0% ont trouvé ce document utile (0 vote)
503 vues2 001 pages

ElementsMathematiquesAppliqueesV2 PDF

Transféré par

hamid_touhami
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
503 vues2 001 pages

ElementsMathematiquesAppliqueesV2 PDF

Transféré par

hamid_touhami
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

ÉLÉMENTS DE

MATHÉMATIQUES APPLIQUÉES

(deuxième édition)
10.03.2005

La science au cœur des savoirs, toutes disciplines confondues: des mathématiques à la


médecine, de l'astrophysique à l'histoire des sciences…
Sciences.ch 14/03/2005

A PROPOS DE CE DOCUMENT

Que ce soit sur le point de vue de la quantité aussi bien que de la qualité du contenu ainsi que
sur l'audience recueillie par les sujets traités, cette nouvelle édition PDF de Sciences.ch n'a
aucune comparaison possible avec la précédente (de 2002). Cependant, cela n'empêche pas
que le travail restant par rapport aux objectifs fixés est considérable et qu'il reste énormément
de progrès et de corrections à effectuer jusqu'aux objectifs fixés.

Cependant, laissons parler les chiffres pour juger de la réussite du site Internet Sciences.ch :
plus de 2'000 pages, 100 documents PDFs disponibles, 70'000 téléchargements (2'000 pour ce
document à lui seul dans son ancienne version) correspondant a 15'000 pages de
documentation, 20'000 visiteurs par mois provenant d'un peu plus de 90 pays.

Ces augmentations faisant, de nombreux lecteurs se sont manifestés pour annoncer leurs
désirs, satisfactions ou déceptions face à ce défi intellectuel d'englober l'ensemble du
programme scientifique scolaire francophone de la plus petite classe jusqu'au plus haut degré
dans un cadre uniforme et continu et disponible gratuitement.

La relecture du site entre 2002 et 2005 a permis également de corriger de nombreuses zones
floues qui méritent pour certaines encore d'être éclaircies ou reformulées par des méthodes
autres que purement formelles de manière à les rendre accessibles au plus grand nombre mais
toujours avec la rigueur nécessaire ! Effectivement, bien qu'au début il y ait eu une grande
réticence quant au fait d'ajouter des textes, figures ou schémas explicatifs des équations
démontrées, le temps faisant, cette position va être complètement abandonnée ne pouvant
admettre qu'il soit parfois nécessaire au lecteur de passer plus de deux à trois heures à
construire des schémas mentaux d'un concept très abstrait. Par ailleurs, les illustrations et les
courts textes de vulgarisation permettent souvent d'obtenir une vision plus directe sur certains
résultats théoriques formels et cela fait toujours du bien, tant aux yeux qu'au mental. La
prochaine édition se verra donc certainement agrémentée de nombreuses illustrations.

Ce document est donc, vous l'aurez compris, toujours en pleine évolution et il faudra souvent
au lecteur se référer au site (www.sciences.ch) pour d'éventuels compléments d'informations
sur les nouveautés et corrections pouvant être publiées depuis sa date de parution. Le lecteur
ne devra également pas hésiter à contacter les responsables du site (et du présent document) à
l'adresse [email protected] pour tout type de remarques constructives.

Nous tenons également à informer le lecteur que Adobe Reader 7.0 est requis pour une lecture
optimale de ce document et que celui-ce rencontre actuellement des problèmes d'affichage sur
la version Adobe Reader 2.0 disponible sur les PocketPc. Dans Adobe Reader 7.0 le lecteur
aura la possibilité de suivre les corrections principales au cours des années à venir (en attendant
la nouvelle version en 2009) en activant les différents outils tels qu'indiqués sur la capture
d'écran visible à la page suivante :

2/2001
Sciences.ch 14/03/2005

Légende :

(1) Cliquez sur l'onglet Commentaires pour voir tous les commentaires ajoutés dès à présent
après la création de ce PDF

(2) Sinon, par un double clic sur une bulle jaune, croix rouge, trait rouge, bulle rouge etc.
apparaîtra la remarque du commentaire sélectionné tel que présenté ci-dessous :

3/2001
Sciences.ch 14/03/2005

Que pouvons nous conclure jusque là pour l'avenir ? :

Il reste donc beaucoup à faire comme nous l'avons déjà précisé et plus nous avançons, plus le
constat de la quantité de travail restante est sévère. Il faut aussi un regard plus critique envers
le monument que constitue la partie mathématique du site car certaines démonstrations sont
ridicules car elles n'apportent rien mis à part à perdre du temps et nous le préciserons à
l'avenir tel quel. Il y a aussi le regret de finalement constater qu'il n'est pas possible de se
rappeler de tout et de tout faire, ce qui montre les limites de l'individu humain. Mais cela n'est
pas nouveau et peut-être que la science permettra un jour d'envisager, à l'aide d'artifices, de
dépasser ces contraintes.

Espérons également que ce document permettra à de nombreuses personnes de sortir du rêve


ou du fanatisme pour la pure rationalité et que ce défi intellectuel gratuitement accessible sera
utile a de nombreuses générations. Croyons aux lumières, à la raison, à la capacité des
sciences à résoudre les problèmes…

Je tiens personnellement en tant que responsable de ce projet à remercier encore une fois les
nombreux intervenants et contributeurs, ainsi que tous les internautes et l'ensemble de la
communauté scientifique passée et contemporaine pour leur aide et héritage culturel.

Vincent Isoz

4/2001
Sciences.ch 14/03/2005

TABLE DES MATIÈRES


A propose de ce document ................................................................................................2
Table des matières.............................................................................................................5
Introduction ....................................................................................................................... 30
Abstract .......................................................................................................................... 30
Méthodes......................................................................................................................... 33
Arithmétique .....................................................................................................................40
Théorie de la démonstration...........................................................................................40
La crise des fondements.............................................................................................41
Raisonnement hypothético-déductif ..........................................................................45
Logique propositionnelle ...........................................................................................46
Propositions...........................................................................................................46
Connecteurs...........................................................................................................47
Quantificateurs ......................................................................................................51
Grammaire .................................................................................................................52
Langages ....................................................................................................................52
Symboles....................................................................................................................53
Termes...................................................................................................................53
Formules................................................................................................................55
Démonstrations ..........................................................................................................58
Règles de démonstration .......................................................................................59
Règles ...............................................................................................................60
Nombres (scalaires)........................................................................................................65
Histoire .....................................................................................................................65
Bases numériques ......................................................................................................67
Types de nombres ......................................................................................................68
Nombres entiers (nombres naturels) .....................................................................69
Axiomes de Peano ............................................................................................70
Nombres pairs, impairs, et parfaits...................................................................71
Nombres premiers ............................................................................................71
Nombres entiers relatifs ........................................................................................73
Nombres rationnels ...............................................................................................73
Nombres irrationnels.............................................................................................75
Nombres réels .......................................................................................................75
Nombres transfinis ...........................................................................................76
Nombres complexes ..............................................................................................78
Plan de Gauss ...................................................................................................83
Formule d'Euler ................................................................................................84
Vecteur tournant ...............................................................................................86
Similitudes directes ..........................................................................................87
Nombres quaternions ............................................................................................88
Nombres algébriques.............................................................................................88
Nombres transcendants .........................................................................................88
Nombres abstraits..................................................................................................89
Alphabet Grec...................................................................................................89
Domaine de définition ......................................................................................89
Opérateurs .....................................................................................................................91
Relations binaires.......................................................................................................91

5/2001
Sciences.ch 14/03/2005

Egalités..................................................................................................................92
Comparateurs ........................................................................................................93
Classes d'équivalences ..........................................................................................96
Lois fondamentales de l'arithmétique ........................................................................97
Addition ................................................................................................................98
Soustraction...........................................................................................................100
Multiplication........................................................................................................102
Division.................................................................................................................104
Polynômes arithmétiques...........................................................................................108
Valeur absolue ...........................................................................................................109
Règles de calcul .........................................................................................................110
Théorie des nombres.......................................................................................................115
Principe du bon ordre.................................................................................................115
Propriété archimédienne ............................................................................................115
Principe d'induction ...................................................................................................116
Divisibilité .................................................................................................................117
Division euclidienne..............................................................................................118
Plus grand commun diviseur (P.G.C.D)...........................................................119
Algorithme d'Euclide........................................................................................121
Plus petit commun multiple (P.P.C.M.) ...........................................................122
Théorème fondamental de l'arithmétique .........................................................124
Congruences..........................................................................................................125
Preuve par neuf.................................................................................................126
Théorie des ensembles ....................................................................................................127
Définitions .................................................................................................................128
Axiomes de ZF (Zermelo-Frankel)............................................................................130
Cardinaux ..............................................................................................................133
Produit cartésien....................................................................................................135
Bornes ...................................................................................................................136
Opérations ensemblistes ............................................................................................136
Inclusion................................................................................................................137
Intersection............................................................................................................137
Réunion .................................................................................................................138
Différence..............................................................................................................139
Différence symétrique...........................................................................................139
Produit ...................................................................................................................140
Ensemble vide .......................................................................................................140
Complémentarité ...................................................................................................141
Fonctions....................................................................................................................141
Loi de composition................................................................................................142
Loi interne/externe ................................................................................................142
Application linéaire...............................................................................................142
Noyau et image.................................................................................................142
Fonction surjective ................................................................................................143
Fonction injective..................................................................................................144
Fonction bijective..................................................................................................144
Fonction composée ...............................................................................................145
Théorème de Cantor-Bernstein .............................................................................145
Structures ...................................................................................................................147
Magma ..................................................................................................................148

6/2001
Sciences.ch 14/03/2005

Monoïde ................................................................................................................149
Groupe................................................................................................................... 151
Groupe abélien .................................................................................................151
Groupe cyclique ...............................................................................................151
Anneau .................................................................................................................. 155
Anneau abélien (commutatif)...........................................................................156
Anneau intègre .................................................................................................156
Anneau factoriel ...............................................................................................156
Sous-anneau......................................................................................................157
Corps ..................................................................................................................... 158
Corps commutatif .............................................................................................158
Espaces vectoriels .................................................................................................158
Sous-espaces vectoriels ....................................................................................160
Algèbres ................................................................................................................160
Homomorphismes......................................................................................................161
Homomorphisme de magma .................................................................................161
Homomorphisme de monoïde ...............................................................................161
Homomorphisme d'anneau....................................................................................161
Homomorphisme de groupe..................................................................................161
Homomorphisme de corps ....................................................................................161
Isomorphisme........................................................................................................163
Endomorphisme ....................................................................................................163
Automorphisme.....................................................................................................163
Idéal.......................................................................................................................163
Probabilités et statistiques .............................................................................................167
Probabilités ................................................................................................................167
Univers des événements........................................................................................167
Axiomes ................................................................................................................168
Evénements disjoints........................................................................................169
Evénements équiprobables ...............................................................................170
Evénements conjoints.......................................................................................170
Probabilités conditionnelles ..................................................................................170
Formules de Bayes ...........................................................................................172
Analyse combinatoire ................................................................................................172
Arrangements avec répétition ...............................................................................173
Permutations avec répétition .................................................................................174
Arrangements simples avec répétition ..................................................................175
Combinaisons simples...........................................................................................176
Combinatoire ....................................................................................................177
Statistiques .................................................................................................................177
Echantillons...........................................................................................................178
Variables discrètes ................................................................................................179
Espérance discrète ............................................................................................179
Déviation standard discrète ..............................................................................180
Formule de Huyghens..................................................................................180
Variable centrée réduite....................................................................................180
Covariance discrète ..........................................................................................181
Coefficient de corrélation.................................................................................183
Variables continues ...............................................................................................184
Densité de probabilité.......................................................................................184

7/2001
Sciences.ch 14/03/2005

Espérance continue...........................................................................................185
Variance continue.............................................................................................185
Fonctions de distribution.......................................................................................185
Fonction discrète uniforme...............................................................................185
Fonction de Bernoulli.......................................................................................186
Fonction binomiale...........................................................................................188
Fonction hypergéométrique..............................................................................189
Fonction multinomiale .....................................................................................190
Fonction de Poisson..........................................................................................191
Fonction de Gauss-Laplace ..............................................................................194
Loi normale centrée réduite .........................................................................199
Fonction uniforme ............................................................................................200
Fonction exponentielle .....................................................................................201
Fonction de Cauchy..........................................................................................203
Fonction bêta ....................................................................................................205
Fonction Gamma ..............................................................................................207
Fonction de Khi-Deux ......................................................................................209
Loi de Student ..................................................................................................209
Loi de Benford..................................................................................................210
Estimateurs............................................................................................................213
Tests d'adéquations ...............................................................................................216
Contrôle de qualité ................................................................................................218
Courbe d'efficacité............................................................................................220
Valeur de niveau de qualité acceptable ............................................................221
Moyennes ..............................................................................................................221
Moyenne arithmétique......................................................................................222
Médiane ............................................................................................................222
Moyenne quadratique .......................................................................................222
Moyenne harmonique.......................................................................................222
Moyenne géométrique......................................................................................223
Moyenne mobile...............................................................................................224
Moyenne pondérée ...........................................................................................225
Moyenne fonctionnelle.....................................................................................226
Propriété des moyennes....................................................................................226
Calculs d'erreurs....................................................................................................230
Incertitudes absolues et relatives......................................................................231
Erreurs statistiques ...........................................................................................231
Algèbre ............................................................................................................................... 233
Calcul algébrique ...........................................................................................................233
Equations et inéquations ............................................................................................234
Equations...............................................................................................................235
Inéquations ............................................................................................................239
Identités remarquables ..........................................................................................242
Triangle de Pascal ............................................................................................243
Polynômes..................................................................................................................245
Equations diophantiennes......................................................................................246
Polynômes de degré 1 ...........................................................................................246
Polynômes de degré 2 ...........................................................................................247
Déterminant ......................................................................................................247
Polynôme de degré 3.............................................................................................249

8/2001
Sciences.ch 14/03/2005

Polynômes cyclotomiques.....................................................................................252
Polynômes de Legendre ........................................................................................253
Analyse fonctionnelle......................................................................................................257
Représentations..........................................................................................................257
Représentation tabulaire........................................................................................258
Représentation graphique......................................................................................258
Propriétés des graphiques.................................................................................263
Représentation analytique .....................................................................................265
Fonctions....................................................................................................................267
Dépendances .........................................................................................................267
Domaines d'existence............................................................................................267
Croissance et décroissance....................................................................................267
Périodicité .............................................................................................................267
Parité .....................................................................................................................268
Composition ..........................................................................................................269
Types de fonctions ................................................................................................269
Fonctions puissances ........................................................................................269
Fonctions exponentielles ..................................................................................269
Fonctions logarithmiques .................................................................................269
Fonctions trigonométriques..............................................................................269
Fonctions polynomiales....................................................................................270
Fonctions rationnelles.......................................................................................270
Fonctions algébriques.......................................................................................270
Limite et continuité ...............................................................................................270
Asymptotes.......................................................................................................274
Logarithmes ...............................................................................................................274
Bases vulgaires......................................................................................................275
Base népérienne ....................................................................................................276
Fonction exponentielle naturelle ...........................................................................278
Produit scalaire fonctionnel .......................................................................................279
Topologie ........................................................................................................................281
Espace topologique ....................................................................................................282
Espace de Hausdorff .............................................................................................282
Espace métrique et distance.......................................................................................282
Distance hölderienne.............................................................................................284
Distance discrète ...................................................................................................285
Distances équivalentes ..........................................................................................285
Fonctions lipchitziennes........................................................................................286
Ensembles ouverts et fermés......................................................................................287
Boules....................................................................................................................287
Parties....................................................................................................................288
Boules généralisées ...............................................................................................290
Diamètre................................................................................................................291
Variétés ......................................................................................................................292
Variétés différentiables .........................................................................................293
Théorie de la mesure ......................................................................................................294
Espaces mesurables....................................................................................................294
Tribu......................................................................................................................294
Tribu borélienne ...............................................................................................296
Théorème de la classe monotone ...............................................................................299

9/2001
Sciences.ch 14/03/2005

Calcul différentiel et intégral .........................................................................................303


Calcul différentiel ......................................................................................................303
Pente moyenne ......................................................................................................303
Dérivée première...................................................................................................304
Fonction dérivée....................................................................................................304
Différentielles........................................................................................................304
Différentielles partielles ...................................................................................306
Différentielle totale exacte...........................................................................306
Théorème de Schwarz .................................................................................307
Dérivées usuelles...................................................................................................309
Calcul intégral............................................................................................................321
Intégrale définie ....................................................................................................321
Intégrale indéfinie .................................................................................................322
Théorème fondamental du calcul intégral ........................................................323
Intégration par changement de variable ................................................................327
Jacobien ............................................................................................................329
Matrice jacobienne ......................................................................................332
Intégration par parties ...........................................................................................334
Primitives usuelles ................................................................................................335
Fonction de Dirac.......................................................................................................345
Fonction Gamma d'Euler ...........................................................................................346
Constante d'Euler-Mascheroni ..............................................................................347
Suites et séries ................................................................................................................349
Suites..........................................................................................................................349
Suites arithmétiques ..............................................................................................349
Suites harmoniques ...............................................................................................350
Suites géométriques ..............................................................................................351
Suite de Cauchy ....................................................................................................352
Suite de Fibonacci .................................................................................................355
Séries.......................................................................................................................... 355
Série numérique ....................................................................................................356
Série de Gauss .......................................................................................................356
Séries de Taylor et de MacLaurin .........................................................................358
Reste de Lagrange ............................................................................................360
Séries de Fourier ...................................................................................................361
Coefficient de Fourier ......................................................................................363
Séries de Bessel.....................................................................................................364
Fonction de Bessel d'ordre 0 ............................................................................365
Fonction de Bessel d'ordre N ...........................................................................365
Equation différentielle de Bessel d'ordre N......................................................371
Critères de convergence.............................................................................................372
Test de l'intégrale ..................................................................................................373
Règle d'Alembert...................................................................................................373
Règle de Cauchy ...................................................................................................374
Théorème de Leibniz ............................................................................................375
Convergence absolue ............................................................................................375
Théorème du point fixe .........................................................................................375
Calcul vectoriel ..................................................................................................................378
Notion de flèche..............................................................................................................378
Ensemble de vecteurs .....................................................................................................378

10/2001
Sciences.ch 14/03/2005

Pseudo vecteurs..........................................................................................................380
Multiplication par un scalaire ....................................................................................380
Règle de trois.........................................................................................................380
Espace vectoriel..............................................................................................................382
Combinaisons linéaires ..............................................................................................383
Sous-espaces vectoriels..............................................................................................384
Familles génératrices .................................................................................................384
Dépendances et indépendances..................................................................................385
Bases d'un espace vectoriel........................................................................................386
Angles directeurs...................................................................................................387
Dimensions d'un espace vectoriel ..............................................................................388
Prolongements d'une famille libre .............................................................................388
Rang d'une famille finie.............................................................................................389
Sommes directes ........................................................................................................390
Espace affine..............................................................................................................390
Espace vectoriel euclidien .........................................................................................392
Norme d'un vecteur ...............................................................................................392
Produit scalaire......................................................................................................393
Projection orthogonale .....................................................................................393
Inégalité de Cauchy-Schwartz..........................................................................396
Inégalité triangulaire.........................................................................................397
Produit vectoriel ....................................................................................................398
Produit mixte.........................................................................................................403
Espace vectoriel fonctionnel......................................................................................404
Système de coordonnées............................................................................................405
Système cartésien ..................................................................................................405
Système sphérique.................................................................................................406
Système cylindrique ..............................................................................................408
Système polaire .....................................................................................................411
Opérateurs différentiels scalaires et vectoriel............................................................412
Gradient d'un champ scalaire ................................................................................412
Gradient d'un champ de vecteurs ..........................................................................416
Divergence d'un champ de vecteurs......................................................................417
Rotationnel d'un champ de vecteurs......................................................................418
Laplacien d'un champ scalaire ..............................................................................419
Laplacien d'un champ vectoriel.............................................................................424
Relation remarquables...........................................................................................425
Résumé..................................................................................................................426
Algèbre linéaire ..............................................................................................................427
Systèmes linéaires......................................................................................................429
Matrices .....................................................................................................................431
Matrice associée ....................................................................................................433
Opérations sur les matrices ...................................................................................435
Types de matrice ...................................................................................................435
Matrice inversible.............................................................................................435
Matrice transposée............................................................................................435
Matrice adjointe................................................................................................436
Matrice hermitique (self-adjointe)....................................................................437
Matrice nilpotent ..............................................................................................437
Matrice orthogonale .........................................................................................437

11/2001
Sciences.ch 14/03/2005

Matrice symétrique...........................................................................................438
Matrice anti-symétrique ...................................................................................438
Matrice triangulaire ..........................................................................................438
Matrice diagonale .............................................................................................439
Matrice de passage ...........................................................................................439
Déterminants..............................................................................................................440
Dérivée d'un déterminant ......................................................................................451
Changements de base.................................................................................................453
Valeurs et vecteur propres .........................................................................................455
Polynômes caractéristique.....................................................................................456
Calcul tensoriel ..............................................................................................................458
Notation indicielle......................................................................................................458
Sommation sur plusieurs indices ...............................................................................460
Symbole de Kronecker...............................................................................................460
Symbole d'antisymétrie..............................................................................................461
Métrique et signature .................................................................................................463
Composantes contravariantes et covariantes .............................................................465
Opérations dans les bases ..........................................................................................466
Méthode d'orthogonalisation de Schmidt..............................................................466
Changements de base ............................................................................................467
Bases réciproques..................................................................................................468
Tenseurs euclidiens....................................................................................................469
Tenseurs fondamental ...........................................................................................470
Produit tensoriel de deux vecteurs ........................................................................471
Espace tensoriel................................................................................................473
Combinaisons linéaires de tenseurs ......................................................................477
Contractions des indices........................................................................................477
Tenseurs particuliers ..................................................................................................479
Tenseur symétrique ...............................................................................................482
Tenseur anti-symétrique........................................................................................482
Tenseur fondamental.............................................................................................484
Coordonnées curvilignes............................................................................................485
Repère naturel en coordonnées sphériques ...........................................................488
Repère naturel en coordonnées polaires................................................................489
Repère naturel en coordonnées cylindriques.........................................................490
Symboles de Christoffel.............................................................................................491
Théorème de Ricci .....................................................................................................497
Dérivée de covariante............................................................................................499
Tenseur de Riemann-Christoffel................................................................................504
Première identité de Bianchi .................................................................................507
Tenseur de Ricci ........................................................................................................507
Scalaire de Ricci....................................................................................................507
Tenseur d'Einstein......................................................................................................507
Identité de Bianchi contractée...............................................................................508
Calcul spinoriel ..............................................................................................................510
Spineur unitaire..........................................................................................................510
Propriétés géométriques ........................................................................................514
Symétries planes...............................................................................................514
Rotations planes ...............................................................................................516
Propriétés des matrices de Pauli.......................................................................521

12/2001
Sciences.ch 14/03/2005

Théorie des nœuds ..........................................................................................................523


Nœud de tait...............................................................................................................525
Formalisation mathématique......................................................................................528
Mouvement de Reidemeister.................................................................................531
Représentation planaire.........................................................................................533
Géométrie........................................................................................................................... 535
Trigonométrie .................................................................................................................535
Radian ........................................................................................................................ 535
Trigonométrie du cercle.............................................................................................536
Relations remarquables .........................................................................................541
Théorème du cosinus........................................................................................ 544
Théorème du sinus............................................................................................545
Trigonométrie hyperbolique ......................................................................................546
Relations remarquables .........................................................................................549
Trigonométrie sphérique............................................................................................550
Relations des sinus ................................................................................................553
Angle solide ...............................................................................................................555
Géométrie euclidienne....................................................................................................558
Dimensions ................................................................................................................559
Ligne droite................................................................................................................562
Axiome de prolongement......................................................................................563
Demi-Droite ..........................................................................................................563
Segment.................................................................................................................563
Grandeurs de même espèce...................................................................................563
Axiome de continuité de la droite .........................................................................566
Plan ............................................................................................................................ 568
Déplacement et retournement ...............................................................................568
Angles ...................................................................................................................569
Angle saillant....................................................................................................569
Angles adjacents...............................................................................................569
Somme de plusieurs angles ..............................................................................570
Mesure des angles ............................................................................................570
Système des unités............................................................................................572
Axiome de continuité ............................................................................................573
Angles droits, aigus, obtus, supplémentaires, complémentaires...........................573
Droites perpendiculaires........................................................................................574
Bissectrices d'un angle ..........................................................................................574
Triangles ....................................................................................................................575
Triangles égaux .....................................................................................................576
Triangle isocèle .....................................................................................................578
Lieu géométrique..............................................................................................579
Triangle équilatéral ...............................................................................................580
Triangle rectangle .................................................................................................581
Triangle rectangle isocèle .....................................................................................581
Théorème de Pythagore ........................................................................................582
Théorème de Thalès ..............................................................................................583
Axiome d'unicité du parallélisme..........................................................................586
Cercles ....................................................................................................................... 588
Barycentre..................................................................................................................591
Axiomatique d'Euclide-Hilbert ..................................................................................593

13/2001
Sciences.ch 14/03/2005

Axiomes d'Euclide ................................................................................................593


Définitions d'Euclide.............................................................................................593
Axiomes d'Hilbert .................................................................................................596
Transformations dans le plan.....................................................................................597
Translation ............................................................................................................598
Homothétie............................................................................................................598
Rotation.................................................................................................................600
Réflexion ...............................................................................................................603
Géométries non-euclidiennes .........................................................................................605
Espaces de Riemann ..................................................................................................605
Géométrie projective ......................................................................................................609
Perspective conique (centrale) ...................................................................................610
Images de points....................................................................................................611
Images de droites...................................................................................................614
Perspective affines .....................................................................................................619
Perspective cavalière.............................................................................................620
Projection orthogonale ..........................................................................................620
Géométrie analytique .....................................................................................................622
Coniques .................................................................................................................... 622
Paramétrisations.........................................................................................................633
Equation du plan ...................................................................................................633
Equation d'une droite ............................................................................................634
Equation d'un cône ................................................................................................638
Equation d'une sphère ...........................................................................................639
Equation d'une ellipsoïde ......................................................................................640
Equation d'un cylindre ..........................................................................................641
Surface de révolution ............................................................................................641
Géométrie différentielle..................................................................................................644
Trièdre de Frenet........................................................................................................646
Nappes paramétrées ...................................................................................................651
Métrique d'une surface ..........................................................................................652
Formes géométriques .....................................................................................................654
Surfaces connues........................................................................................................654
Polygones ..............................................................................................................654
Rectangle...............................................................................................................655
Carré .....................................................................................................................656
Triangle .................................................................................................................657
Triangle isocèle .....................................................................................................659
Triangle équilatéral ...............................................................................................660
Triangle rectangle .................................................................................................661
Trapèze..................................................................................................................662
Parallélogramme ...................................................................................................662
Losange .................................................................................................................662
Cercle ....................................................................................................................662
Ellipse....................................................................................................................665
Volumes connus.........................................................................................................667
Polyèdres ...............................................................................................................667
Parallélépipède .................................................................................................667
Cube (hexaèdre) ...............................................................................................669
Pyramide...........................................................................................................669

14/2001
Sciences.ch 14/03/2005

Tétraèdre...........................................................................................................671
Octaèdre............................................................................................................671
Prisme droit ......................................................................................................672
Dodécaèdre.......................................................................................................672
Icosaèdre...........................................................................................................672
Volumes de révolutions ........................................................................................673
Cylindre ............................................................................................................673
Cône..................................................................................................................675
Sphère...............................................................................................................676
Tore ..................................................................................................................678
Ellipsoïde..........................................................................................................682
Paraboloïde.......................................................................................................683
Théorie des graphes .......................................................................................................685
Définitions .................................................................................................................685
Ponts de Königsberg ..................................................................................................690
Théorème d'Euler.......................................................................................................691
Matrice d'adjacence....................................................................................................694
Catégories ..................................................................................................................694
Mécanique .......................................................................................................................... 696
Principes......................................................................................................................... 696
Systèmes d'unités .......................................................................................................698
MKSC ...................................................................................................................699
Notations scientifiques ..........................................................................................701
Temps....................................................................................................................703
Longueur ...............................................................................................................704
Masse ....................................................................................................................705
Energie ..................................................................................................................707
Charge ...................................................................................................................708
Distributions..........................................................................................................709
Constantes..................................................................................................................710
Constantes universelles .........................................................................................711
Constantes physiques diverses ..............................................................................711
Constantes physico-chimiques diverses................................................................712
Constantes astrophysiques diverses ......................................................................712
Constantes de Planck ............................................................................................713
Unités naturelles....................................................................................................714
Cube magique...................................................................................................715
Principes de la physique ............................................................................................716
Principe de causalité..............................................................................................716
Trilemne de Fries..............................................................................................716
Principe premier de conservation de l'énergie ......................................................717
Principe premier de moindre action ......................................................................717
Principe premier de Noether .................................................................................718
Invariance par translation dans l'espace ...........................................................720
Invariance par rotation dans l'espace................................................................721
Invariance par translation dans le temps ..........................................................722
Théorème de Noether .......................................................................................723
Principe premier de Curie .....................................................................................726
Espaces ponctuels ......................................................................................................727
Mécanique analytique..................................................................................................... 735

15/2001
Sciences.ch 14/03/2005

Formalisme Lagrangien .............................................................................................736


Coordonnées généralisées .....................................................................................736
Repère et référentiel .........................................................................................737
Repère galiléen ............................................................................................737
Repère barycentrique ...................................................................................738
Repère orthonormé direct ............................................................................738
Méthode de Lagrange............................................................................................740
Méthode d'Euler ....................................................................................................740
Principe variationnel .............................................................................................741
Equation d'Euler-Lagrange ...................................................................................742
Action ...............................................................................................................743
Lagrangien........................................................................................................743
Formalisme canonique...............................................................................................747
Transformation de Legendre .................................................................................748
Hamiltonien...........................................................................................................748
Moments canoniques........................................................................................748
Equations canoniques du mouvement ..............................................................750
Crochets de Poisson ..............................................................................................752
Identité de Jacobi..............................................................................................752
Transformations canoniques .................................................................................754
Mécanique classique rationnelle .................................................................................... 756
Point matériel.............................................................................................................756
Angles d'Euler .......................................................................................................757
Rotation propre.................................................................................................758
Nutation ............................................................................................................758
Précession.........................................................................................................758
Lois de Newton..........................................................................................................759
Première loi (loi d'inertie) .....................................................................................759
Deuxième loi (principe fondamental de la dynamique)........................................760
Troisième loi (action et réaction) ..........................................................................762
Conditions d'équilibre ................................................................................................762
Centre de masse et masse réduite ..............................................................................763
Théorème du centre de masse ...............................................................................764
Théorème de Guldin..............................................................................................766
Cinématique ...............................................................................................................767
Position..................................................................................................................768
Vitesse ...................................................................................................................769
Accélération ..........................................................................................................770
Plan osculateur .................................................................................................771
Principe de relativité galiléen ....................................................................................774
Moment cinétique ......................................................................................................776
Théorème du moment cinétique............................................................................778
Moment de forces..................................................................................................780
Statique des forces ................................................................................................781
Balistique ...................................................................................................................783
Mouvements circulaires.............................................................................................786
Vitesse angulaire ...................................................................................................786
Figures de Lissajous..............................................................................................788
Loi de Kepler .............................................................................................................788
Première loi (conicité)...........................................................................................788

16/2001
Sciences.ch 14/03/2005

Deuxième loi (vitesse aréolaire)............................................................................789


Troisième loi (période orbitale) ............................................................................789
Loi de la Gravitation.........................................................................................791
Equation de Newton Poisson.......................................................................792
Décroissance de l'accélération gravifique à l'extérieur de la Terre .............792
Décroissance de l'accélération gravifique à l'intérieur de la Terre ..............793
Travail et énergie .......................................................................................................793
Energie cinétique...................................................................................................794
Moment d'inertie...............................................................................................795
Rayon de giration.........................................................................................797
Moment d'inertie polaire..............................................................................798
Théorème d'Huygens-Steiner ......................................................................799
Tenseur d'inertie ..........................................................................................802
Théorème d'Huygens-Steiner généralisé .....................................................803
Ellipsoïde d'inertie .......................................................................................805
Energie potentielle gravifique ...............................................................................807
Energie potentielle d'une sphère de matière .....................................................811
Conservation de l'énergie mécanique totale..........................................................812
Conservation de la quantité de mouvement ..........................................................813
Loi de Newton généralisée....................................................................................814
Action lagrangienne .........................................................................................816
Lagrangien mécanique .....................................................................................816
Puissance mécanique.............................................................................................818
Puissance d'une machine tournante ..................................................................819
Rendement ...................................................................................................819
Mouvements relatifs et forces d'inerties................................................................819
Accélération de Coriolis...................................................................................823
Principe d'Alembert..........................................................................................823
Théorème de König...............................................................................................826
Premier théorème de König..............................................................................826
Deuxième théorème de König ..........................................................................828
Mouvements oscillatoires......................................................................................828
Pendule de Newton...........................................................................................829
Pendule simple .................................................................................................830
Pendule physique..............................................................................................832
Pendule élastique..............................................................................................835
Pendule conique ...............................................................................................839
Pendule de torsion ............................................................................................840
Pendule de Foucault .........................................................................................841
Pendule de Huygens .........................................................................................843
Mécanique ondulatoire................................................................................................... 847
Fonction d'onde..........................................................................................................847
Equation d'onde .........................................................................................................848
Types d'ondes.............................................................................................................850
Ondes périodiques.................................................................................................850
Ondes harmoniques...............................................................................................851
Ondes stationnaires ...............................................................................................852
Modes de vibration dans un fil tendu ...............................................................853
Mondes de vibration dans une membrane tendue ............................................860
Phaseurs .....................................................................................................................865

17/2001
Sciences.ch 14/03/2005

Vecteur d'onde.......................................................................................................867
Relation de dispersion ...........................................................................................868
Paquet d'onde ........................................................................................................871
Mécanique statistique ..................................................................................................... 872
Théorie statistique de l'information ...........................................................................872
Formule de Shannon .............................................................................................875
Information mutuelle moyenne .............................................................................875
Entropie infométrique ...........................................................................................876
Loi de Boltzmann.......................................................................................................876
Micro-états ............................................................................................................877
Equilibre thermodynamique..................................................................................878
Distributions statistiques physiques...........................................................................881
Distribution de Maxwell .......................................................................................881
Distribution de Maxwell-Boltzmann ....................................................................885
Distribution de Fermi-Dirac..................................................................................890
Distribution de Bose-Einstein ...............................................................................892
Thermodynamique .......................................................................................................... 894
Définitions .................................................................................................................895
Systèmes thermodynamiques.....................................................................................896
Variables d'état...........................................................................................................897
Variables intensives et extensives.........................................................................898
Lois d'état...................................................................................................................899
Transformation thermodynamique ............................................................................899
Principes de la thermodynamique..............................................................................900
Principe zéro (équilibre thermique) ......................................................................900
Principe premier (principe d'équivalence) ............................................................901
Principe deuxième (irréversibilité)........................................................................901
Principe troisième (principe de Nernst) ................................................................901
Fluides........................................................................................................................ 901
Capacités et chaleurs .............................................................................................902
Fluide parfait .........................................................................................................903
Fluide semi-parfait ................................................................................................904
Fluide réel .............................................................................................................904
Energie interne...........................................................................................................905
Enthalpie ...............................................................................................................908
Chaleur.......................................................................................................................908
Equation de continuité ...............................................................................................910
Loi de Fourier........................................................................................................915
Equation de diffusion de la chaleur.......................................................................915
Rayonnement thermique ............................................................................................915
Loi de Stefan-Boltzmann ......................................................................................916
Loi de Planck ........................................................................................................923
Première loi de Wien........................................................................................928
Constante de Stefan-Boltzmann ..................................................................929
Deuxième loi de Wien ......................................................................................930
Constante de Wien.......................................................................................930
Mécanique des milieux continus..................................................................................... 932
Solides........................................................................................................................932
Pressions................................................................................................................933
Elasticité des solides .............................................................................................933

18/2001
Sciences.ch 14/03/2005

Module de Young.............................................................................................935
Loi de Hook......................................................................................................935
Module de cisaillement ....................................................................................936
Module de glissement.......................................................................................937
Coefficient de poisson .................................................................................938
Module de compressibilité ...............................................................................944
Coefficient de compressibilité .....................................................................945
Module de flexion ............................................................................................945
Liquides .....................................................................................................................948
Théorème de Pascal ..............................................................................................949
Viscosité................................................................................................................950
Loi de Poiseuille...............................................................................................952
Théorème de Bernoulli..........................................................................................953
Théorème de Toricelli ......................................................................................957
Effet Venturi.....................................................................................................957
Equations de Navier-Stokes ..................................................................................958
Fluides incompressibles ...................................................................................976
Equation d'Euler de 1ère forme ...................................................................977
Equation d'Euler de 2ème forme .................................................................978
Fluide compressible..........................................................................................981
Fluide statique ..................................................................................................981
Nombre de Reynolds ........................................................................................982
Approximation de Boussinesq..........................................................................984
Loi de Stokes ....................................................................................................986
Pression hydrostatique ..........................................................................................990
Poussée d'Archimède ............................................................................................990
Gaz ............................................................................................................................. 992
Type de gaz ...........................................................................................................992
Gaz parfait ........................................................................................................992
Gaz réel.............................................................................................................993
Théorème du Viriel ...............................................................................................993
Plasmas .....................................................................................................................998
Degré d'ionisation .................................................................................................999
Fréquence plasma..................................................................................................1002
Astrophysique ................................................................................................................. 1003
Trajectoires d'orbitales keplériennes..........................................................................1003
Précession du périhélie ..............................................................................................1007
Formule de Binet...................................................................................................1008
Effet Doppler .............................................................................................................1014
Redshift .................................................................................................................1016
Equation de Drake .....................................................................................................1016
Etoiles ........................................................................................................................ 1017
Diagramme de Hertzprung-Russel........................................................................1018
Température interne des étoiles ............................................................................1020
Température externe des étoiles............................................................................1021
Luminosité des étoiles...........................................................................................1022
Eclat d'une étoile ..............................................................................................1022
Magnitude apparente ........................................................................................1022
Magnitude absolue ...........................................................................................1024
Etoiles variables ...............................................................................................1026

19/2001
Sciences.ch 14/03/2005

Parallaxe trigonométrique .....................................................................................1027


Limite de Chandrasekhar ......................................................................................1028
Modèle cosmologique newtonien .........................................................................1033
Principe cosmologique .....................................................................................1033
Loi de Hubble...................................................................................................1036
Equation de Friedmann ....................................................................................1037
Constante cosmologique..............................................................................1037
Densité critique............................................................................................1039
Modèle de Friedmann-Lemaître.......................................................................1041
Modèle hyperbolique........................................................................................1042
Modèle sphérique .............................................................................................1047
Univers observable ...........................................................................................1050
Rayonnement fossile ........................................................................................1060
Mécanique relativiste ..................................................................................................... 1065
Relativité restreinte ....................................................................................................1066
Postulat d'invariance .............................................................................................1066
Principe cosmologique ..........................................................................................1067
Principe de relativité restreinte..............................................................................1067
Transformations de Lorentz ..................................................................................1068
Facteur de Michelson-Morley ..........................................................................1071
Addition relativiste des vitesses .......................................................................1075
Variation relativiste des longueurs ...................................................................1076
Variation relativiste du temps...........................................................................1077
Variation relativiste de la masse.......................................................................1077
Equivalence masse-énergie ..............................................................................1078
Lagrangien relativiste .......................................................................................1079
Quantité de mouvement relativiste...................................................................1081
Force relativiste ................................................................................................1083
Champs électrique et magnétique relativistes ..................................................1085
Relation d'Einstein.......................................................................................1091
Espace-Temps de Minkowski ..........................................................................1092
Cônes d'univers............................................................................................1094
Relativité générale.................................................................................................1098
Postulat d'équivalence ......................................................................................1099
Principe de Mach..............................................................................................1101
Gravitation et géométrie...................................................................................1101
Métriques .....................................................................................................1102
Lagrangien libre généralisé ..............................................................................1106
Equations des géodésiques ...............................................................................1108
Electromagnétisme ............................................................................................................. 1112
Electrostatique................................................................................................................1112
Force électrique..........................................................................................................1112
Loi de Coulomb ....................................................................................................1112
Permittivité du vide ...............................................................................................1113
Constante diélectrique...........................................................................................1113
Champ électrique ..................................................................................................1113
Potentiel électrique ....................................................................................................1114
Différence de potentiel..........................................................................................1114
Indépendance du chemin.......................................................................................1116
Equipotentielles et lignes de champ......................................................................1116

20/2001
Sciences.ch 14/03/2005

Fil rectiligne infini............................................................................................1119


Dipôle électrique rigide ....................................................................................1121
Flux du champ électrique ......................................................................................1130
Loi de Gauss (du champ électrique).................................................................1130
Capacités ..........................................................................................................1131
Rigidité diélectrique ....................................................................................1131
Energie potentielle électrostatique ........................................................................1132
Magnétostatique .............................................................................................................1134
Théorème d'Ampère...................................................................................................1135
Excitation magnétique...........................................................................................1136
Electro-aimant .......................................................................................................1136
Bobine solénoïdale infinie.....................................................................................1137
Bobine toroïdale ....................................................................................................1138
Relation de Maxwell-Ampère....................................................................................1139
Loi de Biot-Savart......................................................................................................1140
Dipôle magnétique ................................................................................................1144
Moment magnétique dipolaire..........................................................................1148
Facteur gyromagnétique ...................................................................................1149
Loi de Lorentz .......................................................................................................1149
Loi de Laplace ..................................................................................................1153
Effet Hall classique ..........................................................................................1153
Coefficient de Hall.......................................................................................1155
Résistance de Hall .......................................................................................1155
Rayon de Larmor..............................................................................................1156
Pulsation gyro-synchrotron..........................................................................1157
Electrodynamique...........................................................................................................1158
Première équation de Maxwell ..................................................................................1159
Loi de Gauss (du champ électrique) .....................................................................1160
Equation de Maxwell-Poisson ..............................................................................1160
Deuxième équation de Maxwell ................................................................................1160
Loi de Gauss (du champ magnétique)...................................................................1162
Troisième équation de Maxwell ................................................................................1163
Loi de Maxwell-Faraday .......................................................................................1163
Quatrième équation de Maxwell................................................................................1163
Courant de déplacement........................................................................................1164
Equation de Maxwell-Ampère ..............................................................................1165
Equation de Maxwell avec sources............................................................................1166
Champ de déplacement .........................................................................................1166
Equation de Maxwell sans sources ............................................................................1166
Equation de conservation de la charge ......................................................................1167
Théorie de Jauges (électromagnétiques)....................................................................1168
Potentiel vecteur....................................................................................................1168
Potentiel scalaire ...................................................................................................1168
Jauge de Lorenz.....................................................................................................1169
Jauge de Coulomb .................................................................................................1169
Equation de poisson du potentiel vecteur..............................................................1169
Tenseur du champ électromagnétique .......................................................................1171
Equation d'onde électromagnétique ...........................................................................1178
Vitesse de propagation ..........................................................................................1179
Energie véhiculée ..................................................................................................1181

21/2001
Sciences.ch 14/03/2005

Intensité d'un onde électromagnétique .............................................................1183


Emission................................................................................................................1183
Rayonnement synchrotron................................................................................1184
Potentiels de Liénard-Wiechert ...................................................................1188
Electrocinétique..............................................................................................................1189
Lois de Kirchhoff.......................................................................................................1189
Loi des mailles ......................................................................................................1190
Loi des nœuds .......................................................................................................1190
Loi d'Ohm .............................................................................................................1190
Résistance électrique ........................................................................................1193
Force électromotrice ..................................................................................................1195
Puissance électrique ..............................................................................................1195
Champ électromoteur ............................................................................................1196
Force électromotrice (FEM)..................................................................................1196
Loi de Faraday ......................................................................................................1198
Loi de Lenz ...........................................................................................................1199
Inductance .............................................................................................................1200
Coefficient d'auto-induction .............................................................................1200
Optique géométrique ......................................................................................................1202
Sources et ombres ......................................................................................................1202
Photométrie................................................................................................................1205
Flux énergétique....................................................................................................1206
Loi de Beer-Lambert ........................................................................................1206
Intensité lumineuse................................................................................................1207
Emittance énergétique...........................................................................................1208
Luminance énergétique .........................................................................................1209
Loi de Lambert .................................................................................................1210
Loi de Kirchhoff....................................................................................................1211
Décomposition spectrale .......................................................................................1212
Loi de réfraction.........................................................................................................1212
Principe de Fermat ................................................................................................1212
Loi de Snell-Descartes ..........................................................................................1214
Formules de Descartes ..........................................................................................1216
Equation de conjugaison ..................................................................................1226
Optique ondulatoire........................................................................................................1229
Principe d'Huygens ....................................................................................................1229
Loi de Malus .........................................................................................................1230
Diffraction de Fraunhofer .....................................................................................1231
Cas d'une fente rectangulaire............................................................................1232
Pouvoir de résolution...................................................................................1238
Cas d'un réseau de fentes rectangulaires ..........................................................1239
Polarisation de la lumière......................................................................................1245
Polarisation linéaire..........................................................................................1249
Polarisation elliptique.......................................................................................1251
Polarisation circulaire.......................................................................................1252
Polarisation naturelle........................................................................................1252
Loi de Malus.....................................................................................................1254
Physique atomique ............................................................................................................. 1256
Physique quantique corpusculaire .................................................................................1256
Introduction................................................................................................................1256

22/2001
Sciences.ch 14/03/2005

Modèle de Dalton.......................................................................................................1258
Modèle de Thomson ..................................................................................................1259
Modèle de Rutherford................................................................................................1260
Modèle de Bohr .........................................................................................................1261
Postulats de Bohr ..................................................................................................1261
Quantification........................................................................................................1262
Modèles des atomes hydrogénoïdes sans entraînement ........................................1264
Rayon de Bohr..................................................................................................1265
Formule de Balmer ...........................................................................................1267
Constante de Rydberg..................................................................................1267
Modèle des atomes hydrogénoïdes avec entraînement .........................................1268
Hypothèse du neutron ...........................................................................................1272
Modèle de Sommerfeld et Wilson .............................................................................1273
Nombre quantique azimutal ..................................................................................1275
Nombre quantique radial.......................................................................................1277
Modèle relativiste de Sommerfeld.............................................................................1278
Constante de structure fine....................................................................................1285
Constante de Rydberg ...........................................................................................1295
Moment magnétique dipolaire quantique..............................................................1295
Facteur gyromagnétique ...................................................................................1296
Magnéton de Bohr ............................................................................................1296
Nombre quantique magnétique ........................................................................1296
Spin ....................................................................................................................... 1298
Principe d'exclusion de Pauli ................................................................................1299
Couches électroniques...........................................................................................1299
Physique quantique ondulatoire.....................................................................................1304
Postulats .....................................................................................................................1306
1er postulat (état quantique)..................................................................................1307
2ème postulat (évolution temporelle d'un état quantique) ....................................1308
3ème postulat (observables et opérateurs) ............................................................1309
4ème postulat (mesure d'une propriété) ................................................................1311
5ème postulat (moyenne d'une propriété) .............................................................1311
Principes d'incertitudes classiques .............................................................................1311
Première relation d'incertitude classique...............................................................1313
Deuxième relation d'incertitude classique.............................................................1314
Troisième relation d'incertitude classique.............................................................1315
Algèbre quantique......................................................................................................1316
Opérateurs linéaires fonctionnels..........................................................................1316
Opérateurs de quantité de mouvement .............................................................1319
Opérateurs adjoints et hermitiques ...................................................................1319
Commutateurs et anti-commutateurs................................................................1321
Relations d'incertitudes de Heisenberg........................................................1323
Interprétation de Copenhague ..........................................................................1324
Dimensions de Planck ......................................................................................1326
Représentatives .....................................................................................................1329
Valeurs et fonctions propres..................................................................................1331
Formalisme de Dirac .............................................................................................1333
Kets et Bras ......................................................................................................1333
Modèle de Schrödinger..............................................................................................1335
Principe de complémentarité.................................................................................1336

23/2001
Sciences.ch 14/03/2005

Onde associée de De Broglie............................................................................1336


Longueur d'onde associée............................................................................1336
Onde thermique associée de Broglie ................................................................1337
Equation classique de Schrödinger .......................................................................1338
Hamiltonien ......................................................................................................1339
Condition de normalisation de De Broglie.......................................................1340
Etats liés et non liés ..........................................................................................1341
Equation d'évolution classique de Schrödinger ....................................................1342
Equation de continuité......................................................................................1347
Equation d'évolution relativiste de Schrödinger ...................................................1348
Equation de Klein-Gordon libre .......................................................................1349
Implications...........................................................................................................1349
Puits de potentiel à parois rectilignes ...............................................................1350
Oscillateur harmonique ....................................................................................1355
Relation de De Broglie ................................................................................1355
Effet tunnel .......................................................................................................1366
Anti-matière......................................................................................................1371
Principe de superposition linéaire des états......................................................1374
Moment cinétique .................................................................................................1381
Moment cinétique.............................................................................................1390
Analogie avec le principe de moindre action........................................................1391
Equation de Klein-Gordon généralisée .................................................................1394
Densité de probabilité.......................................................................................1400
Densité de courant ............................................................................................1400
Equation de Dirac libre classique..........................................................................1401
Equations de Weyl............................................................................................1406
Equation de Dirac libre linéarisée .........................................................................1413
Equation de Dirac généralisée...............................................................................1425
Physique nucléaire .........................................................................................................1427
L'arme nucléaire.........................................................................................................1427
Nombre atomique, nombre de masse.........................................................................1428
Isotopes, nucléides, isotones......................................................................................1429
Système de masse atomique (u.m.a) ..........................................................................1429
Radioactivité ..............................................................................................................1430
Demi-vie d'isotope ................................................................................................1431
Activité radioactive....................................................................................................1431
Datation au carbone 14 ..............................................................................................1432
Filiation radioactive ...................................................................................................1434
Phénomènes radioactifs .............................................................................................1436
Défaut de masse ....................................................................................................1436
Energie moyenne par nucléon ..........................................................................1437
Fusion nucléaire (1) ..............................................................................................1437
Fission nucléaire (2)..............................................................................................1437
Désintégration alpha (3)........................................................................................1439
Désintégration bêta - (4)........................................................................................1440
Désintégration bêta + (5).......................................................................................1442
Capture électronique (6)........................................................................................1442
Emission gamma (7) .............................................................................................1443
Conversion interne (8)...........................................................................................1444
Electron de conversion .....................................................................................1444

24/2001
Sciences.ch 14/03/2005

Electron Auger .................................................................................................1445


Radioprotection..........................................................................................................1445
Formule de Bethe-Bloch .......................................................................................1445
Effet Compton.......................................................................................................1449
Effet photoélectrique.............................................................................................1452
Diffusion de Rutherford ........................................................................................1456
Paramètre de choc ............................................................................................1456
Rayons-X et Gamma .............................................................................................1462
Coefficient d'atténuation massique...................................................................1463
Section efficace microscopique........................................................................1464
Longueur de relaxation.....................................................................................1465
Création paires électron-positron .....................................................................1466
Physique quantique des champs .....................................................................................1468
Photons virtuels..........................................................................................................1468
Potentiel de Yukawa ..................................................................................................1470
Champs non-massiques.........................................................................................1472
Equation d'Euler-Lagrange des champs.....................................................................1474
Equations du mouvement de Heisenberg..............................................................1474
Lagrangien de Klein-Gordon ................................................................................1479
Lagrangien du champ électromagnétique .............................................................1480
Lagrangien de Dirac..............................................................................................1482
Chimie................................................................................................................................. 1484
Chimie quantique............................................................................................................1484
Puits de potentiel rectangulaire tridimensionnel infini ..............................................1484
Vibrations moléculaires .............................................................................................1488
Atome hydrogénoïde..................................................................................................1491
Rotateur rigide.......................................................................................................1495
Harmoniques sphériques ..................................................................................1511
Cartes de densité...............................................................................................1511
Cartes d'isodensité ............................................................................................1512
Chimie analytique...........................................................................................................1519
Réactions....................................................................................................................1520
Grandeurs stoechiométriques ................................................................................1520
Avancement élémentaire de réaction ....................................................................1520
Taux d'avancement................................................................................................1521
Chimie thermique ...........................................................................................................1524
Transformations chimiques........................................................................................1524
Chaleur de réaction à pression constante ..............................................................1525
Grandeurs molaires ....................................................................................................1525
Masse molaire atomique .......................................................................................1526
Masse molaire moléculaire ...................................................................................1526
Titre molaire..........................................................................................................1527
Titre massique associé...........................................................................................1527
Molarité .................................................................................................................1527
Grandeur molaire standard....................................................................................1528
Informatique théorique ...................................................................................................... 1532
Méthodes numériques .....................................................................................................1532
Complexité.................................................................................................................1534
NP-Complétude.....................................................................................................1537
Partie Entière..............................................................................................................1539

25/2001
Sciences.ch 14/03/2005

Algorithme d'Héron ...................................................................................................1541


Algorithme d'Archimède ...........................................................................................1541
Calcul du nombre d'Euler ..........................................................................................1543
Calcul de la factorielle (formule de Stirling) .............................................................1544
Systèmes d'équations linéaires...................................................................................1544
Une équation à une inconnue ................................................................................1545
Deux équations à deux inconnues .........................................................................1545
Trois équations à trois inconnues..........................................................................1546
N équations à n inconnues ....................................................................................1547
Polynômes..................................................................................................................1548
Régressions et interpolations .....................................................................................1550
Régression linéaire ................................................................................................1550
Méthodes des moindres carrés .........................................................................1551
Interpolation polynomiale .....................................................................................1552
Méthode d'Euler ...............................................................................................1552
Polynôme de collocation ..................................................................................1553
Déterminant de Vandermonde.....................................................................1555
Recherche des racines................................................................................................1556
Méthodes des parties proportionnelles..................................................................1556
Méthode de la bissection.......................................................................................1558
Méthode de la sécante (regula falsi)......................................................................1558
Méthode de Newton ..............................................................................................1560
Aires et sommes de Riemann.....................................................................................1563
Méthode des rectangles .........................................................................................1564
Méthode des trapèzes ............................................................................................1565
Programmation linéaire..............................................................................................1566
Algorithme du simplexe........................................................................................1571
Méthode de Monte-Carlo...........................................................................................1576
Calcul d'une intégrale............................................................................................1578
Calcul de Pi ...........................................................................................................1579
Dichotomie............................................................................................................1579
Réseaux de neurones formels ....................................................................................1580
Modèle de neurone................................................................................................1581
Fonction de transfert .............................................................................................1584
Architecture de réseau...........................................................................................1586
Algorithmes génétiques .............................................................................................1588
Codage et population initiale ................................................................................1591
Opérateurs .............................................................................................................1593
Opérateur de sélection ......................................................................................1593
Opérateur de croisement...................................................................................1594
Opérateurs de mutation ....................................................................................1595
Fractales......................................................................................................................... 1599
Topologie fractale ......................................................................................................1599
Ensemble de Cantor ..............................................................................................1606
Espace métrique des fractales ...............................................................................1608
Construction d'images fractales .................................................................................1610
Ensemble de Mandelbrot ......................................................................................1611
Ensemble de Julia..................................................................................................1613
Ensemble de Newton ............................................................................................1614
Systèmes logiques formels .............................................................................................. 1616

26/2001
Sciences.ch 14/03/2005

Logique stricte ...........................................................................................................1616


Algèbre de Boole ..................................................................................................1617
Théorème des constantes..................................................................................1619
Théorèmes du consensus ..................................................................................1619
Théorèmes de Shannon ....................................................................................1620
Théorème de De Morgan..................................................................................1621
Fonctions logiques ................................................................................................1622
Tables de Karnaugh...............................................................................................1624
Opérations arithmétiques booléennes ...................................................................1628
Logique floue.............................................................................................................1632
Ensemble flou .......................................................................................................1634
Codes correcteurs...........................................................................................................1638
Encodeurs...................................................................................................................1639
Distance de Hamming ...........................................................................................1640
Poids de Hamming ................................................................................................1641
Codes en blocs-linéaires........................................................................................1642
Matrice génératrice...........................................................................................1644
Matrice de contrôle...........................................................................................1644
Codes systématiques .............................................................................................1647
Cryptographie................................................................................................................. 1649
Systèmes symétriques et asymétriques ......................................................................1650
Principe de Kerchoffs ................................................................................................1651
Trappes .....................................................................................................................1651
Rappels mathématiques .............................................................................................1651
Groupe................................................................................................................... 1652
Divisibilité.............................................................................................................1652
Division euclidienne..............................................................................................1653
P.G.C.D. ...........................................................................................................1653
Fonction phi d'Euler ..............................................................................................1654
Congruence ...........................................................................................................1657
Système de chiffrement à clé secrète.........................................................................1659
Schéma de Feistel..................................................................................................1661
Système de chiffrement à clé publique ......................................................................1664
Protocole de Diffie-Hellmann ...............................................................................1666
Système R.S.A. .....................................................................................................1668
Fonction de condensation Message Digest MD5 ......................................................1674
Fonction de condensation Secure Hash Algorithm SHA-1 .......................................1675
Certificats d'authentification ......................................................................................1677
Cryptographie quantique............................................................................................1678
Cryptographie alternative ..........................................................................................1683
Automates .......................................................................................................................1685
Mise en perspective ...................................................................................................1685
Machine de Von Neumann....................................................................................1686
Machine de Turing ................................................................................................1687
Hiérarchie de Chomsky.........................................................................................1689
Langage formel.................................................................................................1689
Syntaxe .............................................................................................................1690
Grammaire formelle .........................................................................................1691
Automates associés...........................................................................................1691
Terminologie..............................................................................................................1694

27/2001
Sciences.ch 14/03/2005

Mots ......................................................................................................................1694
Langages ...............................................................................................................1696
Equations...............................................................................................................1698
Codes.....................................................................................................................1699
Codes préfixes ..................................................................................................1699
Algorithmes linguistiques ..........................................................................................1700
Algorithme de Huffmann ......................................................................................1700
Algorithme de Sardinas et Petterson .....................................................................1705
Informatique quantique ..................................................................................................1708
Polarisation du photon ...............................................................................................1711
QuBit..........................................................................................................................1714
Mathématiques sociales................................................................................................. 1720
Dynamique des populations ...........................................................................................1720
Modèle exponentiel....................................................................................................1720
Modèle logistique ......................................................................................................1721
Diagramme de Feigenbaum ..................................................................................1727
Propagation des épidémies.........................................................................................1731
Modèle Proies-Prédateurs (de Lotka-Volterra)..........................................................1734
Modèle de Hardy-Weinberg ......................................................................................1741
Théorie de la décision (jeux) ..........................................................................................1746
Représentatives ..........................................................................................................1748
Formes extensives .................................................................................................1748
Formes normales ...................................................................................................1749
Jeux répétitifs ...................................................................................................1754
Formes ensemblistes .............................................................................................1756
Jeux coopératifs et non-coopératifs ...........................................................................1760
Optimum de Pareto ...............................................................................................1761
Equilibre de Nash..................................................................................................1762
Utilité espérée .......................................................................................................1763
Jeux évolutionnaires ..................................................................................................1767
Equilibre de Cournot .............................................................................................1771
Econométrie....................................................................................................................1775
Concepts.....................................................................................................................1776
Micro-économie ....................................................................................................1778
Macro-économie ...................................................................................................1784
Modèle monétaire ......................................................................................................1785
Théorie de l'offre et de la demande............................................................................1791
Théorie de la préférence........................................................................................1791
Modèle contrarié à perte nette ..........................................................................1797
Calculs actuariels .......................................................................................................1804
Intérêt simple.........................................................................................................1806
Intérêt composé .....................................................................................................1806
Intérêt progressif ...................................................................................................1808
Théorie de la spéculation ...........................................................................................1809
Portefeuilles, titres actions et obligations .............................................................1810
Options .............................................................................................................1811
Return on investment ............................................................................................1814
Goodwill...........................................................................................................1816
Risque d'un portefeuille....................................................................................1818
Coefficient bêta ................................................................................................1819

28/2001
Sciences.ch 14/03/2005

Modèle de Bachelier .............................................................................................1820


Modèle de Markowitz ...........................................................................................1824
Modèle de Sharp ...................................................................................................1828
Modèle de Black & Sholes....................................................................................1831
Equation de parité Call-Put ..............................................................................1831
Hypothèse efficiente du marché .......................................................................1832
Processus de Wiener.........................................................................................1833
Mouvement brownien.......................................................................................1835
Processu d'Ito....................................................................................................1836
Equation de Black & Sholes.............................................................................1840
Techniques de gestion.....................................................................................................1845
Droite d'Henry ...........................................................................................................1846
PERT probabiliste......................................................................................................1848
Gestion de Stock ........................................................................................................1852
Stock initial optimal ..............................................................................................1852
Modèle de Wilson .................................................................................................1858
Maintenance préventive.............................................................................................1863
Estimateurs empiriques .........................................................................................1864
Modèle de Weibull................................................................................................1867
Humour............................................................................................................................... 1870
Situations ........................................................................................................................1870
Mathématiques ...............................................................................................................1879
Physique .........................................................................................................................1887
Statistiques......................................................................................................................1889
Chimie ............................................................................................................................1891
Ingénierie ........................................................................................................................1894
Informatique ...................................................................................................................1896
Généralités ......................................................................................................................1906
Biographies......................................................................................................................... 1908
Références........................................................................................................................... 1985
Liens ................................................................................................................................... 1990
Sciences exactes .............................................................................................................1990
Editions-Magazines ........................................................................................................1990
Associations....................................................................................................................1992
TV-Radio ........................................................................................................................1992
Divers sciences ...............................................................................................................1993
Logiciels .........................................................................................................................1994
Licence ................................................................................................................................ 1996

29/2001
Sciences.ch 14/03/2005

INTRODUCTION

ABSTRACT

Ancien étudiant en physique, j'ai toujours regretté l'absence d'un bon livre complet et
rigoureux destiné à toutes et à tous contenant l'ensemble du programme de mathématique-
physique de la plus petite classe jusqu'au troisième cycle universitaire sans avoir à s'habituer
chaque fois à une notation ou un vocabulaire spécifique à l'auteur du livre concerné.

J'ai été de plus assez frustré pendant mes études à devoir ingurgiter assez souvent des
"formules" ou des "lois" soit disant (et à tort) indémontrables ou trop compliquées selon mes
professeurs ou même des livres d'auteurs de renomée internationale. Bien qu'aujourd'hui je
doive admettre qu'effectivement que la démonstration de certaines relations présentées dans le
cadre des cours de physique ou de mathématique ne puisse ce faire faute de temps dans le
planning scolaire ou de place dans le livre, je ne peux admettre qu'un professeur ou un auteur
dise à son étudiant (respectivement lecteur) que certaines lois ou théorèmes sont
indémontrables (car la plupart du temps c'est faux) ou que telle ou telle démonstration est trop
compliquée sans lui donner une référence bibliographique où l'étudiant pourrait trouver
l'information qu'il recherche. Ce site doit pouvoir se substituer, gratuitement, à toutes ces
références permettant ainsi à tout étudiant curieux de ne pas être frusté pendant de longues
années durant son cursus scolaire en physique. Sans quoi, la physique prend alors l'aspect
rébarbatif d'une science figée, à l'écart de l'évolution scientifique et technique, d'une
accumulation hétéroclite de connaissances et surtout de formules qui la font considérer
comme un sous-produit insipide des mathématiques...

Si ceux qui voient la physique-mathématique comme un outil (ce qu'elle est aussi) ou comme
l'ennemi des croyances religieuses, ou comme un domaine scolaire rébarbatif sont légions, il
est cependant peut-être utile de rappeler que, comme le disait Galilée "le livre de la Nature est
écrit dans le langage des mathématiques". C'est dans ce contexte que ce site aborde la
physique-mathématique pour les étudiants en sciences de la Nature, de la Terre et de la Vie
comme pour tous ceux qui exercent une profession liée à ces diverses matières y compris la
philosophie ou pour toute personne curieuse de s'informer de l'implication des sciences dans
la vie quotidienne.

La frontière entre la philosophie et les sciences pures et exactes est très mince. Effectivement,
comme le relate Platon dans le Phédon, Socrate à ses dernières heures s'est entouré de ses
amis et disciples dont Cébès et Simmias (deux pythagoriciens) considérés par Socrate comme
interlocuteurs privilégiés. Ce n'est pas un hasard puisqu'il convient alors de philosopher, déjà,
en s'inspirant du modèle pythagoricien qui fait des mathématiques une voie nécessaire d'accès
à la vérité, seule capable de se frayer un chemin fiable pour aborder des sujets aussi
importants que ceux de l'âme et de sa destinée...

Le choix de traiter la physique ici comme une branche purement mathématique, sans être
cependant trop formel, provient certainement du fait que la physique (philosophie naturelle) et
la mathématique sont à ce jour tellement peu discernables que la médaille de Fields (la plus
haute récompense à ce jour dans le domaine de la mathématique) a été décernée en 1990 au
physicien Edward Witten, qui a utilisé des idées physiques pour re-démontrer un théorème
mathématique. Cette tendance n'est certainement pas un mal, car nous pouvons observer que
toute science, dès qu'elle cherche à atteindre une compréhension plus détaillée du sujet qu'elle
étudie, finit finalement toujours sa course dans les mathématiques pures (la voie absolue par
excellence). Ainsi, pouvons nous présager dans un futur lointain, la convergence de toutes les

30/2001
Sciences.ch 14/03/2005

sciences (pures, exactes ou sociales) vers la mathématique (lire à titre d'exemple le document
PDF L'explosion des mathématiques disponible dans la rubrique de téléchargement du site).

Nous reprendrons les mots W. Jeans qui a dit une fois " le grand architecte semble être
mathématicien". Effectivement, il peut parfois nous sembler difficile (pour une raison obscure
d'une crainte non justifiée des sciences pures), bien que nous y mettions le plus de coeur
possible à l'ouvrage, de transmettre le sentiment de beauté de la nature, de sa beauté la plus
profonde et de la mécanique parfaitement huilée de l'Univers à ceux qui ne connaissent rien
aux mathématiques. Le physicien R. Feynmann a parlé une fois de "deux cultures". Nous
pensons au même titre que ces "deux cultures" séparent vraiment les gens qui ont, et ceux qui
n'ont pas eu de compréhension suffisante des mathématiques pour apprécier la nature au
moins une fois dans leur vie. Il est bien dommage qu'il y faille cependant des mathématiques
et que celles-ci aient aussi mauvaise réputation. Pour l'anecdote, on prétend qu'un roi ayant
demandé à Euclide de lui enseigner la géométrie se plaignit de sa difficulté. Euclide répondit:
"il n'y a pas de voie royale". Les physiciens et mathématiciens ne peuvent se convertir à un
autre langage. Si vous voulez apprendre à connaître la nature, à l'apprécier à sa juste valeur,
vous devez comprendre son langage. Elle ne se révèle que sous cette forme et nous ne
pouvons être prétentieux au point de lui demander de changer avant que nous ne consentions à
nous occuper d'elle.

Au même titre, aucune discussion intellectuelle ne vous permettra de communiquer à un sourd


ce que vous ressentez vraiment en écoutant de la musique. De même, toutes les discussions du
monde resteront impuissantes à transmettre une compréhension de la nature à ceux de "l'autre
culture". Les philosophes et théologiens peuvent essayer de vous donner des idées qualitatives
sur l'Univers. Nous, nous essayons de le décrire avec la plus grande rigueur (qui ne s'aurait
subir de quelconques influences économiques, politiques, philosophiques ou religieuses). Le
fait que la méthode scientifique (au sens pur du terme) ne puisse convaincre le monde entier
de sa justesse et de sa pureté, trouve peut-être sa cause dans l'horizon limité de certaines gens
qui sont amené à s'imaginer que l'homme ou qu'un autre concept intuitif, sentimental ou
arbitraire est le centre de l'Univers (principe anthropocentrique).

Certes, dans le but partager ce savoir mathématique, nous concevons qu'il est paradoxal de
vouloir augmenter la liste déjà longue des ouvrages disponibles dans les bibliothèques, dans le
commerce et sur l'Internet. Si nous choisissons néanmoins de le faire, nous devons être en
mesure de présenter une argumentation solide qui justifie la création d'un tel site en
comparaison à des ouvrages comme ceux de Landau ou de Bourbaki. Voici donc les quelques
arguments qui nous paraissent cependant susceptibles d'être révélés :

1. Le grand plaisir que nous prenons à cette entreprise ("garder la main" et progresser)

2. La passion du partage gratuit et sans frontières de la connaissance

3. Le caractère évolutif et pratique d'un document électronique libre (outils de recherche


efficaces)

4. Le contenu évolutif en fonction de la demande !!!

5. La présentation rigoureuse de la physique et ses lois sans pré-requis nécessaires (les


outils mathématiques et leur utilisation en physique sont présentés dans le même
ouvrage).

6. La présentation du plus grand nombre d'outils mathématiques utilisés en physique-

31/2001
Sciences.ch 14/03/2005

mathématique

7. La possibilité pour les étudiants et professeurs de réutiliser le contenu par copier/coller

8. Une notation constante des opérateurs mathématiques, un langage clair, rigoureux et


constant sur tous les sujets abordés (critère des 3.C. : clair, complet et concis)

9. Rassembler le maximum d'informations sur les sciences pures et exactes en un seul


ouvrage électronique et rigoureux

10. Présenter parmi toutes les pseudo-vérités, les seules vérités qui se démontrent

11. L'évolution des méthodes pédagogiques scolaires qui utilisent l'internet pour chercher la
solution à des problèmes de mathématiques

12. L'évolution des robots de traduction et de la puissance des ordinateurs qui feront de ce
site, nous le souhaitons, une référence mondiale dans les domaine des sciences dures
toutes langues confondues.

et aussi... le fait que tant qu'hommes de sciences, nous considérons que les résultats de la
recherche individuelle sont la propriété de l'humanité et qu'ils doivent être mis à la disposition
de tous ceux qui explorent où que ce soit les phénomènes de la nature. De cette façon le
travail de chacun profite à tous, et c'est pour toute l'humanité que s'amassent non
connaissances.

Nous ne cachons pas, au contraire, que notre contribution se limite en grande partie à ce jour à
celle de collectionneurs qui glanent leurs informations dans les ouvrages des maîtres ou dans
les publications ou pages Internet d'anonymes et qui complètent et argumentent les
développements en les améliorant quand ceci est encore possible. Ceux qui pourraient nous
accuser de plagiat devraient réfléchir au fait que les théorèmes présentés dans la plupart des
ouvrages payants et disponibles dans le commerce ont été faits par leurs illustres
prédécesseurs et que leur travail a aussi constitué, comme le notre, à mettre toutes ces
informations dans un ordre clair et moderne. De plus, il peut être vu comme douteux que l'on
fasse payer l'accès à une culture qui est certainement la seule véritablement valable et juste
dans ce bas monde.

Après avoir tenté un ordre de présentation rigoureux du sujet, nous avons décidé d'arranger ce
document dans un ordre plus pédagogique (thématique). Il est à notre avis très difficile de
parler d'un si vaste sujet dans un ordre purement mathématique en une seule vie, c'est-à-dire
lorsque les notions sont introduites une à une, à partir de celles déjà connues (où chaque
théorie, opérateur, outil, etc. n'apparaîtrait pas avant sa définition dans le document). Un tel
plan nécessiterait de couper le document, en morceaux qui ne sont plus thématiques. Nous
avons donc pris la décision de présenter les choses par ordre logique et non par ordre de
nécessité.

Les conséquences de ce choix sont les suivantes :

1. Il faut admettre certaines choses, quitte à les comprendre plus tard

2. Il faut lire deux fois l'ensemble de l'ouvrage. Lors de la première lecture, on voit
l'essentiel et lors de la deuxième lecture, on comprend les détails (je félicite celui qui

32/2001
Sciences.ch 14/03/2005

comprend toutes les subtilités du premier coup).

Certains savent que pour chaque théorème et modèle mathématique, il existe quasiment
toujours plusieurs méthodes de démonstration. Nous avons personnellement toujours tenté de
choisir celle qui nous semblait la plus simple (par exemple en relativité il y a la présentation
algébrique et matricielle et idem en physique quantique). L'objectif étant d'arriver de toute
façon au même résultat.

Ce site étant à ses débuts, il manque forcément des vérifications de convergences (ce qui fera
grimper au plafond les mathématiciens...),de continuité et autres... ! Nous avons cependant
évité (dans le cas contraire nous faisons une autocritique) les approximations habituelles de la
physique et l'utilisation de l'analyse dimensionnelle, en y faisant recours le moins possible.
Nous essayons également d'éviter d'aborder des sujets dont les outils mathématiques n'ont pas
encore été présentés et démontrés avec rigueur.

Enfin, cet exposé n'est pas une référence et contient certainement des erreurs. Toute remarque
est donc la bienvenue. Nous nous appliquerons, dans la mesure du possible, à corriger les
erreurs signalées et à apporter les modifications nécessaires.

En revanche, même si les mathématiques sont exactes et indiscutables, la physique théorique


(ses modèles), reste interprétable dans le vocabulaire commun (mais pas dans le vocabulaire
mathématique) et ses conclusions toutes relatives . Nous ne pouvons que vous conseiller
lorsque vous parcourrez ce site, de lire par vous-même et de ne pas subir d'influences
extérieures. Il faut avoir l'esprit très (très) critique, ne rien prendre pour acquis et tout remettre
en cause sans hésitation. Nous tenons aussi à rappeler que "rien de ce que l’on peut voir,
entendre, sentir, toucher ou goûter, n’est ce qu’il a l’air d’être", ne vous fiez dès lors pas à
votre expérience quotidienne pour tirer des conclusions trop hâtives, soyez critique, cartésien,
rationnel et rigoureux dans vos développements, raisonnements et conclusions !

Nous tenons à préciser à ceux qui tenteraient de trouver par eux-mêmes les résultats de
certains développements présents sur ce site, de ne pas s'inquiéter s'ils n'y arrivent pas ou s'ils
doutent d'eux à cause du temps passé à la résolution d'une équation ou problème: certaines
théories qui nous semblent évidentes ou simples aujourd'hui, ont mis parfois plusieurs
semaines, plusieurs mois, voire plusieurs années, pour êtres élaborées par des mathématiciens
ou physiciens de renom !

Nous avons également tenté de faire en sorte que ce site soit agréable à l'oeil et à parcourir.
Les concepteurs web professionnels voudront cependant bien excuser la mauvaise qualité du
code HTML / PHP (qu'ils ne verront pas en partie..) / Javascript / CSS et l'abus de l'utilisation
du biseautage et estampage de Photoshop ainsi que le choix d'une interface optimisée pour
une résolution de 1024x768 et supérieure mais le temps nous manque pour épurer le code et
réaliser des finitions graphiques correctes (de plus, ce n'est pas vraiment le contenant qui nous
intéresse pour ce site).

Enfin, nous avons choisi d'écrire cet exposé à la première personne du pluriel ("nous").
Effectivement, la mathématique-physique n'est pas une science qui s'est faite ou évoluera
grâce à un travail individuel mais à l'aide d'une collaboration intensive entre personnes reliées
par la même passion et le même désir du Savoir. Ainsi, en faisant usage du "nous", nous
rendons hommage aux hommes de science disparus, aux contemporains et aux futurs
chercheurs pour le travail qu'ils effectueront dans le but de s'approcher de la vérité et de la
sagesse.

33/2001
Sciences.ch 14/03/2005

MÉTHODES

Avant de nous attaquer à l'étude de la mathématique et de la physique théorique, il sera utile


et nécessaire de connaître certains termes que nous retrouverons fréquemment dans le présent
site. Nous insistons bien sur le fait qu'il faut comprendre ces définitions et non les apprendre
bêtement par coeur!

Ces définitions doivent servir le lecteur à utiliser les bonnes méthodes (nous parlerons des
principes de la méthode de Descartes juste après) pour résoudre des problèmes ou développer
des modèles théoriques. Effectivement, voici un tableau qui montre les différentes étapes que
nous devrions suivre lorsque nous faisons de la mathématique ou de la physique (pour les
définitions, voir plus loin) :

MATHÉMATIQUE PHYSIQUE
1. Poser "l'hypothèse", la "conjecture" la 1. Poser le ou les "problèmes" à résoudre de
"propriété" à démontrer de manière formelle manière formelle ou en langage commun (les
ou en langage commun (les hypothèses étant problèmes étant notés P1., P2, ...)
notes H1., H2., ... les conjectures CJ1.,
CJ2.,... et les propriétés P1., P2., ...))
2. Le mathématicien définit les 2. Le physicien théoricien définit les
"axiomes" (sous-entendu non-démontrables, "postulats" ou "principes" ou encore les
indépendants et non-contradictoires) qui vont "hypothèses" et "suppositions" (supposés non
donner les points de départ et établir des démontrables...) qui vont donner les points de
restrictions aux développements (les axiomes départ et établir des restrictions aux
étant notés A1., A2, ...). développements (habituellement, les
postulats et principes sont notés P1., P2, ... et
Remarque : parfois par abus, "propriétés", les hypothèses H1., H2., ... en essayant
"conditions" et "axiomes" sont confondus d'éviter pour les postulats et principes, une
alors que le concept d'axiome est beaucoup confusion possible avec l'énoncé du ou des
plus profond. problèmes qui sont notés de la même
manière).
Dans la même idée, le mathématicien définit
le vocabulaire spécialisé relié à des
opérateurs mathématiques qui seront notés
par D1., D2., D3., ...
3. Des axiomes posés, le mathématicien peut 3. Une fois le "modèle théorique" développé,
en tirer directement des "lemmes" ou des le physicien théoricien doit vérifier les
"propriétés" dont la validité découle équations dimensionnelles pour vérifier une
directement des axiomes et qui préparent au possible erreur dans ses développements (ces
développement du théorème censé valider vérifications étant notées VA1., VA2, ...).
l'hypothèse ou la conjecture de départ (les
lemmes étant notés L1., L2., ... et les
propriétés P1., P2.,...).
4. Une fois le ou les "théorèmes" (notés T1., 4. Le physicien théoricien peut chercher les
T2., ...) démontrés et le ou les hypothèses cas limites (dont les "singularités" font
validées, le mathématicien peut en tirer des parties) de son modèle en vérifier la validité
"corollaires" (notés C1., C2., ...) et encore des intuitive (ces contrôles aux limites étant notés
propriétés (notées P1., P2., P3.,...). CL1., CL2., ...)
5. Le mathématicien peut tester la force ou 5. Le physicien de laboratoire (ou
l'utilité de sa ou ses conjectures ou phénoménologique) teste expérimentalement

34/2001
Sciences.ch 14/03/2005

hypothèses en démontrant la réciproque du le modèle théorique obtenu.


théorème ou en le résultat aux physiciens ou
en la comparant avec des exemples à d'autres
théories mathématiques pour voir si
l'ensemble forme un tout cohérent (les
exemples étant notés E1., E2., ...).
6. D'éventuelles remarques peuvent être 6. D'éventuelles remarques peuvent être
indiquées dans un ordre structuré et notées indiquées dans un ordre structuré et notées
hiérarchiquement R1., R2., ... hiérarchiquement R1., R2., ...

Procéder comme dans le tableau ci-dessus est LA bonne méthode à suivre pour travailler en
mathématique et physique. Évidemment, procéder de façon propre et traditionnelle comme ci-
dessus prend un petit plus de temps qu'en faisant un peu n'importe quoi, n'importe comment
(c'est pour cela que la plupart des professeurs ne suivent pas ces règles, le temps leur manque
cruellement pour parcourir tout le programme scolaire).

Pour l'instant le présent site Internet ne suit pas (non plus) totalement ces règles
fondamentales mais cela changera avec le temps (qui nous manque... sic!).

Profitons de l'occasion ceci étant dit, de présenter les quatre principes de la méthode de
Descartes :

P1. Ne recevoir jamais aucune chose pour vraie que je ne la connusse évidemment être telle;
c'est-à-dire, d'éviter soigneusement la précipitation et la prévention, et de ne comprendre rien
de plus en mes jugements que ce qui se présenterait si clairement et si distinctement à mon
esprit, que je n'eusse aucune occasion de le mettre en doute.

P2. De diviser chacune des difficultés que j'examinerais, en autant de parcelles qu'il se
pourrait, et qu'il serait requis pour les mieux résoudre.

P3. De conduire par ordre mes pensées, en commençant par les objets les plus simples et les
plus aisés à connaître, pour monter peu à peu comme par degrés jusques à la connaissance des
plus composés, et supposant même de l'ordre entre ceux qui ne se précèdent point
naturellement les uns les autres.

P4. Et le dernier, de faire partout des dénombrements si entiers et des revues si générales, que
je fusse assuré de ne rien omettre.

Remarques :

R1. le mathématicien aime parfois bien terminer ses démonstrations (quand il pense qu'elles
sont justes) par l'abréviation c.q.f.d. qui signifie "ce qu'il fallait démontrer" ou encore dans les
hautes écoles par souci d'esthétisme certains professeurs (et mêmes élèves) notent cela en
latin q.e.d. qui signifie "quod erat demonstrandum" (cela en jette...).

R2. Lors des définitions (elles sont nombreuses en mathématiques...) le mathématicien fait
souvent usage des terminologies suivantes :

- ... il suffit que ...

35/2001
Sciences.ch 14/03/2005

- ... si et seulement si ...

- ... nécessaire et suffisant ...

- ... signifie que ...

Les 4 sont équivalentes (identiques au sens strict) nous en ferons usage en fonction de
l'humeur...

R3. Le lecteur s'habituera petit à petit aux nécessités de précision ou, au contraire, aux
habitudes/usages d'imprécision et d'abus de langage sous lesquels tout texte mathématique
serait pédant et/ou illisible.

Le tableau méthodique précédent contient des termes qui peuvent peut-être vous sembler
inconnus ou barbares. C'est la raison pour laquelle il nous semble important, voir fondamental
de présenter les définitions de ces derniers, ainsi que de quelques autres tout aussi importants :

Définitions

D1. Le mot "science" vient du latin "scienta" (connaissance) dont la racine est "scire" qui veut
dire "savoir".

Il est important que nous définissions rigoureusement les différents types de sciences
auxquelles l'être humain fait souvent référence. Effectivement, il semble qu'au 21e siècle un
abus de langage malsain s'instaure et qu'il ne devient plus possible pour la population de
distinguer la "qualité intrinsèque" d'une science d'une autre.

Cet abus de langage vient probablement du fait que plus les sciences pures et exactes perdent
leurs illusions d'universalité et d'objectivité, dans le sens où elles s'auto-corrigent. Ceci ayant
pour conséquence que certaines sciences sont reléguées au second plan et tentent d'en
emprunter les méthodes, les principes et les origines pour créer une confusion quant à leurs
distinctions.

Ainsi, un petit rafraîchissement semble nécessaire :

D2. Nous définissons par "science pure", tout ensemble de connaissances fondées sur un
raisonnement rigoureux valable quel que soit le facteur (arbitraire) élémentaire choisi (nous
disons alors "indépendant de la réalité sensible") et restreint au minimum nécessaire. Il n'y a
que la mathématique (appelée souvent "reine des sciences") qui peut être classifiée dans cette
catégorie.

D3. Nous définissons par "science exacte" ou "science dure", tout ensemble de connaissances
fondées sur l'étude d'une observation, observation qui aura été transcrite sous forme
symbolique (physique théorique).

Remarque : les deux définitions précédentes sont souvent incluses dans la définiton de
"sciences déductives"

D4. Nous définissons par "science de l'ingénieur", tout ensemble de connaissances théoriques
ou pratiques appliquées aux besoins de la société humaine tels que : l'électronique, la chimie,
l'informatique, les télécommunications, la robotique, l'aérospatiale, biotechnologies...

36/2001
Sciences.ch 14/03/2005

D5. Nous définissons par "science" tout ensemble de connaissances fondées sur des études ou
observations de faits dont l'interprétation n'a pas encore été retranscrite ni vérifiée par la
rigueur mathématique mais qui applique des raisonnements comparatifs statistiques. Nous
incluons dans cette définition: la médecine (il faut prendre garde au fait que certaines partie de
la médecine étudie des phénomènes retranscrits sous forme mathématique tel que les réseaux
de neurones ou autres phéonèmnes associés à des causes physiques connues), la sociologie, la
psychologie, l'histoire, la biologie...

D6. Nous définissons par "science molle" tout ensemble de connaissances ou de pratiques qui
sont actuellement fondées sur des faits invérifiables (non reproductibles scientifiquement) ni
par l'expérience, ni par la mathématique. Nous incluons dans cette définition: l'astrologie, la
théologie, le paranormal (zététique), la graphologie...

En ce qui concerne les hommes de science..., Albert Einstein en avait une idée très arrêtée
mais que nous trouvons intéressante d'exposer (certains peut-être s'y reconnaîtront). Ainsi, les
vrais scientifiques, "individus bizarres, solitaires et renfermés" selon lui, sont nécessairement
des théoriciens - l'idée de devoir inventer des objets pour raffiner l''existence de ses
contemporains lui était "intolérable". Il travaillent dans l'abstraction, de préférence seuls, en
évitant si possible de faire de la science leur gagne-pain; juste une fructueuse activité annexe,
comme cela a été le cas pour lui à Berne (Suisse). Ils se doivent d'être sourds aux appels de la
chair et de l'estomac, l'un des motifs les ayant poussés à s'adonner à cette activité ardue,
solitaire et non rémunérée étant, d'après Einstein, le besoin irrésistible de "s'évader hors de la
vie quotidienne , de sa douloureuse grossiérété et de sa et de sa désolante monotonie, hors des
entraves de nos propres désirs éternellement changeants". Lui-même a toujours considéré les
basses aspirations humaines - réussite sociale, propriété, luxe - "comme méprisables, depuis
tout petit".

Ce portrait de savant en moine autiste correspond presque trait pour trait à celui du terrifiant
grand ancêtre, Isaac Newton. Isaac Newton était un parfait autodidacte, qui a défriché seul les
domaines du savoir dans lesquels il a brillé. Einstein a eu d'excellents professeurs mais a
butiné à sa guise les matières et les sujets qui l'intéressaient. Newton n'a jamais eu ni maître,
ni collègue, ni complice, ni élève ou assistant d'aucune sorte et ses théories sont toutes
casquées de son unique cerveau. Einstein a accouché seul (en s'inspirant de travaux existants)
de la théorie de la relaitivté restreinte et s'est engagé seul dans la voie de la relativité générale
(en parallèle et en concurrence avec David Hilbert), ne se résignant à appeler l'aide de son ami
le mathématicien Marcel Grossmann que lorsqu'il s'est trouvé devant un mur.

D7. Le "scientisme" est la doctrine fondamentale suivant laquelle il n'y a de vérité que dans la
science.

Ce qui est intéressant dans cette doctrine, c'est que c'est certainement une des seules qui
demande aux gens de devoir réfléchir par eux-mêmes et de comprendre l'environnement qui
les entoure en remettant continuellement tout en question et sans ne jamais rien accepter
comme acquis (...)

D8. Au-delà de son sens négatif, l'idée de "problème" renvoie à la première étape de la
démarche scientifique. Formuler un problème est ainsi essentiel à sa résolution et permet de
comprendre correctement ce qui fait problème et de voir ce qui doit être résolu.

Le concept de "problème" est intimement relié au concept "d'hypothèse" dont nous allons voir
la définition ci-dessous.

37/2001
Sciences.ch 14/03/2005

D9. Une "hypothèse" est toujours, dans le cadre d'une théorie déjà constituée ou sous-jacente,
une supposition en attente de confirmation ou d'infirmation qui tente d'expliquer un groupe de
faits ou de prévoir l'apparition de faits nouveaux.

Ainsi, une hypothèse peut-être à l'origine d'un problème théorique qu'il faudra formellement
résoudre.

Nous nous permettrons au passage de citer Gauss (voir la page des biographies):

"La méthode de l’hypothèse en Science théorique suppose que contrairement aux sciences
expérimentales, que les soi-disant données sensorielles sont totalement trompeuses. Rien de
ce que l’on peut voir, entendre, sentir, toucher goûter n’est ce qu’il a l’air d’être. Formuler
une telle idée n’est cependant que la première étape du travail de la méthode de l’hypothèse. Il
faut avoir une croyance passionnée - dans un sens proche de la véritable signification du mot '
Foi ' en la réalité d’une simple idée de ce genre. Ce n’est que si elle est guidée par une telle
passion, par un amour de l’idée, qu’une personne peut trouver la motivation nécessaire pour la
pousser d’avantage."

D10. le "postulat" en physique correspond fréquemment à un "principe" (voir définition ci-


dessous) dont l'admission est nécessaire pour établir une démonstration (nous sous-entendons
que cela est une proposition non-démontrable).

L'équivalent mathématique (mais en plus rigoureux) du postulat est "l'axiome" dont nous
verrons la définition plus loin.

D11. un "principe" (parent proche du "postulat") est donc une proposition admise comme base
d'un raisonnement ou une règle générale théorique qui guide la conduite des raisonnements
qu'il faudra effectuer.

En physique, il s'agit également d'une loi générale régissant un ensemble de phénomènes et


vérifiée par l'exactitude de ses conséquences. Le but étant en physique de n'avoir à la fin
qu'une seule et unique loi pour expliquer tous les phénomènes (observables) de la nature.

Remarque: le mot "principe" est utilisé avec abus dans les petites classes ou écoles
d'ingénieurs par les professeurs ne sachant (ce qui est très rare), ou ne voulant (plutôt
fréquent), ou ne pouvant faute de temps (quasi exclusivement), pas démontrer une relation.

L'équivalent du postulat ou du principe en mathématiques est "l'axiome" que nous définissons


ainsi :

D12. Un "axiome" est une vérité (pas forcément vraie) évidente par elle-même

D13. Un axiome est une proposition générale dont l'admission est nécessaire pour établir une
démonstration

Remarque : Les axiomes doivent toujours êtres indépendants entre eux (on ne peut démontrer
un à partir de l'autre), non contradictoires (ils ne doivent pas se contredire - nous disons
également parfois qu'ils doivent être "consistants").

D14. le "corollaire" est un terme malheureusement quasi inexistant en physique (à tort !) et


qui est en fait une proposition résultant d'une vérité déjà démontrée. Nous pouvons également

38/2001
Sciences.ch 14/03/2005

dire qu'un corollaire est une conséquence nécessaire et évidente d'un postulat (par exemple).

D15. Un "lemme" constitue une proposition déduite d'un ou de plusieurs postulats ou axiomes
et dont la démonstration prépare celle d'un théorème.

Remarque : Le concept de lemme est lui aussi (et c'est malheureux) quasi réservé aux
mathématiques.

D16. une "conjecture" constitue une supposition ou opinion fondée sur des probabilités d'un
résultat mathématique qui découle souvent d'un lemme.

D17. par-delà son sens faible de conjecture, une "théorie" est un ensemble articulé autour
d'une hypothèse et étayé par un ensemble de faits qui lui confèrent un contenu positif et
rendent l'hypothèse bien fondée.

D18. une "singularité" est une "indétermination" d'un calcul qui intervient par l'apparition
d'une division par le nombre zéro. Ce terme est aussi bien utilisé en mathématique qu'en
physique.

D19. une "démonstration" constitue un ensemble de procédures mathématiques à suivre pour


démontrer le résultat déjà connu ou non d'un théorème.

D20. Si le mot "paradoxe" signifie étymologiquement "contraire à l'opinion commune", ce


n'est cependant pas par pur goût de la provocation, mais bel et bien pour des raisons solides.
Le "sophisme" quant à lui, est un énoncé volontairement provocateur, une proposition fausse
reposant sur un raisonnement apparemment valide. Ainsi parle-t-on du fameux"paradoxe de
Zéno", alors qu'il ne s'agit que d'un sophisme. Le paradoxe ne se réduit pas à de la fausseté,
mais implique la coexistence de la vérité et de la fausseté, au point qu'on ne parvient plus à
discriminer le vrai et le faux. Le paradoxe apparaît alors problème insoluble ou "aporie".

39/2001
Sciences.ch 14/03/2005

THÉORIE DE LA DÉMONSTRATION

Nous avons choisi de commencer l'étude de la physique-mathématique (ou mathématique


appliquée) par la théorie qui nous semble la plus fondamentale et la plus importante dans le
domaine des sciences pures et exactes. Ce choix peut-être vu comme un peu révolutionnaire
puisque la théorie de la démonstration et de la logique n'est habituellement abordée qu'en
spécialisation à l'université ou dans les grandes écoles d'ingénieurs (ce qui n'était pas le cas
dans les années '70). Cependant, nous faisons le pari qu'il n'est pas nécessaire d'avoir une
assise scientifique considérable pour aborder et comprendre les éléments de base de cette
théorie.

La théorie de la démonstration et de la logique à trois objectifs dans le cadre de ce site:

1. Apprendre au lecteur à raisonner et à démontrer (démonstrations constructives, récursives


ou par l'absurde) et cela indépendant de la spécialisation étudiée

2. Démontrer qu'une démonstration est indépendante du langage utilisé (ce qui étonnera les
réticents aux résultats théoriques souvent dits "déraisonnables" de la physique-mathématique)

3. Se préparer à la théorie de la logique et au théorème d'incomplétude de Gödel

Effectivement, quand un étudiant arrive dans une classe, quel que soit le niveau de cette
dernière, il a surtout appris à calculer, à utiliser des algorithmes. Il a très peu appris à
raisonner. Pour tous les raisonnements, le support visuel est fort, et les personnes qui ne
"voient pas" qu'en traçant telle ou telle courbe droite la solution apparaît ou qui ne "voient
pas" dans l'espace sont très pénalisés.

Au lycée ("collège" pour certains ou "gymnase" pour les autres), on manipule déjà des objets
"inconnus", mais c'est surtout pour faire des calculs, et quand on raisonne sur des objets
représentés par des lettres, on peut remplacer "visuellement" par un réel, un vecteur, etc. A
partir d'un certain niveau, on demande aux personnes de raisonner sur des structures plus
abstraites, et donc de travailler sur des objets inconnus qui sont des éléments d'un ensemble
lui-même inconnu, par exemple les éléments d'un groupe quelconque. Ce support visuel
n'existe alors plus.

Nous demandons aux étudiants de raisonner, de démontrer des propriétés, mais personne ne
leur a jamais appris à raisonner convenablement, à écrire des preuves. Si nous demandonsà un
étudiant de licence de mathématiques ce qu'est une démonstration, il a quelque difficulté à
répondre. Il peut dire que c'est un texte dans lequel on trouve des "mots clés": "donc", "parce
que", "si", "si et seulement si", "prenons un tel que", "supposons que", "cherchons une
contradiction", etc. Mais il est incapable de donner la grammaire de ces textes ni même ces
rudiments, et d'ailleurs, ses enseignants, s'ils n'ont pas suivi de cours, en seraient
probablement incapables.

Pour parler un enfant n'a pas besoin de connaître la grammaire. Il imite son entourage et cela
marche très bien: un enfant de six ans sait utiliser des phrases déjà compliquées quant à la
structure grammaticale sans avoir jamais fait de grammaire. La plupart des enseignants ne
connaissent pas non plus la grammaire du raisonnement mais, chez eux, le processus

40/2001
Sciences.ch 14/03/2005

d'imitation a bien marché et ils raisonnent correctement. L'expérience de la majorité des


enseignants d'université montre que ce processus d'imitation marche bien chez les très bons
étudiants, et alors il est suffisant, mais il marche beaucoup moins bien, voire pas du tout, chez
beaucoup d'autres.

Tant que le degré de complexité est faible (notamment lors d'un raisonnement de type
"équationnel"), la grammaire ne sert à rien, mais quand il augmente ou quand on ne comprend
pas pourquoi quelque chose est faux, il devient nécessaire de faire un peu de grammaire pour
pouvoir progresser. Les enseignants et les étudiants connaissent bien la situation suivante:
dans un devoir, le correcteur a barré toute une page d'un grand trait rouge et mis "faux" dans
la marge. Quand l'étudiant demande ce qui est faux, le correcteur ne peut que dire des choses
du genre "ça n'a aucun rapport avec la démonstration demandée", "rien n'est juste", …, ce qui
n'aide évidemment pas l'étudiant à comprendre. Cela vient en partie, du fait que le texte rédigé
par l'étudiant utilise les mots voulus mais dans un ordre plus ou moins aléatoire et qu'on ne
peut donner de sens à l'assemblage de ces mots. De plus, l'enseignant n'a pas les outils
nécessaires pour pouvoir expliquer ce qui ne va pas. Il faut donc les lui donner!

Ces outils existent mais sont assez récents. La théorie de la démonstration est une branche de
la logique mathématique dont l'origine est la crise des fondements : il y a eu un doute sur ce
que nous avions avait le "droit" de faire dans un raisonnement mathématique (voir la "crise
des fondements" plus loin). Des paradoxes sont apparus. Par exemple (ce paradoxe est connu
sous le nom de "paradoxe de Russel") : soit l'ensemble des ensembles ne se contenant pas
eux-mêmes. Il est facile de montrer que appartient à si et seulement si n'appartient
pas à , ce qui est manifestement une contradiction. Il a alors été nécessaire de préciser les
règles de démonstration et de vérifier que ces règles ne sont pas contradictoires . Cette théorie
est apparue il y a environ un siècle, ce qui est très peu puisque l'essentiel des mathématiques
enseignées en première moitié de l'université est connu depuis deux ou trois cents ans.

Autre implication de la théorie de la démonstration : l'hypothèse du continu en théorie des


ensembles fut d'abord résolut partiellement en 1938 par un des plus grands logiciens du
XXème siècle, Kurt Gödel, qui démontra que l'hypothèse de Cantor n'était pas réfutable, c'est-
à-dire qu'on ne pourrait jamais démontrer qu'elle était fausse. Puis en 1963, le mathématicien
Paul Cohen boucla la boucle. Il démontra qu'on ne pourrait jamais non plus démontrer qu'elle
était vraie !!! Nous ne pouvons conclure à juste raison que Cantor avait perdu la raison (il était
devenu fou) à chercher à démontrer un problème qui ne pouvait pas l'être.

Il vaut mieux donc apprendre la théorie de la démonstration que de devenir fou...

LA CRISE DES FONDEMENTS

Cet essai traite de la façon la plus actuelle de comprendre la relation entre les mathématiques
et la connaissance empirique. Il se concentre sur deux questions :

1. Les mathématiques auraient-elles une sorte de relation métaphysique privilégiée avec le


réel

2. Sinon, comment se fait-il que l’abstraction mathématique semble souvent avoir une telle
puissance prédictive dans le monde réel ?

Eric S. Raymond l'a écrit le 14 mai 1993 pour la liste de discussion des Extropians, et je la
republié avec des changements mineurs en 2001 à la demande d’un correspondant qui l’avait

41/2001
Sciences.ch 14/03/2005

découvert dans une liste d’archives.

Voici le texte :

Pour les premiers Grecs, la géométrie était considérée comme la forme la plus haute du
savoir, une puissante clé pour les mystères métaphysiques de l’univers. Elle était plutôt une
croyance mystique, et le lien entre le mysticisme et la religion était rendu explicite dans des
cultes comme ceux des Pythagoriciens. Aucune culture n’a depuis déifié un homme pour
avoir découvert un théorème géométrique! Plus tard, les mathématiques furent considérées
comme le modèle d’une connaissance a priori dans la tradition aristotélicienne du
rationalisme.

L’étonnement des Grecs pour les mathématiques ne nous a pas quitté, on le retrouve sous la
traditionnelle métaphore des mathématiques comme "Reine des Science". Il s’est renforcé
avec les succès spectaculaires des modèles mathématiques dans la science, succès que les
Grecs (ignorant même la simple algèbre) n’avaient pas prévus. Depuis la découverte par Isaac
Newton du calcul intégral et de la loi du carré inverse de la gravité, à la fin des années 1600,
les sciences phénoménales et les plus hautes mathématiques étaient restées en étroite
symbiose - au point qu’un formalisme mathématique prédictif était devenu le signe distinctif
d’une "science dure".

Après Newton, pendant les deux siècles qui suivirent, la science aspira à ce genre de rigueur
et de pureté qui sembraient inhérentes aux mathématiques. La question métaphysique
semblait simple ; les mathématiques possédaient une connaissance a priori parfaite, et parmi
les sciences, celles qui étaient capables de se mathématiser le plus parfaitement étaient les
plus efficaces pour la prédiction des phénomènes . La connaissance parfaite consistait donc
dans un formalisme mathématique qui, une fois atteint par la science et embrassant tous les
aspects de la réalité, pouvait fonder une connaissance empirique a postériori sur une logique
rationnelle a priori. Ce fut dans cet esprit que Condorcet entreprit d’imaginer la description de
l’univers entier comme un ensemble d’équation différentielles partielles se résolvant les unes
par les autres.

La première faille dans cette image inspiratrice apparut dans la seconde moitié du 19ème
siècle, quand Riemann et Lobachevsky prouvèrent séparément que l’axiome des parallèles
d’Euclides pouvait être remplacé par d’autres qui produisaient des géométries
"consistantes" (on reviendra sur ce terme plus loin). La géométrie de Riemann prenait modèle
sur une sphère, celle de Lobachevsky, sur la rotation dun hyperboloïde.

L’impact de cette découverte a été obscurci plus tard par de grands chamboulements, mais sur
le moment, il fut un coup de tonnerre dans le monde intellectuel. L’existence de systèmes
axiomatiques mutuellement inconsistants, et dont chacun pouvait servir de modèle à l’univers
phénoménal, remettait entièrement en question la relation entre les mathématiques et la
théorie physique.

Quand on ne connaissait qu’Euclide, il n’y avait qu’une géométrie possible. On pouvait croire
que les axiomes d’Euclide constituaient un genre de connaissance parfaite a priori sur la
géométrie dans le monde phénoménal. Mais soudain, nous avons eu trois géométries,
embarrassantes pour les subtilités métaphysique.

Pourquoi aurions-nous à choisir entre les axiomes de la géométrie plane, sphérique et


hyperbolique comme descriptions de la géométrie du "réel"? Parce que toutes les trois sont
consistantes, nous ne pouvons en choisir aucune comme fondement a priori - le choix doit

42/2001
Sciences.ch 14/03/2005

devenir empirique, basé sur leur pouvoir prédictif dans une situation donnée.

Bien sûr, Les théoriciens de la physique ont longtemps été habitués à choisir des formalismes
pour poser un problème scientifique. Mais il était admis largement, si ce n’est
inconsciemment, que la nécessité de procéder ainsi ad hoc était fonction de l’ignorance
humaine, et, qu’avec de la logique ou des mathématiques assez bonnes, on pouvait déduire le
bon choix à partir de premiers principes, et produire des descriptions a priori de la réalité, qui
devaient être confirmées après coup par une vérification empirique.

Cependant, la géométrie euclidienne, considérée pendant deux cents ans comme le modèle de
la perfection axiomatique des mathématiques, avait été détrônée. Si l’on ne pouvait connaître
a priori quelque chose d’aussi fondamental que la géométrie dans l’espace, quel espoir restait-
il pour une pure théorie "rationnelle" qui embrasserait la totalité de la nature ?
Psychologiquement, Riemann et lobachevsky avaient frappé au cœur de l’entreprise
mathématique telle qu’elle avait été conçue jusqu’alors.

De plus, Riemann et Lobachevsky remettaient la nature de l’intuition mathématique en


question. Il avait été facile de croire implicitement que l’intuition mathématique était une
forme de perception - une façon d’entrevoir le noumène platonicien derrière la réalité. Mais
avec deux autres géométries qui bousculaient celle d’Euclide, personne ne pouvait plus être
sûr de savoir à quoi le noumène ressemblait.

Les mathématiciens répondirent à ce double problème avec un excès de rigueur, en essayant


d’appliquer la méthode axiomatique à toute les mathématiques. Il fut progressivement
découvert que la croyance en l’intuition mathématique comme à une sorte de perception d’un
monde nouménal avait encouragé la négligence ; dans la période pré-axiomatique, les preuves
reposaient souvent sur des intuitions communément admises de la "réalité" mathématique, qui
ne pouvaient plus être considérées automatiquement comme valides.

La nouvelle façon de penser les mathématiques conduisait à une série de succès


spectaculaires, parmi lesquelles la théorie des ensembles de Cantor, l’axiomatisation des
nombres de Frege, et éventuellement, la monumentale synthèse des Principia Mathematica de
Russell et Whitehead. Pourtant cela avait aussi un prix. La méthode axiomatique rendait la
connexion entre les mathématiques et la réalité phénoménale toujours plus étroite. En même
temps, des découvertes comme le paradoxe de Balzano suggéraient que les axiomes
mathématiques qui semblaient être consistants avec l’expérience phénoménale pouvait
entraîner de vertigineuses contradictions avec cette expérience.

La majorité des mathématiciens devinrent rapidement des "formalistes", soutenant que les
mathématiques pures ne pouvaient qu’être considérées philosophiquement comme une sorte
de jeu élaboré qui se jouait avec des signes sur le papier (c’est la théorie qui sous-tend la
prophétique qualification des mathématiques de "système à contenu nul" par Robert
Heinlein). La croyance "platonicienne" en la réalité nouménale des objets mathématiques, à
l’ancienne manière, semblait bonne pour la poubelle, malgré le fait que les mathématiciens
continuaient à se sentir comme les platoniciens durant le processus de découverte des
mathématiques.

Philosophiquement, donc, la méthode axiomatique conduisait la plupart des mathématiciens à


abandonner les croyances antérieures en la spécificité métaphysique des mathématiques. Elle
produisit aussi la rupture contemporaine entre les mathématiques pures et appliquées. La
plupart des grands mathématiciens du début de la période moderne - Newton, Leibniz,
Fourier, Gauss et les autres - s’occupaient aussi de science phénoménale (c’est à dire de

43/2001
Sciences.ch 14/03/2005

"philosophie naturelle"). La méthode axiomatique avait couvé l’idée moderne du


mathématicien pur comme un super esthète, insoucieux de la physique. Ironiquement, le
formalisme donnait aux purs mathématiciens un mauvais penchant à l’attitude platonicienne.
Les chercheurs en mathématiques appliquées cessèrent de côtoyer les physiciens et apprirent à
se mettre à leur traîne.

Ceci nous emmène au début du vingtième siècle. Pour la minorité assiégée des platoniciens, le
pire était encore à venir. Cantor, Frege, Russell et Whitehead montrèrent que toutes les
mathématiques pures pouvaient être construites sur le simple fondement axiomatique de la
théorie des ensembles. Cela convenait parfaitement aux formalistes ; les mathématiques se
réunifiaient, du moins en principe, à partir d’un faisceau de petits jeux détachés d’un grand.
Les platoniciens aussi étaient satisfaisaits ; s’il en survenait une grande structure, clé de voûte
consistante pour toutes les mathématiques, la spécificité métaphysique des mathématiques
pouvait encore être sauvée. Malheureusement, il s’avère qu’il existe plus d’une façon
d’axiomatiser la théorie des ensembles. En particulier, il y a au moins quatre façons
différentes de combiner les propositions sur les ensembles infinis, qui conduisent à des
théories des ensembles qui s’excluent (l’axiome de choix ou sa négation, l’hypothèse de
continuité ou sa négation.)

C’était encore et toujours Riemann/Lobachevsy, mais à un niveau beaucoup plus


fondamental. Les géométries riemanniennes et lobachevskiennes pouvaient fonctionner avec
des modèles finis, dans le monde ; vous pouviez décider empiriquement, à la limite, laquelle
convenait. Normalement, vous pouviez considérer les trois comme des cas particuliers de la
géométrie des géodésiques sur les variétés, ce faisant les intégrer à la superstructure érigée sur
la théorie des ensembles. Mais les axiomes indépendants dans la théorie des ensembles ne
paraissent pas conduire à des résultats qui puissent être modélisés dans le monde fini. Et il n’y
a aucun moyen d’affirmer à la fois l’hypothèse de continuité et sa négation dans une théorie
des ensembles unique. Comment un pauvre Platonicien choisit-il quel système décrit les
mathématiques "réelles" ? La victoire de la position formaliste semblait complète.

D’une façon négative, pourtant, un platonicien eut le dernier mot. Kurt Godel mit son grain de
sable dans le programme formaliste d’axiomatisation quand il démontra que tout système
d’axiomes assez puissant pour inclure les entiers devait être soit inconsistant (contenir des
contradictions) soit incomplet (trop faible pour décider de la justesse ou de la fausseté de
certaines affirmations du système). Et c’est plus ou moins où en sont les choses aujourd’hui.
Les Mathématiciens savent que de nombreuses tentatives pour faire avancer les
mathématiques comme une connaissance a priori de l’univers doivent se heurter à de
nombreux paradoxes et à l’impossibilité de décider quel système axiomatique décrit les
mathématiques "réelles". Ils ont été réduits à espérer que les axiomatisations standard ne
soient pas inconsistantes mais incomplètes, et à se demander anxieusement quelles
contradictions ou quels théorèmes indémontrables attendent d’être découverts ailleurs, cachés
comme des champs de mines dans la noosphère.

Cependant, sur le front de l’empirisme, les mathématiques étaient toujours un succès


spectaculaire en tant qu’outil de construction théorique. Les grands succès de la physique du
20ème siècle (la relativité générale et la physique quantique) poussaient si loin hors du
royaume de l’intuition physique, qu’ils ne pouvaient être compris qu’en méditant
profondément sur leurs formalismes mathématiques, et en prolongeant leurs conclusions
logiques, même lorsque ces conclusions semblaient sauvagement bizarres. Quelle ironie. Au
moment même où la "perception" mathématique en venait à paraître toujours moins fiable
dans les mathématiques pures, elle devenait toujours plus indispensable dans les sciences
phénoménales.

44/2001
Sciences.ch 14/03/2005

À l’opposé de cet arrière-plan, la fameuse citation d’Einstein sur l’applicabilité des


mathématiques à la science phénoménale pose un problème plus épineux qu’il n’apparaît
d’abord. Le rapport entre les modèles mathématiques et la prédiction des phénomènes est
complexe, pas seulement dans la pratique mais dans le principe. D’autant plus complexe que,
comme nous le savons maintenant, il y a des façons d’axiomatiser les mathématiques qui
s’excluent!

Mais pourquoi existe-t-il seulement de bons choix de modèle mathématique ? C’est à dire,
pourquoi y a-t-il un formalisme mathématique, par exemple pour la physique quantique, si
productif qu’il prédit réellement la découverte de nouvelles particules observables ?

Pour "répondre" à cette question on observera qu’elle peut, aussi bien, fonctionner comme
une sorte de définition. Pour beaucoup de système phénoménaux, de tels formalismes
prédictifs exacts n’ont pas été trouvés, et aucun ne semble plausible. Les poètes aiment
marmonner sur le cœur des hommes, mais on peut trouver des exemples plus ordinaires : le
climat, où le comportement d’une économie supérieure à celle d’un village, par exemple -
systèmes si chaotiquement interdépendants que la prédiction exacte est effectivement
impossible (pas seulement dans les faits mais en principe).

Il y a beaucoup de choses pour lesquelles la modélisation mathématique conduit au mieux à


des résultats statistiques confus et contingents et, pour le moins, ne prédit jamais avec succès
de "nouvelles entités". Ainsi la réponse correcte à cette question "Pourquoi les mathématiques
sont-elles si merveilleusement applicables à ma science ?" est-elle simplement "Parce que
c’est la sorte de science que vous avez choisi d’étudier!" ?

RAISONNEMENT HYPOTHETICO-DEDUCTIF

Après cette brève incursion philosophique revenons en aux mathématiques :

Le raisonnement hypothético-déductif est, nous le savons, la capacité qu'a l'apprenant de


déduire des conclusions à partir de pures hypothèses et pas seulement d'une observation
réelle. C'est un processus de réflexion qui tente de dégager une explication causale d'un
phénomène quelconque (nous y reviendrons lors de nos premiers pas en physique).
L'apprenant qui utilise ce type de raisonnement commence par formuler une hypothèse et
essaie ensuite de confirmer ou d'infirmer son hypothèse selon le schémas synoptique ci-
dessous :

45/2001
Sciences.ch 14/03/2005

La procédure déductive consiste à tenir pour vrai, à titre provisoire, cette proposition première
qu’on appelle, en logique le prédicat et à en tirer toutes les conséquences logiquement
nécessaires, c'est-à-dire à en rechercher les implications.

Soit la proposition : est un homme, elle implique la proposition suivante : est


mortel.

L'expression (si c'est un homme il est nécessairement mortel) est un implication


prédicative (d'où le terme "prédicat"). Il n’y a pas dans cet exemple de cas où on puisse
énoncer sans . Cet exemple est celui d’une "implication stricte", telle qu’on la trouve
dans le "syllogisme" (figure logique du raisonnement).

Des spécialistes ont montré que le raisonnement hypothético-déductif s’élabore


progressivement chez l’enfant, à partir de 6-7ans, et que ce type de raisonnement n’est utilisé
systématiquement, en partant d’une fonction propositionnelle stricte qu’à partir de 11-12 ans.

LOGIQUE PROPOSITIONNELLE

Ceci est un préliminaire absolument indispensable pour aborder une formation en sciences,
philosophie, droit, politique, économie, etc.

PROPOSITIONS

Définition : En logique (du premier ordre), une "proposition" est une affirmation qui a un
sens. Cela veut dire que l'on peut dire sans ambiguïté si cette affirmation est vraie ( ) ou
fausse ( ). C'est ce que l'on appelle le "principe du tiers exclu".

46/2001
Sciences.ch 14/03/2005

Exemple trivial et sympathique:

"Je mens" n'est pas une proposition. Si l'on suppose que cette affirmation est vraie, elle est
une affirmation de sa propre invalidité, donc nous devrions conclure qu'elle est fausse. Mais si
nous supposons qu'elle est fausse, alors l'auteur de cette affirmation ne ment pas, donc il dit la
vérité, aussi la proposition serait vraie.

Une proposition en logique binaire n'est donc jamais vraie et fausse à la fois. C'est que l'on
appelle le "principe de non-contradiction".

Ainsi, une propriété d'une proposition de l'ensemble des propositions est une application
de dans l'ensemble des "valeurs de vérité" :

Nous parlons de "sous-ensemble associé", lorsque la proposition engendre uniquement une


partie de et inversement.

Exemple:

Dans , si s'énonce " est pair" , alors ce qui est bien


seulement un élément de (mais de même cardinal - pour plus d'information sur les
cardinaux voir le chapitre traitant de la théorie des ensembles).

Définition : Soit une propriété sur l'ensemble . Une propriété sur est une
"négation" de si et seulement si, pour tout :

- est si est

- est si est

Nous pouvons rassembler ces conditions dans une table dite "table de vérité":

En d'autres termes, et ont toujours des valeurs de vérité "contraires". Nous noterons ce
genre d'énoncé " est une négation de " (à ne pas confondre avec la moyenne):

où le "connecteur" signifie "non".

CONNECTEURS

Il y a d'autres types de connecteurs utiles en logique:

47/2001
Sciences.ch 14/03/2005

Soit et deux propriétés définies sur le même ensemble .

(lire " ou ") est une propriété sur définie par :

- est vraie si au moins l'une des propriétés est vraie

- est fausse sinon

Nous pouvons créer la table de vérité du connecteur :

Il est facile de se convaincre que, si les parties de sont respectivement associées aux
propriétés que (voir théorie des ensembles) est associé à .

Le connecteur est associatif. Pour s'en convaincre, il suffit de faire une table vérité où nous
vérifions que:

Il existe également le connecteur pour "et" tel que soient deux propriétés définies sur
, est une propriété sur définie par :

- est vraie si toutes les deux propriétés sont vraies

- est fausse sinon

Nous pouvons créer la table de vérité du connecteur :

Il est également facile de se convaincre que, si les parties de sont respectivement

48/2001
Sciences.ch 14/03/2005

associées aux propriétés que (voir théorie des ensembles) est associé à .

Le connecteur est associatif. Pour s'en convaincre, il suffit aussi de faire une table vérité où
nous vérifions que:

Les connecteurs sont distributifs l'un sur l'autre. A l'aide d'une simple table de vérité,
nous prouvons que:

ainsi que:

Une négation de est un négation de est tel que :

A nouveau, ces propriétés peuvent se démontrer par une simple table de vérité.

Revenons maintenant sur le connecteur d'implication :

Soient deux propriétés sur . est une propriété sur définie par:

- est fausse si est vraie et fausse

- est vraie sinon

Si nous écrivons la table de vérité de l'implication :

Exemple : "Si tu obtiens ton diplôme, je t'achète un ordinateur"

49/2001
Sciences.ch 14/03/2005

Parmi tous les cas, un seul correspond à une promesse non tenue: celui où l'enfant à son
diplôme, et n'a toujours pas d'ordinateur.

Et le cas où il n'a pas le diplôme, mais reçoit quand même un ordinateur? Il est possible qu'il
ait été longtemps malade et a raté un semestre, et le père a le droit d'être bon.

Que signifie cette promesse, que nous écrirons aussi : "Tu as ton diplôme je t'achète un
ordinateur" ? Exactement ceci:

- Si tu as ton diplôme, c'est sûr, je t'achète un ordinateur (je ne peux pas ne pas l'acheter)

- Si tu n'as pas ton diplôme, je n'ai rien dit

Ce connecteur est essentiel en mathématiques, philosophie, etc. C'est le fondement de toute


démonstration, preuve ou déduction.

Le connecteur à comme propriétés (vérifiables à l'aide de la table de vérité ci-dessous) :

conséquence de la dernière propriété (à nouveau vérifiable par une table de vérité) :

Le connecteur d'équivalence signifie que:

Ce que nous pouvons vérifier à l'aide d'une table de vérité:

signifie bien " et ont toujours la même valeur de vérité" ou encore " et
sont équivalents". C'est vrai si et ont même valeur, faux dans tout cas contraire.

Bien évidemment :

Si , nous pouvons dire que pour que soit vraie, il suffit que soit vraie. Donc
est une condition suffisante de . D'un autre côté, signifie . Donc, si

50/2001
Sciences.ch 14/03/2005

est fausse, il est impossible que soit vraie. Donc finalement est une condition
nécessaire de .

La relation équivaut donc à ce que soit une condition nécessaire et suffisante de


et à ce que soit une condition nécessaire et suffisante de .

Les conditions de type "nécessaire et suffisant" peuvent être reformulés avec les termes "si",
"seulement si", "si et seulement si". Ainsi :

peut être énoncé: est vraie si est vraie. Mais si n'est pas vraie, ne peut
être vraie, donc: est vraie si et seulement si est vraie.

La relation équivaut donc à ce que soit vraie si et seulement si est vraie.

QUANTIFICATEURS

Il existe deux types de quantificateurs en en mathématiques:

- le quantificateur universel:

- le quantificateur existentiel:

D3: l'énoncé signifie par définition qu'une partie de associée à la


propriété , remplit entièrement l'ensemble :

Lire: "pour tout élément de , est vraie", ou encore "pour tout élément de , a
la propriété ", ou encore "chaque élément de à la propriété "

D4: l'énoncé signifie par définition que partie de associée à la propriété


, n'est pas vide:

Lire: "Il existe (au moins un) élément de , tel que est vraie", ou encore "il existe
(au moins un) élément de de , ayant la propriété .

Remarque: nous utilisons parfois le symbole pour dire brièvement : "Il existe un et un
seul":

Nous allons voir que la théorie de la démonstration et des ensembles, est l'exacte transcription
des principes et résultats de la Logique (celle avec un "L" majuscule").

GRAMMAIRE

51/2001
Sciences.ch 14/03/2005

Dans un cours de mathématiques (d'algèbre, d'analyse, de géométrie, …), on démontre les


propriétés de différents types d'objets (entiers, réels, matrices, suites, fonctions continues,
courbes, …). Pour pouvoir prouver ces propriétés, il faut bien sûr que les objets sur lesquels
on travaille soient clairement définis (qu'est-ce qu'un entier, un réel, …?).

En "logique du premier ordre" et, en particulier, en théorie de la démonstration, les objets que
nous étudions sont les formules et leurs démonstrations. Il faut donc donner une définition
précise de ce que sont ces notions. Les termes et les formules forment la grammaire d'une
langue, simplifiée à l'extrême et calculée exactement pour dire ce que l'on veut sans ambiguïté
et sans détour inutile (contrairement aux langues courantes).

Les "termes", ils désignent les objets dont on veut prouver des propriétés (nous reviendrons
un peu plus loin beaucoup plus en détail sur ces derniers) :

- En algèbre, les termes désignent les éléments d'un groupe (ou anneau, corps, espace
vectoriel, etc.). Nous manipulons aussi des ensembles d'objets (sous-groupe, sous-espace
vectoriel, etc). Les termes qui désignent ces objets, d'un autre type, seront appelés "termes du
second ordre".

- En analyse, les termes désignent les réels ou (par exemple, si nous nous placons dans des
espaces fonctionnels) des fonctions.

Les "formules", elles représentent les propriétés des objets que nous étudions (nous
reviendrons également beaucoup plus en détail sur ces dernières) :

- En algèbre, nous pourrons écrire des formules pour exprimer que deux éléments commutent,
qu'un sous-espace vectoriel est de dimension 3, etc.

- En analyse, nous écrirons des formules pour exprimer la continuité d'une fonction, la
convergence d'une suite, etc.

- En théorie des ensembles, les formules pourront exprimer l'inclusion de deux ensembles,
l'appartenance d'un élément à un ensemble,…

Les "démonstrations" :

Elles permettent d'établir qu'une formule est vraie. Le sens précis de ce mot aura lui aussi
besoin d'être défini. Plus exactement, elles sont des déductions sous hypothèses, elles
permettent de "mener du vrai au vrai", la question de la vérité de la conclusion étant alors
renvoyée à celle des hypothèses, laquelle ne regarde pas la logique mais repose sur la
connaissance que nous avons des choses dont nous parlons.

Il faut prendre garde en théorie de la démonstration à ne pas mélanger le niveau où vivent les
termes, les formules et les démonstrations, qui sont les objets de notre étude, et le niveau
"méta" où nous énoncons et prouvons les propriétés de ces objets. Dans cette même théorie
nous réservons également, dans la plupart des cas, la notation symbolique au niveau objet. Par
exemple, nous n'utiliserons pas l'abréviation pour "pour tout" au niveau méta.

LANGAGES

En mathématique, nous utilisons, suivant le domaine, différents langages qui se distinguent

52/2001
Sciences.ch 14/03/2005

par les symboles utilisés. La définition ci-dessous exprime simplement qu'il suffit de donner
la liste de ces symboles pour préciser le langage.

Définition : un langage est la donnée d'une famille (pas nécessairement finie) de symboles.
On en distingue trois sortes (symboles, termes et formules).

Remarques :

R1. Nous utilisons quelquefois le mot "vocabulaire" ou le mot "signature" à la place du mot
"langage".

R2. Le mot "prédicat" peut être utilisé à la place du mot "relation". On parle alors de "calcul
des prédicats" au lieu de "logique du premier ordre" (ce que nous avons étudié
précédemment).

SYMBOLES

Il en existe différents types de symboles que nous allons tâcher de définir :

- les "symboles de constante"

- les "symboles de fonction". A chaque symbole est associé un entier strictement positif qu'on
appelle son "arité": c'est le nombre d'arguments de la fonction. Si l'arité est 1 (resp. 2, …, ),
on dit que la fonction est unaire (resp. binaire, …, -aire)

- les "symboles de relation". De la même manière, à chaque symbole est associé un entier
positif ou nul (son arité) qui correspond à son nombre d'arguments et on parle de relation
unaire, binaire, -aire.

Remarques:

R1. un symbole de constante peut être vu comme un symbole de fonction à 0 argument.

R2. nous considèrons (sauf mention contraire) que chaque langage contient le symbole de
relation binaire = (lire "égal") et le symbole de relation (à ne pas confondre avec le symbole
de connection) à zéro argument dénoté (lire "bottom" ou "absurde") qui représente le faux.
Dans la description d'un langage, nous omettrons donc souvent de les mentionner. Le symbole
est souvent redondant. Nous pouvons en effet, sans l'utiliser, écrire une formule qui est
toujours fausse. Il permet cependant de représenter le faux d'une manière canonique et donc
d'écrire des règles de démonstration générales.

R3. Le rôle des fonctions et des relations est très différent. Comme nous le verrons plus loin,
les symboles de fonction sont utilisés pour construire les termes (les objets du langage) et les
symboles de relation pour construire les formules (le propriétés de ces objets).

Dans toute la suite, nous nous donnerons un ensemble infini de variables. Les variables
seront notées comme il l'est par tradition : (éventuellement indexées: ).

TERMES

Les termes (nous disons aussi "termes du premier ordre") représentent les objets associés au

53/2001
Sciences.ch 14/03/2005

langage. Formellement

Définitions :

Soit un langage:

D1. l'ensemble des termes sur est le plus petit ensemble contenant les variables et
constantes obtenues par l'application des symboles de fonctions à des termes.

D2. un terme clos est un terme qui ne contient pas de variables.

D3. Pour obtenir une définition plus formelle, nous pouvons écrire : où est une
variable ou un symbole de constante et, pour tout , où
est une fonction d'arité (rappelons que l'arité est le nombre d'arguments de la fonction).

D4. nous appellerons hauteur d'un terme le plus petit tel que

Remarques :

R1. la définition D4 signifie que les variables et les constantes sont des termes et que si est
un symbole de fonction -aire et sont des termes alors est un terme en soi
aussi. L'ensemble des termes est défini par la grammaire:

étant l'ensemble des symboles de constantes et l'ensemble des symboles de fonction


du langage pouvant êtres traités comme des termes.

Cette expression se lit de la manière suivante : un élément de l'ensemble que nous sommes
en train de définir est soit un élément de (variables), soit un élément de (l'ensemble des
symboles de constantes), soit l'application d'un élément à éléments de .

Attention : le fait que soit de la bonne arité est seulement implicite dans cette notation. De
plus, l'écriture ne signifie pas que tous les arguments d'une fonction sont
identiques mais simplement que ces arguments sont des éléments de .

R2. il est souvent commode de voir un terme comme un arbre dont chaque nœud est étiqueté
par un symbole de fonction et chaque feuille par une variable ou une constante.

Dans la suite, nous allons sans cesse définir des notions (ou prouver des résultats) "par
récurrence" sur la structure ou la taille d'un terme.

R3. pour prouver une propriété sur les termes, il suffit de prouver pour les variables et
les constantes et de prouver à partir de . Nous faisons ainsi ici
une preuve "par induction" sur la "hauteur" d'un terme.

R4. Pour définir une fonction sur les termes, il suffit de la définir sur les variables et les

54/2001
Sciences.ch 14/03/2005

constantes et de dire comment nous obtenons à partir de . Nous


faisons ici encore une définition "par induction" sur la hauteur d'un terme. Voici une telle
définition :

La taille (nous disons aussi la "longueur") d'un terme (notée ) est le nombre de
symboles de fonction apparaissant dans . Formellement:

- si est une variable et est une constante

Remarque: la preuve par induction sur la hauteur d'un terme sera souvent insuffisante. Nous
pourrons alors prouver une propriété sur les termes en supposant la propriété vraie pour
tous les termes de taille et en la démontrant ensuite pour les termes de taille . Il
s'agira alors d'une preuve par récurrence sur la taille du terme.

LES FORMULES

Les formules sont construites à partir des formules dites "atomiques" en utilisant des
"connecteurs" et des "quantificateurs". Nous utiliserons les connecteurs et les quantificateurs
suivants (certains nous sont déjà connus) :

- connecteur unaire: qui se lit "non"

- connecteurs binaires: qui se lit "et", qui se lit "ou", qui se lit "implique" ou
"flèche"

- quantificateurs : qui se lit "il existe" et qui se lit "pour tout"

Cette notation des connecteurs est standard (elle devrait du moins). Elle est utilisée pour éviter
les confusions entre les formules et le langage courant (le métalangage).

Définition : soit un langage. Les formules "atomiques" de sont les formules de la forme
où est un symbole de relation -aire de et sont des termes de .
Nous notos "Atom" l'ensemble des formules atomiques. Si nous notons l'ensemble des
symboles de relation, nous pouvons écrire:

L'ensemble des formules de la logique du premier ordre de est défini par la grammaire
(où est une variable):

où il faut lire : l'ensemble des formules est le plus petit ensemble contenant les formules et tel
que si et sont des formules alors , etc. sont des formules.

55/2001
Sciences.ch 14/03/2005

Nous ferons attention à ne pas confondre termes et formules. est un terme, est
une formule. Mais n'est rien : nous ne pouvons ne pouvons, en effet, mettre
un connecteur entre un terme et une formule (aucun sens).

Définitions:

D1. une sous-formule d'une formule est l'un de ses "composants", in extenso une formule à
partir de laquelle est construite. Formellement, nous définissons l'ensemble des
sous formules par:

- Si est atomique,

- Si avec

- Si ou avec

D2. une formule de n'utilise qu'un nombre fini de symboles de . Ce sous-ensemble


est appelé "le langage de la formule" et noté .

D3. la taille (ou la longueur) d'une formule (notée ) est le nombre de connecteurs ou
de quantificateurs apparaissant dans . Formellement:

- si est une formule atomique

- avec

D4. l'opérateur principal (nous disons aussi le "connecteur principal") d'une formule est défini
par :

- Si est atomique, alors elle n'a pas d'opérateur principal

- Si , alors est l'opérateur principal de A

- Si où , alors est l'opérateur principal de

- Si où , alors est l'opérateur principal de

D5. soit une formule. L'ensemble des variables libres de et l'ensemble


muettes (ou liées) de sont définis par récurrence sur .

Voyons d'abord en quoi consiste une variable "libre", "liée", ou encore "muette" avant d'en
définir les propriétés.

D5A. une "variable muette" est par définition la variable que l'on utilise pour prouver la
propriété d'une autre variable.

56/2001
Sciences.ch 14/03/2005

D5B. une "variable liée" est la variable dont on veut prouver les propriétés à partir de l'énoncé
de la variable muette

D5C. une "occurrence" d'une variable dans une formule est une position de cette
variable dans la formule . Ne pas confondre avec l'objet qu'est la variable elle-même. Des
définitions précédentes il vient qu'une occurrence de la variable est liée (ou muette) dans la
formule si dans le domaine de cette variable on trouve . Dans le cas contraire, on dit
que l'occurrence est "libre".

Pour préciser les variables libres possibles d'une formule , nous noterons . Cela
signifie que les variables libres de sont parmi in extenso si est libre dans ,
alors est l'un des mais les n'apparaissent pas nécessairement dans .

Remarques :

R1. si est atomique alors est l'ensemble des variables apparaissant dans
les et nous avons

R2. si où : alors

R3. si alors et

R4. si avec et

D6. nous disons que les formules et sont -équivalentes si elles sont (syntaxiquement)
identiques à un renommage près des occurrences liées des variables.

D7. une formule "close" est une formule sans variables libres.

8. Soit une formule, une variable et un terme. est la formule obtenue en


remplaçant dans toutes les occurrences libres de par , après renommage éventuel des
occurrences liées de qui apparaissent libres dans .

Remarques importantes:

R1. pour définir une fonction sur les formules, il suffit de définir sur les formules
atomiques et de dire comment on obtient (resp. ) à partir de
et (resp. )

R2. pour prouver une propriété sur les formules, il suffit de prouver pour les formules
atomiques et de prouver (resp. ) à partir de et
(resp. ).

R3. pour prouver une propriété sur les formules, il suffit de supposer la propriété vraie
pour toutes les formules de taille et de la démontrer pour les formules de taille .

57/2001
Sciences.ch 14/03/2005

R4. nous noterons qu'une variable peut avoir à la fois des occurrences libres et des
occurrences liées. Nous d'avons donc pas toujours (exemple:
où et )

R4. Nous ne pouvons pas renommer en dans la formule et obtenir la


formule : la variable serait "capturée". Nous ne pouvons donc pas
renommer des variables liées sans précautions : il faut éviter de capturer des occurrences
libres.

R5. La notion de formule définie ici est la notion de formule de logique du premier ordre.
Certaines formules ne sont pas des formules du premier ordre (le nombre de quantificateurs
ne doivent pas êtres dépendant d'une variable !).

DÉMONSTRATIONS

Les démonstrations que l'on trouve dans les ouvrages de mathématiques sont des assemblages
de symboles mathématiques et de phrases contenant des mots clés tels que: "donc", "parce
que", "si", "si et seulement si", "il est nécessaire que", "il suffit de", "prenons un tel que",
"supposons que", "cherchons une contradiction", etc. Ces mots sont supposés être compris par
tous de la même manière, ce qui n'est en fait, pas toujours le cas.

Dans tout ouvrage, le but d'une démonstration est de convaincre le lecteur de la vérité de
l'énoncé. Suivant le niveau du lecteur, cette démonstration sera plus ou moins détaillée :
quelque chose qui pourra être considéré comme évident dans un cours de licence pourrait ne
pas l'être dans un cours de maturité.

Dans un devoir, le correcteur sait que le résultat demandé à l'étudiant est vrai et il en connaît
la démonstration. L'étudiant doit démontrer (correctement) le résultat demandé. Le niveau de
détail qu'il doit donner dépend donc de la confiance qu'aura le correcteur : dans une bonne
copie, une "preuve par une récurrence évidente" passera bien, alors que dans une copie où il y
eu auparavant un "évident", qui était évidemment… faux, ça ne passera pas!

Pour pouvoir gérer convenablement le niveau de détail, il faut savoir ce qu'est une
démonstration complète. Ce travail de formalisation a été fait qu début de XXème siècle!!

Plusieurs choses peuvent paraître surprenantes:

- il n'y a qu'un nombre fini de règles: deux pour chacun des connecteurs (et l'égalité) plus trois
règles générales. Il n'était pas du tout évident à piori qu'un nombre fini de règles soit suffisant
pour démontrer tout ce qui est vrai. Nous montrerons ce résultat (c'est essentiellement, le
théorème de complétude). La preuve n'en est pas du tout triviale.

- ce sont les mêmes règles pour toutes les mathématiques et la physique: algèbre, analyse,
géométrie, etc. Cela veut dire que nous avons réussi à isoler tout ce qui est général dans un
raisonnement. Nous verrons plus loin qu'une démonstration est un assemblage de couples , où
est un ensemble de formules (les hypothèses) et une formule (la conclusion). Quand
nous faisons de l'arithmétique, de la géométrie ou de l'analyse réelle, nous utilisons, en plus
des règles, des hypothèses que l'on appelle des "axiomes". Ceux-ci expriment les propriétés
particulières des objets que nous manipulons (pour plus de détails sur les axiomes voir la page
d'introduction du site).

58/2001
Sciences.ch 14/03/2005

Nous démontrons donc, en général, des formules en utilisant un ensemble d'hypothèses, et cet
ensemble peut varier au cours de la démonstration: quand nous disons "supposons et
montrons ", est alors une nouvelle hypothèse que nous pourrons utiliser pour montrer
. Pour formaliser cela, nous introduisons le concept de "séquent":

Définitions:

D1. un "séquent" est un couple (noté ) où:

- est un ensemble fini de formules. représente les hypothèses que nous pouvons utiliser.
Cet ensemble s'appelle aussi le "contexte du séquent".

- est une formule. C'est la formule que nous voulons montrer. Nous dirons que cette
formule est la "conclusion du séquent".

Remarques:

R1. si nous pourrons noter au lieu de . Le signe se lit


"thèse" ou "démontre".

R2. nous noterons un séquent dont l'ensemble d'hypothèses est vide et un


séquent dont l'ensemble d'hypothèses est .

R3. Nous noterons en que dans le séquent la formule peut-être dans , ce


contexte est .

R4. Nous écrirons pour dire que " est non prouvable"

D2. un séquent est "prouvable" (ou démontrable, dérivable) s'il peut être obtenu par
une application finie de règles. Une formule est prouvable si le séquent est prouvable.

RÈGLES DE DÉMONSTRATION

Les règles de démonstration sont les briques qui permettent de construire les dérivations. Une
dérivation formelle est un assemblage fini (et correct!) de règles. Cet assemblage n'est pas
linéaire (ce n'est pas une suite) mais un "arbre". Nous sommes en effet souvent amenés à faire
des branchements.

Nous allons présenter un choix de règles. Nous aurions pu en présenter d'autres (à la place ou
en plus) qui donneraient la même notion de prouvabilité. Celle que l'on a choisies sont
"naturelles" et correspondent aux raisonnements que l'on fait habituellement en
mathématique. Dans la pratique courante nous utilisons, en plus des règles ci-dessous,
beaucoup d'autres règles mais celles-ci peuvent se déduire des précédentes. Nous les
appellerons "règles dérivées".

Il est de tradition d'écrire la racine de l'arbre (le séquent conclusion) en bas, les feuilles en
haut: la nature est ainsi faite… Pourtant, nous construisons souvent l'arbre en allant de la
racine vers les feuilles. Comme il est également de tradition d'écrire, sur une feuille de papier,
de haut en bas, il ne serait pas déraisonnable d'écrire la racine en haut et les feuilles en bas. Il

59/2001
Sciences.ch 14/03/2005

faut faire un choix !

Une règle se compose:

- d'un ensemble de "prémisses": chacune d'elles est un séquent. Il peut y en avoir zéro, un ou
plusieurs

- du séquent conclusion de la règle

- d'une barre horizontale séparant les prémisses (en haut) de la conclusion (en bas). Sur la
droit de la barre, nous indiquerons le nom de la règle. Exemple:

Cette règle à deux prémisses ( et ) et une conclusion ( ). Le nom


abrégé de cette règle est .

Cette règle peut se lire de deux manières:

- de bas en haut: si nous voulons prouver la conclusion, il suffit par utilisation de la règle de
prouver les prémisses. C'est ce qu'on fait quand nous cherchons une démonstration. Cela
correspond à "l'analyse".

- de haut en bas: si nous avons prouvé les prémisses, alors nous avons aussi prouvé la
conclusion. C'est ce qu'on fait quand nous rédigons une démonstration. Cela correspond à la
"synthèse".

RÈGLES

Pour les démonstrations il existe un nombre fini de règles au nombre 17 que l'on va définir ci-
après:

1. Axiome:

Explication: si la conclusion du séquent est une des hypothèses, alors le séquent est
prouvable.

2. Affaiblissement

Explications:

- de haut en bas: si nous démontrons sous les hypothèses , en ajoutant d'autres

60/2001
Sciences.ch 14/03/2005

hypothèses on peut encore démontrer .

- de bas en haut: il y a des hypothèses qui peuvent ne pas servir

3. Introduction de l'implication

- de bas en haut: pour montre que nous supposons (c'est-à-dire que nous l'ajoutons
aux hypothèses) et nous démontrons .

4. Elimination de l'implication

de bas en haut: pour démonter , son nous connaissons un théorème de la forme ou si


nous pouvons démontrer le lemme , il suffit de démontrer .

5. Introduction à la conjonction

de bas en haut: pour montrer , il suffit de montrer et de montrer .

6. Elimination de la conjonction

et

de haut en bas: de , nous pouvons déduire (élimination gauche) et (élimination


droite)

7. Introduction de la disjonction

ou

de bas en haut: pour démontrer , il suffit de démontrer ou de démontrer

8. Elimination de la disjonction

de bas en haut: si nous voulons montrer et que nous savons que nous avons , il suffit

61/2001
Sciences.ch 14/03/2005

de le montre rd'un part en supposant , d'autre part en supposant . C'est un raisonnement


par cas.

9. Introduction de la négation

de bas en haut: pour montrer , nous supposons et nous démontrons l'absurde ( )

10. Elimination de la négation

de haut en bas: si nous avons montré et , alors nous avons montré l'absurde ( )

11. Absurdité classique

de bas en haut: pour démontrer , il suffit de démontrer l'absurde en supposant .

Les deux règles mettent en valeur le rôle du symbole qui représente, intuitivement,
le faux universel indépendamment du langage utilisé.

Contrairement à beaucoup d'autres, cette règle peut être appliquée à tout moment: nous
pouvons en effet, souvent dire "pour prouver , je suppose et je vais chercher une
contradiction". Cela rend assez souvent la recherche de la preuve un peu plus difficile.

12. Introduction au quantificateur universel

de bas en haut: pour démontrer , il suffit de montrer en ne faisant aucune hypothèse


sur . Lors des démonstrations cette vérification (aucune hypothèse sur ) est souvent source
d'erreur.

13. Elimination du quantificateur universel

de haut en bas: de , nous pouvons déduire pour n'import quel terme . Ce que
nous pouvons dire aussi sous la forme: si nous avons prouvé pour tout , alors nous
pouvons utiliser avec n'importe quel objet (!!).

62/2001
Sciences.ch 14/03/2005

14. Introduction du quantificateur existentiel

de bas en haut: pour démontrer , il suffit de trouver un objet (in extenso un terme ) pour
lequel nous savons montrer .

15. Elimination du quantificateur existentiel

de bas en haut: quand nous avons une hypothèse de la forme , nous pouvons utiliser cette
hypothèse en prenant un qui satisfait . Cette condition est donc la formalisation du fait
que l'objet dont l'hypothèse affirme l'existence n'est pas nécessairement l'un des objets utilisé
pour la démonstration.

16. Introduction de l'égalité

Explication: nous pouvons toujours montrer . Cette règle signifie que l'égalité est
réflexive (voir la chapitre traitant des opérateurs dans la même section du site).

17. Elimination de l'égalité

de haut en bas: si nous avons démontré et , alors nous avons démontré


. Cette règle exprime que les objets égaux ont les mêmes propriétés. Nous noterons
cependant que les formules (ou relations) et ne sont pas, formellement,
identiques. Il nous faudra démontrer que l'égalité est symétrique (nous en profiterons aussi
pour démontrer que l'égalité est transitive).

Cet exemple montre que l'égalité est symétrique :

Le dernier exemple montre que l'égalité est transitive (c'est-à-dire si et alors


):

63/2001
Sciences.ch 14/03/2005

64/2001
Sciences.ch 14/03/2005

NOMBRES

HISTOIRE

La base des mathématiques, mis à part le raisonnement (sous-entendu la logique du premier


ordre et la théorie de la démonstration), est sans nul doute pour le commun des personnes -
mathématiciens mis à part - l'arithmétique. Il est donc obligatoire que nous y fassions étape
pour étudier sa provenance, ses propriétés et conséquences.

L'histoire des nombres (ou également appelés "scalaires") est beaucoup trop longue pour être
relatée ici, mais nous ne pouvons que vous conseiller un des meilleurs ouvrages sur le sujet:
Histoire Universelle des chiffres (~2000 pages), Georges Ifrah, ISBN: 2 221 05779 1

Cependant voici une petite bride de cette dernière qui nous semble fondamentale:

Notre système décimal actuel, de base 10, utilise les chiffres de 0 à 9, dits "arabes", mais au
fait d'origine indienne (hindous). En fait, les chiffres arabes sont différents :

Il faut lire: 0 "zéro", 1 "un", 2 "deux", 3 "trois", 4 "quatre", 5 "cinq", 6 "six", 7 "sept", 8
"huit", 9 "neuf"

Ces chiffres ne furent introduits en Europe que vers l'an 1000. Utilisés en Inde, ils furent
transmis par les Arabes au monde occidental par le pape Gerbert d'Aurillac lors de son séjour
en Andalousie à la fin du IXème siècle.

Le mot français "chiffre" est une déformation du mot arabe "sifr" désignant "zéro". En italien,
"zéro" se dit "zero", et serait une contraction de "zefiro", on voit là encore la racine arabe.
Ainsi nos termes "chiffre" et "zéro" ont la même origine.

Notre système décimal : l'usage précoce d'un symbole numérique désignant "rien", au sens de
"aucune quantité" ou "absence de quantité", c'est à dire notre zéro, provient du fait que les
Indiens utilisèrent un système dit "positionnel".

Dans un tel système, la position d'un chiffre dans l'écriture d'un nombre exprime la puissance
de 10 et le nombre de fois qu'elle intervient.

L'absence d'une puissance est notée par un petit rond... : c'est le zéro. Notre système actuel est
donc "décimal et positionnel".

65/2001
Sciences.ch 14/03/2005

Le nombre 324 s'écrit de gauche à droite comme étant trois centaines : 3 x 100, deux
dizaines : 2 x 10 et quatre unités : 4 x 1.

304 signifie 3 centaines, pas de dizaines (0 (zéro) dizaine), et 4 unités.

Attention!! Nous différencions un chiffre d'un nombre... Le nombre est composé de chiffres et
non inversement.

Nous voyons parfois (et c'est conseillé) un séparateur de milliers représenté par un guillemet '
en Suisse (posé tous les trois chiffres à partir du premier en partant de la droite pour les
nombres entier). Ainsi, nous écrirons 1'034 au lieu de 1034 ou encore 1'344'567'569 au lieu de
1344567569. Les séparateurs de milliers permettent de rapidement quantifier l'ordre de
grandeur des nombres lus. Ainsi:

- si nous voyons uniquement 1 guillement nous saurons que le nombre est de l'ordre du millier
- si nous voyons voit deux guillemets nous saurons que le nombre est de l'ordre du million
- si nous voyons trois guillements nous saurons que le nombre est de l'ordre du milliard
- et ainsi de suite...

Au fait, tout nombre entier, autre que l'unité, peut être pris pour base d'un système de
numérotation. Nous avons ainsi les systèmes de numérotation binaire, ternaire,
quaternaire,...,décimal, duodécimal qui correspondent respectivement aux bases deux, trois
quatre,...,dix, douze.

Une généralisation de ce qui a été vu précédemment, peut s'écrire sous la forme suivante:

Tout nombre entier positif peut être représenté dans une base sous forme de somme, où les
coefficients sont multipliés chacun par leur poids respectif . Tel que :

Plus élégamment écrit :

avec et

BASES NUMÉRIQUES

66/2001
Sciences.ch 14/03/2005

Pour écrire un nombre dans un système de base , nous devons commencer par adopter
caractères destinés à représenter les premiers nombres. Ces caractères sont comme
nous les avons déjà défini, les "chiffres" que nous énoncons comme à l'ordinaire.

Pour la numérotation écrite, nous faisons cette convention, qu'un chiffre, placé à gauche d'un
autre représente des unités de l'ordre immédiatement supérieur, ou fois plus grandes. Pour
tenir la place des unités qui peuvent manquer dans certains ordres, nous nous servons du zéro
(0) et par suite, le nombre de chiffres employés est toujours égal à la base du système.

Définition : pour la numérotation parlée, nous convenons d'appeler "unité simple", "dizaine",
"centaine", "mille", etc., les unités du premier ordre, du second, du troisième, du quatrième,
etc. Ainsi les nombres 10, 11,…,19 se liront de même dans tous les systèmes de numérotation;
les nombres 1a, 1b,a0, b0, … se liront dix-a, dix-bé, a-dix, bé-dix, etc. Ainsi, le nombre
5b6a71c se lira :

cinq millions bé-cent soixant-a mille sept cent dix-cé

Cet exemple est pertinent car il nous montre l'expression générale de la langue parlée que
nous utilisons quotidiennement et intuitivement en base dix (faut à notre éducation).

Remarques :

R1. Les règles des opérations définies pour les nombres écrits dans le système décimal sont
les mêmes pour les nombres écrits dans un système quelconque de numérotation.

R2. Pour opérer rapidement dans un système quelconque de numérotation, il est indispensable
de savoir par cœur toutes les sommes et tous les produits de deux nombres d'un seul chiffre.

Le fait que la base décimale ait été choisie est semblerait t'il due au fait que l'humain a dix
doigts. Comme quoi cela ne tient pas à grand chose…

Voyons comment nous convertissons un système de numérotation dans un ordre:

En base dix nous savons que 142'713 s'écrit:

En base deux (binaires) le nombre 0110 s'écrirait en base 10:

en ainsi de suite.

L'inverse (pour l'exemple de la base deux) est toujours un peu plus délicat. Par exemple la
conversion du nombre décimal 1'492 en base deux donne (le principe est à peu près identique
pour toutes les autres bases):

67/2001
Sciences.ch 14/03/2005

Ainsi, pour convertir le nombre 142'713 (base décimale) en base duodécimale (base
douze) nous avons (notation : est le "quotient", et le "reste") :

Ainsi nous avons les restes 6, 10, 7, 0, 9 ce qui nous amène à écrire :

Nous avons choisi pour ce cas particulier la symbolique que nous avions définie
précédemment (a-dix) pour éviter tout confusion.

TYPES DE NOMBRES

Il existe en mathématiques une très grande variété de nombres (naturels, rationnels,


réels, irrationnels, complexes, p-adiques,...) puisque le mathématicien peut à loisirs en
créer en ayant uniquement à poser les axiomes (règles) de manipulations de ceux-ci.

Cependant, il y en a quelqu'uns que nous retrouvons plus souvent que d'autres et


certains qui servent de base de construction à d'autres et qu'il conviendrait de définir
suffisament rigoureusement (sans aller dans les extrêmes) pour pouvoir savoir de quoi

68/2001
Sciences.ch 14/03/2005

nous parlerons lorsque nous les utiliserons.

NOMBRES ENTIERS

L'idée du "nombre entier" est le concept fondamental de la mathématique et nous vient à la


vue d'un groupement d'objets de même espèce (un mouton, un autre mouton, encore un autre,
etc.). Lorsque la quantité d'objets d'un groupe est différente de celle d'un autre groupe nous
parlons alors de groupe numériquement supérieur ou inférieur quelque soit l'espèce d'objets
contenus dans ces groupes. Lorsque la quantité d'objet d'un ou de plusieurs groupes est
équivalente, nous parle alors "d'égalité". A chaque objet correspond le nombre "un" ou
"unité".

Pour former des groupements d'objets, nous pouvons opérer ainsi: à un objet, ajouter un autre
objet, puis encore un et ainsi de suite; chacun des groupements, au point de vue de sa
collectivité, est caractérisé par un nombre; il résulte de là qu'un nombre peut être considéré
comme représentant un groupement d'unités tel que chacune de ces unités corresponde à un
objet de la collection.

Définition : deux nombres sont dits "égaux" si à chacune des unités de l'un nous pouvons faire
correspondre une unité de l'autre et inversement. Si ceci ne se vérifie par alors nous parlons
"d'inégalité".

Prenons un objet, puis un autre, puis au groupement formé, ajoutons encore un objet et ainsi
de suite. Les groupements ainsi constitués sont caractérisés par des nombres qui, considérés
dans le même ordre que les groupements successivement obtenus, constituent la "suite
naturelle" notée et appelée contenant la suite: 0,1, 2, 3, …, et que nous notons :

La présence du 0 (zéro) dans notre définition de est discutable étant donné qu'il n'est ni
positif ni négatif. C'est la raison pour laquelle dans certains ouvrages vous pourrez trouver
une définition de sans le 0.

Nous pouvons définir cet ensemble de façon plus générale mais non axiomatique (définition
personnelle) : est l'ensemble le plus commun et intuitif d'abstraits quantitatifs arbitraires
qui satisfont à des règles subjectives dépendantes de la complexe logique qui en est à
l'origine.

Et les constituants par (nous devons cette définition au mathématicien Gottlob) les propriétés
(avoir lu au préalable le chapitre de théorie des ensembles est recommandé...) : 0 (lire "zéro")
est le nombre d'éléments (défini comme une relation d'équivalence) de tous les ensembles
équivalents à (en bijection avec) l'ensemble vide. 1 (lire "un") est le nombre d'éléments de
tous les ensembles équivalents à l'ensemble dont le seul élément est 1. 2 (lire "deux") est le
nombre d'éléments de tous les ensembles équivalents à l'ensemble dont tous les éléments sont
0 et 1. En général, un nombre entier est le nombre d'éléments de tous les ensembles
équivalents à l'ensemble des nombres entiers le précédent!

La construction de l'ensemble des entiers naturels s'est faite de la manière la plus naturelle et
cohérente qui soit. Les naturels doivent leur nom à ce qu'ils avaient pour objet, aux prémices
de leur existence, de dénombrer des quantités et des choses de la nature ou qui intervenaient
dans la vie de l'homme. L'originalité de l'ensemble réside dans la manière empirique dont il

69/2001
Sciences.ch 14/03/2005

s'est construit car il ne résulte pas réellement d'une définition mathématique, mais davantage
d'une prise de conscience par l'homme du concept de quantité dénombrable, de nombre et de
lois qui traduisent des relations entre eux.

La question de l'origine de est dès lors la question de l'origine des mathématiques. Et de


tout temps des débats confrontant les pensées des plus grands esprits philosophiques ont tenté
d'élucider ce profond mystère, à savoir si les mathématiques sont une pure création de l'esprit
humain ou si au contraire l'homme n'a fait que redécouvrir une science qui existait déjà dans
la nature (nous en avons déjà parlé lors de l'introduction à la théoire de la démonstration).
Outre les nombreuses questions philosophiques que cet ensemble peut susciter, il n'en est pas
moins intéressant d'un point de vue exclusivement mathématique. Du fait de sa structure, il
présente des propriétés remarquables qui peuvent se révéler d'une grande utilité lorsque l'on
pratique certains raisonnements (dénombrabilité, récurrence, descente infinie, principe de
Dirichlet, ...) ou calculs.

Remarquons immédiatement que la suite naturelle des nombres entiers est illimitée mais
dénombrable (nous le verrons plus bas), car, à un groupement d'objets qui se trouve représenté
par un certain nombre , il suffira d'ajouter un objet pour obtenir un autre groupement qui
sera défini par un nombre entier immédiatement supérieur . Deux nombres entiers qui
différent d'une unité positive sont dits "consécutifs".

AXIOMES DE PEANO

Lors de la crise des fondements des mathématiques, les mathématiciens ont bien évidemment
cherché à axiomatiser l'ensemble et nous devons l'axiomatisation actuelle à Peano et à
Dedekind dont voisci une énumération (nous utiliserons également certains de ces axiomes
pour la démonstration des propriétés des opérations élémentaires des mathématiques) :

A1. Zéro est un nombre.

A2. Si est un nombre alors, le successeur de , noté est un nombre.

A3. Zéro n’est le successeur d’aucun nombre :

A4. Si les successeurs de deux nombres sont égaux alors ces deux nombres sont égaux :

A5. Soit l’ensemble de tous les nombres si un ensemble de nombres est tel que :

1.

2. si et alors .

Remarque : A5 est appelé "axiome d’induction"

Théorème : soit l’ensemble (à ne pas confondre avec le symbole représentant l'élément


successeur)

70/2001
Sciences.ch 14/03/2005

alors .

Démonstration :

1. par définition de

2. Si par définition de ,

Par l’axiome 5 il vient que .

Donc l’ensemble de tous les nombres vérifiant les 5 axiomes sont :

NOMBRES PAIRS, IMPAIRS ET PARFAITS

Les nombres obtenus en comptant par deux à partir de zéro, (soit 0, 2, 4, 6, 8, …) dans cette
suite naturelle sont appelés "nombres pairs".

Les nombres que nous obtenons en comptant par deux à partir de un (soit 1, 3, 5, 7,... ) dans
cette suite naturelle s'appellent "nombres impairs".

La formation des nombres pairs peut être définie ainsi :

D1. le nombre pair est donné par la relation

D2. de même, le nombre impair est donné par .

Remarque : nous appellons "nombres parfaits", les nombres égaux à la somme de leurs
diviseurs entiers (concept que nous verrons en détail plus tard) comme par exemple: 6=1+2+3
et 28=1+2+4+7+14

NOMBRES PREMIERS

Par définition un nombre premier est un entier possédant exactement 2 diviseurs (ces deux
diviseurs sont donc "1" et lui-même).

A noter que la définition de nombre premier exclut le chiffre "1". Admettre "1" comme
nombre premier rendrait faux l'important "théorème fondamental de l'arithmétique" (voir la
théorie des nombres dans le site) qui dit qu'il existe une unique manière d'écrire un nombre
entier supérieur à "1" comme produit de nombres premiers (sans prendre en compte l'ordre
de la multiplication).

Cette définition est très important car elle nous permettra de démontrer que forme un
anneau intégralement clos (voir un peu plus loin lorsque nous définirons le conception de
"nombre algébrique).

71/2001
Sciences.ch 14/03/2005

Nous pouvons nous demander s'il existe une infinité de nombres premiers ? La réponse est
positive et en voici une démonstration (parmi tant d'autres) par l'absurde :

Supposons qu'il en existe qu'un nombre fini de nombres premiers qui seraient (nous utilisons
des nombres abstraits pour représent un nombre premier quelconque):

Nous formons un nouveau nombre. Le produit de tous les nombres premiers auquel nous
ajoutons "1":

Selon notre hypothèse initiale ce nouveau nombre devrait être divisible par l'un des nombres
premiers existants (selon le théorème fondamental de l'arithmétique – voir le chapitre de
théorie des nombres dans le site) selon:

Nous pouvons effectuer la division:

Le premier terme se simplifie, car est dans le produit. On note cet entier:

Or, et sont deux entiers, donc doit être un entier. Mais est par définition
supérieur à 1. Donc n'est pas un entier.

Contradiction : les nombres premiers ne sont pas en nombre fini, mais infini.

Remarque: (le produit des premiers nombres premiers) est appelé


"primorielle ".

Nous renvoyons le lecteur au chapitre de cryptographie de la section d'analyse numérique


pour étudier quelques propriétés remarquables des nombres premiers dont la non moins
fameuse fonction phi d'Euler (ou appelé aussi: fonction indicatrice).

NOMBRES ENTIERS RELATIFS

L'ensemble à quelques défauts que nous n'avons pas énoncés tout à l'heure. Par exemple, la
soustraction de deux nombres dans n'a pas toujours un résultat dans (les nombres négatif
n'y existent pas). Autre défaut, la division de deux nombres dans n'a également pas toujours
un résultant dans (les nombres fractionnaires n'y existent pas).

Ainsi, nous pouvons dans un premier temps résoudre le problème de la soustraction en

72/2001
Sciences.ch 14/03/2005

ajoutant à l'ensemble des entiers naturels, les entiers négatifs (concept révolutionnaire pour
ceux qui en sont à l'origine) nous obtenons "l'ensemble des entiers relatifs" noté :

L'ensemble des entiers naturels est donc inclus dans l'ensemble des entiers relatifs. C'est ce
que nous notons sous la forme :

et nous avons par définition (c'est un notation qu'il faut apprendre) :

Cet ensemble à été crée à l'origine pour faire de l'ensemble des entiers naturels un objet que
nous appellons un "groupe" (voir le chapitre théorie des ensembles dans le site) par rapport à
l'addition et la soustraction.

Remarque: nous disons qu'un ensemble est "dénombrable", s'il est équipotent à . C'est-à-
dire s'il existe une bijection de (voir chapitre théorie des ensembles) sur . Ainsi, grosso
modo, deux ensembles équipotents ont "autant" d'éléments au sens de leurs cardinaux (voir
chapitre théorie des ensembles), ou tout au moins la même infinité.

L'objectif de cette remarque est de faire comprendre que les ensembles sont
dénombrables. Par choix, nous ne souhaitons pas démontrer maintenant que est
dénombrable. Cela sera évident lorsque nous démontrerons que l'ensemble des rationnels
(définition ci-dessous) est dénombrable.

NOMBRES RATIONNELS

L'ensemble à aussi un défaut. Ainsi, la division de deux nombres dans n'a également pas
toujours un résultant dans (les nombres fractionnaires n'y existent pas).

Nous pouvons ainsi définir un nouvel ensemble qui contient tous les nombres qui peuvent
s'écrire sous forme de fraction (rapport d'un dividende et d'un diviseur entiers) ou autrement
dit : les "nombres fractionnaires". Cet ensemble est noté :

Remarque : peut également s'écrire

et nous avons évidemment :

La logique de la création de l'ensemble des nombres rationnels est similaire à celle des entiers
relatifs. Effectivement, les mathématiciens ont souhaité faire de l'ensemble des nombre

73/2001
Sciences.ch 14/03/2005

relatifs un "groupe" par rapport à la loi de multiplication et de division (voir théorie des
ensembles). De plus, contrairement à l'intuition, les nombres rationnels sont en même quantité
que les nombres entiers relatifs et naturels. Nous pouvons nous persuader de cette équipotence
en rangeant comme le fit Cantor, les rationnels dans un premier temps de la façon suivante:

Si nous éliminons de ce tableau les rationnels qui se répétent alors nous pouvons construire
sur celui une même diagonale (d'où le nom de la méthode : "diagonale de Cantor") que celle
présentée ci-dessus et celle-ci montre alors clairement que tout rationnel admet un rang.

Par exemple, 3/2 est classé 8ème et sera unique (puisque nous éliminons 6/4 et les autres
rationnels qui ont la même valeur).

Nous définissons ainsi une application qui est injective (deux rationnels distincts
admettent des rangs distincts) et surjective (à tout place sera inscrit un rationnel: on le cherche
par son dénominateur, puis en colonne pour son numérateur).

L'application est donc bijective: et sont donc bien équipotents.

Outre les circonstances historiques de sa mise en place, ce nouvel ensemble se distingue des
ensembles d'entiers relatifs car il induit la notion originale et paradoxale de quantité partielle.
Cette notion qui a priori n'a pas de sens, trouvera sa place dans l'esprit de l'homme notamment
grâce à la géométrie où l'idée de fraction de longueur, de proportion s'illustre plus
intuitivement.

NOMBRES IRRATIONNELS

L'ensemble des rationnels ne permet pas de résodure un grand nombre de problème


mathématiques, bien qu'il existe des nombres rationnels qui soient extrêmement proches d'une
solution.

Ainsi, tous les nombres qui ne peuvent (négation) s'écrire sous forme de fraction (rapport d'un
dividende et d'un diviseur entiers) sont ce que nous appelons des nombres "irrationnels".

Pour démontrer l'irrationalité d'un nombre, nous utilisons un démonstration par l'absurde

74/2001
Sciences.ch 14/03/2005

utilisant les propriétés des nombres pairs et impairs. Par exemple, pour l'exemple fort connu
de nous procèdons de la façon suivante:

Supposons que soit rationnel. Alors, nous pouvons l'exprimer comme , où et


sont des entiers sans facteur commun (de par la définition des nombres rationnels). Pour
cette raison, et ne peuvent tous les deux être pairs. Il y a deux possibilités:

1. est impair ( est alors pair)

2. est pair ( est alors impair)

En mettant au carré, nous avons :

qui peut s'écrire :

Puisque le carré d'un nombre impair est impair et le carré d'un nombre pair est pair, le cas (1)
est impossible, car serait impair et serait pair.

Le cas (2) est aussi est aussi impossible, car alors nous pourrions écrire , où est un
entier quelconque, et donc si on le porte au carré on a où l'on a un nombre pair des
deux côtés de l'égalité. En remplaçant dans on obtient . serait impair
alors que serait pair. Il n'y a pas de solution; c'est donc que l'hypothèse de départ est
fausse et qu'il n'existe pas deux entiers et tels que .

Nous pouvons appliquer ce genre de raisonnement pour vérifier l'irrationalité de n'importe


quel irrationnel… avec plus ou moins de temps en fonction des cas (essayez avec …).

NOMBRES RÉELS

La réunion des nombres rationnels et irrationnels donne l'ensemble des nombres réels. Donc
nous pouvons écrire que :

Remarque : les mathématicien dans leur rigueur habituelle ont différentes techniques pour
définir les nombres réels. Ils utilisent pour cela des propriétés de la topologie (entre autres) et
en particulier les suites de Cauchy mais c'est une autre histoire qui dépasse le cadre formel du
présent chapitre.

Nous sommes évidemment amenés à nous poser la question si est dénombrable ou non. La
démonstration est assez simple. Par définition, nous savons qu'il doit y avoir une bijection
entre et pour que dire que soit dénombrable.

75/2001
Sciences.ch 14/03/2005

Pour simplifier, nous allons montrer que l'intervalle n'est pas dénombrable; ce qui
implique bien sûr que ne l'est pas.

Supposons cependant le contraire (démonstration par l'absurde): nous pouvons alors énumérer
, c'est-à-dire qu'il existe une suite qui contient tous les réels de .

Ecrivons le développement décimal des premiers termes de en notant le i-ème chiffre


après la virgule de :

Nous formons maintenant le nombre s'écrivant (nous prenons les chiffres de la diagonale
principale ci-dessus):

Nous formons enfin le nombre en remplaçant chaque décimale de par son prédécesseur:

Alors le nombre qui est bien défini, n'est pas dans la liste des valeurs parcourues par . En
effet:

(le premier chiffre décimal de ) est différent de (le premier chiffre décimal de )
donc et puis en procédant toujours avec le même raisonnement donc
etc.

Donc pour tout !! Nous avons donc construit un réel de qui n'est pas dans
tel que nous ayons une contradiction avec l'hypothèse initiale. Une telle suite
parcourant tous les réels de n'existe donc pas, donc est indénombrable.

La technique qui nous a permis d'arriver est connue sous le nom de "procédé diagonal de
Cantor" et l'ensemble des nombres réels est dit avoir "la puissance du continu" de par le fait
qu'il est indénombrable.

NOMBRES TRANSFINIS

Nous nous retrouvons donc avec un "infini" des nombres réels qui est différent de celui des
nombres naturels. Cantor osa alors ce que personne n'avait osé depuis Aristote: la suite des
entiers positifs est infinie, l'ensemble , est donc un ensemble qui a une infinité d'éléments,
alors il affirma que le cardinal (voir la théorie des ensembles de la présent section) de cet

76/2001
Sciences.ch 14/03/2005

ensemble était un nombre qui existait comme tel sans que l'on utilise le symbole fourre tout
, il le nota:

Ce symbole est la première lettre de l'alphabet hébreu, qui se prononce "aleph zéro". Canton
allait appeler ce nombre étrange, un nombre "transfini".

Cantor écrivit: «l'acte décisif fut d'affirmer qu'il y a, après le fini, un transfini, c'est-à-dire une
échelle illimitée de modes déterminés qui par nature sont infinis, et qui cependant peuvent
êtres précisés, tout comme le fini, par des nombres déterminés, bien définis et distinguables
les uns des autres.»

Après ce premier coup d'audace allant à l'encontre de la plupart des idées reçues depuis plus
de deux mille ans, Cantor allait poursuivre sa lancée et établir des règles de calcul,
paradoxales à première vue, sur les nombres transfinis. Ces règles se basaient, comme nous
l'avons défini tout à l'heure, sur le fait que deux ensembles infinis sont équivalent s'il existe
une bijection entre les deux ensembles. Elle permettent donc de distinguer plusieurs sortes
d'infinis.

Ainsi, par la même méthode que celle que nous avons utilisé, nous pouvons montrer que
l'infini des nombres pairs est équivalent à l'infini des nombres entiers. Pour cela, il suffit de
montrer qu'à chaque nombre entier, nous pouvons associer un nombre pair, son double, et
inversement. Ainsi, même si les nombres paires sont inclus dans l'ensemble des nombres
entiers, il y en a une infinité égale, les deux ensembles sont équivalents. En affirmant
qu'un ensemble peut être égale à une de ses parties, Cantor va à l'encontre ce qui semblait être
une évidence pour Aristote et Euclide: l'ensemble de tous les ensembles est infini ! Cela va
ébranler la totalité des mathématiques et va amener à l'axiomatisation de Zermelo-Frankel que
nous verrons en théorie des ensembles.

Démontrer que l'ensemble des réels est non dénombrable revient aussi à démontrer qu'il n'y a
pas plus de points sur la surface d'un carré que sur un de ses côtés (d'ailleurs Cantor écrivit:
«Je le vois mais je ne le crois pas»). En généralisant ce raisonnement, nous arrivons au fait
qu'un espace à dimensions ne contient pas plus de points qu'un espace à une dimension (il
fallut trois années à Cantor pour démontrer rigoureusement ce résultat) !

A partir de ce qui précède, Cantor établit les règles de calculs suivants sur les cardinaux:

Nous pouvons remarquer que ces règles ne sont pas nécessairement intuitives.

L'ensemble transfini des nombres réels amène à un "paradoxe" dit "paradoxe de Russell".

Effectivement, si nous prenons une partie de , celle-ci reste transfinie (à la puissance du


continu), et de même si nous prenons la partie de cette partie. Nous somme donc amenés à
énoncer le paradoxe suivant:

Si nous considérons le cardinal de l'ensemble de tous les cardinaux, il est nécessairement plus
grand que tous les cardinaux, y compris lui-même !

77/2001
Sciences.ch 14/03/2005

Nous reviendrons plus en détail là-dessus lors de notre étude des cardinaux dans la théorie des
ensembles.

NOMBRES COMPLEXES

Inventés au XVIIIème siècle entre autres par Jérôme Cardan et Rafaello Bombelle, ces
nombres permettent de résoudre des problèmes n'ayant pas de solutions dans . L'idée fut
d'introduire un nombre imaginaire tel que:

La forme générale d'un nombre complexe est la suivante:

( et étant des nombres abstraits - voir plus loin la définition d'un nombre abstrait) et nous
notons l'ensemble des nombres complexes et avons donc par extension:

L'ensemble est identifié au plan affine euclidien orienté (voir le chapitre d'analyse
vectorielle dans la section d'algèbre du site) grâce au choix d'une base orthonormée directe
(nous obtenons ainsi le "plan d'Argand-Cauchy" ou "plan de Gauss" que nous verrons un peu
plus loin).

L'ensemble des nombres complexes (qui constitue un corps - voir théorie des ensembles),
donc noté , est défini par:

Pendant près de 150 ans les nombres complexes étaient purement des êtres mathématiques
abstraits n'ayant pas d'équivalents dans la nature. Avec l'avénement de la physique quantique,
il est apparu que les dimensions complexes (nous allons voir un peu plus loin ce qu'est une
dimension complexe) étaient inhérentes aux propriétés de la nature (voir le chapitre de
physique quantique ondulatoire dans la section de physique atomique du site).

L'addition et la multiplication de nombres complexes sont des opérations internes à l'ensemble


des complexes (nous reviendrons beaucoup plus en détail sur certaines propriétés des nombres
complexes dans le chapitre traitant de la théorie des ensembles) et définies par:

La "partie réelle" de est notée:

La "partie imaginaire" de est notée:

78/2001
Sciences.ch 14/03/2005

Le "conjugué" de est défini par:

et est souvent noté (particulièrement en physique quantique !).

A partir d'un complexe et de son conjugué, il est possible de trouver ses parties réelles et
imaginaires. Ce sont les relations évidentes suivantes:

et

Le "module" de représente la longueur par rapport au centre du plan de Gauss (voir un peu
plus bas ce qu'est le plan de Gauss) et est simplement calculé avec l'aide du théorème de
Pythagore:

La notation pour le module n'est pas innocente puisque coïncide avec la valeur absolue
de lorsque est réel.

La division entres deux complexes se calcule comme:

L'inverse d'un complexe se calculant de façon similaire :

Nous pouvons aussi énumérer 8 importantes propriétés (ou théorèmes) du module et du


conjugué complexe:

T1.

Démonstration:

Par définition pour que la somme soit positive la condition nécessaire


est que

T2.

Démonstration:

79/2001
Sciences.ch 14/03/2005

T3.

Démonstration:

Les deux inégalités peuvent s'écrire:

donc équivalent respectivement à:

qui sont triviales. Bien entendu si et seulement si avec le


même type de raisonnement pour la partie imaginaire.

T4. et si

Démonstrations:

et:

T5.

Démonstration:

T6.

Démonstrations:

80/2001
Sciences.ch 14/03/2005

T7.

Nous nous restreindrons à la démonstration de la seconde relation qui est un cas général de la
première (où ):

T8. Nous avons a pour tous complexes . De plus l'égalité a lieu si et


seulement si et sont colinéaires (les vecteurs sont "sur la même droite") et de même
sens, autrement dit s'il existe tel que ou .

Démonstration:

A priori cette inégalité peut ne pas paraître évident à tout le monde alors développons un peu
et supposons-la vraie:

Après simplification:

81/2001
Sciences.ch 14/03/2005

Après simplification:

Cette dernière relation démontre donc que l'inégalité est vraie.

L'égalité à lieu si et seulement si ce qui équivaut successivement à:

La version complète de cette inégalité (inégalité de Minkowski) est au fait:

Démonstration:

Nous appliquons deux fois la première version de l'inégalité pour obtenir:

Nous pouvons aussi représenter un nombre complexe ou dans un plan délimité


par deux axes (deux dimension) de longueur infinie et orthogonaux entres eux. L'axe vertical
représentant la partie imaginaire d'un nombre complexe et l'axe horizontal la partie réelle
(voir figure ci-après).

On nomme parfois ce type de représentation "plan de Gauss".

82/2001
Sciences.ch 14/03/2005

Nous calculons sans trop de difficultés avec les bases de trigonométrie (voir le chapitre de
trigonométrie dans la section de géométrie du site) que:

où est appelé "l'argument de " et est noté:

Pour passer de la forme algébrique d'un nombre complexe à sa forme trigonométrique et


inversement nous démontrons de façon élémentaire que pour obtenir la forme trigonométrique
nous avons les relations:

, ,

et inversement:

Les égalités suivantes sont vraies modulo pour tous nombres complexes non nuls
et tout entier naturel :

1. et

2.

3.

4.

5.

83/2001
Sciences.ch 14/03/2005

Démonstration: (1) et (2) proviennent des formules classique de trigonométrie. (2) entraîne (3)
par récurrence sur . (2) entraîne aussi:

d'où (4). Enfin, (5) provient de (2) et (4).

Nous démontronse entre autres avec les séries de Taylor (voir le chapitre des suites et séries
dans la section d'algèbre) que:

et:

dont la somme est semblable à:

mais par contre parfaitement identique au développement de Taylor de

donc nous avons:

relation nommée "formule d'Euler".

Grâce à la forme exponentielle d'un nombre complexe (très fréquemment utilisée en


physique) nous pouvons très facilement tirer des relations telles que soit:

et en supposant connues les relations trigonométriques de bases (sinon voir la section


"géométrie") nous avons les relations suivantes pour la multiplication:

84/2001
Sciences.ch 14/03/2005

étant le module de nous avons trivialement:

et concernant l'argument du produit:

pour la division:

Nous avons donc :

et

pour la mise en puissance (ou la racine):

nous avons donc :

et

Dans le cas où nous avons un module unité tel que nous avons
évidemment:

Nous appelle cette relation "formule de Moivre".

Pour le logarithme népérien:

Evidemment tous les résultats vus jusqu'ici sont périodiques de période avec
.

Ceci étant dit, une variation sinusoïdale peut être représentée comme la
projection (voir le chapitre de trigonométrie) sur l'axe vertical (axe des imaginaires de
l'ensemble ) d'un vecteur tournant à vitesse angulaire autour de l'origine dans le plan

85/2001
Sciences.ch 14/03/2005

Un tel "vecteur tournant" s'appelle "vecteur de Fresnel" et peut très bien être interprété comme
la partie imaginaire d'un nombre complexe donné par :

Nous retrouverons les vecteurs tournants de façon explicite lors de notre étude de la
mécanique ondulatoire et optique géométrique (dans le cadre de la diffraction).

Il est habituel de représenter les nombres réels comme points d'une droite graduée. Les
opérations algébriques y ont leur interprétation géométrique: l'addition est une translation, la
multiplication une homothétie centrée à l'origine.

En particulier nous pouvons parler de la "racine carrée d'une transformation". Une translation
d'amplitude peut être obtenue comme l'itération d'une translation d'amplitude . De
même une homothétie de rapport a peut être obtenue comme l'itérée d'une homothétie de
rapport . En particulier une homothétie de rapport 9 est la composée de deux homothéties
de rapport 3 ( ou -3).

La racine carrée prend alors un sens géométrique. Mais qu'en est-il de la racine carrée de
nombres négatifs? En particulier la racine carrée de -1?

Une homothétie de rapport -1 peut être vue comme une symétrie par rapport à l'origine;
toutefois si nous voulons voir cette transformation d'une manière continue, force nous est de
placer la droite dans un plan. Dès lors une homothétie de rapport -1 peut être vue comme une
rotation de radians autour de l'origine.

Du coup, le problème de la racine carrée se simplifie. En effet il n'est guère difficile de


décomposer une rotation de radians en deux transformations: nous pouvons répéter soit une
rotation de soit une rotation de . L'image de 1 sera la racine carrée de -1 et est
située sur une perpendiculaire à l'origine à une distance 1 soit vers le haut soit vers le bas.

Ayant réussi à positionner le nombre il n'est plus guère difficile de disposer les autres
nombres complexes dans un plan (le plan de Gauss, d'Argand ou de Wessel). Nous pouvons
ainsi associer à le produit de l'homothétie de rapport 2 par la rotation de centre O et d'angle
, soit une similitude centrée à l'origine.

86/2001
Sciences.ch 14/03/2005

Dans ce plan réel toute opération sur les complexes prend un sens géométrique. L'addition
correspond à une translation. Quant à la multiplication par un nombre ,
elle est représentée par une similitude: 0 reste évidemment fixe et 1 est appliqué sur . Tout
nombre complexe est ainsi associé, par le biais de la multiplication, à une similitude:
l'amplitude de la similitude est son argument, le rapport de la similitude est son module.

D'une manière algébrique le nombre complexe multiplié par


est associée la similitude de rapport et d'angle :

Si nous désignons par et les axes de coordonnées du plan complexe (ou plan de Gauss)
nous avons (en laissant le soin au lecteur de faire les petits dessins s'il n'arrive pas à en
percevoir l'évidence mentalement):

Similitudes directes (les plus usitées):

- Translation d'amplitude :

- Rotation de centre O, d'angle :

- Homothétie (agrandissement) de centre O, de rapport ( ):

- Similitude linéaire directe (combinaison des trois précédents):

- Rotation de centre c, d'angle :

- Homothétie de centre c, de rapport ( ):

- Similitude directe (cas général de tous les précédents):

Similitudes rétrogrades (les plus usitées):

- Symétrie d'axe :

- Symétrie d'axe :

- Symétrie d'axe passant par O et :

- Similitude linéaire rétrograde (combinaison des trois précédents):

Inversion:

- Inversion de pôle O et de puissance 1:

87/2001
Sciences.ch 14/03/2005

NOMBRES QUATERNIONS

Appelés aussi "hypercomplexes", ces nombres ont été inventés en 1843 par William Rowan
Hamilton pour généraliser les nombres complexes. Ils s'écrivent sous la forme
où sont réels et où vérifient certaines propriétés.

NOMBRES ALGÉBRIQUES

Nous définissons tout nombre algébrique par un nombre qui est solution d'une équation
algébrique, à savoir un polynôme (concept que nous aborderons dans la seciont d'algèbre)
dont les coefficients sont des entiers relatifs et non nuls.

Un résultat intéressant (curiosité de mathématique) est qu'un nombre rationnel est un nombre
algébrique si et seulement si c'est un entier relatif (lisez plusieurs fois au besoin…). De par
cette propriété que nous allons de suite démontrer, nous disons que l'anneau est
"intégralement clos".

Démonstrations: nous supposons que le nombre , où et sont deux entiers premiers


entre eux, est une racine du polynôme (voir le sous-chapitre traitant des polynômes dans le
chapitre de calcul algébrique se trouvant dans la section d'algèbre):

Dans ce cas:

Ainsi, divise une puissance de , ce qui n'est possible dans l'ensemble que si vaut
(puisqu'ils étaient premiers entre eux).

Réciproquement, tout entier relatif est évidemment un entier algébrique.

NOMBRES TRANSCENDANTS

Les nombres qui ne sont pas algébriques sont transcendants. Les transcendants sont donc
beaucoup plus nombreux que les algébriques.

Remarque: les transcendants les plus connus sont et . Les démonstrations de leur
transcendance est en cours de rédaction. Nous devrions pouvoir vous les fournir fin 2004.

NOMBRES ABSTRAITS

Le nombre peut être envisagé en faisant abstraction de la nature des objets qui constituent le
groupement qu'il caractérise; et ainsi qu'à la façon de codifier (chiffre arabe, romain, ou autre
système universel) on dit alors que le nombre est "abstrait". Arbitrairement, l'être humain a
adopté un système numérique majoritairement utilisé de par le monde et représenté par les
symboles 1, 2, 3, 4, 5... qui seront connus aussi bien en écriture qu'oralement par le lecteur
(apprentissage du langage).

Pour les mathématiciens il n'est pas avantageux de travailler avec ces symboles car ils

88/2001
Sciences.ch 14/03/2005

représentent uniquement des cas particuliers. Ce que cherchent les physiciens théoriciens ainsi
que les mathématiciens, se sont des relations applicables universellement dans un cas général
et que les ingénieurs puissent en fonction de leurs besoins changer ces nombres abstraits par
les valeurs numériques qui correspondent au problème qu'ils ont besoin de résoudre.

Ces nombres abstraits appelés aujourd'hui communément "variables" sont très souvent
représentés par:

1. L'alphabet latin (a, b, c, d, e... ; A, B, C, D, E...)

2. Par l'alphabet grec qui est lui particulièrement utilisé pour représenter soit des opérateurs
mathématiques plus ou moins complexes (comme le sont le + pour l'addition, le - pour
l'addition par exemple), soit des variables physiques.

3. Par l'alphabet hébraïque (à moindre mesure)

Bien que ces symboles puissent représenter n'importe quel nombre il en existe quelques uns
qui peuvent représenter des constantes dites Universelles (vitesse da la lumière, la constante
gravitationnelle, constante de Planck et bien d'autres).

Nous utilisons très souvent encore d'autres symboles que nous introduirons et définirons au
fur et à mesure.

Remarques :

R1. les lettres pour représenter les nombres ont été employées pour la première fois par Viète.

R2. habituellement, les premières lettres de l'alphabet latin désignent les nombres
connus, et les dernières les nombres inconnus.

DOMAINE DE DÉFINITION

Une variable est un nombre abstrait susceptible de prendre des valeurs numériques
différentes. L'ensemble de ces valeurs peut varier suivant le caractère du problème considéré.

Nous appellons "domaine de définition" d'une variable, l'ensemble des valeurs numériques
qu'elle est susceptible de prendre.

89/2001
Sciences.ch 14/03/2005

Définitions y relatives :

D1. nous appelons "domaine de définition" d'une variable, l'ensemble des valeurs numériques
qu'elle est susceptible de prendre.

Soit deux et deux nombres tel que . Alors :

D2. nous appelons "intervalle fermé d'extrémité et ", l'ensemble de tous les nombres
compris entre ces deux valeurs comprises et nous le désignons de la façon suivante :

D3. nous appelons "intervalle ouvert d'extrémité et ", l'ensemble de tous les nombres
compris entre ces deux valeurs non comprises et nous le désignons de la façon suivante:

D4. nous appelons "intervalle fermé à gauche, ouvert à droite" la relation suivante :

D5. nous appelons "intervalle ouvert à gauche, fermer à droite" la relation suivante :

Remarque : si la variable peut prendre toutes les valeurs négatives et positives possibles nous
écrivons dès lors: où le symbole " " signifie une infinité. Evidemment il peut y
avoir des combinaisons d'intervalles ouverts et infinis à droite, fermé et limité gauche et
réciproquement.

Remarque : nous rappelerons ces concepts lorsque nous étudierons l'algèbre (calcul littéral).

Nous disons que la variable est "ordonnée" si en représentant son domaine de définition par
un axe horizontal où chaque point de l'axe représente une valeur de , alors que pour chaque
couple de de valeurs, nous pouvons indiquer celle qui est "antécédente" (qui précède) et celle
qui est "conséquente" (qui suit). Ici la notion d'antécédente ou de conséquente n'est pas liée au
temps, elle exprime juste la façon d'ordonner les valeurs de la variable.

Définitions y relatives :

D1. une variable est dite "croissante" si chaque valeur conséquente est plus grande que chaque
valeur antécédente.

D2. une variable est dite "décroissante" si chaque valeur conséquente est plus petite que
chaque valeur antécédente.

D3. les variables croissantes et les variables décroissantes sont appelées "variables à
variations monotones" ou simplement "variables monotones".

90/2001
Sciences.ch 14/03/2005

OPÉRATEURS

Il existe en mathématiques, deux types d'outils fondamentaux pour le commun des individus
(nous verrons dans des cadres un peu poussés qu'il y en a beaucoup plus que deux au fait...) :

1. Les opérateurs

Il existe deux opérateurs de base (addition et soustraction) à partir desquels nous


pouvons construire l'arithmétique : la "multiplication" et la "division". Nous
verrons ces derniers plus en détails après avoir défini les relations binaires.

2. Les relations binaires

Il existe 6 relations binaires fondamentales (égal, différent de, plus grand que,
plus petit que, plus grand ou égal, plus petit ou égal) qui permettent de comparer
des grandeurs d'éléments se trouvant à gauche et à droite (donc au nombre de
deux, d'où leur nom) afin d'en tirer certaines conclusions.

Il est essentiel de parfaitement connaître ses deux outils et leurs propriétés avant de se lancer
dans des calculs plus ardus.

RELATIONS BINAIRES

Le concept de "relation" est la base de toute la mathématique dont le but est d'étudier - par
observation et déduction (raisonnement), calcul et comparaison - des configurations abstraites
ou concrètes de ses objets (nombres, formes, structures) en cherchant à établir les liens
logiques, numériques ou conceptuels entre ces objets.

Considérons deux ensembles non vides et (voir théorie des ensembles). Si à certains
éléments de nous pouvons associer par une règle mathématique précise (non
ambiguë) un élément de , nous définissons ainsi une relation de vers dite "binaire"
car faisant intervenir deux éléments. Nous écrivons :

et

Comme nous l'avons déjà dit, il existe 6 relations binaires fondamentales (égal, différent de,
plus grand que, plus petit que, plus grand ou égal, plus petit ou égal). Mais nous allons voir
qu'à partir de ces 6 relations fondamentales, nous pouvons en construire un plus grand
nombre.

Ainsi, de façon plus générale, une peut être définie comme un règle mathématique qui
associe à certains éléments de , certains éléments de .

Alors, dans ce contexte plus général, si , nous disons que est une "image" de par
et que est un antécédent de .

L'ensemble des couples ( , ) tel que soit une assertion vraie forme un "graphe" de la
relation . Nous pouvons représenter ces couples dans un repère adéquatemment choisi pour
en faire une représentation graphique de la relation .

91/2001
Sciences.ch 14/03/2005

ÉGALITES

Il est fort difficile de définir la notion "d'égalité" dans un cas général applicable à toute
situation. Pour notre part, nous nous permettrons pour cette définition de nous inspirer du
théorème d'extensionnalité de la théorie des ensembles (que nous verrons plus tard):

Définition: deux éléments sont égaux si, et seulement si, ils ont les mêmes éléments.

L'égalité est décrite par le symbole:

Le signe "=" signifie "égal à" ou "égalité de". Ce symbole a été introduit pour la première fois
par Le Recorde (1557).

Propriété (triviale) : si
nous avons et un nombre et une opération quelconque (tel que
l'addition, la soustraction, la multiplication ou la division) quelconque alors :

Cette propriété est très utilisée pour résoudre ou simplifier des équations de type quelconques.

Si deux éléments ne sont pas égaux (inégaux), nous les relions par le symbole :

et nous disons qu'il sont "non égaux"

Il existe encore d'autres symboles d'égalités, qui sont une extension des deux que nous avons
éfini précédemment. Malheureusement, ils sont mal utilisés (disons plutôt qu'ils sont utilisés
au mauvais endroits) dans la plupart des ouvrages disponibles sur le marché :

Dans l'ordre (de gauche à droite) nous avons:

- presque égal (plutôt utilisé en ingénierie)

- asymptotiquement égal à (utilisé en analyse fonctionnelle)

- approximativement égal (utilisé en physique lors d'approximation de séries)

- identique à (utilisé aussi bien en analyse fonctionnelle qu'en physique)

- tend vers la limite (idem)

- proportionnel à (utilisé en physique ou en mathématiques financières)

COMPARATEURS

Les comparateurs sont des outils qui nous permettent de comparer et d'ordonner tout couple

92/2001
Sciences.ch 14/03/2005

de nombres (et in extenso aussi des ensembles!) . La possibilité d'ordonner des nombres est
presque fondamentale en mathématiques dans le cas contraire (s'il n'était pas possible ou non
imposé d'ordonner), il y aurait des tas de choses qui choqueraient nos habitudes, par exemple
(certains des concepts présentés dans la phrase qui suit n'ont pas encore été vus mais nous
souhaitons quand même y faire référence) : plus de fonctions monotones (en particulier de
suites) et lié à cela la dérivation n'indiquerait donc rien sur un "sens de variation", plus
d'approche de zéros d'un polynôme par dichotomie (algorithme classique de recherche dans
un ensemble ordonné partagé en deux à chaque itération), en géométrie, plus de segments ni
de demi-droites, plus de demi-espace, plus de convexité, nous ne pouvons plus orienter
l'espace, etc. C'est donc important de pouvoir ordonner les choses comme vous l'aurez
compris.

Ainsi, pour tout nous écrivons :

(terminologie : est plus grand que )

(terminololgie : est plus petit que )

Remarque : il est utile de rappeler que l'ensemble des réels est un groupe totalement
ordonné (voir théorie des ensembles), sans quoi nous ne pourrions pas définir des relations
d'ordre entre ces éléments.

Le symbole "<" est une "relation d'ordre" qui signifie "plus petit que" ainsi que ">" signifie
plus "grand que"..

Nous avons également les corollaires:

et

implique (rappel : noté " ") que :

Si :

et

Remarque: nous notons est équivalent (toujours noté avec le symbole " ") à

Soit deux , deux nombres réels quelconques, alors si :

et

inversement :

et

Si :

93/2001
Sciences.ch 14/03/2005

nous avons inversement :

Nous pouvons bien évidemment multiplier, diviser, addition ou soustraire un terme de chaque
côté de la relation telle que celle-ci soit toujours vraie. Petite remarque cependant, si vous
multipliez les deux membres par un nombre négatif il faudra bien évidemment changer le
comparateur tel que si :

et inversement :

Si :

Soit :

si est pair alors et si est impair (ce n'est évidemment qu'une question de
signe).

Finalement :

Les relations d'ordre (plus grand que, plus petit que, plus petit ou égal, plus
grand ou égal, beaucoup plus grand, beaucoup plus petit) ont été imaginés par Harriot en
1631.

Comme nous le verrons en théorie des ensembles, les relations de comparaisons sont définies
de façon un peu plus subtile et rigoureuse. Voyons cela de suite (le vocabulaire qui va suivre
est explicité dans le chapitre de théorie des ensembles du site):

Ainsi, soit une relation binaire d'un ensemble vers lui-même, une relation dans est
un sous-ensemble du produit cartésien (c'est-à-dire que la relation binaire
engendre un sous-ensemble de par les contraintes qu'elle impose aux éléments de qui
satisfont la relation) avec la propriété d'être :

D1. "réflexive" si :

94/2001
Sciences.ch 14/03/2005

D2. "symétrique" si :

D3. "antisymétrique" si :

D4. "transitive" si :

D5. "connexe" si :

Nous avons également par définition qu'une relation est :

D6. Une "préordre" si et seulement si elles est réflexive et transitive

D7. Une "relation d'ordre partiel" si et seulement si elle est réflexive, antisymétrique et
transtive

D8. Une "relation d'équivalence" si et seulement si elle est réflexive, symétrique, transitive

D9. Une "relation d'ordre total" si et seulement si elle est réflexive, antisymétrique, transitive
et connexe

Remarque : les relations d'ordre binaire ont toutes des propriétés similaires dans les ensembles
(en prenant le module pour l'ensemble des nombres complexes).

Si nous résumons :

Relation
d'ordre
réflexive oui oui oui
symétrique oui oui oui oui
transitive oui oui oui oui oui
connexe oui oui oui oui oui
anti-symétrique oui oui
transitive oui oui

Ainsi, nous voyons que les relations binaires forment avec les ensembles précités, des
relations d'ordre total.

95/2001
Sciences.ch 14/03/2005

Ainsi il est très facile de voir quelles relations binaires sont des relations d'ordre partiel, total
ou d'équivalence.

Remarque : si est une relation d'équivalence sur . Pour , la "classe


d'équivalence" de est par définition l'ensemble:

Nous pouvons nous intéresser à un cas très intéressant en topologie de l'application de


relations d'équivalences appliqué au cas le plus simple (pour la compréhension) aux anneaux
(voir chapitre de théorie des ensembles) et en particulier à l'anneau :

est donc un sous-ensemble de ( ) que nous noterons (aussi…). Nous


disposons ainsi d'un nouvel ensemble qui est "l'ensemble des classes d'équivalences" ou
"ensemble quotient" noté . Nous avons . Remarquons que dans
nous ne regardons plus comme un sous-ensemble de mais comme un élément.
L'application définie par est appelée "projection canonique". Tout
élément est alors appelé "représentant de la classe ".

Considérons maintenant un ensemble. Alors nous proposons de démontrer qu'il y a


bijection entre l'ensembles des relations d'équivalences sur et l'ensemble des partitions de
. En d'autre termes cette proposition dit qu'une relation d'équivalence sur "n'est" rien
d'autre qu'une partition de .

Démonstration : soit une relation d'équivalence sur . Nous choisissons comme


ensemble d'indexation des partitions (voir chapitre de théorie des ensembles) et nous posons
pour tout , . Il suffit de vérifier les deux propriétés de la définition des
partitions pour montrer que la famille est une partition de .

1. Soit tels que alors (trivial) .

2. est évident car si alors .

Nous avons donc associé à la relation une partition de . Réciproquement si est une
partition de alors nous vérifions facilement que la relation définie par: si et
seulement si il existe tel que , est une relation d'équivalence. Les deux
applications ainsi définies sont bijectives et réciproques l'une de l'autre.

Nous allons à présent appliquer ce que nous venons de voir à la construction des anneaux
.

Rappel : Soit deux nombres . Nous disons que " divise " et nous écrivons si
et seulement si il existe un entier tel que .

Nous allons maintenant introduire une relation d'équivalence sur .

96/2001
Sciences.ch 14/03/2005

Rappel (voir chapitre de cryptographie aussi… si…si) : soit un entier. Nous définissons
la relation par si et seulement si ou dit autrement si et seulement si
il existe tel que . Généralement nous écrivons ceci aussi (modulo
) au lieu de et nous disons que " est congru à modulo ". Rappelons aussi que
(mod. ) si et seulement si divise .

Maintenant, démontrons que pour tout entier , la congruence modulo est une relation
d'équivalence sur .

Démonstration (contrôle des trois propriétés de l'équivalence) :

1. Réflexivité : car .

2. Symétrie : Si alors et donc c'est-à-dire .

3. Transitivité : Si et alors et donc


c'est-à-dire .

Définition : dans la situation ci-dessus, nous notons l'ensemble des classes


d'équivalences

et noterons la classe d'équivalence de la congruence d'un entier donnée par :

(chaque valeur entre accolades est divisible par puisque et c'est


ainsi bien un classe d'équivalence) et ainsi :

En particulier (trivial car nous obtenons ainsi tout ): .

Remarque : souvent pendant les études (cours) de mathématiques nous cherchons par
exemple, les valeurs pour lesquelles l'anneau devient un corps et nous remarquons
alors que ce sont les valeurs premières de .

LOIS FONDAMENTALES DE L'ARITHMÉTIQUE

Comme nous l'avons déjà dit précédemment, il existe deux opérateurs de base (addition et
soustraction) à partir desquels il possible de définir la multiplication et la division et autours
desquels nous pouvons construire toute la mathématique analytique.

Remarque : nous verrons en théorie des ensembles un chapitre nommé "structures


algébriques", dans lequel nous définirons plus en détail (à l'aide de l'axiomatique de Peano) et
de façon plus générale (ce qui plaira au mathématicien), certaines propriétés fondamentales de
ces opérateurs.

ADDITION

97/2001
Sciences.ch 14/03/2005

Définition : L'addition des nombres entiers est une opération notée "+" qui a pour seul but de
réunir en un seul nombre toutes les unités contenues dans plusieurs autres. Le résultat de
l'opération se nomme "somme" ou "total". Les nombres à additionner sont appelés "termes de
l'addition". Les signes d'addition "+" et de soustraction "-" sont dus à Widmann (1489).

Ainsi, ... sont les termes de l'addition et le résultat est la somme des termes de
l'additon.

Axiomes :

A1. La somme de plusieurs nombres ne dépend pas de l'ordre des termes. Nous disons alors
que l'addition est une "opération commutative".

A2. La somme de plusieurs nombres ne change pas si nous remplacons deux ou plusieurs
d'entre eux par leur résultat intermédiaire. Nous disons alors que l'addition est "associative".

A3. Le zéro est l'élément neutre de l'addition car tout nombre additioné à zéro donne ce
même nombre.

A4. L'addition peut comporter un terme de telle façon à ce que le total soit nul. Nous disons
alors qu'il existe un "inverse" pour l'addition.

Soit des nombres quelconques alors nous pouvons noter également la somme
ainsi:

en définissant des bornes supérieurs et inférieures à la somme (au-dessus et en-dessous de la


lettre grecque majuscule "sigma").

Rappel des propriétés relatives à cette notation :

où est une constante

Exemples:

L'addition de deux nombres relativement petits est assez facile dès que nous avons appris par
cœur à compter jusqu'au nombre résultant de cette opération. Ainsi (nous basons nos

98/2001
Sciences.ch 14/03/2005

exemples sur la base décimale) :

, ,

Pour les beaucoup plus grands nombres il faut adopter un autre méthode qu'il s'agit
d'apprendre par cœur. Ainsi par exemple:

Démarche : nous additionnons les colonnes (4 colonnes dans cet exemple) de droite à gauche.
Pour la première colonne nous avons donc 4+5=9 ce qui nous donne :

et nous continuons ainsi pour la deuxième 4+7=11 mais à la différence que comme nous
avons un nombre supérieur à la dizaine, nous reportons le premier chiffre (de gauche) sur la
colonne suivante de l'addition. Ainsi:

La troisième colonne se calcule dès lors comme 4+2+1=7 ce qui nous donne:

Pour la dernière colonne nous avons 9+5=14 et à nouveau nous reportons le premier chiffre
(de gauche) sur la colonne suivante de l'addition. Ainsi:

et la dernière colonne donne

Voilà comment nous procèdons donc pour l'addition de nombres quelconques : nous faisons
une addition par colonne de droite à gauche et si le résultat d'une addition est supérieure à la
dizaine, nous reportons une unité sur la colonne suivante.

99/2001
Sciences.ch 14/03/2005

Cette méthodologie d'addition est simple à comprendre et à effectuer. Nous ne l'expliciterons


pas plus.

SOUSTRACTION

Définition : La soustraction du nombre entier par le nombre entier noté par le symbole "-
", c'est trouver le nombre qui, ajouté à , redonne .

Remarque : l'opération n'est possible dans les entiers naturels que si .

Nous écrivons la soustraction sous la forme : qui doit évidemment vérifier que

Axiomes :

A1. La soustraction de plusieurs nombres ne dépend pas de l'ordre des termes. Nious disons
alors que la soustraction est une "opération commutative".

A2. La soustraction de plusieurs nombres ne change pas si l'on remplace deux ou plusieurs
d'entre eux par leur résultat intermédiaire. Nous disons alors que l'addition est "associative".

A3. Le zéro est l'élément neutre de la soustraction car tout nombre à qui on soustrait zéro
donne ce même nombre.

A4. La soustraction peut comporter un terme de telle façon à ce que le total soit nul. Nous
disons alors alors qu'il existe un "inverse pour la soustraction".

Exemples:

La soustraction de deux nombres relativement petits est assez facile dès que nous avons appris
par cœur à compter jusqu'à au moins le nombre résultant de cette opération. Ainsi:

, ,

Pour les beaucoup plus grands nombres il faut adopter un autre méthode qu'il s'agit
d'apprendre par cœur (au même titre que l'addition). Ainsi par exemple:

nous soustraions les colonnes (4 colonnes dans cet exemple) de droite à gauche. Pour la
première colonne nous avons a ce qui fait que nous reportons –1 sur la colonne
suivante et écrivons en bas de la barre d'égalité :

100/2001
Sciences.ch 14/03/2005

et nous continuons ainsi pour la deuxième ce qui fait que nous reportons –1 sur
la colonne suivante et comme nous reportons en bas de la barre
d'égalité:

La troisième colonne se calcule dès lors comme et nous reportons –1 sur la


colonne suivante et comme nous reportons en bas de la barre
d'égalité :

Pour la dernière colonne nous avons nous reportons donc rien sur la colonne
suivante et comme nous reportons 0 en bas de la barre d'égalité:

Voilà comment nous procèdons donc pour la soustraction de nombres quelconques. Nous
faisons une soustraction par colonne de droite à gauche et si le résultat d'une soustraction est
inférieure à zéro nous faisonst reporter –1 sur la colonne suivante et l'addition du dernier
report sur la soustraction obtenue en bas de la barre d'égalité.

La méthodologie utilisée pour la soustraction se basant sur exactement le même principe que
l'addition nous ne l'expliciterons pas plus. Cette méthode est très simple et nécessite bien sûr
une certaine habitude de travailler avec les chiffres pour être totalement appréhendée.

MULTIPLICATION

Définition: La multiplication des nombres est une opération qui a pour but, étant donné deux
nombres, l'un appelé "multiplicateur", et l'autre "multiplicande", d'en trouver un troisième
appelé "produit" qui soit la somme (donc la multiplication d'écoule de la somme !) d'autant de
nombres égaux au multiplicande qu'il y a d'unités au multiplicateur. Le multiplicande et le
multiplicateur sont appelés les "facteurs du produit".

La multiplication s'indique à l'aide du signe "x" (anciennement) ou du point de ponctuation

101/2001
Sciences.ch 14/03/2005

surélevé (notation moderne) ou sans aucun symbole tel que :

Le signe de croix "x" pour la multiplication se trouve pour la première fois dans l'ouvrage d'Ougtred (1631)
quant au point à mi-hauteur (notation moderne pour la multiplication), nous le devons à Leibniz. Dès 1544,
Stiefel, dans un de ses ouvrages n'employait aucun signe et désignait le produit de deux nombres en les placant
l'un après l'autre.

Remarque: le nombre de chiffres d'un produit de deux facteurs est au plus égal à la somme
des nombres des chiffres de ces deux facteurs et au moins égal à cette somme diminuée d'une
unité.

La puissance est une notation particulière d'un cas précis de multiplications. Lorsque le(s)
multiplicateur(s) et multiplicande(s) sont identique(s) en valeur numérique, on note la
multiplication (par exemple):

c'est ce que nous nommons la notation en puissance ou "l'exponentation". Le nombre en


exposant est ce que nous nommons la "puissance" ou "l'exposant" du nombre ( en
l'occurrence). La notation en exposants se trouve pour la première fois dans l'ouvrage de Chuquet intitulé
"Triparty en la science des nombres" (1484).

Vous pouvez vérifier par vous-même que ses propriétés sont les suivantes (par exemple):

Axiomes :

A1. La multiplication de plusieurs nombres ne dépend pas de l'ordre des termes. Nous disons
alors que la multiplication est une "opération commutative".

A2. La multiplication de plusieurs nombres ne change pas si l'on remplace deux ou plusieurs
d'entre eux par leur résultat intermédaire. Nous disons alors que la multiplication est
"associative".

A3. L'unité est l'élément neutre de la multiplication car tout multiplicande multiplié par la
multiplicateur 1 est égal au multiplicande.

A4. La multiplication peut comporter un terme de telle façon à ce que le produit soit égal à
l'unité (l'élément neutre). Nous disons alors qu'il existe un "inverse pour la multiplication".

A5. La multiplication est "distributive", c'est-à-dire que l'opération


inverse s'appelant la factorisation.

Soit des nombres quelconques (non nécessairement égaux) alors nous pouvons
noter le produit ainsi:

102/2001
Sciences.ch 14/03/2005

en définissant des bornes supérieurs et inférieures au produit (au-dessus et en-dessous de la


lettre grecque majuscule "pi").

Rappel des propriétés relatives à cette notation:

où est une constante telle que :

Exemples :

La multiplication de deux nombres relativement petits est assez facile dès que nous avons
appris par cœur à compter jusqu'à au moins le nombre résultant de cette opération. Ainsi:

, ,

Pour les beaucoup plus grands nombres il faut adopter un autre méthode qu'il s'agit
d'apprendre par cœur. Ainsi par exemple:

nous multiplions colonne par colonne et nous additionnons l'ensemble des résultats décalés
d'un chiffre comme ci-dessous (8x4=32, 8x7=56, 8x5=40, 8x4=32) ainsi nous obtenons :

103/2001
Sciences.ch 14/03/2005

Cette méthodologie est très logique si vous avez bien compris comment nous construisons un
chiffre en base dix. Ainsi, nous avons (nous supposerons pour l'instant la distributivité comme
connue):

Pour ne pas surcharger l'écriture dans la multiplication par la méthode "verticale", nous ne
représentons pas les zéros qui surchargeraient inutilement les calculs (et ce d'autant plus si le
multiplicateur le multiplicande sont de très grands nombres)

DIVISION

Définition: La division des nombres entiers est une opération, qui a pour but, étant donné
deux nombres, l'un appelé "dividende", l'autre appelé "diviseur", d'en trouver un troisième
appelé "quotient" qui soit le plus grand nombre dont le produit par le diviseur puisse se
retrancher (donc la division découle de la soustraction !) du dividende (la différence étant
nommé le "reste" ou la "congruence").

Remarque : dans les cas des nombre réels il n'y a jamais de reste à la fin de l'opération de
division (tel que le quotient multiplié par le diviseur donne exactement le dividende). ! D'une
façon générale dans le cadre des nombres entiers, si nous note la dividende, le diviseur,
le quotient et le reste nous avons la relation:

en sachant que la division était :

Nous désignons également souvent par "fraction" (au lieu de "quotient"); le rapport de deux
nombres ou autrement dit, la division du premier par le deuxième (pris dans un ordre
arbitrairement choisi).

Remarque : le signe de la division ":" est dû à Leibniz; la barre de fraction se trouve elle pour
la première fois dans les ouvrages de Fibonacci (1202); elle est probablement due aux

104/2001
Sciences.ch 14/03/2005

Hindous.

Si nous divisons deux entiers et que nous souhaite un entier comme quotient et reste (s'il y en
a un) uniquement, alors nous parlons de "division euclidienne".

Nous indiquons l'opération en plaçant entre les deux nombres, le dividende et le diviseur un
" : " ou une barre de division " / " :

Si nous avons :

on appelle l'inverse du dividende. A tout nombre est associé un inverse qui satisfait cette
condition.

De cette définition il vient la notation (avec étant un nombre quelconque différent de zéro) :

Dans le cas de deux nombres fractionnaires, nous disons qu'ils sont "inverses" ou
"réciproques", lorsque leur produit est égal à l'unité (comme la relation précédente) pour toute
valeur de , positive ou négative.

Remarques :

R1. une division par zéro est ce que l'on nomme une "singularité". C'est-à-dire que le résultat
de la division est indéterminé (ce qui n'est pas le même chose que de dire qu'il n'y a pas de
solution).

R2. lorsque nous multiplions le dividende et le diviseur d'une division par un même nombre,
le quotient ne change pas, mais le reste est multiplié par ce nombre.

R3. diviser un nombre par un produit effectué de plusieurs facteurs revient à diviser ce
nombre successivement par chacun des facteurs du produit et réciproquement.

Les propriétés des divisions avec les puissances sont les suivantes (nous laisserons le soin au
lecteur de le vérifier avec des valeurs numériques):

ou :

Rappelons qu'un nombre premier est un nombre qui n'a d'autres diviseurs que lui-même et

105/2001
Sciences.ch 14/03/2005

l'unité. Donc tout nombre qui n'est pas premier à un nombre premier comme diviseur. Le plus
petit des diviseurs d'un nombre entier est donc un nombre premier.

Quelques propriétés de la division (certaines nous sont déja connues car elles découlent d'un
raisonnement logique des propriétés de la multiplication) :

Axiomes :

A1. La division de plusieurs nombres ne dépend pas de l'ordre des termes. Nous disons alors
que la division est une "opération commutative".

A2. La division de plusieurs nombres ne change pas si l'on remplace deux ou plusieurs d'entre
eux par leur résultat intermédaire. Nous disons alors que la division est "associative".

A3. L'unité est l'élément neutre de la division car tout dividende divisé par le diviseur 1 est
égal au dividende.

A4. La division peut comporter un terme de telle façon à ce que la division soit égal à l'unité
(l'élément neutre). Nous disons alors qu'il existe un "inverse pour la division".

Si et sont deux nombres réels positifs nous avons (nous vous laissons bien sûr observer
la cas où doit être non nul) :

Nous pouvons maintenant définir la racine q-ième principale d'un nombre quelconque :

106/2001
Sciences.ch 14/03/2005

la dernière relation n'étant définie que pour . Au niveau de la terminologie, nous


avons :

qui est une racine, le nombre est le "radicande" et est l'indice de la racine. Le symbol
est appelé le "radical".

De ce qui a déjà été dit pour les puissances, nous pouvons conclure aisément que:

et :

il en ressort que :

et

Nous avons également si :

si et :

si est pair.

Si le dénominateur d'un quotient contient un facteur de la forme avec , en


multipliant la numérateur et le dénominateur par , nous supprimerons la racine au
dénominateur, puisque :

Nous appellons communément ce procédé "rendre un dénominateur rationnel". Nous pouvons


bien sûr faire de même avec le numérateur.

Remarques :

107/2001
Sciences.ch 14/03/2005

R1. "simplifier" une expression contenant des puissances de nombres réels signifie qu'il faut
regrouper les termes ayant des exposants identiques.

R2. si et est impair, alors est le nombre réel négatif tel que .
Si la est impaire alors bien sûr, comme nous l'avons déjà vu, la racine est complexe
(voir les nombres complexes dans le chapitre traitant des nombres).

POLYNÔMES ARITHMÉTIQUES

Définition : un "polynôme arithmétique" (à ne pas confondre des polynômes algébriques qui


seront étudiés dans la sectiond d'algèbre) est un ensemble de nombres séparés les uns des
autres par les signes + ou -.

Les composants enfermés dans le polynôme sont appelés "termes" du polynôme. Lorsque le
polynôme contient un unique terme, nous parlons alors de "monôme", s'il y a deux termes
nous parlons de "binôme", et ainsi de suite....

Démontrons que la valeur d'un polynôme arithmétique est égale à l'excès de la somme des
termes précédés du signe + sur la somme des termes précédés du signe -.

Démonstration:

quelque soit la valeur des variables.

Mettre en évidence l'unité négative –1 est ce que l'on appelle une "factorisation" ou "mise en
facteurs". L'opération inverse, s'appellant une "distribution".

Le produit de plusieurs polynômes peut toujours être remplacé par un polynôme unique que
nous appellons "le produit effectué". Nous opèrons habituellement comme suit: nous
multiplions successivement tous les termes du premier polynôme, en commençant par la
gauche, par le premier, le second, …, le dernier terme du second polynôme. Nous obtenons
ainsi un premier produit partiel; nous faisons, s'il y a lieu, la réduction des termes semblables.
Nous multiplions ensuite chacun des termes du produit partiel successivement par le premier,
le second, …, le dernier terme du troisième polynôme en commençant par la gauche et ainsi
de suite.

Le produit des polynômes est la somme de tous les produites de facteurs


formés avec un terme de , un terme de , …, et un terme de ; s'il n'y a aucune réduction,
le nombre des termes du produit est égal au produit des nombres des termes des facteurs.

Soit, en général:

108/2001
Sciences.ch 14/03/2005

pour faire la multiplication des polynômes nous multiplions tous les termes
de successivement par tous ceux de pris dans l'ordre de gauche à droite; puis nous
multiplions tous les termes du produit pas ceux de , et ainsi de suite. Un terme quelconque a
une expression de la forme , en désignant par l'un des entiers , et de
même pour et pour . Dans le produit total, les termes pris dans l'ordre successif sont
d'abord ceux qui ne contiennent que en nombre ; puis ceux qui ne contiennent que ou
, pris séparément ou simultanément; ils sont en nombre ; puis les termes du produit par
qui sont en nombre , et ainsi de suite. On voit ainsi que le rang du terme
est fourni par l'expression:

Inversement, lorsque est donné, nous observons que est l'entier de la division de par
, que est l'entier de la division du reste par , et ainsi de suite. En particulier, si
, la détermination du terme qui correspond à un rang donné revient à écrire
dans le système de numération de base .

Ainsi, dans le produit:

pour avoir le signe du terme de rang , nous écrivons ce nombre dans le système de
numération binaire; le terme correspondant est positif, ou négatif, suivant que le nombre des
1, et celui des 0 qui terminent sont, ou ne sont pas, de même parité.

VALEUR ABSOLUE

Définition: nous appellons "valeur absolue" d'un nombre réel noté , le nombre réel non
négatif, qui satisfait aux conditions suivantes:

(positif) si

(positif) si

Il découle de cette définition que pour tout nous avons :

et :

Remarque : les relations ci-dessous sont équivalentes de par la définition de la valeur


absolue :

109/2001
Sciences.ch 14/03/2005

Corollaires:

C1. La valeur absolue de la somme algébrique de plusieurs nombres réels n'est pas supérieure
à la somme à la somme des valeurs absolues des composantes de la somme.

C2. La valeur absolue de la différence n'est inférieur à la différence des valeurs absolues des
composantes de la différence.

C3. La valeur absolue du produit (multiplication) est égale au produit des valeurs absolues.

C4. La valeur absolue du rapport est égale au rapport des valeurs absolues.

Remarque : nous emploierons le symbole de valeur absolue pour définir la distance entre deux
points quelconques d'une droite quelconque (si elle est complexe nous en prendrons le module
des points qui la composent). Ainsi, si et sont la norme ou le module (concepts que nous
connaissons que partiellement pour l'instant) de coordonnées de deux points et d'un
droite, alors la distance (ou "longueur") entre les deux points de la droit est défini par :

et puisque , nous avons :

RÉGLES DE CALCUL

Fréquemment en informatique (dans le développement en particulier), nous parlons de


"priorité des opérateurs". En mathématiques nous parlons de "priorité des ensembles
d'opérations et des règles des signes". De quoi s'agit-il exactement?

Nous avons déjà vu qu'elles étaient les propriétés des opérations d'addition, soustraction,
multiplication, mise en puissance et division. Nous tenons donc à ce que le lecteur différencie
la notion de "propriété" de celle ce de "priorité" (que nous allons tout de suite voir) qui sont
des choses complètement différentes.

En mathématiques, en particulier, nous définissons les priorités des symboles:

Autrement dit:

1. Les opérations qui sont entre parenthèses ( ) doivent êtres effectuées en premier dans le
polynôme.

2. Les opérations qui sont entre crochets [ ] doivent êtres effectuées en second à partir des
résultats obtenus des opérations qui se trouvaient entre les parenthèses ( ).

110/2001
Sciences.ch 14/03/2005

3. Finalement, à partir des résultats intermédiaires des opérations qui se trouvaient entre
parenthèses ( ) et crochets [ ], nous calculons les opérations qui se situent entre les accolades
{ }.

Faisons un exemple, ceci sera plus parlant. Soit à calculer le polynôme:

Selon les règles que nous avons définies tout à l'heure, nous calculons d'abord tous les
éléments qui sont entre parenthèses ( ), c'est-à-dire:

, ,

ce qui nous donne:

Toujours selon le règles que nous avons définies tout à l'heure, nous calculons maintenant
tous les éléments entre crochets en commençant toujours à calculer les termes qui sont dans
les crochets [ ] au plus bas niveau des autres crochets [ ]. Ainsi, nous commence par calculer
l'expression qui se trouve dans le crochet de niveau supérieur: .

Cela nous donne et donc:

Il nous reste à calculer maintenant et donc:

Nous calculons maintenant l'unique terme entre accolade, ce qui nous donne :

Finalement il nous reste:

Evidemment il s'agit d'un cas particulier... Mais le principe est toujours le même.

La priorité des opérateurs arithmétiques est une notion spécifique aux langages informatiques
(comme nous en avons déjà fait mention) du fait qu'on ne peut dans ces derniers écrire des
relations mathématiques que sur une ligne unique.

Ainsi, en informatique l'équation:

111/2001
Sciences.ch 14/03/2005

s'écrit (à peu de choses près) :

Un non-initié pourrait y lire:

ou ou

ou et encore quelques autres...

ce qui vous en conviendrez, est fort dangereux car nous arriverons à des résultats différents à
chaque fois (cas particuliers mis à part…) !

Ainsi, il a logiquement été défini un ordre de priorité des opérandes tel que les opérations
soient effectuées dans l'ordre suivant:

1. – Négation

2. ^ Puissance

3. * / Multiplication et division

4. \ division entière (spécifique à l'informatique)

5. Mod Modulo (voir théorie des nombres)

6. + - Addition et soustraction

Evidemment les règles des parenthèses ( ), crochets [ ], et accolades { } qui ont été définies en
mathématiques s'appliquent à l'informatique.

Ainsi, nous obtenons dans l'ordre (nous remplacons chaque opération effectuée par un
symbole):

D'abord les termes entre parenthèses:

Ensuite les règles de priorité des opérateurs s'appliquent dans l'ordre défini précédemment:

D'abord (1):

ensuite (2) :

112/2001
Sciences.ch 14/03/2005

nous appliquons la multiplication (3):

et finalement la division (3):

Les règles (4) et (5) s'appliquent pas à cet exemple particulier.

Finalement (6) :

Ainsi, en suivant ces règles, ni l'ordinateur, ni l'être humain ne peuvent (ne devraient) se
tromper lors de l'interprétation d'une équations écrite sur un ligne unique.

En informatique, il existe cependant plusieurs opérateurs que nous ne retrouvons pas en


mathématiques et qui changent souvent de propriétés d'un langage informatique à un autre.
Nous nous attarderons pas trop là-dessus cependant, nous avons mis ci-dessous un petit
descriptif:

L'opérateur de concaténation " & " est évalué avant les opérateurs de comparaisons.

Les opérateurs de comparaison (=, <, >, …) possèdent tous une priorité identique.

Cependant, les opérateurs les plus à gauche dans une expression, détiennent une priorité plus
élevée.

Les opérateurs logiques sont évalués dans l'ordre de priorité suivant:

1. Not - 2. And - 3. Or - 4. Xor - 5. Eqv - 6. Imp

Maintenant que nous avons vu les priorités des opérateurs, quelles sont les règles des signes
en vigueur en mathématiques?

D'abord, il faut savoir que ces dernières ne s'appliquent que dans le cas de la multiplication et
la division. Soit deux nombres positifs . Nous avons:

Autrement dit, la multiplication de deux nombres positifs est un nombre positifs et ce pour
généralisable à la multiplication de nombres positifs.

Autrement dit, la multiplication d'un nombre positif par un nombre négatif est négatif. Ce qui

113/2001
Sciences.ch 14/03/2005

est généralisable à un résultat positif de la multiplication s'il y a un nombre pair de nombres


négatifs et à un résultat négatif pour un nombre impair de nombres négatifs sur la totalité
des nombres de la multiplication.

Autrement dit, la multiplication de deux nombres négatifs est positif. Ce qui est généralisable
à un résultat positif de la multiplication s'il y a un nombre pair de nombre négatifs et à un
résultat négatif pour un nombre impair de nombres négatifs.

Pour ce qui est des division, la raisonnement est identique:

et

Autrement dit, si le numérateur et le dénominateur sont positifs, alors le résultat de la division


sera positif.

et

Autrement dit, si soit le numérateur ou le dénominateur est négatif, alors le résultat de la


division sera forcément négatif.

et

Autrement dit, si le numérateur et le dénominateur sont positifs, alors le résultat de la


division, sera forcément positif.

Evidemment, si nous avons une soustraction de termes, il est possible de la récrire sous la
forme :

114/2001
Sciences.ch 14/03/2005

THÉORIE DES NOMBRES

La théorie des nombres est un sujet très vaste qui englobe de nombreuses parties des
mathématiques dont les probabilités, la statistique, la théorie des graphes, la théorie des
ensembles, l'algèbre (d'une certaine façon) et encore bien d'autres...

Nous avons choisi de ne présenter dans cet exposé, que les sujets qui sont indispensables à
l'étude de la mathématique et de la physique théorique ainsi que ceux devant faire partie de la
culture générale du scientifique.

PRINCIPE DU BON ORDRE

Nous tiendrons acquis ce principe qui s'énonce ainsi :

Tout ensemble non vide contient un plus petit élément.

Nous pouvons utiliser ce théorème pour démontrer une propriété importante des nombres :

PROPRIÉTÉ ARCHIMÉDIENNE

Cette propriété s'énonce ainsi:

Soit , il existe au moins un entier positif tel que

Démonstration:

Supposons le contraire, c'est-à-dire que nous ayons :

Si nous démontrons que cela est absurde pour tout alors on aurons démontré la propriété
archimédienne.

Considérons alors l'ensemble . Nous imposons que pour


satisfaire et que . En utilisant le principe du bon ordre, nous déduisons qu'il
existe tel que pour tout . Posons donc :

Comme impose également , nous devons avoir :

ce qui voudrait dire que , d'où une contradiction évident. Cette contradiction amène
que l'hypothèse initiale comme quoi pour tout alors est fausse et donc que la
propriété archimédienne est démontrée par l'absurde.

PRINCIPE D'INDUCTION

115/2001
Sciences.ch 14/03/2005

Soit un ensemble de nombres naturels qui possède les deux propriétés suivantes :

P1.

P2. Si , alors

Alors :

nous construisons ainsi l'ensemble des nombres naturels.

Démonstration :

Soit (le symbole " \ " signifiant "excluant"). Nous voulons démontrer que .
Supposons le contraire :

Par le principe du bon ordre, puisque alors , doit posséder un plus petit élément .
Mais puisque , nous avons que , c'est-à-dire aussi . En faisant appel
à (P2), nous avons finalement que , c'est-à-dire que , donc une contradiction.

Exemple d'application :

Nous souhaitons montrer à l'aide du principe d'induction, que la somme des premiers carrés
est égale à , c'est-à-dire que pour nous aurions:

Démonstration :

D'abord la relation ci-dessus est facilement vérifiée pour nous allons montrer que
vérifie aussi cette relation. En vertu de l'hypothèse d'induction:

nous retrouvons bien l'hypothèse de la validité de la première relation mais avec ,


d'où le résultat.

La suite de Fibonacci (voir le chapite des fonctions arithmétiques dans cette section) possède
la propriété suivante : la somme des premiers termes consécutifs de la suite, augmentée de 1,
est égale au terme qui suit de rangs le terme auquel on s'est arrêté.

Ainsi, nous avons:

116/2001
Sciences.ch 14/03/2005

Pour démontrer cette propriété, nous constate que cette dernière est aisément vérifiée pour les
premières valeurs , de . Supposons que la propriété ait été démontrée pour et
pour . Nous avons :

par conséquent, en ajoutant ces deux égalités et tenant compte de la loi de formation nous
obtenons :

par conséquent la deuxième relation ne diffère que de la première par le changement de en


puisque est nul. Donc le théorème est démontré.

Ce procédé de démonstration est d'une très grande importance dans l'étude de l'arithmétique;
souvent l'observation et l'induction ont permis de soupçonner des lois qu'il eût été plus
difficile de trouver par "a priori". Nous nous rendons compte de l'exactitude des formules par
la méthode précédente qui a donné naissance à l'algèbre moderne par les études de Fermat et
de Pascal sur le triangle de Pascal (voir la section d'algèbre)

LA DIVISIBILITÉ

Soit avec . Nous disons que " divise (sans restes)" s'il existe un entier (le
quotient) tel que :

auquel cas nous écrivons : .

Dans le cas contraire, nous écrivons et nous lisons " ne divise pas ".

Remarque : si , nous dirons aussi que " est divisible par " ou que " est un
multiple de ". Dans le cas où et que , nous dirons que est un "diviseur
propre" de . De plus, il est clair que quel que soit sinon quoi nous avons
une singularité. Enfin, nous écrira pour signifier que mais que .

Voici maintenant quelques théorèmes élémentaires se rattachant à la divisibilité:

T1. Si , alors quel que soit

Démonstration:

Si , alors il existe un entier tel que . Alors, et ainsi .

117/2001
Sciences.ch 14/03/2005

T2. Si et , alors

Démonstration:

Si et , alors il existe des entiers et tels que et . Donc,


et ainsi .

T3. Si et , alors ,

Démonstration:

Si et , alors il existe des entiers et tels que et . Il s'ensuit que:

et ainsi que

T4. Si et , alors

Démonstration:

Si et , alors il existe des entiers et tels que et . Nous avons


donc et ainsi ; c'est pourquoi nous pouvons avoir si et
qu'ainsi

T5. Si et , alors il existe un entier alors

Démonstration:

Si et , alors il existe un entier tel que . Mais alors, ,


puisque .

DIVISION EUCLIDIENNE

Soit avec ; alors, il existe des entiers et tels que


, où . De plus, si , alors .

Démonstration :

Considérons l'ensemble:

Il est facile de voir que et donc que , d'où, d'après le principe du bon
ordre, nous concluons que contient un plus petit élément . Soit l'entier satisfaisant
à . Il reste à montrer que . Supposons le contraire à nouveau (démonstration

118/2001
Sciences.ch 14/03/2005

par l'absurde), c'est-à-dire que . Alors, dans ce cas, nous avons , ce qui
est équivalent à ; mais et , ce
qui contredit le fait que est le plus petit élément de . Donc, . Enfin, il est
clair que si , nous avons , d'où la seconde affirmation du théorème.

Remarque : dans l'énoncé de la division euclidienne, nous avons supposé que .


Qu'obtenons-nous lorsque ? Dans cette situation, est positif, et alors nous pouvons
appliquer la division euclidienne à et - . Par conséquent, il existe des entiers et tels
que:

Or, cette relation peut s'écrire , où bien sûr, - est un entier. La conclusion est
que la division euclidienne peut s'énoncer sous la forme plus générale :

Soit , alors il existe des entiers et tels que , où . De plus,


si , alors

Les entiers et sont dans la division euclidienne uniques. En effet, s'il existe deux autres
entiers et tels que avec toujours , alors et ainsi
. En vertu de (T5) nous avons, si , . Or, cette dernière inégalité
est impossible puisque . Donc, et, puisque , alors ; d'où
l'unicité.

PLUS GRAND COMMUN DIVISEUR

Soit tels que . Le "plus grand commun diviseur" (noté "p.g.c.d" par la suite)
de , noté :

est l'entier positif qui satisfait aux deux propriétés suivantes :

P1. et

P2. si et alors (par définition)

Remarque: notons que 1 est un diviseur commun de deux entiers arbitraires. Cependant, il
n'est pas évident que le p.g.c.d de deux entiers existe toujours; ce fait est démontré
dans le théorème suivant (cependant, si le p.g.c.d existe, il est de par sa définition unique) :

Soit tels que . Alors, il existe des entiers tels que:

119/2001
Sciences.ch 14/03/2005

Démonstration:

Considérons l'ensemble . Comme et , nous


pouvons utiliser le principe du bon ordre et conclure que possède un plus petit élément .
Nous pouvons alors écrire pour un certain choix . Il suffit de montrer
que . Pour cela, il faut montrer que satisfait aux propriétés (P1) et (P2) de la
définition du p.g.c.d.

Commençons par la première:

Supposons que . Alors, d'après la division euclidienne, il existe tels que


, où . Mais alors:

et donc et , ce qui contredit le fait que est le plus petit élément possible de .
Donc, et, de la même façon, nous démontrons que .

Corollaire:

Soit tels que . Alors:

constitue l'ensemble de tous les multiples de .

Démonstration:

Comme et , alors nous supposons pour tout . Soit


. Nous voulons montrer que . Soit d'abord ce qui signifie que
et qui implique . Supposons maintenant également qu'il existe un , cela
voudrait donc dire que pour un certain . Comme pour un choix
d'entiers quelconques , alors:

Ainsi se termine la démonstration. Les hypothèses peuvent vous sembler compliquées mais
portez plutôt votre attention un certain temps sur la dernière relation. Vous allez tout de suite
comprendre!

Remarque: si au lieu de définir le p.g.c.d de deux entiers non nuls, nous permettons à l'un
d'entre eux d'être égal à 0, disons , ? Dans ce cas, nous avons et , selon notre
définition du p.g.c.d, il est clair que .

Propriétés : Soit et soit , alors:

120/2001
Sciences.ch 14/03/2005

P1.

P2. où

P3.

P4. Si tel que et alors

Dans certains ouvrages, ces quatre propriétés sont "démontrées" en utilisant intrinsèquement
la propriété elle-même. Personnellement nous nous en abstiendrons car faire cela est plus
ridicule qu'autre chose à notre goût car la propriété est un démonstration en elle-même.

Elaborons maintenant un méthode qui s'avérera très importante pour calculer le plus grand
commun diviseur de deux entiers (utile en informatique parfois).

ALGORITHME D'EUCLIDE

Soit , où . En appliquant successivement la division euclidienne, nous obtenons


la suite d'équations:

Si , alors . Par suite, les entiers satisfaisant à

Démonstration:

Nous voulons d'abord montrer que . Or, d'après la propriété


nous avons :

Pour démontrer la deuxième propriété de l'algorithme d'Euclide, nous écrivons l'avant


dernière équation du système sous la forme:

Or, en utilisant l'équation précédant l'avant dernière équation du système, nous avons :

121/2001
Sciences.ch 14/03/2005

En continuant ce processus, nous arrivons à exprimer comme un combinaison linéaire de


.

Exemple:

Calculons le plus grand commun diviseur de (966,429) et exprimons ce nombre comme une
combinaison linéaire de 966 et de 429.

Solution : nous appliquons bien évidemment l'algorithme d'Euclide:

Nous en déduisons donc que :

et, de plus, que:

Définition: nous disons que les entiers sont "relativement premiers" si

PLUS PETIT COMMUN MULTIPLE

Définition: soit . Nous disons que est un "commun multiple de


si pour . Le "plus petit commun multiple" (p.p.c.m) de
, noté :

est le plus petit entier positif par tous les communs multiples de .

Remarque : soit ; alors, le plus petit commun multiple existe. En effet,


considérons l'ensemble:

122/2001
Sciences.ch 14/03/2005

Puisque , alors l'ensemble est non vide et, d'après l'axiome du bon ordre,
l'ensemble contient un plus petit élément positif.

Théorèmes :

T1. Si est un commun multiple de alors

Démonstration:

Soit . Alors, d'après la division euclidienne, il existe des entiers et tels


que:

Il suffit de montrer que . Supposons (démonstration par l'absurde). Puisque


et , alors on a et cela pour . Donc, est un commun multiple
de plus petit que le p.p.c.m. On vient d'obtenir une contradiction, ce qui prouve la
première partie.

T2. Si , alors

La démonstration est évidente.

T3.

Démonstration:

Pour la démonstration, nous allons utiliser le "lemme d'Euclide" qui s'énonce ainsi :

Si et alors .

Démonstration :

Nous avons vu qu'il existe tels que et alors . Mais et


impliquent que , c'est-à-dire également que .

Revenons à notre théorème:

Puisque et , il suffit de prouver le résultat pour des entiers


positifs et . En tout premier lieu, considérons le cas où . L'entier étant un
multiple de , nous pouvons écrire . Ainsi, nous avons et, puisque
, il s'ensuit, d'après le lemme d'Euclide, que . Donc, et alors .
Mais est un commun positif de et qui ne peut être plus petit que le p.p.c.m; c'est
pourquoi .

Pour le cas général, c'est-à-dire , nous avons, d'après la propriété :

123/2001
Sciences.ch 14/03/2005

et avec les résultat obtenu précédemment que:

Lorsque nous multiplions des deux côtés de l'équation par , le résultat suit et la
démonstration est effectuée

THEOREME FONDAMENTAL DE L'ARITHMÉTIQUE

Tout nombre naturel peut s'écrire comme un produit de nombres premiers, et cette
représentation est unique, à part l'ordre dans lequel les facteurs premiers sont disposés.

Si est premier, alors la preuve est terminée. Supposons que n'est pas premier et
considérons l'ensemble:

Alors, et , puisque est composé, nous avons que . D'après le principe du bon
ordre, possède un plus petit élément qui est premier, sans quoi le choix minimal de
serait contredit. Nous pouvons donc écrire . Si est premier, alors la preuve est
terminée. Si est composé, alors nous répètons le même argument que précédemment et
nous en déduisons l'existence d'un nombre premier et d'un entier tels que
. En poursuivant ainsi nous arrivons forcément à la conclusion que sera
premier.

Donc finalement nous avons bien démontré qu'un nombre quelconque est décomposable en
facteurs de nombres premiers à l'aide du principe du bon ordre.

Nous ne connaissons pas à ce jour de loi qui permette de calculer le -ième facteur premier
. Ainsi, pour savoir si un entier est premier, il est pratiquement plus facile à ce jour de
vérifier sa présence dans une table de nombres premiers.

En fait, nous utilisons aujourd'hui la méthode suivante :

Soit un nombre , si nous voulons déterminer s'il est premier ou non, nous calculons s'il est
divisible par les nombres premiers qui appartiennent à l'ensemble :

Exemple: L'entier 223 n'est divisible par 2, ni par 3, ni par 5, ni par 7, ni par 11, ni par 13. Il
est inutile de continuer avec le prochain nombre premier, car . Nous en
déduisons dès lors que le nombre 223 est premier.

124/2001
Sciences.ch 14/03/2005

NOMBRES CONGRUS

Définition: soit . Nous disons que " est congru à modulo ", et nous
écrivons :

si ; dans le cas contraire, nous disons que " est non congru à modulo ".

D'autre part, nous pouvons étendre la signification du mot "reste" en disant que deux nombres
congrus pour le module sont "résidus" l'un de l'autre pour ce module.

L'égalité entre deux nombres, en supprimant les multiples du module, s'appelle "congruence"
ou "équivalence". La notation de Gauss permet de mettre en évidence l'analogie qui existe
entre les égalités et les congruences, sans introduire de confusion.

Nous avons les propriétés suivantes:

P1. Nous pouvons peut ajouter ou retrancher membre à membre des congruences de même
module.

P2. Nous pouvons multiplier les deux membres d'une congruence par un même nombre entier.

P3. Nous pouvons multiplier membre à membre les congruences de même module.

P4. Nous pouvons élever à une même puissance les deux membres d'une congruence.

Des ces propriétés il vient que si nous désignons par un polynôme à coefficient entiers,
positifs ou négatifs:

La congruence donnera aussi

Si nous remplacons successivement par tous les nombres entiers dans un polynôme
à coefficients entiers, et si nous prenons les résidus pour le module , ces résidus se
reproduisent de en (dans le sens où la congruence se vérifie), puisque nous avons, quel
que soit l'entier et :

Nous en déduisons alors l'impossibilité de résoudre la congruence suivante :

en nombres entiers, si désigne l'un quelconque des non-résidus (un résidu qui ne satisfait
pas la congruence).

PREUVE PAR NEUF

125/2001
Sciences.ch 14/03/2005

La "preuve par 9" dans le système de numérotation décimale, pour les quatre opérations
fondamentales de l'arithmétique (+, - , x, / ), repose sur les théorèmes que nous venons de voir
sur les congruences, en supposant .

En effet, suivant le module , toutes les puissances de dix sont congrues à l'unité,
puisque , étant un nombre formé exclusivement des chiffres 9999…., est divisible par
9. Par conséquent, si désignent respectivement les chiffres des unités, dizaines,
centaines, … d'un nombre écrit dans le système décimal, nous avons :

et, par suite de par les propriétés de la congruence:

En d'autres termes, le reste de la division d'un nombre par 9 est égal au reste de la division par
9, de la somme de ses chiffres.

Par conséquent, si l'on remplace, dans les quatre opérations fondamentales de l'arithmétique,
les nombres donnés par leurs restes suivant le module 9, les nombres obtenus doivent êtres
congrus à ceux qu'on déduirait des résultats; sinon il y aurait erreur dans les calculs.

126/2001
Sciences.ch 14/03/2005

THÉORIE DES ENSEMBLES

Lors de notre études des nombres, des opérateurs, et de théorie des nombres (voir chapitres du
même nom), nous avons assez souvent utilisé les termes de "groupes, "d'anneaux", de "corps",
"d'homomorphisme", etc. et continuerons par la suite à le faire encore de nombreuses fois.
Outre le fait que ces concepts soient d'une extrême importance, permettant de faire des
démonstrations ou de construire des êtres mathématiques indispensables à l'étude de la
physique théorique contemporaine (physique quantique des champs, théories de cordes,
modèles standard,...), ils permettent de comprendre les composants et les propriétés de base
de la mathématique et de ses opérateurs en rangeant ceux-ci par catégories distinctes. Ainsi,
choisir de mettre la théorie des ensembles en tant que cinquième chapitre de ce site est un
choix tout à fait discutable puisque rigoureusement c'est par là que tout commence...
Cependant, nous avions besoins d'exposer quand même la théorie de la démonstration ne
serait-ce que pour les notations et les méthodes dont il sera fait usage ici.

Par ailleurs, lors de l'enseignement des mathématiques modernes dans l'enseignement


secondaire, voire primaire (années 70), on introduisit le langage des ensembles et l'étude
préalable des relations binaires pour une approche plus rigoureuse de la notion de fonctions
(voir la définition plus loin) et de la mathématique en générale :

Nous parlons alors de "diagramme sagittal" (ou de "schéma sagittal" du latin sagitta = flèche).

Exemple : la représentation graphique de la fonction définie de vers


conduirait au diagramme sagittal ci-dessous :

Une relation de dans fournirait un diagramme sagittal du type :

Le bouclage de chaque élément montrant une fonction "réflexive"; la présence systématique


d'une flèche retour indiquant une fonction "symétrique".

127/2001
Sciences.ch 14/03/2005

Cependant le choix d'introduire la théorie des ensembles dans les classes d'école a une raison
aussi un peu autre. Au fait, dans un souci de rigueur interne (in extenso : non liées à la
réalité), une très grande partie des mathématiques a été reconstruite à l'intérieur d'un seul
cadre axiomatique, dénommé donc "théorie des ensembles", dans le sens où chaque concept
mathématique (autrefois indépendant des autres) est ramené à une définition dont tous les
constituants logiques proviennent de ce même cadre : elle est considérée comme
fondamentale. Ainsi, la rigueur d'un raisonnement effectué au sein de la théorie de ensembles
est garantie par le fait que le cadre est "non-contradictoire" ou "consistant".

Voici les définitions qui construisent ce cadre :

DÉFINITIONS

D1. Nous appelons "ensemble" toute liste, collection ou rassemblement d'objets

D2. Nous appelons "éléments" ou "membres de l'ensemble" les objets appartenant à


l'ensemble et nous notons :

si est un élément de l'ensemble et dans le cas contraire :

Si est une partie de , ou sous-ensemble de , nous notons cela :

ou

dès lors, si pour tout

Nous identifiions également un ensemble soit en listant ses éléments, soit en donnant la
définition de ses éléments. Par exemple:

- par exemple

D3. Un ensemble est dit ordonnée (muni d'une relation d'ordre – voir le chapitre traitant des
opérateurs dans la présente section) si soit une relation d'ordre et deux éléments de
nous avons :

ou

c'est-à-dire que les éléments sont comparables.

Remarques :

R1. la structure d'ensemble ordonnée a été mise en place dans le cadre de la théorie des
nombre par Canton et Dedekind.

128/2001
Sciences.ch 14/03/2005

R2. il se peut, en effet que nous n'ayons ni , ni : nous parlons alors "d'ordre partiel",
sinon, l'ordre est "total".

R3. sont totalement ordonnées par les relations usuelles . La relation ,


souvent dite "d'ordre strict", n'est pas une relation d'ordre car non réflexive et non anti-
symétrique (voir le chapitre traitant des opérateurs). Dans , la relation " divise ",
souvent notée par le symbole " | ", est un ordre partiel.

R4. Si est un ordre sur et une partie de , la restriction à de la relation est un


ordre sur , dit "ordre induit par dans ".

R5. Si est un ordre sur , la relation définie par :

est un ordre sur , dit "ordre réciproque" de . L'ordre réciproque de l'ordre usuel est
l'ordre noté ainsi que l'ordre réciproque de l'ordre " divise " dans est l'ordre " est
multiple de ".

L'ensemble est l'être mathématique de base, dont l'existence est posée : il n'est pas défini en
tant que tel, mais par ses propriétés, donées par les axiomes. Il fait appel à une procédure
humaine : une sorte de "fonction de catégorisation", qui permet à la pensée de distinguer
plusieurs éléments qualifiés d'indépendants.

Nous pouvons démontrer à partir des ces concepts, que le nombre de sous-ensembles d'un
ensemble de cardinal (nombre d'éléments) est :

Il y a d'abord l'ensemble vide , soit 0 éléments choisi par , in extenso et ainsi de


suite…

Au total, le nombre de sous-ensembles d'un ensemble considéré est alors:

Exemple :

Considérons l'ensemble , nous avons :

- L'ensemble des parties commun à chaque sous-ensemble est l'ensemble vide:

- Les singletons :

- Les "duets" :

- lui-même :

Remarque : l'ordre dans lequel sont différenciés les éléments ne rentrent pas en compte lors

129/2001
Sciences.ch 14/03/2005

du comptage des parties de l'ensemble de départ.

En physique-mathématique, nous travaillerons presque exclusivement avec des ensembles de


nombres. Nous nous se restreindrons donc à l'étude des définitions et propriétés de ces
derniers :

AXIOMES

L'axiomatique (dite "ZF") présentée ci-dessous a été formulée par Ernst Zermela (1908) puis
précisée par Adolf Abraham (1922); c'est la plus naturelle. Il en existe bien d'autres, basées
sur le concept plus général de "classe", comme celle développée par von Neumann, Bernays
et Gödel (pour les notations, voir le chapitre traitant de la théorie de la démonstration)

A1. Axiome d'extensionalité :

Deux ensembles sont égaux si, et seulement si, ils ont les mêms éléments. C'est ce que nous
notons :

Cette définition exprime seulement le fait qu'un ensemble ne contient rien d'autre que ce qui
est spécifié par la donnée ses éléments.

L'unicité de certains ensembles est démontrée en utilisant conjointement l'axiome de sélection


et l'axiome d'extensionnalité.

A2. Axiome d'élémentarité ou axiome de la paire :

L'ensemble vide existe, il n'a aucun élément, son cardinal est noté 0; si est un objet, est
un ensemble appelé singleton (single = seul), son cardinal est 1. Si et sont des objets
distincts, est un ensemble appelé "paire", son cardinal est 2.

A3. Axiome de l'union :

Soient et deux ensembles. Il existe un ensemble dont les éléments sont exactement
ceux qui appartiennent à et à . Nous notons cela :

A4. Axiomes des parties :

Soit un ensemble. Il existe un autre ensemble dont les éléments sont exactement les parties
de . Il est noté :

A5. Axiome de l'infini :

130/2001
Sciences.ch 14/03/2005

Il existe un ensemble, dit "autosuccesseur" contenant (l'ensemble vide) tel que si


appartient à , alors appartient également à :

est autosuccesseur :

Cet ensemble permet d'utiliser des ensembles infinis. est ainsi le plus petit ensemble
autosuccesseur, au sens de l'inclusion et par convention nous notons
(ou nous construisons l'ensemble des naturels) :

A6. Axiome de régularité ou de fondation :

Pour tout ensemble non vide , il existe un ensemble , élément de tel qu'aucun élément
de ne soit élément de (il faut bien différencien le niveau du langage utilisé, un ensemble
et ses éléments n'ont pas le même statut) ce que nous notons :

Cet axiome élimine la possibilité d'avoir comme élément de lui-même.

En conséquence :

A7. Axiome de remplacement :

Quel que soit l'ensemble d'éléments et la relation binaire , il existe un ensemble


constitué des éléments tel que soit vraie. Si est une fonction, alors et
.

A8. Axiome de sélection (ou de compréhension) :

A tout ensemble et toute condition ou proposition , il correspond un ensemble


dont les éléments sont exactement les éléments de pour lesquels est vraie. C'est ce
que nous notons :

Cet axiome est primordial : le respect de ses conditions très strictes d'application permet
d'éliminer les paradoxes de la "théorie naïve des ensembles", comme le paradoxe de Russel ou
le paradoxe de Cantor qui ont invalidé la théorie naïve des ensembles.

Considérons par exemple l'ensemble de Russell de tous les ensembles qui ne s'auto-
contiennent pas (notez bien que nous donnons une propriété de sans expliciter quel est cet
ensemble) : . Le problème est de savoir si se contient ou non. Si ,

131/2001
Sciences.ch 14/03/2005

alors, s'auto-contient, et, par définition et inversement. Chaque possibilité est donc
contradictoire.

Si maintenant nous désignons par l'ensemble de tous les ensembles (l'Universel de Cantor),
nous avons en particulier : , ce qui est impossible (i.e. par exemple avec la
puissance du continu de l'ensemble de réels), d'après le théorème de Cantor.

Ces "paradoxes" (ou antinomies syntaxiques) proviennent d'un non respect des conditions
d'application de l'axiome de sélection : pour définir (dans l'exemple de Russel), il doit
exister une proposition qui porte sur l'ensemble , qui doit être explicité. La
proposition définissant l'ensemble de Russell ou celui de Cantor n'indique pas quel est
l'ensemble ; elle est donc invalide.

Un exemple fort symphatique et fort connu (c'est la raison pour laquelle nous le présentons)
permet de mieux comprendre (il s'agit du paradoxe de Russel) :

Un jeune étudiant se rendit un jour chez son barbier. Il engagea la conversation et lui demanda
s'il avait de nombreux concurrents dans sa jolie cité. De manière apparemment innocente, le
barbier lui répondit :"Je n'ai aucune concurrence. En effet, de tous les hommes de la cité, je ne
rase évidemment pas ceux qui se rasent eux-mêmes, mais j'ai le bonheur de raser tous ceux
qui ne se rasent pas eux-mêmes."

En quoi donc, une telle affirmation si simple put-elle mettre en défaut la logique de notre
jeune étudiant si malin ?

La réponse est en effet innocente, jusqu'au moment ou nous décidons de l'appliquer au cas du
barbier :

Se rase-t-il lui-même, oui ou non ?

Supposons qu'il se rase lui-même : il entre dans la catégorie de ceux qui se rasent eux-mêmes,
dont le barbier a précisé qu'il ne les rasait évidemment pas. Donc il ne rase pas lui-même.

Très bien ! Supposons alors qu'il ne se rase pas lui-même : il entre alors dans la catégorie de
ceux qui ne se rasent pas eux-mêmes, dont le barbier a précisé qu'il les rasait tous. Donc il se
rase lui-même.

Finalement, ce malheureux barbier est dans une position étrange : s'il se rase lui-même, il ne
se rase pas, et s'il ne se rase pas lui-même, il se rase. Cette logique est autodestructrice,
stupidement contradictoire, rationnellement irrationnelle.

Vient alors l'axiome de sélection :

Nous excluons le barbier de l'ensemble des personnes auxquelles s'applique la déclaration.


Car en réalité, le problème vient du fait que le barbier est un élément de l'ensemble de tous les
hommes de la cité. Ainsi, ce qui s'applique à tous les hommes ne s'applique pas au cas
individuel du barbier.

A9. Axiome du choix :

132/2001
Sciences.ch 14/03/2005

Les trois formulations ont équivalents :

- Le produit cartésien (voir plus loin une définition complète) d'une famille infinie
d'ensembles non vides est non vide

- Tout ensemble peut être bien ordonné (un ensemble ordonné par une relation d'ordre est
dit bien ordonné si toute partie non vide de contient un plus petit élément)

- Soit un ensemble non vide. Alors :

où est l'ensemble (ou l'espace) des fonctions (fonctions de choix de ) de


vers .

La théorie des ensembles basée sur les axiomes 1 à 7 est dite de Zermelo (Z). Complétée par
l'axiome 8, nous parlons de la théorie Zermelo-Fraenkel ou, plus simplement, la théorie ZF. Si
nous lui ajoutons l'axiome du choix, elle est dite ZFC ("C" comme choix - pour l'axiome du
même nom).

CARDINAUX

Définition : des ensembles sont dits "équipotents" s'il existe une bijection (correspondance
biunivoque) entre ces ensembles. Nous disons qu'ils ont alors même "cardinal".

Ainsi, plus rigoureusement, un cardinal (qui quantifie le nombre d'éléments contenus dans
l'ensemble) est une "classe d'équivalence" pour la relation d'équipotence.

Si nous écrivons en tant qu'égalité de cardinaux, nous entendons alors par là qu'il
existe deux ensembles équipotents et tels que :

et .

Les cardinaux peuvent êtres comparés. L'ordre ainsi défini est une relation d'ordre total entre
les cardinaux. Dire que signifie que est équipotent à une partie propre de , mais
n'est équipotent à aucune partie propre de .

Nous avons vu lors de notre étude des nombres, en particulier des nombres transfinis, qu'un
ensemble équipotent (ou en bijection) à était dit "dénombrable".

Voyons cette notion un petit peu plus dans les détails:

Soit un ensemble, s'il existe un entier tel qu'il y ait au moins à chaque élément de un
correspondant dans l'ensemble (nous parlons alors de bijection) nous disons alors
que le cardinal de , noté , est de "cardinal fini" et vaut .

Dans le cas contraire, nous disons que l'ensemble est de "cardinal infini" et nous posons :

133/2001
Sciences.ch 14/03/2005

Un ensemble de nombres est donc "dénombrable" s'il existe une bijection entre et .
Un ensemble de nombre est "au plus dénombrable" s'il existe une bijection entre et une
partie . Un ensemble au plus dénombrable est donc soit de cardinal fini, soit dénombrable.

Nous vérifions dès lors les propositions suivantes:

P1. une partie d'un ensemble dénombrable est au plus dénombrable.

P2. un ensemble contenant un ensemble non-dénombrable n'est lui aussi pas dénombrable

P3. Le produit de deux ensembles dénombrables est dénombrable

Remarque : nous pouvons restreindre un ensemble de nombres par rapport à l'élément nul et
aux éléments négatifs ou positifs qu'il contient et dès lors nous notons (exemple pour
l'ensemble des réels):

Ces notions étant analogues pour

Donc tout sous-ensemble infini de est équipotent à lui-même. En particulier, il y a


autant d'entier naturels pairs que d'entiers naturels quelconques (utiliser la bijection
) de vers , où désigne l'ensemble des entiers naturels pairs), autant
d'entiers relatifs que d'entiers naturels, autant d'entiers relatifs que de nombres rationnels (voir
le chapitre traitant des nombres pour les démonstrations).

Nous pouvons donc écrire:

et plus généralement, toute partie infinie de est dénombrable.

Un résultat important: tout ensemble infini possède donc une partie infinie dénombrable.

Puisque nous avons démontré dans le chapitre traitant des nombres que l'ensemble des réels
avait la "puissance du continu" et que l'ensemble des nombres naturels était de cardinal
transfini , Cantor souleva la question s'il existait un cardinal transfini entre et le
cardinal de ? Autrement dit, existe-il un ensemble infiniment grand qui serait intermédiaire
entre l'ensemble des nombres entiers et l'ensemble des réels?

134/2001
Sciences.ch 14/03/2005

Le problème se posa en notant bien évidemment le cardinal de et (nouveauté) le


cardinal de et en proposant de démontrer ou de contredire que:

selon la loi combinatoire qui donne le nombre d'éléments de l'ensemble que l'on peut obtenir à
partir de tous les sous-ensembles d'un ensemble (tel que nous l'avons démontré
précedemment).

Le reste de sa vie, Cantor essaya, en vain, de démontrer ce résultat que l'on nomma
"l'hypothèse du continu". Il n'y réussit pas et sombra dans la folie. En 1900, au congrès
international des mathématiciens, Hilbert estima qu'il s'agissait là d'un des 23 problèmes
majeurs qui devraient êtres résolus au XXème siècle.

Ce problème se résout d'une façon assez étonnante. D'abord, en 1938, un des plus grands
logiciens du XXème siècle, Kurt Gödel, démontra que l'hypothèse de Cantor n'était pas
réfutable, c'est-à-dire qu'on ne pourrait jamais démontrer qu'elle était fausse. Puis en 1963, le
mathématicien Paul Cohen boucla la boucle. Il démontra qu'on ne pourrait jamais non plus
démontrer qu'elle était vraie !!! Nous ne pouvons conclure à juste raison que Cantor avait
perdu la raison à chercher à démontrer une problème qui ne pouvait pas l'être.

PRODUIT CARTÉSIEN

Si et sont deux ensembles, nous appelons "produit cartésien de par " l'ensemble
noté (à ne pas confondre avec le produit vectoriel) formé de tous les couples possibles
où est un élément de et un élément de .

Autrement écrit:

Nous remarquons facilement que et ne sont pas les mêmes ensembles (sauf bien
sur si ).

Nous notons le produit cartésien de par lui même :

et nous disonsalors est "l'ensemble des couples d'éléments de ".

Nous pouvons effectuer le produit cartésien d'une suite d'ensemble et ainsi


obtenir "l'ensemble des n-uplets où .

Dans le cas où tous les ensembles sont identiques à , le produit cartésien


se note bien évidemment . Nous disons alors que est "l'ensemble des
n-uplets d'éléments de ".

Si et sont finis alors le produit cartésien est fini. De plus:

135/2001
Sciences.ch 14/03/2005

De là, nous voyons que si les ensembles sont finis alors le produit cartésien
est aussi fini et nous avons :

En particulier, si est un ensemble fini.

Quelques exemples:

1. Si est l'ensemble des nombres réels, est alors l'ensemble des couples de réels. Dans le
plan rapporté à un repère, tout point admet des coordonnées qui sont un élément de .

2. Lorque nous lançons deux dés dont les faces sont numérotées de 1 à 6, chaque dé peut être
symbolisé par l'ensemble . Le résultat d'un lancer est alors un élément de
. Le cardinal de est alors 36. Il y a donc 36 résultats possibles quand nous
lançons 2 dés dont les faces sont numérotées de 1 à 6.

BORNES

Soit un ensemble de nombres quelconques de façon à ce que (exemple particulier


mais fréquent) nous avons comme définitions:

D1. est appelé "borne supérieure" de l'ensemble , si pour s'il existe


un tel nombre , alors nous disons que admet une "borne supérieure".

D2. Soit . est appelé "plus petite borne supérieure" ou "majorant" noté :
de si est une borne supérieure de et si est une autre borne
supérieure quelconque de façon à ce que .

D3. Soit , est appelé "plus grande borne inférieure" ou "minorant"


de si est une borne inférieure de et si est une autre borne
inférieure quelconque de façon à ce que .

OPÉRATIONS ENSEMBLISTES

Soit , , des sous-ensembles (ou parties) d'un ensemble donné , appelé "Univers" (de
Cantonr). Nous désignons par l'ensemble des parties de .

Nous pouvons construire à partir d'au moins trois ensembles, l'ensemble des opérations (dont
nous devons les notations à Dedekind) existant dans le théorie des ensembles.

Remarque: certaines des notations présentes ci-dessous se retrouveront fréquemment dans des
théorèmes complexes, il est donc nécessaire de bien comprendre de quoi il en retourne.

136/2001
Sciences.ch 14/03/2005

Ainsi :

INCLUSION

Dans le cas le plus simple, nous avons :

En langage non spécialisé voici que qu'il faut lire:

est "inclus" (ou "fait partie", ou encore est un "sous-ensemble") dans alors pour tout
appartenant à chacun des ces appartient aussi à .

De ceci il en découle les propriétés suivantes:

P1. Si et alors cela implique = et réciproquement

P2. Si et alors cela implique

INTERSECTION

Dans le cas le plus simple, nous avons :

En langage non spécialisé voici que qu'il faut lire:

"L'intersection" des ensembles et consiste en l'ensemble des éléments qui se trouvent à


la fois dans et dans

Plus généralement, si est une suite d'ensembles indexés par , l'intersection des
est notée :

Cette intersection est définie par :

C'est-à-dire que l'intersection de la suite d'ensembles indexés comprend tous les qui se
trouvent dans chaque ensemble de tous les ensemble de la suite.

Soit deux ensembles et , nous disons qu'ils sont "disjoints" si et seulement si:

137/2001
Sciences.ch 14/03/2005

Définition : une collection d'ensembles non vides forment une "partition" d'un
ensemble si les propriétés suivantes sont vérifiées :

P1. et

P2.

Exemple : L'ensemble des nombres pairs et l'ensemble des nombres impairs forment une
partition de .

La loi d'intersection est une loi commutative (voir plus loin la définition du concept de
"loi") telle que:

RÉUNION

Dans le cas le plus simple, nous avons :

En langage non spécialisé voici que qu'il faut lire:

la "réunion" des ensembles et consiste en l'ensemble des éléments qui se trouvent dans
et en plus dans

Plus généralement, si est une suite d'ensembles indexés par , l'union des

est notée . Cette réunion est définie par:

C'est-à-dire que la réunion de la suite d'ensembles indexés comprend tous les pour lesquels
il existe un ensemble indexé par tel que soit inclus dans cet ensemble .

Nous avons les propriétés de distributivité suivantes:

138/2001
Sciences.ch 14/03/2005

La loi de réunion est une loi commutative (voir plus loin la définition du concept de "loi")
telle que:

Nous appellons par ailleurs "loi d'idempotence" les relations (je précise cela pour la culture
générale):

et "lois d'absorption" les lois:

Les loi de réunion et d'intersection sont associatives telles que:

et distributives telles que:

DIFFÉRENCE

Dans le cas le plus simple, nous avons :

En langage non spécialisé voici que qu'il faut lire:

La "différence" des ensembles et consiste en l'ensemble des éléments qui se trouvent


uniquement dans (et qui excluent dont les éléments de ).

Si nous nous rappellons du concept de "cardinal" (voir plus haut), nous avons avec les
opérations précédemment définies, la relation suivante:

d'où:

DIFFÉRENCE SYMÉTRIQUE

139/2001
Sciences.ch 14/03/2005

Soit un ensemble. Pour tout nous définissons la différence symétrique


entre et par :

En langage non spécialisé voici que qu'il faut lire:

La "différence symétrique" des ensembles et consiste en l'ensemble des éléments qui se


trouvent uniquement dans et de ceux se trouvant uniquement dans (nous laissons donc
de côté les éléments qui sont communs)

Les propriétés triviales sont les suivantes :

P1.

P2.

P3.

PRODUIT

Dans le cas le plus simple, nous avons :

En langage non spécialisé voici que qu'il faut lire:

Le produit (à ne pas confondre avec la multiplication ou le produit vectoriel) de deux


ensembles et est l'ensemble des couples tels que .

Nous retrouvons ici le concept de "produit scalaire" que nous avions défini avant.

ENSEMBLE VIDE

Nous notons l'ensemble vide:

Nous avons également que l'extérieur de l'Univers est un ensemble vide de tout élément.

De ce qui a été déjà vu jusqu'à maintenant nous pouvons facilement développer les propriétés
suivantes pour des ensembles abstraits:

Une "partition" d'un ensemble est une famille d'ensembles de tels que:

140/2001
Sciences.ch 14/03/2005

COMPLÉMENTARITÉ

Dans le cas le plus simple, nous avons :

En langage non spécialisé voici que qu'il faut lire :

Le "complémentaire" du sous-ensemble consiste en tous les qui sont compris dans


l'Univers des sous-ensembles mais qui ne sont pas compris dans .

Une autre notation très importante de la complémentarité et est la suivante: ou


simplement .

Nous avons comme propriétés:

Voici quelques lois triviales relatives aux compléments:

Il existe d'autres lois très importantes en logique booléenne (voir le chapitre de systèmes
numériques formels dans la section d'informatique théorique du site pour la démonstraiton)
nommées "loi de De Morgan" et qui sont données par les relations :

FONCTIONS

141/2001
Sciences.ch 14/03/2005

Nous parlons d'une "application" ou "fonction" (Euler et Gauss en ont donné de jolies
définitions) lorsque nous faisons référence à une suite d'opérations mathématiques sur un ou
plusieurs éléments d'un ensemble amenant à un résultat d'éléments compris dans le même
ensemble ou non.

Plus rigoureusement et traditionnellement nous avons pour habitude de définir les concepts
suivants :

D1. Une "fonction" est en général une opération mathématique (souvent notée ) sur une ou
plusieurs variables ( ) d'un ensemble vers un ensemble ( ) noté :

D2. Etant donnés trois ensembles , et (non vides), toute fonction de vers
est appelée "loi de composition de à valeurs dans ".

D3. Une "loi de composition interne" (ou simplement "loi interne") dans est une loi de
composition de à valeurs dans (cas ).

Remarque : la soustraction dans n'est pas une loi de composition interne bien qu'elle fasse
partie des quatre opérations élémentaires apprises à l'école. Par contre l'addition sur en est
biens une.

D4. Une loi de "composition externe" (ou simplement "loi externe") dans est une loi de
composition de à valeurs dans , où est un ensemble distinct de . En général,
est un corps, dit "corps de scalaires"

Exemple : Dans le cas d'un espace vectoriel (voir définition beaucoup plus bas) la
multiplication d'un vecteur (dont les composante se basent sur un ensemble donné) par un
réel.

Remarque : Une loi de composition externe à valeurs dans E est aussi appelée action de F sur
E.
L'ensemble F est alors le domaine d'opérateurs. On dit aussi que F opère sur E (ayez en tête
l'exemple des vecteurs précédemment cité)

Ces deux dernières définitions sont importantes car elles englobent le concept de structures
algébriques que nous verrons un peu plus loin.

D5. Soient deux ensembles. Nous disons que l'application est dite
"application linéaire" si et seulement si :

et nous notons l'ensemble des applications linéaires de dans .

Remarque : nous referrons cette définition plus rigoureusement lorsque nous présenterons le
concept "d'homomorphisme" plus loin car il nous mansque le concept de K-ev pour l'instant..

142/2001
Sciences.ch 14/03/2005

D6. Soient deux ensembles, . Nous appelons "image de ", et nous notons
, le sous-ensemble défini par :

et nous appelons "noyau de ", et nous notons , le sous-ensemble défini par :

Selon la figure :

Remarques :

R1. provient de l’allemand "Kern", signifiant tout simplement "noyau". En anglais, le


noyau se dit aussi "kernel", signifiant "amande" dans le civil.

R2.Une "application" est un opérateur mathématique qui agit sur une fonction (ainsi, la
dérivée est une application sur une fonction d'un ensemble vers un ensemble ) il faut
donc prendre garde au langage utilisé.

Cependant, les fonctions peuvent avoir une quantité phénoménale de propriétés dont voici
celles qui font partie des connaissances générales du physicien (pour plus de renseignement
sur ce qu'est une fonction, voir le chapitre traitant de l'analyse fonctionnelle dans la section
d'algèbre).

Soit une fonction d'un ensemble à un ensemble alors nous avons les propriétés
suivantes :

P1. Une fonction est dite "surjective" si :

Tout élément de est l'image par d'au moins (nous insistons sur le "au moins") un
élément de , la fonction est alors dite "surjective". Nous disons encore que c'est une
"surjection" de dans . Il découle de cette définition, qu'une fonction est
surjective si et seulement si . En d'autres termes nous écrivons aussi cette définition

143/2001
Sciences.ch 14/03/2005

ainsi :

P2. Une fonction est dite "injective" si :

Tout élément de est l'image par d'au plus (nous insistons sur le "au plus") d'un seul
élément de , l'application est dite "injective". Nous disons encore que est une
injection de dans . Il résulte de cette définition, qu'une fonction est injective
si et seulement si les relations et impliquent autrement dit :
une application pour laquelle deux éléments distincts ont des images distinctes est dite
injective. En d'autres termes, une fonction est injective si l'une des propriétés équivalents
suivantes est vérifiée :

P2.1

P2.2

P2.3 l'équation en x, a au plus une solution dans E

P3. Une fonction est dite "bijective" si :

Une application de dans est à la fois surjective et injective; nous disons aussi que
c'est une "bijection" de dans . Dans ce cas, nous avons que pour tout élément de
de l'équation admet dans une unique (ni "au plus", ni "au moins") pré-image .
Ce que nous écrivons aussi :

Nous sommes ainsi tout naturellement amené à définir une nouvelle application de dans
, appelé "fonction réciproque" de et notée , qui a tout élément de , fait
correspondre l'élément de pré-image unique de l'équation . Autrement dit:

L'existence d'une fonction réciproque implique que graphique d'une fonction bijective et celui
de son application réciproque sont symétriques par rapport à la droite d'équation .

Effectivement, nous remarquons que si est équivalent à . Ces équations


impliquement que le point est sur le graphique de si et seulement si le point est
sur le graphique de .

Remarque . il vient des définitions ci-dessus qu'une fonction bijective (ou "biunivoque") si
et seulement si toute droite horizontale coupe la représentation graphique de la fonction en un
seul point. Nous pouvons donc amener à faire la seconde remarque suivante :

144/2001
Sciences.ch 14/03/2005

Une fonction qui vérifie le test de la droite horizontale est continuement croissante ou
décroissante en tout point de son domaine de définition.

P4. Une fonction est dite "composée" si :

Soit une fonction de dans et une fonction de dans . La fonction qui associe
à chaque élément de l'élément de , de s'appelle "fonction composée" de et
de et se note .

Le symoble " " est appelé "rond". Ainsi, la relation précédente ce lit "psi rond phy". Ainsi:

Soit, de plus, une fonction de dans . Nous vérifions aussitôt que l'opération de
composition est associative:

Cela nous permet d'omettre les parenthèses et d'écrire plus simplement:

Dans le cas particulier où serait une application de dans , nous notons


l'application composée (k fois).

Ce qui est important dans ce que nous venons de voir dans ce chapitre, c'est que toutes les
propriétés définies et énoncées ci-dessus sont applicables aux ensembles de nombres.

Voyons en un exemple très concret et très puissant:

THÉORÈME DE CANTOR-BERNSTEIN

Attention. Ce théorème, dont le résultat est évident dans un premier abord, n'est pas simple à
aborder. Nous vous conseillons de lire très lentement et de vous imaginer les diagrammes
sagittaux dans la tête.

Hypothèse à démontrer: soit et deux ensembles. S'il existe une injection (voir la
définition d'une fonction injective ci-dessus) de vers et une autre de vers , alors les
deux ensembles sont en bijection (voir la définition d'une fonction bijective ci-dessus).

Pour la démonstration, nous avons besoin de démontrer au préalable un lemme dont l'énonce
est le suivant:

Soit trois ensembles tels que . Si et sont en bijection, alors et


sont en bijection.

Démonstration du lemme:

D'abord, au niveau formel, créons une fonction que nous créons telle quelle soit bijective:

145/2001
Sciences.ch 14/03/2005

Nous avons besoin maintenant de définir l'ensemble par les images de l'union des fonctions
des fonctions (du genre ) des pré-images de l'ensemble dont nous excluons
les éléments de (ce que nous notons ). Ce que nous noterons donc:

Nous avons alors bien évidemment (faire un schéma de tête des diagramme sagittaux peut
aider à ce niveau là):

Nous pouvons démontrer élégamment cette dernière relation:

(sympathique n'est-ce pas…).

Comme peut être partitionné en et , nous posons comme une


définition la fonction telle que:

tel que pour toute pré-image nous ayons:

(rappelez-vous de la définition des fonction notées " ") et:

Au fait, il faut y comprendre ceci: toute pré-image se situant dans et donc pas
dans à une image qui n'est pas identique à un quelconque élément de tel que l'image de
soit donné par une fonction mais où il est impossible que (vous suivez
toujours?). Le seconde injection dit simplement que toute pré-image se situant dans à
uniquement pour image lui-même (si la définition de l'application contredisait cette
dernière écriture, nous ne pourrions pas construire ).

L'application est alors bijective car ses restrictions à et , (qui forment


une partition) sont et l'identité qui sont par définition bijectives.

Finalement il existe bien, par construction, une bijection entre et .

Reprenons les hypothèses du théorème :

Soit une injection de vers et une injection de vers

146/2001
Sciences.ch 14/03/2005

Nous avons alors:

et

donc:

Comme est injective, et sont par définition en bijection et de même, comme


est injective, et sont en bijection (là il est bon de relire…).

Donc: et sont eux aussi en bijection

En utilisant le lemme sur et (donc en analogie avec ), il vient


donc que est en bijection ce qui nous donne avec ceux que nous avons vu juste
précédemment, que puisque aussi et sont en bijection, alors que est en
bijection avec , alors et sont en injection (ouf! c'est beau mais c'est aussi vicieux
que simple).

STRUCTURES ALGÈBRIQUES

L'algèbre dite "moderne" commence avec la théorie des structures algébriques due en partie à
Carl F. Gauss et surtout à Évariste Galois.

Soit pour simplifier les écritures, une loi de composition (comme l'addition, la soustraction,
la multiplication ou encore la division,...). Si est une loi de composition (ou application)
interne dans un ensemble de nombres (comme ) à , nous la notons comme
nous l'avons déjà vu :

Définitions: soit et des symboles de lois (cela pourrait être l'addition et la multiplication
pour prendre le cas le plus connu). Nous définissons que :

D1. est commutative si :

D2. est associative si :

D3. est élément neutre pour si :

D4. est le "symétrique" (dans le sens génénéral de l'opposé par exemple pour l'additon et
l'inverse pour la multiplication) de pour si :

D5. est "distributive" par rapport à si :

Remarques:

147/2001
Sciences.ch 14/03/2005

R1. Si est son propre symétrique par rapport à la loi , les mathématiciens disent que est
"involutif"

R2. Si un élément de vérifie , alors est dit "absorbant" pour la loi .

Exemple : dans le magma multiplicatif (voir la définition de magma juste en dessous) ,


0 est absorbant.

R3. il faut toujours vérifier que les neutres et les symétriques le soient "à gauche" et "à
droite". Ainsi, par exemple, dans , l'élément 0 n'est un neutre qu'à droite car
mais

MAGMA

Définition : nous désignons un ensemble de nombres par le terme "magma" M , si les


composants le constituant sont opérables par rapport une loi interne . :

est un magma si

Remarques :

R1. Si la loi interne est commutative, nous parlons de "magma commutatif"

R2. Si la loi interne est assiocative, nous parlons de "magma assiocatif"

R3. Si la loi interne possède un élément neutre, nous parlons de "magma unitaire"

Il est donc important de se rappeler que si nous désignons une structure algébrique par le
terme "magma" tout court cela signifie en aucun cas que le loi interne est commutative,
associative ou même qu'elle possède un élémenet neutre !

Définition : Dans un magma , un élément x est dit "régulier" (ou "simplifiable") à


gauche si pour tout couple nous avons :

Remarque : nous définition de même un élément régulier à droite.

Ainsi, un élément est dit "régulier" s'il est régulier à droite et à gauche. Si * est commutative
(ce qui est le cas pour un magma commutatif), les notions d'élément réguler à gauche ou à
droite coïncident.

Exemple : dans tout élément est régulier et dans tout élément non nul est
régulier.

Un magma est donc une structure algébrique élémentaire. Il existe des structures plus
subtiles (monïdes, groupes, anneaux, corps, espace vectoriels, etc.) dans lesquelles un

148/2001
Sciences.ch 14/03/2005

ensemble de nombres est muni de plusieurs lois et de différentes propriétés. Nous allons les
voir de suite et les utiliser tout au long de ce site.

MONOÏDE

Définition : si la loi est associative et possède un élément neutre nous disons alors que le
"magma associatif unitaire" est un "monoïde" :

est un monoïde si

Remarquess :

R1. Si la loi interne est en plus commutative alors nous disons alors que la structure forme
un "monoïde abélien" (ou simplement "monoïde commutatif").

R2. Dans certains ouvrage nous trouvons aussi comme définition que le monoïde est un
"demi-groupe" (avec une loi associative) muni d'un élément neutre.

Montrons tout de suite que l'ensemble des entiers naturels est un monoïde abélien
totalement ordonné (comme nous l'avons partiellement vu dans le chapitre des opérateurs) par
rapport aux lois d'addition et de multiplication :

La loi d'addition ( + ) est-elle une opération interne telle que nous ayons :

Nous pouvons démontrer que c'est bien le cas en sachant que 1 appartient à tel que :

Donc et l'addition est bien une loi interne (nous disons également que l'ensemble est
"stable" par rapport à l'addition) et en même temps associative puisque 1 peut être additionné
à lui-même par définition dans n'importe quel ordre sans que le résultat en soit altéré. Si vous
vous rappelez que la multiplication est une loi qui se construit sur l'addition, alors la loi de
multiplication ( x ) est aussi une loi interne et associative !

Nous admettrons à partir d'ici qu'il est trivial que la loi d'addition est également commutative
et que le zéro "0" en est l'élément neutre ( ). Ainsi, la loi de multiplication est elle aussi
commutative et il est trivial que "1" en est l'élément neutre ( ).

- Existe t'il pour la loi d'addition ( + ) un symétrique tel que nous ayons:

avec ?

149/2001
Sciences.ch 14/03/2005

Il est assez trivial que pour que cette égalité soit satisfaite nous ayons:

or les nombres négatifs n'existent pas dans . Ce qui nous amène aussi à la conclusion que la loi
d'addition ( + ) n'a pas de symétrique et que la loi de soustraction ( - ) n'existe pas dans (la
soustraction étant rigoureusement l'addition d'un nombre négatif).

- Existe t'il pour la loi de multiplication ( x ) un symétrique tel que nous ayons :

avec ?

D'abord il est évident que:

Mais excepté pour , le quotient n'existe pas dans . Donc nous devons conclure qu'il
n'existe pas pour tout élément de de symétriques pour la loi de multiplication et ainsi que la
loi de division n'existe pas dans .

Synthèse :

(lois) (+) (-) (x) (/)


Opération
oui oui
interne
Commutative oui oui
- -
oui (un
Elément neutre oui (zéro "0")
"1")
Symétrique - -

Remarque : le "-" signifie que cette propriété n'existe pas dans l'ensemble considéré

P1. est totalement ordonné

P2. et un monoïde abélien

P3. L'élément zéro "0" est l'élément absorbant pour le monoïde

P4. Le monoïde abélien est distributif par rapport aux lois ( + ) et ( x )

P5. Les lois de soustraction et division n'existent pas dans l'ensemble

150/2001
Sciences.ch 14/03/2005

P6. est un monoïde abélien totalement ordonné par rapport aux lois d'addition et de
multiplication :

Remarques:

R1. Il est rare d'utiliser les monoïdes; car souvent, lorsque nous nous trouvons face à une
structure trop pauvre pour pouvoir vraiment discuter, nous la prolongeons vers quelque chose
de plus riche, comme un groupe, ou un anneau (voir plus loin) tel que l'ensemble des entiers
relatifs.

R2. Dire qu'une structure algébrique est totalement ordonnée par rapport à certaines lois
signifie que soit une loi, et une relation d'ordre et quatre éléments de la strucutre
intéressée, alors si et implique . Nous notons alors cette structure
ou simplement et en indiquant la (ou les) loi concernée.

GROUPES

Définition : nous désignons un ensemble de nombres par le terme "groupe", si les composants
le constituant satisfont aux 3 conditions (la quatrième étant que le groupe possède une loi
commutative interne) de ce que l'on nomme la "loi interne de groupe", définie ci-dessous:

est un groupe si

Remarque : il y a des groupes particuliers tels que si:

- la loi interne est également commutative. Nous disons alors que le groupe est
"abélien" (ou simplement "commutatif")

- il existe dans un élément tel que tout élément de est une puissance de ou du
symétrique de , nous disons que est un "groupe cyclique" s'il est fini, sinon nous
disons qu'il est "monogène". Plus généralement un groupe d'élément neutre , non
réduit à sera monogène, s'il existe un élément a de distinct de tel que
. Un tel groupe sera cyclique, s'il existe un entier non nul pour lequel
. Le plus petit entier non nul vérifiant cette égalité est alors l'ordre du groupe.

Exemple :

Montrons tout de suite que l'ensemble des entiers relatifs est un groupe abélien totalement
ordonné (comme nous l'avons vu dans le chapitre des opérateurs) par rapport aux lois
d'addition et de multiplication.

D'abord pour raccourcir les développements, il est utile de rappeler que l'ensemble est un
"prolongement" par le fait que nous y avons ajouté tous les nombres symétrique de signe
négatif ( ). Ainsi :

151/2001
Sciences.ch 14/03/2005

forme un groupe abélien totalement ordonné

forme un monoïde abélien totalement ordonné

La loi de division n'existant pas pour tout élément de l'ensemble .

Synthèse :

(lois) (+) (-) (x) (/)


Opération interne oui oui oui
Associative oui oui oui
Commutative oui oui oui -
Elément neutre oui (zéro "0") oui (zéro "0") oui (un "1")
Symétrique oui (signe opposé) oui (signe opposé) -

P1. est totalement ordonné

P2. est un monoïde abélien dont zéro "0" est l'élément absorbant

P3. La loi de division n'existe pas dans l'ensemble

P4. L'ensemble est un groupe abélien totalement ordonné par rapport aux lois d'addition et
de soustraction et de multiplication :

P5. L'ensemble est un monoïde abélien totalement ordonné par rapport à la loi de
multiplication :

Nous voyons de suite que a des propriétés trop restreintes, c'est la raison pour laquelle il
est intéressant de le prolonger par l'ensemble des rationnels défini par (rappel):

et nous avons évidemment:

Il est dès lors évident (sans démonstration) que est aussi totalement ordonné et aussi
que est un groupe abélien totalement ordonné par rapport aux lois d'addition et de
soustraction .

152/2001
Sciences.ch 14/03/2005

Ce qui devient intéressant avec , c'est que les lois de multiplication et de division
deviennent des lois internes et forment un groupe abélien commutatif par rapport à .

- Démonstration que le symétrique existe pour la loi de multiplication ( x ) tel que:

Puisque dans tout nombre peut se mettre sous la forme:

avec

Alors puisque:

Il existe donc un symétrique à tout rationnel dans pour la loi de multiplication.

- Par définition la division existe dans et est une opération interne. Mais est-elle
associative telle que pour nous ayons:

Au fait, la démonstration est assez triviale si nous nous rappelons que la division se définit à
partir de la loi de multiplication par l'inverse et que cette dernière loi est commutative. Ainsi,
il vient :

Donc la loi de division n'est pas associative dans .

- Est-ce que la loi de division ( / ) est cependant commutative tel que la relation:

pour ?

Nous voyons très bien que cela n'est pas le cas puisque nous pouvons écrire cette dernière
relation sous la forme:

153/2001
Sciences.ch 14/03/2005

Synthèse:

(lois) (+) (-) (x) (/)


Opération
oui oui oui oui
interne
Associative oui oui oui non
Commutative oui oui oui non
Elément neutre oui (zéro "0") oui (zéro "0") oui (un "1") oui (un "1")
oui (singe oui (singe
Symétrique oui (l'inverse) oui (l'inverse)
opposé) opposé)

P1. est totalement ordonné

P2. sont indépendammnets des groupes abéliens totalement ordonnés.

P3. Zéro "0" est l'élément absorbant par rapport groupe

P4. est un monoïde

P5. L'ensemble est un groupe abélien totalement ordonné par rapport aux lois d'addition,
de soustraction et de multiplication que nous notons :

Les mêmes propriétés sont applicables à et à mais à la différence que ce dernier n'est
pas ordonnable.

Cependant, il peut être compréhensible que pour vous soyez sceptiques. Développons donc
tout cela:

Nous devons nous assurer que la somme, la différence, le produit et le quotient de deux
nombres de la forme donne quelque chose d'encore de cette forme.

Additionnons les nombres et où , , et sont des réels :

Donc l'addition est bien une loi interne commutative et associative pour laquelle il existe un
élément neutre et symétrique dans l'ensemble des complexes.

Soustrayons les nombres et où , , et sont ici encore, des réels :

Donc la soustraction est une opération interne commutative et associative pour laquelle il
existe un élément neutre et symétrique dans l'ensemble des complexes.

154/2001
Sciences.ch 14/03/2005

Multiplions maintenant les nombres et où , , et là toujours, des réels.


Pour parvenir à nos fins, nous emploierons la distributivité de la multiplication par rapport à
l'addition.

Donc la loi de multiplication est bien une opération interne commutative, associative et
distributive (!)pour laquelle il existe un élément neutre et symétrique (voir ci-après) dans
l'ensemble des complexes.

Une division est avant tout une multiplication par l'inverse. Prouver qu'il existe un inverse
c'est prouver qu'il existe un symétrique pour la multiplication. Inversons donc le nombre
où et y sont des réels.

Donc l'inverse (et la division) d'un nombre complexe est bien une opération interne non
associative et non commutative pour laquelle il existe un élément neutre et symétrique.

Voyons un exemple de groupe cyclique : Dans , considérons muni de la


multiplication usuelle des nombres complexes: est évidemment un groupe abélien. Un
tel groupe est aussi monogène car engendré par les puissances d'un de ses éléments : (ou
bien ). Ce groupe monogène étant fini, il s'agit alors d'un groupe cyclique.

ANNEAUX

Définition : nous désigons un ensemble de nombres par le terme "anneau" si :

est un Anneau

Remarques :

R1. L'élément neutre de la loi interne + est noté "0" et appelé "zéro" de l'anneau.

R2. Nous rencontrons aussi des anneaux non-commutatifs dans lequel la relation de
commutativité n'est pas imposée, il faut alors renforcer la propriété de l'élément neutre en
imposant à 1 d'être un élément neutre à la fois à droite et à gauche : (un exemple
d'anneau non-commutatif est fourni par l'ensemble des matrices à coefficients dans un
anneau , par exemple - voir chapitre d'algèbre linéaire).

Il y a des anneaux particuliers tels que si :

155/2001
Sciences.ch 14/03/2005

- la loi interne est également commutative, l'anneau est "commutatif" (c'est important car il
existe des anneaux d'opérateurs non-commutatifs!)

- s'il existe dans un élément neutre pour la loi interne , et que cet élément neutre est
l'unité "1" nous disons alors que l'anneau est "unitaire" et 1 est appelé "unité" de l'anneau.
Nous parlons alors "d'anneau commutatif unitaire"

- , quels que soient les éléments de , l'anneau est dit


"intègre" ou "sans diviseurs de zéro" (dans le cas contraire il est bien évidemment "non
intègre").

- lorsque l'anneau est composée d'éléments irréductibles par rapport aux autres éléments
(nombre premiers par exemple) nous parlons "d'anneau factoriel".

Définitions :

D1. Un élément a d'un anneau A est une "unité" s'il existe tel que . Si un tel
b existe il est unique (nous en avons vu un exemple lors de notre étude des classes de
congruence en théorie des nombres).

D2. Soit A un anneau. Nous disons que A possède des diviseurs de zéro s'il existe
avec et . Les éléments a et b sont appelés des "diviseurs de zéro".

Remarques :

R1. Il est clair qu'un anneau est intègre si et seulement si il ne possède aucun diviseur de zéro.

R2. Les notions d'unité et de diviseurs de zéro sont incompatibles mais un élément d'un
anneau peut être ni l'un ni l'autre. Ces le cas, par exemple, de tous les entiers dans
. Ce ne sont ni des unités, ni des diviseurs de zéro.

Nous verrons un exemple important d'anneau lors du cadre de notre étude des polynômes
(voir chapitre de calcul algébrique) mais nous en avons déjà vu de très importants lors de
notre étude des classes de congruences dans le chapitre de théorie des nombres.

Voyons quelques exemples d'anneaux : lors de notre étude des groupes nous avons trouvé que
les structures :

sont des groupes abéliens totalement ordonnés.

La loi de division n'état en aucun cas associative, nous pouvons nous restreindre à étudier
pour chacun des groupes précités, le couple de lois: (+) et ( x ).

Ainsi, il vient très vite que:

constituent des anneaux commutatifs unitaires.

156/2001
Sciences.ch 14/03/2005

Et même mieux:

sont des anneaux commutatifs unitaires et intègres.

Remarque : nous considérerons comme évident qu'à ce niveau du discours que le lecteur aura
remarqué que est un "sous-anneau" de (dans le sens où les opérations définies sont
internes à chacun des ensembles et que les éléments neutres et identité sont identiques et qu'il
existe pour chaque élément de ces ensembles un opposé qui est dans le même ensemble).

Soit A un anneau, nous avons les propriétés suivant :

P1.

P2.

P3.

Démonstrations :

D1. La propriété P1 découle de la définition D4 des structures algébriques (tout élément


possède un opposé/symétrique). En effet, nous pouvons additionner à l'égalité
l'élément –a. Nous obtenons alors par l'existence de l'opposé cela
donne d'où

D2. La propriété P2 découle des définitions D3 (existence de l'élément neutre), D4 (existence


de l'opposé/symétrique), D5 (distributivité par rapport à l'autre loi) ainsi que de la propriété
P1 ci-dessus. En effet, nous avons :

Nous avons donc et (selon D3). La propriété P3 ci-dessus permet de


conclure que (nous pourrions discuter de la pertinence de ce genre de
démonstration…)

D3. La propriété P3. se montre à l'aide de P2. Nous avons :

en ajoutant –a à cette dernière égalité, nous avons

SOUS-ANNEAU

Définition : Soit A un anneau et un sous-ensemble de A. Nous disons que S est un


"sous-anneau" de A si :

P1. (élément neutre de A est aussi dans S)

157/2001
Sciences.ch 14/03/2005

P2.

P3.

P4.

Exemple : l'anneau est un sous-anneau de

CORPS

Définition : nous désignons un ensemble de nombres par le terme "corps" si :

est un corps si

Donc un corps est un anneau non nul dans lequel tout élément non nul est inversible ou en
d'autre termes : un anneau commutatif dont tous les éléments non nuls sont des unités est
appelé un "corps".

Remarque : si la loi interne est également commutative, le corps est dit "commutatif"

Voyons des exemples de corps parmi les anneaux unitaires suivant :

Il nous faut d'abord déterminer lesquels ne constituent pas des groupes par rapport à la loi
interne de multiplication ( x ).

Comme nous l'avons déjà vu dans notre étude des groupes précédemment, il est évident qu'il
nous faut éliminer .

Ainsi, les corps fondamentaux de l'arithmétique sont:

et puisque la loi de multiplication ( x ) est commutative dans ces ensembles, nous pouvons
affirmer que ces corps sont également des corps commutatifs.

ESPACES VECTORIELS

Lorsque nous définissons un "vecteur" (voir chapitre de calcul vectoriel), nous faisons
habituellement référence à un "espace euclidien" (voir aussi chapitre de calcul vectoriel) de n
dimensions de . Cependant, la notion d'espace vectoriel est beaucoup beaucoup plus vaste
que ce dernier qui ne représente qu'un cas particulier.

Définition : un "espace vectoriel (E.V.)" ou "K-espace vectoriel" (abrégé : K-ev) sur le corps
K (nous prendrons fréquemment pour ce corps ou ) est un ensemble possédant
les propriétés :

158/2001
Sciences.ch 14/03/2005

Cette loi externe doit vérifier (nous omettons les flèches sur les symboles x,y représentant les
vecteurs pour l'instant tant que nous n'aurons pas aborder le chapitre de calcul vectoriel) que
les propriétés suivantes :

P1. (opération interne avec la loi externe)

P2. (associativié sur la loi externe)

P3. (distributivité sur la loi externe)

P4. (distributivité sur la loi externe)

P5. (élément neutre sur la loi externe)

Remarques :

R1. Nous disons alors que l'espace vectoriel à une "structure algébrique vectorielle" et que ces
éléments sont des "vecteurs", les éléments de des "scalaires".

R2. Les opération respectives sont fréquemment l'addition et la mutiplication traditionnelles.

R3. Dorénavant, pour distinguer les éléments du corps et de l'ensemble , nous noterons
ceux de par des lettres grecques et ceux de par des lettres latines majuscules.

R4. Outre les cinq propriétés énumérées ci-dessus, il ne faut pas oublier d'ajouter les cinq
autres propriétés du groupe abélien (opération interne, commutativité, associativité, élément
neutre, élément inverse). Ce qui nous fait donc au total dix propriétés à respecter.

Il est inutile de démontrer que ces propriétés sont respectées pour et, par conséquent pour
. Nous pouvons cependant nous poser la question à propos de certains sous-ensembles de
. Par exemple, considérons la région rectangulaire illustrée dans la figure (a) (et en
perspective dans la figure (c)) ci-dessous :

159/2001
Sciences.ch 14/03/2005

Ce sous-ensemble de n'est pas un espace vectoriel car, entre autres, la propriété


d'opération interne du groupe abélien n'est pas satisfaite. En effet, si nous prenons deux
vecteur à l'intérieur du rectangle et que nous les additionnons, il se peut que le résultat sorte
du rectangle. Par contre, il est facile de voir que la droite (infinie) illustrée dans la figure (b)
respecte toutes les propriétés énumérées précédemment et, par conséquent, défini un espace
vectoriel. Notons bien, cependant, que cette droite se doit de passer par l'origine, sinon la
propriété d'élément neutre du groupe abélien ne serait pas respectée (l'élément neutre
n'existant plus).

Un autre exemple d'un espace vectoriel est l'ensemble des polynômes de degré deux ou
moins (voir chapitre de calcul algébrique pour plus de détails). Par exemple, deux éléments de
cet espace sont :

Cet ensemble respecte les 10 propriétés d'un espace vectoriel. En effet, si nous additionnons
deux polynômes de degré deux ou moins, nous obtenons un autre polynôme de degré deux ou
moins. Nous pouvons aussi multiplier un polynôme par un scalaire sans changer l'ordre (ou
degré) de celui-ci, etc. Nous pouvons donc représenter un polynôme par des vecteurs dont les
termes sont les coefficients du polynôme.

Mentionnons que nous pouvons aussi former des espaces vectoriels avec des ensembles de
fonctions plus générales que des polynômes. Il importe seulement de respecter les dix
propriétés fondamentales d'un espace vectoriel !

Ainsi défini, un espace vectoriel sur est une action de sur qui est
compatible avec la loi de groupe (par extension un "automorphisme" - voir la définition plus
loin - sur ).

Définition : Soit E un espace vectoriel, nous appelons "sous-espace vectoriel (abrégé : SEV)"
de E un sous-ensemble de E si et seulement si :

ALGÈBRES

Définition : est une "algèbre" (dit aussi " -algèbre") sur un corps commutatif C si et
seulement si:

est un algèbre si

Remarque : nous allons de suite voir plus bas ce qu'est un homomorphisme d'anneau

160/2001
Sciences.ch 14/03/2005

Exemple : est un -algèbre (un nombre complexe pouvant être vu comme un vecteur à
deux composantes)

HOMOMORPHISMES

Le concept d'homomorphismes (du grec homoios = semblable et morphê = forme)a été défini
par les mathématiciens car permettant de mettre en évidence des propriétés remarquables des
fonctions en particuler avec leurs structures, leur noyau, et de ce que nous appelons les
"idéaux" (voir plus loin). Ils nous permettront ainsi d'identifier une structure algébrique à une
autre ou de découvrir des propriétés nouvelles comme nous le verrons pas la suite.

Remarque : un excellent exemple d'application pratique dans le vie courant sera montré dans
le chapitre de cryptographie où nous utilisons le fait que pour crypter des informations une
fonction appelée "fonction phi d'Euler" est un homomorphisme (et il nous faudra le
démontrer).

Définitions :

D1. Si et sont deux magmas (peu importe la notation utilisé pour les lois
internes), une application f de A dans B est un "homomorphisme" ou "morphisme" (par abus
de langage nous écrivons parfois aussi "homorphisme" par flegme) si :

en d'autres termes, si l'image d'un composé dans A est le composé des images dans B.

D2. Si et sont deux monoïdes, une application f de A dans B est un


"homomorphisme de monoïde" si :

où sont les éléments neutres respectifs des monoïdes A,B .

D3. Si sont deux anneaux, un "homomorphisme d'anneaux" de dans est une


application telle que nous ayons pour tout :

où sont les éléments neutres des anneaux par rapport à la multiplication.

Soit un homomorphisme d'anneaux. Alors :

P1.

161/2001
Sciences.ch 14/03/2005

P2.

P3. Si a est une unité de A, alors est une unité de B et

Démonstrations :

DM1. Par , nous avons . Ajoutant des


deux côtés de l'égalité, nous obtenons

DM2. La propriété P2 découle aussi de et la propriété P1. En effet,


nous avons . En additionnant aux deux côtés
de la dernière égalité, nous obtenons .

DM3. Soient tel que . Alors par et , nous


avons et de même ce qui montre que est
l'inverse de si b est l'inverse de a.

Théorème : un homomorphisme d'anneaux est injectif si et seulement si l'élément


0 est la seul pré-image de 0, autrement dit si :

Démonstration : la condition est clairement nécessaire. Montrons qu'elle est suffisante. Nous
supposons donc que . Soit tel que . Alors
ceci implique que donc que ce qui montre que
f est injectif.

D4. Soient et , deux groupes et f une application . Nous disons que f


est un "homomorphisme de groupe" si :

où sont les éléments neutres respectifs des groupes A,B .

D5. Soient f une application d'un corps vers un autre. Nous disons que f est un
"homomorphisme de corps" si f est un homomorphisme d'anneaux.

Remarque : Le fait que l'homomorphisme de corps soit le même que celui d'un anneau tient
juste au fait que la différence entre les deux tient est que les éléments du corps sont
inversibles (aucune loi ou propriété de loi ne diffère entre les deux selon leur définition).

Théorème : Tout homomorphisme de corps est injectif

162/2001
Sciences.ch 14/03/2005

Démonstration :

Soit une un homomorphisme de corps. est un idéal. car


. Il en résulte et par suite f est injectif.

Ainsi, un homomorphisme de corps est un homomorphisme d'anneaux qui conserve l'élément


neutre de la multiplication.

D6. Soient A et B deux K-ev et une application de A dans B. Nous disons que f est
une "application linéaire" ou "homomorphisme d'espace vectoriels" si :

Remarque : nous avions déjà défini plus haut le concept d'application linéaire mais n'aviosn
pas précisé que les deux ensembles A et B étaient des K-ev.

Remarque : l'application linéaire est appelée "forme linéaire" si et seulement si

D7. Si l'homomorphisme est bijectif nous dirons alors que f est un "isomorphisme". S'il existe
un isomorphisme entre A et B, nous disons que A et B sont "isomorphes" et nous noterons cela
.

Remarque : l'isomorphisme permet au fait d'identifier deux ensembles munies d'une structure
algébrique identique (que ce soit groupe, anneau ou etc.) mais donc les éléments sont
nommées d'une façon.

D8. Si l'homomorphisme f est une application uniquement interne, nous dirons alors que f est
un "endomorphisme" (en d'autres termes, nous avons un endomorphisme si dans la définition
de l'homorphisme de groupe nous avons A=B)

Remarque : si nous avons un endomorphisme f de E, f est donc restreint à . Donc le


terme "endomorphisme" veut juste dire que l'application f arrive dans E et pas qu'elle touche
tous les éléments de E. Nous avons et pas forcément car dans ce dernier
cas nous disons que f est surjective comme nous l'avons déjà vu.

D9. Si l'endomorphisme f est en plus bijectif (donc en d'autres termes si homomorphisme est
un endomorphisme et un isomorphisme), nous dirons alors que f est un "automorphisme"

IDÉAL

Définition : Soit A un anneau commutatif. Un sous-ensemble est un "idéal" si :

P1. pour tout

P2. pour tout et tout

En d'autres termes, un "idéal" est un sous-ensemble fermé pour l'addition et "stable" par
multiplication par un élément quelconque de A.

163/2001
Sciences.ch 14/03/2005

Remarque : Les idéaux et sont appelé les "idéaux triviaux".

Pour savoir si un idéal est égal à tout l'anneau, il est utile d'utiliser le lemme suivant :

Lemme : soient A un anneau et I un idéal de A. Si alors

Démonstration : ceci résulte de la propriété P2 de la définition d'un idéal : pour tout ,


nous avons car .

Un premier exemple d'idéal est donné par le noyau d'un homomorphisme d'anneaux :

Théorème : le noyau d'un homomorphisme est un idéal de R.

Démonstration :

Soient . Alors :

ce qui montre que . Soit , alors :

ce qui montre que .

Proposition : Soit A un anneau et soit . Le sous-ensemble :

noté ou aA, est un idéal (nous allons voir un exemple concret après la prochaine
définition).

Définition : un idéal d'un anneau A est dit "principal" s'il existe tel que .
Un anneau dont tous les idéaux sont principaux est dit "anneau principal".

Théorème : L'anneau est principal (car tous ses idéaux sont principaux).

Démonstration :

Soit I un idéal de (il est facile de choisir un). Soit le plus petit entier positif non nul
de I. Nous allons montrer que . Soit a un élément quelconque de I. La division
euclidienne nous permet d'écrire :

avec (nous l'avons déjà démontré). Mais comme et que , par la


définition d'un idéal, nous avons . Par choix de r ceci implique que et donc que
. Ainsi tout élément de I est un multiple de r et donc .

164/2001
Sciences.ch 14/03/2005

Remarque : la démonstration ci-dessus n'utilise que la division euclidienne sur . Nous


pouvons alors généraliser ce résultat aux anneaux qui possèdent une division euclidienne.
Ainsi, par exemple, l'anneau des polynômes à coefficients dans un corps k (voir
chapitre de calcul algébrique) est un anneau principal car il possède une division euclidienne.

Ainsi, les seuls idéaux de sont ceux de la forme . De plus :

Lemme : Soient d et m des entiers > 1. Alors si et seulement si

Démonstration :

Si alors il existe n avec . Soit un élément de . Alors


ce qui montre que .

Réciproquement, si ceci implique que m est de la forme et ceci prouve que d


divise m.

Théorème : Un anneau R est un corps si et seulement s'il ne possède que les idéaux triviaux
.

Démonstration :

Montrons que la condition est nécessaire : Soit I un idéal non nul de R et un élément
non nul. Par hypothèse (qu'il s'agit d'un corps), il est inversible, c'est-à-dire qu'il existe
tel que . Ceci implique que et donc, par un résultat obtenu plus haut .

Réciproquement, supposons que tout idéal soit l'idéal nul. Alors si est un
élément non nul de R, l'idéal principal doit être égal à R. Mais ceci implique que
et dont qu'il existe avec ce qui montre que r est inversible. L'anneau R est donc
un corps.

Cette caractérisation va nous permettre de démontrer facilement que tout homomorphisme


partant d'un corps est injectif.

Théorème : Soit un homomorphisme où R est un corps. Alors f est injectif.

Démonstration :

Nous mettons ensemble ce qui a été vu jusque-là. Nous avons démontré plus haut que le
noyau d'un homomorphisme est un idéal. Mais nous avons également démontré plus
haut que nous avons soit soit (car anneau R est un corps si et
seulement s'il ne possède que les idéaux triviaux). Mais vu que (de par la
définition d'un homomorphisme) il s'ensuit qu'il reste (puisque nous avons
démontre que si A est un anneau et I un idéal de A alors Si alors ). Ceci implique
par un théorème précédent (où nous avons démontré que si l'homomorphisme
est injectif) que… f est injective.

Etudions maintenant les homomorphismes dont l'anneau de départ est . Soit A un anneau et

165/2001
Sciences.ch 14/03/2005

un homomorphisme. Par définition d'un homomorphisme et par ses propriétés, il


faut que et . Mail il faut encore que :

pour tout . Ainsi f est complètement déterminé par la donnée de et est donc
unique. Réciproquement, nous montrons que l'application définie par :

est un homomorphisme d'anneaux. En résumé. il existe un et un seul homomorphisme de


dans un anneau quelconque A.

Définition : Soit A un anneau et l'unique homomorphisme défini précédemment.


Si f est injectif, nous dirons que A est de "caractéristique nulle". Sinon, est un idéal
non trivial de et comme est dès lors principal (comme nous l'avons démontré plus haut)
il est de la forme avec . L'entier m est appelé la "caractéristique de A".

Remarque : moins formellement, la caractéristique d'un anneau est le plus petit entier positif
m tel que . S'il n'y en a pas, alors la caractéristique est nulle.

Exemple : l'anneau est de caractéristique nulle car l'unique homomorphisme est


l'identité. Il est donc injectif. Les injections montrent que (et
également) sont des corps de caractéristique nulle)

Proposition : La caractéristique d'un anneau intègre (et en particulier d'un corps) est égale 0
ou à un premier p.

Démonstration :

Nous montrons la contraposée. Soit A un anneau de caractéristique avec m non


premier. Il existe alors des entiers naturels tels que . Soit
l'unique homomorphisme (définir précédemment). Par définition (de l'idéal) de m, nous avons
mais . Mais alors ce qui montre
que A n'est pas intègre.

Remarque : la réciproque du théorème n'est pas vraie comme le montre l'exemple de l'anneau
où l'addition et la multiplication se font composant par composant. C'est un anneau de
caractéristique nulle mais avec des diviseurs de zéro :

166/2001
Sciences.ch 14/03/2005

PROBABILITÉS ET STATISTIQUES

PROBABILITÉS

Le calcul des probabilités s'occupe des phénomènes aléatoires (dits plus esthétiquement:
"processus stochastiques"), c'est-à-dire de phénomènes qui ne mènent pas toujours à la même
issue et qui peuvent êtres étudiés grâce aux nombres et à leurs conséquences et apparitions
(d'où notre choix très personnel des la voirs mis dans la section d'arithmétique). Néanmoins,
même si ces phénomènes ont des issues variées, dépendant du hasard, nous observons
cependant une certaine régularité statistique. Le jet d'un dé, le tirage du Loto pourraient être
analysés par les lois de la mécanique, mais ce serait trop compliqué et même impossible car il
faudrait parfaitement connaître les conditions initiales ce qui comme vous pouvez le voir dans
le chapitre de physique quantique ondulatoire est de toute façon impossible.

La modélisation par le calcul des probabilités a alors été inventée par A.N. Kolmogorov dans
un livre paru en 1933. Cette modélisation est faite à partir de l'espace de probabilités
que nous définirons de manière simpliste un peu plus loin et de manière beaucoup
plus précise dans le chapitre traitant dans la théorie de la mesure (voir section d'algèbre).

Remarque : une grande partie du contenu de ce chapitre est très peu satisfaisante à notre goût.
Nous faisons cependant tous les efforts possibles pour essayer de faire digérer et présenter
cette branche qui pose souvent problème lors des études scolaire de la meilleure manière quoi
soit mais nous rencontrons de grandes difficultés. Effectivement nous aimerions nous passer
d'exemples et d'exercices et de faire que le tout soit cependant parfaitement compréhensible et
clair mais cela est difficile car il nous faut revoir toute la manière d'aborder cette branche des
mathématiques. Nous vous remercions donc pour votre compréhension si certaines choses ne
sont à ce jour pas claires.

UNIVERS DES ÉVÉNEMENTS

Définitions :

D1. L'univers des événements (dit des "observables" aussi) est l'ensemble de toutes les
issues (résultats) possibles qui se présentent au cours d'une épreuve aléatoire déterminée.

D2. Soit un univers et un événement, nous disons que l'événement "à lieu" (ou "se
réalise") si lors du déroulement de l'épreuve se présente l'issue et que dans
le cas contraire, nous disons que "n'a pas lieu".

D3. Le sous-ensemble vide de s'appelle "événement impossible". En effet, si lors de


l'épreuve l'issue se présente, nous avons toujours et donc l'événement n'a donc
jamais lieu.

D4. Le sous-ensemble de s'appelle "événement certain". En effet, si lors de l'épreuve


l'issue se présente, nous avons toujours (car est l'univers des événements);
l'événement a donc toujours lieu.

167/2001
Sciences.ch 14/03/2005

D5. Soit et deux sous-ensembles de . Nous savons que l'événement et


sont tous deux des sous-ensembles de donc des événements.

Si deux événements et sont tels que :

les deux événements ne peuvent pas êtres réalisables pendant la même épreuve (résultat de
lancer d'un dé typiquement), nous disons qu'ils sont "incompatibles".

Sinon, si :

les deux événements peuvent êtres réalisables dans la même épreuve (possibilité de voir un
chat noir au moment où on passe sous une échelle par exemple), nous disons inversement
qu'ils sont "indépendants" (nous y reviendrons plus en détails dans l'étude des axiomes des
probabilités).

AXIOMES

La probabilité d'un événement sera en quelque sorte le répondant de la notion de fréquence


d'un phénomène aléatoire, en d'autres termes, à chaque événement nous allons attacher un
nombre réel, appartenant à l'intervalle [0;1], qui mesurera sa probabilité (chance) de
réalisation. Les propriétés des fréquences que nous pouvons mettre en évidence lors
d'épreuves diverses nous permettent de fixer les axiomes des probabilités.

Attention! La théorie des probabilités représente un cadre théorique dans lequel nous allons
pouvoir modéliser le domaine de l'incertain. Comme dans toute formalisation, il existe une
part de schématisation de la réalité, qui implique que les résultats obtenus ne seront valides
que dans la mesure ou cette représentation abstraite et simplifiée de la réalité n'est pas trop
éloignée de cette dernière.

Axiomes:

Soit un univers. Nous disons que nous définissons une probabilité sur les événements de
si à tout événement de nous associons un nombre , appelé "probabilité de
l'événement ", satisfaisant aux quatre axiomes suivants :

A1. Pour tout événement :

Ainsi, la probabilité de tout événement est un nombre positif supérieur ou égal à zéro oiu
inférieur ou égal à 1.

A2. La probabilité de l'événement certain ou de l'ensemble des événements est égal à 1 :

168/2001
Sciences.ch 14/03/2005

A3. Si , alors :

la probabilité de la réunion ("ou") de deux événements incompatibles est égale à la somme de


leurs probabilités (loi d'addition). Nous parlons alors de "probabilité disjointe" et la notons
.

Autrement dit sous forme plus générale : si est une suite d'évènements disjoints deux à
deux ( et ne peuvent pas se produire en même temps si ) alors :

Une conséquence immédiate des axiomes (A2.) et (A3.) est la relation entre les probabilités
d'un événement et de complémentaire, noté :

A4. Si et sont indépendants (ou "mutuellement exclusifs"), nous avons ,


alors :

la probabilité de l'intersection ("et") de deux événements indépendants est égale au produit de


leurs probabilités (loi de multiplication). Nous parlons alors de "probabilité conjointe" et la
notons .

Autrement dit sous forme plus générale : les événements sont indépendants si la
probabilité de l'intersection est le produit des probabilités :

Remarque : Attention ! Il ne faut pas confondre "indépendants" et "incompatibles". Deux


événements indépendants de probabilités non nulles ne sont jamais indépendants. Si l'un des
deux se produit, l'autre ne peut pas se produire.

Soit un univers comportant un nombre fini d'issues possibles :

169/2001
Sciences.ch 14/03/2005

Les événements :

sont appelés "événements élémentaires". Lorsque ces événements ont même probabilité, nous
disons qu'ils sont "équiprobables". Dans ce cas, il est très facile de calculer leur probabilité.
En effet, ces événements étant par définition indépendants entre eux à ce niveau de notre
discours, nous avons en vertu de l'axiome 3 des probabilités :

mais puisque :

et que les probabilités du membre de droite sont par hypothèse équiprobables, nous avons :

Soient deux évènements et réalisés respectivement et fois au cours de


épreuves. Nous avons donc:

et

Si de plus et sont réalisés simultanément fois, nous avons pour probabilité


conjointe :

PROBABILITÉS CONDITIONNELLES

Que pouvons-nous déduire sur la probabilité de l'évènement sachant que l'évènement est
réalisé? Cette probabilité est appelée "probabilité conditionnelle" de sachant et se note
. Dans notre cas, nous avons :

ou

Nous voulons définir la probabilité d'un événement conditionnellement à un autre événement.


Historiquement, le premier mathématicien à avoir utilisé correctement la notion de probabilité
conditionnelle fut Thomas Bayes (1702-1761). Aussi parlons-nous souvent de Bayes ou de
bayésien dès que des probabilités conditionnelles sont en jeu: formule de Bayes, statistique
bayésienne…

170/2001
Sciences.ch 14/03/2005

La notion de probabilité conditionnelle que nous allons introduire est beaucoup moins simple
qu'elle ne paraît a priori et les problèmes de conditionnement sont un source inépuisable
d'erreurs en tout genre. A titre d'illustration, nous pourrons méditer la petite histoire suivante:

Il est extrêmement improbable que deux personnes ayant chacune une bombe prennent le
même avion. Quelle est alors la meilleure façon d'éviter d'avoir une bombe dans son avion?
Réponse: il faut se munir d'une bombe puisque la probabilité qu'il y ait une deuxième bombe
sachant qu'il y en a déjà une est extrêmement faible…

Revenons à des considérations plus mathématiques.

Supposons que nous ayons deux dès. Imaginons maintenant que nous ayons lancé seulement
le premier dé. Nous voulons savoir quelle est la probabilité qu'en lançant le second dé, la
somme des deux chiffres vaille 12. Ainsi, la probabilité d'obtenir 12 sachant la valeur du
premier dé est totalement différente de la probabilité d'obtenir 12 en lançant les deux dès.
Comment calculer cette nouvelle probabilité? Prenons le problème dans l'autre sens.
Supposons que le résultat du premier dé soit 6. Un argument empirique du type "règle de
trois" (voir mathématiques financières) nous dirait (imagination) que la probabilité que la
somme des chiffres des deux dès vaille 8 ou 9 sera le double de la probabilité que la somme
des chiffres vaille 7. Formalisons la démarche. Après le lancer du premier dé, nous avons une
nouvelle loi qui tient compte de l'information supplémentaire:

Notons cette nouvelle loi . Comment la déterminer? Deux solutions sont


envisageables :

S1. Soit nous remodèlisons notre problème

S2. Soit nous calculons

À partir de la probabilité initiale. Nous allons choisir la deuxième solution. Soit . En


généralisant l'argument "règle de trois", nous pressentons que doit être proportionnel
à , la constant de proportionnalité étant déterminée par la normalisation .

Soit maintenant ( est inclus dans le complémentaire de ). Il est assez intuitif que
. Ceci nous mène aux définitions suivantes :

et

Le nombre s'appelle "probabilité conditionnelle de sachant ".

Interprétation : La connaissance d'une information sur une expérience peut modifier l'idée que
nous nous faisons de la probabilité d'un évènement. Ainsi, le fait de savoir que est réalisé
réduit l'ensemble des résultats possibles de à . A partir de là, seules les éventualités de
ont une importance. La probabilité de sachant doit donc être proportionnelle à

171/2001
Sciences.ch 14/03/2005

. Le coefficient de proportionnalité assure que l'application qui à associe


est bien une probabilité, pour laquelle est l'événement certain.

Remarque : attention la notation est quelque peu dangereuse. En effet, n'est


pas un événement!

Une loi de probabilité conditionnelle est une loi de probabilité. En particulier, si sont
disjoints (incompatibles) et réalisé parmi les expériences où l'est aussi. Alors :

aussi :

La définition des probabilités conditionnelles s'utilise souvent sous la forme :

Si est une famille dénombrable d'évènements disjoints deux à deux dont la réunions est
l'événement certaine (sous-ensemble de ) alors :

C'est la "formules des probabilités totales". Mais aussi, pour tout , nous avons :

C'est la "formule de Bayes".

ANALYSE COMBINATOIRE

Définitions : "L'analyse combinatoire" est le domaine de la mathématique qui s'occupe de


l'étude de l'ensemble des issues ou arrangements (combinaisons) ordonnés ou non possibles
d'événements ou faits (distinguables ou non tous distinguables) possibles selon certaines
contraintes données.

Propriétés :

P1. Une suite d'objets (événements, issues,...) est dite "ordonnée" si chaque suite composée
d'un ordre particulier des objets est compatbilisé comme une configuration particulière.

Corollaire : une suite est non ordonnée si et seulement si nous intéresse la fréquence
d'apparition des objets indépendamment de leur ordre.

172/2001
Sciences.ch 14/03/2005

P2. Des objets (d'une suite) sont dits "distincts" si leurs charactéristiques ne permettent pas de
les confondre avec des autres objets.

Remarque : nous avons choisi de mettre l'analyse combinatoire dans ce chapitre car lorsque
nous calculons des probabilités, nous avons également assez souvent besoin de savoir quelle
est la probabilité de tomber sur une combinaison ou un arrangement d'événements donnés
sous certaines contraintes (le Loto par exemple..).

Il existe plusieurs types d'arrangements selons les contraintes et les propriétés des éléments
arrangés. Nous allons présenter et démontrer ci-dessous les 5 cas les plus répandus à partir
desquels nous pouvons trouver (habituellement) tous les autres :

ARRANGEMENTS AVEC RÉPÉTITION

Définition : Un "arrangement avec répétition" est une suite ordonnée de longueur de


objets distincts non nécessairement tous différents dans la suite (avec répétition).

Soient et deux ensembles finis de cardinaux respectifs tels que trivialement il y ait
façons de choisir un objet dans (de type ) et façons de choisir un objet dans (de
type ).

Nous avons vu en théorie des ensemble que si et sont disjoints, que


. Nous en déduisons donc les propriété suivantes :

Propriétés :

P1. Si un objet ne peut être à la fois de type et de type et s'il y a façons de choisir un
objet de type et façons de choisir un objet de type , alors il y a façons de choisir
un objet de type ou de type .

P2. Si nous pouvons choisir un objet de type de façons puis un objet de type de
façons, alors il y a (produit cartésien de deux ensembles – voir théorie des ensembles) :

de choisir un seul et unique objet de type puis un objet de type .

Avec les mêmes notations, choisir une fonction de dans , c'est choisir (dans le cas
général) pour chaque élément de , son unique image parmi les éléments de . Il y a
donc façons de choisir l'image du premier élément de , puis aussi façons de
choisir l'image du deuxième, …, puis façons de choisir l'image du -ième. Le
nombre d'applications totales possibles de dans est donc égal au produit de égaux à
. Ainsi, nous avons :

où est l'ensemble des applications de dans .

Corollaire (important) : il est intéressant de faire l'observation qu'à toute suite

173/2001
Sciences.ch 14/03/2005

d'éléments de composé d'éléments de tel que nous pouvons


faire aussi une correspondance du type .

Ce corollaire nous amène à assimiler ce résultat mathématique au résultat ordonné (un


arrangement dont l'ordre des éléments de la suite est pris en compte) de tirages dans
un sac contenant boules différentes avec remise après chaque tirage.

Exemple : Combien de "mots" (ordonnés) de 7 lettres pouvons nous former à partir d'un
alphabet de 24 lettres distinctes ?

Une généralisation simple de ce dernier résultat peut consister dans l'énoncé du problème
suivant :

Soit une suite non-ordonnée de objets non nécessairement distincts, chaque


objet peut prendre un nombre fini d'états avec . Alors nous avons par
combinaisons :

Remarque : si nous avons et et que tout sous-ensemble


d'objets est identique nous retombons sur .

PERMUTATIONS SIMPLES

Définition (première version) : une "permutation simple" (appelée anciennement


"substitution") de objets distincts est une suite ordonnée de ces objets par définition tous
différents dans la suite (sans répétition).

Le nombre d'arrangements de éléments peut être calculé par récurrence : il y a places


pour un premier élément, pour un deuxième élément,…, et il ne restera qu'une place
pour le dernier élément restant.

Il est dès lors trivial que nous aurons un nombre d'arrangements donné par :

Rappelons que la série :

est appelé "factorielle de " et nous la notons pour .

Il y a donc pour éléments distinguables :

174/2001
Sciences.ch 14/03/2005

arrangements possibles.

Exemple : Combien de "mots" (ordonnés) de 7 lettres distinctes pouvons nous former ?

Ce résultat nous amène à l'assimiler au résultat ordonné (un arrangement dont l'ordre des
éléments de la suite est pris en compte) du tirage de toutes les boules d'un sac contenant
boules distinguables sans remise.

Définition (ensembliste) : une permutation d'un ensemble est une bijection de l'ensemble
sur lui-même, y compris le cas où est infini. Une permutation de éléments est une
bijection d'un ensemble fini de cardinal sur lui-même. Une permutation de
éléments est aussi un -uplet de éléments distincts. L'ensemble étant fini, il y autant
d'applications bijectives de dans lui-même que d'applications injectives de dans lui-
même, soit .

PERMUTATIONS AVEC RÉPÉTITION

Définition : lorsque nous considérons le nombre de permutations ordonnées (différentes)


d'une suite de objets distincts tous nécessairement non différents dans la suite nous parlons
de "permutation avec répétition".

Remarque : il ne faut pas confondre cette dernière définition avec "l'arrangement avec
répétition" qui est une suite ordonnée de longueur de objets distincts non
nécessairement tous différents la suite.

Lorsque certains éléments éléments ne sont pas distinguables dans une suite d'objets (ils sont
répétitifs dans la suite), alors le nombre d'arrangements (permutations) que nous pouvons
constituer se réduit alors trivialement à un nombre plus petit que si tous les éléments étaient
distinguables.

Si nous notons :

avec

le nombre d'arrangements possibles (pour l'instant inconnu) avec répétition (un ou plusieurs
éléments répétitifs dans une suite d'éléments sont non distinguables par permutation), alors si
chacune des places occupées par des éléments identiques était occupée par des éléments
diffèrents, le nombre de permutations serait alors à multiplier par chacun des (cas
précédent).

Il vient alors que nous retombons sur la factorielle telle que :

175/2001
Sciences.ch 14/03/2005

alors:

Remarque : si les objets sont tous différentes dans la suite, nous avons alors :

et nous nous retrouvons bien avec une permutation simple tel que :

Exemple : combien de "mots" (ordonnés) pouvons-nous former avec les lettres du mot
"mississippi" :

Ce résultat nous amène à l'assimiler au résultat ordonné (un arrangement dont l'ordre des
éléments de la suite est pris en compte) du tirage de boules non tous distinguables d'un sac
contenant boules avec remise limitée pour chaque boule.

Propriété : quelques soient les éléments dans la suite analysée chacun des éléments peut
donc apparaître et nous avons donc (voire le chapitre traitant des suites et
séries dans la section d'algèbre) :

ARRANGEMENTS SIMPLES SANS RÉPÉTITION

Définition : un "arrangement simple sans répétition" est une suite ordonnée de objets (tous
différents dans la suite) pris parmi objets distincts avec .

Nous nous proposons maintenant de dénombrer les arrangements possibles de objets


parmi . Nous noterons le nombre des ces arrangements. Il est aisé de calculer et
de vérifier que ; il existe en effet façons de choisir le premier objet et
façons de choisir le deuxième lorsque nous avons déjà le premier. Pour déterminer ,
nous raisonnons alors par récurrence.

Nous supposons connu et nous en déduisons :

176/2001
Sciences.ch 14/03/2005

Dès lors:

alors:

d'où :

Ce résultat nous amène à l'assimiler au résultat ordonné (un arrangement dont l'ordre des
éléments de la suite est pris en compte) du tirage de boules d'un sac contenant boules
différentes sans remise.

Exemple : soit les 24 lettres de l'alphabet, combien de "mots" (ordonnés) de 7 lettres distinctes
pouvons nous former ?

Remarque : si nous prenons nous nous retrouvons bien avec :

Une permutation simple est donc un arrangement simple sans répétition avec .

COMBINAISONS SIMPLES

Définition : une "combinaison simple" est une suite non-ordonnée de éléments tous
différents choisis parmi objects distincts et est par définition notée et appelée "la
binômiale".

Si nous permutons les éléments de chaque arrangement simple de éléments, nous obtenons
toutes les permutations simples et nous savons qu'il y en a d'où :

Remarque (triviale) : nous avons nécessairement par définition

Exemple : soit un alphabet de 24 lettres, combien avons nous de choix de prendre 7 lettres
parmi les 24 sans prendre en en compte l'ordre dans lequel sont tirées les lettres :

177/2001
Sciences.ch 14/03/2005

Ce résultat nous amène à l'assimiler au résultat non ordonné (un arrangement dont l'ordre
des éléments de la suite n'est pas pris en compte) du tirage de boules d'un sac contenant
boules différentes sans remise.

STATISTIQUES

Définition : les statistiques sont une science qui a pour objet le groupement méthodique des
faits qui se prêtent à une évaluation numérique d'événements qui peuvent se répéter dans le
temps suivant une loi donnée. Certains s'aiment à dire que la statistique est la première des
sciences inexactes…

Autre définition : Le but principal de la statistique est de déterminer les caractéristiques d'une
population donnée à partir de l'étude d'une partie de cette population, appelée échantillon.

Lorsque nous observe un événement prenant en compte certains facteurs, il peut arriver
qu'une deuxième observation ait lieu dans des conditions qui semblent identiques. En répétant
ces mesures plusieurs fois, nous pouvons constater que les résultats observables sont
distribuées statistiquement autour d'une valeur moyenne qui est, finalement le résultat
possible le plus probable. Dans la pratique, nous n'effectuons cependant qu'une seule mesure
et il s'agit alors de déterminer la valeur de l'erreur que l'on commet en adoptant celle-ci
comme moyenne mesurée. Cette détermination nécessite de connaître le type de distribution
statistique auquel nous avons à faire.

Introduisons avant de continuer quelques définitions qui vont nous être utiles pour la suite:

ÉCHANTILLONS

Lors de l'étude statistiques d'ensembles d'informations, la façon de sélectionner l'échantillon


est aussi importante que la manière de l'analyser. Il faut que l'échantillon soit "représentatif"
de la population. Pour cela, l'échantillonnage aléatoire est le meilleur moyen d'y parvenir.

Définitions :

D1. Un échantillon aléatoire est un échantillon tiré au hasard dans lequel tous les individus
ont la même chance, ou "équiprobabilité" (et nous insistons sur le fait que cette probabilité
doit être égale), de se retrouver dans l'échantillon.

D2. Dans le cas contraire d'un échantillon dont les éléments n'ont pas été pris au hasard, nous
disons alors que l'échantillon est "biaisé" (dans le cas inverse nous disons qu'il est "non-
biaisé")

Remarque : un petit échantillon représentatif est, de loin, préférable à un grand échantillon


biaisé.

En fait, lorsque la taille des échantillons utilisés est petite, le hasard peut donner un résultat
moins bon que celui qui est biaisé. Une autre méthode consiste alors à utiliser la technique des
quotas :

178/2001
Sciences.ch 14/03/2005

Définition : un échantillon de population respecte la proportion d'éléments distinctifs de la


population totale.

VARIABLES DISCRÈTES

Soit un variable indépendante (un élément d'un échantillon dont la propriété est
indépendante des autres éléments) qui peut prendre les valeurs aléatoires discrètes
dans avec les probabilités respectives où, de par l'axiomatique des
probabilités:

Alors nous définissons "l'espérance mathématique" de la variable par:

En d'autres termes, nous savons qu'à chaque événement de l'espace des échantillons est
associé
une probabilité à laquelle nous associons également une valeur (donnée par la variable
aléatoire). La question étant alors de savoir quelle valeur, à long terme, nous pouvons obtenir.
La valeur espérée, (l'espérance mathématique donc...) est alors la moyenne pondérée, par la
probabilité, de toutes les valeurs des événements de l'espace des échantillons.

Si la probabilité est donnée par une fonction de distribution (voir les définitions de fonctions
de distribution plus bas) de la variable aléatoire, nous avons:

peut être notée s'il n'y pas de confusion possible.

Voici quelque propriétés mathématiques importantes de l'espérance:

Nous en déduisons que pour variables aléatoires , définies sur une même loi de
distribution:

179/2001
Sciences.ch 14/03/2005

Après avoir traduit la tendance par l'espérance, il est intéressant de traduire la dispersion (ou
"déviation standard") autour de l'espérance par une valeur (la variance ou l'écart-type).

La variance de , notée ou est définie par:

L'écart-type de , noté , est défini par:

peut être noté s'il n'y pas de confusion possible.

La variance peut également s'écrire sous la forme de la "formule de Huyghens". Voyons de


quoi il s'agit:

Soit une variable aléatoire d'espérance (valeur constante et déterminée) et de variance


(valeur constante et déterminée), nous définissons la "variable centrée réduite" par la
relation:

et l'on démontre de façon très simple (contactez moi si vous souhaitez que je fasse quand
même la petite démonstration) que:

Voici quelque propriétés mathématiques importantes de la variance:

180/2001
Sciences.ch 14/03/2005

En similitude avec les propriétés mathématiques de la variance:

ainsi, nous retrouvons bien si que .

Le terme est appelé "covariance" et possède les propriétés suivantes et l'expression:

est appelée "forme bilinéaire de la variance" (ou forme "multivariée").

Si la convariance est univariée, nous avons dès lors:

Soit un vecteur de composantes et un autre vecteur de composantes


le calcul de la covariance des composantes deux à deux donnent ce que l'on
appelle la "matrice des covariances" (outil très utilisé en mathématiques financières).

Effectivement, si nous notons:

et ce jusqu'à . Nous pouvons dès lors écrire une matrice sous la forme:

Cette matrice à comme propriété remarquable que si l'on prend deux vecteur identiques et que
l'on calcule les composantes de la matrice, alors la diagonale de cette dernière donnera les
variances des composantes de vecteurs!

Souvent en statistique, il est utile de déterminer l'écart-type de la moyenne. Voyons de quoi il


s'agit:

181/2001
Sciences.ch 14/03/2005

Soit la moyenne d'un serie de termes déterminés chacun par la mesure de plusieurs valeurs::

alors:

et:

d'où l'écart-type de le moyenne:

Soient et deux variables aléatoires ayant pour covariance:

Nous pouvons démontrer que (voir la démonstration de cette inégalité en analyse vectorielle
dans la définition du produit scalaire):

Ce qui nous donne:

Finalement nous obtenons une forme de l'inégalité statistique dite "inégalité de Cauchy-
Schwarz" :

Si les variances de et sont non nulles, la corrélation entre et est définie par:

182/2001
Sciences.ch 14/03/2005

Quels que soient l'unité et les ordres de grandeur, le coefficient de corrélation est un nombre
sans unité, compris entre -1 et 1. Il traduit la plus ou moins grande dépendance linéaire de X et
Y et ou, géométriquement, le plus ou moins grand aplatissement. Un coefficient de corrélation
nul ou proche de 0 signifie qu'il n'y a pas de relation linéaire entre les caractères. Mais il
n'entraîne aucune notion d'indépendance plus générale.

Quand le coefficient de corrélation est proche de 1 ou -1, les caractères sont dits fortement
corrélés. Il faut prendre garde à la confusion fréquente entre corrélation et causalité. Que deux
phénomènes soient corrélés n'implique en aucune façon que l'un soit cause de l'autre.

Ainsi:

- si nous avons affaire à une corrélation négative dite "corrélation négative


parfaite" (tous les points de mesures sont situés sur une droite de régression de pente
négative).

- si nous avons affaire à une corrélation négative ou positive dite "corrélation


imparfaite"

- si la corrélation est nulle...

- si nous avons affaire à une corrélation positive dite "corrélation positive


parfaite" (tous les points de mesures sont situés sur une droite de régression de pente
positive).

L'analyse de régression et de corrélation poursuit donc deux objectifs:

1. Déterminer le degré d'association entre les différentes variables: celui-ci est exprimé par le
coefficient de détermination, qui est le carré du coefficient de corrélation. Le coefficient de
détermination mesure la contribution d'une des variables à l'explication de la seconde.

2. Déterminer les caractéristiques de cette association, c'est-à-dire des paramètres et de


la droite de régression (voir la section d'analyse numérique du site au chapitre des algorithmes
traitant de la régression linéaire). Si l'on peut faire valablement l'hypothèse de la stabilité du
processus générateur des couples de valeurs des deux variables, la connaissance de ces
paramètres permettrait de prédire le comportement du phénomène étudié

Dans le cas où nous avons à disposition une série de mesures couplées, nous pouvons
grossièrement estimer la valeur moyenne et la variance des mesures par les estimateurs
suivants (il s'agit simplement au fait de l'espérance et l'écart-type d'un échantillon dont les
événement sont tous équiprobables) :

et

Démonstration :

183/2001
Sciences.ch 14/03/2005

De par son approximation, nous disons que ces estimateurs sont biaisés et que l'écart est
moyen.

Ainsi, nous obtenons le coefficient de corrélation :

VARIABLES CONTINUES

Si nous étudions une variable continue (non discrète) pouvant prendre n'importe qu'elle
valeur dans , alors nous définissons la "densité de probabilité" normalisée à 1 comme
étant la fonction qui permet de connaître la probabilité d'obtenir un résultat compris entre
et . Cette densité est donnée par l'intégrale de la fonction exprimant la probabilité
d'apparition de la variable aléatoire suivant :

où de par l'axiomatique des probabilités , . Evidemment nous a:

représente la probabilité d'obtenir le résultat .

Dans ce cas :

et

Toute fonction de distribution de probabilité doit satisfaire l'intégrale de normalisation dans


son domaine de définition!

La moyenne ayant été défini par la somme pour une variable discrète, elle devient une
intégrale pour une variable continue:

184/2001
Sciences.ch 14/03/2005

et la variance s'écrit donc:

Souvent les statisticiens utilisent les notations suivantes pour l'espérance mathématique:

et pour la variance:

Par la suite, nous calculerons ces différents termes avec développements uniquement dans les
cas les plus usités.

FONCTIONS DE DISTRIBUTION

Lorsque nous observons des phéonomènes stochastiques, et que nous prenons note des valeurs
prises par ces derniers et que les reporte graphiquement, nous observons toujours que les
différentes mesures obtenues suivent une caractéristique courbe ou droite typique
fréquemment reproductible. Dans le domaine des probabilités et statistiques, nous appelons
ces caractéristiques des "fonctions de distribution".

Cependant, il convient de préciser que rigoureusement, nous parlons normalement de


"fonction de répartition" pour les variables discrètes et de "fonctions de densité" pour les
variables continues.

Remarque : le lecteur pourra trouver la fonction de distribution de Weibull (ou "loi de


Weibull") dans le chapitre traitant des techniques de gestion (section de mathématiques
sociales).

FONCTION DISCRÈTE UNIFORME

Si nous admettons qu'il est possible d'associer une probabilité à un événement, nous pouvons
concevoir des situations où nous pouvons supposer a priori que tous les événements
élémentaires sont équiprobables (c'est-à-dire qu'ils ont même probabilité). Nous utilisons alors
le rapport entre le nombre de cas favorables et le nombre de cas possibles pour calculer la
probabilité de tous les événements de l'Univers des événements . Plus généralement si
est un ensemble fini d'événements équiprobables et une partie de nous avons :

c'est-à-dire le nombre de cas favorables sur le nombre de cas possibles. Cette relation est
utilisable dans le cas particulier où les événements possibles sont équiprobables et en nombre

185/2001
Sciences.ch 14/03/2005

fini.

Plus communément, nous pouvons écrire : soit un événement pouvant avoir issues
équiprobables possibles. Alors la probabilité d'observer l'issue de l'événement sera:

Ayant pour espérance (ou moyenne) :

et pour variance :

Soit un ensemble de événements, et un sous ensemble d'événements. La probabilité


d'observer au moins un des sous-éléments est nous l'avons déjà démontré:

FONCTION DE BERNOULLI

Si l'on à affaire à un observation binaire alors la probabilité d'un événement reste constant
d'une observation à l'autre s'il n'y a pas d'effet mémoire (autrement dit: une somme de
variables de Bernoulli, deux à deux indépendante). Nous appelons ce genre d'observations où
la variable aléatoire à valeurs 0 ou 1, avec probabilité , respectivement, des "essais
de Bernoulli".

Ainsi, une variable aléatoire suit une fonction (ou loi) de Bernoulli si elle ne peut prendre
que les valeurs 0 ou 1, associées aux probabilités et de sorte que et:

L'exemple classique d'un tel processus est le jeu de pile de face.

Si l'on considère événements où l'on obtient fois une des issues possibles et
l'autre suivant un certain ordre (ou arrangement), alors la probabilité d'obtenir à nouveau le
même ordre est donné par:

186/2001
Sciences.ch 14/03/2005

relativement à ce que nous avions vu en analyse combinatoire!

Exemple : tracé de la fonction pour :

La fonction de Bernoulli ayant pour espérance (moyenne):

puisque:

et a pour variance:

FONCTION BINOMIALE

Si l'on revient maintenant à notre relation de l'événement binaire dont la probabilité d'un
arrangement particulier est . Alors la densité de probabilité d'avoir fois
l'événement et fois l'événement dans n'importe quel arrangement (ou ordre) sera
donné par les différentes possibilité d'avoir des arrangement avec et fois ces

187/2001
Sciences.ch 14/03/2005

événements multipliés par la probabilité de chaque séquence d'arrangement


particulière.

Le nombres d'arrangements possibles est, nous l'avons démontré, donné par :

donc:

Ecrite autrement ceci donne la fonction binomiale connue sous la forme:

et parfois notée:

Exemple : Tracé de la fonction avec , et . Avec rouge


, vert , bleu

Nous avons bien évidemment :

L'espérance mathématique de est:

La variance de la distribution binomiale étant:

188/2001
Sciences.ch 14/03/2005

L'écart-type étant , nous avons :

FONCTION HYPERGÉOMETRIQUE

Nous considèrons pour l'exemple une urne contenant boules dont sont noires et les
autres blanches. On tire successivement, et sans les remettre dans l'urne, boules. Quelle est
la probabilité que parmi ces boules, il y en ait qui soient noires (c'est que l'on appelle
communément le "tirage sans remise") ?

Les boules peuvent être choisies parmi les boules de façons (représentant le nombre
de tirages différents possibles). Les boules noires peuvent être choisies parmi les noires
de façons. Les boules blanches peuvent être elles choisies de . Il y a donc
tirages qui donnent boules noires et boules blanches. La probabilité
recherche vaut donc:

Exemple : Tracé de la fonction avec . Nous obtenons les graphiques : rouge


, vert , bleu :

189/2001
Sciences.ch 14/03/2005

La fonction hypergéométrique a pour moyenne :

et pour variance :

FONCTION MULTINOMIALE

Soit muni d'une probabilité . Nous tirons fois de


suite un élément de avec la probabilité . Quelle est la probabilité d'obtenir le
nombre 1, fois le nombre 2, fois, sur une suite d'un tirage de éléments (c'est ce que
l'on appelle communément le "tirage avec remise") ?

Nous avons vu en analyse, que si l'on prend un ensemble d'événements ayant plusieurs issues,
alors les différentes combinaisons de suites que l'on peut obtenir en prenant éléments
choisis parmi est:

Il y a donc :

190/2001
Sciences.ch 14/03/2005

façons différentes d'obtenir fois un certain événement.

Il y a ensuite :

façons différentes d'obtenir un seconde événement puisque dans l'ensemble de la suite, de


éléments déjà on été tirés ce qui fait qu'il n'en reste plus sur lesquels nous
pouvons obtenir les voulus.

Par récurrence immédiate nous avons alors:

combinaisons de sortir fois certains événements dans l'ordre donné!

La probabilité recherchée vaut donc:

FONCTION DE POISSON

Il existe une très grande quantités de fonctions mathématiques qui décrivent le comportement
d'observations d'événements aléatoires et indépendants et identiquement distribués. Nous
allons parcourir ces fonctions et pour les plus connues, les étudier en détails

Pour certains événements fort rares, la probabilité est très faible et tend vers zéro.
Toutefois la valeur moyenne tend vers une valeur fixe lorsque tend vers l'infini.

Nous partirons donc d'une distribution binomiale de moyenne que nous supposerons
finie lorsque tend vers l'infini.

La probabilité de réussites lors de épreuves vaut:

191/2001
Sciences.ch 14/03/2005

En posant , cette expression peut s'écrire:

En regroupant les termes, nous pouvons mettre la valeur de sous la forme:

Nous reconnaissons que, lorsque tend vers l'infini, le deuxième facteur du produit a pour
limite .

Quant au troisième facteur, puisque l'on s'intéresse aux petites valeurs de (la probabilité de
réussite est très faible), sa limite pour tendant vers l'infini vaut 1. Nous obtenons ainsi la loi
de distribution dite de Poisson:

Exemple : Tracé de la fonction de Poisson pour en rouge, en vert, en


bleu :

Cette distribution est importante car elle décrit beaucoup de processus dont la probabilité est
petite et constante. Elle est souvent utilisée dans la "queing theory" (temps d'attente), test

192/2001
Sciences.ch 14/03/2005

d'acceptabilité et fiabilité, et contrôles statistiques de qualité. Entre autres, elle s'applique aux
processus tels que: l'émission des quanta de lumière par des atomes excités, le nombre de
globules rouges observés au microscope, le nombre d'appels arrivant à une centrale
téléphonique ainsi qu'au cas qui nous concerne, le nombre de désintégrations de noyaux
atomiques. La distribution de Poisson est valable pour presque toutes les observations faites
en physique nucléaire ou corpusculaire.

La distribution de Poisson donne la probabilité de trouver un nombre donné d'événements en


fonction d'une variable donnée, si les événements sont indépendants et ont un taux de
répétition (probabilité) constant (équiprobables).

L'espérance (moyenne) de la fonction de distribution de Poisson est:

La variance de la fonction de distribution de Poisson est elle donnée par:

Pour la distribution de Poisson nous avons le cas particulier où :

Les lois de distribution statistiques sont étables en supposant la réalisation d'un nombre infini
de mesures. Il est évident que nous ne pouvons en effectuer qu'un nombre fini . D'où la
nécessité d'établir des correspondances entre les valeurs utiles théoriques et expérimentales.
Pour ces dernières nous n'obtenons évidemment qu'une approximation dont la validité est
toutefois suffisante.

Théoriquement nous avons :

Dans le cas d'une distribution de Poisson par exemple:

, ,

Expérimentalement, nous avons :

193/2001
Sciences.ch 14/03/2005

, ,

Donc à chaque fois qu'une mesure est faite, il s'ensuit une incertitude sur le résultat unique
obtenu. Supposons avoir compté (observé) événements en fonction d'une certaine variable;
l'écart entre et la moyenne sera en moyenne . Il est donc naturel d'écrire:

Mais comme nous pouvons donc écrire l'observation de


événements comme étant:

FONCTION DE GAUSS-LAPLACE (OU LOI NORMALE)

Partons d'une distribution binomiale et faisons tendre le nombre d'épreuves vers l'infini.

Si est fixé au départ, la moyenne tend également vers l'infini; de plus l'écart
tend également vers l'infini.

Remarque : le cas où varie et tend vers 0 tout en laissant fixe la moyenne ayant
été étudié lors de la présentation de la loi de Poisson.

Si nous voulons calculer la limite de la distribution binomiale, il s'agira donc de faire un


changement d'origine qui stabilise la moyenne, en 0 par exemple, et un changement d'unité
qui stabilise l'écart, à 1 par exemple.

Voyons tout d'abord comment varie en fonction de et calculons la différence:

Nous en concluons que est une fonction croissante de , tant que est
positif.

Remarquons que et que par conséquent la valeur de voisine de la moyenne


constitue le maxima de . D'autre part la différence est le taux
d'accroissement de la fonction . Nous pouvons alors écrire :

194/2001
Sciences.ch 14/03/2005

Si devient grand il est clair que l'est également! Dès lors, pour autant que soit fixé et
que nous nous intéressions aux valeurs de la fonction proches de la moyenne dès
lors les variations de peuvent s'écrire :

la valeur de la nouvelle variable tende vers zéro lorsque nous effectuons un passage à la limite
pour et dont la moyenne soit nulle (variation négligeables) et telle que son écart-type soit
unitaire. Nous avons :

appelons l'expression de calculée en fonction de la nouvelle variable. Le taux


d'accroissement de vaut alors :

et, en appliquant le résultat trouvé précédemment, nous obtenons :

Comme nous avons posé et il vient :

Après un passage à la limite pour tendant vers l'infini nous obtenons :

Cette équation peut encore s'écrire:

195/2001
Sciences.ch 14/03/2005

et en intégrant les deux membres de cette égalité nous obtenons :

La fonction suivante est une des solutions de la relation précédente:

La constante est déterminée par la condition que , qui représente la somme de

toutes les probabilités, vaut 1. Nous pouvons montrer que :

Démonstration :

Nous avons :

puisque est une fonction paire (voir chapitre d'analyse fonctionnelle). Ecrivons
maintenant le carré de l'intégrale de la manière suivante :

et faisons un changement de variable en passant en coordonnées polaires, dès lors nous ferons
aussi du Jacobien dans ses mêmes coordonnées (voir chapitre de calcul différentiel et
intégral) :

Par extension pour nous avons .

196/2001
Sciences.ch 14/03/2005

Nous obtenons donc la fonction (ou loi) de Gauss-Laplace, dite aussi "loi normale" :

En revenant aux variables non normées, nous obtenons :

Exemple : Tracé de la fonction pour en rouge, en vert,


en bleu, en magenta :

Cette loi régit sous des conditions très générales, et souvent rencontrées, beaucoup de
phénomènes aléatoires. Elle est par ailleurs symétrique par rapport à la moyenne .

Montrons maintenant que représente l'espérance mathématique (ou la moyenne) de :

Posons . Nous avons dès lors :

197/2001
Sciences.ch 14/03/2005

Calculons :

Donc :

Montrons aussi que représente l’écart type de (il convient, en d’autres termes de
montrer que ) et pour cela rappelons que nous avions démontré que :

Nous avons déjà calcule tout à l'heure commençons alors par


calculer :

Posons qui conduit dès lors à :

Or, nous savons (la première intégrale est évidente, la seconde moins mais nous l'avons déjà
calculée un peu plus haut) :

198/2001
Sciences.ch 14/03/2005

Il reste donc à calculer la première intégrale. Pour ce procédons par une intégration par parties
(voir chapitre de calcul différentiel et intégral) :

D'où :

Il vient finalement :

Une signification supplémentaire de dans la fonction est une mesure de la largeur de la


distribution tel que (cela ne peut se vérifier qu'à l'aide d'intégration à l'aide de méthodes
numériques) :

Nous avons aussi la relation:

où FWHM (Full Width at Half Maximum) est la largeur de la distribution à mi-hauteur.

La largeur de l'intervalle a une très grande importance dans l'interprétation des incertitudes
d'une mesure. La présentation d'un résultat comme signifie que la valeur moyenne a
environ 68.3% de chance (probabilité) de se trouver entre les limites de et , ou
qu'elle a 95.5% de se trouver entre et etc.

Cependant, la fonction de distribution de Gauss-Laplace n'est pas tabulée puisqu'il faudrait


autant de table numériques que de valeurs possibles pour la moyenne et l'écart-type .
C'est pourquoi, en opérant un changement de variable, la loi normale générale devient la "loi
normale centrée réduite" où :

- "centrée" signifie soustraire la moyenne (la fonction à alors pour axe de symétrie l'axe
des ordonnées)

199/2001
Sciences.ch 14/03/2005

- "réduite" signifie, diviser par l'écart-type

Par ce cfhangement de variable, la variable est remplacée par la variable aléatoire centrée
réduite :

Si la variable a pour moyenne et pour écart- type alors la variable a pour


moyenne 0 et pour écart-type 1. Nous nous retrouvons dès lors avec la fonction de distribution
dite "loi normale centrée réduite".

Donc la relation:

s'écrit alors (trivialement) plus simplement :

FONCTION UNIFORME

Soient . La fonction:

est une fonction de distribution car elle vérifie :

La fonction uniforme a pour espérance (moyenne) :

et pour variance :

200/2001
Sciences.ch 14/03/2005

signifie qu'en dehors du domaine de définition la fonction de distribution est nulle.


Nous retrouverons ce type de notation dans certaines autres fonctions de distribution.

Exemple : Tracé de la fonction pour :

FONCTION EXPONENTIELLE

Soient . La fonction:

est une fonction de distribution car elle vérifie :

La fonction exponentielle a pour espérance (moyenne) :

201/2001
Sciences.ch 14/03/2005

et pour variance

en utilisant à nouveau et il ne nous reste plus qu'à calculer :

Un changement de variable conduit à :

Une double intégration par parties donne :

D'où il vient dès lors :

Exemple : Tracé de la fonction pour (rouge), (bleu) :

202/2001
Sciences.ch 14/03/2005

FONCTION DE CAUCHY

La fonction:

est une fonction de distribution car elle vérifie :

Exemple : Tracé de la fonction avec

203/2001
Sciences.ch 14/03/2005

La fonction de Cauchy a pour espérance (moyenne) :

et pour variance :

FONCTION BÊTA

Nous définissons la fonction gamma d'Euler comme étant la relation (voir le chapitre de
calcul différentiel et intégral dans la section d'algèbre) :

pour . Nous pouvons démontrer que la fonction ainsi définie est bien définie, c'est à dire

204/2001
Sciences.ch 14/03/2005

l'intégrale existe, pour . Une propriété de la fonction gamma est que


(nous la démontrons en intégrant par parties).

De plus, nous démontrons que :

où :

En faisant le changement de variables :

nous obtenons :

pour l'intégrale interne nous utilisons la substitution et nous trouvons :

La fonction qui apparaît dans l'expression ci-dessus est appelée "fonction bêta" et nous
avons donc :

Pour , considérons maintenant la fonction de distribution :

où :

205/2001
Sciences.ch 14/03/2005

qui est égal à une constante si nous fixons .

Nous vérifions que est une fonction de distribution :

La fonction beta a pour espérance (moyenne) :

et pour variance :

En sachant que et que nous trouvons :

et donc :

Exemple : Tracé de la fonction pour en rouge, en vert,


en noir, en bleu, en magenta,
en cyan, en gris, en turquoise, en jaune,

206/2001
Sciences.ch 14/03/2005

en couleur or :

FONCTION GAMMA

Pour la définition de la fonction gamma voir ci-dessus.

Pour nous considèrons la fonction de distribution :

En faisant le changement de variables nous obtenons :

et donc :

et nous vérifions avec un raisonnement similaire en tout point celui de fonction bêta que
est une fonction de distribution :

207/2001
Sciences.ch 14/03/2005

Exemple : Tracé de la fonction pour en rouge, en vert,


en noir, en bleu, en magenta :

La fonction gamme a pour espérance (moyenne) :

et pour variance :

FONCTION DE KHI-DEUX

208/2001
Sciences.ch 14/03/2005

Nous considèrons la fonction de distribution gamma dans le cas particulier où et


, avec entier positif :

Tous les calculs faits auparavant s’appliquent et nous avons :

Exemple : Tracé de la fonction pour en rouge, en vert, en noir, Bleu :


:

LOI DE STUDENT

La loi de Student est définie par :

est une fonction de distribution car elle vérifie également :

209/2001
Sciences.ch 14/03/2005

C'est une fonction intéressant car son espérance (moyenne) vaut :

et sa variance :

Exemple : Le tracé de la fonction pour en rouge, en vert, en bleu :

LOI DE BENFORD

En 1938, un mathématicien du nom de Franck Benford fait une constatation curieuse. Dans la
bibliothèque de l'université, il remarque que les premières pages des tables de logarithmes
sont nettement plus usées que les dernières.

Seule explication possible : nous avons plus souvent besoin d'extraire le logarithme de
chiffres commençant par 1 que de chiffres commençant par 9, ce qui implique que les
premiers sont "plus nombreux" que les seconds.

Bien que cette idée lui paraisse tout à fait invraisemblable, Benford entreprend de vérifier son
hypothèse. Rien de plus simple : il se procure des tables de valeurs numériques, et calcule le
pourcentage d'apparition du chiffre le plus à gauche. Les résultats qu'il obtient confirment son
intuition:

Chiffe initial Probabilité d'apparition


1 30,1 %
2 17,6 %

210/2001
Sciences.ch 14/03/2005

3 12,5 %
4 9,7 %
5 7,9 %
6 6,7 %
7 5,8 %
8 5,1 %
9 4,6 %

A partir de ces données, Benford trouve expérimentalement que la probabilité O qu'un


nombre commence par le chiffre n (excepté 0) est:

Exemple : tracé de la fonction :

Il convient de préciser que cette loi ne s'applique qu'à des listes de valeurs "naturelles", c'est-
à-dire à des chiffres ayant une signification physique. Elle ne fonctionne évidemment pas sur
une liste de chiffres tirés au hasard.

La loi de Benford a été testée sur toute sorte de table : longueur des fleuves du globe,
superficie des pays, résultat des élections, liste des prix de l'épicerie du coin... Elle se vérifie à
tous les coups.

Elle est évidemment indépendante de l'unité choisie. Si l'on prend par exemple la liste des prix
d'un supermarché, elle fonctionne aussi bien avec les valeurs exprimées en Francs qu'avec les
mêmes prix convertis en Euros.

211/2001
Sciences.ch 14/03/2005

Cet étrange phénomène est resté peu étudié et inexpliqué jusqu'à une époque assez récente.
Puis une démonstration générale en a été donnée en 1996, qui fait appel au théorème de la
limite centrale.

Aussi surprenant que cela puisse paraître, cette loi a trouvé une application : le fisc l'utilise
aux Etats-Unis pour détecter les fausses déclarations. Le principe est basé sur la restriction
vue plus haut : la loi de Benford ne s'applique que sur des valeurs ayant une signification
physique.

S'il existe une distribution de probabilité universelle sur de tels nombres, ils doivent
êtres invariants sous un changement d'échelle tel que:

Si:

alors:

et la normalisation de la distribution donne:

si nous dérivons par rapport à et que nous posons , nous obtenons :

en posant finalement . Nous avons :

Cette équation différentielle a pour solution:

Cette fonction, n'est pas en premier lieu à proprement parler une fonction de distribution de
probabilité (elle diverge) et deuxièment, les lois de la physique et humaine imposent des
limites.

212/2001
Sciences.ch 14/03/2005

Nous devons donc comparer cette distribution par rapport à une référence arbitraire. Ainsi, si
le nombre décimal étudié contient plusieurs puissance de 10 (10 au total: 0,1,2,3,4,5,6,7,9) la
probabilité que le premier chiffre non nul (décimal) soit est donné par la distribution
logarithmique:

Les bornes de l'intégrale sont de 1 à 10 puisque la valeur nulle est interdite.

L'intégrale du dénominateur donne:

L'intégrale du numérateur donne:

Ce qui nous donne finalement:

De par les propriétés des logarithmes (voir le chapitre d'analyse fonctionelle dans la section
d'algèbre du site) nous avons :

Cependant, la loi de Benford ne s'applique pas uniquement aux données invariantes par
changement d'échelle mais également à des nombres de provenant de sources quelconques.
Expliquer ce cas implique une investigation plus rigoureuse en utilisant le théorème de la
limite centrale. Cette démonstration a été effectuée seulement en 1996 par T. Hill par une
approche utilisant la distribution des distributions.

ESTIMATEURS

Soit un ensemble dénombrable. Nous supposons que nous disposons


d'observations qui sont des réalisations de variable aléatoire (non biaisées)
indépendantes et identiquement distribuées de loi de probabilité inconnue.

213/2001
Sciences.ch 14/03/2005

Nous allons chercher à estimer cette loi de probabilité inconnue à partir des observations
. Nous n'allons pas chercher cette loi dans l'ensemble de toutes les probabilités
possibles sur .

Nous allons au contraire supposer que nous possédons une connaissance a priori sur cette loi
de probabilité. Nous allons supposer qu'il existe une partie telle qu'à chaque ,
nous puissions associer une probabilité sur et telle que la probabilité inconnue puisse
s'écrire avec .

Supposons que l'on procède par tâtonnement pour estimer la loi de probabilité inconnue
. Nous essayons une probabilité arbitraire et l'on veut
savoir si ce choix est raisonnable ou loufoque. Une manière de procéder est de se demander si
les observations avaient une probabilité élevée ou non de sortir avec cette
probabilité arbitraire.

Nous devons pour cela calculer la probabilité qu'avaient les observations de

sortir avec . Cette probabilité vaut , en notant la loi de

probabilité associée à . Il serait alors particulièrement maladroit de choisir


comme estimateur de une probabilité telle que la

quantité soit faible. Au contraire, nous allons chercher la probabilité

qui maximise , c'est-à-dire qui rende les observations

le plus vraisemblable possible.

Nous somme donc à chercher le (ou les) paramètre(s) qui maximise(nt) la quantité :

Cette quantité porte le nom de "vraisemblance". C'est une fonction du paramètre et des
observations . La ou les valeurs du paramètre qui maximisent la
vraisemblance sont appelées "estimateurs du maximum de vraisemblance".

Faisons quand même un petit exemple (très classique et utile) avec la fonction de distribution
de Gauss-Laplace :

Soit un -échantillon de variables aléatoires gaussiennes d'espérance et de


variance . Quel est l'estimateur de maximum de vraisemblance de ?

Le paramètre est ici . L'ensemble des paramètres possibles est


. La densité d'une variable aléatoire gaussienne est donnée par :

214/2001
Sciences.ch 14/03/2005

Nous avons donc bien un modèle statistique dominé. La vraisemblance est donnée par:

Maximiser une fonction ou maximiser son logarithme est équivalent donc:

Fixons d'abord l'écart-type. Pour cela, dérivons par rapport à et regardons


pour quelle valeur de la moyenne la fonction s'annule. Il nous reste:

Ainsi :

Fixons maintenant la moyenne. L'annulation de la dérivée de en conduit à :

Ce qui nous permet d'écrire (nous connaisssons déjà par coincïdence théorique l'expression
d'un tel estimateur) :

Cependant, nous n'avons pas encore défini ce qu'était un bon estimateur. Il nous faut
néanmoins préciser dès à présent qu'un estimateur biaisé peut très bien être un bon estimateur,
alors qu'un estimateur sans biais pourra se révéler être un mauvais estimateur. Ce que nous
entendons par là:

- Si un estimateur , vérifie , nous disons que cet estimateur est "sans biais" (il
correspond au paramètre réel)

- Si un estimateur , vérifie , nous alors que cet estimateur est "biaisé".

215/2001
Sciences.ch 14/03/2005

Dans l'exemple précédent, la moyenne est biaisée mais qu'en est-il de la variance ? Or, nous
avons :

L'estimateur de la variance est biaisé. Nous remarquerons au passage qu'un estimateur du


maximum de vraisemblance peut être biaisé. Nous noterons également que la différence
l'estimateur tend vers un estimateur sans biais lorsque le nombre d'essais tend vers l'infini
. Nous disons alors que nous avons un "estimateur asymptotiquement non biaisé" ou
plus simplement "estimateur sans biais" noté E.S.B en abrégé.

Remarque : un estimateur est dit "consistant" s'il converge en probabilité, lorsque ,


vers la vraie valeur du paramètre.

De par les propriétés de l'espérance, nous avons :

Nous avons donc l'estimateur de maximum de vraisemblance :

et l'estimateur sans biais (E.S.B) :

deux relations que nous retrouvons souvent dans les tables et dans les logiciels !

TESTS D'ADÉQUATION

Dans cette partie, nous supposons que la loi de probabilité de la variable aléatoire , dont
nous disposons d'un échantillon, est inconnue. Une première remarque s'impose : les tests
d'adéquation ne permettent pas de trouver la loi d'une variable aléatoire mais seulement
d'accepter ou de rejeter une hypothèse simple émise à priori.

Ainsi, il est nécessaire de faire une étude sommaire préalable de l'échantillon afin de formuler
des hypothèses plausibles quant à la loi de probabilité de :

- La variable aléatoire est-elle discrète ou continue ?

- Est-elle définie pour tout , ou seulement pour positif et différent de zéro ?

216/2001
Sciences.ch 14/03/2005

- L'histogramme en fréquence obtenu est-il symétrique par rapport à la valeur moyenne ?

- Existe-t-il une relation simple entre moyenne et la variance estimées ?

Les réponses à ces différentes questions, de même que la nature de la variable représentée par
permettent dans la plupart des cas d'émettre une hypothèse plausible connaissant les
propriétés et les allures des différentes distributions vues jusque ici.

Considérons maintent un échantillon de réalisations indépendantes de la


variable aléatoire. . Soit la loi de distribution inconnue de . L'hypothèse de départ
sera que la loi de distribution est la vraisemblance . Ceci permet de formuler les
hypothèses (ok/pas ok):

Les paramètres de seront soient connus soit estimés.

A partir de l'échantillon, nous construisons un histogramme en fréquence de classes .


Nous notons le nombre d'observations de faites dans la classe .

Si la variable aléatoire suit bien la loi de vraisemblance alors l'effectif théorique de


la classe est donné par: où est la probabilité pour que la variable aléatoire
suivant la loi prenne une valeur sur le domaine définissant la classe

L'écart entre la réalité issue de l'échantillon et la théorie issue de l'hypothèse est mesurée
par l'indicateur:

Sous l'hypothèse , nous pouvons considérer que l'écart entre distribution théorique
et distribution empirique est distribué normalement.

Dans ces conditions, tend vers la loi du à degrés de liberté où:

= (Nbr. de classes) - 1 – Nbr. de paramètres nécessaires à la spécification complète


de

La région d'acceptation du test est l'intervalle tel que la probabilité d'une


variable du à degrés de liberté prenne une valeur dans cet intervalle soit égale à (
étant l'erreur de première espèce relative au test).

217/2001
Sciences.ch 14/03/2005

Si la valeur de l'indicateur est supérieure à , alors on décide l'hypothèse .

Il n'est guère possible de déterminer l'erreur de deuxième espèce (et donc la puissance du
test), la loi de probabilité de n'étant pas spécifiée sous l'hypothèse . On ne peut donc
pas déterminer la loi de probabilité de l'indicateur sous cette hypothèse.

Pour que la loi (sous l'hypothèse ) de l'indicateur d'écart tende effectivement vers une loi
du , il est nécessaire que l'effectif d'une classe soit en pratique supérieur à 5. Dans le cas
contraire, il faudra procéder à un regroupement des classes jusqu'à ce que cette contrainte soit
satisfaite.

CONTRÔLE DE QUALITÉ

Nous renoncons souvent à un contrôle à 100% à cause du prix. Nous procèdons alors à une
prise d'échantillons. Ceux-ci doivent être présentés, c'est-à-dire quelconque et d'égales
chances. But de la prise d'échantillons : information de la probabilité du taux de défaillances
réel du lot complet sur la base des défaillances constatées sur l'échantillonnage.

Exemple:

Cette probabilité du taux de défaillance réelle se calcule comme suit si, lors d'un
échantillonnage de n pièces parmi un lot total de pièces, on trouve exactement
défectueuses et si p désigne la probabilité d'une pièce défectueuse et le nombre de
pièces défectueuses de lot .

Nous avons donc 5 informations:

étant l'échantillon de pièces

le nombre total de pièces

le nombre de pièces défectueuses sur l'échantillon

la probabilité de défectuosité d'une pièce

le nombre de pièces défectueuses du lot

On considère un lot de pièces contenant pièces dont sont défectueuses et les autres
parfaites. On tire successivement, et sans les remettre dans le lot, pièces. Quelle est la
probabilité que parmi ces pièces, il y en ait qui soient défectueuses?

Nous avons déjà vu que la loi qui s'applique dans ce contexte est la loi géométrique donnée
par (nous l'avons démontré) :

218/2001
Sciences.ch 14/03/2005

qui donne donc la probabilité que pièces défectueuses parmi l'échantillon de pièces.

Mais dans notre cas nous avons:

car identiquement au fait que représente le nombre de pièces non défectueuses parmi
les pièces tirées uniquement, dans notre problème représente lui aussi le nombre de
pièces non défectueuses mais dans le lot total car c'est relativement à la totalité que l'on
souhaite faire une comparaison.

Corollaire:

Nous avons également dans notre contrôle de qualité à poser que:

car identiquement au fait que représente le nombre de pièces non défectueuses dans le
lot total , au contraire dans notre problème d'origine comme on inverse l'objectif nous
allons nous intéresser aux pièces non défectueuses sur l'échantillon qui a été pris au hasard
(pour l'instant tout est une question de mis en rapport logique).

Corollaire:

On a donc finalement:

qui donne la probabilité d'avoir pièces défectueuses dans un échantillon de pièces prises à
partir d'un lot total de pièces.

Ce qui nous intéresse est une tolérance maximale, nous n'allons donc non plus calculer la
simple probabilité de tomber sur pièces défectueuses, mais la probabilité cumulée
(maximale!) qui se calcule dans ce cas particulier comme:

219/2001
Sciences.ch 14/03/2005

Exemple:

Dans un lot de vis, on admet au maximum , c'est-à-dire: pièces


défectueuses. On procède à un échantillonnage de vis. Combien peut-on accepter de
vis défectueuses dans cet échantillonnage si l'on impose que:

Le calcul montre que l'on peut tolérer au pire qu'une pièce soit défectueuse.

COURBE D'EFFICACITÉ

Dans le même contexte que précédemment, on définit la probabilité d'acceptation


où est défini comme le risque du producteur et le nombre de pièces
défectueuses dans l'échantillon comme précédemment:

On peut calculer les différentes courbes d'efficacité en fonction du pourcentage de


défectueux p du lot avec par exemple en admettant un distribution de type Poisonienne. On
distingue alors 2 types:

VALEURS DE NIVEAU DE QUALITÉ ACCEPTABLE (N.Q.A)

220/2001
Sciences.ch 14/03/2005

Après discussions, le producteur et le client fixe un point important de la courbe d'efficacité:


la valeur NQA. Cette valeur indique le pourcentage défectueux en % d'un lot pour que le
lot ait une chance d'être accepté lors d'un contrôle par échantillonnage avec une probabilité
usuelle de 90% (car , est dans ce cas . Ceci signifie que, sur la
courbe d'efficacité de premier type (celle de gauche ci-dessus), on ait au plus défectueux
dans un échantillon de taille n. Afin de limiter les retours, le fournisseur maintien sa qualité
(pourcentage de défectueux du lot) en dessous de la valeur NQA garantie; par ex. à (voir
figure ci-dessous) où seulement défectueux sont admis resp. si la probabilité d'acceptation
est 99%. En pratique, on admet souvent un valeur NQA avec

MOYENNES

La notion de moyenne nous semble très familière et nous en parlons beaucoup sans nous
poser trop de questions. Pourtant il existe divers qualificatifs (nous insistons sur le fait que ce
ne sont que des qualificatifs) pour distinguer la forme de la résolution d'un problème
consistant à calculer la moyenne. Il faut donc être très très prudent quand aux calculs des
moyennes car nous avons une fâcheuse tendance à nous précipiter et à utiliser
systématiquement la moyenne arithmétique sans réfléchir, ce qui peut amener à de graves
erreurs !

Nous verrons ci-dessous différentes moyennes avec des exemples relatifs à l'arithmétique, au
dénombrement, à la physique, à l'économétrie, à la géométrie. Le lecteur trouvera d'autres
exemples en parcourant l'ensemble du site.

Soit des nombres réels, nous avons par définition :

D1. Moyenne arithmétique (triviale) :

D2. La "médiane" ou "moyenne milieu" (triviale) :

221/2001
Sciences.ch 14/03/2005

Soit une suite de valeurs ordonnées , la "médiane" est par définition :

1. la valeur milieu qui coupe la suite en deux parties de cardinaux égaux si est impair

2. la moyenne arithmétique des deux valeurs directement voisines de l'élément

Rappel : est la partie entière d'un valeur donnée

D3. Moyenne quadratique :

peu connue et de faible intérêt mais découle souvent de raisonnement simples dont voici un
exemple:

Soit un carré de côté , et un autre carré de côté . La somme des aires des deux carrés est
égale à :

Au fait, cette moyenne à peu d'intérêt et elle peut être généralisée aussi à des formes de
dimensions plus élevées selon la relation donnée dans la définition.

De plus, et cette moyenne à d'autant moins d'intérêt qu'il suffit de poser et


pour retomber sur un moyenne arithmétique simple.

D4. Moyenne harmonique (triviale) :

peu connue mais découle souvent de raisonnements simples et pertinents dont voici un
exemple :

Soit une distance parcourue dans un sens à la vitesse et dans l'autre (ou pas) à la vitesse
. La vitesse moyenne s'obtiendra en divisant la distance totale par le temps mis à la
parcourir:

222/2001
Sciences.ch 14/03/2005

Si nous calculons le temps mis lorsqu'on parcourt avec une vitesse c'est tout simplement
le quotient:

Le temps total vaut donc:

La vitesse moyenne sera donc bien du type harmonique :

D5. Moyenne géométrique :

peu connue et assez peu rencontrée (mais connue dans le domaine de l'économétrie surtout
quand nous étudierons le rendement géométrique moyen), voyons un exemple de cette
moyenne:

Supposons qu'une banque offre une possibilité de placement et prévoit pour la première année
un intérêt (c'est absurde mais c'est un exemple) de , mais pour la deuxième année
un intérêt de Au même moment une autre banque offre un intérêt constant pour
deux ans: . C'est pareil, dirons-nous un peu rapidement. En fait les deux placements n'ont
pas la même rentabilité.

Dans la première banque, un capital deviendra au bout de la première année:

et la seconde année:

Dans l'autre banque nous aurons au bout d'un an:

et après la seconde année:

223/2001
Sciences.ch 14/03/2005

etc...

Comme vous pouvez le voir le placement ne sera pas identique si contrairement à ce


que vous auriez pu penser au début.

Donc n'est donc pas la moyenne de et .

Posons maintenant:

et

Quelle est en fait la valeur moyenne ?

Au bout de deux ans le capital est multiplié par . Si la moyenne vaut il sera alors
multiplié par . Nous avons donc la relation:

C'est un exemple d'application où nous retrouvons donc la moyenne géométrique.

D6. Moyenne mobile ou moyenne glissante :

La "moyenne mobile" ou "moyenne glissante" est définie par la relation:

lorsque la moyenne est dite "simple", et par la relation :

lorsque la moyenne est dite "pondérée".

Les moyennes mobiles sont particulièrement utilisées en économique, où elles permettent de


représenter un courbe de tendance de moyenne mobile d'un série de valeurs, dont le nombre
de points est égal au nombre total de points de la série de valeurs moins le nombre que vous
spécifiez pour la période.

Une Moyenne Mobile ( ) est une courbe calculée à partir des moyennes des cours d'une
valeur, sur une période donnée: chaque point d'une moyenne mobile sur 100 séances est la
moyenne des 100 derniers cours de la valeur considérée.

Cette courbe, affichée simultanément avec la courbe d'évolution des cours de la valeur,
permet de lisser les variations journalières de la valeur, et de dégager une tendance haussière

224/2001
Sciences.ch 14/03/2005

si la moyenne mobile est croissante avec les cours de la valeur situés au dessus de la Moyenne
Mobile et baissière si la moyenne mobile est décroissante avec les cours de la valeur situés au
dessous de la moyenne mobile

Les moyennes mobiles peuvent être calculées sur différentes périodes, ce qui permet de
dégager des tendances à court terme (20 séances selon les habitudes de la branche), moyen
terme (50-100 séances) ou long terme (plus de 200 séances).

Les croisements des moyennes mobiles par la courbe des cours de la valeur génèrent des
signaux d'achat ou de vente selon les professionnels suivant le cas:

- signal d'achat: lorsque la courbe des cours franchit la MM vers le haut sur de bons volumes
de transactions et que la MM sert de support à la courbe des cours.

- signal de vente: lorsque la courbe des cours franchit la MM vers le bas et que la MM sert de
résistance à la courbe des cours.

D7. Moyenne pondérée :

La moyenne pondérée est utilisée, en géométrie pour localiser le barycentre d'un polygone, en

225/2001
Sciences.ch 14/03/2005

physique pour déterminer le centre de gravité ou en statistique et probabilité pour calculer une
espérance. Nous la calculons ainsi :

Dans le cas général le poids représente l'influence de l'élément par rapport aux autres.

D8. Moyenne fonctionnelle :

La valeur moyenne d'une fonction d'une variable réelle intégrable (voir chapitre de
calcul différentiel et intégral) sur un intervalle est :

PROPRIÉTÉS DES MOYENNES

Voyons maintenant quelques propriétés pertinentes qui relient quelques-unes de ces


moyennes :

P1. Le calcul des moyennes arithmétique, quadratique, géométrique et harmonique peuvent


êtres généralisé à l'aide de la relation suivante :

où nous retrouvons :

1. pour , la moyenne arithmétique

2. pour , la moyenne quadratique

3. lorsque , la limite est la moyenne géométrique

4 . pour , la moyenne harmonique

P2. Soit à démontrer :

Démonstration : tout d’abord, nous prenons 2 nombres réels non nuls et tels que
et nous écrivons :

226/2001
Sciences.ch 14/03/2005

1. La moyenne arithmétique :

2. La moyenne géométrique :

3. La moyenne harmonique :

4. La moyenne quadratique :

Remarque : les comparaisons entre les moyennes précitées et la "médiane" ou encore les
"moyennes glissantes" et "pondérées" n'ont pas de sens c'est pour cela que nous nous
abstenons à les faire.

Prouvons déjà que démontrons cette relation par l'absurde en posant :

Mais comme :

et

Nous avons donc :

Il y donc contradiction et :

227/2001
Sciences.ch 14/03/2005

Ce qui vérifie notre hypothèse initiale :

Regardons maintenant si et démontrons-le par l'absurde en posant :

Or le carré d'un nombre est toujours positif ce qui vérifie notre hypothèse initiale :

Nous prouvons maintenant et démontrons-le par l'absurde en posant :

Or le carré d'un nombre est toujours positif ce qui vérifie notre hypothèse initiale :

Nous avons donc bien :

Démontrons par l'absurde que en posant et que . Nous


avons alors :

Il y a donc contradiction avec l'hypothèse initiale et nous avons donc bien :

Ces inégalités démontrées, nous pouvons alors passer à une figure que nous attribuons à
Archimède pour placer trois de ces moyennes. L'intérêt de cet exemple est de montrer qu'il

228/2001
Sciences.ch 14/03/2005

existe des relations remarquables parfois entre la statistique et le géométrie (fruit du


hasard ???).

Nous allons d'abord poser et est le milieu de . Ainsi, le cercle dessiné


est de centre et de rayon . est l’intersection de la perpendiculaire à passant
par et du cercle (nous choisissons l’intersection que nous voulons). est quant à lui le
projeté orthogonal de sur .

Archimède affirme que est la moyenne arithmétique de et et que est la moyenne


géométrique de et , et la moyenne harmonique de et .

Nous démontrons donc que (trivial) :

Donc est bien la moyenne arithmétique de et .

Ensuite nous avons dans le triangle rectangle :

Puis dans le triangle rectangle nous avons :

Nous additionnons alors ces deux égalités, et nous trouvons :

Nous savons que est sur un cercle de diamètre , donc est rectangle en , donc :

229/2001
Sciences.ch 14/03/2005

Puis nous remplaçons et par et :

Et donc, est bien la moyenne géométrique de et .

Nous reste à prouver alors que est la moyenne harmonique de et :

Nous avons dans un premier temps (projection orthogonale) :

Puis nous avons aussi (projection orthogonale aussi):

Nous avons donc :

et comme , nous avons donc :

est donc bien la moyenne harmonique de et , Archimède ne s’était pas trompé.

CALCULS D'ERREURS

Il est impossible de connaître la valeur exacte d'une grandeur physique expérimentalement, il


est très important donc d'en déterminer l'incertitude.

Nous appelons bien évidemment "erreur", la différence entre la valeur mesurée et la valeur
exacte. Cependant, comme nous ignorons la valeur exacte, nous ne pouvons pas connaître
l'erreur commise quand même…. Le résultat est donc toujours incertain. C'est la raison pour
laquelle nous parlons parfois des "incertitudes de mesure".

Nous distinguons deux types d'incertitudes :

1. Les "erreurs systématiques" : elles affectent le résultat constamment et dans le même sens
(erreurs des appareils de mesures, limites de précision, etc.). Il faut alors éliminer, ou corriger
le résultat, si possible !

230/2001
Sciences.ch 14/03/2005

2. Les "erreurs accidentelles" (statistiques) : il faut alors répéter les mesures, calculer la
moyenne et évaluer l'incertitude en utilisant les outils de statistique.

INCERTITUDES ABSOLUES ET RELATIVES

Si la vraie valeur d'une grandeur est (connue théoriquement) et la valeur mesurée est ,
est "l'incertitude absolue" (l'incertitude dû aux appareils de mesure) telle que :

Le résultat s'écrit alors :

L'incertitude relative est quant à elle définie par :

L'incertitude absolue permet de savoir l'approximation du dernier chiffre significatif de celle-


ci. Par contre, lorsque nous désirons comparer deux mesures ayant des incertitudes absolues
afin de déceler lequel a la plus grande marge d'erreur, nous calculons l'incertitude relative de
ce nombre en divisant l'incertitude absolue par le nombre, et transformé en pourcentage.

ERREURS STATISTIQUES

Dans la plupart des mesures, nous pouvons estimer l'erreur due à des phénomènes aléatoires
par une série de mesures :

Comme nous l'avons vu plus haut, la valeur moyenne arithmétique sera alors :

et l'écart moyen (estimateur biaisé démontré plus haut) :

et l'écart quadratique moyen ou écart-type (estimateur sans biais ou E.S.B) :

et nous avions démontré que l'écart-type de la moyenne était donné par :

231/2001
Sciences.ch 14/03/2005

et comme nous l'avons vu, après un grand nombre de mesures indépendantes, la distribution
des erreurs sur une mesure suit une gaussienne tel que nous puissions écrire :

PROPAGATION DES ERREURS

Soit une mesure et une fonction de . Quelle est l'incertitude sur ?

Lorsque est petit, est remplacé au voisinage de par sa tangente (il s'agit
simplement de la dérivée bien sûr) :

mais si dépend de plusieurs grandeurs mesurées avec les incertitudes :

alors l'erreur maximale possible est alors la différentielle totale exacte (voir chapitre de calcul
différentiel et intégral) :

Ce qui conduit à :

232/2001
Sciences.ch 14/03/2005

CALCUL ALGÉBRIQUE

Dans la section d'arithmétique de ce site, nous avons beaucoup écrit sur différentes théories
utilisant les nombres abstraits afin de généraliser l'étendue de la validité de ces dernières.
Nous avons cependant peu abordé la façon dont nous devions manipuler avec exactitude ces
nombres abstraits. C'est ce que nous allons voir maintenant.

Comme vous le savez peut-être déjà, le nombre peut être envisagé en faisant abstraction de la
nature des objets qui constituent le groupement qu'il caractérise; et ainsi qu'à la façon de
codifier (chiffre arabe, romain, ou autre système...). Nous disons alors que le nombre est
"abstrait" et lorsque nous manipulons ces types de nombres nous disons que nous faisons du
"calcul algébrique" ou encore du "calcul littéral".

Pour les mathématiciens il n'est pas avantageux de travailler avec des valeurs numériques
(1,2,3…) car ils représentent uniquement des cas particuliers. Ce que cherchent les physiciens
théoriciens ainsi que les mathématiciens, se sont des relations applicables universellement
dans un cadre le plus général possible.

Ces nombres abstraits appelés aujourd'hui communément "variables" sont très souvent
représentés par:

1. L'alphabet latin ( )

2. Par l'alphabet grec, qui est lui particulièrement utilisé pour représenter des opérateurs
mathématiques plus ou moins complexes (comme le sont le + pour l'addition, le - pour la
soustraction par exemple).

3. Par l'alphabet hébraïque (à moindre mesure)

Bien que ces symboles puissent représenter n'importe quel nombre, il en existe quelques uns
qui peuvent représenter des constantes dites Universelles (vitesse da la lumière , la constante
gravitationnelle , ...).

Remarque : il semblerait que les lettres pour représenter les nombres ont été employées pour
la première fois par Viète.

Habituellement, les premières lettres de l'alphabet latin désignent les nombres


connus, et les dernières les nombres inconnus.

Une variable est donc susceptible de prendre des valeurs numériques différentes. L'ensemble
de ces valeurs peut varier suivant le caractère du problème considéré.

Rappels (nous avions déjà défini cela dans le chapitre traitant des nombres dans la section
d'arithmétique) :

D1. nous appelons "domaine de définition" d'une variable, l'ensemble des valeurs numériques
qu'elle est susceptible de prendre.

233/2001
Sciences.ch 14/03/2005

Soit deux et deux nombres tel que . Alors :

D2. nous appelons "intervalle fermé d'extrémité et ", l'ensemble de tous les nombres
compris entre ces deux valeurs comprises et nous le désignons de la façon suivante :

D3. nous appelons "intervalle ouvert d'extrémité et ", l'ensemble de tous les nombres
compris entre ces deux valeurs non comprises et nous le désignons de la façon suivante:

D4. nous appelons "intervalle fermé à gauche, ouvert à droite" la relation suivante :

D5. nous appelons "intervalle ouvert à gauche, fermer à droite" la relation suivante :

Remarque : si la variable peut prendre toutes les valeurs négatives et positives possibles nous
écrivons dès lors: où le symbole " " signifie une infinité. Evidemment il peut y
avoir des combinaisons d'intervalles ouverts et infinis à droite, fermé et limité gauche et
réciproquement.

ÉQUATIONS ET INÉQUATIONS

L'algèbre élémentaire consiste à partir des définitions de l'addition, soustraction,


multiplication, et puissance et de leurs propriétés (associativité, distributivité, commutativité,
élément neutre, inverse, …) - ce qui constitute selon l'ensemble sur lequel nous travaillons un
corps ou un groupe commutatif abélien ou non (voir chapitre de théorie des ensembles) - de
manipuler selon un but fixé des "équations algébriques".

Nous allons définir de suite après ce qu'est une équation et une inéquation mais nous
souhaitons d'abord définir certaines de leurs propriétés :

Soit et deux polynômes (ou monômes) quelconques - voir définitions un peu plus loin -
les expressions :

Vérifient les propriétés suivantes :

P1. Nous pouvons toujours ajouter ou ôter aux deux membres d'une inéquation ou équation un
même polynôme en obtenant une inéquation ou équations équivalente (c'est à dire avec les
mêmes solutions ou réductions).

P2. Si nous multiplions ou si nous divisons les deux membres d'une inéquation par un même
nombre positif nous obtenons également une inéquation ou équation équivalente (nous avons

234/2001
Sciences.ch 14/03/2005

déjà vu cela).

P3. Si nous multiplions ou si nous divisons les deux membres d'une inéquation par un même
nombre négatif et si nous inversons le sens de l'inégalité, nous obtenons alors une inéquation
ou équation équivalente.

ÉQUATIONS

Définition : une équation est une relation d'égalité entre des valeurs toutes abstraites
(autrement dit : deux expressions algébriques) ou non toutes abstraites (dès lors nous parlons
d'équations à une inconnue, deux inconnues, trois inconnues, ... ) reliées entre elles par des
opérateurs divers.

La maîtrise parfaite de l'algèbre élémentaire est fondamentale en physique-mathématique.


Comme il existe une infinité de types d'équations, nous ne les présenterons pas ici. C'est le
rôle de l'enseignant dans les "petites" classes d'entraîner le cerveau de ses élèves pendant
plusieurs années (2 à 3 ans en moyenne) à résoudre énormément de configurations différentes
d'équations algébriques (exposées sous forme de problèmes de tous les jours, géométriques ou
purement mathématiques) et ce afin que les élèves manipulent ces dernières sans erreurs en
suivant un raisonnement logique et rigoureux (ce n'est qu'en forgeant que l'on devient
forgeron...)!!!

Un professeur et un établissement scolaire sont irremplaçables !!!

Comme nous n'aimons pas les exemples pratiques, nous avons tenté, ci-dessous, de faire une
généralisation simpliste des règles de base de l'algèbre élémentaire. Cette générlisation sera
d'autant plus simple à comprendre que le lecteur aura l'habitude de manipuler des quantités
abstraites :

Ainsi, soit des nombres abstraits pouvant prendre n'importe quelle valeur
numérique. Soit la lettre majuscule grecque "Xi" représentant un ou plusieurs nombres
abstraits quelconques opérants entre eux d'une façon quelconque tel que nous ayons des
monômes (un seul nombre abstrait) ou polynômes (poly = plusieurs) algébriques différents
distinguables ou non (nous faisons un abstrait de l'abstraction).

Propriétés :

P1. Nous aurons toujours si et seulement si le terme à gauche de l'égalité représente


le même terme que celui qui est à droite de l'égalité. Si cette condition est satisfaite nous
avons alors :

P2. Sinon:

où nous excluons le cas particulier où tous les sont nuls.

P3. Nous avons :

235/2001
Sciences.ch 14/03/2005

qui vérifie la symbolique de l'équation dans le cas seulement où les éléments sont
identiques entre eux (nous excluons le dénominateur nul)

P4. Nous avons sinon (dans le cas où tous les sont strictement différents) :

mais nous pouvons peut quand même avoir :

dans le cas où une simplification des termes contenus dans les amènent à une identité de la
relation binaire non nécessairement égale à l'unité.

P5. Si tous les sont strictement identiques, alors :

Mais... il est possible que dans l'expression précédente certains différents s'annulent
cependant entre eux dès que leur multiplication mutuelle est égale à l'unité.

P6. Sinon nous avons que :

qui ne peut s'écrire autrement mais il peut arriver que avec le à droite de
l'égalité identique à aucun, un ou encore plusieurs du membre gauche de l'égalité.

P7. Nous pouvons avoir :

sans que nécessairement les exposants du numérateur ou dénominateur soient égaux (nous
excluons le dénominateur nul)

P8. Sinon nous pouvons avoir :

ou

mais il n'est cependant bien évidemment pas impossible d'avoir quand même ou
(nous excluons exclut le dénominateur nul)

236/2001
Sciences.ch 14/03/2005

P9. Nous avons si tous les sont strictement identiques, alors :

Mais... il est également possible que dans l'expression précédente certains différents
s'annulent cependant entre eux dès que leur divisions mutuelle est égale à l'unité (nous
excluons le dénominateur nul)

P10. Sinon nous avons :

mais il n'est cependant pas impossible d'avoir quand même avec le à


droite de l'égalité identique à aucun, un ou plusieurs du membre gauche de l'égalité ou
même

P11. Soit représentant indifféremment l'addition ou la soustraction nous avons :

Si tous les sont identiques entre eux ou si la combinaison d'un nombre indéterminés de
sont égaux au présent à droite de l'égalité.

P11'. Sinon quoi nous aurons :

il peut cependant arriver que le à droite de l'égalité soit identique à aucun, un ou plusieurs
du membre gauche de l'égalité.

P12. Nous pouvons également avoir :

Quelque que soient les (égaux ou non) où les puissances (égales ou non) donnés.

A partir de la connaissance des ces 13 règles (peut être en avons nous oubliés quelques unes),
nous pouvons résoudre, simplifier ou montrer qu'une équation possède des solutions ou non
par rapport à un problème ou énoncé donné.

Ainsi, soit une opérande ou une suite d'opérations quelconques sur une ou des abstractions
d'abstrait et parmi tous les , une (ou plusieurs) dont la ou les valeurs numériques est ou
sont inconnues (les autres étant connues). Alors, nous devons pouvoir trouver ou démontrer
qu'une équation du type:

possède ou non de solutions.

237/2001
Sciences.ch 14/03/2005

Dans le cas d'une équation avec la valeur absolue du type :

avec le deuxième membre strictement positif (sinon la relation précédente serait un non sens)
cela équivaut bien sûr d'après la définition de la valeur absolue à écrire :

et

Remarques :

R1. la présence de la valeur absolue dans une équation algébrique dont nous cherchons les
solutions double souvent le nombre de solutions.

R2. une équation est dite "équation conditionnelle", s'il y a des nombres dans l'ensemble de
définition des expressions qui ne sont pas solutions (ce qui au fait le cas le plus fréquent).
Inversement, si tout nombre de l'ensemble de définition est solution de l'équation alors
l'équation est dit "équation identité".

Nous pouvons parfois avoir à résoudre (et non à simplifier) un "système d'équations". Qu'est-
ce que c'est ? : C'est un ensemble d'au moins 2 équations à résoudre (et non à simplifier). La
particularité du système ? : L'ensemble des solutions du système est l'intersection des
solutions de toutes les équations à résoudre. Quelle est leur utilité ? : Elle est sans fin, ces
systèmes permettent de résoudre des problèmes faisant intervenir des applications des
mathématiques à d'autres domaines. A cause de la variété illimitée des applications, il est
difficiele d'établir des règles précises pour trouver des solutions. La marche à suivre que voici
peut-être utile pour autant bien sûr que le problème puiss être formulé sous forme
d'équations :

1. Si le problème est posé par écrit, le lire plusieurs fois soigneusement, réfléchir aux faits
donnés ainsi qu'à la quantité d'inconnues à trouver (résumer l'énonce sur une feuille de papier
est souvent plus qu'utile pour les gros problèmes).

2. Choisir une lettre qui représente la quantité inconnue. C'est l'un des pas décisifs dans la
recherche de la solution. Des phrases contenant des mots comme : trouver, quoi, combien, où,
quand ; devraient vous renseigner sur la quantité inconnue

3. Faire éventuellement un dessin (de tête ou sur papier) avec des légendes

4. Dresser une liste des faits connus et des relations concernant les quantités inconnues. Une
relation peut être décrite par une équation dans laquelle apparaissent d'un seul ou des deux
côtés du signe égal des énoncés écrits à la place des lettres ou des nombres.

5. Après avoir analyse la liste de l'étape 4, formuler une équation qui décrive précisement ce
qui est énoncé avec des mots.

6. Résoudre l'équation formulée à l'étape 5.

7. Contrôler les solutions obtenues à l'étape 6 en se reportant à l'énoncé de départ du


problème. Vérifier que la solution concorde avec les conditions de l'énoncé.

238/2001
Sciences.ch 14/03/2005

La méthode résolution des systèmes d'équations sont traités en détails dans le chapitre traitant
des algorithmes dans la section d'analyse numérique du site (vous y verrez la méthode) et
également dans le chapitre d'algèbre linéaire de la présente section (vous comprendez pour la
méthode est telle qu'elle est).

INÉQUATIONS

Précédemment nous avons vu q'une équation était une égalité composée de différents calculs
avec différents termes (dont au moins une "inconnue" ou "un chiffre abstrait" ), et que
"résoudre" une équation revenait à calculer la valeur de l'inconnue de l'égalité, alors que la
"simplifier" revenait à minimiser mathématiquement le nombre de termes (en factorisant ou
autre..) et que développer revenait à mettre à plat tous les termes.

Pourquoi avons-nous besoin de rappeler la définition d'une équation ? Tout simplement parce
que pour l'inéquation, c'est la même système. La différence ? Si l'équation est une égalité,
l'inéquation est une inégalité : comme l'équation, l'inéquation est composée de différents
calculs avec différents termes reliés entre eux par des opérateurs quelconques, dont au moins
une inconnue.

Différence entre égalité et inégalité:

- Egalité : nous savons qu'elle est symbolisée par le signe =

- Inégalité : l'inégalité est l'utilisation des symboles de relation d'ordre symbolisée par les
signes .

Lorsque nous résolvons une inéquation, notre inconnue peut-avoir plusieurs valeurs qui
satisfont à l'inéquation. Nous disons alors que la solution de l'inéquation est un "ensemble de
valeurs".C'est la différence fondamentale entre une égalité et une inégalité !

Rappelons les signes que nous pouvons rencontrer dans une inéquation sont :

: se lit "strictement inférieur à "ou "strictement plus petit que". Dans ce cas, la valeur
butoire numérique n'est pas comprise dans le domaine des valeurs solutions de l'inéquation et
nous représentons alors le domaine avec un crochet ouvert : ]....

: se lit "strictement supérieur à" ou "strictement plus grand que". Dans ce cas, la valeur
butoire numérique n'est également pas comprise dans le domaine des valeurs solutions de
l'inéquation et nous représentons alors le domaine avec un crochet fermé : [....

: se lit "inférieur ou égal à "ou "plus petit ou égal à". Dans ce cas, la valeur butoire
numérique est comprise dans le domaine des valeurs solutions de l'inéquation et nous
représentons alors le domaine avec un crochet fermé : [....

: se lit "supérieur ou égal à "ou "plus grand ou égal à" . Dans ce cas, la valeur butoire
numérique est également comprise dans le domaine des valeurs solutions de l'inéquation et
nous représentons alors le domaine avec un crochet fermé : [....

Nous renvoyons le lecteur au début de ce chapitre où nous avions définit la manière d'écrire
des domaines de définition.

239/2001
Sciences.ch 14/03/2005

L'objectif des inéquations est la plupart du temps (excepté le côté esthétique) d'avoir au moins parmi
l'ensemble des termes une valeur numérique qui permet de définir le domaine de solution (des tous
les termes abstraits de l'inéquation) qui satisfont l'inéquation.

Il existe plusieurs façon de représent les domaines de définition des variables qui satisfont à
l'inéquation. Nous allons voir un travers un petit exemples quelles sont ces possibilités :

Soit une inéquation linéaire (du premier degré) en à une seule inconnue à laquelle nous
imposons un contrainte particulière arbitraire pour l'exemple (évidemment l'expression peut
contenir plus de termes...) :

nous avons dans l'inéquation ci-dessus déjà simplifié tous les termes qui étaient superflus.

Résoudre l'inégalité revient à chercher la valeur de inférieure à 2. Bien sûr, il n'existe pas un
seule solution dans mais un ensemble de solutions et c'est cela même le principe des
inéquations.

Pour résoudre l'inéquation, nous observons d'abord le type d'inégalité imposée ("stricte" ou
"ou égal"). Ensuite, dans les petites classes (et pas seulement parfois…) nous représentons
l'ensemble par un tableau tel que :

- 0 +
................... ......|...... ...................

Nous savons intuitivement que la solution de notre inéquation regroupe toutes les valeurs
inférieures à 2 (2 exclu des solutions) et ce jusqu'à - . Nous écrivons alors cet "intervalle" ou
"domaine" :

Ensuite, nous pouvons représenter graphiquement l'ensemble des solutions (cela aide à
comprendre et prépare l'étudiant à la résolution de systèmes d'équations et d'inéquation
et aux variations de fonctions). Pour cela, nous reprenons le modèle de schéma du
système numérique, et y plaçons notre notre valeur butoir (nous n'en avons qu'une
dans cet exemple mais parfois il peut y en avoir plusieurs du au fait qu'il y un
singularité ou des racines pour certaines valeurs du domaine de définition), soit 2 :

- 0 2 +
................... ......|...... ......|...... ...................

et enfin, nous délimitons au stylo de couleur (…) l'ensemble des solutions de - à 2 exclu :

- 0 2 +
................... ......|...... ......[...... ...................

A la valeur 2, nous n'oublions pas de marquer le signe ....[ pour montrer que cette valeur est
exclue des solutions. Et voilà, le tour est joué et le concept est extrapolable a des inéquation
beaucoup plus complexes.

240/2001
Sciences.ch 14/03/2005

Remarques :

R1. parfois au lieu de représenter les tableaux comme nous l'avons fait, certains professeurs
(c'est un choix complétement artistique) demandent à leur élèves d'hachurer les cases du
tableau et d'y dessiner de petits ronds, ou encore se servent de petites flèches, ou encore de
dessinger le graphique des fonctions de l'inéquation (cette dernière méthode est certes
esthétique mais prend du temps..).

R2. dans le cadre d'inéquations de degré supérieur à 1, il faut (voir plus loin ce que cela
signifie exactement) d'abord déterminer les racines de l'inéquation qui permettent de
déterminer les intervalles et ensuite par essais successifs, déterminer quels intervalles sont à
rejeter ou a conserver.

Nous pouvons également (au même titre que les équations) parfois avoir à résoudre un
"système d'inéquations". Qu'est-ce que c'est ? : C'est un ensemble d'au moins 2 inéquations à
résoudre. La particularité du système ? : L'ensemble des solutions du système est
l'intersection des solutions des toutes les inéquations à résoudre.

Autrement dit, la méthode est la même que la précédente, à la différence que notre tableau
(représentant les domaines de solutions) comportera une ligne supplémentaire par inéquation
supplémentaire dans le système plus une ligne de synthèse qui est la projection des domaines
de solutions possibles du système.

Ainsi, un système à inéquations aura un tableau récapitulatif à lignes.

Mathématiquement, les domaines (car il peuvent y en avoir plusieurs qui sont disjoints)
peuvent s'écrire comme un ensemble des domaines :

Les systèmes d'inéquations sont très fréquents dans beaucoup de problèmes de la


mathématique, physique, économétrie, etc… Il est donc important de s'entraîner à les résoudre
pendant vos études avec l'aide de votre professeur.

Par exemple, voici une possible représentation du domaine de solutions d'un système
d'inéquations pris du chapitre traitant de l'algorithmique dans la section d'analyse numérique
où nous étudions la "recherche opérationnelle".

241/2001
Sciences.ch 14/03/2005

IDENTITÉS REMARQUABLES

Les identités remarquables sont des "formules magiques", qui nous servent le plus souvent
pour la factorisation ou la résolution d'équations algébriques.

Rappelons certaines notions qui ont déjà été vues dans le chapitre de théorie des ensembles de
la section d'arithmétique (nous supposons le concept d'élément neutre conne puisque déjà
défini) :

Commutativité :

et

Associativité :

et

Distributivité :

Les mêmes observations sont valables avec l'opération de soustraction bien évidemment dans
les domaines de définition adéquats.

Nous pouvons vérifier avec des valeurs numériques (en remplaçant chaque nombre abstrait
par un nombre choisi au hasard), ou par distribution (ce serait mieux, ainsi vous êtes sûr
d'avoir compris ce dont quoi nous parlions), que les identités algébriques suivantes sont
vérifiées (ce sont les plus connues) :

242/2001
Sciences.ch 14/03/2005

Remarque: nous pouvons très bien poser que où nous avons bien
évidemment posé que (nous faisons un "abstrait d'abstraction" ou plus
couramment : un "changement de variable"...)

Nous pouvons remarquer que pour calculer le développement de , nous utilisons le


développement de , c'est-à-dire calculé avec la valeur précédente de .

Nous remarquons : et

P1. Les puissances de décroissent de à0( , donc il n'est pas noté dans le dernier
terme)

P2. Les puissances de croissent de 0 à ( , donc il n'est pas noté dans le dernier
terme)

P3. Dans chaque terme, la somme des puissances de et est égal à

P4. Les coefficients multiplicateurs devant chaque terme se calculent en faisant la somme des
coefficients multiplicateurs de deux termes du développement obtenu avec la valeur
précédente de (voir la figure ci-dessous).

Les coefficients binomiaux peuvent êtres obtenus par le "triangle de Pascal".

Dont chaque élément est donné par (voir le chapitre traitants des probabilités et statistiques
dans la section d'arithmétique pour l'origine mathématique de cette relation):

avec .

Nous pouvons alors facilement vérifier que:

243/2001
Sciences.ch 14/03/2005

Pour ce qui est des identités remarquables avec des valeurs négatives, il est inutile d'apprendre
par coeur l'emplacement du signe "-". Il suffit de faire un changement de variable et une fois
le développement fait de refaire le changement de variable dans l'autre sens. Exemple :

et ainsi de suite pour toute puissance .

Nous pouvons bien sûr mélanger les genres tels que (fameux exemple particulier) :

et quelques relations remarquables pratiques supplémentaires qui sont souvent utilisées dans
les petites classes pour les exercices :

et autre cas très fréquent que l'on résout par essais successifs lorsque le professeur donne le
polynôme à décomposer (si quelqu'un connait un méthode directe nous sommes preneurs) :

Bien sûr, il y en a encore un beaucoup plus grand nombre de relations utiles (dont une partie
découlent d'une généralisation de celle présentées ci-dessus) que le lecteur découvrira par ses
propres raisonnements et en fonction de sa pratique.

Remarques :

R1. il est bien sûr possible de multiplier des polynômes entre eux et de distribuer les termes
multiplicatifs. Inversement, il est souvent demané aux élèves des petites classes de faire la
procédure inverse ("factoriser" ou "décomposer" un polynôme) afin qu'ils s'habituent à la
manipulation des identités remarquables. Décomposer en un produit de facteurs est une
opération importante en mathématiques, puisqu'il est ainsi possible de réduire l'étude
d'expressions compliquées à l'étude de plusieurs expressions plus simples.

R2. un polynôme ayant ses coefficients dans un ensemble de nombres est dit "premier" ou
"irréductible" sur , s'il est de degré positif, et s'il ne peut pas être écrit comme un produit de
deux polynômes eux-mêmes irréductibles de degré positif à coefficients aussi dans .

244/2001
Sciences.ch 14/03/2005

POLYNÔMES

Définition (simpliste) : nous appelons "polynôme algébrique " une fonction de degré
qui s'écrit :

ou de façon plus condensée par :

Remarque : le en indice du est parfois omis car explicitement défini dans l'énoncé.

Définition (ensembliste) : Soit un anneau (voir le chapitre de théorie des ensembles) et


. "L'anneau des polynômes" en indéterminées (ou variables) est défini
de la façon suivante :

Définition : Un "monôme" est une expression de la forme :

où et sont des entiers . Ainsi, un polynôme est une somme d'un nombre
fini de monômes.

Définition : Nous nommons "racine" ou "zéro de polynôme", la ou les valeurs telles que
à la condition qu'au moins un des avec soit non nul.

Si le polynôme admet une ou plusieurs racines nous pouvons alors factoriser ce dernier
sous la forme:

Les identités algébriques sont des exemples de types particuliers de fonctions polynomiales.
Considérons une constante et une variable et :

Nous voyons que si nous posons :

nous retrouvons :

245/2001
Sciences.ch 14/03/2005

Définition : le "coefficient dominant" d'un polynôme est le coefficient de son monôme de plus
haut degré.

ÉQUATIONS DIOPHANTIENNES

Si nous généralisons le concept de polynôme avec plusieurs variables tel que:

nous appelons alors "équation diophantienne" une équation de la forme:

où est un polynôme à coefficients entiers (ou rationnels) dont nous cherchons les radicaux
strictement dans ou . Des exemples classiques d'équations diophantiennes sont :

- les triplets pythagoriciens (ou triades) tel que:

- le grand théorème de Fermat dont la conjecture dit que si est supérieur à 2, il n'existe pas
d'entiers non nuls pour lesquels:

Pour la démonstration il faudra attendre un peu que les auteurs du site aient le temps de la
comprendre également (...).

POLYNÔMES DE DEGRÉ 1

Soit :

Si alors le polynôme admet une unique racine :

tel que .

Remarques:

R1. il faut toujours prendre l'habitude de vérifier l'existence de la solution dans l'équation
d'origine pour s'assurer de la validation du domaine de définition de la solution.

246/2001
Sciences.ch 14/03/2005

Effectivement, il existe des solutions aux développement de résolution d'une équation qui ne
vérifient pas l'équation d'origine et c'est ce que nous nommons des "solutions étrangères" ou
encore "racines étrangères".

R2. si les coefficients du polynômes de degré 1 sont tous réels alors la racine est réelle.

R3. Si un des coefficients est complexe alors la racine est nécessairement complexe.

R4. Si les deux coefficients sont complexes, alors la racine est soit complexe soit réelle.

POLYNÔMES DE DEGRÉ 2

Soit :

Si alors une des racines satisfera:

Il peut donc y avoir deux racines que l'on note :

tel que et où nous définissons un nouveau terme appelé "déterminant" qui allège
souvent les écritures :

Remarque importante: il faut aussi toujours prendre l'habitude de vérifier l'existence de la


solution dans l'équation d'origine pour s'assurer de la validation du domaine de définition de
la solution au cas où la solution serait "étrangère".

Si le polynôme du deuxième degré en comporte deux racines, nous pouvons alors factoriser
de manière irréductible :

Nous démontrons, à partir de l'expression des racines, sans trop de peine les relations dites "de
Viète":

et

247/2001
Sciences.ch 14/03/2005

Remarques :

R1. si le polynôme n'admet pas de zéro et ne se décompose pas en un produit de


facteurs réels du premier degré mais de facteurs complexes. Ainsi (il est nécessaire d'avoir lu
la partie traitant des nombres complexes dans le chapitre des nombres de la section
d'arithmétique du site) :

et nous savons que nous pouvons écrire tout nombre complexe sous une forme condensée
(formule d'Euler) et comme les racines complexes d'un polynôme du second degré sont
conjugées (nous connaissons ce terme) nous avons :

où (rappel) est le module des racines complexes (module égal pour les deux racines) et
l'argument des racines complexes (égales en valeur absolue).

R2. si alors le polynôme possède une seule solution qui est bien évidemment :

R3. si alors le polynôme possède deux solution définies par les relations générales que
nous avons déjà données précédemment.

Evidemment de ce qui a été vu jusqu'à maintenant on en tire que si un polynôme admet une
ou plusieurs racines alors ce même polynôme est divisible par .

Il existe un polynôme de degré deux dont la solution est fameuse de par le monde. Ce nombre
est appelé la "divine proportion" et se retrouve en architecture, esthétique ou encore en
phyllotaxie (c'est-à-dire dans la disposition des feuilles autour de la tige des plantes).

Ce nombre vaut:

et appartient à l'ensemble des nombres irrationnels car il ne peut pas s'écrire sous forme de
fraction entière, mais c'est un nombre algébrique puisqu'il est la solution positive de
l'équation:

POLYNÔMES DE DEGRÉ 3

Bien que rare à résoudre en physique théorique ou lors de ses études, la résolution d'un
polynôme du 3ème degré est assez récréative et montre un bon exemple d'un raisonnement

248/2001
Sciences.ch 14/03/2005

mathématique déjà mature (nous devons ces développements à Scipione del Ferro et Jérome
Cardan mathématiciens du XVIème siècle…).

Soit l'équation :

avec les coefficients tous dans (pour commencer…). Dans un premier temps, le lecteur
pourra voir que les raisonnements que nous avons appliqués pour les polynômes de degrés
inférieurs coincent rapidement (excepté pour des cas particuliers simplistes bien sûr…).

Nous allons contourner le problème par des changements de variables subtils mais tout à fait
justifiés.

Ainsi, rien ne nous empêche de poser que :

et que en divisant le polynôme de degré 3 par d'écrire :

En regroupant les termes de même ordre :

et posons (rien, mais alors absolument rien ne nous l'interdit) :

où (1) est connu si et seulement si est connu et où sont de tout façon connus.

249/2001
Sciences.ch 14/03/2005

Le polynôme :

étant de degré impair, il admet comme permet de le constater tout tracé visuel d'un tel
polynôme à coefficient réels aux moins un racine réelle, appelée "racine certaine" (vérifiez
vous verrez bien par une représentation graphique d'un polynôme de degré impair que cela est
trivial).

Maintenant, nous faisons un autre changement de variable (nous en avons tout à fait le droit)
subtil : en imposant la condition que doivent êtres tels que (rien ne
nous empêche d'imposer une telle contrainte) et nous alors :

Dès lors nous avons :

Nous pouvons très bien faire une analogie entre les deux relations (1') et (2') et les relations de
Viète que nous avions obtenues pour le polynôme de degré 2 qui rappelons le étaient :

et

à la différence que nous avons maintenant (nous adoptons une autre notation pour ces racines
intermédiaires) et ce qui nous donne pour le polynôme en imposant
(toujours par analogie) une nouvelle équation :

dont sont les racines.

Cette dernière équation à pour discriminant :

Prenons maintenant le cas par cas :

- Si , l'équation en admet deux solutions dont la somme va nous donner


indirectement la valeur de puisque par définition et et . Nous

250/2001
Sciences.ch 14/03/2005

voyons que nous avons tous les ingrédients pour trouver la première racine de l'équation
initiale qui sera la racine certaine. Ainsi :

comme et que les racine supérieurs sont cubiques nous avons nécessairement
si tous les coefficient de l'équation originale sont bien dans .

- Si , nous le savons, l'équation en admet une racine double et puisque le discrimant


comporte une puissance carrée de cela signifie nécessairement que est négatif.

Le polynôme admet donc luis aussi une racine double et de même pour l'équation
d'origine. Nous avons vu par ailleurs que pour un polynôme du second degré si le
discriminant est nul les racines sont :

alors par analogie :

- Si nous devons à nouveau utiliser les nombres complexes comme nous l'avons fait
lors de notre étude du polynôme de degré 3. Ainsi, nous savons que l'équation en admet
deux solutions complexes telles que :

et à nouveau comme les racines sont conjuguées nous pouvons écrire sous la forme condensé :

et comme :

nous avons donc :

Comme sont conjugués, nous avons nécessairement .

251/2001
Sciences.ch 14/03/2005

POLYNÔMES CYCLOTOMIQUES

Si est un entier naturel, nous appelons "polynôme cyclotomique" ce que nous notons
traditionnellement et définissons comme étant le produit de tous les monômes en
où est un racine primitive n-ième de l'unité de .

Ainsi, l'ensemble des racines n-ièmes de l'unité est l'ensemble:

qui est un groupe cyclique (voir la théorie des ensembles dans la section d'arithmétique du
site).

Nous appelons alors "racine primitive n-ième de l'unité" ou "R.P.N." tout élément de ce
groupe l'engendrant.

De plus les éléments de sont du type avec . Nous pouvons même écrire :

Un petit exemple de polynôme cyclotomique:

Les racines quatrième de l'unité sont 1, -1, et (autrement dit chacun de ces nombres mis
à la puissance 4 donne 1). Elle forment le groupe et celui-ci peut-être engendré que par
et .

Donc un polynôme cyclotomique est le produit de facteurs qui s'écrit:

avec et étant premier par rapport à .

Les polynômes ont un grand nombre de propriétés que nous n'aborderons pas ici puisque ce
site ne se veut pas être un ouvrage de mathématiques supérieure.

POLYNÔMES DE LEGENDRE

Définition : les polynômes de Legendre sont définis par (lire de préférence les chapitres de
calcul différentiel et intégral ainsi que d'analyse fonctionnelle avant) :

252/2001
Sciences.ch 14/03/2005

où est donc un polynôme de degré . Nous retrouverons ces polynômes dans la résolution
d'équations différentielles en physique (propagation de la chaleur, physique quantique,
chimique quantique, etc.).

Démontrons que selon la définition du produit scalaire fonctionnel (voir chapitre d'analyse
fonctionnel et de calcul vectoriel) que les polynômes de Legendre sont orthogonaux.

Démonstration : soit un polynôme de degré . Il suffit de montrer que ,


c'est-à-dire que est orthogonal à l'espace des polynômes de degré inférieur à . Nous
avons en effet :

en intégrant par parties nous obtenons :

en continuant de la sorte nous obtenons après intégrations par parties :

Voici quelques propriétés des :

P1.

Démonstration :

et par la formule de Leibniz (voir chapitre de calcul différentiel et intégral) nous avons :

d'où :

253/2001
Sciences.ch 14/03/2005

P2. si est pair :

Démonstration : Si est pair, est une fonction paire et donc :

est paire.

P3. si est impair.

Démonstration : Si est impair, est impaire et donc :

est impaire.

Nous allons à présent démontrer la validité de la relation de récurrence suivante pour les
(relations que nous utiliserons en physique) :

pour .

Démonstration : est un polynôme de degré , il existe dès lors des tel que ce
polynôme peut s'exprimer comme combinaisons linéaire de la famille de polynômes
constituant la base orthonormale engendre :

nous pouvons dès lors écrire :

mais nous choisissons (parce que est dès lors de degré ):

254/2001
Sciences.ch 14/03/2005

Donc c'est-à-dire que nous devons avoir . Par suite :

(*)

Par les propriétés des polynômes de Legendre vues précédemment, nous pouvons écrire les
égalités :

et

d'où :

et

Le coefficient dominant de est défini (rappelons-le) par le coefficient du monôme du plus


grand degré. Ainsi, il est donné par :

Remarque : le lecteur vérifiera au besoin pour un donné que

la relation (*) nous impose que la coefficient dominant du polynôme de la combinaison


linéaire soit égal au coefficient dominant du polynôme (nous avons éliminé le qui
se simplifie :

après simplification, nous obtenons : :

255/2001
Sciences.ch 14/03/2005

et ce qui donne finalement facilement :

(*) devient dès lors :

Voici les six premiers polynômes de Legendre :

256/2001
Sciences.ch 14/03/2005

ANALYSE FONCTIONNELLE

L'analyse fonctionnelle est la branche des mathématiques et plus particulièrement de l'analyse


qui en rapport avec l'étude des espaces de fonctions. Elle prend ses racines historiques dans
l'étude des transformations telles que la transformation de Fourier et dans l'étude des
équations différentielles et des intégrales. A ce titre elle enloge tellement de domaines qu'il est
difficile d'argumenter ce qu'elle fasse l'objet d'un chapitre car elle ferait plutôt celle d'un
domaine. Par ailleurs, c'est à cause de cette difficulté de cerner exactement le domaine qu'elle
touche que le lecteur trouvera le théorème fondamental de l'analyse dans le chapitre de calcul
différentiel et intégral plutôt qu'ici.

Pourquoi ceci dit utilisons nous le terme "analyse" dans le cas particulier des fonctions. La
raison vient pour des raisons historiques à l'étude des divers phénomènes de la nature et la
résolution de divers problèmes techniques et par conséquent de mathématiques, qui nous
amènent souvent à considérer la variation d'une grandeur en corrélation avec la variation
d'une autre ou de plusieurs autres grandeurs. Pour étudier ces variations, de nombreux outils
sont à la disposition de tout à chacun :

- L'ingénieur phyisicien a par exemple fréquemment recours à la représentation graphique


(système d'axes cartésien, polaire, logarithmique... concepts sur lesquels nous reviendros plus
en détail) pour déterminer la relation (ou "loi") mathématique qui lient les différentes
grandeurs entre elles. Certes ce genre de méthode est (parfois...) esthétique mais les étudiants
savent bien combien il est pénible en laboratoire de devoir porter des points sur une feuille de
papier ou à l'ordinateur. C'est malheureusement une étape nécessaire (mais dont il faudrait
éviter de faire une utilisation abusive) pour comprendre comment nos prédecesseurs
travaillaient et ont obtenu les résultats qui nous aident aujourd'hui dans nos avancées en
physique théorique.

- Le mathématicien et le phyisicien théoricien ont habituellement horreur d'avoir recours aux


méthodes papier-crayon-gribouillage. Quoiqu'il en soit, le rôle du mathématicien où du
physicien est de développer de nouvelles théories à l'aide d'axiomes ou de principes
mathématiques ce qui ne devrait nécessiter aucunement le recours à la représention graphique
et à l'accès aux mesures expérimentales qui y sont souvent rattachées.

Remarque : avant de commencer la lecture de ce qui va suivre, il peut être utile de rappeler au
lecteur que la définition du concept de "fonction" et propriétés élémentaires y relatives est
donné dans le chapitre de théorie des ensembles dans la section d'arithmétique.

REPRÉSENTATIONS

Nous allons voir dans ce qui va suivre, dans un premier temps, comment représenter
différentes grandeurs liées de façon tabulaire et graphique (eh oui! il faut bien car cela aide à
comprendre) et ensuite comment analyser mathématiquement les propriétés de ces
représentations uniquement à l'aide d'outils mathématiques abstraits.

Remarque: quand nous définissons la notion de "fonction", nous admettons parfois qu'à
chaque valeur de prise dans un certain domaine correspond non pas une valeur , mais
plusieurs ou même une infinité. Dans ce cas, la fonction est dite "multivalente", tandis que la
fonction précédemment définie est dite "univalente".

REPRÉSENTATION TABULAIRE

257/2001
Sciences.ch 14/03/2005

Parmi le mode de représentation visuel des fonctions (nous nous restreignons dans un premier
à l'étude d'une fonction bivalente), la plus intuitive et la plus ancienne est celle où nous
disposons dans la colonne ou la ligne d'un tableau de façon ordonnée les valeurs de la variable
indépendante et les valeurs correspondantes, dites "variables transformées" de la
fonction dans une autre colonne ou ligne alignée.

Telles sont par exemple, les tables des fonctions trigonométriques, les tables logarithmiques,
etc. et au cours de l'étude expérimentale de certains phénomènes des tables qui expriment la
dépendance fonctionnelle existant entre des grandeurs physiques mesurées tel que les relevés
de la température de l'air enregistrés dans une station météorologique durant une journée.

Bien évidemment, ce concept est généralisable à toute fonction multivalente quelque soit son
ensemble de définition.

Cependant, cette méthode elle est laborieuse et ne permet pas de voir directement le
comportement de la fonction et donc une analyse visuelle simple et intéressante de ses
propriétés. Elle a pour avantage quand même de ne pas nécessites d'outils spéciaux ou de
connaissances mathématiques poussées.

REPRÉSENTATION GRAPHIQUE

Les nombres naturels, relatifs, réels ou purement complexes peuvent tous êtres représentés le
plus simplement du monde par des points sur un axe numérique (ligne droite) infini.

Pour ce faire, nous choisissons sur cet axe:

1. un point appelé "origine"

2. un sens positif, que nous indiquons par une "flèche horizontale"

3. une unité de mesure (représenté habituellement par un petit trait vertical : la "graduation")

Tel que :

Le plus souvent nous disposons (par tradition) l'axe horizontalement et choisissons la


direction de gauche à droite.

Le point représente très fréquemment le nombre zéro mais nous pourrions très bien choisir
de mettre l'origine ailleurs.

Il est évident que le fait que les ensembles de nombres dont nous avons parlé soient ordonnés
implique que tout nombre est représenté par un seul point de l'axe numérique. Ainsi, deux
nombre réels distincts correspondent deux points différents de l'axe numérique.

Ainsi, il existe une correspondance biunivoque entre tous les nombres et tous les points de
l'axe numérique (dans le cas des nombres réels ou complexes, il correspond non pas un
nombre à chaque graduation mais un nombre à chaque point de l'axe). Ainsi, à chaque nombre

258/2001
Sciences.ch 14/03/2005

correspond un point ou une graduation unique et inversement à chaque point ou graduation


correspond un seul nombre dont il est l'image. Rappelons que c'est une : correspondance
biunivoque (concept que nous avons déjà défini en théorie des ensembles).

Dans le cas, toujours, d'une fonction bivalente, nous pouvons à chaque valeur de la variable
reportée sur un axe horizontal (appelé "axe des abscisses" ou "axe des ") faire
correspondre sa valeur au travers de sa fonction :

reportée sur un axe vertical (appelé "axe des ordonnées" ou "axe des ") qui passe par le
croisement défini par l'origine tel que (exemple arbitraire) :

L'ensemble des points du plan noté ou encore (cette dernière notation


étant plus rare), dont les abscisses représentent par tradition les valeurs de la variable
indépendante et les ordonnées les valeurs correspondantes de la fonction, est appelé
"graphique" de cette fonction.

Dans le cas d'une représentation par un système de coordonnées rectangulaire (cartésien,


polaire ou logarithmique) comme la figure ci-dessus, nous pouvons observer que l'ensemble
du plan des coordonnées est séparé en quatre surfaces que nous avons pour habitude d'appeler
"quadrants".

Remarques :

R1. lorsque nous souhaitons mettre en évidemence un point particuler de la fonction


représentée, nous y dessinons un petit rond tel que présenté ci-dessus.

259/2001
Sciences.ch 14/03/2005

R2. pour résoudre les équations polynomiales du second degré, il est fréquent dans les petites
classes que le professeur demande en plus à ses élèves d'une expression algébrique des racines
de :

données par, rappelons-le :

une résolution graphique où les deux racines (dans le cas où il y en a deux distinctes) sont
données par l'intersection de la parabole avec l'axe des ordoonées (bien sûr si l'équation n'a
pas de solutions, il n'y a pas d'intersection...) :

La représentation graphique étant généralisable aux équations polynomiales du 3ème, 4ème et


5ème degré (nous démontrerons bien plus loin, à l'aide de la théorie de Galois qu'il n'est pas
possible d'obtenir un expression algébrique des racines d'une équation polynômiale du 5ème
degré et supérieur).

R3. lorsque nous avons besoin pour une raison quelconque de calculer (restreignons nous
pour l'instant au plan) la distance entre deux points, il convient d'applique le théorème de
pythagore (démontré dans la section de géométrie) tel que soit trois points sur un
plan dans lequel a été défini un repère tel que présenté ci-dessous :

260/2001
Sciences.ch 14/03/2005

Si et (comme sur la figure ci-dessus), les points sont les sommets


d'un triangle rectangle. Par application du théorème de Pythagore :

Sur la figure, nous voyons que :

et

Puisque , nous pouvons écrire :

Si , nous nous retrouvons avec une relation appelée "norme" (ou plus simplement
aussi : distance) dans le cadre de l'étude de l'analyse vectoriel (voir le chapitre qui y est
consacré)..

Bien évidemment, si nous considérons deux points , nous pouvons


déterminer si un troisième point est sur la médiatrice (voir la section de géométrie)
des deux premiers et qu'il suffit pour cela que bien évidemment (par définition même de la
médiatrice) :

Comme sont connus, nous pouvons facilement exprimer une expression


analytique (ou également "fonction") de la médiatrice du type :

261/2001
Sciences.ch 14/03/2005

où sont des constantes et où tout point qui satisfait cette relation, qui est en l'occurrence
l'équation d'une droite, se trouve sur la médiatrice.

R4. Toute fonction du type :

avec est l'équation analytique d'un droite de pente et d'ordonnée à l'origine (quand
)

Si :

la droite est horizontale et inversement, si :

la droite est une verticale.

R5. Si nous considérons à nouveau deux points qui définissent un


segment de droite, nous avons bien évidemment le point milieu qui est donné par :

Bien évidemment, dans le cas d'une fonction trivalente (tri-dimensionnelle), le principe reste
le même à la différence que le nombre de quadrants double. Par exemple (c'est toujours joli à
regarder...) :

262/2001
Sciences.ch 14/03/2005

Cette méthode de représentation et d'analyse d'une fonction était longue à mettre en place
mais avec l'aide des ordinateurs ce problème est en ce 21ème siècle assez bien résolu.
Cependant, bien que cette méthode permette visuellement et rapidement de déduire certaines
propriétés de la fonction (et outre le fait qu'elle donne parfois de jolies figures) à pour
désavantage d'être limité a 1, 2 ou 3 dimensions à cause de nos propres limites humaines de
perception (quoique...).

PROPRIÉTÉS DES GRAPHIQUES

P1. Le graphique est dit "symétrique par rapport à l'axe des ordonnées" si le changement de
en ne modifie pas l'équation tel que :

P2. Le graphique est dit "symétrique par rapport à l'axe des abscisses" si le changement de
en ne modifie pas l'équation tel que :

263/2001
Sciences.ch 14/03/2005

P3. Le graphique est dit "symétrique par rapport à l'origine" si le changement simultané de
en et de en ne modifie pas l'équation tel que :

P4. Soit une fonction , si nous ajoutons une constante à cette fonction tel que
nous écrivions :

Alors le graphique de est déplacé ou "translaté" verticalement vers le haut d'une distance
tel que :

et inversement si mais que :

alors le graphique est bien évidemment translaté verticalement vers le bas.

Nous pouvons aussi envisager des translation horizontales de graphiques. Précisement, si


, alors est translaté horizontalement vers la droite si nous écrivons :

et inversement, translaté horizontalement vers la gauche, si nous écrivons :

264/2001
Sciences.ch 14/03/2005

Pour étirer ou comprimer verticalement un graphique, il suffit de multiplier la fonction


par une constante et respectivement ou tel que :

et pour étirer ou comprimer horitzontalement un graphique, il suffit de même, de multiplier la


fonction par une constante et respectivement ou tel que :

Remarque : tranlater, étirer, comprimer un graphique ou lui faire subit une symétrie c'est le
transformer. Le graphique résultant de ces transformations est appelé le "transformé" du
graphique de départ.

REPRÉSENTATION ANALYTIQUE

Le mode de représentation analytique est de loin le plus utilisé et consiste à représenter toute
fonction en une "expression analytique" qui est la notation mathématique symbolique et
abstraite de l'ensemble des opérations mathématiques connues que l'on doit appliquer dans un
certain ordre à des nombres et des lettres exprimant des grandeurs constantes ou variables que
nous cherchons à analyser.

Remarquons que par ensemble des opérations mathématiques connues, nous envisageons non
seulement les opérations mathématiques vues dans la section arithmétique (addition,
soustraction, extraction de la racine, etc.) mais également toutes les opération qui seront
définies au fur et à mesure dans le présent site internet.

Si la dépendance fonctionnelle (dans le cas particulier et simpliste d'un fonction


bivalente) est telle que est une expression analytique, nous disons alors que la fonction "
de " est "donnée analytiquement". Voici quelques exemples d'expressions analytiques:

, ,

Remarque : lorsque nous avons déterminer l'équation de la médiatrice, nous avons obtenu une
expression analytique de la droite visuelle qui l'a caractérise sous la forme d'une fonction du
type :

qui rappelons-le, est donc l'équation d'une droite (ou plus simplement : une "équation
linéaire") sur un plan dont si deux points sont connus, la pente est donnée
par le rapport de l'accroissement vertical sur l'acroissement horizontal tel que :

265/2001
Sciences.ch 14/03/2005

Une application sympathique et triviale consiste à démontrer que deux droites non verticales
sont parallèles si et seulement si elles ont la même pente. Ainsi, soit deux droites données par
les équations :

Les droites se coupent en un point si et seulement si les valeurs de sont égales pour
un certain , c'est-à-dire :

La dernière équation peut être résolue par rapport à si et seulement si . Nous


avons donc montré que les droites se coupent si et seulement si . Donc, elles ne
se coupent pas (elles sont parallèles) si et seulement si .

De façon assez simple en appliquant le théorème de Pythagore, il n'est pas compliqué de


déterminer que l'équation d'un cercle de centre à pour équation (nous avons pour
habitude en mathématique de ne pas expliciter pour l'équation du cercle ainsi, l'équation de
ce dernier est visuellement beaucoup plus esthétique et parlante)

Dans ces exemples les fonctions sont exprimées analytiquement par une seule formule (nous
appelons "formule" l'égalité entre deux expressions analytiques) qui définit dans un même
temps le "domaine naturel de définition" des fonctions.

Définition : le "domaine naturel de définition" d'une fonction donnée par une expression
analytique est l'ensemble des valeurs pour lesquelles l'expression du membre droit a une
valeur bien déterminée.

Par exemple, la fonction :

est définie pour toutes les valeurs de , excepté la valeur où nous avons une singularité
(division par zéro).

Remarque : il existe une infinité de fonction et nous ne pouvons toutes les exposer ici,
cependant nous en rencontrerons plus d'un milier sur l'ensemble du site et cela devrait
amplement suffire à se faire une idée de leur étude.

FONCTIONS

Définitions :

266/2001
Sciences.ch 14/03/2005

D1. Nous disons que est une fonction de et nous écrirons , etc., si à
chaque valeur de la variable appartenant à un certain domaine de définition (ensemble) ,
correspond une valeur de la variable dans un autre domaine de définition (ensemble) . Ce
que nous notons dans le cas d'une fonction univalente :

La variable est appelée "variable indépendante" ou "variable d'entrée" et "variable


dépendante".

La dépendance entre les variables et s'appelle une "dépendance fonctionnelle". La lettre


, qui entre dans la notation symbolique de la dépendance fonctionnelle, indique qu'il faut
appliquer certaines opérations à pour obtenir la valeur correspondant . Nous écrivons
parfois au lieu de ; dans ce cas la lettre exprime en même temps la
valeur de la fonction et le symbole des opérations appliquées à .

Remarque : comme nous l'avons vu lors de notre étude de la théorie des ensembles, une
application (ou fonction) peut-être injective, bijective ou surjective. Il convient donc que le
lecteur dont ces notions ne sont pas connues aille en priorité lire ces définitions.

D2. L'ensemble des valeurs pour lesquelles la valeur de la fonction est donnée par la
fonction est appelé "domaine d'existence" de la fonction (ou domaine de définition de la
fonction).

D3. La fonction est dite "croissante" si à une plus grande valeur de la variable
indépendante correspond une plus grande valeur de la fonction (de l'image). Nous définissons
de manière analogue mais inverse la fonction "décroissante". Une fonction "constante" est une
fonction pour laquelle à toute valeur de la variable indépendante correspond toujours une
même image constante.

D4. La fonction est dit "périodique" s'il existe un nombre constant tel que la
valeur de la fonction ne change pas quand nous ajoutons (ou l'on retranche) le nombre à la
variable indépendante tel que: . La plus petite constante satisfaisant à cette
condition est appelée "période" de la fonction. Elle est fréquemment notée en physique.

D6. En calcul différentiel et intégral, l'expression :

avec est d'un intéret particulier. Nous l'appellons un "quotient d'accroissement" (nous
reviendrons beaucoup plus en détail sur ce sujet lors de notre étude du calcul différentiel et
intégral).

D7. Nous utilisons certaines propriétés des fonctions pour faciliter leur représentation
graphique. En particulier, une fonction est dite "paire" si pour tout dans
son domaine de définition. Une fonction est dite "impaire" si pour tout dans
son domaine de définition.

267/2001
Sciences.ch 14/03/2005

Théorème : Toute fonction est la somme d'une fonction paire et d'une fonction
impaire .

Démonstration : Posons :

alors :

Si nous sommons, nous avons dès lors :

et en soustrayant :

Il existe donc bien une décomposition paire et impaire de toute fonction.

D8. De façon générale, si et sont des fonctions quelconques, nous utilisons la


terminologie et les notations données dans le tableau suivant suivant :

Terminologie Valeur de la fonction


Somme
Différence
Produit

Quotient

Les domaines de définition de , , sont l'intersection des domaines de


définition de et de , c'est-à-dire les nombres qui sont communs aux deux domaines
de définition. Le domaine de définition de est quant à lui le sous-ensemble de
comprenant tous les de tels que .

D9. Soit une fonction de et une fonction de la variable , alors dépend alors de
et nous avons ce que nous appelle une "fonction composée" et que nous notons:

ou

Pour la dernière notation, il faut lire " rond " et ne pas confondre le "rond" avec la
notation du produit scalaire que nous verrons en analyse vectorielle.

268/2001
Sciences.ch 14/03/2005

ILe domaine de définition de la fonction composée est soit identique au domaine tout entier
de définition de la fonction , soit à la partie de ce domaine dans laquelle les valeurs
de sont telles que les valeurs correspondantes appartiennent au domaine de définition
de cette fonction.

Le principe de fonction composée peut être appliquée non seulement une fois, mais un
nombre arbitraire de fois.

Si ne dépend pas d'une autre variable (ou qu'elle n'est pas elle même une fonction
composée), on dit alors que est une "fonction élémentaire".

Les principales fonctions élémentaires sont des fonctions dont l'expression analytique est l'une
des suivantes:

1. La "fonction puissance" :

où est un nombre positif différent de 1.

2. La "fonction exponentielle" :

où est un nombre positif différent de 1.

3. La "fonction logarithmique" :

où la base du logarithme est un nombre positif différent de l'unité (cette fonction sera
définie rigoureusement un peu plus loin)

Remarque : les fonctions exponentielles et logarithmiques sont appelées parfois des


"fonctions transcendantes"

4. Les "fonctions trigonométriques" :

...

Remarque : nous avons déjà défini rigoureusement ces fonctions dans le chapitre traitant de la
trigonométrie.

5. Les "fonctions polynomiales" :

où sont des nombres constants appelés coefficients; est un entier positif que

269/2001
Sciences.ch 14/03/2005

nous appelons "degré du polynôme". Il est évident que cette fonction est définie pour toutes
les valeurs de , c'est-à-dire qu'elle est définie dans un intervalle infini.

6. Les "fractions rationnelles" :

7. Les "fonctions algébriques" sont définies par le fait que la fonction est le résultat
d'opérations d'addition, de soustraction, de multiplication, de division, de variables élevées à
une puissance rationnelle non entière.

LIMITE ET CONTINUITÉ DES FONCTIONS

Nous allons considérer maintenant des variables ordonnées d'un type spécial, que nous
définissons par la relation "la variable tend vers une limite". Dans la suite de ce cours, la
notion de limite d'une variable va jouer un rôle fondamental, étant intimement liée aux
notions de base de l'analyse mathématique, la dérivée, l'intégrale, etc.

Définition: Le nombre est appelé la "limite" de la grandeur variable , si, pour tout nombre
arbitrairement petit , nous pouvons indiquer une valeur de la variable telle que toutes
les valeurs conséquentes de la variable vérifient l'inégalité :

Si le nombre est la limite de la variable , nous disons que " tend vers la limite ".

Nous pouvons définir également la notion de limite en partant de considérations géométriques


(cela peut aider à mieux comprendre... quoique pas toujours...) :

Le nombre constant est la limite de la variable , si pour tout voisinage donné, aussi petit
qu'il soit, de centre et de rayon , nous pouvons trouver un valeur telle que tous les
points correspondant aux valeurs suivantes de la variable appartiennent à ce voisinage
(notions que nous avons défini précédemment). Géométriquement nous représentons cela
ainsi:

Remarque: Il est trivial que la limite d'une grandeur constante est égale à cette constante,
puisque l'inégalité est toujours satisfaite pour arbitraire.

Il découle également de la définition de la limite qu'une grandeur variable ne peut pas avoir
n'importe comment deux limites. En effet, si et avec , doit
satisfaire simultanément aux deux inégalités suivantes :

270/2001
Sciences.ch 14/03/2005

et

pour arbitrairement choisi. Mais si nous faisons une représentation géométrique identique à
la précédente, nous voyons assez aisément que cela est impossible si :

Il ne faut également pas s'imaginer que chaque variable doit nécessairement avoir une limite.

Définition: La variable tend vers l'infini, si pour chaque nombre positif donné nous
indiquons une valeur de à partir de laquelle toutes les valeurs conséquentes (suivantes) de
la variable vérifient l'inégalité .

Nous pouvons vérifier ce genre de cas dans les suites arithmétiques, géométriques, ou
harmoniques où chaque terme de la progression est une valeur que prend la variable .

La variable "tend vers plus l'infini", ou si pour arbitraire, à partir d'une


certaine valeur, toutes les valeurs conséquentes de la variable vérifient l'inégalité .
C'est typiquement le genre de considération que nous avons pour des progressions divergentes
vers l'infini ou à partir d'un certain terme de valeur égale à tous les termes suivant sont
supérieurs à .

La variable tend vers moins l'infini ou si pour arbitraire, à partir d'une


certaine valeur, toutes les valeurs suivantes de la variable vérifient l'inégalité .

Définition: Soit une fonction définie dans un voisinage du point ou en certains


points de ce voisinage. La fonction tend vers la limite lorsque
tendant vers , si pour chaque nombre positif , aussi petit qu'il soit, nous pouvons
indiquer un nombre positif tel que tous les différents de et vérifiant l'inégalité
satisfont également :

L'inégalité permet d'exprimer le "côté" ou le "sens" depuis lequel nous venons


avec notre . Car sur le système d'axe représentant des valeurs ordonnées, nous pouvons,
pour une valeur donnée, venir de sa gauche ou de sa droite pour se rapprocher d'elle
(imaginez-vous au besoin, un bus qui peut venir depuis un côté ou un autre de la route tant
que la distance qui le sépare à l'arrêt qui nous intéresse est inférieur à ).

Si est la limite de la fonction quand , nous écrivons alors sur ce site en tout les
cas:

Pour définir le côté depuis lequel nous venons en appliquant la limite, nous utilisons une

271/2001
Sciences.ch 14/03/2005

notation particulière (rappelons que cela permet de connaître de quel côté de la route vient
notre bus).

Ainsi, si tend vers la limite quand tend vers un nombre en ne prenant que des
valeurs plus petites que , nous écrirons alors:

(remarquez le petit – en indice) et nous appellerons la "limite à gauche" de la fonction


au point (car rappelez vous que l'axe des ordonnées va de à , donc les "petites
valeurs" par rapport à une valeur donnée, se trouvent à gauche). Si prend des valeurs plus
grande que , nous écrirons alors:

(remarquez le petit + en indice) et nous appellerons la "limite à droite" de la fonction au


point .

Définition: la fonction tend vers la limite quand si pour chaque nombre


positif aussi petit qu'il soit on peut indiquer un nombre positif N tel que pour toutes les
valeurs de vérifiant l'inégalité , l'inégalité

Exemple:

Montrons que (nous supposons le résultat connu pour l'instant):

Il faut démontrer que, quel que soit , l'inégalité sera satisfaite dès que ,

où est défini par le choix de . L'inégalité précédente est évidemment équivalente à

, qui est satisfait si nous avons :

Nous admettons que l'exemple et la méthode sont discutables mais nous verrons plus tard les
outils mathématiques adéquats pour arriver rigoureusement, sans magouilles et hypothèses de
départ, au résultat obtenu précédemment.

La signification des symboles et , rend évidente celle des expressions :

" tend vers quand " et " tend vers quand "

272/2001
Sciences.ch 14/03/2005

que nous notons symboliquement par:

et

Nous avons étudié le cas où la fonction tend vers une certaine limite quand ou
. Considérons maintenant le cas où la fonction tend vers l'infini quand la
variable varie d'une certaine manière.

Définition : La fonction tend vers l'infini quand , autrement dit est


infiniment grande quand , si pour chaque nombre positif , aussi grand qu'il soit,
nous pouvons trouver un nombre tel que pour touets les valeurs de différentes de
et vérifiant la condition , l'inégalité est satisfaite.

Si tend vers l'infini quand , on écrit:

Si tend vers l'infini quand , en ne prenant que des valeur positives ou que des
valeurs négatives, on écrit respectivement :

et

Si la fonction tend vers l'infini quand on écrit:

et en particulier, on peut avoir:

, , ,

Il peut arriver que la fonction ne tende ni vers une limite finie, ni vers l'infini quand
(par exemple ), la fonction est alors dite "bornée".

Définition: La fonction est dite "bornée" dans le domaine de définition de la variable ,


s'il existe un nombre positif tel que pour toutes les valeurs de x appartenant à ce domaine,
l'inégalité est vérifiée. Si un tel nombre n'existe pas, on dit que la fonction
n'est pas bornée dans ce domaine.

Exemple: La fonction définie dans l'intervalle infini est bornée,


puisque pour toutes les valeurs de ,

Remarques :

R1. Lorsque la limite d'une fonction tends vers une constante quand , alors

273/2001
Sciences.ch 14/03/2005

la représentation graphique de cette fonction nous amène à dessiner une droite horizontale que
nous appelons "asymptote horizontale" et dont l'équation est :

R2. Lorsque la limite d'une fonction tends vers quand , alors la


représentation graphique de cette fonction nous amène à dessiner une droite verticale que
nous appelons "asymptote verticale" et dont l'équation est :

R3. Lorsque la limite d'une fonction est égale à une valeur ni infinie, ni finie (asymptote
ni horizontale, ni verticale) quand , alors la représentation graphique de cette
fonction nous amène à dessiner une autre asymptote donnée par l'équation d'une droite que
nous appelons "asymptote oblique" et dont l'équation est du type :

Nous n'avons pas étudier ce gendre d'asymptotes pour l'instant car elles nécessitent si nous
désirons nous passer d'une représentationg graphique du calcul différentiel que nous verrons
au chapitre suivante.

LOGARITHMES

Nous avons longuement hésité à mettre la définition des logarithmes dans le chapitre traitant
du calcul algébrique. Après un moment de réflexion, nous avons décidé qu'il valait mieux la
mettre ici car pour bien la comprendre, il faut avoir connaissance des concepts de limite,
domaine de définition et fonction exponentille. Nous espérons que notre choix vous
conviendra au mieux.

Soit la fonction exponentielle (bijective) de base quelconque , où notée :

pour laquelle il correspond à chaque nombre réel , exactement un nombre positif


(l'ensemble image de la fonction est dans ) tel que les règles de calcul des puissances soient
applicables (voir le chapitre traitant du calcul algébrique).

Nous savons que pour une telle fonction, que si , alors est croissante et positive
dans , et si , alors est décroissante et positive dans .

Remarques :

R1. si , lorsque décroit par valeurs négatives, le graphique de tend vers l'axe des
. Ainsi, l'axe des tend est une asymptote horizontale. Lorsque croît par valeurs positives,
le graphique montre rapidement. Ce type de variation est caractéristique de la "loi de
croissance exponentielle" et est quelque fois appelée "fonction de croissance". Si
, lorsque croît, le graphique tend asymptotiquement vers l'axe des . Ce type de

274/2001
Sciences.ch 14/03/2005

variation est connue sous le nom de "décroissance exponentielle".

R2. en étudiant , nous exclusons le cas et . Notons que si , alors n'est


pas un nombre réel pour de nombreuses valeurs de (nous rappelons que l'ensemble image
est contraint à ). Si , n'est pas défini. Enfin, si , alors pour tout
et le graphique de est une droite horizontale.

Puisque la fonction exponentielle est bijective alors il existe une fonction réciproque
et appelée "fonction logarithme" de base notée :

Et donc :

si et seulement si

En considérant comme un exposant, nous avons les propriétés suivantes :

Propriétés Jusitification

Remarques :

R1. le mot "logarithme" signifie "nombre du logos", "logos" signifiant "raison" ou "rapport".

R2. les fonctions logarithme et exponentielle sont définies par leur base (le nombre ).
Lorsqu'on utilise un base de puissance de 10 (10, 100, 1000,…) on parle alors de "système
vulgaire" car ils ont pour logarithme des nombres entiers successifs.

R3. la partie entière du logarithme s'appelle "la caractéristique".

Il existe deux types de logarithmes que l'on retrouve presque exclusivement en mathématiques
et physique le logarithme en base dix et le logarithme en base (ce dernier est fréquemment
appelé "logarithme naturel" ou plus exactement pour des raisons historiques justifiées
"logarithme népérien"). Historiquement, c'est à John Napier (1550-1617) dont le nom latinisé
est "Neper" que l'on doit l'étude des logarithmes et le nom aux "logarithmes néperien".

En base 10:

abusivement noté .

275/2001
Sciences.ch 14/03/2005

base (eulérienne) :

historiquement notée (le "n" signifiant "népérien")

En français pour la fonction logarithmique en base 10 il faut pour calculer se


poser la question suivante : à quelle puissance doit on élever 10 pour obtenir ?

Formellement, cela consiste à résoudre l'équation: ou sinon avec étant


connu et donc .

Pour la fonction logarithmique en base eulérienne (ou dite également "base nepérienne") il
faut pour calculer se poser aussi la question suivante : à quelle puissance
devons nous élever le nombre pour obtenir ?

Formellement, cela consiste à résoudre l'équation : ou sinon avec étant


connu et donc .

Mais quel est donc ce nombre "eulérien" ? Pourquoi le retrouve-t-on si souvent en physique et
en mathématiques? D'abord déterminons l'origine de sa valeur :

Pour cela, il nous faut déterminer la limite de :

avec et quand .

L'intérêt que nous avons à poser le problème ainsi c'est que s'il nous faisons tendre la
fonction écrite précédemment tend vers et cette fonction a pour propriété particulière de
pouvoir se calculer plus ou moins facilement pour des raisons historiques à l'aide du binôme
de Newton.

Donc d'après le développement du binôme de Newton nous pouvons écrire :

Ce développement, est similaire au développement de Taylor de certaines fonctions pour des


cas particulier de valeurs de développement (d'où la raisons pour laquelle nous retrouvons ce
nombre eulérien dans beaucoup de d'endroits que nous découvrirons au fur et à mesure).

En effectuant certaines transformations algébriques évidentes, nous trouvons:

276/2001
Sciences.ch 14/03/2005

Nous voyons de cette dernière égalité que la fonction est croissante quand croît.

En effet, quand nous passons de la valeur à la valeur chaque terme de cette somme
augmente:

, etc.

Montrons que la grandeur variable est bornée. En remarquant que ,

, etc. on obtient donc:

D'autre part:

Nous pouvons donc écrire l'inégalité:

Les termes soulignés constituent une progression géométrique de raison et dont le


premier terme est 1. Par suite:

Par conséquent nous avons :

Nous avons donc prouvé que la fonction est bornée.

277/2001
Sciences.ch 14/03/2005

La limite tend donc vers le nombre dont la valeur est

Nous pouvons alors définir la "fonction exponentielle naturelle" (réciproque de la fonction


logarithme néperienne) définie par :

ou également parfois notée :

Le nombre et la fonction qui permet de le déterminer sont très utiles. Nous les retrouvons
dans tous les domaines de la mathémtique et de la physique.

Les logarithmes ont plusieurs propriétés. Les voici (nous nous référons à une base
donnée):

Si nous posons et nous avons donc :

Si nous avons le cas particulier alors:

Cherchons à exprimer sous une forme différente. Posons ce qui


nous amène au développement:

Cherchons à exprimer maintenant avec sous un forme différente. Posons :

ce qui nous amène à:

278/2001
Sciences.ch 14/03/2005

Il y a une relation assez utilisée en physique relativement aux changements de bases


logarithmiques. La première relation est triviale et découle des propriétés algébriques des
logarithmes:

La seconde relation:

est un peu moins triviale et nécessite peut-être une démonstration.

Nous avons d'abord les équations équivalentes (de la première relation ci-dessus):

et

et nous procédons comme suit:

Ce qui nous amène finalement à:

PRODUIT SCALAIRE FONCTIONNEL

Si le lecteur n'a pas encore parcouru le chapitre de calcul vectoriel et la partie y traitant du
produit scalaire vectoriel, nous ne serions que trop recommander sa lecteur sans quoi la
lecture de ce qui va suivre risque d'être un peu incompréhensible.

Nous nous placons dans l'espace des fonctions continues de l'intervalle


dans muni du produit scalaire définit par (nous retrouvons la notation spécifique du produit
scalaire à sa version fonctionnelle comme nous en avions fait part lors de notre définition du
produit scalaire vectoriel):

279/2001
Sciences.ch 14/03/2005

Une famille de polynômes orthogonale est une famille comme nous pouvons en faire
l'analogie avec le produit scalaire vu en calcul vectoriel, une famille de
polynômes tels que :

si

Nous rappelons qu'une famille orthogonale est libre (voir chapitre de calcul vectoriel).

Le développement suivant va nous rappeller le procédé de Gram-Schmidt (voir chapitre de


calcul tensoriel) pour construire une famille orthogonale :

Soit une famille de polynômes linéairement indépendants définis sur et


l'espace vectoriel engendré par cette famille. La famille définie par
récurrence de la manière suivante :

et

est orthogonale et engendre .

Démonstration : Montrons par récurrence sur que est une famille orthogonale
qui engendre le même espace que . L'assertion est vérifiée pour .
Supposons l'assertion vérifiée pour , pour nous avons :

est donc orthogonale. Pour finir, l'égalité :

montre que et engendrent le même espace. est donc


bien une famille orthogonale qui engendre .

280/2001
Sciences.ch 14/03/2005

TOPOLOGIE

La topologie (du grec : discours du lieu) est un domaine extrêment vaste des mathématiques
dont il est difficile de définir avec exactitude l'objet dont elle fait l'étude. Ce que nous
pouvons dire dans un premier temps, c'est que la topologie est très intimement liée à la théorie
des ensembles, à l'analyse fonctionnelle, aux suites et séries, au calcul intégral et différentiel,
au calcul vectoriel, à la géométrie et encore beaucoup d'autres domaines.

L'origine de la topologie semble provenir des problèmes qu'ont posé les progrès de l'analyse
fonctionnelle dans l'étude des fonctions continues, de leur dérivabilité, de leurs limites en un
point (fini ou non), de l'existence d'extremums, etc... dans des espaces de dimensions
supérieures (au fait, implicitement la topologie à pour objectif de créer des outils qui
permettent facilement d'étudier les propriétés des fonctions dans toutes les dimensions). Tout
ces concepts, demandaient pour le mathématicien une définition rigoureuse de l'idée intuitive
de proximité, tout particulièrement lors d'opérations sur ces fonctions. Mais la continuité n'est
pas un concept exclusif de l'analyse fonctionnelle, elle se retrouve en géométrie dans ses
transformations, voire ses déformations - les figures pouvant être considérées comme des
ensembles ouverts ou fermés de points.

Voici cependant un essai de définition de la topologie que nous pourrons toujours compléter :

Définition : La topologie s'intéresse aux propriétés "morphologiques" des ensembles, par


l'intermédiaire de l'étude des relations entre leurs différents éléments (la distance entre deux
objets d'un ensemble est un exemple), indépendamment de leur "forme" ou de leur "taille",
c'est-à-dire indépendamment des propriétés quantitatives des ensembles. Intuitivement, (mais
ce n'est qu'un cas particulier), deux "objets" sont topologiquement équivalents s'il est possible
de passer de l'un à l'autre par "déformation élastique", sans déchirure ni recollement.

Remarques :

R1. Nous pensons que la topologie devrait être introduite dans le cursus scolaire dès le
moment où l'étudiant a de solides connaissances en théorie des ensembles, calcul vectoriel,
algèbre linéaire, calcul tensoriel et géométrie différentielle. Ce n'est effectivement qu'à ce
moment que le niveau de l'étudiant permet à celui-ci de comprendre toute la subtilité, l'utilité
et les répercussions majeures des développements et définitions qui vont suivre.

R2. Nous orientons volontairement le contenu de ce chapitre pour le physicien théoricien. Ce


que nous voulons dire par là, c'est que suite à des définitions, nous ne donnerons pas des petits
exemples d'applications avec démonstration (sauf sur demande) s'il y en a aucun qui
s'applique de façon subtile au contenu du présent site.

R3. Souvent les personnes qui commencent à étudier la topologie sont frappées par le fait qu'il
y ait autant de définitions dans un seul domaine (ce qui gâche, il est vrai, un peu la beauté
mathématique de la topologie). Ils prennent alors pleinement conscience de la citation
d'Erdös : "les mathématiciens sont des gens qui font des définitions avec du café...".

R4. Certains concepts définis ici deviendront aussi plus clair dès le moment où le lecteur aura
étudié le chapitre de théorie de la mesure (...)

ESPACE TOPOLOGIQUE

281/2001
Sciences.ch 14/03/2005

Soit un ensemble non vide . Une "topologie" sur est une famille de sous-ensembles
ouverts (nous définirons cela un peu plus loin) de telle que les axiomes (triviaux) suivants
soient vérifiés :

A1. et

A2. implique

A3. implique

Définition : étant donné une telle famille , nous appelons , ou plus précisément le couple
un "espace topologique".

Remarque : le couple forme un "espace de Hausdorff" si de plus la propriété suivante


(axiome d'Hausdorff) est vérifiée :

A4. avec , tels que et

Remarques

R1. Un exemple bien connu d'espace topologique est muni de ses intervalles ouverts, c'est-
à-dire les intervalles .

R2. Nous verrons une application très concrètre des espaces de Hausdorff lors de notre études
des fractales en informatique théorique.

Définition : si nous notons un espace topologique, désignant les ouverts (voir plus
loin la définition d'un "ouvert") de , une "base", au sens topologique, de est une
partie de telle que tout ouvert soit réunion d'ouverts de (c'est la même idée que les
espace vectoriels au fait mais appliqué à des ensembles... rien de bien méchant).

ESPACE MÉTRIQUE ET DISTANCE

Définition : un "espace métrique" noté ou encore est par définition un ensemble


muni d'une application , appelée "distance" ou "métrique", qui satisfait les
axiomes suivants:

A1. (positivité)

A2. (séparation)

A3. (nullité sur la diagonale)

A4. (inégalité triangulaire)

282/2001
Sciences.ch 14/03/2005

A5. (symétrie)

Remarques :

R1. Certains lecteurs verront de suite que certaines de ces propriétés ont déjà été vues et
démontrées dans d'autres chapitre de site lors de l'étude des distance entre poins fonctionnels
et lors de l'étude des normes (inégalité triangulaire démontrée dans le chapitre de calcul
vectoriel - la symétrie, la nullité, la positivité, la séparation et la symétrie dans le chapitre
d'analyse fonctionelle).

R2. Un espace métrique sera en général noté ou bien encore . Nous pouvons
également le noter simplement si la distance ne peut être confondue.

La "fonction distance" de est donc notée habituellement dans le plus général qui
soit en mathématique :

Remarques :

R1. Si nous n'imposons pas l'axiome A2, nous disons que est une "semi-distance" sur .

R2. Si nous autorisons une semi-distance à prendre la valeur , nous préférons dire que
est un "écart"

R3. Si une distance vérifie la propriété ,


propriété plus contraignante que l'inégalité triangulaire dans certains espaces, nous disons que
est "ultra-métrique". Cette notion de distance est utilisée dans les nombres p-adiques (voir
le chapitre sur les nombres)

R4. Soit un espace métrique et soit une partie de l'ensemble . L'espace


métrique où désigne la restriction de à est appelé "sous-
espace métrique de " (il convient de vérifier que la distance est équivalente à la
distance ). Dans ce cas, nous disons aussi que est muni de la distance induite par celle de
. Nous notons simplement la distance induite.

Voyons quelques exemples importants de distance :

E1. Si nous prenons pour le plan, ou bien l'espace à trois dimensions de la géométrie
euclidienne et une unité de longueur, la "distance" au sens usuel du terme est bien une
distance au sens des 5 axiomes précédemment cités. Dans ces espaces, les trois points
satisfont comme nous l'avons démontré en calcul vectoriel et comme il l'est
intuitivement que :

avec les autres inégalités obtenues par permutation circulaire de . Ces inégalités sont
bien connues par exemple entre les longueurs des côtés d'un triangle.

283/2001
Sciences.ch 14/03/2005

E2. Si nous prenons , et que nous dotons d'une structure d'espace


vectoriel euclidienne (et non pas non-euclidienne) et que nous prenons deux points :

dans

La distance est donnée nous le savons par (nous avons déjà démontré cela en analyse
fonctionnelle et calcul vectoriel) :

qui satisfait aux 5 axiomes de la distance. Nous pouvons prendre (c'est une propriété
intéressante pour la culture générale), que toute relation de la forme :

est aussi une distance dans (sans démonstration). Les mathématiciens font encore plus
fort en généralisant encore plus (la démonstration à peu d'intérêt pour l'instant) cette dernière
relation (en prenant en compte la définition même de la distance) sous la forme :

Qui est appelée "distance hölderienne".

Au même titre pour l'inégalité triangulaire, donnée alors par (voir chapitre de calcul
vectoriel) :

La généralisation, de par la vérification de l'existance de la distance de hölderienne, nous


donne la vraie "inégalité de Minkowski" :

Dans le cas particulier avec , nous avons bien évidemment :

qui est la distance usuelle sur .

E3. Si nous prenons , nous considérerons la distance :

284/2001
Sciences.ch 14/03/2005

Ainsi, si et nous avons le module qui de même


manière que la norme dans , forme une distance :

E4. Considérons aussi un ensemble arbitraire. Posons :

si et si

Il est très facile de vérifier que cette distance vérifie les 5 axiomes et qu'elle est de plus ultra-
métrique. Cette distance est appelée "distance discrète" et le lecteur remarquera que nous
avons par analogie opté pour cette distance le symbole de la fonction Dirac (ce n'est pas
innocent !!) plutôt que la traditionnel .

DISTANCES ÉQUIVALENTES

Parfois, deux distances différentes et sur un même ensemble sont assez


ressemblantes pour que les espaces métriques liés possèdent les mêmes
propriétés pour certains objets mathématiques définis par d'une part, par . Il existe
plusieurs notions de ressemblances dont voici une première (avant les autres qui nécessitent
des outils mathématiques que nous n'avons pas encore définis) :

Définition : soient et deux distances sur un même ensemble , et sont dites


"équivalentes" s'il existe deux constantes réelles telles que

soit avec :

avec . Nous noterons par ailleurs cette équivalence .

L'intérêt de cette définition est le suivant : si nous avons convergence pour l'une des
métriques, alors nous aurons la convergence pour l'autre aussi. Plus clairement :

in extenso .

FONCTIONS LIPSCHITZIENNES

Relativement aux définitions, précédentes, nous pouvons maintenant énoncer quelques

285/2001
Sciences.ch 14/03/2005

propriétés supplémentaires aux fonctions telles que nous les avions énoncées dans la théorie
des ensemble :

Soient et des espaces métriques, et soit une fonction. Nous


définissons les propriétés suivantes :

P1. Nous disons que est une "isométrie" si :

P2. Nous disons que deux espaces métriques sont "isométriques" s'il existe une isométrie
surjective de l'un sur l'autre

P3. est dite "lipchitzienne" de constante (ou : "de rapport") s'il existe tel
que :

Si , nous disons que est "contractante" (ou : est une "contraction"), et si , nous
disons que est strictement contractante.

P4. Toute fonction lipchitzienne est uniformément continue (voir plus loin voir plus loin le
concept "d'uniforme continue") si elle vérifie :

avec et (la réciproque n'est pas vraie : toute fonction uniformément continue
n'est pas nécessairement continue).

Remarques :

R1. Une isométrie est toujours injective car :

mais elle n'est pas en général surjective.

R2. Si et sont isométriques, du point de vue de la théorie des espaces métriques


ils sont indiscernables, puisque toutes leurs propriétés sont les mêmes, mais leurs éléments
peuvent être de nature très différente (suites dans l'un et fonctions dans l'autre par exemple).

ENSEMBLES OUVERTS ET FERMÉS

Définition: Considérons un ensemble muni d’une distance . Un sous-ensemble de


est dit "ouvert" si, pour chaque élément de , il existe une distance non nulle pour laquelle
tous les éléments de dont la distance à cet élément est inférieure à , appartiennent à ,
ce qui ce traduit en langage mathématique :

286/2001
Sciences.ch 14/03/2005

ouvert de

Remarque : le symbole / signifie "satisfait le propriété"

Cette définition peut sembler complexe mais en fait, sa signification concrète est plus simple
qu’il n’y paraît. En fait, selon cette définition, un ensemble ouvert dans un espace topologique
n’est rien d’autre qu’un ensemble de points contiguës et sans bords.

L’absence de bord découle de la condition . En effet, en raisonnant par l’absurde, si un


ensemble ouvert avait un bord, alors pour chaque point situé sur celui-ci (le bord) il serait
toujours possible de trouver un point n’appartenant pas à aussi proche que l’on veut de lui.
Il s’ensuit que la distance nécessaire devient donc nulle.

Définitions :

D1. Un sous-ensemble "fermé" est un "ouvert avec bord".

D2. Un "voisinage" d'un point de est une partie de contenant un ouvert contenant ce
point.

La définition d’un ensemble ouvert peut être simplifiée en introduisant une notion
supplémentaire, celle de "boule ouverte" :

BOULES

Soit un élément de .

Définition: une "boule ouverte de centre et de rayon " (ou : "boule métrique de
rayon centrée en ") est le sous-ensemble de tous les points de dont la distance à est
inférieure à , ce que nous écrivons :

Un ensemble ouvert peut également être défini comme un ensemble pour lequel il est possible
de définir une boule ouverte en chaque point.

Remarques :

R2. Les ouverts ainsi définis, forment ce que nous appelons une "topologie induite" par la
distance ou aussi "topologie métrique".

R3. Nous appelons une "couverture ouverte" de , un ensemble d’ouverts de dont la


réunion est .

Définition : une "boule fermée" est similaire à une boule ouverte mais diffère dans le sens que
nous y incluons les éléments situés à la distance du centre :

287/2001
Sciences.ch 14/03/2005

Remarques : pour les inclusions sont des conséquences


directes de la définition de boule ouvert et fermeé.

Définition : une "sphère" est donnée par :

Remarque : puisque par définition, , les boules ouvertes et fermées ne sont pas vides car
elle contiennet au moins leur centre. Par contre, une sphère peut être vide.

Voyons un exemple intéressant de tout cela : avec nous avons vu dans les exemples
précédents que nous pouvions définir différentes distances. Pour les distinguer, nous les
notons :

Alors, dans les boules fermées de centre et de rayon unité équivalentes aux trois
formuations précédentes, ont la forme suivante (rappel : dans cet exemple) :

PARTIES

Maintenant que nous avons défini les concepts de boules, nous pouvons enfin définir
rigoureusement les concepts d'intervalles ouverts et fermées (qui dans un espace à plus d'une
dimension sont nommées "parties") dont nous avons fait si souvent usage en analyse
fonctionnelle et calcul intégral et différentiel.

Définition : Soit un espace métrique. Nous disons qu'une partie de est "bornée"
s'il existe une boule fermée telle que :

Compte tenu de la remarque précédente sur les inclusions des boules, il est claire que nous
pouvons remplacer l'adjectif "fermée" par "ouverte". De plus l'inégalité triangulaire entraîne

288/2001
Sciences.ch 14/03/2005

que le caractère borné de ne dépend pas du choix de (avec un il suffit de remplacer


par ).

Définitions :

D1. Soit un ensemble et un espace métrique. Si est un ensemble, nous disons


qu'une fonction est bornée si son image est bornée.

D2. Soit un espace métrique, et soit une partie non vide de . Pour tout nous
notons et nous appelons "distance de à ", le nombre réel positif non nul :

Nous prolongeons la notion en posant :

Remarque : si le lecteur à bien compris la définition du concept de "parties" il remarquera


qu'il n'existe pas nécessairement toujours un tel que . En
conséquence, nous écrivons trivialement :

De plus, si un tel existe, il n'est bien évidemment pas nécessairement unique.

Remarque : il convient peut être de rappeler que cette distance satisfait également les 5
axiomes des distances.

D3. Soit un espace métrique, et soit une partie de . Nous appelons "adhérence" de
et notons le sous-ensemble de défini par :

En particulier, puisque , nous avons , et puisque


, nous avons : .

Remarques :

R1. Tout élément de l'ensemble est dit "point adhérent" à

R2. Nous disons qu'une partie de est "fermée" si elle est égale à son adhérence

R3. Nous disons qu'une partie de est "ouverte" si son complémentaire par rapport à :

est fermé.

289/2001
Sciences.ch 14/03/2005

Il s'ensuite que (de par les définitions) :

est ouverte

Propriétés :

P1. (triviale) Si et vérifient , nous avons :

P2. (triviale) Pour tout , tout :

Corollaire de P2. (trivial) :

Si pour tout nous avons , , nous avons :

BOULES GÉNÉRALISÉES

La notion de distance d'un point à un ensemble permet d'étendre les notions de boule et de
sphère.

Définitions :

D1. Soit et soit un . Nous appelons "boule ouverte généralisée" de centre et


de rayon , l'ensemble suivant :

Respectivement "boule fermée généralisée":

Respectivement "sphère généralisée" :

D1. Soit , une espace métrique et soient deux parties non vides de . Nous
notons et appelons "gap" (qui signifie "écartement" ou "espacement" en français) de
à , le nombre réel supérieur ou égal à zéro :

Remarque : l'inégalité triangulaire n'est pas valide dans le cadre


des gap (ceci étant également valable). Il suffit pour le démontrer, d'un seul et unique exemple
qui contredirait l'inégalité.

290/2001
Sciences.ch 14/03/2005

Exemple : Dans prenons nous avons alors :

Il y a donc bien contradiction.

DIAMÈTRE

Définition : Soit un espace métrique et soit une partie non vide de . Nous notons
et nous appelons "diamètre" de , le nombre réel positif non nul :

Tout partie non vide d'un espace métrique vérifiant sera dite "bornée".

Remarque : Nous considérons la partie vide comme un borné de diamètre

Si l'espace métrique tout entier est borné, nous disons que "la distance est bornée".
Par exemple, la distance discrète est bornée, la distance usuelle sur ne l'est pas.

Propriétés :

P1. (triviale) ou

P2. (triviale)

P3. De par la définition du diamètre :

Exemple : pour il suffit pour se convaincre de prendre la distance discrète.


Ainsi, dans un espace métrique où nous prenons avec , nous avons
(c'est un cas intéressant car complètement contre-intuitif).

P4. Nous avons

Exemple : Dans prenons , nous avons alors (infériorité stricte triviale):

P5. est borné si et seulement si

Définition : Nous appelons "excès de Hausdorff" de sur :

Remarque : nous avons en général et ces quantités peuvent ne pas être

291/2001
Sciences.ch 14/03/2005

finies.

VARIÉTÉS

Nous introduisons maintenant les "variétés". Ce sont des espaces topologiques qui sont
"localement comme " (notre espace par exemple..).

Définitions :

D1. Une "variété topologique de dimension " est un espace de Hausdorff tel que pour
tout il existe un voisinage ouvert avec , un voisinage ouvert et
un homéomorphisme :

D2. Un "homéomorphisme" entre deux espaces est une bijection continue dont l'inverse est
également continu.

D3. Les couples sont appelés des "cartes", étant le "domaine de la carte" et
"l'application de coordonnées". Au lieu de "carte nous disons parfois aussi "système de
coordonnées"

Remarque : nous noterons par la dimension d'une variété topologique. Ainsi :

D4. Soit une variété topologique de dimension . Une famille de cartes de est
appelée un "atlas" si pour tout , il existe une carte telle que .

Remarque : notons que si sont deux cartes de telles que (ne vérifiant pas
l'axiome de Hausdorff) , alors l'application de changement de cartes :

292/2001
Sciences.ch 14/03/2005

est un homéomorphisme.

Définitions :

D1. Une "variété différentiable" est un espace topologique où les applications


sont des fonctions de classe .

D2. Un "difféomorphisme" est une application où sont des domaines


ouverts de et si est un homéomorphisme et en plus si et sont différentiables.

Remarque : "différentiable" dans ce contexte signifiera toujours différentiable de classe

VARIETES DIFFERENTIABLES

Définitions :

D1 .Soit une variété topologique (pour simplifier l'écriture), deux cartes


de sont "compatibles" (plus précisément, compatibles de classe ), si
l'une des deux propriétés suivantes est vérifiée :

P1. et l'application de changement de cartes est un difféomorphisme

P2.

Un atlas de est différentiable si toutes les cartes de sont compatibles entre elles.

D2. Une "variété différentiable" est un couple où est une variété topologique et
un atlas différentiable de .

Remarque : étant donné un atlas différentiable, il est parfois nécessaire de le compléter : nous
disons qu'une carte de est compatible avec un atlas différentiable si elle est compatible
avec chaque carte de . Un atlas de est "maximal" si toute carte compatible avec
appartient déjà à . Un atlas maximal est appelé une "structure différentiable".

293/2001
Sciences.ch 14/03/2005

THÉORIE DE LA MESURE

La mesure, au sens topologique, va nous permettre de généraliser la notion élémentaire de


mesure d'un segment, ou d'une aire (au sens de Riemann, par exemple) et est indissociable de
la nouvelle théorie de l'intégration que Lebesgue mettra en place de 1901 à 1902 et que nous
allons aborder ici afin de construire des outils mathématiques beaucoup plus puissant que
l'intégrale simple de Riemann (voir chapitre de calcul différentiel et intégral).

La théorie de la mesure va également nous permettre de définir avec rigueur le concept de


mesure (peu importe la mesure de quoi) et ainsi de revenir sur des résultats importants de
l'étude des probabilités (voir chapitre de probabilités et statistiques). Effectivement, nous
allons voir (nous définirons le vocabulaire qui suit plus loin) pourquoi est un
"espace de probabilités" où au fait une tribu sur et une mesure sur l'espace mesurable
.

Avertissement : le niveau de connaissance recquis pour la lecture de ce chapitre est assez


élevée. Il faut être à l'aise avec les notions vues en théorie des ensembles ainsi qu'en
topologie. Un très bon niveau d'abstraction et beaucoup de volonté de compréhension est
aussi souhaité. En tout cas... bonne chance!

ESPACES MESURABLES

Définitions :

D1. Soit un ensemble. Une "tribu" ou " "sur est une famille de parties de
vérifiant les axiomes :

A1. (voir exemples plus bas - étant considéré comme élément)

A2. ( est stable par passage au complémentaire). Cet axiome implique


que l'ensemble vide est toujours un élément d'une tribu.

A3. Pour toute suite d'éléments de nous avons (nous disons alors que
est "stable" par union dénombrable).

Remarques :

R1. Nous écrivons car nous ne considérons non plus comme un sous-ensemble de
mais comme un élément de !

R2. Les cas non-dénombrables sont typiques de la topologie.

D2. Le couple est appelé "espace mesurable" et nous disons que les éléments de
sont des "ensembles mesurables". Si dans la troisième condition nous imposons seulement
que soit stable par union finie nous imposons la notion plus générale "d'algèbre". Ainsi,
une tribu est nécesssairement contenu dans une algèbre (mais le contraire n'est pas vrai car
justement l'axiome est plus fort).

294/2001
Sciences.ch 14/03/2005

Exemples :

E1. Soit un ensemble de cardinal 2. Les tribus qui satisfont sont :

Il n'y a pas d'autres tribus pour l'ensemble donné que ces deux (la grossière, et la
maximale), car il ne faut pas oublier que l'union de chacun des éléments de la tribu doit aussi
être dans la tribu (A3), ainsi que le complémentaire d'un élément (A2).

E2. Soit un ensemble est bien une tribu

E3. L'ensemble des parties de , noté est aussi une tribu.

Remarque : est aussi stable par intersections dénombrables. En effet si est une suite
d'éléments de nous avons (trivial en prenant comme référence l'exemple E1) :

et

Donc aussi (trivial en prenant comme référence l'exemple E1) :

ce qui amène à ce qu'une tribu est stable par unions et par intersections finies. En particulier,
si alors , car (rappel) :

Remarque : si une famille de tribus sur (comme l'exemple E1). Alors est une
tribu (la vérification des trois axiomes est immédiate)

Définition : soit un ensemble et ( est donc considéré comme un sous-


ensemble de et non comme un élément). Soit la famille de toutes les tribus
contenant (entre autres) . n'est évidemment pas vide car . Nous notons par
définition :

la tribu engendrée par . est la plus petite tribu contenant (et par extension la plus
petit tribu de ).

Voici deux exemples qui permettent de vérifier si ce qui précède à été compris et qui

295/2001
Sciences.ch 14/03/2005

permettent de mettre en évidence des résultats importants pour la suite :

E1. Soit un ensemble, et . .

E2. Si est une tribu sur alors .

E3. Soit et nous avons dés lors :

Nous trouvons donc bien dans l'ensemble vide obligatoire ainsi que
(selon l'axiome A1) ainsi que lui-même (par définition de ) et les
complémentaires de (selon l'axiome A2) ainsi que les unions
(selon l'axiome A3).

Définition : Soit un espace topologique (voir chapitre de topologie). Nous notons la


tribu engendrée par les ouverts de . est appelée la "tribu borélienne" sur . Les
éléments de sont appelés les "boréliens" de .

La notion de "Borélien" est surtout intéressante car elle est nécessaire à la définition de la
"tribu de Lebesgue" et par suite à "la mesure de Lebesgue" qui nous aménera à définir
"l'intégrale de Lebesgue".

Remarques :

R1. La tribu étant stable par passage au complémentaire, elle contient aussi tous les
fermés.

R2. Si est un espace topologique à base dénombrable, est engendrée par les ouverts
de la base.

Exemple (important) : Si désigne l'espace des réels muni de la topologie euclidienne (voir
chapitre de topologie), la famille des intervalles ouverts à extrémités rationnelles est une base
dénombrable (étant donné les extremités) de et donc engendre . Même remarque pour
, , avec comme base dénombrable la famille des pavés ouverts à extrémités
rationnelles (c'est la famille des ensembles du type ).

Considérons maintenant un ensemble dense (voir chapitre de topologie) dans . Les


familles suivantes engendrent :

; ; ;

Démonstration :

Soit (la famille des ouverts) :

296/2001
Sciences.ch 14/03/2005

Nous avons évidement :

De plus :

Donc les intervalles du type avec et dans appartiennent aussi à . Donc, si


nous généralisons, avec , il existe une suite d'éléments de décroissant vers et
une suite d'éléments de croissant vers tel que :

ce qui entraîne au même titre (que ) que . Les autres cas se traitent de
manière analogue.

Soit un espace mesurable et (et ) (où est donc considéré comme un


sous-ensemble et non comme un élément !). La famille est une tribu sur
appelée "tribu trace" de sur , nous la noterons . De plus, si , la tribu trace
est formée par les ensembles mesurables contenus dans .

Démonstration : nous vérifions les trois points de la définition d'une tribu :

1.

2. Soit et donc

Exemple : soit alors (un tribu parmi d'autres - ne pas oublier la stabilité par
union !) :

Choisissons (il est évident que est une tribu sur )

Dès lors :

et nous avons bien ainsi que .

297/2001
Sciences.ch 14/03/2005

3. Soit une suite d'éléments de alors

La dernière assertion de la proposition est évidente.

Soit maintenant un ensemble, une famille de parties de et non vide. Nous


notons la trace de sur et la tribu engendrée par sur . Alors :

Exemple (avant la démonstration) : soit l'ensemble , ,


alors :

Et vérifions :

Donc l'égalité est vérifiée.

Un corollaire trivial de cette égalité est que si nous considérons un espace topologique et
muni de la topologie induite. Alors:

Rappel (voir le chapitre de théorie des ensembles) : Soit un ensemble. Pour tout
nous définissons la différence symétrique entre et par :

Les propriétés triviales sont les suivantes :

P1. Une algèbre est stable par différence symétrique ( nous avons )

P2.

P3.

P3.

298/2001
Sciences.ch 14/03/2005

Si est une algèbre sur , alors est un anneau de Boole (ou algèbre de Boole mais
attention avec le terme "algèbre" qui peut prêter à confusion avec la théorie des ensembles)
avec et comme élément neutre "additif" ( ) respectivement "multiplicatif" ( ).

Rappels : voir le chapitre de théorie des ensembles et le chapitr d'algèbre de Boole (section
analyse numérqiue)

Démonstration : ("addition") est associative car en développant nous obtenons (cela se


vérifie en faisant un diagramme saggital au besoin – les "patates") :

et cette dernière expression est stable par permutation (commutation) de (même


méthode de vérification) . Donc :

Nous vérifions que vérifie que est bien neutre par rapport la différence symétrique (la
démonstration que est neutre par rapport à l'inclusion est évidente). Il est trivial que :

et que

est donc bien un groupe abélien par rapport à la loi (différence symétrique).

Pour finir est distributif par rapport à . En effet:

Ce qui fait bien de un anneau (qui de plus est un anneau commutatif).

THÉORÈME DE LA CLASSE MONOTONE

Définition : Soit un ensemble. Une "classe monotone" sur est une famille de parties
de vérifiant :

A1.

A2. et

A3. Si est une suite croissante (attention au terme "croissant") d'éléments de alors

(stable par union par dénombrable croissant)

Remarques :

299/2001
Sciences.ch 14/03/2005

R1. Une suite croissante d'ensembles c'est :

R2. Les deux premiers points impliquent que est stable par passage au complémentaire.

R3. L'axiome (2) et (3) (plus le (1)) amène que la classe monotone est stable par intersection
décroissante. Une manière de vérifier c'est de prendre le complémentaire de chaque élément
de la suite croissante pour tomber sur la suite décroissante et inversement.

R4. L'axiome 3 des classes monotones étant un peu plus restrictif (plus "fort") que l'axiome 3
des tribus (puisque nous y imposons une suite croissante). Cela implique que toute tribu est
une classe monotone (tout union dénombrable de la tribu étant dans la tribu ce qui est une
condition plus forte que la suite croissante) !

De la même manière que pour les tribus, si nous considérons une famille de classes
monotones sur . Alors est une classe monotone (la démonstration se vérifie
immédiament par les trois axiomes précédemment cités).

Exemple : Si est un ensemble, est une classe monotone sur . Plus généralement,
une tribu est une classe monotone.

De manière équivalente aux tribus, considérons un ensemble et . Soit la


famille de toutes les classes monotones contenant . n'est pas vide car . Nous
notons :

la classe monotone engendrée par . est la plus petite classe monotone contenant (et
satisfaisant bien évidemment aux axiomes).

Remarque : si est un ensemble et alors , car est une classe


monotone (et aussi une tribu) contenant et donc elle contient aussi (voir les
exemples avec les tribus).

Le théorème (de la classe monotone) s'énonce ainsi : soit un ensemble. Si est une
famille de parties de que nous imposons stable par intersections finies alors
(nous devons donc prouver que la tribu minimale de est égale à la classe monotone
minimale de ). Si nous imposons pas que soit pas stable par intersections finies nous
aurions pas nécessairement l'égalité.

Démonstration : comme déjà dit (c'est quasiment trivial). Nous allons montrer
dans un premier temps que est donc aussi une tribu sur . Pour ceci il suffit de
montrer que est (aussi) stable par union dénombrable (et non nécessairement par une
suite croissante d'éléments!).

300/2001
Sciences.ch 14/03/2005

Considérons les familles suivantes pour la démonstration :

Par les définitions précédentes mais étant (imposé) stable par intersections
finies entraîne et donc (c'est le même raisonnement que pour les tribus) :

(1)

est une classe monotone en effet , si et que (axiome 2)


alors :

et donc (ce qui appuie que les autre éléments satisfont la relation précédente) :

Si est une suite croissante d'éléments de alors :

car est une suite croissante.

Ainsi est bien une classe monotone et par (1), nous avons donc :

Cette dernière égalité implique . Comme pour , nous montrons montrons que
est une classe monotone et donc , ce qui veut dire par extension que
est est donc stable par intersections finies.

étant stable par passage au complémentaire ceci entraîne que est nous venons
de montrer qu'ell est plus stable par unions finies (alors que nous voulons démontrer que c'est
stable par union dénombrable).

Soit à présent une suite d'éléments de . Nous considèrons la suite :

301/2001
Sciences.ch 14/03/2005

est une suite croissante d'éléments de , donc :

mais

Donc :

Ainsi est stable par union dénombrable et enfin est une tribu. Or comme
cela nous amène donc à .

Nous verrons plus tard quelques applications importantes de ce théorème.

302/2001
Sciences.ch 14/03/2005

CALCUL DIFFÉRENTIEL ET INTÉGRAL

Le calcul différentiel est un des domaines les plus passionnants et vastes de la mathématique,
et il existe une littérature considérable (colossale) sur le sujet. Les résultats retrouvent des
implications dans absolument tous les domaines de la physique, de l'informatique, de
l'électronique, de la chimie, biologie et de la mathématique elle-même.

Les mathématiciens ont rédigé une telle quantité de théorèmes sur le sujet que la validation de
certains est délicate car certains à eux-seuls nécessiteraient la vie d'un homme pour être
parcourus (c'est un problème que la communauté des mathématiciens reconnait) et vérifiés (ce
qui fait que personne ne les vérifie...).

Ce constat fait, nous avons choisi de ne présenter ici que les points absolument nécessaires à
la compréhensions des outils fondamentaux du physicien et du mathématicien (niveau licence
à peu près). Les puristes nous excuseront donc pour l'instant de ne pas présenter certains
théorèmes qui peuvent leur sembler indispensables mais que nous rédigerons une fois le
temps venu...

Nous allons principalement étudier dans ce qui va suivre ce que les mathématiciens aiment
bien préciser (et ils ont raison) : les cas généraux des fonctions réelles à une variable réelle.
Les fonctions plus complexes (à plusieurs variables réelles ou complexes, continues ou
discrètes) viendront une fois cette partie terminée.

Remarque : Nous ne nous atterderons pas à démontrer les dérivées et primitives de toutes les
fonctions car comme il y a une infinité de fonctions possibles, il y a également une infinité de
dérivées et de primitives. C'est le rôle des professeurs dans les instituts scolaires d'entraîner
les élèves à appliquer et à comprendre le raisonnement de dérivation et d'intégration par des
applications sur des fonctions connues (l'internet ne remplacera très probablement jamais
l'école à ce niveau).

CALCUL DIFFÉRENTIEL

Soit une fonction réelle à une variable réelle (nous nous limitons à ce cas de figure pour
l'instant et étudierons les dérivées partielles dans des espaces à un nombre de dimensions
quelconques plus loin) continue au moins dans un intervalle où se situe .

Définitions :

D1. Nous appelons "pente moyenne" le rapport de la projection orthogonale de deux points
de la fonction non nécessairement continue sur l'axe des abscisses et des
ordonnées tel que :

Remarque : signifiant "un delta" exprime le fait que nous sous-entendons une différence
d'une même quantité.

D2. Nous appelons "nombre dérivé en " ou "pente instantanée" ou encore "dérivée

303/2001
Sciences.ch 14/03/2005

première", la limite quand tend vers 0 (si elle existe) du rapport de la projection
orthogonale de deux points infiniment proches de la fonction continue (dans
le sens qu'elle ne contient pas de "trous") sur l'axe des abscisses et des ordonnées tel que :

Une interprétation graphique donne que est le coefficient directeur (autrement dit la
"pente instantanée") de la tangente au point d'abscisse .

Remarque : signifiant "un différentiel" exprime le fait que nous sous-entendons une
différence infiniment petite d'une même quantité.

D3. Soit une fonction définie sur une intervalle et dérivable en tout point de , la
fonction qui à tout réel de associe le nombre est appelée "fonction dérivée de
sur " et est notée .

Remarque : au niveau des notations les physiciens adoptent suivant leur humeur différentes
notations possibles pour les dérivées. Ainsi, considérons la fonction réelle à une variable
, vous trouverez dans la littérature ainsi que dans le présent site les notations suivantes
pour la "dérivée première" :

ou encore en considérant implicitement que est fonction de (ceci permet d'allèger un


petit peu la tailles des développements) :

DIFFÉRENTIELLES

Nous avons indiqué précédemment ce qu'était un "différentiel ". Mais il existe au fait
plusieurs types de sortes de différentielles d'une fonction (remarquez que nous distinguons le
genre masculin et féminin du terme) :

1. Les différentiels

2. Les différentielles partielles

3. Les différentielles totales exactes

4. Les différentielles totales inexactes

Rappelons que nous appelons "différentiel " d'une fonction à une variable la relation
donnée par (voir texte précédent) :

304/2001
Sciences.ch 14/03/2005

Cependant, pour exprimer l'effet d'un changement de toutes les variables d'une fonction de
plusieurs variables, nous devons utiliser un autre type de différentiel que nous appelons la
"différentielle totale" (dérivée en deux sous-familles : différentielle totale exacte et
différentielle totale inexacte).

Soit par exemple, une fonction des deux variables et . L'accroissement de la


fonction , pour un accroissement fini de à et de à est :

que nous pouvons aussi écrire :

ou encore:

Pour des accroissements infiniment petits de et :

Intéressons nous dès lors aux deux termes :

et

Le premier terme de gauche, nous le voyons, ne donne finalement que la variation en de la


fonction en ayant constant sur la variation. Nous notons cela dès lors (si la
connaissance des variables constantes est triviale, nous ne les indiquons plus) :

et de même :

Les deux expressions :

305/2001
Sciences.ch 14/03/2005

et

sont ce que nous appelons des "différentielles partielles".

Il vient dès lors :

qui est la "différentielle totale exacte" de . Il est important de se rappeler de la forme de


cette relation que nous retrouverons partout dans des opérateurs particuliers en physique, dans
la mécanique des fluides, dans la thermodynamique, etc.

Remarque . de la même manière, pour une fonction de plus de deux variables, par exemple
, la différentielle totale est:

Dans l'équation ci-dessus, la différentielle a été calculée à partir de l'expression de la


fonction . Puisqu'il existe une fonction qui vérifie l'expression de , la différentielle
est dite alors aussi "totale exacte".

Il existe cependant également des différentielles totales exactes, qu'aucune fonction ne vérifie.
Dans ce cas, nous parlons de "différentielle totale inexacte" et pour déterminer si une
différentielle totale est exacte ou inexacte, nous utilisons les propriétés des dérivées
partielles.

Soit la forme différentielle :

où et sont des fonctions des variables et . Si est une différentielle


totale exacte, alors :

Il faut donc que :

et

ou encore, en effectuant une seconde dérivation, que:

306/2001
Sciences.ch 14/03/2005

et

Avant de continuer, nous avons besoin d'un résultat donné par le "théorème de Schwarz".
Démonstration :

Soit une fonction . Si :

sont continues alors (il faut vraiment vraiment vérifier que ce soit le cas) :

pour tout .

Démonstration : nous considérons l'expression :

Posons :

On avons alors :

Par le théorème des accroissements finis

avec En reprenant les définitions de et nous obtenons :

307/2001
Sciences.ch 14/03/2005

en appliquant à nouveau le théorème des accroissements finis aux deux membres entre
parenthèses nous trouvons :

avec Pour finir :

et par continuité lorsque , nous avons :

Plus simplement écrit :

Par récurrence sur le nombre de variables nous pouvons démontrer le cas général (c'est long
mais c'est possible, nous le ferons si besoin il y a).

Donc finalement pour en revenir à notre problème initial, nous avons donc :

Ce qui nous donne finalement :

C'est la condition que doit satisfaire une différentielle total pour être une différentielle totale
exacte et la condition qu'elle ne doit pas satisfaire pour être une différentielle totale inexacte.

Afin de ne pas confondre les deux types de différentielles, nous utilisons le symbole pour
représenter une différentielle totale inexacte et pour une différentielle totale exacte. La
distinction est extrêmement importante car seules les différentielles totale exactes ont une
intégrale qui ne dépend que des bornes d'intégration (puisque toutes les variables changent en
même temps) :

308/2001
Sciences.ch 14/03/2005

mais

Autrement dit, la variation d'une fonction dont la différentielle est totale exacte, ne dépend pas
du chemin suivi, mais uniquement des états initiaux et finaux. Nous appelons une telle
fonction qui satisfait à une différentielle totale exacte, une "fonction d'état", c'est-à-dire une
fonction dont la valeur ne dépend que de l'état présent et futur, et non de son histoire.

Cette distinction est très importante et particulièrement en thermodynamique où il convient de


déterminer si une quantité physique est une différentielle totale exacte (une "fonction d'état"
donc) ou non afin de savoir comment évoluent les systèmes.

Exemple : un exemple important de forme différentielle en thermodynamique, est le travail


élémentaire d'une force exercée sur un corps en mouvement dans le plan , nous
avons :

et ne dérivent pas nécessairement d'un même potentiel tel que :

DÉRIVÉES USUELLES

Nous allons démontrer ici les dérivées les plus fréquentes (une petite trentaine) que nous
puissions rencontrer en physique théorique et mathématique ainsi que certaines de leurs
propriétés. La liste est pour l'instant non exhaustive mais les démonstrations étant
généralisées, elles peuvent s'appliquer à un grand nombre d'autres cas (que nous
appliquerons/rencontrerons tout au long de ce site).

1. Dérivée de :

Partons d'abord d'un cas particulier, la dérivée de :

Soit donc un réel quelconque fixé, alors:

Le nombre dérivé en de la fonction cube est donc .

Nous pouvons généraliser ce résultat pour tout entier naturel positif ou négatif et nous
allons voir que la fonction définie sur par est dérivable et que sa dérivée
est définie par .

309/2001
Sciences.ch 14/03/2005

Ainsi, nous avons (quelques exemples peuvent êtres utiles pour comprendre la portée de ce
résultat):

Nous voyons donc qu'en ayant déterminé la dérivée d'une fonction de la forme , nous
avons également déterminée toute fonction qui est mise cette forme tel que:

et

Cependant, les fonctions:

ne sont pas dérivables en puisque la fonction n'y est plus définie (division par zéro). De
plus, en ce qui concerne la fonction comportant la racine (puissance non entière), la dérivée
n'est pas définie dans .

Cependant, le résultat précédent donne un résultat intéressant pour les fonctions constantes
telle que:

il n'est alors pas difficile de déterminer la dérivée qui vaut simplement:

Donc la dérivée de toute fonction constante est nulle (il est important de se souvenir de ce
résultat que nous étudierons les propriétés des intégrales) !!!

2. Dérivée de la fonction :

310/2001
Sciences.ch 14/03/2005

Soit donc un réel quelconque fixé, alors (attention! il est utile de connaître les relations
trigonométriques remarquables que nous démontrons dans le chapitre de trigonométrie dans la
section de géométrie):

Puisque:

Effectivement, rappelons que la fonction est assimilable (visuellement et


mathématiquement) à une droite de fonction au voisinage de .

Donc pour résumer:

3. Dérivée de la fonction :

Soit donc un réel quelconque fixé, alors (attention! il est utile de connaître les relations
trigonométriques remarquables que nous démontrons dans le chapitre de trigonométrie dans la
section de géométrie):

Donc pour résumer:

4. Dérivée de la fonction :

311/2001
Sciences.ch 14/03/2005

La dérivée de la fonction est égale à , c'est-à-dire si :

alors

Démonstration : si est l'accroissement de la fonction pour un accroissement


correspondant de la variable , alors :

et nous pouvons écrire :

Multiplions et divisons par l'expression figurant dans le membre droit de la dernière


égalité :

Désignons la quantité par . Il est évident que quand tend vers zéro pour un
donné. Par conséquent :

Or, nous retrouvons ici une autre provenance historique de la constante d'Euler (voir le
chapitre d'analyse fonctionnelle) où :

Ainsi :

Une cas particulier important est le cas où . Nous avons alors :

312/2001
Sciences.ch 14/03/2005

5. Dérivée d'une somme de fonctions :

Soient et deux fonctions. La fonction somme est dérivable sur tout intervalle
où et sont dérivables, sa dérivée est la fonction s' somme des fonctions dérivées et
de et .

Ce résultat se généralise pour une somme d'un nombre quelconque fixé de fonctions.

Démonstration :

Soit un réel fixé et et deux fonctions définies et dérivables en :

Donc la dérivée d'une somme est la somme des dérivées.

6. Dérivée d'un produit de fonction :

Soient et deux fonctions. La fonction produit est dérivable sur tout intervalle
où et sont dérivables, sa dérivée première est la fonction telle que .

Démonstration:

Soit un réel fixé et et deux fonctions définies et dérivables en a:

Nous rajoutons à cette dernière relation deux termes dont la somme est nulle tel que:

313/2001
Sciences.ch 14/03/2005

En généralisant ce développement à une dérivée d'ordre quelconque, nous obtenons ce que


nous appelons la "relation ou formule de Leibniz". Ainsi, soit deux fonctions fois
dérivables. Alors est au moins fois dérivable et :

où bien désigne le coefficient binomial (voir chapitre de probabilités et

statistiques).

Démonstration :

La démonstration se fait par récurrence sur . C'est évidemment vérifié pour et pour
pour lequel nous reconnaissons ce que nous avions démontré plus haut :
.

Si la formule est vraie au rang et que les fonctions sont fois dérivables, nous voyons
que est dérivable et de dérivée :

en changeant d'indice dans la première somme, nous pouvons écrire :

Remarque : La formule de Leibniz permet d'en déduire la formule du binôme de Newton. Il


suffit pour cela de prendre et d'appliquer la formule de Leibniz en

7. Dérivée d'une fonction composée :

Soit la fonction composée de deux fonctions et dérivables, la première en


, la seconde en , la fonction dérivée est définie par , c'est-à-dire :

Démonstration :

Soit un réel fixé et une fonction définie et dérivable en et une fonction définie et
dérivable en :

314/2001
Sciences.ch 14/03/2005

posons , nous avons alors:

continuons notre développement précédent:

Conclusion: la dérivée d'une fonction composée est donnée par la dérivée de la fonction
multipliée par la "dérivée intérieure".

8. Dérivée d'une fonction réciproque :

Si la fonction est continue, strictement monotone sur un intervalle , dérivable sur ,


alors la fonction réciproque est dérivable sur l'intervalle et admet pour fonction
dérivée:

En effet, nous pouvons écrire :

C’est-à-dire (application identité) :

Par application de la dérivation des fonctions composées:

d'où:

Pour une variable , nous poserons pour la dérivée de la fonction réciproque:

315/2001
Sciences.ch 14/03/2005

10. Dérivée de la fonction :

En utilisant le résultat précédent de la fonction réciproque, nous pouvons calculer la dérivée


de la fonction :

11. Dérivée de la fonction :

En utilisant le résultat précédent de la fonction réciproque, nous pouvons calculer la dérivée


de la fonction :

12. Dérivée d'un quotient de deux fonctions :

La fonction est dérivable sur tout intervalle où les fonctions et sont dérivable et
où la fonction est non nulle et:

Démonstration :

La fonction peut être considérée comme le produit de deux fonctions : la fonction et la


fonction . Une produit de deux fonctions est dérivable si chacune d'elle est dérivable, il
faut donc que la fonction soit dérivable et que la fonction soit également dérivable ce
qui est le cas quand est dérivable non nulle.

13. Dérivée de la fonction :

Par définition (voir chapitre de trigonométrie) nous avons :

et en appliquant donc la dérivée d'un quotient vu précédemment, nous avons :

316/2001
Sciences.ch 14/03/2005

ou encore :

14. Dérivée de la fonction :

Par définition (voir chapitre de trigonométrie), :

et donc (dérivée d'un quotient à nouveau) :

ou encore :

15. Dérivée de la fonction :

Nous utilisons les propriétés dérivée des fonctions réciproques :

16. Dérivée de la fonction :

Selon la même méthode que précédemment :

17. Dérivée de la fonction :

Nous verrons lors de notre études des méthodes numérique (voir section d'informatique) que
le "nombre d'Euler" peut être calculé selon la série :

317/2001
Sciences.ch 14/03/2005

qui converge sur . En dérivant terme à terme il vient,

Ainsi l'exponentielle est sa propre dérivée. Ainsi, nous pouvons nous permettre d'étudier les
dérivées de quelques fonction trigonométriques hyperboliques (voir chapitre de
trigonométrie).

18. Dérivée de la fonction :

Rappel :

Donc trivialement :

19. Dérivée de la fonction :

Rappel :

Donc trivialement :

20. Dérivée de la fonction :

Puisque par définition :

Donc en appliquant la dérivée d'un quotient nous obtenons :

318/2001
Sciences.ch 14/03/2005

Ou encore :

21. Dérivée de la fonction :

Rappel :

et donc :

22. Dérivée de la fonction :

Nous appliquons les propriétés des dérivées des fonctions réciproques :

Or (voir à nouveau le chapitre de trigonométrie) :

et donc :

Etant donné que ne prend que des valeurs positives, nous avons :

Donc finalement :

319/2001
Sciences.ch 14/03/2005

23. Dérivée de la fonction :

Nous appliquons les propriétés des dérivées des fonctions réciproques :

Or selon la méthode que précédemment :

d'où :

Etant donné que ne prend que des valeurs positives nous avons alors :

Donc :

24. Dérivée de la fonction :

En appliquant les propriétés des dérivées des fonctions réciproques) :

25. Dérivée de la fonction :

En appliquant les propriétés des dérivées des fonctions réciproques) si :

26. Dérivée de la fonction :

Avec :

Donc (dérivée d'une fonction composée) :

320/2001
Sciences.ch 14/03/2005

CALCUL INTÉGRAL

Nous allons aborder ici les principes élémentaires et de base du calcul intégral. La suite (avec
plus de rigueur) viendra en fonction du temps qui est la disposition des responsables du site.

INTÉGRALE DÉFINIE

Une valeur approchée de l'aire sous une courbe peut être obtenue par un découpage en n
bandes rectangulaires verticales de même largeur. En particulier on peut réaliser un
encadrement de cette aire à l'aide d'une somme majorante et d'une somme minorante
pour un découpage donné.

Supposons que le nombre n de bandes tende vers l'infini. Comme les bandes sont de même
largeur, la largeur de chaque bande tend vers 0.

Si les sommes et ont toutes deux une limite lorsque, le nombre n de bandes, tend
vers l'infini, alors l'aire sous la courbe est comprise entre ces deux limites.

Nous avons :

Si ces deux limites sont égales, leur valeur est celle de l'aire sous la courbe.

D'où une première définition de l'intégrale définie:

Soit un intervalle , divisé en n parties égales, soit f une fonction continue sur l'intervalle
, soit , la somme algébrique minorante et soit , la somme algébrique majorante.
Nous appelons "intégrale définie" de f, depuis a jusqu'à b, notée :

321/2001
Sciences.ch 14/03/2005

le nombre tel que pourvu que cette limite existe.

Intuitivement, il est évident que lorsque , nous étendons la définition ainsi :

Remarques :

R1. Pour calculer l'aire majorante et l'aire minorante, il n'est pas nécessaire que la largeur des
sous-intervalles du découpage soit la même partout.

R2. Si cette limite existe, alors nous disons que f est "intégrable" sur et l'intégrale

définie existe.

R3. Le fait de chercher cette limite s'appelle "calculer l'intégrale".

R4. Les nombres a et b sont appelés les "bornes d'intégration", a est la "borne inférieure", b
est la "borne supérieure".

R5. D'autres lettres que x peuvent être employées dans la notation de l'intégrale définie. Ainsi

si f est intégrable sur , alors etc. C'est la raison pour

laquelle la variable x de la définition est dite "variable muette".

R6. Comme nous le verrons plus loin, il est essentiel de ne pas confondre "intégrale définie"
et "intégrale indéfinie". Ainsi, une intégrale indéfinie, notée est une fonction, ou,
plus précisément, une famille de fonctions appelées aussi "primitives de f" (voir plus bas)

alors qu'une intégrale définie, notée est une constant (c'est-à-dire un nombre réel).

INTÉGRALE INDÉFINIE

Nous avons vu précédemment lors de notre études des dérivées, le problème suivant : étant
donnée une fonction , trouver sa dérivée, c'est-à-dire la fonction .

Définition : nous disons que la fonction est une "primitive" ou "intégrale indéfinie" de
la fonction sur le segment , si en tout point de ce segment nous avons l'égalité
.

Une autre manière de voire le concept d'intégrale indéfinie est de passer par le théorème
fondamental du calcul intégral (et différentiel) appelé aussi parfois "calcul fondamental de
l'analyse" s'énonce ainsi :

322/2001
Sciences.ch 14/03/2005

Soit f une fonction continue sur un intervalle fermé .

P1. Si A est la fonction définie par pour tout X dans , alors A est la

primitive de f sur qui s'annule en a.

P2. Si F est une primitive de f sur , alors .

Démonstration :

P1. Soit la fonction :

Si f est positive et (la démonstration dans le cas où est proposée similaire) et


comme , nous pouvons nous représenter A(X) comme l'aire sous la courbe de f depuis
jusqu'à .

Pour démontrer que A est une primitive de f , nous allons prouver que . Selon la
définition de la dérivée :

Etudions ce quotient : est représentée par l'aire de la bande de largeur h,


prise en sandwich entre deux rectangles de largeur h.

Soit M le maximum de f sur l'intervalle et m le minimum de f sur ce même


intervalle. Les aires respectives des deux rectangles sont Mh et mh.

Nous avons alors la double inégalité suivante :

323/2001
Sciences.ch 14/03/2005

Comme h est positif, on peut diviser par sans changer le sens des inégalités :

Lorsque et si est une fonction continue, alors et ont pour limite , et

le rapport , qui est compris entre et , a bien pour limite .

Comme pour tout X, ceci nous montre que la dérivée de la fonction aire est
. Ainsi est une primitive de . Comme , est bien la primitive de f qui
s’annule en a.

Avant de commencer la démonstration de la deuxième propriété du théorème fondamental,


énoncons et démontrons le théorème suivant :

Théorème :si et sont deux primitives de la fonction sur le segment ,


leur différence est une constante (ce théorème est très important en physique pour ce qui est
de l'étude de ce que nous appelons les "conditions initiales").

Démonstration : Nous avons en vertu de la définition de la primitive :

pour .

Posons :

Nous pouvons écrire :

Il vient donc de ce que nous avons vu pendant notre étude des dérivées que .

Nous avons alors :

Il résulte de ce théorème que si nous connaissons une primitive quelconque de la


fonction , toute autre primitive de cette fonction sera de la forme :

324/2001
Sciences.ch 14/03/2005

Donc finalement, nous appelons "intégrale indéfinie" de la fonction et nous notons :

tout expression de la forme où est une primitive de . Ainsi, par


convention d'écriture :

si et seulement si .

Dans ce contexte, est également appelée "fonction à intégrer" et , "fonction sous


le signe somme".

Géométriquement, nous pouvons considérer l'intégrale indéfinie comme un ensemble


(famille) de courbes telles que nous passons de l'une à l'autre en effectuant une translation
dans le sens positif ou négatif de l'axe des ordonnés.

Revenons-en à la démonstration du point (2) du théorème fondamental de l'analyse :

P2. Soit une primitive de .

Puisque deux primitives diffèrent d'une constante, nous avons bien:

ce que nous pouvons écrire aussi :

pour tout dans . Le cas particulier donne et donc

et . En remplaçant, nous obtenons :

Comme cette identité est valable pour tout de l'intervalle , elle est vraie en
particulier pour . D'où :

325/2001
Sciences.ch 14/03/2005

Remarque : le théorème fondamental qui montre le lien entre primitive et intégrale a conduit à
utiliser le même symbole pour écrire une primitive, qui est une fonction, et une intégrale,
qui elle, est un nombre.

Voici quelques propriétés triviales de l'intégration qu'il est bon de se rappeler (si cela ne vous
semble pas évident, contactez-nous et nous le détaillerons) :

P1. La dérivée d'une intégrale indéfinie est égale à la fonction à intégrer :

P2. La différentielle d'une intégrale indéfinie est égale à l'expression sous le signe somme :

P3. L'intégrale indéfinie de la différentielle d'une certaine fonction est égale à la somme de
cette fonction et d'une constante arbitraire :

P4. L'intégrale indéfinie de la somme (ou soustraction) algébrique de deux ou plusieurs


fonctions est égale à la somme algébrique de leurs intégrales :

Démonstration :

D'après P1 nous avons :

Vérifions s'il en est de même avec le membre de droite (nous supposons connues les
propriétés des dérivées que nous avons démontrées au début de ce chapitre) :

P5. Nous pouvons sortir un facteur constant de sous le signe somme, c'est-à-dire :

Nous justifions cette égalité en dérivant les deux membres (et d'après les propriétés des
dérivées) :

326/2001
Sciences.ch 14/03/2005

P6. Nous pouvons sortire un facteur constant de l'argument de la fonction intégrée (plutôt
rarement utilisée) :

En effet, en dérivant les deux membres de l'égalité nous avons d'après les propriétés des
dérivées :

P7. L'intégration d'une fonction dont l'argument est sommé (ou soustrait) algébriquement est
la primitive de l'argument sommé (respectivement soustrait) :

Cette propriété ce démontre également identiquement à la précédente à l'aide des propriétés


des dérivées.

P8. La combinaison des propriétés P6 et P7 nous permettent d'écrire :

INTÉGRATION PAR CHANGEMENTS DE VARIABLE

Voici un théorème important. Lorsque nous ne pouvons facilement déterminer la primitive


d'une fonction donnée, nous pouvons nous débrouiller par un changement de variable
astucieux (parfois même très subtile) à contourner la difficulté. Cela ne marche pas à tous les
coups (car certaines fonctions ne sont pas intégrables formellement) mais il vaut la peine
d'essayer avant d'avoir recours à l'ordinateur.

A nouveau, nous ne donnons que la forme générale de la méthode. C'est le rôle des
professeurs dans les écoles d'entraîner les élèves à comprendre et maîtriser ce genre
techniques. De plus, les chapitres traitant des sciences exactes sur le site (physique,
informatique, astrophysique, chimie, …) regorgent d'exemples utilisant cette technique et
servent ainsi implicitement d'exercices de style.

Soit à calculer l'intégrale (non bornée pour l'instant) :

bien que nous ne sachions pas calculer directement la primitive de cette fonction (en

327/2001
Sciences.ch 14/03/2005

tout cas nous imaginons être dans une telle situation) nous savons (d'une manière ou d'une
autre) qu'elle existe (nous ne traitons pas encore des intégrales impropres à ce niveau).

La technique consiste alors dans cette intégrale à effectuer le changement de variable :

où est une fonction continue ainsi que sa dérivée, et admettant une fonction inverse.
Alors , démontrons que dans ce cas l'égalité :

est satisfaite.

Nous sous-entendons ici que la variable sera remplacée après intégration du membre droit
par son expression en fonction de . Pour justifier l'égalité en ce sens, il suffit de montrer que
les deux quantités considérées dont chacune n'est définie qu'à une constant arbitraire près ont
la même dérivée par rapport à . La dérivée du membre gauche est :

Nous dérivons le membre droit par rapport à en tenant compte que est une fonction de .
Nous savons que :

Nous avons par conséquent :

Les dérivées par rapport à des deux membres de l'égalité de départ sont donc égales
(c.q.f.d).

Bien évidemment, la fonction doit être choisie de manière à ce que nous sachions
calculer l'intégrale indéfinie figurant à droite de l'égalité.

Remarque : il est parfois préférable de choisir le changement de variable sous la forme


au lieu de car cela à une large tendance à simplifier la longueur de
l'équation au lieu de l'allonger.

JACOBIEN

Considérons un domaine du plan limité par une courbe . Supposons que les
coordonnées soient des fonctions des nouvelles variables (toujours dans le cadre

328/2001
Sciences.ch 14/03/2005

d'un changement de variables donc) par les relations de transformations :

où les fonctions et sont univoques, continues et possèdent des dérivées


continues dans un certain domaine que nous définirons par la suite. Il correspond alors
d'après les relations précédentes à tout couple de valeurs un seul couple de valeur et
réciproquement.

Il résulte de ce qui précède qu'à tout point du plan correspond univoquement un


point j du plan de coordonnées définies par les relations précédentes. Les
nombres et seront appelées "coordonnées curvilignes" de et nous verrons des
exemples concrets et schématisé de ceux-ci dans le chapitre de calcul vectoriel.

Si dans le plan le point décrit la courbe fermée délimitant le domaine , le point


correspondant décrit dans le plan un certain domaine . Il correspond alors à tout point
de un point de . Ainsi, les relations de transformations établissent une correspondance
biunivoque entre les points des domaines et .

Considérons maintenant dans une droite . En général, les relations de


transformation lui font correspondre dans le plan une ligne courbe (ou inversement).
Ainsi, découpons le domaine par des droites et en de petits domaines
rectangulaires (nous ne prendrons pas en compte dans la limite, les rectangles empiétant sur la
frontière de ). Les courbes correspondantes du domaine découpent alors ce dernier en
quadrilatère (définis par des courbes donc). Evidemment, l'inverse est applicable.

Considérons dans le plan le rectangle limité par les droites :

et le quadrilatère curviligne correspondant dans le plan . Nous désignerons les aires


de ces domaines partiels également par et . Nous avons évidemment :

Les aires et peuvent êtres en générales différentes.

Supposons donne dans une fonction continue . Il correspond à toute valeur de


cette fonction du domaine la même valeur (ce qu'il faut vérifier) dans , où :

329/2001
Sciences.ch 14/03/2005

Considérons les sommes intégrales de la fonction dans le domaine . Nous avons


évidemment l'égalité suivante :

Calculons , c'est-à-dire l'aire du quadrilatère curviligne dans le plan :

Déterminons les coordonnes de ses sommets :

Nous assimilerons dans le calcul de l'aire du quadrilatère les arcs


à des segments de droites parallèles. Nous remplacerons en outre les
accroissement des fonctions par leurs différentielles. C'est dire que nous faisons abstraction
des infiniment petits d'ordre plus élevé que et . Les relations précédentes deviennent
alors :

Sous ces hypothèses, le quadrilatère curviligne peut être assimilé à un


parallélogramme. Son aire est approximativement égale au double de l'aire du triangle
, aire que nous pouvons calculer en utilisant les propriétés du déterminant (comme nous
le démontreront dans le chapitre d'algèbre linéaire, le déterminant dans représente un
parallélogramme alors que dans celui-ci représente l'aire d'un parallélépipède) :

Tel que (c'est là qu'il faut faire le meilleur choix pour que l'expression final soit la plus simple
et la plus esthétique, nous procédons par essais successifs et faisons enfin le choix ci-
dessous) :

330/2001
Sciences.ch 14/03/2005

Ainsi, nous avons :

Par conséquent :

Avec :

qui est la "matrice jacobienne" (alors que son déterminant est appelé le "jacobien" (tout

331/2001
Sciences.ch 14/03/2005

court)) du transformation de coordonnées de . En appliquant exactement le même


raisonnement pour , alors la matrice jacobienne s'écrit alors (en changeant un peu les
notations car sinon cela devient illisible):

Bref, à quoi cela sert-il concrètement ? Eh bien revenons à notre relation :

qui n'est finalement qu'approximative étant donné que dans les calculs de l'aire nous avons
négligé les infiniment petits d'ordre supérieur. Toutefois, plus les dimensions des domaines
élémentaires et sont petites, et plus nous nous approchons de l'égalité. L'égalité ayant
finalement lieu quand nous passons à la limite (finalement en maths aussi on fait des
approximation… hein !), les surfaces des domaines élémentaires tendant vers zéro :

Appliquons maintenant l'égalité obtenue au calcul de l'intégral double (nous pouvons faire de
même avec la triple bien sûr). Nous pouvons donc finalement écrire (c'est la seule manière de
poser la chose qui a un sens) :

Passant à la limite, nous obtenons l'égalité rigoureuse :

Telle est la relation de transformation des coordonnées dans une intégrale double. Elle permet
de ramener le calcul d'une intégrale double dans le domaine au domaine , ce qui peut
simplifier le problème.

De même, pour une intégrale triple, nous écrirons :

332/2001
Sciences.ch 14/03/2005

Déterminons maintenant le Jacobien pour les systèmes de coordonnées les plus courants (nous
renvoyons à nouveau le lecteur au chapitre de calcul vectoriel pour plus d'information
concernant ces système) :

1. Coordonnes polaires :

Comme est toujours positif, nous écrivons simplement :

2. Coordonnées cylindriques (voir le chapitre d'alèbre linéaire


pour le calcul du déterminant) :

Comme est toujours positif, nous écrivons simplement :

3. En coordonnées sphériques (voir le chapitre


d'algèbre linéaire pour le calcul du déterminant) :

333/2001
Sciences.ch 14/03/2005

Comme est toujours positif, nous écrivons simplement :

avec

INTÉGRATION PAR PARTIES

Lorsque nous cherchons à effectuer des intégrations, il est fréquent que nous ayons à utiliseer
un outil (ou méthode de calcul) appelé "intégration par parties". Voici la démonstration de la
validité de ce dernier.

Soit deux applications de classe (dérivables fois) de dans , alors:

Démonstration par récurrence sur : nous supposons la formule vraie pour et nous la
démontrons pour :

334/2001
Sciences.ch 14/03/2005

Pour nous retrouvons la formule bien connue:

PRIMITIVES USUELLES

Il exise en mathématique et en physique un grand nombre de primitives ou de fonctions


définies sur des intégrales que nosu retrouvons assez fréquemment (mais pas exclusivement).
Comme dans n'importe quel formulaire, nous vous proposons les primitives connues mais
avec les démonstrations.

Cependant, nous omettrons les primitives qui découlent déjà des dérivées que nous avons
démontrées dans le sous-chapitre précédent traitant du calcul différentiel.

Sinon voici déjà une liste de quelques intégrales fréquentes (le lecteur en rencontrera de toute
façon bien d'autres – développées dans les détails - lors de son parcours du site) :

1. Primitive de :

Par définition nous avons donc :

Nous utilise le changement de variable et ainsi :

Donc :

2. Primitive de :

Par définition nous avons donc :

Nous utilisons le changement de variable et :

Donc :

335/2001
Sciences.ch 14/03/2005

3. Primitive de :

Nous intégrons par parties :

Si nous posons ,( ) nous obtenons :

Donc :

4. Primitive de :

Nous intégrons à nouveau par parties :

Si nous pose ,( ), nous obtenons :

Donc :

5. Primitive de :

Nous intègre encore une fois par parties :

Si nous posons ,( ), nous obtenons :

336/2001
Sciences.ch 14/03/2005

Donc :

6. Primitive de :

Encore une fois… nous intègre par parties :

Si nous posons ,( ), nous obtenons :

Donc :

7. Primitive de :

Avec .Une intégration par parties nous donne :

Donc :

Remarque : une autre intégrale très importante avec l'exponentielle en physique est celle que
nous avions démontrée lors de notre étude de la loi de Gauss-Laplace en statistiques et
probabilités (détermination de la moyenne).

8. Primitive de :

en intégrant par parties nous trouvons :

337/2001
Sciences.ch 14/03/2005

Donc :

9. Primitive de :

Avec . Une intégration par parties nous donne :

Donc :

11. Primitive de :

Ainsi il vient :

Il vient :

et

d'où :

12. Primitive de :

Pour ( ) sachant que (voir les propriétés des logarithmes dans le chapitre d'analyse
fonctionnelle) :

nous avons en utilisant la primitive de :

338/2001
Sciences.ch 14/03/2005

13. Primitive de :

Nous avons :

Nous utilisons le changement de variable et obtenons :

Donc :

14. Primitive de :

Nous avons donc :

Nous utilisons le changement de variable et obtenons:

Donc :

15. Primitive de :

Nous intégrons par parties :

Si nous posons ,( ) nous obtenons :

339/2001
Sciences.ch 14/03/2005

Donc :

16. Primitive de :

Nous intégrons par parties :

Si on pose ,( ) nous obtenons :

Donc finalement :

17. Primitive de :

Nous intégrons par parties :

Si nous posons ,( ) nous obtenons :

Donc finalement :

18. Primitive de :

Nous intégrons par parties :

340/2001
Sciences.ch 14/03/2005

Si nous posons ,( ) nous obtenons :

Donc finalement :

19. Primitive de :

Avec . Posons . Une intégration par partie donne :

en remplaçant par dans la dernière intégrale, nous obtenons :

et donc :

20. Primitive de :

Avec . Dans ce cas nous avons la formule de récurrence

qui se démontre de la même façon que la relation de récurrence précédente.

21. Primitive de :

Sachant que , nous avons :

Donc :

341/2001
Sciences.ch 14/03/2005

22. Intégrale de :

Sachant que , nous avons :

Donc :

24. Primitive de :

En utilisant les relations trigonométriques remarquables, nous avons :

Selon la primitive . Donc :

25. Primitive de :

En utilisant encore une fois les relations trigonométriques remarquables, nous avons :

Selon la primitive . Donc :

26. Primitive de :

Nous faisons la substitution ( ). Sachant que :

342/2001
Sciences.ch 14/03/2005

(voir chapitre de trigonométrie) nous obtenons alors :

et

(selon la dérivée de ). Donc :

et :

27. Primitive de :

Sachant que (voir chapitre de trigonométrie) nous avons :

Nous faisons le changement de variable ( ):

(selon la primitive de ). Donc :

28. Primitive de :

343/2001
Sciences.ch 14/03/2005

Nous faisons la substitution ( ). Sachant que :

(voir chapitre de trigonométrie) nous obtenons :

et

(selon la dérivée de ). Donc :

et :

29. Soit :

avec . Nous avons:

Or cette dernière intégrale se résout par parties:

Donc:

344/2001
Sciences.ch 14/03/2005

Que l'on retrouve plus fréquemment dans la littérature sous la forme:

Identiquement au développement suivant, nous avons pour (le signe change):

la relation suivante:

Vous pourrez trouver une application de ces deux primitives dans le modèle cosmologique
newtonien de l'univers dans le chapitre d'astrophysique à la section de mécanique analytique.

FONCTION DE DIRAC

La fonction de Dirac ou "fonction delta" joue un rôle pratique très important aussi bien en
électronique et informatique qu'en physique quantique ondulatoire et physique quantique des
champs (cela permet de discrétiser un continuum). Pour l'introduire simplement, considérons
la fonction définie par:

La représentation de est un rectangle de largeur , de hauteur et de surface


unité. La fonction de Dirac peut être considérée comme la limite, lorsque de la
fonction . On a donc:

avec:

où est un nombre plus grand que 0 aussi petit que nous le voulons. Pour une fonction

345/2001
Sciences.ch 14/03/2005

continue en on a:

Par extension nous avons :

et pour une fonction continue en :

Il est alors assez aisé de définir la fonction de Dirac dans l'espace à 3 dimensions par:

FONCTION GAMMA D'EULER

Nous définissons la fonction Gamma d'Euler (intégrale Eulérienne de deuxième espèce) par
l'intégrale suivante:

avec (entiers naturels nul non compris).

Remarque : nous avons déjà rencontré cette intégrale et certaines de ses propriétés lors de
notre étude la fonction de distribution bêta en probabilités et statistiques (voir la section
d'arithmétique). Nous utiliserons également cette intégrale en maintenance (gestion de la
production) et dans la théorie des cordes).

Cette fonction est intéressante si nous l'écrivons sous la forme suivante (la variable
supposée appartenant aux entiers naturels) :

Intégrons par partie cette dernière fonction:

346/2001
Sciences.ch 14/03/2005

Comme la fonction exponentielle décroît beaucoup plus vite que nous avons :

Il en découle :

Donc:

CONSTANTE D'EULER-MASCHERONI

Ce petit texte fait juste office de curiosité relativement à la constante d'Euler et à presque
tous les outils de calcul différentiel et intégral que nous avons vu jusqu'à maintenant. C'est un
très joli exemple (presque artistique) de ce que nous pouvons faire avec les mathématiques
dès que nous avons suffisamment d'outils à notre disposition.

De plus, cette constante est utile dans certaines équations différentielles où nous la
retrouverons.

Nous avions vu que le nombre dans la rubrique d'analyse fonctionnelle que la constante
d'euler est défini par la fonction :

Dans un cas plus général nous pouvons très facilement démontrer da la même façon que:

Cela suggère évidemment:

par changement de variable nous écrivons :

347/2001
Sciences.ch 14/03/2005

Pour transformer cette expression nous pouvons écrire :

Or la quantité:

tend vers la limite , appelée "constante d'Euler-Mascheroni" ou également


£"constante Gamma d'Euler", lorsque tend vers l'infini.

D'où:

Divisons chacun des termes du produit par l'entier correspondant pris dans ,
nous obtenons donc:

348/2001
Sciences.ch 14/03/2005

SUITES ET SÉRIES

Les suites et séries ont une très grande importante dans les mathématiques pures c'est la raison
pour laquelle nous y consacrons un chapitre entier. Il conviendra cependant de la part du
lecteur de ne pas confondre dans ce qui va suivre le concept de "suite" de celui de "série" qui
tout en étant similaires sur le fond ne s'analysent mathématiquement pas toujours de la même
manière (au fait la différence est même très importante).

Nous avons souhaité dans ce chapitre rester dans des choses simples sans trop partir dans les
concepts topologiques des suites et séries. Cependant, la personne intéressée par des
définitions beaucoup plus rigoureuses pourra se reporter dans le chapitre traitant des fractales
(section d'informatique) et de topologie ou de nombreux concepts sur le suites sont définis
(supremum, infimum, sous-suite, théorème de Bolzano-Weierstrass,...).

SUITES

Définitions :

D1. Des nombres (en suite) sont en "progression arithmétique" si la différence de deux termes
consécutifs est constante.

D2. Des nombres (en suite) sont en "progression géométrique" si le rapport de deux termes
consécutifs est constant.

D3. Des nombres (en suite) sont en "progression harmonique" si les inverses de deux termes
consécutifs sont en progression arithmétique.

Dès lors, une "suite" est arithmétique, géométrique, harmonique si ses termes sont
respectivement en progression arithmétique, géométrique, harmonique et est la moyenne
arithmétique, géométrique, harmonique de et si les nombres sont en progression
arithmétique, géométrique, harmonique.

SUITES ARITHMÉTIQUES

Nous disons que des nombres ou que des "termes" en progression forment une "suite
arithmétique" lorsque leurs valeurs numériques différent d'une valeur appelée la "raison" de
la suite.

Ainsi, la suite:

est une suite arithmétique de raison .

La suite :

est une suite arithmétique de raison , etc.

349/2001
Sciences.ch 14/03/2005

Ainsi, si nous notons par un terme quelconque de la suite ( ) de raison , nous avons :

Nous avons les propriétés suivantes pour un tel type de suite :

P1. Un terme dont le rang est la moyenne arithmétique des rangs de deux autre termes est la
moyenne arithmétique de ces deux termes.

Démonstration :

Considérons maintenant ( ) une suite arithmétique de raison définie par :

et soient tels que , nous avons alors :

et donc :

avec

Corollaire : pour trois termes consécutifs en progression arithmétique, le deuxième terme est
la moyenne arithmétique des deux autres.

Démonstration :

avec

SUITES HARMONIQUES

Nous disons que des nombres forment une "suite harmonique" lorsque leurs inverses sont en
progression arithmétique. Nous représentons cette progression par :

désignant des termes en progression arithmétique de raison ; d'ailleurs, nous


supposerons, dans ce qui suit, qu'il n'y a aucun dénominateur nul.

En partageant cette série en groupes renfermant successivement termes, nous observons


que chacun de ceux-ci est plus grand que le dernier de son groupe:

350/2001
Sciences.ch 14/03/2005

et que la somme des termes de chaque groupe est plus grande que 1/2 . La somme des termes
de la série augment donc indéfiniment; nous disons alors que la série est "divergente" (nous
reviendrons plus en détail sur ces concepts de convergence et divergence lors de.

Plus généralement, la somme des termes d'une progression harmonique indéfinie est
divergente. En effet, pour un terme quelconque, nous avons :

en désignant par l'entier plus grand que , les termes de la progression sont
respectivement, à partir de ce terme, plus petits que le quotient par des termes:

de la série harmonique.

SUITES GÉOMETRIQUES

Une "suite géométrique" est une suite de nombres tels que chacun d'eux est égal au précédent
multiplié par un nombre constant que nous appelons la "raison" de la progression. Nous
désignerons par:

Ainsi, si nous notons par un terme quelconque de la suite ( ), nous avons (trivial) :

Nous avons les propriétés suivantes pour un tel type de suite (sans démonstration pour
l'instant... sauf demande car triviales pour la plupart) :

P1. (triviale) Le quotient de deux termes d'une même suite est une puissance de la raison dont
l'exposant égale la différence des rangs des deux termes (simple rapport de termes de
puissance).

P2. (triviale) Si nous multiplions ou divisons terme à terme deux suites géométriques, nous
obtenons une troisième suite géométrique dont la raison égale le produit respectivement le
quotient des raisons des progressions données (simple opération avec les raisons des deux
séries d'origine).

P3. (triviale) Le produit de deux termes équidistants des extrêmes égale le produit compris
dans l'intervalle entre ces termes et les extrêmes (relisez plusieurs fois au besoin).

351/2001
Sciences.ch 14/03/2005

P4. Dans une suite géométrique, un terme dont le rang est la moyenne arithmétique des rangs
de deux autre termes est la moyenne géométrique de ces deux termes (relisez plusieurs fois au
besoin).

Démonstration :

Soit une suite géométrique de raison , nous avons :

Soit deux termes de la suite géométrique, nous avons alors :

et ainsi :

Corollaire (trivial) : pour trois termes consécutifs en progression géométrique, le deuxième


terme est la moyenne arithmétique des deux autres.

Démonstration :

avec

Il existe cependant quelques suites particulières qui ont des propriétés particulières que nous
retrouvons très fréquemment en mathématique ou physique théorique. Sans trop entrer dans
les détails, voici une petite liste (non exhaustive de ces dernières) :

SUITE DE CAUCHY

Il est souvent intéressant pour le mathématicien, autant que pour le physicien, de connaître les
propriétés d'une suite ayant une type de progression donnée. La propriété la plus importante
étant la limite vers laquelle elle tend.

Remarque : le lecteur qui n'est pas à l'aise avec la topologie peut sauter le texte qui va suivre
en attendant... et celui qui souhaite en savoir plus sur les suites de Cauchy peut se reporter au
chapitre de topologie et particulièrement dans le chapitre consacré aux fractales (section
d'informatique théorique).

Définition: soit un espace métrique (voir le chapitre de topologie), nous disons que la
suite:

converge vers si par définition :

352/2001
Sciences.ch 14/03/2005

En d'autres termes plus nous avancons dans la suite, plus les points sont proches (au sens de la
métrique d ) les uns des autres.

Nous disons également par définition que la suite d'éléments de est une "suite de
Cauchy" si :

Il est clair alors que toute suite convergente est une suite de Cauchy (bon il y a quelques
subtilités auxquelles nous ne ferons pas référence pour l'instant).

Remarque : ce critère facilite certaines démonstrations car il permet de montrer l'existence


d'une limite sans faire intervenir sa valeur, en général inconnue.

Proposition : une suite convergente est de Cauchy

Démonstration : soit une suite convergeant vers (qui nous est inconnu donc) et
(choisi au hasard). Il existe alors selon la définition de la suite de Cauchy tel que :

le choix d'écrire est complètement mais au fait nous anticipons juste le résultat de la
démonstration afin que celui-ci soit plus esthétique.

Alors pour (au fait connaître le en question importe peu puisque cela doit
marcher pour n'importe lequel) nous avons selon l'inégalité triangulaire :

et puisque :

ce qui revient à écrire :

C'est peut être un peu abstrait alors voyons un exemple avec le suite harmonique (divergente
comme nous le savons déjà) . D'abord, rien ne nous interdit de prendre (sinon
cela va être dur de faire une différence entre deux termes…).

353/2001
Sciences.ch 14/03/2005

Dès lors nous prenons la distance euclidienne :

D'abord le lecteur remarquera que dans tous les cas puisque compris entre et
. Ce qui nous amène à pouvoir écrire :

Donc à partir de cette égalité il vient automatique que chaque terme de la somme de gauche
ci-dessous sera plus grand que chaque terme de la somme de droite suivant :

avec

maintenant l'idée est de voir que la somme de gauche est donc plus grande ou égale à
et cela quelque soit . Ainsi, l'idée c'est que nous ayons trouvé un epsilon pour lequel le
critère de Cauchy est mis en défaut. Car dans le cas contraire nous aurions du avoir :

dont la suite n'est pas convergente.

Donc, ce n'est pas parce que des points se rapprochent les uns des autres qu'ils convergent
vers un point, car ce point n'existe peut-être pas.

Exemple :

Le meilleur exemple est certainement le suivant : prenons et . Soit z


un nombre irrationnel et , avec .

Les forment une suite de Cauchy. En effet :

et donc si . Nous avons donc trouvé un N qui satisfait à notre


définition d'une suite de Cauchy. Or cette suite ne converge pas dans sinon z serait
rationnel.

Remarque : les mathématiciens utilisent ce fait pour définir l'ensemble des irrationnels en
utilisant quelques concepts topologique supplémentaires.

Nous venons de voir qu'une suite de Cauchy n'est pas forcément une suite convergente dans

354/2001
Sciences.ch 14/03/2005

X. La réciproque toutefois est vraie : toute suite convergente est une suite de Cauchy.

SUITE DE FIBONACCI

Si nous calculons une suite de nombres commençant par 0 et 1, de telle sorte que chaque
terme soit égale à la somme des deux précédents, nous pouvons former la suite:

par conséquent, si nous désignons les différents termes par :

nous avons la loi de formation:

La suite de Fibonacci possède des propriétés nombreuses fort intéressantes, qui seront
développées ultérieurement. Cette suite a été étudiée par Albert Girard (1633) dans la dernière
annotation de sa traduction du 5ème et du 6ème livre de l'Arithmétique de Diophante. Il
démontre que le rapport de deux termes consécutifs de la suite s'approche de plus en plus du
rapport du côté du décagone régulier inscrit dans la circonférence au rayon de cette
circonférence. Dans un mémoire présenté à l'Académie des Sciences de Paris en 1844, Lamé
indique l'application que l'on peut faire de cette suite à la détermination d'une limite
supérieure du nombre des divisions à faire dans la recherche du plus grand commun diviseur
de deux nombres entiers; l'année précédente Binet en avait montré l'emploi pour le
dénombrement des combinaisons discontigües. Cette même suite a encore été étudiée par
Plana en 1859. Il s'agit cependant de la première "suite récurrente" connue (d'où le fait que
nous en parlons aussi).

Nous utilisons également ce genre de suite pour montrer l'utilité du principe d'induction
présenté dans le chapitre de la théorie des nombres se trouvant dans la section d'arithmétique.

SÉRIES

Le physicien a souvent besoin pour résoudre simplement et formelement des problèmes,


d'approximer certains "termes" (voir théorie de la démonstration) de ses équations. Pour cela,
il utilisera la théorie des séries.

Il existe, une quantité phénomènale de séries et de théories gravitant autour de ces dernières,
mais nous nous citerons en particulier les séries de Taylor (utilisées un peu partout), séries de
Fourier (théorie du signal et en mécanique ondulatoire) et les séries ou fonctions de Bessel
(physique nucléaire) dont nous ferons une étude ici.

Définition : soit donnée une suite numérique infinie :

L'expression :

355/2001
Sciences.ch 14/03/2005

est appelée "série numérique".

Définition : La somme partielle des premiers termes de la série est appelée "somme
partielle " :

Si la limite suivante existe et est finie :

nous l'appelons la "somme de la série" et nous disons que la "série converge" (elle est donc de
Cauchy). Cependant, si la limite n'existe pas, nous disons que la "série diverge" et n'a pas de
somme (pour plus de détails voir le sous-chapitre plus loin traitant des critères de
convergence).

SÉRIES DE GAUSS

Les séries arithmétiques de Gauss sont l'expression de la somme de premiers entiers non
nuls élevés à une puissance donnée sous une forme condensée. L'application de cette forme
condensée de série à une utilité pratique en physique lorsque l'on souhait simplifier
l'expression de certains résultats.

Gauss avait trouvé une méthode séduisante en 1786 pour déterminer cette expression lorsqu'il
avait 9 ans (...):

En simplifiant, nous trouvons facilement:

pour .

Nous pouvons continuer ainsi pour des ordres supérieurs (nous les présentons non en tant
qu'exercices mais parce que ces relations sont utiles!):

Calculons maintenant la somme des premiers carrés (toujours non nuls). Posons:

356/2001
Sciences.ch 14/03/2005

nous savons que (binôme de Newton):

nous pouvons donc écrire et ajouter membre à membre les égalités suivantes:

Avec quelques manipulations algébriques élémentaires:

d'où:

Finalement:

Terminons avec

la somme des premiers cubes (non nuls). Le principe étant le même que précédemment,
nous posons:

Nous savons que (binôme de Newton):

nous obtenons en faisant varier de 1 à , relations que nous pouvons ajouter membre à

357/2001
Sciences.ch 14/03/2005

membre:

en isolant , nous obtenons la relation de la somme des cubes:

Evidemment, nous pouvons continuer ainsi longtemps mais à partir du certaine valeur de
l'élévation de la puissance les choses se compliquent un petit peu (de plus, la méthode est un
peu longue). Ainsi, un des membre de la famille des Bernoulli (c'était une famille de
mathématiciens assez doués...) a montré une relation générale fonctionnant pour n'importe
quelle puissance en définissant ce que l'on appelle le "polynôme de Bernoulli".
Personnellement, bien que cette méthode fonctionne très bien, nous n'avons pas souhaité la
présenter ici, excepté si un lecteur nous en fait la demande.

SÉRIES DE TAYLOR ET DE MACLAURIN

Soit un polynôme :

Nous avons trivialement pour ce dernier :

Soit maintenant la dérivée du polynôme :

donc :

et ainsi de suite avec tel que :

358/2001
Sciences.ch 14/03/2005

Il s'ensuit que :

Donc finalement notre polynôme peut s'écrire :

relation que l'on appelle "série de MacLaurin limitée" ou tout simplement "série de
MacLaurin".

En appliquant maintenant le même raisonnement mais en centrant le polynôme sur la valeur


, nous avons :

et ainsi le développement précédent devient :

qui n'est d'autre que l'expression générale d'un polynôme exprimé sous une forme dite de
"série de Taylor limitée".

Ainsi, certaines fonctions pouvant être approximées par un polynôme autour


d'une valeur peuvent êtres exprimées sous la forme d'un polynôme tel que :

RESTE DE LAGRANGE

Il peut y avoir un intérêt à connaître l'erreur d'approximation du polynôme par rapport à

359/2001
Sciences.ch 14/03/2005

la fonction . Définissons ainsi un "reste" , tel que :

La fonction est appelée "reste de Lagrange".

Théorème : Soit une fonction dérivable sur un intervalle qui contient . Pour
une valeur de l'intervalle, différente de , il existe un nombre situé entre et tel
que :

Démonstration : Soit une fonction définie pour une variable définie dans l'intervalle
considéré et définie par :

avec bien sûr :

Nous voyons que tel que s'annule bien pour les valeurs :

Dérivons maintenant , nous trouvons :

Après simplification :

Selon le théorème de Rolle (voir chapitre de calcul différentiel et intégral), nous devons
trouver une valeur pour lequel la dérivée s'annule. Donc :

360/2001
Sciences.ch 14/03/2005

Nous pouvons simplifier l'équation par et nous trouvons pour maximum de :

Nous voyons que plus le polynôme est de degré élevé, plus il approxime la fonction
avec exactitude. Que se passe-t-il lorsque ?

Théorème : Supposons que admette des dérives de tout ordre (ce que l'on note ) pour
toutes les valeur d'un intervalle quelconque contenant et soit le reste de Lagrange de
en . Si, quel que soit dans l'intervalle :

alors est exactement représentée par sur l'intervalle.

Démonstration : elle découle simplement de l'expression de lorsque

Le polynôme :

est appelé "polynôme de Taylor" ou "série de Taylor". Si , il est appelé "polynôme de


MacLaurin" ou "série de MacLaurin".

SÉRIES DE FOURIER

Nous appelons par définition "série trigonométrique" une série de la forme :

ou sous une forme plus compacte :

Les constantes sont les coefficients de la série trigonométrique plus

361/2001
Sciences.ch 14/03/2005

souvent nommés "coefficients de Fourier".

Si la série converge, sa somme est une fonction périodique de période , étant


donné que et sont des fonctions périodiques de période . De sorte que:

Posons le problème suivant : nous nous donnons une fonction périodique de période
. Nous demandons s'il existe une série trigonométrique convergent vers moyennant
des conditions sur cette série.

Supposons maintenant que la fonction , périodique et de période , puisse être


effectivement représentée par une série trigonométrique convergent vers dans
l’intervalle , c'est-à-dire qu’elle soit la somme de cette série :

Supposons que l’intégrale de la fonction du premier membre de cette égalité soit égale à la
somme des intégrales des termes de la série ci-dessus. Ceci aura lieu, par exemple, si nous
supposons que la série trigonométrique proposée converge absolument, c'est-à-dire que
converge la série numérique suivante (de par la propriété bornée des fonctions
trigonométriques) :

La série :

est alors majorable et peut être intégrée terme à terme de 0 à (où ) ce qui nous
permet de déterminer les différents coefficients de Fourier. Mais avant de commencer
exposons les intégrales suivantes qui nous seront utiles par la suite (si le lecteur souhaite le
développement des ces intégrales, nous le feront) :

Avec et Avec et

362/2001
Sciences.ch 14/03/2005

Pour déterminer les coefficients multiplions les deux membres de l’égalité :

par :

La série du second membre de l’égalité est majorable, étant donné que ses termes ne sont pas
supérieurs en valeurs absolues aux termes de la série positive convergente. Nous peuvons
donc l’intégrer terme à terme sur tout segment borné de 0 à :

Ainsi, pour déterminer l’ensemble des coefficients nous développons la fonction ci-dessus
en posant :

D’où nous tirons que :

Pour déterminer les coefficients multiplions les deux membres de l’égalité par :

La série du second membre de l'égalité est majorable, étant donné que ses termes ne sont pas
supérieurs en valeurs absolues aux termes de la série positivie convergente. Nous pouvons
donc l'intégrer terme à terme sur tout segement borné de 0 à :.

Ainsi, pour déterminer l’ensemble des coefficients nous développons la série ci-dessus en
posant encoire une fois :

363/2001
Sciences.ch 14/03/2005

D’où nous tirons que :

Les coefficients de Fourier sont donc déterminés par les intégrales:

et :

Le théorème de Fourier montre que toute fonction périodique continue peut être approchée
par une somme infinie de fonctions trigonométriques (sinus ou cosinus) consistant en une
fonction fondamentale et ses harmoniques.

SÉRIES DE BESSEL

Les fonctions de Bessel sont très utiles dans de nombreux domaines de pointe de la physique
faisant intervenir des équations différentielles délicates à résoudre. Les domaines dans
lesquelles nous les trouvons le plus souvent sont la calorimétrie (conduction de la chaleur), la
physique nucléaire (physique de réacteurs), et la mécanique des fluides.

Ces séries sont cependant très peu détaillées dans les écoles universitaires et il est souvent du
rôle de l'élève de chercher les compléments d'informations dont il a besoin sur le sujet dans la
bibliothèque de son école. Nous avons voulu présenter ici les développements permettant
d'éviter cette démarche tout en restant chez soi devant son ordinateur (de plus les livres sur le
sujet sont assez rares...).

Remarque préalable : nous parlons habituellement par abus de langage des "fonctions de
Bessel" au lieu des "séries de Bessel"

Il existe une quantité non négligeable de fonctions de Bessel mais nous allons nous restreindre
à l'étude de celles qui sont les plus utilisées en physique.

FONCTION DE BESSEL D'ORDRE ZÉRO

La fonction connue sous le nom de "fonction de Bessel d'ordre zéro", notée est définie par la
série de puissances:

364/2001
Sciences.ch 14/03/2005

C'est lors de l'étude des propriétés de dérivation et d'intégration que Bessel a trouvé que cette
série de puissance est une solution à une équation différentielle que l'on retrouve assez
fréquemment en physique. C'est pourquoi elle porte son nom.

Si représente le terme de la série, nous voyons aisément que:

qui tend vers zéro quand , quelque soit la valeur de . Cela a pour conséquence que la
série converge pour toutes les valeurs de . Comme il s'agit d'une série de puissance positive,
la fonction et toutes ces dérivées sont continues pour toutes valeurs de , réelles ou
complexes.

FONCTION DE BESSEL D'ORDRE N

La fonction , connue sous le nom de "fonction de Bessel d'ordre ", est définie, lorsque
est un entier positif, par la série de puissance:

qui converge pour toutes valeurs de , réelles ou complexes.

365/2001
Sciences.ch 14/03/2005

En particulier, pour nous avons :

et quand :

Nous pouvons noter que est une fonction paire de quand est paire, et impaire
quand est impaire (voir le chapitre d'analyse fonctionnelle pour voir ce qu'est une fonction
paire ou impaire).

En dérivant la fonction et en comparant le résultat avec la série , nous voyons


sans trop de peine que:

Nous trouvons également sans trop de difficulté, la relation suivante:

366/2001
Sciences.ch 14/03/2005

En utilisant le fait que :

et en l'incluant dans la précédente relation, nous trouvons :

ou écrit autrement:

est donc une solution de l'équation différentielle du second ordre :

ou écrit autrement :

ou encore :

Une solution à une équation Bessel qui n'est pas un multiple de est appelée "fonction
de Bessel du seconde type". Supposons que est une telle fonction et posons ; alors
d'après la relation:

nous avons:

et

En multipliant la première relation par et la seconde par et après soustraction, nous


obtenons :

367/2001
Sciences.ch 14/03/2005

nous avons donc également:

nous pouvons donc écrire:

effectivement car si nous développons, nous trouvons :

Pour que l'égalité :

soit satisfaite, nous avons:

En divisant par , nous avons :

ce qui est équivalent à :

de suite, par intégration il vient :

où est une constante. Consécutivement nous avons, puisque :

où rappelons-le, et sont des constantes, et si n'est pas un multiple de par

368/2001
Sciences.ch 14/03/2005

définition.

Si dans la dernière relation, est remplacé par son expression en termes de série nous
avons:

dès lors :

consécutivement si nous posons :

où est une fonction de Bessel particulière du second type appelée "fonction de Bessel-
Neumann du second type d'ordre nul".

Identiquement au fait que quand , l'équation à cause du terme


quand est petit tend vers quand .

Finalement, il vient de ce que nous avons vu précédemment que et sont des


solutions indépendantes de l'équation différentielle :

La solution générale étant donc :

où , sont des constantes arbitraires et afin que soit réel.

Si nous remplacons par , où est une constante, l'équation différentielle devient :

369/2001
Sciences.ch 14/03/2005

en multipliant le tout par , nous trouvons la forme générale de l'équation différentielle:

dont la solution générale est:

où afin que soit réel quand .

Au fait, les fonctions de Bessel viennent des solutions de l'équation différentielle étudiée
précédemment solutionnées par la méthode de Frobenius. Posons:

et faisons la substitution :

en substituant dans , nous obtenons

Choisissons maintenant les afin de satisfaire l'équation différentielle tel que:

Dès lors, à moins que soit un entier négatif, nous avons:

En substituant ces valeurs dans la relation , nous


obtenons :

370/2001
Sciences.ch 14/03/2005

dès lors:

si nous posons dans l'avant-dernière relation, nous obtenons :

ÉQUATION DIFFÉRENTIELLE DE BESSEL D'ORDRE N

Nous avons défini les séries de Bessel comme étant :

Posons :

et différentions ainsi :

Mais nous avons aussi :

Par soustraction :

Ce qui donne finalement :

371/2001
Sciences.ch 14/03/2005

Ce qui s'écrit également :

Qui est appelé "l'équation différentielle de Bessel d'ordre " ou plus simplement "équation de
Bessel". Au fait, la plupart des écoles ou sites Internet donnent cette équation différentielle
comme une définition et pourtant il est clair qu'il y a raisonnement rigoureux derrière cette
équation.

La solution est donc du type :

ce qui s'écrit encore parfois en utilisant la fonction gamma d'Euler :

Il s'ensuite que :

et donc que est solution de cette équation différentielle.

CRITERES DE CONVERGENCE

Lorsque nous étudions une série, l'une des questions fondamentales est celle de la
convergence ou de la divergence de cette série.

Si une série converge, son terme général tend vers zéro lorsque tend vers l'infini :

Ce critère est nécessaire mais non suffisant pour établir la convergence d'une série. Par contre,
si ce critère n'est pas rempli, on est absolument sûr que la série converge.

Trois méthodes sont proposées pour approfondir le critère de convergence :

1. Le test de l'intégrale

2. La règle d'Alembert

3. La règle de Cauchy

Dans les paragraphes suivants, nous admettrons des séries à terme positifs. Le cas de la série
alternée sera vu ultérieurement.

372/2001
Sciences.ch 14/03/2005

TEST DE L'INTEGRALE

Soit la série à termes positifs non croissants :

c'est-à-dire :

et soit une fonction continue non croissante telle que :

nous pouvons alors affirmer que :

1. Si l'intégrale :

converge, la série converge également.

2. Si l'intégrale :

diverge, la série diverge également.

Remarques : en aucun cas l'intégrale ne donne la valeur de la somme de la série ! Le test de


l'intégrale donne simplement une indication sur la convergence de la série. Avant de faire le
test de l'intégrale, il est important de vérifier que les termes de la série soient strictement
décroissants afin de remplir la condition .

REGLE D'ALEMBERT

Si dans une série à termes positifs :

le rapport (assimilable à une fonction prise en son entier) a une limite finie lorsque
:

373/2001
Sciences.ch 14/03/2005

1. Si , la série converge

2. Si , la série diverge

3. Si on ne peut rien dire

et nous définissons le rayon de convergence comme :

RÈGLE DE CAUCHY

Si dans une série à termes positifs :

la quantité a une limite finie lorsque telle que :

avec à nouveau les mêmes considération que pour la règle d'Alembert :

1. Si , la série converge

2. Si , la série diverge

3. Si on ne peut rien dire

THÉOREME DE LEIBNIZ

Nous avons considéré jusqu'à présent des séries à termes positifs. Nous allons considérer dans
cette partie des séries dont les termes sont alternés, c'est-à-dire des séries de la forme :

Si dans une série alternée les termes vont en décroissant :

et si :

alors la série converge, sa somme est positive et n'est pas supérieure au premier terme.

Si est la somme de la série et une somme partielle, alors :

374/2001
Sciences.ch 14/03/2005

Remarque : il est important de vérifier que les valeurs absolues des termes de la série soient
strictement décroissants afin de remplir la condition précédente.

CONVERGENCE ABSOLUE

Définition : une série à termes variables est dite absolument convergent si la série formée avec
la valeur absolue de ses termes converge :

Si une série alternée de termes est absolument convergente, la série absolue qui en découle
converge aussi.

Nous pouvons généraliser la règle d'Alembert au cas des séries à termes quelconques :

Ainsi, le rapport a une limite finie lorsque pour nous avons :

toujours avec les mêmes conclusions que pour la règle d'Alembert normale.

THÉOREME DU POINT FIXE

Le théorème du point fixe n'est pas vraiment utile en physique (imlicitement il est
indispensable mais les phyisiciens utilisent souvent des outils mathématiques dont les
propriétés ont déjà été validées au préalable par des mathématiciens), cependant nous le
retrouvons en théorie du chaos (les vortex, tourbillons, etc...) ainsi qu'en informatique
théorique (voir le chapitre traitant des fractales en particulier le triangle de Sierpinski). Nous
ne saurions donc que recommander au lecteur de prendre le temps de lire et de comprendre les
explications qui vont suivre.

Soit , un espace métrique complet (voir chapitre de topologie ou des fractales) et soit
une application strictement contractante de constante (voir les fonctions
lipschitziennes chapitre de topologie), alors il existe un unique point tel que
. est alors dit le "point fixe" de . De plus si nous notons par :

l'image de par le n-ième itéré de , nous avons alors :

375/2001
Sciences.ch 14/03/2005

et la vitesse de convergence peut d'ailleur être estimée par :

Démonstration : soit nous considérons la suite définie comme ci-dessus.


Nous allons d'abord montrer que cette suite est une suite de Cauchy (voir plus haut sur la
présente page ce qu'est une suite de Cauchy).

En appliquant l'inégalité triangulaire (voir le chapitre d'analyse vectorielle) plusieurs fois nous
avons :

Or :

donc :

pour finir :

c'est-à-dire que dans un premier temps est bien une suite de Cauchy.

étant un espace complet nous avons que converge, et nous posons

A présent, nous vérifions que est bien un point fixe de . En effet est uniformément
continue (car lipschitzienne - voir le chapitre de topologie) donc à fortiori continue ainsi:

Il reste à vérifier que est l'unique point fixe (du coup nous aurons démontré que ne
dépend pas du choix de ). Supposons que nous ayons aussi alors :

376/2001
Sciences.ch 14/03/2005

Une estimation de la vitesse de convergence est donnée par:

est continue par rapport à chacune des variables donc:

et les limites préservent les inégalités (non strictes) donc:

377/2001
Sciences.ch 14/03/2005

CALCUL VECTORIEL

Des notions physiques telles que la force ou la vitesse sont caractérisées par une direction, un
sens et une intensité. Ce triple caractère est mis en évidence par les flèches. Celles-ci sont à
l'origine de la notion de vecteur et en constituent l'exemple le plus suggestif. Bien que leur
nature soit essentiellement géométrique, c'est leur aptitude à se lier les unes aux autres, donc
leur comportement algébrique, qui retiendra principalement notre attention. Partagé en classes
d'équivalence et muni de deux opérations appelées addition et multiplication par un scalaire,
l'ensemble qu'elles forment représente le modèle classique d'un espace vectoriel. Un de nos
premiers objectifs est la description détaillée de ce modèle.

Remarques :

R1. Avant de lire ce qui va suivre, nous conseillons au lecteur d'avoir au moins parcouru en
diagonale le chapitre traitant de la théorie des ensembles dans la section d'arithmétique. Nous
y définissons ce qu'est un "espace vectoriel" en utilisant les outils de la théorie des ensembles.
Ce concept bien que non indispensable vaut la peine quand même de s'y attarder pour voir
comment deux domaines des mathématiques s'intriquent.

R2. L'analyse vectorielle contient beaucoup de termes techniques et de définitions qu'il faut
apprendre par coeur (nous comprenons les raisonnements mais devons apprendre par coeur la
terminologie). Ce travail est pénible mais malheureusement nécessaire (l'auteur de ces pages
connaîte le problème...)

NOTION DE FLÈCHE

Nous désignerons par l'espace ordinaire de la géométrie élémentaire et par ses


points. Nous appellerons "flèche" tout segment de droite orienté (dans l'espace).

La flèche d'origine et d'extrémité sera notée ou abrégé par une lettre unique (latine
ou grecque) choisie arbitrairement tel que par exemple : .

Nous considérerons comme évident que toute flèche est caractérisée par sa direction, son sens,
son intensité ou grandeur et ainsi que son origine.

ENSEMBLE DES VECTEURS

Définitions :

D1. Nous disons que deux flèches sont "équivalentes" si elles ont la même direction, le même
sens et la même intensité.

D2. Nous disons que deux flèches sont "colinéaires" si elles ont seulement la même direction

Partageons l'ensemble des flèches en classes d'équivalence : deux flèches appartiennent à une
même classe si et seulement si elles sont équivalentes.

Définition : nous dirons que chacune de ces classes est un "vecteur".

Rangeons, en outre , les flèches dégénérées (c'est-à-dire de la forme ) en une classe

378/2001
Sciences.ch 14/03/2005

distinguée que nous appellerons "vecteur nul" et noterons .

L'ensemble des vecteurs sera lui désigné par . Il faut souligner que les éléments de sont
des classes de flèches et non pas des flèches individuelles. Il est cependant clair qu'une flèche
quelconque suffit cependant à déterminer la classe à laquelle elle appartient et il est donc
naturel de l'appeler "représentant de la classe" ou du vecteur.

Traçons le représentant d'un vecteur à partir de l'extrémité d'un représentant d'un vecteur
. La flèche dont l'origine est celle du représentant de et l'extrémité celle du représentant
de détermine un vecteur que nous noterons . L'opération qui associe à tout couple de
vecteurs leur somme s'appelle "addition vectorielle".

A l'aide d'une figure, il est facile de montrer que l'opération d'addition vectorielle est
associative et commutative, autrement dit, que:

et

Il est en outre évident que le vecteur nul est l'élément neutre de l'addition vectorielle,
autrement dit, que:

et

où désigne le vecteur opposé de , c'est-à-dire le vecteur dont les représentants ont la


même direction et la même intensité que ceux de , mais le sens opposé.

L'opération inverse de l'addition vectorielle est la soustraction vectorielle. Soustraire un


vecteur revient à addition le vecteur opposé.

Remarques:

R1. l'addition s'étend, par récurrence, au cas d'une famille finie quelconque de vecteurs. En
vertu de l'associativité, ces additions successives peuvent être effectuées dans n'importe quel
ordre, ce qui justifie l'écriture sans parenthèses.

R2. la multiplication entre deux vecteurs est un concept qui n'existe pas. Par contre, comme
nous le verrons un peu plus loin, nous pouvons multiplier les vecteurs par certaines propriétés
d'autres vecteurs que nous appelons la "norme" et encore d'autres petites choses...

PSEUDO-VECTEURS

379/2001
Sciences.ch 14/03/2005

En physique, lors de l'énoncé de ce que nous appelons le "principe de Curie", les physicien
font mention de ce qu'ils appelent des pseudo-vecteurs. Il s'agit du vocabulaire simple pour
parler de quelque de tout aussi trivial mais fondamentalement peu de gens en font vraiment
usage. Mais il être quand même utile donc de présenter de quoi il s'agit.

Au fait, vecteurs et pseudo-vecteurs se transforment de la même manière dans une rotation ou


une translation (nous verrons plus tard dans ce chapitre comment effectuer mathéamtiquement
ces transformations). Il n’en est pas de même dans la symétrie par rapport à un plan ou à un
point. Dans ces transformations nous avons par définition les propriétés suivantes :

P1. Un vecteur est transformé en son symétrique,

P2. Un pseudo-vecteur est transformé en l’opposé du symétrique.

Voici une figure avec des exemples types (le choix des lettre représentant les vecteurs ne sont
pas du au hasard, elle sont un clin d'œil aux propriétés des champs électriques et magnétique
étudiés en physique) :

Ben voilà… c'est tout sur les pseudo-vecteurs…

MULTIPLICATION PAR UN SCALAIRE

Le vecteur appelé "produit du nombre par ", est défini de la manière suivante:

Prenons une flèche représentative de et construisons un flèche de même direction, de


même sens ou de sens opposé, suivant que est positif ou négatif, et d'intensité fois
l'intensité de la flèche initiale; la flèche ainsi obtenue est un représentant du vecteur ; si
ou , nous posons .

L'opération qui consiste à effectuer le produit d'un nombre par un vecteur est appelé
"multiplication par un scalaire".

Nous vérifions aisément que la multiplication par un scalaire est associative et distributive par
rapport à l'addition numérique vectorielle, autrement dit que:

380/2001
Sciences.ch 14/03/2005

Voyons de suite un exemple concret mondialement connu des vecteurs :

RÈGLE DE TROIS

Revenons un peu sur la"règle de trois" (appelée parfois "règles des rapports et proportions" ou
encore "méthode de réduction à l'unité") souvent définie dans les petites classes de manière
intutive mais sans démonstration digne de ce nom. Cette règle est certainement l'algorithme le
plus usité de par le monde qui sert à identifier un quatrième nombre quand trois sont donnés et
que les quatre nombres sont linéairement dépendants.

La règle de trois est est dérivée sous deux versions:

1. Simple et directe si les grandeurs sont directement proportionnelles

2. Simple et inverse si les grandeurs sont inversement proportionnelles

etlorsque deux variables et sont proportionnelles nous le notons :

Supposons maintenant que puisse prendre les valeurs et prendra les valeurs
linéairement dépendantes alors:

- le rapport proportionnel suivant :

est dit "simple et directe".

Démonstration : soient deux vecteurs colinéaires et donc


proportionnels à un facteur près tel que :

Remarque : si ce rapport n'est pas égal, alors il faut passer à l'utilisation d'autres outils tel que
la régression et in extenso l'extrapolation.

- le rapport proportionnel suivant :

381/2001
Sciences.ch 14/03/2005

est dit "simple et inverse".

Démonstration : soient deux vecteurs colinéaires et donc


proportionnels à un facteur près tel que :

Remarque : si ce rapport n'est pas égal, alors il faut passer à la régression linéaire.

En gros, il suffit que nous connaissions trois variables sur les quatre pour résoudre cette
simple équation du premier degré.

Les conversions de monnaies ou d'unités de mesure se font à l'aide de la règle de trois simple
directe ou indirecte. Les calculs de parités (calcul prévisionnel fait par un importateur d'un
certain pays ayant ses propres unités de mesures et de monnaie, qui recherche parmi plusieurs
offres étrangères (dans des systèmes d'unités de mesures et de monnaies qui diffèrent de
l'importateur), laquelle est la plus avantageuse ou inversement) se font également avec la
règle de trois.

Nous appelle également "règle conjointe simple ou inverse", une série de règle de trois
directes ou indirectes.

Dans de tels calculs, les agents du marché d'échange ont remarqué que la plupart du temps, les
rapports étaient des valeurs proche de l'unité. Ils ont été ainsi naturellement amené à définir
"le pourcentage" comme étant la proportion d'une quantité ou d'une grandeur par rapport à
une autre, évaluée à la centaine (en général du moins ... ) :

Soit un nombre alors sa notation en pourcentage sera:

Soit un nombre alors sa notation en pour-mille sera

ESPACE VECTORIEL

Nous appelons "espace vectoriel" un ensemble d'éléments désignés par et appelés


"vecteurs", muni d'une "structure algébrique vectorielle" définie par la donnée de l'addition
(soustraction) vectorielle et la multiplication par un scalaire. Ces deux opérations satisfaisant
les lois associativité, de commutativité, de distributivité, d'élément neutre et d'opposé comme
nous l'avons déjà vu en théorie des ensembles.

Pour plus d'informations sur ce qu'est un espace vectoriel dans le sens "ensembliste" le lecteur

382/2001
Sciences.ch 14/03/2005

devra se reporter au chapitre de théorie des ensembles où ce concept est défini avec plus de
rigueur.

Remarque : muni de ces deux opérations, un espace vectoriel est dit "vectorialisé".

Pour tout entier positif , désignera l'ensemble des n-uplets de nombres disposés en
colonne :

et est à l'évidence muni d'une structure d'espace vectoriel. Les vecteurs de cet espace
seront appelés "vecteur-colonnes". Il seront souvent désignés plus brièvement par :

ou encore plus simplement par :

Le nombre est parfois appelé "terme" ou "composante d'indice de ".

COMBINAISONS LINÉAIRES

Dorénavant, sauf mention explicite du contraire, les vecteurs seront les éléments d'un espace
vectoriel .

Nous appelons "combinaison linéaire" des vecteurs tout vecteur de la forme :

ou sont des nombres appelés "coefficients de la combinaison linéaire".

Le vecteur nul est combinaison linéaire de avec tous les coefficients


égaux à zéro. Nous parlons dès lors de "combinaison linéaire triviale".

Nous appelons "combinaison convexe", toute combinaison linéaire dont les coefficients sont
non négatifs et de somme égale à 1. L'ensemble des combinaisons convexes de deux points
et d'un espace ponctuel (ayant un origine) est le segment de droite et . Pour s'en
rendre compte, il suffit d'écrire:

383/2001
Sciences.ch 14/03/2005

de faire varier de 0 à 1 et de constater que tous les points du segment sont ainsi obtenu.

Si le vecteur est combinaison linéaire des vecteurs et chacun de ces vecteurs est
combinaison linéaire des vecteurs , alors est combinaison linéaire de
.

SOUS-ESPACES VECTORIELS

Nous appelons "sous-espace vectoriel de " tout sous-ensemble de qui est lui-même un
espace vectoriel pour les opérations d'addition et de multiplication par un scalaire définies
dans .

Un sous-espace vectoriel, en tant qu'espace vectoriel, ne peut être vide puisqu'il comprend au
moins un vecteur, à savoir son vecteur nul, celui-ci étant d'ailleurs forcément le vecteur nul de
. En outre, en même temps que les vecteurs et (s'il en contient d'autres que le vecteur
nul), il comprend également toutes leurs combinaisons linéaires .

Inversement, nous voyons aussitôt que tout sous-ensemble jouissant de ces propriétés est un
sous-espace vectoriel. Nous avons ainsi établi la proposition suivante :

Un sous ensemble de est un sous-espace vectoriel de si et seulement si est non


vide et appartient à pour tout couple de vecteurs de et tout couple
.

FAMILLES GÉNÉRATRICES

Il en découle que si nous avons une famille de vecteurs l'ensemble des


combinaisons linéaires de peut être un sous-espace vectoriel de , plus
précisément le plus petit sous-espace vectoriel de comprenant .

Les vecteurs qui satisfont à la condition ci-dessus sont appelés "générateurs" de


et la famille , famille génératrice de . Nous disons aussi que ces vecteurs
ou cette famille engendrent .

Remarque : le sous-espace vectoriel engendré par un vecteur non nul est formé de tous les
multiples de ce vecteur. Nous appelons un tel sous-espace "droite vectorielle". Un sous-
espace vectoriel engendré par deux vecteurs non multiples l'un de l'autre est appelé "plan
vectoriel".

DÉPENDANCES ET INDÉPENDANCES LINÉAIRES

Ce qui va suivre est très important en physique nous conseillons donc au futur physicien de
prendre vraiment le temps de bien lire les développements qui vont suivre.

Si sont trois vecteurs de dont les représentants ne sont pas parallèles à un même
plan (par convention une flèche d'intensité nulle est parallèle à tout plan), alors tout vecteur
de peut s'écrire de manière unique sous la forme :

384/2001
Sciences.ch 14/03/2005

où sont des nombres.

En particulier, la seule possibilité d'obtenir le vecteur nul comme combinaison linéaire de


est d'attribuer la valeur triviale 0 à .

Réciproquement, si pour trois vecteurs de la relation :

implique , aucun des vecteurs ne peut être combinaison linéaire des deux
autres, autrement dit, leurs représentants ne sont pas parallèles à un même plan.

Sur la base de ces observations, nous allons étendre la notion d'absence de parallélisme à un
même plan au cas d'un nombre quelconque de vecteurs d'un espace vectoriel .

Nous disons que les vecteurs sont "linéairement indépendants" si la relation :

implique nécessairement , autrement dit, si la combinaison linéaire


triviale est la seule combinaison linéaire de qui soit nulle. Dans le cas contraire,
nous disons que les vecteurs sont "linéairement dépendants".

Si l'attention est fixée sur la famille plutôt que sur les termes dont elle est
constituée, nous disons que celle-ci est "libre" ou "liée" suivant que les vecteurs
sont linéairement indépendants ou dépendants.

BASES D'UN ESPACE VECTORIEL

Définition : nous disons qu'une famille finie de vecteurs est une base de si et seulement si :

385/2001
Sciences.ch 14/03/2005

1. elle est libre

2. elle engendre .

D'après cette définition, toute famille libre est une base du sous-espace vectoriel
qu'elle engendre.

Pour qu'une famille de vecteurs soit une base de , il faut et il suffit que tout
vecteur de s'exprime de manière unique sous la forme d'une combinaison linéaire des
vecteurs :

La relation ci-dessus est appelée "décomposition de suivant la base " où les


coefficients sont appelés "composantes de dans cette base". En présence d'une
base, tout vecteur est donc entièrement déterminé par ses composantes.

Proposition:

Si sont les composantes de et celles de , alors:

sont les composantes de .

En d'autres termes, additionner deux vecteurs revient à additionner leurs composantes et


multiplier un vecteur par un scalaire revient évidemment à multiplier ses composantes par ce
même scalaire. La base est donc un outil important car elle permet d'effectuer les opérations
sur les vecteur au moyen d'opération sur les nombres.

Exemple crucial : les vecteur colonnes de :

forment un base que nous appelons "base canonique" de (nous travaillerons dans les
espaces complexes dans un autre chapitre).

Remarque : dans le cadre de l'espace à trois dimensions, les bases sont très souvent assimilées
à un trièdre (effectivement si vous reliez les extrémités des trois vecteurs par des traits vous
obtiendrez une trièdre imaginaire)

386/2001
Sciences.ch 14/03/2005

ANGLES DIRECTEURS

Il est clair, qu'un seul angle ne peut décrire la direction d'un vecteur dans l'espace. Nous
utilisons alors la notion "d'angles directeurs". Il s'agit de mesurer l'angle du vecteur par
rapport à chacun des axes positifs de la base :

Si :

alors:

Les valeurs :

sont appelées les "cosinus directeurs" de .

Les 3 angles mentionnées ne sont pas complètements indépendants. En effet, 2 suffisent pour
déterminer complètement la direction d'un vecteur dans l'espace, le troisième pouvant se
déduire la relation suivante (obtenue à partir du calcul de la norme du vecteur, concept que
nous verrons un peu plus loin):

De plus, les cosinus directeurs sont les composantes scalaires d'un vecteur de norme unitaire
ayant la même direction que :

387/2001
Sciences.ch 14/03/2005

DIMENSIONS D'UN ESPACE VECTORIEL

Nous disons que est de "dimension finie" s'il est engendré par une famille finie de vecteurs.
Dans le cas contraire, nous disons que est de "dimension "infinie" (nous aborderons ce
type d'espaces dans un autre chapitre). Tout espace vectoriel de dimension finie et non réduit
au vecteur nul admet une base. En fait, de tout famille génératrice d'un tel espace nous
pouvons extraire une base.

La dimension d'un espace vectoriel est notée:

Tout espace vectoriel de dimension finie non nulle peut être mis en correspondance
biunivoque (c'est-à-dire en bijection) avec . Il suffit de choisir une base de et de faire
correspondre à tout vecteur de le vecteur-colonne dont les termes sont les composantes
de dans la base choisie (c'est du bla bla de mathématicien mais ce sera utile quand nous
aborderons des espaces plus complexes) :

Cette correspondance conserve les opération d'addition et de multiplication par un scalaire


que nous avons déjà vues; en d'autres termes, elle permet d'effectuer les opérations sur les
vecteurs par des opérations sur les nombres.

Remarque : nous disons alors que et sont "isomorphes" ou que la correspondance est
un isomorphisme (voir théorie des ensembles).

PROLONGEMENT D'UNE FAMILLE LIBRE

Soit une famille libre et une famille génératrice de . Si


n'est pas une base de , nous peuvons extraire une sous-famille
de de telle manière que la famille soit
une base de .

Remarque : une telle étude à son utilité lors de passage d'espace mathématique ayant des
propriétés données à un autre espace ayant des propriétés mathématiques différentes.

Démonstration:

388/2001
Sciences.ch 14/03/2005

H1. Nous supposons qu'au moins un des vecteurs n'est pas combinaison linéaire des
vecteurs , sinon engendrerait et serait donc une base possible de
. Notons ce vecteur . La famille est alors une famille libre. En effet, la
relation :

implique alors tout d'abord que , autrement serait combinaison linéaire des vecteurs
, et ensuite , puisque les vecteurs sont linéairement
indépendants.

Si la famille engendre , elle est une base possible de et le théroème est


démontré. Dans le cas contraire, le même raisonnement nous assure l'existence d'un autre
vecteur …. Si la nouvelle famille en découlant n'est pas un base de , alors le procédé
d'extraction de vecteurs de se poursuit. Lorsqu'il s'arrête, nous aurons obtenu
un "prolongement" de en une famille libre engendrant , c'est-à-dire une base
de .

Il en retourne un corollaire:

Tout espace vectoriel de dimension finie et non réduit au vecteur nul admet une base. En fait,
de toute famille génératrice d'un tel espace, nous pouvons donc extraire une base.

RANG D'UNE FAMILLE FINIE

Définitions : nous appelons "rang" d'une famille de vecteurs la dimension du sous-espace


vectoriel de qu'elle engendre.

Proposition: le rang d'une famille de vecteurs est inférieur ou égal à . Il est


égal à si et seulement si cette famille est libre.

Démonstration: écartons le cas trivial où le rang de la famille est nul. D'après le


corollaire vu précédemment, nous pouvons alors extraire de cette famille une base du sous-
espace vectoriel qu'elle engendre. Le rang est donc inférieur ou égal à suivant que
est une famille liée ou non.

SOMMES DIRECTES

Définition : nous disons que la somme de deux sous-espaces vectoriel et de


est "directe" si . Dans ce cas, nous la notons :

De la somme directe nous pouvons introduire la notion de "sous-espace complémentaire":

Supposons que soit de dimension finie. Pour tout sous-espace vectoriel de , il existe

389/2001
Sciences.ch 14/03/2005

un sous-espace vectoriel (non unique) de tel que soit somme directe de et .


Nous disons alors que est un "sous-espace complémentaire" de dans .

Démonstration:

Ecartons d'abord les cas triviaux où et . Le sous-espace vectoriel admet une


base , où est inférieur à la dimension de . Par le théorème du
prolongement d'une famille libre, cette base peut se prolonger en une base
de . Soit le sous-espace vectoriel engendré par la famille
. Si est un vecteur quelconque de , alors , où est un vecteur de
et un vecteur de . En outre, car aucun vecteur, excepté le vecteur nul, ne peut
être combinaison linéaire des vecteurs et des vecteurs . Nous en concluons
donc que : .

ESPACE AFFINE

L'espace de la géométrie élémentaire est à la fois usuel et la source de la notion "d'espace


affine" que nous allons introduire.

Cet espace est associé à "l'espace vectoriel" géométrique par la correspondance entre
flèches et vecteurs étudiés jusqu'ici ! La définition suivante ne fait que mettre en évidence les
traits dominants de cette correspondance :

Soit un ensemble non vide d'éléments que nous appellerons "points" et désignerons par les
lettres ; soit en outre un espace vectoriel. Supposons qu'à tout couple de points
corresponde un vecteur noté . Nous disons alors que que est un "espace affine"
d'espace directeur (ou dit simplement abusivement de "direction") si les conditions
suivantes sont satisfaites :

C1. Pour tout point fixé, la correspondance entre couples et vecteurs est
biunivoque, autrement dit, pour tout vecteur il existe un point et un seul tel que .

C2. Pour tout triplet de points , (relation de Chasles)

C3. Si est un point et un vecteur, pour exprimer que est l'unique point tel que
, nous écrivons:

Bien qu'un peu abusive, cette écriture est comme à l'usage et suggère bien le sens de
l'opération qu'elle désigne.

Les propriétés suivantes découlent directement des la définition d'espace affine :

P1.

390/2001
Sciences.ch 14/03/2005

P2. Pour tout point ,, . Cela résulte de la condition dans le cas où


nous avon .

P3. . Il suffit de poser dans la condition .

P4. Règle du parallélogramme :

Soit un parallélogramme de sommets (dans le sens des aiguilles d'un montre) et


arrêtes . Nous avons :

si et seulement si :

En effet, d'après la condition :

nous avons :

Précédemment, nous avons vu ce qui faisait qu'un espace pouvait être muni d'une structure
d'espace vectoriel (nous avons vu que nous disons que ce dernier était dès lors "vectorialisé").
Dans le cas général d'un espace affine , le procédé est le même :

Nous choisissons un point quelconque de . La correspondance entre couples et


vecteurs de l'espace directeur étant alors biunivoque nous définissons l'addition de points et la
multiplication d'un point par un scalaire par les opérations correspondantes sur les vecteurs de
. Muni de ces deux opérations, devient un espace vectoriel, appelé "vectorialisé de
relativement à ". Nous désignerons cet espace par et appellerons "l'origine".

Vu la manière dont les opérations ont été définies, il résulte que est isomorphe à l'espace
directeur :

Toutefois, cet isomorphisme dépend du choix de l'origine et en pratique cette origine est
choisie sur la base de données inhérentes aux problèmes posés. Par exemple, si une
transformation affine admet un point invariant (qui ne bouge pas), il y a avantage a choisir ce
point comme origine.

Remarques:

391/2001
Sciences.ch 14/03/2005

R1. Lorsque nous parlons de dimension d'un espace affine, nous parlons de la dimension de
son espace directeur.

R2. L'espace de la géométrie élémentaire est un espace affine. En effet, sa direction est
l'espace géométrique et les conditions de définition d'un espace affine sont satisfaites. Il
faut bien noter qu'au couple de points est associé le vecteur et non pas la flèche
. En fait, la flèche pouvant être identifiée au couple de points, nous voyons que ce que
postule la définition d'un espace affine n'est rien d'autre qu'une forme abstraite de
correspondance entre flèches et vecteurs.

R3. Tout espace vectoriel peut être considéré comme un espace affine de direction lui-
même si au couple de vecteurs est associé le vecteur . En effet, les conditions de
définition d'un espace affine sont dès lors satisfaites.

ESPACE VECTORIEL EUCLIDIEN

Avant de définir ce qu'est un espace vectoriel, nous allons au préalable définir quelques outils
mathématiques et quelques concepts.

Nous pouvons, en choisissant une unité de longueur, mesurer l'intensité de chaque flèche,
autrement dit, déterminer sa longueur. Nous pouvons aussi mesurer l'écart angulaire de deux
flèches (ou vecteurs) quelconques d'origine commune (non nécessairement distinctes) en
prenant comme unité de mesure d'angle par exemple le radian. La mesure de cet écart est alors
un nombre compris entre 0 et , appelé "angle" des deux flèches. Si les deux flèches ont
même direction et même sens, leur angle est nul et si elles ont même direction et sens opposé,
ce même angle est .

Les flèches représentatives d'un même vecteur ont toutes la même longueur. Nous
désignerons cette longeur par la notation:

et l'appellerons "norme" de . Il est clair que la longeur d'un vecteur est nulle si et seulement
si sa norme est nulle. Nous dirons qu'un vecteur est unitaire si sa norme est 1.

Si est un vecteur non nul :

est un vecteur unitaire colinéaire (nécessairement) à dont la norme est égale à l'unité et que
nous notons .

Nous appelerons "angle des vecteurs non nuls et " l'angle de deux flèches d'origine
commune représentant l'une et l'autre .

PRODUIT SCALAIRE

Définition : l'espace vectoriel euclidien, est un espace vectoriel (réel et de dimension finie

392/2001
Sciences.ch 14/03/2005

pour les puristes) possédant une opération particulière, "le produit scalaire" que nous noterons
(notation spécifique à ce site Internet) en ce qui concerne les vecteurs :

Remarques :

R1. Nous trouvons dans certains ouvrages (pour information) la notation ou encore
que nous ne souhaitons pas utiliser dans le cadre du calcul vectoriel car trop proche du
formalisme de Dirac utilisé en physique quantique et du produit scalaire fonctionnel (voir
chapitre d'analyse fonctionnelle).

R2. Le produit scalaire à une importance énorme dans l'ensemble du domaine des
mathématiques et de la physique, ainsi nous le retrouvons dans le calcul différentiel et intégral
(de par le produit scalaire fonctionnel), en topologie, en physique quantique en analyse du
signale etc... il convient donc de bien comprendre ce qui va suivre.

R3. Le produit scalaire peut être vu comme une projection de la longueur d'un vecteur sur la
longueur d'un autre

Ce produit scalaire possède les propriétés suivantes (dont la plupart découlent de la définition
même du produit scalaire):

P1. Commutativité :

P2. Associativité :

P3. Distributivité :

P4. Si

P5. et si

P6.

Seule cette dernière propriété nécessite une démonstration (de plus un des résultats de la
démonstration nous servira à démontrer une autre propriété très important du produit
scalaire):

Soit :

qui constitue la "projection orthogonale" du vecteur sur le normalisaiton à l'unité du vecteur


.

393/2001
Sciences.ch 14/03/2005

A l'aide du produit scalaire, le vecteur peut être exprimé autrement il suffit de de


prendre :

et de l'introduire dans avec les vecteur adéquats pour obtenir :

Cette expressions vaut également dans le cas où est nul, à condition d'admettre que la
projection orthogonale de vecteur nul est nul. La norme de s'écrit :

Si est unitaire, les relations de projections précédentes se simplifient et deviennet :

et

Par des considérations géométriques élémentaires, il est facile de se rendre compte que :

et

Si nous revenons maintenant à la démonstration de :

Nous avons si :

d'après la définition la propriété de la projection orthogonale :

d'où la propriété P6 qui s'ensuit par multiplication des deux membres de l'égalité par .

Définitions :

D1. L'espace vectoriel est dit "proprement euclidien" si

394/2001
Sciences.ch 14/03/2005

D2. Nous dissons que les vecteurs et sont "orthogonaux" s'ils sont non nuls et que leur
produit scalaire est nul (leur angle est égal à ).

Une base de est dite "orthonomormale" si les vecteurs sont


orthogonaux deux à deux et unitaires (donc constituant une famille libre).

Par le raisonnement géométrique, nous voyons que tout vecteur est la somme de ses
projections orthogonales sur les vecteurs d'une base orthonormale, autrement dit, si
est une base orthonormale:

Cette décomposition s'obtient également par la propriété de P6 du produit scalaire. En effet,


étant les composantes de :

puisque et de même :

et

d'où la décomposition.

Soit et les composantes respectives des vecteurs et dans un base


orthonormale canonique nous pouvons écrire le produit scalaire sous la forme :

de la propriété P6 du produit scalaire :

en utilisant la propriété P1 et à nouveau P6 :

Ce qui nous donne finalement la décomposition :

395/2001
Sciences.ch 14/03/2005

qui constitue l'une des relations les plus importante dans le domaine du calcul vectoriel et que
nous appelons "produit scalaire canonique".

INÉGALITÉ DE CAUCHY-SCHWARZ

La relation:

s'écrit également trivialement sous la forme suivante si nous utilisons la notion de norme et la
définition du produit scalaire :

Si les deux vecteurs et sont orthogonaux, nous retrouvons le résultat d'un théorème
fameux: le théorème de Phytagore.

Effectivement, dès lors nous avons . Ce qui nous donne:

Cette relation est très importante en physique-mathématique. Il faut s'en souvenir !

Nous appelons également "inégalité de Cauchy-Schwarz" l'inégalité, valable pour tout choix
des vecteurs et la relation :

Démonstration : dans le cas particulier où et sont des vecteurs de et le produit


scalaire est défini, cette inégalité est évidente, puisque . Dans le cas général, elle
nécessite une preuve. Si est nul, les deux membres de l'inégalité sont nuls et l'inégalité
devient au fait une égalité. Si n'est pas nul, posons:

et écrivons (le premier et troisième terme du membre gauche de l'égalité s'annulent) :

Comme est la projection orthogonale de sur , est aussi orthogonal à


, donc à , ce qui nous permet d'appliquer le théorème de pythagore au second
membre de la relation précédente et d'obtenir :

396/2001
Sciences.ch 14/03/2005

Dès lors, l'inégalité suivante :

vérifie l'inégalité puisque le second terme est au carré donc nécessairement positif ou nul.

Lorsque est , l'inégalité de Cauchy-Schwarz s'écrit avec les composantes des vecteurs :

Dans le cas particulier où elle devient:

ou encore:

ce qui montre que le carré de la moyenne arithmétique est inférieur ou égal à la moyenne
arithmétique des carrés. Ce résultat est très important pour l'étude des statistiques.

INÉGALITÉ TRIANGULAIRE

En majorant par (à l'aide de l'inégalité de Cauchy-Schwartz) et en mettant


ceci dans la relation établie déjà précédement:

Nous obtenons

ce qui entraîne la fameuse "inégalité triangulaire" (très utile dans l'étude des suites et séries

397/2001
Sciences.ch 14/03/2005

pour l'étude des convergences ainsi qu'en topologie) :

Remarque : la généralisation de cette inégalité relativement aux propriétés des normes telles
que nous le verrons en topologie, donne ce que nous appelons "l'inégalité de Minkowski".

et en procédant de même (par les mêmes raisonnements) nous obtenons :

En vertu de la propriété du cosinus et de l'inégalité de Cauchy-Schwartz , nous


pouvons écrire:

relation que nous retrouvons également dans l'étude des statistiques.

PRODUIT VECTORIEL

Le produit vectoriel de deux vecteurs est une opération propre à la dimension 3. Pour
l'introduire, il faut préalablement orienter l'espace destiné à le recevoir. L'orientation étant
définie au moyen de la notion de "déterminant", nous commencerons par une brève
introduction à l'étude de cette notion. Cette étude sera reprise plus tard dans le détail lors de
l'analyse des systèmes linéaires dans le chapitre d'algèbre matricielle.

Nous appelons "déterminant" des vecteurs-colonnes de :

et nous notons:

le nombre (produit soustrait en croix) :

Nous appelons déterminant des vecteurs-colonnes de :

398/2001
Sciences.ch 14/03/2005

et nous notons :

le nombre :

La fonction qui associe à tout couple de vecteurs-colonnes de (à tout triplet de vecteurs-


colonnes de ) son déterminant est appelé "déterminant d'ordre 2" (respectivement d'ordre
3).

Le déterminant a comme propriété d'être multiplié par –1 si l'un de ses vecteurs colonnes est
remplacé par son opposé ou si deux de ses vecteurs-colonnes sont échangés (la vérification
étant simple nous nous abstiendrons de la démonstration, sauf sur demande). En plus, le
déterminant est non nul si et seulement si ses vecteurs-colonnes sont linéairement
indépendants (la démonstration se trouve quelques lignes plus bas et est d'une très grande
importance en mathématiques).

Définition : soit et les composantes respectives des vecteurs et dans


la base orthonormale . Nous appelons "produite vectoriel" de et , et nous
notons:

le vecteur :

Ou sous formes de composantes :

Remarques :

399/2001
Sciences.ch 14/03/2005

R1. La première notation est la notation internationale due à Gibbs (que nous utiliserons tout
au long de ce site), la deuxième est la notation français due à Burali-Forti (assez embêtant car
ce confond avec l'opérateur ET en logique)

R2. il est assez embêtant de retenir par coeur les relations qui forment le produit vectoriel
habituellement. Mais heureusement il existe au moins trois bons moyens mnémotechniques :

RM1. Le plus rapide consiste à retrouver l'une des expressions des comosantes du produit
vectoriel et ensuite par décrémentation des indices (en recommencent à 3 lorsque qu'on arrive
à 0) de connaître toutes les autres composantes. Encore faut-il trouver un moyen simple de se
souvenir d'une des composantes. Un bon moyen est la propriété mathématique suivante de
deux vecteur colinéaires permettant facilement de retrouver la troisème composante (celle
selon l'axe ) :

Soit deux vecteurs colinéaires dans un même plan, alors :

Nous retrouvons donc bien l'expression de la troisième composante du produit vectoriel de


deux vecteurs (non nécessairement colinéaires... eux!).

RM2. La seconde mais que nous verrons lors de notre étude du calcul tensoriel consiste à
utiliser le symbole d'antisymétrie (également appelé "tenseur de Levi-Civita"). Cette méthode
est certainement la plus esthétique d'entre toutes mais pas nécessairement la plus rapide à
développer. Nous donnons ici juste l'expression sans plus d'explications pour l'instant (elle est
également utile pour l'expression du déterminant par extension) :

RM3. Cette dernière méthode est assez simple et triviale aussi mais elle utilise implicitement
la première : la i-ème composante est le déterminant des deux colonnes:

privées de leur i-ème terme, le deuxième déterminant étant cependant pris avec le signe "-" tel
que :

Propriétés du produit vectoriel pour les vecteurs d'une base orthogonale :

400/2001
Sciences.ch 14/03/2005

Le produit vectoriel jouit aussi propriétés suivantes:

P1. Antisymétrie :

P2. Linéarité :

P3. si et seulement si et sont linéairement dépendants (très important !).

P4. Non associativité :

Démonstrations :

Les deux premières propriétés découlent directement de la définition et la propirété P4 se


vérifié aisément en développant les composantes et en comparant les résultats obtenus.

Démontrons la troisième propriété qui est très importante en algèbre linéaire :

Soient deux vecteurs et . Si les deux vecteurs sont linéairement


dépendants alors il existe tel que nous puissions écrire:

Si nous développons le produit vectoriel des deux vecteurs dépendants à un facteur près,
nous obtenons:

Il va sans dire que le résultat ci-dessus est égal au vecteur nul si effectivement les deux
vecteurs sont linéairement dépendants.

Si nous supposons maintenant que les deux vecteurs et sont linéairement indépendants et
non nuls, nous devons démontrer que le produit vectoriel est:

P3.1. orthogonal (perpendiculaire) à et

P3.2. de norme , où est l'angle entre et

Démontrons maintenant la première propriété P1 (première importance en physique) :

401/2001
Sciences.ch 14/03/2005

ce qui montre bien que le vecteur est perpendiculaire au vecteur résultant du produit
vectoriel entre et !

Il nous faut encore démontrer la deuxième propriété (aussi de première importance en


physique) :

Soit le carré de la norme du produit vectoriel . D'après la définition du produit


vectoriel nous avons:

Donc finalement:

Nous remarquerons que dans le cas où est l'espace vectoriel géométrique, la norme du
produit vectoriel représente l'aire du parallélogramme construit sur des représentants et
d'origine commune.

Si et sont linéairement indépendants, le triplet et donc aussi le triplet


sont directs.

En effet, étant les composantes de (dans la base ), le déterminant


de passage de à (par exemple) s'écrit:

Ce déterminant est donc positif, puisqu'au moins un des n'est pas nul, d'après la troisième
propriété d'indépendance linéaire du produit vectoriel.

402/2001
Sciences.ch 14/03/2005

Voici encore quelques propriétés très importantes d'utilité pratique du produit vectoriel (en
physique particulièrement) :

P1.

P2.

P3.

PRODUIT MIXTE

Nous pouvons étendre la définition du produit vectoriel à une autre type d'outil mathématique
que nous appelons le "produit mixte" :

Définition : nous appelons "produit mixte" des vecteurs le double produit :

Abrégé :

D'après ce que nous avons vu lors de la définition du produit scalaire et vectoriel , le produit
mixte peut également s'écrire :

Nous remarquerons que dans le cas où est l'espace vectoriel géométrique , le produit
mixte symbole le volume (orienté) du parallélépipède, construit sur des représentants
d'origine commune.

Remarque : il est assez trivial que le produit mixte est un extension à 3 dimension du produit
vectoriel qui représente rappelons-le, la surface du parallélogramme.

De par les propriétés de commutativité du produit scalaire, nous avons :

et le lecteur vérifier sans aucune peine (nous le ferons s'il y a demande) en développant les
composantes que :

Le produit mixte jouit également des propriétés que le lecteur ne devrait avoir aucun mal à
vérifier en développant les composantes (mis à part P3 qui découle des propriétés du produit
scalaire et vectoriel) :

P1.

403/2001
Sciences.ch 14/03/2005

P2.

P3. si et seulement si sont linéairement indépendants

P4.

ESPACE VECTORIEL FONCTIONNEL

Soit l'ensemble des fonctions réelles -fois dérivables dans l'intervalle fermé .
Nous désignerons les éléments de cet ensemble par les lettres

La valeur de au point sera bien évidemment notée . Dire que équivaudra


donc à dire que : . De manière abrégée, nous écrirons , le
signe indiquant ainsi que les deux membres sont égaux pour tout de l'intervalle .

Considérons les deux opérations suivantes :

- définie par la formule

- définie par la formule

Ces deux opérations satisfont à toutes les conditions des vecteurs d'un espace vectoriel que
nous avons déjà définies au début de ce chapitre (associativité, commutativité, vecteur nul,
vecteur opposé, distributivité, élément neutre) et munissent donc d'une structure
d'espace vectoriel. Le vecteur nul de cet espace étant bien évidemment la fonction nulle et
l'opposé de étant la fonction .

Il est intéressant de constater que en tant qu'espace vectoriel est une généralisation de
au cas continu. Nous pouvons en effet concevoir tout vecteur de sous la forme
d'une fonction réelle définie dans l'ensemble : la valeur de cette fonction au point
est tout simplement .

Remarque : Les polynômes de degré et à une inconnue forment aussi un exemple d'espace
vectoriel fonctionnel de dimension (à chaque coefficient du polynôme correspond une
composante du vecteur).

Le champ d'application privilégié de la théorie abstraite du produit scalaire est constitué par
les espaces vectoriels fonctionnels. Nous appelons ainsi aussi produit scalaire canonique dans
l'opération définie par la relation :

Cette opération définit bien un produit scalaire, ces les propriétés de ce dernier sont vérifiées
et, en outre, l'intégrale :

404/2001
Sciences.ch 14/03/2005

est positive si la fonction continue n'est pas identiquement nulle.

SYSTÈMES DE COORDONNÉES

Nous allons aborder ici, l'aspect des changements de coordonnées des composantes de
vecteurs. Ce type de transformation à un fort potentiel en physique (ainsi qu'en mathématique)
lorsque nous souhaitons simplifier l'étude de systèmes physiques dont les équations
deviennent plus facilement manipulables dans d'autres système de coordonnées.

Bien que nous soyons dans un chapitre et une section de mathématiques du site, nous nous
permettrons dans ce qui va suivre de faire une liaison directe avec la physique pour ce qui
concerne les expressions de la vitesse et de l'accélération dans différentes systèmes de
coordonnées.

SYSTÈME DE COORDONNÉES CARTÉSIENNES

Nous ne souhaitons pas trop nous attarder sur ce système car il est bien connu de tout le
monde habituellement. Rappelons cependant que la plupart du temps, en physique, les
systèmes cartésiens dans lequels nous travaillons sont (deux dimensions spatiales),
(trois dimensions spatiales) voir ou (trois dimensions spatiales et une temporelle)
lorsque nous travaillons en relativité.

Les systèmes cartésiens sont représentés par des vecteurs de base orthonormés (dans le sens
qu'ils sont linéairement indépendant et de norme unité) qui forment une base pré-euclidienne
(base euclidienne dans laquelle nous avons défini le produit scalaire).

Dans (cas le plus fréquent), il y a trois vecteurs de base notés traditionnellement:

Dans ce système, la position d'un point (repérable par un vecteur ) est défini par le triplet
de nombre noté (en calcul tensoriel):

et en physique plus conventionellement:

où habituellement la coordonnée ( ) représente le haut (la verticale), la coordonnée ( ) la


profondeur et la coordonnée ( ) la longueur (évidemment ces choix sont complétement
arbitraires).

Ce point peut être repéré par un vecteur noté arbitrairement dans la base par la
relation (utilisant la notation tensorielle):

405/2001
Sciences.ch 14/03/2005

En physique, si nous travaillons avec des coordonnées, c'est toujours pour pouvoir déterminer
l'emplacement d'un élément. Or, comme nous le verrons plus rigoureusement en mécanique
analytique, le physicien travaille avec les notions suivantes (chaque élément dépendant
souvent du temps):

- Position:

- Vitesse:

- Accélération:

Maintenant voyons comment s'expriment ces différentes notions dans des systèmes telles que
les coordonnnées sphériques, cylindriques et polaires.

SYSTÈME DE COORDONNÉES SPHÉRIQUES

Le choix de commencer avec ce système de coordonnées n'est pas un hasard. Il a pour


avantage d'être une généralisation des systèmes cylindrique et polaire dont nous en
retrouverons par la suite plus facilement les expressions de la position, de la vitesse et de
l'accélération .

Nous représentons traditionnellement un système à coordonnées sphérique de la façon


suivante:

Nous voyons très bien si nous connaissons bien les relations trigonométriques élémentaires
(voir le chapitre du même nom dans la section de géométrie) que nous avons les
transformations:

406/2001
Sciences.ch 14/03/2005

et inversement:

Maintenant il nous faut trouver les expressions qui relient les vecteurs de la base sphérique
que nous choisissons de noter avec les vecteurs de la base cartésienne .
Nous avons, comme nous pouvons le voir sur le schéma ci-dessus:

Explications pour la seconde ligne : en divisant par , nous nous assurons de par les
propriétés de la norme du produit vectoriel que sera bien normalisé à
l'unité.

Pour des besoins ultérieurs, déterminons les différentielles partielles de chacune des ces
coordonnées:

407/2001
Sciences.ch 14/03/2005

Nous allons également utiliser plus tard (pour l'étude des opérateurs vectoriels) la variation
exprimée en coordonnées sphériques:

Pour exprimer la vitesse et l'accélération en coordonnées sphériques, nous aurons également


besoin des dérivées par rapport au temps:

Donc si nous faisons maintenant un peu de physique, nous avons:

ce qui nous amène à (nous aurons besoin de cette relation en astrophysique) :

Pour l'accélération nous obtenons (exactement dans la même démarche que pour déterminer
l'expression de la vitesse):

SYSTÈME DE COORDONNÉES CYLINDRIQUES

Le système de coordonnées cylindriques (très utile dans l'étude des système à mouvements
hélicoïdaux) est assez semblable à celui des coordonnées sphériques puisqu'il peut être vu
comme une tranche de la sphère. Soit le schéma:

408/2001
Sciences.ch 14/03/2005

il vient sans peine qu'en coordonnées polaires (à un changement de notation près par rapport
au schéma ci-dessus):

et inversement:

Maintenant il nous faut trouver les expressions qui relient les vecteurs de la base polaire que
nous choisisson de noter (au lieu de comme cela ce fait traditionnellement)
avec les vecteurs de la base cartésienne . Nous avons, identiquement à ce que nous
avons fait pour les coordonnées sphériques:

Explications pour la seconde ligne : en divisant par , nous nous assurons de par les
propriétés de la norme du produit vectoriel que sera bien normalisé à
l'unité. Dans le cas des coordonnées cylindriques l'angle étant de toute façon droit, nous ne
serions pas obligé d'indiquer cette division, mais nous avons fait ce choix par souci
d'homogénéité avec les développements précédents.

Pour des besoins ultérieurs, déterminons les différentielles partielles de chacune des ces
coordonnées:

409/2001
Sciences.ch 14/03/2005

Nous allons également utiliser plus tard (pour l'étude des opérateurs vectoriels) la variation
exprimée en coordonnées cylindriques:

Pour exprimer la vitesse et l'accélération en coordonnées sphériques, nous aurons également


besoin des dérivées par rapport au temps:

Donc si nous faisons maintenant un peu de physique, nous avons (rappellons que la
composante est indépendante des autres composantes cylindriques):

ce qui nous amène à:

Pour l'accélération nous obtenons (exactement dans la même démarche que pour déterminer
l'expression de la vitesse):

SYSTÈME DE COORDONNÉES POLAIRES

Le système de coordonnées polaires est très semblable à celui des coordonnées cylindriques
puisqu'il peut être vu comme un retranchement d'une dimension (la hauteur) du système
cylindrique.

410/2001
Sciences.ch 14/03/2005

Ainsi, il vient sans peine qu'en coordonnées polaires:

et inversement:

Maintenant il nous faut trouver les expressions qui relient les vecteurs de la base polaire que
je choisis de noter (au lieu de comme cela ce fait traditionnellement) avec les
vecteurs de la base cartésienne . Nous avons identiquement à ce que nous avions fait
pour les coordonnées sphériques:

Explications pour la seconde ligne : en divisant par , nous nous assurons de par les
propriétés de la norme du produit vectoriel que sera bien normalisé à
l'unité. Dans le cas des coordonnées polaires l'angle étant de toute façon droit, nous ne serions
pas obligé d'indiquer cette division, mais nous avons fait ce choix par souci d'homogénéité
avec les développements précédents.

Pour des besoins ultérieurs, déterminons les différentielles partielles de chacune des ces
coordonnées:

Nous allons également utiliser plus tard (pour l'étude des opérateurs vectoriels) la variation
exprimée en coordonnées cylindriques:

411/2001
Sciences.ch 14/03/2005

Pour exprimer la vitesse et l'accélération en coordonnées sphériques, nous aurons également


besoin des dérivées par rapport au temps:

Donc si nous faisons maintenant un peu de physique, nous avons:

ce qui nous amène à:

où le premier terme est la composante radiale de la vitesse et le second la composante


tangentielle de la vitesse (angulaire).

Pour l'accélération nous obtenons (exactement dans la même démarche que pour déterminer
l'expression de la vitesse):

où le premier terme est l'accélération radiale, le second l'accélération centripète, le troisième


l'accélération tangentielle et le quatrième l'accélération de Coriolis.

OPÉRATEURS DIFFÉRENTIELS SCALAIRES ET VECTORIELS

Un champ scalaire, vectoriel ou tensoriel, dans un volume , est une application qui, à tout
point de ce volume , associe une grandeur scalaire, vectorielle ou tensorielle. Ainsi,
l'application qui, à tout point de , de coordonnées spatiales associe la valeur
scalaire est un champs scalaire dans .

En chaque point d'un volume traversé par un fluide en mouvement, le vecteur qui coïncide à
chaque instant avec la vitesse de la particule changeante qui passe en ce point à ce même
instant définit un champ vectoriel 3D, éventuellement variable dans le temps. Les champs
ainsi définis constituent un outil mathématique de base dans l'ensemble de la physique.

Lorsque nous représentons graphiquement un champ scalaire, l'ensemble des points continus
de valeur égale constituent ce que l'on appelle des "isolignes" ou plus couramment "courbes
de niveau".

412/2001
Sciences.ch 14/03/2005

GRADIENT D'UN CHAMP SCALAIRE

Soit un champ scalaire tridimensionnel , où et et sont les coordonnées


cartésiennes d’un point M de l'espace. Lorsque se déplace dans l'espace selon le vecteur
de composantes , et , le champ scalaire varie de selon la différentielle
totale:

A partir de cette relation, nous pouvons définir l'opérateur "gradient" d'un champ scalaire tel
que:

où est un terme vectoriel appelé le "gradient du champ scalaire ". Pour condenser
l'écriture, nous utilisons parfois le symbole nommé le "nabla du champ scalaire ".

A partir de la définition et de la différentielle totale, nous obtenons

Ce qui nous amène à poser que:

et donc que finalement en coordonnées cartésiennes:

Finalement nous voyons que le gradient d'un champ scalaire est le champ vectoriel
dont les composantes en chaque point sont les trois dérivées du champ scalaire par rapport
aux trois coordonnées spatiales, notées ici .

La variation de pour un déplacement est donc le produit scalaire de par le gradient


du champ . Or, un déplacement infinitésimal effectué le long d'une isoligne, du champ
scalaire tridimensionnel n'engendre aucune variation de . Le produit scalaire
évoqué est donc nul dans ce cas, ce qui implique que et sont perpendiculaires.

En considérant cette fois un déplacement perpendiculaire aux isolignes, nous montrons


facilement que le vecteur gradient de est dirigé depuis les faibles valeurs de vers les
fortes valeurs de . Son module étant d'autant plus grand que varie rapidement au
voisinage du point considéré.

413/2001
Sciences.ch 14/03/2005

Par sa direction, son sens et son module, le vecteur gradient d'un champ en un point comporte
donc des indications sur la manière dont varie le champ autour de ce point.

Remarque : la condition nécessaire et suffisante pour qu'un champ de vecteurs soit le gradient
d'un champ scalaire est que ce champ vectoriel soit irrotationnel (voir plus loin l'opérateur
"rotationnel d'un champ vectoriel").

Après avoir défini le gradient en coordonnées cartésiennes nous devons nous intéresser
à l'expression de cet opérateur dans d'autres systèmes de coordonnées. Il est fréquent en
physique d'avoir à utiliser les coordonnées cylindriques, polaires et sphériques pour simplifier
l'étude formelle de systèmes physiques. Ainsi, si nous faisons référence à notre étude des
systèmes de coordonnées, nous avons (rappel) d'abord en coordonnées polaires:

Or, avec la définition du gradient en coordonnées cartésiennes, nous avons en coordonnées


polaires la définition suivante:

Si nous exprimons la différentielle totale exacte (voir chapitre de calcul intégral et


différentiel) de nous obtenons les relations suivantes:

Ce qui nous permet d'obtenir la relation:

donc :

ce qui nous amène à :

Ainsi le gradient en coordonnées polaires s'exprime comme:

Occupons nous maintenant de l'expression du gradient en coordonnées cylindriques.

414/2001
Sciences.ch 14/03/2005

Rappellons que lors de l'étude des différents systèmes de coordonnées nous avons obtenu
pour les coordonnées cylindriques:

Donc nous savons déjà que l'expression du gradient en coordonnées cylindriques sera
identique à celle en coordonnées polaires à l'exception de l'ajout de la composante verticale
indépendante des autres coordonnées. Ainsi, nous obtenons en coordonnées cylindriques:

Occupons nous maintenant de l'expression du gradient en coordonnées sphériques.


Rappellons que lors de l'étude des différents systèmes de coordonnées nous avons obtenu
pour les coordonnées sphériques:

Or, avec la définition du gradient en coordonnées cartésiennes, nous avons en coordonnées


sphériques la définition suivante:

Si nous exprimons la différentielle totale de nous obtenons les relations suivantes:

Ce qui nous permet d'obtenir la relation (nous utilisons maintenant la notation qui use du
l'opérateur "nabla"):

La relation:

Nous impose:

Ainsi le gradient en coordonnées sphériques s'exprime comme:

415/2001
Sciences.ch 14/03/2005

Nous avons donc finalement vu toutes les expressions du gradient dans les systèmes
cartésiens, polaires, cylindriques et sphériques.

GRADIENT D'UN CHAMP DE VECTEURS

Le gradient d'un champ vectoriel est le champ dit "tensoriel" défini par les 9
relations suivantes en coordonnées cartésiennes:

Par les 4 relations suivantes en coordonnées polaires:

Par les 9 relations suivantes en coordonnées cylindriques:

Par les 9 relations suivantes en coordonnées sphériques:

416/2001
Sciences.ch 14/03/2005

Nous avons donc finalement vu toutes les expressions du gradient d'un champ tensoriel dans
les systèmes cartésiens, polaires, cylindriques et sphériques.

DIVERGENCE D'UN CHAMP DE VECTEURS

Nous définissons l'opérateur divergence par la relation suivante (la notation tensorielle a été
utilisée afin d'abréger l'écriture) dans un espace à dimensions:

Ainsi, en coordonnées cartésiennes, nous obtenons :

Si la divergence d’un champ de vecteurs est identiquement nulle en tous les points d’un repère
Eulérien, l’intégrale triple du flux de ce champs à travers un volume sera:

Il en résulte que le flux de ce champ de vecteurs à travers les bords du volume est nul, c’est-à-
dire que le flux entrant compense le flux sortant. Nous disons qu’un tel champ de vecteurs de
divergence nulle présente un flux conservatif.

Il est très facile d'otenir l'expression de la divergence en d'autres systèmes de coordonnées. Le


fait que nous ayons déterminé le gradient dans différents systèmes nous permet très
rapidement d'écrire que la divergence en coordonnées polaires s'exprime par la relation:

en coordonnées cylindriques par la relation (nous ajoutons la composante verticale


indépendante):

en coordonnées sphériques par la relation:

Nous avons donc finalement vu toutes les expressions de la divergence d'un champ vectoriel
dans les systèmes cartésiens, polaires, cylindriques et sphériques.

417/2001
Sciences.ch 14/03/2005

ROTATIONNEL D'UN CHAMP DE VECTEURS

Le rotationnel d'un champ de vecteurs noté ou est le champ de vecteurs dont


les lignes de champs sont perpendiculaires à celles dont nous avons calculé le rotationnel
comme le montre l'exemple particulier ci-dessous:

Le rotationnel d'un champ vectoriel est par définition le champ vectoriel


perpendiculaire dont les composantes en chaque point sont données en coordonnées
cartésiennes par:

Effectivement, de par la définition du produit vectoriel, il est évident que:

d'où le fait que le rotationnel d'un champ de vecteur est perpendiculaire à ce champ.

Un champ de vecteurs est dit "irrotationnel" lorsque le rotationnel de ce champ est


identiquement nul en tous les points de l'espace.

L'expression de ce rotationnel est très simple à obtenir dans d'autres système de coordonnées
une fois le gradient connu dans tous les systèmes couramments utilisés. Ainsi, en coordonnées
cylindriques (le rotationnel en coordonnées polaires n'est pas définissable), nous avons:

418/2001
Sciences.ch 14/03/2005

et en coordonnées sphériques:

LAPLACIEN D'UN CHAMP SCALAIRE

Le Laplacien d’un champ scalaire est le champ scalaire qui mesure la différence
entre la valeur de la fonction en un point et sa moyenne autour de ce point.

Cet opérateur s'obtient à partir de la divergence du gradient et nous la notons (écriture


tensorielle):

Le Laplacien est nul, ou assez petit, lorsque la fonction varie sans à-coup. Les fonctions
vérifiant l’équation de Laplace sont dites "harmoniques".

Le Laplacien d'un champ scalaire en dans d'autres systèmes de coordonnées est un peu plus
long à développer. Il existe plusieurs méthodes et parmi celles existantes j'ai choisi celles dont
le type de raisonnement et les outils utilisés semblaient pertinents. Il est intéressant d'aborder
différentes stratégies mais bien sûr il existe des méthodes plus simples que celle présentée ci-
dessous.

Soit le Laplacien en coordonnées cartésiennes dans d'un champ scalaire :

Pour déterminer cette expression en coordonnées polaires, nous allons utiliser la différentielle
totale et la règle de chaîne en coordonnées polaires:

419/2001
Sciences.ch 14/03/2005

donc pour une dérivée seconde:

or, nous avons pour les coordonnées polaires:

et

d'où:

et

et

d'où:

et compte tenu que les dérivées partielles secondes sont continues, alors les dérivées croisées
sont égales:

Donc:

De façon similaire, nous aurons :

420/2001
Sciences.ch 14/03/2005

d'où l'expression du Laplacien en coordonnées polaires:

Dans le cas d'extension aux coordonnées cylindriques, nous aurons, puisque la troisième
coordonné ne change pas:

Pour trouver l'expression du Laplacien en coordonnées sphériques, nous allons utiliser


l'intuition du physicien et les notions de similitude.

Nous allons tout d'abord nous aider de la figure ci-dessus pour savoir de quoi l'on parle:

Les relations entre coordonnées cartésiennes et sphérique sont données par les relations:

Nous allons considérer maintenant les similitudes suivantes:

Coordonnées cylindriques: et

421/2001
Sciences.ch 14/03/2005

Coordonnées sphériques: et

Construisons un tableau de correspondance:

L'objectif est de jouer avec cette correspondance avec d'abord le Laplacien en coordonnées
cylindriques où l'on a soustrait des deux côtés de l'égalité le terme . Ainsi:

utilisons le tableau de correspondance et nous obtenons :

Le deuxième terme de l'égalité de cette dernière relation est l'équivalent sphérique du terme
#1 du Laplacien en coordonnées cylindriques:

Maintenant examinons le terme #2:

Identiquement lorsque nous avons déterminé la relation:

nous obtenons:

avec:

et

ce qui nous permet d'écrire:

422/2001
Sciences.ch 14/03/2005

si nous jouons encore avec le tableau de correspondance, nous avons:

nous divisons cette relation des deux côtés par et ainsi nous obtenons:

Nous avons donc ci-dessus l'équivalent sphérique du terme #2 du Laplacien en coordonnes


cylindrique:

Le terme #3 est très simple à déterminer. Nous remplacons par afin d'obtenir:

En rassemblant tous les termes obtenus précédemment, nous obtenons enfin la forme étendue
du Laplacien en coordonnées sphériques si utilisé en physique:

Nous pouvons raccourcir cette expression et factorisant les termes:

LAPLACIEN D'UN CHAMP VECTORIEL

Le Laplacien d'un champ vectoriel est le champ vectoriel défini par (notation
tensorielle):

423/2001
Sciences.ch 14/03/2005

dont les composantes sont les Laplacien des composantes.

Ainsi, en coordonnées cartésiennes:

Le Laplacien d'un champ de vecteurs en d'autres systèmes de coordonnées est assez simple à
obtenir à partir de la connaissance du Laplacien d'un champ scalaire dans ces mêmes
coordonnées. Ainsi, en coordonnées polaires, nous avons pour le Laplacien d'un champ
vectoriel la relation suivante:

et en coordonnées cylindriques:

et finalement en coordonnées sphériques :

424/2001
Sciences.ch 14/03/2005

RELATIONS REMARQUABLES

Les opérateurs différentiels scalaires et vectoriel ont des propriétés très simples que l'on
retrouve très souvent en physique.

Voyons d'abord les relations qui n'ont aucun sens (au cas où vous tomberiez dessus sans faire
exprès...):

ou

le rotationnel d'une divergence n'existe pas puisque l'opérateur rotationnel s'applique à un


champ vectoriel alors que la divergence est un scalaire.

ou

le rotationnel d'un laplacien scalaire n'existe pas puisque l'opérateur rotationnel s'applique à
un champ vectoriel alors que par construction, le laplacien est un scalaire.

Voyons maintenant les propriétés remarquables (sans démonstrations car trop simple -
cependant si vous en avez besoin car vous n'y arrivez pas seul, n'hésitez pas à nous contacter,
nous compléterons):

- Par construction le laplacien scalaire est la divergence du gradient du champ :

- Le rotationnel du gradient est nul :

- La divergence du rotationnel d'un champ vectoriel est toujours nulle :

ou

- Le rotationnel d'un champ vectoriel est égal au gradient de la divergence de ce champ moins
son laplacien vectoriel :

ou

425/2001
Sciences.ch 14/03/2005

- La multiplication de l'opérateur nabla par le produit scalaire de deux vecteurs est égal à...
(voir ci-dessous), qui donne une relation très utile en mécanique des fluides :

- Le produit scalaire du rotationnel d'un vecteur est la différence des opérateurs commutés tel
que :

nous réutiliserons cette dernière relation lors de notre étude en électromagnétisme, de la


pression de radiation (entre autres).

RÉSUMÉ DES OPÉRATEURS DIFFÉRENTIELS

Dans le cadre de ce site Internet, nous faisons usage des différentes notations présentées et
résumées dans le tableau ci-dessous. Leur usage permet dans le cadre de différentes théories
d'éviter des confusions avec d'autres êtres mathématiques. C'est embêtant certes mais il faudra
faire avec.

ÊTRE MATHEMATIQUE NOTATIONS

Gradient d'un champ scalaire

Gradient d'un champ vectoriel

Divergence d'un champ de vecteurs

Rotationnel d'un champ de vecteurs

Laplacien d'un champ scalaire

Laplacien d'un champ vectoriel

Et pour les pragmatique voici une explication de chacun des opérateurs :

- Le gradient signifie "la pente" (exemple : le champ électrique est la pente du potentiel
électrostatique).

- La divergence caractérise un flux de quelque chose qui vient de quelque part, d'une source,
ou qui y va. Si la divergence n'est pas nulle, c'est qu'il y a concentration autour d'un point,
donc la densité augmente (ou diminue, c'est selon le signe). Ca peut être la densité de charges
électriques ou bien la masse volumique. D'où le fameux théorème qui dit que le flux (ce qui
passe dans une surface) est égal à l'intégrale de la divergence (ce qui reste).

- Le rotationnel caractérise l'existence d'un tourbillon, c'est très utilisé en mécanique des
fluides. S'il y a un tourbillon, on peut suivre une ligne de courant sur une courbe fermée sans
qu'elle change de sens : la circulation ne sera pas nulle (elle vaut l'intégrale du rotationnel).

426/2001
Sciences.ch 14/03/2005

ALGÈBRE LINÉAIRE

Nous avons étudié dans le chapitre de calcul algébrique comment déterminer l'intersection (si
elle existe) de l'équation de deux droites (nous pouvons étendre le problème bien évidemment
à plus de deux) dans données par :

et

où .

En cherchant donc la valeur de pour laquelle :

Ainsi nous pouvions écrire :

Cependant, il existe une autre manière de présenter le problème comme nous l'avons vu en
algorithmique. Effectivement, nous pouvons écrire le problème sous la forme d'un "bloc"
d'équations :

et comme nous cherchons , nous avons :

Cette écriture s'appelle comme nous l'avons présenté dans le chapitre d'algorithmique (section
analyse numérique) un "système linéaire" que nous pouvons résoudre par en soustrayant ou en
addition les lignes entre elles (l'ensemble des solutions étant toujours égal), ce qui nous
donne :

et nous voyons que nous retombons sur la solution :

427/2001
Sciences.ch 14/03/2005

il y donc deux manière de présenter un problème d'intersection de droites :

1. Sous forme d'équation

2. Sous forme de système

Nous allons nous intéresser dans une partie ce chapitre à la deuxième méthode qui nous
permettre à l'aide des outils vus dans le chapitre de calcul vectoriel de résoudre les
intersection non plus d'une ou plusieurs droites mais d'une ou plusieurs droits, plans,
hyperplans dans respectivement .

Il y a cependant une condition à remplir : comme nous l'avons vu dans l'exemple précédent,
nous ne pourrions pas résoudre un système d'équations à deux inconnues si nous n'avons
qu'une seule équation. C'est la raison pour laquelle il faut et il suffit pour un système
d'équation à inconnues avoir au moins équations. Ainsi, nous parlons de : "systèmes de
équations à inconnues" et comme nous le verrons plus loin, ceci implique trivialement
d'avoir une matrice carrée (le concept de "matrice" sera défini un peu plus loin). Nous verrons
aussi que pour un tel système ait des solutions non toutes nulles, il faut que nous ayons un
déterminant de la matrice qui soit nul (le concept de "déterminant" sera défini plus loin) et
donc que la matrice soit inversible.

SYSTÈMES LINÉAIRES

Nous appelons donc "système linéaire", ou simplement système, toute famille d'équations de
la forme :

où chaque ligne représente l'équation d'une droite, plan ou hyperplan (voir le chapitre de
géométrie chapitre pour la détermination de l'équation d'un hyperplan) et les "coefficients
du système", les "coefficients du second membre" et les les "inconnues du système".

Si les coefficients du second membre sont tous nuls, nous disons que le système est
"homogène". Nous appelons "système homogène associé" au système, ce même système que
nous obtenons en substituant des zéros au coefficient du second membre.

Rappels :

- L'équation d'une droite (voir chapitre d'analyse fonctionnelle) est donnée par :

en posant .

428/2001
Sciences.ch 14/03/2005

- L'équation d'un plan (voir chapitre de géométrie spatiale dans la section de géométrie) est
donnée par :

en posant .

- L'équation d'un hyperplan est très facilement (si vous ne voyez pas comment faites le nous
savoir nous le préciseront) généralisable à partir de la démonstration de celle du plan et nous
obtenons ainsi :

en posant

Nous écrivons souvent un système linéaire sous la forme condensée suivante :

Une écriture encore plus condensée sera introduite plus tard.

Nous appelons "solution du système" tout -uplet tel que :

Résoudre un système signifie trouver l'ensemble des solutions de ce système. Deux systèmes
à inconnues sont dits "équivalents" si toute solution de l'un est solution de l'autre,
autrement dit, s'ils admettent le même ensemble de solutions. Nous disons parfois que les
équations d'un système sont "compatibles" ou "incompatibles", suivant que ce système admet
au moins une solution ou n'en admet aucune.

Nous pouvons également donner bien sûr une interprétation géométrique à ces systèmes.
Supposons que les premiers membres des équations du système soient non nuls. Alors, nous
savons que chacune de ces équations représente un hyperplan d'un espace affine (voir le
chapitre de calcul vectoriel) de dimension . Par conséquent, l'ensemble des solutions du
système, regardé comme ensemble de -uplets de coordonnées, représente une intersection
finie d'hyperplans.

Pour la méthode de résolution "classique" de ces systèmes, nous renvoyons le lecteur au


chapitre traitant des algorithmes dans la section d'analyse numérique.

MATRICES

Nous appelons "matrice" à et lignes et colonnes, ou "matrice de type " (le premier
terme correspond toujours aux lignes et le second aux colonnes, pour s'en souvenir il existe un
bon moyen mnémotechnique : le président LinColn – abréviation de Ligne et Colonne…),

429/2001
Sciences.ch 14/03/2005

tout tableau de nombres :

Nous désignons souvent une matrice de type plus brièvement par :

ou simplement par .

Le nombre est appelé "terme ou coefficients d'indices ". L'indice étant appelé "indice
de ligne" et l'indice "indice de colonne".

Nous notons l'ensemble des matrices dont les coefficients prennent leurs
valeurs dans (pouvant être ou par exemple).

Lorsque , nous disons que est une "matrice carrée" d'ordre . Dans ce cas, les
termes sont appelées "termes diagonaux".

Nous appelons également une matrice à une seule ligne "matrice-ligne" et une matrice à une
seule colonne "matrice-colonne". Il est claire qu'une matrice colonne n'est rient d'autre qu'un
"vecteur-colonne". Par la suite, les lignes d'une matrice seront assimilées à des matrices-lignes
et les colonnes à des matrices-colonnes.

L'intérêt de la notion de matrice apparaître tout au long des textes qui vont suivre mais la
raison d'être immédiate de cette notion est simplement de permettre à certaines familles finies
de nombres d'être conçues sous la forme d'un tableau rectangulaire.

Nous assignerons aux matrices des symboles propres, à savoir les lettre latines majuscules :
et aux matrices-colonnes des symboles à savoir les lettres minuscules vectorielles
; nous les appellerons d'ailleurs indifféremment matrices-colonnes ou vecteurs-
colonnes.

Nous appelons "matrice nulle", et nous la notons , toute matrice dont chaque terme est nul.
Les matrices-colonnes sont également désignées par le symbole vectoriel : .

Nous appelons "matrice unité d'ordre ", et nous notons , ou simplement , la matrice
carrée d'ordre :

430/2001
Sciences.ch 14/03/2005

Nous verrons plus loin que la matrice nulle joue le rôle d'élément neutre de l'addition
matricielle et la matrice unité d'élément neutre de la multiplication matricielle.

Nous allons maintenant revenir brièvement sur la définition de "rang d'une famille finie" que
nous avons vu en calcul vectoriel.

Rappel : nous appelons "rang" d'une famille de vecteurs la dimension du sous-espace vectoriel
de qu'elle engendre.

Ainsi, soit les colonnes d'une matrice , nous appelons "rang de ", et nous
notons , le rang de la famille .

Dans un langage un peu plus familier (…) le rang d'une matrice est donné par le nombre de
matrice-colonnes qui ne peuvent s'exprimer par la combinaison et la multiplication par un
scalaire d'autres matrices-colonnes de la même matrice.

Remarque : s'il a y des difficultés à déterminer le rang d'une matrice il existe un technique
"d'échelonnage" des matrices que nous allons voir plus tard qui permet d'effectuer ce travail
très rapidement.

Nous appelons "matrice associée au système" :

l'être mathématique défini par :

c'est-à-dire la matrice dont les termes sont les coefficients du système. Nous appelons
"matrice du second membre du système linéaire", ou simplement "second membre du
système", la matrice-colonne dont les termes sont les coefficients du second membre
de ce système. Nous appelons également "matrice augmentée associée au système" la matrice
obtenue de en ajoutant comme -ième colonne.

431/2001
Sciences.ch 14/03/2005

Si nous considérons maintenant un système de matrice associée et de second membre .


Désignons toujours par les colonnes de . Le système s'écrit alors de manière
équivalente sous la forme d'une équation vectorielle linéaire :

Maintenons rappelons un théorème que nous avons vu en calcul vectoriel : pour que le rang
d'une famille de vecteurs soit égal au rang de la famille augmentée
, il faut et il suffit que le vecteur soit combinaison linéaire des vecteurs
.

Il s'ensuit que notre système linéaire sous forme vectorielle admet au moins une solution
si le rang de la famille est égal au rang de la famille augmentée
et cette solution est unique si et seulement si le rang de la famille
est .

Ainsi, pour qu'un système linéaire de matrice associée et de second membre admette au
moins une solution, il faut et il suffit que le rang de soit égal au rang de la matrice
augmentée . Si cette condition est remplie, le système admet une seule solution si et
seulement le rand de est égal au nombre d'inconnues autrement dit, les colonnes de sont
linéairement indépendantes.

Nous disons qu'une matrice est "échelonnée" si ses lignes satisfont aux deux conditions
suivantes :

C1. Tout ligne nulle n'est suivie que de lignes nulles

C2. L'indice de colonne du premier terme non nul de toute linge non nulle est supérieur à
l'indice de colonne du premier terme non nul de la linge qui la précède.

Une matrice échelonnée non nulle est donc de la forme :

où et sont des termes non nuls. Bien entendu, les lignes


nulles terminales peuvent manquer.

Remarque : il est évident que les matrices nulles et les matrices unités sont échelonnées.

Les colonnes d'indice d'une matrice échelonnée sont clairement linéairement


indépendantes. Envisagées comme des vecteurs-colonnes de , elles forment donc une base

432/2001
Sciences.ch 14/03/2005

de cet espace vectoriel. En considérant les autres colonnes également comme des vecteurs-
colonnes de , nous en déduisons qu'elles sont nécessairement combinaison linéaire de
celles d'indice et donc que le rang de la matrice échelonnée est .

Nous noterons que est aussi le nombre de lignes non nulles la matrice échelonnée et
également le rang de la famille des lignes de cette matrice, puisque les lignes non nulles sont
dès lors manifestement indépendantes.

Nous pouvons dès lors nous autoriser un certain nombre d'opérations élémentaires
(supplémentaires) sur les lignes des matrices qui nous seront fort utiles et ce, sans changer son
rang :

P1. Nous pouvons permuter les lignes.

Remarque : la matrice est juste une représentation graphique esthétique d'un système linéaire.
Ainsi, permuter deux lignes ne change aucunement le système.

P2. Multiplier une ligne par un scalaire non nul

Remarque : cela ne changeant en rien l'indépendance linéaire des vecteurs-lignes.

P3. Additionner à une ligne, un multiple d'une autre

Remarque : la ligne additionnée disparaîtra au profit de la nouvelle qui est indépendante de


toutes les (anciennes) autres. Le système reste ainsi linéairement indépendant.

Toute matrice peut être transformée en matrice échelonnée par une suite finie d'opérations de
type P1, P2, P3. C'est cette technique que nous utilisons dans le chapitre traitant des
algorithmes pour résoudre les systèmes linéaires.

Il est donc évident que les opérations élémentaires sur les lignes d'une matrice ne modifient
pas le rang de la famille des lignes de cette matrice. Or, nous avons observé que le rang de la
famille des lignes d'une matrice échelonnée est égal au rang de la famille des colonnes, c'est-
à-dire au rang de cette matrice. Nous en concluons que le rang de n'importe quelle matrice de
type est également le rang de la famille des lignes de cette matrice.

Comme corollaire de cette conclusion, il apparaît que :

Lors de la résolution de système linéaires de équations à inconnues il apparaît, comme


nous l'avons déjà fait remarquer tout au début de ce chapitre, qu'il doit y avoir au moins un
nombre égal d'équations ou d'inconnues ou plus rigoureusement : le nombre d'inconnues doit
être inférieur ou égal aux nombre d'équations tel que :

OPÉRATIONS SUR LES MATRICES

Rappelons que nous avons vu lors de notre étude du calcul vectoriel que les opérations de

433/2001
Sciences.ch 14/03/2005

multiplication d'un vecteur par un scalaire, d'addition ou soustraction de vecteurs entre eux et
l'opération de produit scalaire formait dans le sens ensembliste du terme un "espace
vectoriel" (voir le chapitre de théorie des ensembles) possédant ainsi aussi une "structure
algébrique vectorielle". Ceci sous la condition que les vecteurs aient bien sûr les mêmes
dimensions (ce constat n'étant pas valable si au lieu du produit scalaire nous prenions le
produit vectoriel).

Au même titre que les vecteurs, nous pouvons multiplier une matrice par un scalaire et
additionner celles-ci entre elles (tant qu'elles ont les mêmes dimensions…) mais en plus, nous
pouvons aussi multiplier deux matrices entre elles sous certaines conditions que nous
définirons ci-après. Cela fera également de l'ensemble des matrices dans le sens ensembliste
du terme, un espace vectoriel sur le corps et possédant ainsi aussi une "structure algébrique
vectorielle".

Ainsi, un vecteur pourra aussi être vu comme une matrice particulière de dimension
et s'opérer dans l'espace vectoriel des matrices. En gros…, le calcul vectoriel
n'est qu'un cas particulier de l'algèbre linéaire.

Définitions :

D1. Soient . Nous appelons somme de et la matrice dont


les coefficients sont :

D2. Soient une matrice et un scalaire. Nous appelons produit de par


la matrice dont les coefficients sont :

De ses deux définitions nous pouvons donc effectivement conclure que l'espace/ensemble des
matrices est bien un espace vectoriel et possède ainsi une "structure algébrique vectorielle".

D3. Soient trois espaces vectoriels de bases respective et


deux application linéaires (voir théorie des ensembles aussi pour un
rappel). Soient la matrice de relativement aux base et la matrice de
relativement aux bases . Alors la matrice de (voir la définition d'une fonction
composée dans le chapitre d'analyse fonctionnelle) relativement aux bases est égale au
produit de par noté .

et

et

434/2001
Sciences.ch 14/03/2005

Dons soient et , nous appelons produit matriciel de par et


nous notons , la matrice dont les coefficients sont :

En notant par des lettres latines majuscules les matrices et par les lettres grecques minuscules
les scalaires, le lecteur vérifiera aisément (nous pouvons rajouter les démonstration sur
demande) les relations :

TYPE DE MATRICES

Afin de simplifier les notations et la longueur des calculs, nous définissons :

D1. Soit une matrice carrée (c'est-à-dire ). La matrice est dite "inversible"
ou "régulière" si et seulement s'il est telle que :

si tel n'est pas le cas, nous disons que est "singulière".

Cette définition est fondamentale !!!! Elle a des conséquences extrêmement importantes dans
tout l'algèbre linéaire (résolution de système linéaires, déterminant, vecteurs et valeurs
propres, etc.) !!!!

D2. Soit :

une matrice de . Nous appelons "matrice transposée" de , la matricée notée , de


définie par (nous mettons les ligens en colonne et les colonnes en ligne) :

435/2001
Sciences.ch 14/03/2005

Remarque :

Quelques relations utiles y relatives (dont nous pouvons rajouter les démonstrations détaillées
sur demande) :

D3. Soit :

une matrice de . Nous appelons "matrice adjointe" de , la matricée, de


définie par :

qui est donc la complexe conjuguée de la matrice transposée ou si vous préférez... la


transposée de la matrice conjuguée (dans le cas de coefficient réels... on se passera de la
conjuguer... lol). Pour simplifer les écritures nous la notons simplement (écriture fréquente
en physique quantique).

Remarques :

R1. Nous appelons "comatrice" de la matrice , la transposée de son adjointe (et nous
pouvons continuer ainsi longtemps...)

R2. Relation triviale (qui sera souvent utilisée en physique quantique des champs) :

436/2001
Sciences.ch 14/03/2005

D4. Par définition, une matrice est dite "matrice hermitique" ou "matrice self-adjoine" si elle
est égale à son adjointe tel que :

D5. Soit une matrice carrée de , la trace de , notée est définie par :

Quelques relations utiles y relatives (dont nous pouvons rajouter les démonstration détaillées
sur demande) :

D6. Une matrice est dite "nilpotent" si en la multipliant successivement par elle-même elle
peut donner zéro. En clair, s'il existe un entier tel que :

Remarque : pour se souvenir de se mot, nous le décomposons en "nil" pour nulle et "potent"
pour potentiel. Ainsi, quelque chose de nilpotent est donc quelquechose qui est
potentiellement nul.

D7. Une matrice est dite "matrice orthogonale" si ses éléments sont réels et si elle obéit à :

ce qui se traduit par (où est le symbole de Kronecker) :

Les vecteurs colonnes de la matrices sont donc normés à l'unité et orthogonaux entre eux.

Remarque : c'est typiquement le cas de la matrice de la base canonique, ou de toute matrice


diagonalisable.

D8. Soit une matrice carrée. La matrice est dite "matrice symétrique" si et
seulement si :

437/2001
Sciences.ch 14/03/2005

Nous retrouverons cette définition en calcul tensoriel.

D9. Soit une matrice carrée. La matrice est dite "matrice anti-symétrique" si
et seulement si :

ce qui impose que ,

Nous retrouverons cette définition aussi en calcul tensoriel.

D10. Soit Soit une matrice carrée. La matrice est dite "matrice triangulaire
supérieure" si et seulement si :

D11. Soit Soit une matrice carrée. La matrice est dite "matrice triangulaire
inférieure" si et seulement si :

D12. La matrice est dite "orthogonale" si :

D13. Soit , une matrice carrée. La matrice est dite "matrice diagonale" si et
seulement si :

La notation habituelle d'une matrice diagonale étant :

438/2001
Sciences.ch 14/03/2005

D14. Soient un espace vectoriel, de dimension et deux bases deux bases de :

Définition : nous appelons "matrice de passage" de la base à la base , et nous noterons


la matrice de dont les colonnes sont formées des composantes des vecteurs de
sur la base .

Nous considérons le vecteur de qui s'écrit dans les bases et


suivant les relations :

Soit :

le vecteur de formé des composantes de dans la base et respectivement le vecteur


formé des composantes de dans la base . Alors :

Remarques :

R1. Si lorsqu'un vecteur est donné et que sa base n'est pas spécifiée, c'est qu'ils s'agit dès lors
implicitement de la base canonique :

qui laisse invariant la multiplication par un vecteur quelconque et lorsque la base utilisée est
notée et n'est pas spécifiée, c'est qu'il s'agit également de la base canonique.

R2. Si un vecteur est donnée par rapport à la base canonique, ces composantes sont dites
"covariantes", dans le cas contraire, où si elles sont exprimées après suite dans une autre base
non canonique, alors nous disons que les composantes sont contravariantes (pour plus de
précisions sur le sujet voir le chapitre de calcul tensoriel).

DÉTERMINANTS

439/2001
Sciences.ch 14/03/2005

Nous allons nous intéresser aux déterminants dans le point de vue du physicien (celui de
mathématicien étant assez rébarbatif...). Fréquemment, en physique, que ce soit en mécanique
ou physique quantique des champs, nous aurons fréquemment des systèmes linéaires à
résoudre. Or, nous avons vu maintenant qu'un système linéaire :

peut être écrit sous la forme :

et nous savons que les seuls systèmes linéaires résolubles sont ceux qui ont autant d'équations
que d'inconnues. Ainsi, la matrice doit être une matrice carrée .

Si une solution existe, il existe alors une matrice-colonne (ou "vecteur") tel que
ce qui implique :

Qu'impose cette relation ? Eh bien c'est simple mais à la fois très important : pour qu'un
système linéaire ait une solution, il faut que le la matrice soit inversible ! Quel rapport avec
le déterminant alors ? C'est simple : les mathématiciens ont cherché comment s'écrivaient les
inverses des matrices de systèmes linéaires dont ils savaient qu'ils y avait une solution et ils
sont arrivés après tâtonnements à déterminer une sorte de formule qui permette de vérifier si
la matrice est inversible ou non. Une fois cette formule trouvée, ils ont formalisé (comme ils
savent si bien le faire…), avec un très bonne rigueur, le concept entourant cette formule qu'ils
ont appelé "détérminant". Ils y sont tellement bien arrivés d'ailleurs qu'on oublie parfois qu'ils
ont procédé ainsi….

Remarque : si une matrice d'un système linéaire n'est pas inversible, cela a pour conséquence
qu'il existe soit aucune solution, soit une infinité de solutions (comme à l'habitude quoi…)

Nous allons ci-dessous d'abord nous intéresser à la manière de construire le déterminant en


définissant un type d'application particulière. Ensuite, après avoir vu un exemple simple et
interprétable du calcul d'un déterminant, nous nous attacherons à déterminer la formule de
celui-ci dans le cas général. Enfin, une fois ceci fait, nous verrons qu'elle est la relation qui lie
l'inverse d'une matrice et le déterminant.

Dans ce qui suit tous les espaces vectoriels considérés sont de dimension finie et sur le corps
des nombres complexes (ceux qui le préfèrent pourront prendre comme corps de base,
de fait nous pourrions prendre un corps quelconque).

440/2001
Sciences.ch 14/03/2005

D'abord nous allons faire un petit peu de mathématique (un peu rébarbative) avant de passer à
du concret.

Soit un espace vectoriel, nous écrirons au lieu de . désignera la


base canonique de . est l'ensemble des matrices carrées à coefficients dans
.

Définitions :

D1. Une "application multilinéaire" sur un espace est par définition une application
qui est linéaire en chacune de ces composantes. C'est-à-dire :

pour tout et où les sont des vecteurs.

Remarque : une application multilinéaire non nulle n'est pas une application linéaire de
l'espace dans . Sauf si . Effectivement, cela se vérifie de par la définition de
l'application linéaire versus celle de l'application multilinéaire :

D2. Une "application multilinéaire alternée" sur est par définition une application
multilinéaire qui vérifie la condition suivante:

pour tout . Ainsi la permutation de deux vecteurs qui se suivent change le


signe de .

Ainsi, si est une application multilinéaire, alors est alternée si et seulement si


. nous avons :

Démonstration : étant définie comme alternée, nous avons donc :

441/2001
Sciences.ch 14/03/2005

et voilà ce qui nous intéresse :

D3. Un "déterminant" est par définition (par imposition) une application multilinéaire alternée
vérifiant de plus :

Remarque : les colonnes d'une matrice carrée forment vecteurs et nous voyons donc qu'un
déterminant sur induit une application de (où est l'espace des
matrices carrées à coefficients dans ) définie par où est la i-
ème colonne de . Par la suite, nous ferons l'abus d'écriture qui consiste à confondre et .

Etudions le cas . Si est un déterminant, pour tout vecteurs


nous avons :

Comme est multilinéaire, nous avons :

et comme elle est surtout multilinéaire alternée, nous avons donc :

En fait, nous venons de montrer que si un déterminant existe, il est unique et de la forme
indiquée ci-dessus, il faudrait encore vérifier que l'application ainsi définie satisfait les
propriétés d'un déterminant, mais ce dernier point est immédiat.

Ainsi, si est une matrice nous avons donc :

442/2001
Sciences.ch 14/03/2005

Nous retrouvons donc la forme du déterminant tel que nous en avons fait mention en calcul
vectoriel.

Donnons une interprétation géométrique du déterminant. Soit deux vecteurs de .

Le vecteur est obtenu en projetant sur et nous avons donc :

et

L'aire du parallélogramme ci-dessus est donc :

Si alors :

et donc :

Ainsi le déterminant représente au signe près l'aire du parallélogramme défini par les vecteurs
lorsque ceux-ci sont linéairement indépendants. Nous pouvons généraliser ce résultat à
une dimension quelconque, en particulier, pour , le déterminant de trois vecteurs
linéairement indépendants représente le volume du parallélépipède défini par ces derniers.

Le cas plus général de l'expression du déterminant est un peu plus délicate à établir. Il faut
pour cela que nous définissions une application bijective particulière mais simple que nous

443/2001
Sciences.ch 14/03/2005

avions déjà rencontrée dans la chapitre de probabilités et statistiques.

Définition : soit nous appelons "permutation de " toute application


bijective de dans :

Soit l'ensemble des permutations (applications bijectives) possibles de .


contient bien évidemment… (voir la combinatoire dans le chapitre de probabilités et
statistiques) éléments. La donnée d'un élément de est définie par les données
successives de :

Etant donnée une suite d'éléments ordonnées (croissants) d'éléments , nous


appelons "inversion", toute permutation d'éléments dans la suite ordonnée (donc la suite ne
sera plus ordonnée du tout…). Nous notons le nombre d'inversions.

Nous disons que la permutation est pair (impair) si est pair (impair). Nous appelons
"signature de ", le nombre noté défini par , c'est-à-dire :

Nous avons maintenant les outils en place nécessaire à définir de manière générale la formule
du déterminant :

Définition : soit . Nous appelons "déterminant de ", et nous


notons , le scalaire défini par (nous verrons un exemple plus loin) :

Exemples :

E2. Soit , considérons les permutations des seconds indices


(des entiers ) pris dans leur ensemble :

444/2001
Sciences.ch 14/03/2005

Nous calculons les signatures de . Voici le schéma de cette règle (rappel : nous disons
donc… qu'il y a "inversion", si dans une permutation, un entier supérieur précède un entier
inférieur) :

Nombre
0 1
d'inversions
Permutation Paire Impaire

+1 -1

Donc nous avons :

Ce qui correspond bien à ce que nous avions vu initialement.

E2. Soit , considérons les permutations des seconds indices


(des entiers ) pris dans leur ensemble :

Nous calculons les signatures de . Voici le schéma de cette règle (rappel : nous disons
donc… qu'il y a "inversion", si dans une permutation, un entier supérieur précède un entier
inférieur) :

Nombre
0 1
d'inversions
Permutation Paire Impaire

+1 -1

Donc nous avons :

445/2001
Sciences.ch 14/03/2005

Ce qui correspond bien à ce que nous avions vu initialement.

E2. Soit , considérons les permutations des seconds indices


(des entiers ) pris dans leur ensemble :

Nous calculons les signatures de . Voici le schéma de cette règle (rappel : nous disons
donc… qu'il y a "inversion", si dans une permutation, un entier supérieur précède un entier
inférieur) :

123 132 213 231 312 321


Nombre
0 1 1 2 2 3
d'inversions
Permutation Paire Impaire Impaire Paire Paire Impaire

+1 -1 -1 +1 +1 -1

Donc nous avons :

Voyons quelques propriétés et corollaires de cette formulation du déterminant :

P1. Soit une matrice carrée d'ordre , nous ne changeons pas la valeur du
déterminant de en :

1. Effectuant une opération élémentaire sur les colonnes de

2. Effectuant une opération élémentaire sur les lignes de

Démonstration : Si alors est composée de vecteurs colonnes :

Effectuer une opération élémentaire sur les colonnes de revient à addition

446/2001
Sciences.ch 14/03/2005

à une des colonnes de . Soit la matrice obtenue en additionnant à la j-ème


colonne de , nous avons :

Par multilinéarité (finalement la démonstration n'est vraiment pas bien dure) :

et comme le déterminant est alterné :

Pour ce qui est des opération élémentaires sur les lignes il suffit de considérer la transposée
(c'est à pleurer tellement c'est simple).

P2. Soit une matrice carrée d'ordre et soit :

Démonstration : comme précédemment, il suffit de remarquer que si sont les vecteurs


colonnes constituant la matrice alors sont ceux qui constituent et :

L'application étant n-linéaire, nous aboutissons à l'égalité :

P3. Soit une matrice carrée d'ordre . Nous changeons le signe du déterminant de
si :

1. Nous permutons deux de ces colonnes

2. Nous permutons deux de ces lignes

Démonstration : est constituée des vecteurs . Le déterminant de est égal au


déterminant de ces . Permuter deux colonnes de revient à permuter les deux vecteurs
correspondant. Supposons que les vecteurs permutés soit le i-ème et le j-ème, l'application
déterminant étant alternée, nous avons :

Pour ce qui est des lignes, il suffit de considérer les transposée de

447/2001
Sciences.ch 14/03/2005

P4. Soit alors :

La démonstration peut se faire de deux manières, la première est assez indigeste et abstraite
nous la laisserons aux mathématiciens (…) même si elle a l'avantage d'être générale, la
seconde plus simple, consiste à vérifier cette assertions pour différentes matrices carrées.

Exemple :

Les calculs donnent donc des résultant qui sont bien identiques. Nous pouvons vérifier ainsi
pour des matrices carrées de dimensions supérieures.

P5. Une matrice carrée est inversible si et seulement si .

Démonstration : si est inversible, nous avons :

Il s'agit de la propriété la plus importante des matrices dans le cadre de la physique théorique
car si est un système linéaire, le calcul de son déterminant permet de savoir si celui-ci a des
solutions uniques. Dans le cas contraire, comme nous en avons déjà fait mention, soit le
système a aucune solution, soit une infinité !

Il faut considérer aussi un car particulier important. Soit le système suivant :

où et à déterminer. Il est clair…, que soit inversible ou non,


la solution triviale est . Cependant…, imaginons une cas de physique théorique où nous
avons mais pour lequel nous savons que et pour lequel nous
imposons . Dans ce cas, ils nous faut éliminer la solution triviale . De
plus, calculer l'inverse (s'il existe) de la matrice ne nous ramènera à rien de concret mis à

448/2001
Sciences.ch 14/03/2005

part à ce qui bien évidemment ne nous satisfait pas. La seule solution est alors de se
débrouiller pour que les coefficient de la matrice soient tels que sont déterminant soit
nul et donc la matrice non inversible ! L'intérêt ? Eh, bien d'avoir une infinité de solutions
possibles (de donc !) qui satisfont . Nous aurons besoin de cette méthodologie en
mécanique quantique ondulatoire, lorsque nous déterminerons l'existence des anti-particules
par l'intermédiaire de l'équation de Dirac linéarisée. Il faudra donc s'en rappeler.

P6. Deux matrices "conjuguées" (attention, pas dans le sens complexe du terme) ont le même
déterminant.

Démonstration : soit , et une matrice de passage d'une base à une


autre (voir plus loin le traitement des changements de bases), nous avons alors :

P7. Pour toute matrice :

Démonstration :

Or (trivial.. simple multiplication de tous les coefficients) :

Puisque (trivial) et que (voir le chapitre traitant des


nombres dans la section d'arithmétique), nous pouvons alors écrire :

P8. Pour toute matrice :

Démonstration : ben… c'est la même chose que pour la propriété précédente mais sans les
valeurs conjuguées… De fait, nous montrons de la même manière, la même propriété pour
.

P6. Soit une matrice , nous noterons la matrice obtenue à partir de

449/2001
Sciences.ch 14/03/2005

en effaçant la i-ème ligne et la j-ème colonne. appartient donc à . Alors pour tout
:

où est appelé "cofacteur"

Démonstration : définissons pour cela l'application :

Il est facile de voir que est multilinéaire (il suffit de considérer comme une
simple constante et ensuite par extension de la définition du déterminant… trop facile…).

Montrons cependant qu'elle est alternée (dans ce cas, c'est un déterminant qui a toutes les
propriétés d'un déterminant) :

Soit deux vecteurs colonne de qui se suivent. Supposons que , il faut


montrer que dans ce cas (qui découle de la définition d'une application alternée).

Nous avons premièrement (c'est obligatoire de par la définition) si nous n'effaçons aucune des
colonnes étant ou :

si

et nous avons bien évidemment si nous enlevons l

Donc

C'est donc OK. Elle est alternée et multilinéaire, il s'agit donc bien d'un déterminant.

Nous venons donc de montrer que est un déterminant et par unicité nous a
pour tout .

Voyons un exemple de cette méthode en calculant le déterminant de :

450/2001
Sciences.ch 14/03/2005

Développons selon la deuxième ligne . Nous obtenons :

Développons selon la première colonne en guise de vérification (on ne sait jamais…) :

Définition : Soit deux entiers positifs quelconques et une matrice à coefficients


dans . Pour tout entier un "mineur d'ordre " de est un déterminant du
type:

avec

Pour finir nous terminons en donnant une formule qui relie les coefficients de l'inverse d'une
matrice avec ces mineurs d'ordre .

DÉRIVÉE D'UN DÉTERMINANT

Soit une matrice carrée avec des fonctions dérivables. Posons


. Nous voulons calculer . Soit le i-ème vecteur colonne de la matrice .
Utilisons la formule :

Sachant que la dérivée de est (dérivée de produits) :

451/2001
Sciences.ch 14/03/2005

nous avons donc :

Si nous regardons la première somme ci-dessus, nous remarquons que :

où est la dérivée du vecteur . De même pour les sommes suivantes. Ainsi,

Développons encore. Considérons le terme ci-dessus. Si nous le


développons par rapport à la première colonne, nous obtenons :

De même, en développant le j-ème terme de la somme ci-dessus par rapport à la j-ème


colonne nous avons :

Si nous posons :

nous obtenons :

452/2001
Sciences.ch 14/03/2005

ce qui en notation tensorielle (voir chapitre de calcul tensoriel) s'écrit :

Nous avons aussi :

où est le coefficient se trouvant à la j-ème ligne, i-ème colonne de la matrice . Si nous


notons le coefficient de la matrice alors :

et

L'expression de la dérivée devient finalement :

qui s'écrit en notation tensorielle :

Ce résultat, finalement assez simple, nous sera utile en calcul tensoriel, pour construire les
outils nécessaires à l'étude de la relativité générale et à la détermination de l'équation
d'Einstein des champs. Il convient donc de s'en rappeler.

CHANGEMENTS DE BASE

Supposons que nous passions d'une base d'un espace à une autre base
de ce même espace.

Décomposons les dans la base :

Définition : nous appelons "matrice de transition" ou "matrice de passage", la matrice


(l'application linéaire) qui permet de passer de donnée par :

453/2001
Sciences.ch 14/03/2005

Théorème : soit . Alors les composants de dans la base sont


données par :

ou

Remarque : la matrice est inversible, car ses colonnes sont linéairement indépendantes (ce
sont les vecteurs décomposés dans la base et les sont linéairement indépendants car
ils forment une base).

Démonstration : prenons pour simplifier le cas (la démonstration étant très facilement
généralisable) avec et .

Nous avons alors :

Nous avons donc et nous cherchons à exprimer dans la base tel que .
Nous allons chercher l'application linéaire qui relie ces deux relations telles que :

d'où :

c'est-à-dire :

454/2001
Sciences.ch 14/03/2005

Considérons maintenant une application linéaire. Soit sa matrice dans la base


, et sa matrice dans la base . Alors nous avons :

Démonstration : soit et nous avons donc une fonction qui


nous amène à écrire :

D'autre part, nous avons (ce que nous avons démontré tout à l'heure) :

Dès lors :

d'où :

et comme nous l'avons vu dans notre étude du déterminant, les déterminants de sont
égaux et donc invariants.

VALEURS ET VECTEURS PROPRES

Définition : une valeur propre est par définition (nous retrouvons cette définition dans
l'introduction a l'algèbre quantique dans le cadre du chapitre de physique quantique
ondulatoire) une valeur appartenant à un corps tel que soit une matrice carrée
nous avons :

et réciproquement qu'un vecteur est un vecteur propre si et seulement si :

Ainsi, l'ensemble des valeurs propres d'une matrice est appelé "spectre de "
et satisfait au système homogène :

où est une matrice de diagonale unité aussi notée et qui admet une solution non nulle si
et seulement si (nous verrons de nombreux exemples en physique) :

455/2001
Sciences.ch 14/03/2005

Le déterminant (qui est un polynôme en ) est appelé "polynôme


caractéristique" de et l'équation "équation caractéristique de .

P7. Terminons en donnant une relation qui relie les coefficients de l'inverse d'une matrice
avec ces mineurs d'ordre (nous allons utiliser cette relation un peu plus loin) :

Soit une matrice inversible. Notons et . Alors :

Démonstration : notons le k-ème vecteur colonne de la matrice . Sachant que


, nous avons a (trivial) :

Calculons . D'une part en développant par rapport à la k-ème


colonne nous trouvons (puisque qu'un seul des coefficients de est non nul et que l'unique
non nul est égal à l'unité) :

D'autre part (propriétés du déterminant) :

Ainsi :

456/2001
Sciences.ch 14/03/2005

c'est-à-dire :

457/2001
Sciences.ch 14/03/2005

CALCUL TENSORIEL

Le calcul vectoriel classique est une technique simple et efficace qui s'adapte parfaitement à
l'étude des propriétés mécaniques et physiques de la matière dans l'espace euclidien à trois
dimensions. Cependant, dans de nombreux domaines de la physique, il apparaît des grandeurs
expérimentales qui ne peuvent plus être facilement représentées par de simples vecteurs-
colonnes d'espaces vectoriels euclidiens. C'est le cas par exemple en mécanique des milieux
continus, fluides ou solides, en électromagnétisme, relativité générale, etc.

Ainsi, dès la fin du 19ème siècle, l'analyse des forces qui s'exercent à l'intérieur d'un milieu
continu à conduit à mettre en évidence des grandeurs physique caractérisées par neuf
nombres représentant les forces de pression ou de tension internes. La représentation de ces
grandeurs nécessita l'introduction d'un nouvel être mathématique qui fut appelé "tenseur", par
référence à son origine physique (au fait, il s'agit de matrice sur lesquelles nous définissons
des opérations mathématiques propres au domaine de la physique). Par la suite, à partir de
1900, ce furent R. Ricci et T. Lévi-Civita qui développèrent le calcul tensoriel; puis l'étude
des tenseurs permit un approfondissement de la théorie des espaces vectoriels et contribua au
développement de la géométrie différentielle.

Le calcul tensoriel à également pour avantage de se libérer de tous les systèmes de


coordonnées et leurs formes sont ainsi invariantes (énorme allégement des calculs). Il n'y a
plus alors à se préoccuper dans quel référentiel il convient de travailler et cela, est très
intéressant en relativité générale (bien que nous puissions reformuler toute la physique sous
forme tensorielle, nous nous en abstiendrons tant que cela ne sera pas strictement nécessaire).

Nous conseillons par ailleurs vivement au lecteur de bien maîtriser les bases du calcul
vectoriel et de l'algèbre linéaire comme elles ont été présentées auparavant. Au besoin, nous
avons choisi lors de la rédaction de ce chapitre de revenir sur certains points vus en calcul
vectoriel (composantes covariantes, contravariantes,...). Si le lecteur à déjà parcouru l'étude
des équations de Navier-Stokes (mécanique des milieux continus) ceci constituera un petit
avantage pratique avant de parcourir ce qui va suivre.

Nous ne ferons que très peu d'exemples pratique dans cette section. Effectivement les
exemples concrtets viendront lorsque nous étudierons la mécanique des milieux continus, la
relativité générale, la physique quantique des champs, etc...

Un conseil peut-être : pensez matriciel, écrivez tensoriel ! (vous comprendrez mieux ce petit
adage une fois après avoir parcouru tout ce chapitre).

NOTATION INDICIELLE

Nous utilisons par la suite des symboles mathématiques: coordonnées, composantes de


vecteurs et tenseurs, éléments de matrice, etc., dont le nombre, dans chaque catégorie, est
grand ou indéterminé. Pour distinguer les divers symboles d'une catégorie nous emploions des
indices. Par exemple, au lieu des variables traditionnelles nous utiliserons
éventuellement les grandeurs (comme nous l'avons déjà fait en algèbre linéaire).
Cette notation devient indispensable lorsque nous avons des variables en nombre indéterminé.

Ainsi, si nous avons a variables, nous les noterons :

458/2001
Sciences.ch 14/03/2005

Nous utilisons également des indices supérieurs, selon les besoins; par exemple, .
Afin d'éviter toute confusion avec l'écriture des puissances, la quantité à la puissance
sera écrite . Lorsque le contexte écarte tout risque d'ambiguïté, l'utilisation des
parenthèses n'est cependant pas fondamentalement nécessaire.

En calcul tensoriel il existe une convention de sommation qui consiste à utiliser le fait que
l'indice répété, ici l'indice , va devenir lui-même l'indication de la sommation. Nous écrivons
alors, avec cette convention :

ce qui permet de condenser relativement bien les écritures.

Ainsi, pour représenter le système linéaire :

Nous écrirons (remarquez bien comment s'écrivent les composants de la matrice associée) :

en spécifiant que c'est pour .

Nous voiyons sur cet exemple, combien la convention de sommation permet une écriture
condensée et donc puissante.

La convention de sommation s'étend à tous les symboles mathématiques comportant des


indices répétés. Ainsi la décomposition d'un vecteur sur une base s'écrit pour
dès lors :

En résumé, tout expression qui comporte un indice deux fois répété représente une somme sur
toutes les valeurs possibles de l'indice répété.

SOMMATION SUR PLUSIEURS INDICES

La convention de sommation s'étend au cas où figurent plusieurs indices dits "muets" dans un
même monôme. Soit par exemple, la quantité , celle-ci représente la somme suivante
pour et prenant les valeurs de 1 à 2:

459/2001
Sciences.ch 14/03/2005

Ainsi, nous voyons facilement qu'un expression avec deux indices de sommation qui prennent
respectivement les valeurs comportera termes; s'il y a trois indices, de
sommation etc.

Il faut faire cependant attention aux substitutions avec ce genre de notation car si nous
supposons que nous avons la relation:

avec

Pour obtenir l'expression de uniquement en fonction des variables , nous ne pouvons


pas écrire :

car cela ne revient pas à la même expression après développement puisque les indices muets
sont systématiquement sommés de manières identiques et rigides (nous laissons au lecteur le
soin de faire ce petit exercice de style).

SYMBOLE DE KRONECKER

Un symbole introduit par le mathématicien Kronecker, est le suivant:

Ce symbole est appelé "symbole de Kronecker". Il permet avantageusement d'écrire, par


exemple, le produit scalaire de deux vecteurs et , de norme unité et orthogonaux entre
eux, sous la forme:

Lors d'une sommation portant sur deux indices muets, le symbole de Kronecker annule tous
les termes où les indices ont des valeurs différentes. Par exemple:

Nous retrouverons ce symbole dans de nombreux exemples de physique théorique (physique


quantique ondulatoire, physique quantique des champs, relativité générale, mécanique des
fluides, etc..)

SYMBOLE D'ANTISYMÉTRIE

Une autre symbole fort utile est le "symbole d'antisymétrie" que nous retrouverons
fréquemment en relativité générale. Dans le cas où prennent l'une des valeurs le
symbole d'antisymétrie aura les valeurs définies suivantes:

- , si deux quelconques des indices ont une valeur identique

460/2001
Sciences.ch 14/03/2005

- , si les indices sont dans l'ordre 1, 2, 3 ou proviennent d'un nombre pair de


permutations des indices par rapport à l'ordre initial des indices.

- , si les indices sont dans un ordre qui provient d'un nombre impair de permutations
par rapport à l'ordre initial des indices.

En utilisant ce symbole, un déterminant d'ordre deux (voir algèbre linéaire) s'écrit alors sous
la forme avantageuse :

et le produit vectoriel (et ça c'est très pratique en relativité générale) :

où bien sûr, et sont sommés et où l'indice muet est le numéro de la ligne du vecteur
résultant (en cas de demande nous ferons les développements). En particulier, le rotationnel
d'un champ vectoriel est alors :

Comme exemple, calculons en notation indicielle le double produit vectoriel :

où à nouveau, l'indice muet est le numéro de la ligne du vecteur résultant (en cas de
demande nous ferons les développements).

Comme deuxième exemple, montrons comment la divergence d'un rotationnel s'annule :

Comme de par la théorème de Schwarz est symétrique dans les indices et que est
anti-symétrique (par définition) dans les mêmes indices, la somme sur et doit
nécessairement s'annuler. Par exemple, la contribution à la somme du terme est
l'opposée de celle de .

Remarque : le symbole d'antisymétrie est très souvent appelé "tenseur de Levi-Civita" dans la
littérature. Au fait, bien que ce soit bien un tenseur sous la forme de ses notations, il s'agit
plus d'un outil mathématique qu'un "être" mathématique d'où la préférence de certains
physiciens de le nommer "symbole" plutôt que "tenseur". Mais c'est à vous de voir...

Voyons maintenant des applications concrètes de cette notation indicielle en reprenant

461/2001
Sciences.ch 14/03/2005

l'exemple du changement de base que nous avons déjà vu en calcul vectoriel :

Soient deux bases et d'un espace vectoriel euclidien .


Chaque vecteur d'une base peut être décomposé sur l'autre base sous la forme d'une
application linéaire (matrice de changement de base - voir chapitre d'algèbre linéaire) :

et

où nous utilisons bien évidemment la convention de sommation pour

Rappel : la matrice de changement de base (ou de "transformation) doit avoir autant de


colonnes que le vecteur de base n'a de lignes (dimensions). Petit exemple à trois dimensions:

et il est évident qu'îl est fort plus sympathique d'écrire cela sous la forme :

Un vecteur quelconque de peut être décomposé (nous l'avons déjà vu) sur chaque base
de sous la forme:

Si nous cherchons les relations entre les composantes et il suffit de reprendre les
relations de changement de base et nous avons alors (cela revient à faire de l'agèblre linéaire):

De suite par l'unicité de la décomposition d'un vecteur sur une base, nous pouvons égaler les
coefficients des vecteurs de base et nous obtenons (il faut prendre garde a ré-arranger à
nouveau l'ordre des termes que la multiplication matricielle n'est pas commutative comme
nous le savons déjà) :

et

Il vient également la relation triviale (voir l'algèbre linéaire) :

Quant au produit scalaire les résultats obtenus avec la notation indicielle sont forts
intéressants et extrêmement puissants. Nous avons déjà défini le produit scalaire en calcul
vectoriel mais voyons comment l'on manipule ce dernier avec la notation indicielle:

462/2001
Sciences.ch 14/03/2005

Considérons un espace vectoriel euclidien rapporté à une base quelconque . Les


vecteurs s'écrivent sur cette base (nous le savons déjà):

Le produit scalaire relativement à ses propriétés et à la notation indicielle s'écrit alors:

avec évidemment:

et pour satisfaire la propriété de commutativité du produit scalaire (voir le chapitre de calcul


vectoriel) nous devons évidemment avoir l'égalité .

Remarque: lorsque les vecteurs de base forment un espace vectoriel orthogonal (pas
nécessairement orthonormé) alors les quantités:

sont nulles si . Le produit scalaire de deux vecteurs et se réduit alors à:

ou encore à :

MÉTRIQUE ET SIGNATURE

Comme nous l'avons vu en calcul vectoriel, le produit scalaire d'un vecteur peut permettre
de définir la notion de norme d'un vecteur (et le concept de distance).

Rappellons que nous avons par définition la norme d'un vecteur qui est donnée par:

où les nombres définissent en quelque sorte une "mesure" des vecteurs; nous disons alors
dans le langage du calcul tensoriel qu'ils constituent la "métrique" de l'espace vectoriel choisi.

Dans l'espace de la géométrie classique, la norme est un nombre qui est toujours strictement
positif et qui ne devient nul que si le vecteur mesuré est égal à zéro. Par contre, l'expression
précédente de la norme d'un vecteur, peut être éventuellement négative pour des nombres
quelconques (espaces complexes par exemple). Nous pouvons donc distinguer
deux genres d'espaces vectoriels pré-euclidiens (espace euclidien dans lequel nous avons

463/2001
Sciences.ch 14/03/2005

défini le produit scalaire) selon que la norme est positive ou non. Cependant lorsqu'en
physique théorique nous souhaitons faire l'analogisme avec une structure d'espace vectoriel il
faut que la condition :

soit satisfaite ( peut être écrit comme une matrice, rien ne nos l'empêche).

Explications: nous savons que le produit scalaire doit satisfaire à la propriété de


commutativité telle que:

D'autre part, si pour tout non nul nous avons :

cela implique (c'est une des propriétés de la norme que nous avons vu en calcul
vectoriel). Nous pouvons alors écrire:

Nous nous retrouve ici simplement avec un système de équations à inconnues (ne
devant admettre par hypothèse que la solution ), il faut et il suffit pour cela que le
déterminant du système, noté , du système soit différent de zéro (voir le chapitre d'algèbre
linaire); nous devons donc avoir:

C'est une des conditions pour qu'une expression assimilable à une norme sous une écriture
tensorielle forme dans le cadre d'une théorie physique un espace vectoriel des états du
système !!

Remarque : le nombre de signes + et – se trouvant dans l'expression du produit scalaire


constitue une caractéristique d'un espace vectoriel donné ; elle est appelée la "signature de
l'espace vectoriel" .

COMPOSANTES CONTRAVARIANTES ET COVARIANTES

Jusqu'à maintenant nous avons écrit les indices muets arbitrairement en exposant ou en indice
selon notre vouloir. Cependant, cela n'est pas toujours autorisé et parfois le fait qu'un indice
muet soit en exposant ou en indice à une signification bien particulière. Ceci constitue souvent
la difficulté lors de l'étude de certains théorèmes, car si nous n'étudions pas ceux-là depuis le
début, nous ne savons pas vraiment comme interpréter la position des indices muets. Il faut
donc être extrêmement prudent à ce niveau.

Pour un espace vectoriel euclidien rapporté à une base quelconque , le produit scalaire

464/2001
Sciences.ch 14/03/2005

d'un vecteur par un vecteur de sa base s'écrit:

Donc :

Cette relation est de première importance en physique théorique et en calcul tensoriel. Il est
important de s'en souvenir pour lorsque nous étudierons la contraction des indices plus tard
(vous pouvez observer dans la relation précédente que nous avons "abaissé" l'indice des
composantes du membre droit de l'égalité).

Ces produits scalaires notés , s'appellent les composantes "covariantes", dans la base ,
du vecteur . Ces composantes sont donc définies par:

Remarque : cela constitue une projection d'un vecteur sur un des vecteurs de sa propre base

Elles seront notées au moyen d'indices inférieurs !!! Nous verrons par la suite que ces
composantes s'introduisent naturellement pour certains vecteur de la physique, par exemple le
vecteur gradient. D'autre part, la notion de composante covariante est essentielle pour les
tenseurs.

Remarque: les vecteurs de base ont toujours les indices notés en bas car ils sont leurs propres
composantes covariantes (ils se projettent sur eux-mêmes par produit scalaire).

Inversement, les composantes "contravariantes" (autrement dit les "composantes non


projetées") peuvent être calculées en résolvant, par rapport aux inconnues , le système de
équations de :

Les relations précédentes montrent que les composantes covariantes sont liées aux
composantes classiques. Pour les distinguer, ces dernières sont appelées les composantes
"contravariantes" du vecteur . Les composantes contravariantes sont donc des nombres
tels que:

Elles seront indiquées au moyen d'indices supérieurs !! L'étude des changements de base
permettra de justifier encore plus l'appellation des différentes composantes.

Dans une base orthonormée canonique (cas très particulier), les composantes covariantes et
contravariantes sont identiques puisque nous avons effectivement :

465/2001
Sciences.ch 14/03/2005

Remarque : nous voyons ci-dessus, que l'écriture incéssante d'indice muets en exposants ou en
indice peut parfois amener à certaines confusiosn et à des maux de tête sérieux (c'est la plus
grande difficulté du calcul tensoriel à notre avis).

OPÉRATIONS DANS LES BASES

L'intérêt du physicien pour le calcul tensoriel, est le passage de paramètres d'une base à une
autre pour des raisons données (souvent dans le but soit de simplifier l'étude de problèmes ou
simplement parce que les états étudiés dépendant - ou peuvent dépendre - de la géométrie de
l'espace dont il est question). Il convient donc d'introduire les principaux outils qui y sont
relatifs.

MÉTHODE D'ORTHOGONALISATION DE SCHMIDT

La méthode dite d'orthogonalisation de Schmidt (dite également de "Grahm-Schmidt") permet


le calcul effectif d'une base orthogonale pour tout espace vectoriel pré-euclidien (nous
aurions pu présenter cette méthode dans le chapitre de calcul vectoriel mais il nous semblait
plus intéressant de la présenter dans le cas général et esthétique du calcul tensoriel).

Pour cela, considérons un ensemble de vecteurs linéairement indépendants de


et supposons que nous ayons pour chaque vecteur le produit scalaire (la norme) :

Cherchons vecteurs orthogonaux entre eux. Partons pour cela de et cherchons


orthogonal à sous la forme:

Le coefficient se calcule en écrivant la relation d'orthogonalité:

Nous en déduisons sans trop de peine:

La paramètre étant déterminé, nous obtenons le vecteur qui est orthogonal à et non
nul puisque le système est linéairement indépendant.

Le vecteur est cherché sous la forme:

466/2001
Sciences.ch 14/03/2005

Les deux relations d'orthogonalité: et , permettent le calcul des


coefficients et . Nous obtenons:

ce qui détermine le vecteur , orthogonal à et , et non nul puisque le système


est indépendant. En continuant le même type de calcul, nous obtenons de
proche en proche un système de vecteurs orthogonaux entre eux et dont aucun
n'est nul

Dans le cas où certains vecteurs seraient tels que (leur norme est nulle), nous
remplaçons par , en choisissant un vecteur de telle sorte que nous
obtenions .

Nous en déduisons donc que tout espace vectoriel pré-euclidien admet des bases
orthogonales!

Ce système de calcul des bases est de première importance, il permet par exemple d'étudier
des systèmes physiques à partir d'un référentiel pré-euclidien dont les propriétés changent
dans le temps. Ce qui est par exemple typique de la relativité générale (pour donner l'exemple
le plus impressionnant…).

Remarque : nous retrouv(er)ons ici la méthode d'orhogonalisation de Grahm-Schmidt telle


que nous l'avons vue en analyse fonctionnelle lors de la définitiont du produit scalaire
fonctionnel.

CHANGEMENTS DE BASE

Soient deux bases et d'un espace vectoriel . Chaque vecteur


d'une base peut être décomposé sur l'autre base sous la forme suivante (nous l'avons déjà déjé
démontré):

et

Un vecteur de peut être décomposé sur chaque base sous la forme:

et nous avons aussi déjà démontré que:

et

467/2001
Sciences.ch 14/03/2005

Nous remarquons que les relations de transformation des composantes contravariantes sont le
contraire des vecteurs de base, les grandeurs et s'échangeant, d'où l'origine de
l'appellation "contra"-"variantes" de ces composantes.

Soient et les composantes contravariantes du vecteur respectivement sur les bases


et . Remplaçons les vecteurs de base, exprimés par les relations:

et

dans l'expression de définition des composantes covariantes, il vient:

d'où la relation entre les composantes covariantes dans chaque base:

Nous obtenons de même:

Nous remarquons que les composantes covariantes se transforment comme les vecteurs de
bases, d'où l'appellation de ces composantes.

BASES RÉCIPROQUES

Soit une base quelconque d'un espace vectoriel euclidien . Par définition, vecteurs
qui vérifient les relations suivantes:

sont appelés les "vecteurs réciproques" des vecteurs . Ils seront notés avec des indices
supérieurs. Par définition, chaque vecteur réciproque se doit donc d'être orthogonal à tous
les vecteur , sauf pour .

Montrons que les vecteurs réciproques d'une base donnée sont linéairement
indépendants. Pour cela, il faut montrer qu'une combinaison linéaire donne un vecteur
nul, si et seulement si chaque coefficient est nul.

Soit un vecteur quelconque de . Multiplions scalairement par la combinaison


linéaire précédente , on obtient:

468/2001
Sciences.ch 14/03/2005

Cette dernière égalité devant être vérifiée quels que soient les , il est nécessaire que chaque
soit nul et ainsi les vecteurs sont donc linéairement indépendants (fallait déjà avoir
l'idée de procéder ainsi n'est-ce pas?).

Le système de vecteurs réciproques forme donc une base appelée la "base réciproque" de
l'espace vectoriel .

Exemple (d'habitude nous nous opposons aux exemples mais ici les implications sont
intéressantes):

Soit trois vecteurs formant une base (non nécessairement orthonormée) d'un espace
vectoriel euclidien. Nous décidons de noter :

où, rappelons-le, le symbole représente le produit vectoriel (au cas oùi il y aurait un petit
oubli...). Les vecteurs suivants:

vérifient la relation et constituent le système réciproque des vecteurs . En


cristallographie, ces vecteurs constituent ce que nous appelons "l'espace de Fourier associé".

TENSEURS EUCLIDIENS

La généralisation de la notion de vecteur nous a conduit à l'étude des espaces vectoriels à


dimensions. Les tenseurs sont également des vecteurs de dimension quelconque mais qui
possèdent des propriétés supplémentaires par rapport aux vecteurs.

Pour le physicien théoricien, le calcul tensoriel s'intéresse en premier lieu à la manière dont
les composantes des tenseurs se transforment lors d'un changement de base des espaces
vectoriels dont ils sont issus. Nous commencerons donc à étudier ces propriétés vis-à-vis des
changements de base (car c'est le cas le plus intéressant).

Un tenseur est, en pratique, souvent uniquement défini et utilisé sous la forme de ses
composantes. Ces dernières peuvent être exprimées sous forme covariante ou contravariante
comme pour tout vecteur. Mais un nouveau type de composantes va apparaître pour les
tenseurs, ce sont les "composantes mixtes". Ces trois types de composantes constituent des
décompositions des tenseurs euclidiens sur des bases différentes.

TENSEUR FONDAMENTAL

Au cours de la théorie vu précédemment, nous avons utilisé les quantités , définies à partir
du produit scalaire des vecteurs de base d'un espace vectoriel pré-euclidien à
dimensions, par:

469/2001
Sciences.ch 14/03/2005

Ces quantités constituent les composantes covariantes d'un tenseur appelé le "tenseur
fondamental" ou "tenseur métrique".

Etudions comment varient les quantités lorsque nous effectuons un changement de base :

Soit une autre base liée à la précédente par les relations connues:

et

Substituant la relation dans l'expression de , il vient (nous changeons les


indices comme il se doit lors d'une substitution):

Dans la nouvelle base , les produits scalaires des vecteurs de base sont donc des quantités
telles que:

Nous avons donc finalement pour l'expression des composantes covariantes lors d'un
changement de base:

Identiquement nous avons :

De manière générale, une suite de quantités qui se transforment, lors d'un changement
de base de , selon les deux relations précédentes, à savoir:

et

constituent, par définition, les "composantes covariantes d'un tenseur d'ordre deux" (à deux
indices) sur .

Nous pouvons ainsi manipuler des quantités exprimant les propriétés intrinsèques des bases
comme des tenseurs normaux !

PRODUIT TENSORIEL DE DEUX VECTEURS

Considérons un espace vectoriel euclidien de base et soient deux vecteurs de :

et

470/2001
Sciences.ch 14/03/2005

Formons les produits deux à deux des composantes contravariantes et , soit:

Nous obtenons ainsi quantités qui constituent également les composantes contravariantes
d'un tenseur d'ordre deux appelé "le produit tensoriel du vecteur par le vecteur ".

Remarque : nous pouvons construire des produits tensoriels d'ordre trois (donc avec
termes) tels que :

Etudions les propriétés de changement de base de ces composantes. Utilisons pour cela les
relations de changement de base des composantes contravariantes d'un vecteur, à savoir:

et

Remplaçons dans la relation les composantes et par leur expression de


changement de base, il vient:

Les quantités sont les nouvelles composantes:

La formule de transformation des quantités lors d'un changement de base de est


donc finalement (très similaire au tenseur métrique):

Une telle relation de changement de base caractérise les composantes contravariantes d'un
tenseur d'ordre deux. Inversement, nous obtenons :

Les quantités constituent donc les "composantes contravariantes d'un tenseur d'ordre
deux".

Nous pouvons former de même les produits deux à deux des composantes covariantes et
des vecteurs et soit:

Les formules de changement de base des composantes covariantes des vecteurs sont données

471/2001
Sciences.ch 14/03/2005

par les relations suivantes que nous avons déjà démontrées précédemment:

et

Substituant la première relation dans le produit , il vient:

C'est la relation de changement de base des composantes covariantes d'un tenseur d'ordre
deux. On vérifie que l'on a:

Identiquement nous avons bien évidemment: puisque .

Les quantités constituent donc les "composantes covariantes d'un tenseur d'ordre deux".

Formons à présent quantités en multipliant deux à deux les composantes covariantes du


vecteur par les composantes contravariantes de , nous obtenons :

Effectuons un changement de base dans cette dernière relation en tenant compte des
expressions et , on obtient:

Cette relation de changement de base caractérise les "composantes mixtes" d'un tenseur
d'ordre deux. Inversement, on peut vérifier que l'on a:

Ces composantes mixtes constituent également des composantes du produit tensoriel de par
, selon une certaines base.

De manière générale, une suite de quantités qui se transforment, lors d'un changement
de base de , selon les relations établies juste précédemment constituent donc, par
définition, les "composantes mixtes d'un tenseur d'ordre deux".

ESPACES TENSORIELS

Au cours de l'étude précédente, nous avons utilisé des systèmes de nombres, crées à partir
d'un espace vectoriel . Lorsque ces nombres vérifient certaines relations de changement de
base, nous avons appelé ces grandeurs, par définition, les "composantes d'un tenseur".

472/2001
Sciences.ch 14/03/2005

Nous avons vu que toute combinaison linéaire de ces composantes constitue les composantes
d'autres tenseurs. Nous pouvons donc additionner entre elles les composantes des tenseurs
ainsi que les multiplier par des scalaires, pour obtenir d'autres composantes de tenseurs. Ces
propriétés d'addition et de multiplication font que nous allons pouvoir utiliser ces grandeurs
tensorielles comme composantes de vecteurs.

D'un point de vue pratique, nous pourrions nous contenter de définir les tenseurs à partir des
relations de transformation de leurs composantes lors d'un changement de base. C'est ce qui
est souvent fait en physique. Cependant, la définition des tenseurs sous forme de vecteurs
conduit à une meilleure compréhension de leurs propriétés et les rattache à la théorie générale
des vecteurs.

Pour préciser comment nous définissons un tenseur sur une base, étudions le cas particulier
d'un produit tensoriel de deux vecteurs constitués par des triplets de nombres. Considérons
l'espace vectoriel euclidien dont les vecteurs sont des triplets de nombre de la forme:
. La base orthonormée canonique de est formée de trois vecteurs :

avec (jolie façon d'écrire la chose n'est-il pas...).

Des vecteurs de permettent de former les neuf quantités que nous avons appelées
"les composantes du produit tensoriel" des vecteurs et .

Si nous effectuons tous les produits tensoriels possibles entre vecteurs de , nous obtenons
des suites de neuf nombres qui peuvent servir à définir le vecteur suivant :

Remarque : nous voyons de suite avec la relation précédente que le produit tensoriel n'est dès
lors pas commutatif.

éléments d'un espace vectoriel à neuf dimensions, ayant pour éléments tous les multiplets
formés de neuf nombres.

Ces vecteurs peuvent être décomposés, par exemple, sur une base canonique orthonormée :

avec .

Si nous renumérotons les quantités selon la place qu'elle occupent dans l'expression de
, soit:

avec et , les vecteurs s'écrivent alors:

473/2001
Sciences.ch 14/03/2005

et constituent un exemple de tenseur d'ordre deux (évidemment on peut généraliser la


démarche).

En quoi ces tenseurs diffèrent-ils des vecteurs ordinaires ? Ils sont certes identiques à
certains vecteurs de mais ils ont été formés à partir des vecteurs de et de . Pour
rappeler ce fait, nous les notons :

et ils sont appelés "produits tensoriels d'ordre deux" des vecteurs et . Le symbole est
donc défini de la manière dont nous avons formé les quantités et l'ordre dans lequel
nous les avons classées pour former le vecteur .

Pour rappeler la dépendance entre une quantité et le vecteur de base auquel il est
affecté, renumérotons ces vecteurs en mettant à la place de l'indice les deux indices et ,
relatifs aux composantes, soit:

Ce dernier peut très bien être noté sous la forme:

Les vecteurs constituent donc une base de qui est appelée la "base associée".

Nous rappelons également que le produit tensoriel est non-commutatif (il est vraiment
important de s'en rappeler)! Autrement dit :

Les relations précédentes nous permettent finalement d'écrire le produit tensoriel des vecteurs
et sous la forme:

L'espace vectoriel est doté d'une structure plus précise que celle de simple espace vectoriel
de dimension neuf lorsque nous définissons les produits tensoriels comme constituant
la base de . Nous disons que est doté d'une "structure de produit tensoriel" ce qui nous
amène à noter cet espace ou encore .

Le produit tensoriel à plusieurs propriétés dont il est facile de démontrer la validité:

- Distributivité, à gauche et à droite, par rapport à l'addition des vecteurs:

474/2001
Sciences.ch 14/03/2005

- Associativité avec la multiplication par une grandeur scalaire:

En tant qu'élément d'un espace , un tenseur est un vecteur de la forme générale:

Etudions ses propriétés vis-à-vis d'un changement de base de tel que:

et

Lors d'un tel changement, la base associée à devient une autre base
associée à , à savoir:

Par suite, le prdouit tensoriel a pour composantes dans la nouvelle base:

Soit donc :

Nous avons les propriétés suivantes :

P1. Distributivité, à gauche et à droite, par rapport à l'addition des vecteurs :

La démonstration de ces propriétés est simple content de la définition du produit tensoriel.


Nous avons par exemple :

P2. Associativité avec la multiplication par une grandeur scalaire :

475/2001
Sciences.ch 14/03/2005

Nous avons en effet :

P3. Lorsque nous choisissons une base dans chacun des espaces vectoriels pour ,
pour , les éléments de que nous notons forment également une base
de .

Démonstration : déjà faite dans l'exemple particuler que nous avons utilisé au début.

Remarque : en pratique, nous avons souvent à utiliser des tenseurs formés à partir de veteurs
appartenant à des espaces vectoriels identiques .

Nous pouvons bien évidemment généraliser le produit tensoriel à un nombre quelconque de


vecteurs. De proche en proche, compte tenu de la propriété P1, nous pouvons considérer
vecteurs appartenant chacun à des espaces vectoriels différents
. Si nous avons :

nous pouvons former le produit tensoriel :

avec .

Nous obtenons construisons ainsi des produits tensoriels d'ordre appartenant à l'espace
vectoriel , espace qui est muni d'une structure de produit tensoriel. Les
éléments de cet espace constituent par définition des tenseurs d'ordre .

Afin d'unifier la classification, les espace vectoriels élémentaires, qui ne peuvent êtres munis
d'une structure de produit tensoriel, peuvent êtres considérés comme ayant pour éléments des
tenseurs d'ordre un. En général, nous appellons ces éléments des "vecteurs", réservant le nom
de "tenseurs" à des éléments d'espaces tensoriels d'ordre égal ou supérieur à deux !

Remarque : il est commode d'appeler "tenseurs d'ordre zéro" les grandeurs scalaires. Il est
également rare de rencontrer des tenseurs d'ordre supérieur à 2.

Il est assez évident et nous ne ferons pas la démonstration (excepté s'il y a une demande) que
nous pouvons redéfinir absolument tous les concepts (base, décomposition sur une base, base
réciproque, produit scalaire, produit tensoriel) que nous avons vu jusqu'à maintenant en
considérant les tenseurs d'ordre deux commes des vecteurs (il faudrait donc que nous re-
écrivions tout ce qui est déjà écrit ci-dessus... ce qui est inutile).

Il est aussi tout à fait possible de réiterer toutes ces définitions pour des tenseurs d'ordre
supérieurs et ainsi généraliser le concept d'espace tensoriel pour toutes les dimensions.

476/2001
Sciences.ch 14/03/2005

De ces considérations, nous pouvons énoncer le "critère de tensorialité":

Pour qu'une suite de quantités, rapportées à une base d'un espace vectoriel , puisse
être considérée comme les composantes d'un tenseur, il faut et il suffit que ces quantités soit
liées entre elles, dans deux bases différentes de , par les relations de transformation des
composantes.

COMBINAISONS LINÉAIRES DE TENSEURS

Nous pouvons former d'autres tenseurs en combinant entre elles les composantes de différents
produits tensoriels définis à l'aide des vecteurs d'un même espace vectoriel. Considérons par
exemple les composantes contravariantes des produits tensoriels des vecteurs et :

Formons les quantités suivantes:

Les quantités vérifient également les formules générales de changement de base. Nous
avons en effet, en substituant les relations de transformation des composantes contravariantes
d'un produit tensoriel dans l'expression précédente :

Les quantités de , vérifiant la relation de changement de base, constituent donc


également des composantes contravariantes d'un tenseur d'ordre deux.

CONTRACTION DES INDICES

Considérons le produit tensoriel mixte de deux vecteurs et de composantes respectives


contravariantes et covariantes . Les composantes mixtes du produit tensoriel de ces
deux vecteurs, sont:

Effectuons l'addition des différentes composantes du tenseur telle que , soit:

Nous obtenons ainsi l'expression du produit scalaire des vecteurs et ; la quantité est un
scalaire ou tenseur d'ordre zéro. Une telle addition sur des indices de variance différente
constitue, par définition, l'opération de "contraction des indices" du tenseur . Cette
opération a permis de passer d'un tenseur d'ordre deux à un tenseur d'ordre zéro; le tenseur
a été amputé d'une covariance et d'une contravariance.

477/2001
Sciences.ch 14/03/2005

Prenons également l'exemple d'un tenseur dont les composantes mixtes sont (attention...
il ne s'agit pas d'une matrice tridimensionnelle mais simplement de l'indication que les
composantes de ce tenseurs s'expriment à partir de trois autres variables). Considérons
certaines de ses composantes telles que , à savoir les quantités et effectuons
l'addition de ces dernières; nous obtenons:

Ces nouvelles quantités forment les composantes d'un tenseur d'ordre un (donc un
vecteur). Les quantités constituent des "composantes contractées" du tenseur et satisfont
bien évidemment aux relations de changement de base (sur demande nous pouvons faire la
démonstration mais sachez qu'elle est similaire à celle que nous avions faite pour les
vecteurs). Nous sommes ainsi passé d'un tenseur d'ordre trois à un tenseur d'ordre un.

Si nous partons de l'expression des composantes contravariantes ou covariantes d'un tenseur,


nous pouvons abaisser l'un des indices par multiplication de ou (métrique diagonale
unitaire et à signature positive : de type canonique) et sommation, afin d'obtenir des
composantes mixtes sur lesquelles nous pouvons ensuite effectuer les opérations de
contraction.

Considérons un tenseur euclidien de composantes contravariantes . Ecrivons les


composantes mixtes de en abaissant à la position covariante l'indice (cela revient donc à
exprimer les composantes d'un des vecteurs implicites en composantes covariantes). Alors:

Effectivement, rappelons que :

Maintenant que nous avons un tenseur à composantes, mixtes, nous pouvons très bien
contracter les indices. Choisissons par exemple l'indice et effectuons la contraction avec
l'indice , posons (nous nous intéressans alors plus qu'à certains termes
particuliers), il vient:

Nous obtenons donc après abaissement de l'indice et contraction, un tenseur d'ordre .

Remarque : par suite de la symétrie des quantités (produit scalaire est commutatif) ce
dernier tenseur est identique à celui que nous obtiendrons en abaissant à la position covariante
l'indice puis en effectuant la contraction avec l'indice :

478/2001
Sciences.ch 14/03/2005

De manière générale, la contraction d'un tenseur permet donc de former un tenseur d'ordre
à partir d'un tenseur d'ordre . Nous pouvons naturellement répéter l'opération de
contraction. Ainsi, un tenseur pair, , deviendra un scalaire après contractions et un
tenseur d'ordre impair, , deviendra un vecteur.

Nous pouvons étendre après cette définition de la contraction des indices, le critère de
tensorialité. Nous avons vu jusqu'à maintenant, deux manières de reconnaître le caractère
tensoriel d'une suite de quantités :

- la première consiste à démontrer que ces quantités sont formées par le produit tensoriel de
composantes de vecteurs ou par une somme de produits tensoriel

- le deuxième consiste à étudier la manière dont ces quantités se transforment lors d'un
changement de base et à vérifier la conformité des relations de transformation.

- la troisième et nouvelle amène à poser que pour qu'un ensemble de quantités,


comportant indices supérieurs et indices inférieurs soit tensoriel, il faut et il suffit que
leur produit complètement contracté par les composantes contravariantes de vecteurs
quelconques et les composantes covariantes de vecteurs quelconques, soit une quantité (la
norme au fait...) qui demeure invariante par changement de base.

TENSEURS PARTICULIERS

Nous pouvons être confrontés en physique théorique à des tenseurs qui ont des propriétés
intéressantes. Afin d'éviter de faire un travail redondant au cas par cas, nous allons énumérer
et démontrer les différentes propriétés existantes et parler de leurs possibles implications.

TENSEUR SYMÉTRIQUE

Considérons un tenseur d'ordre deux contravariantes . Supposons que, suivant une base
, toutes ces composantes satisfassent aux relations:

Sur une autre base , liée à la précédente par les relations de transformation connues, les
nouvelles composantes de vérifient la relation:

Nous voyons que la propriété est donc une caractéristique intrinsèque du tenseur ,
indépendante de la base ! Nous disons alors que le tenseur est "symétrique".

La propriété de symétrie se vérifie également pour les composantes covariantes d'un tenseur
symétrique puisque nous avons:

Réciproquement, la symétrie des composantes covariantes entraîne celle des composantes

479/2001
Sciences.ch 14/03/2005

contravariantes.

Pour des tenseurs d'ordre plus élevé, la symétrie peut être partielle, portant sur deux indices
covariants ou deux indices contravariants. Ainsi, un tenseur d'ordre quatre, de composantes
mixtes peut être également symétrique en et , par exemple, soit:

Nous vérifions, de même que ci-dessus, qu'une telle propriété est intrinsèque.

Un tenseur est dit "complètement symétrique" si toute transposition de deux indices de même
variance, change la composante correspondante en elle-même. Par exemple, pour un tenseur
d'ordre trois , complètement symétrique, nous avons les composantes suivantes qui sont
égales entre elles:

Des exemples de tenseurs compléments symétriques sont le tenseur des contraintes que
nous verrons lors de notre étude des équations de Navier-Stokes en mécanique des fluides et
les tenseurs des transformation relativistes de Lorentz que nous verrons en mécanique
relativiste. Ces tenseurs sont alors dits aussi "totalement invariants" (sous-entendu par
changement de base).

Nous pouvons également (curiosité intéressante) obtenir une représentation géométrique des
valeurs des composantes d'un tenseur symétrique d'ordre deux. Pour cela, considérons dans
l'espace géométrique ordinaire des coordonnées , l'équation suivante:

où, rappelons-le, peut-être vu comme un produit tensoriel avec et où les


sont des coefficients réels donnés. Supposons que ces coefficients soient tels que:

L'équation précédente s'écrit alors:

Nous retrouvons ici l'équation d'une surface de second degré ou quadrique similaire à celle du
plan que nous avons vue en géométrie plane. Nous savons que par extension à la troisième
dimension que ces surfaces sont des ellipsoïdes ou hyperboloïdes, selon les valeurs des
quantités .

Etudions comment se transforment les quantités lorsque nous effectue un changement de


coordonnées tel que :

480/2001
Sciences.ch 14/03/2005

et

L'équation de la quadrique s'écrit dans ce nouveau système de coordonnées:

d'où l'expression des coefficients dans le nouveau système d'axes:

Les coefficients se transforment donc comme les composantes covariantes d'un tenseur
d'ordre deux. Réciproquement, si les quantités sont les composantes d'un tenseur
symétrique, ces composantes définissent les coefficients d'une quadrique. Il existe donc une
certaine équivalence entre un tenseur symétrique et les coefficients d'une quadrique. Nous
dirons que l'équation de la quadrique est la "quadrique représentative" du tenseur symétrique.

Nous savons de par notre étude des quadriques en géométrie plane (en étendant cela au cas
tri-dimensionnel) que nous pouvons toujours trouver un système de coordonnées par rapport
auquel l'équation d'une quadrique prend une forme plus simple:

Dans ce cas, les vecteurs de base sont portés par les axes principaux de la quadrique. Dans ce
système de coordonnées, les composantes du tenseur se réduisent à:

et pour les autres composantes. Les quantités sont appelées les "composantes
principales" du tenseur .

Si les quantités sont positives, la surface est une ellipsoïde, si deux quantités sont
strictement positives et la troisième strictement négative, nous avons un hyperboloïde à une
nappe, si deux quantités sont strictement négatives et la troisième positive, nous avons un
hyperboloïde à deux nappes (pour plus d'information voir le chapitre de géométrie spatiale sur
les coniques).

La comparaison de l'expression de la quadrique obtenue précédemment avec l'équation


classique:

où sont les demi-axes d'un ellipsoïde montre que nous avons :

481/2001
Sciences.ch 14/03/2005

TENSEUR ANTI-SYMÉTRIQUE

Lorsque les composantes contravariantes d'un tenseur d'ordre deux, vérifient les relations:

nous disons que le tenseur est "anti-symétrique". C'est une propriété intrinsèque du tenseur
qui se démontre comme pour les tenseurs symétriques, au signe "-" près. Un tenseur anti-
symétrique doit bien évidemment satisfaire au fait que ces composantes diagonales soient
nulles tel que:

Si les composantes contravariantes d'un tenseur sont anti-symétriques, ses composantes


covariantes le sont également.

Un tenseur sera partiellement antisymétrique si nous avons par exemple:

Il sera complètement antisymétrique si toute transposition d'indice de même variance change


la composante correspondante en son opposée.

Tout tenseurs peut être mis sous la forme d'une somme d'un tenseur symétrique et d'un
tenseur antisymétrique. Nous avons en effet:

Le premier terme de la somme ci-dessus est un tenseur symétrique et le second, un tenseur


antisymétrique.

Considérons maintenant deux vecteurs et d'un espace vectoriel .


Formons les quantités anti-symétriques suivantes (nous y trouvons deux produits tensoriels):

où nous voyons immédiatement que les composantes sont celles d'un tenseur
antisymétrique .

La décomposition du vecteur dans la base s'écrit:

482/2001
Sciences.ch 14/03/2005

Le tenseur (noté ainsi en analogie avec le produit vectoriel pour ) est appelé le
"produit extérieur" des vecteurs et . Nous disons encore que ce tenseur est un "bi-
vecteur".

Le produit extérieur est donc un tenseur anti-symétrique qui vérifie les propriétés suivantes:

P1. anticommutativité: , il en résulte:

P2. distributivité à gauche et à droite pour l'addition vectorielle:

P3. associativité pour la multiplication par un scalaire:

P4. les produits extérieurs:

constituent une base de l'ensemble des bi-vecteurs. Démonstration:

Un tenseur antisymétrique d'ordre deux, élément de , peut s'écrire sous la forme:

Echangeant, dans la dernière somme de la relation ci-dessus, le nom des indices et en tenant
compte que , nous obtenons :

Les éléments:

sont linéairement indépendants puisque les vecteurs le sont également. Ces éléments
constituent donc une base sur laquelle les tenseurs anti-symétriques peuvent êtres
décomposés.

Le nombre de vecteurs distinguables est égal au nombre de combinaisons de


vecteurs pris deux à deux et distinguables parmi tel que:

483/2001
Sciences.ch 14/03/2005

Effectivement parmi les composantes, composantes sont nulles et les autres


composantes ont des valeurs opposées deux à deux. Nous pouvons donc considérer que la
moitié de ces dernières suffit a caractériser le tenseur.

Dans le cadre du produit tensoriel où nous avons:

le nombres de composantes distinguables est également de et elles sont appelées


"composantes strictes".

Nous remarquons que pour , le nombre de composantes strictes du produit extérieur de


deux vecteurs est aussi égal à trois. Ceci permet de former avec les composantes du bivecteur,
les composantes d'un produit vectoriel .

Ainsi, un produit vectoriel n'existe donc que pour un sous-espace de bi-vecteurs dont le
nombre de dimension est égal à 3 et dont les pré-images sont des tenseurs anti-symétriques.

Si toutes ces conditions sont satisfaites, nous disons que le vecteur constitue le "tenseur
adjoint" du tenseur .

TENSEUR FONDAMENTAL

Nous avons vu au début de notre étude du calcul tensoriel la définition des composantes
covariantes du tenseur fondamental, à savoir :

Ces quantités interviennent, nous le savonse, dans l'expression du produit scalaire de deux
vecteur et , de composantes contravariantes et , donné par la relation:

Utilisons le critère général de tensorialité pour mettre en évidence le caractère tensoriel des
. L'expression précédente est un produit complètement contracté des quantités avec les
composantes contravariantes d'un tenseur arbitraire. Comme le produit scalaire est une
quantité invariante (en l'occurence un scalaire) par rapport aux changements de base, il en
résulte que les quantités sont les composantes covariantes d'un tenseur.

Ce tenseur est de plus symétrique par suite de la propriété symétrie du produit scalaire des
vecteurs de base tel que:

484/2001
Sciences.ch 14/03/2005

Nous avons de même pour les composantes contravariantes du tenseur fondamental :

Si nous notons les composantes mixtes du tenseur fondamental à lui même:

avec évidemment ldans la base canonique :

COORDONNÉES CURVILIGNES

Les notions classiques de système de coordonnées peuvent être généralisées à des espaces
ponctuels (voir le chapitre traitant des principes de la mécanique classique) à dimensions.
Nous appelons "système de coordonnées" dans (espace ponctuel à dimensions donc),
tout mode de définition d'un point dans le système considéré.

Pour un système donné de coordonnées (cartésiennes, sphériques, cylindriques, polaires…),


nous appelons "ligne coordonnée" le "lieu" des points lorsqu'une seule coordonnée varie,
les autres étant égales à des constantes.

Etudions tout d'abord la généralisation d'un système de coordonnées relatives à un repère fixe
(nous conseillons vivement au lecteur d'avoir lu au préalable la partie traitant des systèmes de
coordonnées dans le chapitre de calcul vectoriel et la partie traitant du formalisme lagrangien
dans le chapitre des principes de la mécanique).

Considérons un espace ponctuel et un repère de cet espace. Soit les coordonnées


rectilignes d'un point de par rapport à ce repère. Un système de coordonnées
quelconque , , est obtenu en se donnant fonctions arbitraires des
paramètres , telles que:

Nous supposerons par la suite que les fonctions satisfont aux trois propriétés suivantes:

P1. Elles sont de classe supérieur ou égal à (dérivables au moins deux fois pour les
besoins de la physique). Cette hypothèse implique, en tout point où elle est satisfaite, que
nous avons la permutabilité des dérivations (par rapport aux deux dérivations):

P2. Ces fonctions sont telles que nous pouvons résoudre le système des équations de
changement de système de coordonnées par rapport aux variables et les exprimer en
fonction des , soit:

485/2001
Sciences.ch 14/03/2005

toujours avec .

P3. Lorsque les variables varient dans un domaine , les variables varient dans un
domaine . Le jacobien des fonctions , défini par:

sera supposé différent de zéro dans le domaine ainsi que le jacobien des fonctions
qui est l'inverse du jacobien . Si les jacobiens
existent, ils sont non nuls comme conséquence en première lieu de la deuxième propriété ci-
dessus et implicitement de la première.

Si nous fixons paramètres en faisant varier un seul paramètre, par exemple, nous
obtenons les coordonnées d'un ensemble de points de qui constituent une "ligne
coordonnée". En général, les lignes coordonnées ne sont pas des droites mais des courbes; ces
coordonnées sont appelées pour cette raison des "coordonnées curvilignes". En un point
de se croisent d'ailleurs lignes coordonnées.

Nous démontrons en mécanique analytique, lors de l'étude des espaces ponctuels, que les
dérivées et les différentielles d'un vecteur de sont indépendantes du point d'un
repère donné. Si est rapporté à un système de coordonnées curvilignes , nous écrivons :

Soient maintenant les coordonnées curvilignes du point par rapport à une


repère cartésien . Dans ce repère, nous avons bien évidemment :

où les coordonnées cartésiennes sont des fonctions .

Le vecteur a donc pour expression:

A partir des composantes du vecteur , nous pouvons former un déterminant

486/2001
Sciences.ch 14/03/2005

qui est précisément le jacobien des fonctions que nous avions défini
précédemment. Puisque ce déterminant est différent de zéro (du moins imposé tel quel), il en
résulte que les vecteurs sont linéairement indépendants.

Ces vecteurs, définis par la relation:

sont appelées la "base naturelle" au point de l'espace vectoriel . Il sont colinéaires aux
tangentes des lignes coordonnées qui se coupent au point où ils sont définis.

Nous n'insisterons pas sur le fait évident qu'à tout système de coordonnées curvilignes sont
associées des repères naturels dont les bases sont exprimées par ses mêmes coordonnées (voir
le chapitre de calcul vectoriel).

Associons au point de un repère formé par le point et par les vecteurs de la base
naturelle. Ce repère est appelé le "repère naturel" en du système de coordonnées . Il
sera noté:

ou

La différentielles du vecteur s'exprime alors sous la forme:

Les quantités constituent les composantes contravariantes du vecteur dans le repère


naturel du système de coordonnées .

Considérons maintenant deux systèmes quelconques de coordonnées curvilignes et ,


liées entre elles par les relations:

où les fonctions sont supposées plusieurs fois continuement dérivables


par rapport aux et de même pour les fonctions par rapport aux
coordonnées . Lorsque nous passons d'un système de coordonnées à un autre, nous disons
que nous effectuons un "changement de coordonnées curvilignes".

Nous avons vu en relativité générale que la carré de la distance entre deux points et
infiniment proches est donnée par le relation:

où les sont les composantes du vecteur , rapportées à un repère fixe d'un

487/2001
Sciences.ch 14/03/2005

espace ponctuel . Lorsque cet espace est rapporté à un système de coordonnées curvilignes
, nous avons vu que la relation:

montre que le vecteur a pour composantes contravariantes les quantités par rapport
au repère naturel . Le carré de la distance s'écrit alors dans le repère naturel:

où les quantités sont les composantes du tenseur fondamental ou du tenseur


métrique définies à l'aide d'une base naturelle. L'expression précédente s'appelle "l'élément
linéaire de l'espace ponctuel " ou encore la "métrique" de cet espace.

Les vecteurs du repère naturel varient en général d'un point un autre. C'est le cas, par
exemple, des coordonnées sphériques dont les quantités (nous le démontrerons de suite
après) sont variables !!

Une courbe de peut être définie par la donnée des coordonnées curvilignes du
lieu des points en fonction d'un paramètre . La distance élémentaire sur cette
courbe s'écrit alors:

REPÈRE NATUREL EN COORDONNÉES SPHÉRIQUES

Déterminons la base naturelle de l'espace vectoriel associé à l'espace ponctuel de la


géométrie ordinaire, en coordonnées sphériques. Ecrivons l'expression des vecteurs dans
un repère cartésien fixe qui sont par définition (voir le chapitre de calcul vectoriel pour
plus de détails) :

Les vecteurs des la base naturelle étant donnés par:

Nous avons ainsi :

488/2001
Sciences.ch 14/03/2005

La dérivée de par rapport à donne le vecteur :

La dérivée par rapport à donne le vecteur :

Ces trois vecteurs sont orthogonaux entre eux ainsi que nous le vérifonse aisément en
effectuant les produits scalaires . Lorsqu'il en est ainsi, nous disons que les coordonnées
sont des coordonnées "curvilignes orthogonales".

Ces vecteurs ne sont cependant pas tous normés, puisque nous avons:

Le repère naturel, en coordonnées sphériques, est donc formé par des vecteurs variables en
direction en en module en chaque point de . Les quantités constituent un exemple de
tenseur métrique attaché à chacun des points de l'espace .

L'élément linéaire du plan est donné par (les détails des calculs peuvent êtres trouvés dans le
chapitre traitant de la mécanique relativiste – en particulier la partie concernant la relativité
générale):

REPÈRE NATUREL EN COORDONNÉES POLAIRES

Déterminons la base naturelle de l'espace vectoriel associé à l'espace ponctuel de la


géométrie ordinaire, en coordonnées polaires. Ecrivons l'expression des vecteurs dans
un repère fixe cartésien qui sont par définition (voir le chapitre d'analyse vectorielle pour
plus de détails):

Les vecteurs des la base naturelle étant donnés par:

Nous avons:

489/2001
Sciences.ch 14/03/2005

La dérivée de par rapport à donne le vecteur :

Ces deux vecteurs sont orthogonaux entre eux ainsi que nous le vérifions aisément en
effectuant les produits scalaires .

Nous avons:

L'élément linéaire du plan est donné par (les détails des calculs peuvent êtres trouvés dans le
chapitre traitant de la mécanique relativiste – en particulier la partie concernant la relativité
générale):

REPÈRE NATUREL EN COORDONNÉES CYLINDRIQUES

Déterminons la base naturelle de l'espace vectoriel associé à l'espace ponctuel de la


géométrie ordinaire, en coordonnées cylindriques. Ecrivons l'expression des vecteurs
dans un repère fixe cartésien qui sont par définition (voir le chapitre d'analyse
vectorielle pour plus de détails):

Les vecteurs des la base naturelle étant donnés par:

Nous avons:

La dérivée de par rapport à donne le vecteur :

et enfin:

490/2001
Sciences.ch 14/03/2005

Ces trois vecteurs sont orthogonaux entre eux ainsi qu'on le vérifie aisément en effectuant les
produits scalaires .

Nous avons:

L'élément linéaire du plan est donné par (les détails des calculs peuvent êtres trouvés dans le
chapitre traitant de la mécanique relativiste – en particulier la partie concernant la relativité
générale):

SYMBOLES DE CHRISTOFFEL

L'étude des champs de tenseurs constitue, pour le physicien, l'essentiel de l'analyse tensorielle.
Le tenseur générique de ce champ est une fonction du point et nous le notons:

Si le tenseur est une fonction seulement de , le champ considéré est appelé un "champ
fixe". Si est, en outre, une fonction d'un ou plusieurs paramètres autres que les
coordonnées de , nous disons alors que ce champ est variable et nous le notons :

Les différentes opérations algébriques sur les tenseurs associés à un même point ne
soulèvent pas de difficulté particulière. La dérivée de par rapport à un paramètre
conduit à utiliser les résultats classiques relatifs à la dérivation des vecteurs.

Cependant, une difficulté apparaît lorsque nous cherchons à calculer la dérivée d'un tenseur
par rapport aux coordonnées curvilignes. En effet, les composantes du tenseur sont
définies en chaque point par rapport à un repère naturel qui varie d'un point à un autre.

Par suite, le calcul de la variation élémentaire :

lorsque nous passons d'un point à un point infiniment voisin ne peut se faire que si
nous avons recours à une même base. Pour pouvoir comparer l'un à l'autre les tenseur
et , nous sommes amenés à étudier comment varie un repère naturel, pour un
système de coordonnées donné, lorsque nous passons d'un point au point infiniment voisin
.

Pour un système de coordonnée curvilignes donné d'un espace ponctuel un problème

491/2001
Sciences.ch 14/03/2005

fondamental de l'analyse tensorielle consiste donc à déterminer, par rapport au repère naturel
au point , le repère naturel au point infiniment voisin .

D'une part, le point sera parfaitement défini par rapport à si nous déterminons le
vecteur tel que . Pour des coordonnées curvilignes , la décomposition
d'un vecteur élémentaire est donnée par la relation que nous avons démontré
précédemment:

Les quantités étant les composantes contravariantes du vecteur sur la base naturelle
.

D'autre part, les vecteurs vont pouvoir être déterminés en calculant les variations
élémentaire des vecteurs , par rapport au repère naturel , lorsque nous passons
de en ; nous avons alors:

Le calcul des vecteurs reste alors le problème essentiel à résoudre. Nous allons tout
d'abord étudier un exemple de ce type de calcul en coordonnées sphériques.

Pour cela, reprenons l'expression des vecteurs de la base naturelle en coordonnées


sphériques, soit:

Les vecteurs de base du repère fixe cartésien étant constants en module et en direction,
la différentielle du vecteur s'écrit:

Nous remarquons que les termes entre parenthèses représentent respectivement les vecteurs
et , d'où:

Nous calculons de même, en différentiant les vecteurs :

492/2001
Sciences.ch 14/03/2005

Avec:

nous avons:

Donc finalement:

Et:

Après quelques opérations algébriques élémentaires et très pertinentes (…), nous arrivons à:

Les différentielles sont ainsi décomposées sur la base naturelle . Si nous notons ,
les composantes contravariantes du vecteur , celui-ci s'écrit (nous changeons les lettres
d'indices):

Les composantes des vecteurs sont des formes différentielles (combinaisons linéaires

493/2001
Sciences.ch 14/03/2005

de différentielles). Nous avons, par exemple:

Si nous notons de manière générale les coordonnées sphériques, nous avons:

Les différentielles des coordonnées sont alors notées:

et les composantes s'écrivent alors de manière générale:

où les quantités sont des fonctions de qui vont être explicitement obtenues en
identifiant chaque composante . Par exemple, la composante s'écrit avec la notations
de la relation précédente:

Identifiant les coefficients des différentielles, il vient:

En procédant de même avec les neuf composantes , nous obtenons les vingt sept termes
. Pour un système de coordonnées curvilignes quelconques, ces quantités sont
appelées les "symboles de Christoffel de deuxième espèce".

Ainsi, pour un espace ponctuel et un système de coordonnées curvilignes quelconque,


la différentielle des vecteurs de la base naturelle s'écrit sur cette base:

Nous venons de voir, sur l'exemple des coordonnées sphériques, qu'un calcul direct permet,
par identification, d'obtenir explicitement les quantités . Nous allons voir que nous
pouvons également obtenir l'expression de ces quantités en fonction des composantes .

Le calcul des quantités en fonction des va nous amener à introduire d'autres symboles

494/2001
Sciences.ch 14/03/2005

de Christoffel. Pour cela, écrivons les composantes covariantes, notées , des différentielles
, soit:

Les composantes covariantes sont également des combinaisons linéaires des différentielles
que nous pouvons écrire sous la forme:

Les quantités sont appelées les "symboles de Christoffel de première espèce".

Nous voyons très bien en parcourant à nouveau la définition du symbole de Christoffel que :

et donc que :

Puisque les composantes covariantes sont liées aux composantes contravariantes par les
relations (contraction des indices) :

nous obtenons l'expression liant les symboles de Christoffel de chaque espèse:

Inversement:

Remarque: diverses notations sont utilisées pour représenter les symboles de Christoffel. Les
plus usuelles sont les suivantes:

- Symboles de première espèce:

- Symboles de deuxième espèce:

Considérons maintenant un espace ponctuel et soit un élément linéaire donné de cet


espace:

495/2001
Sciences.ch 14/03/2005

Partant de:

nous obtenons par différentiation:

L'expression des différentielles nous donne:

L'expression représente la composante covariante du vecteur soit compte tenu


des composantes contravariantes en fonction des symboles de Christoffel:

substituant la relation dans l'expression précédente, nous obtenons alors :

La différentielle s'écrit alors :

D'autre part, la différentielle de la fonction s'écrit également :

d'où en identifient les coefficients des différentielles dans ces deux dernières
expressions :

Comme nous avons :

Nous pouvons écrire l'avant dernière relation :

496/2001
Sciences.ch 14/03/2005

puis en effectuant une permutation circulaire sur les indices, nous obtenons :

En effectuant la somme :

et en retranchant :

En simplifiant il vient :

d'où :

C'est l'expression des symboles de Christoffel de première espèce en fonction des dérivées
partielles des composantes du tenseur fondamental. Nous obtenons ceux de deuxième
espèce à partir de la relation :

Les deux dernières expressions encadrées permettent le calcul effectif des symboles de
Christoffel pour une métrique donnée (d'où un énorme gain en calculs). Lorsque les quantités
sont données à priori, nous pouvons ainsi étudier les propriétés de l'espace ponctuel défini
par la donne de cette métrique, ce qui est le cas des espaces de Riemann que nous verrons plus
loin.

THÉORÈME DE RICCI

Nous avons vu dans le chapitre de mécanique relativiste que les géodésique sont les distances
les plus courtes entre deux points dans n'importe quel type d'espace. Ce qui va nous intéresser
maintenant, c'est d'étudier les variations d'un vecteur au cours d'un tel déplacement.

497/2001
Sciences.ch 14/03/2005

Rappelons d'abord que l'équation des géodésique pour un système de coordonnées curvilignes
quelconque de l'espace ponctuel (voir le chapitre des principes de la mécanique) est
donnée par (voir chapitre de mécanique relativiste) :

Considérons maintenant un vecteur de composantes covariantes et formons le produit


scalaires des vecteurs et , nous avons alors la quantité suivante :

Lors d'un déplacement le long de la géodésique, d'un point à un point infiniment voisin
, le scalaire subit la variation :

et comme :

d'où :

Remplaçons dans cette dernière expression, d'une part la différentielle de par sa


différentielle totale exacte :

et d'autre part, la dérivée seconde par son expression tirée de l'équation des
géodésiques. Nous obtenons :

qui peut encore s'écrire :

498/2001
Sciences.ch 14/03/2005

où nous avons posé :

qui sont par définition les "différentielles absolues" des composantes covariantes du vecteur
. Nous définissons également la "dérivée covariante" (appelée également "connexion") par
la relation :

Remarque : dans les ouvrages anciens ou américains ceci est souvent noté sous la forme (que
nous n'utiliserons aucunement sur ce site :

faisant donc usage du ";" pour noter la dérivée covariante et de la "," pour différentielle
partielle.

Puisque la dérivée du produit de deux fonctions est la somme des dérivées partielles, nous
avons alors aussi :

Si nous posons alors nous avons (résultat que nous utiliserons après avoir
démontré le théorème de Ricci pour déterminer le tenseur d'Einstein nécessaire à la relativité
générale) :

En coordonnées curvilignes, pour que la différentielle d'un vecteur soit un vecteur, il faut que
les deux vecteurs dont nous prenons la différence se trouvent en un même point de l'espace.
En d'autres termes, il faut transporter, d'une manière ou d'une autre, l'un des deux vecteurs
infiniment voisins au point où se trouve le second et , seulement après faire la différence des
deux vecteurs qui se trouvent maintenant en un seul et même point de l'espace. L'opération de
transport parallèle doit être définie de telle sorte que en coordonnées cartésiennes (pour le
petit exemple), la différence des composantes coïncide avec la différence ordinaire .

Ainsi, nous avons bien en coordonnées cartésiennes :

puisque dans ce système : .

499/2001
Sciences.ch 14/03/2005

Ainsi, en coordonnées curvilignes la différence des composantes des deux vecteurs après le
transport de l'un d'entre eux au point où se trouve l'autre est noté tel que nous ayons :

Ceci nous amène à :

Mais aussi à écrire le principe de moindre action (principe variationnel) sous la forme
tensorielle :

Considérons maintenant un tenseur d'ordre deux, produit de deux tenseurs d'ordre un tel que
(nous l'avons vu lors de notre étude des compositions de tenseurs) :

Donc :

d'où :

Ce qui nous amène à pouvoir écrire la métrique sous sa forme variationnelle :

Appelée "identité de Ricci". Mais nous avons aussi puisque :

d'où l'identité :

Avec les deux relations :

et

500/2001
Sciences.ch 14/03/2005

et la différentielle absolue (qui se généralise simplement pour un tenseur d'ordre deux) :

Nous avons :

Or, rappelons que nous avons par définition :

et

Donc finalement :

La différentielle absolue sur une géodésique dans l'approximation d'un transport infinitésimal
du tenseur fondamental est donc (comme nous pouvions nous y attendre) nulle. C'est le
"théorème de Ricci". Certains physicien théoriciens disent dès lors que "la dérivée covariante
tue la métrique" dans le sens où la métrique ne change pas sur un différentiel d'espace.

Finalement, nous voyons aussi que pour un tenseur d'ordre deux (la métrique en particulier)
nous avons :

Nous pouvons donc écrire la différentielle absolue qui dans ce cas particulier est nul :

et donc :

Remarque : il faudra se rappeler lors de la définition du tenseur d'Einstein que :

et

et qu'il s'agit d'un autre manière d'exprimer qu'un variation infinitésimale sur une géodésique
selon le principe de moindre action tue la métrique. Nous allons donc travailler à partir de
maintenant (comme avant déjà) avec des équations différentielles non nécessairement
linéaires qu'il faudra intégrer pour trouver le comportement de la matière dans un espace
donné.

Déterminons maintenant une expression qui nous sera très utile en relativité générale lorsque
nous déterminerons l'équation d'Einstein des champs :

501/2001
Sciences.ch 14/03/2005

Effectuons la multiplication contracté de l'avant dernière expression par , il vient en


utilisant la relation (que nous avions démontrée beaucoup plus haut que) :

d'où la relation :

Les quantités et représentant les mêmes sommes, nous avons alors :

Soit le déterminant des quantités . La dérivation du déterminant nous donne :

Démonstration :

Soit une variable quelconque que nous choisissons ici être le temps uniquement pour
simplifier les notations des calculs qui vont suivre. Lorsque la partie principale du
développement sera achevée, le résultat peut être adapter à tout autre variable et soit les
colonnes d'éléments de .

Pour les développements qui vont suivre, nous définissons les notations :

(2)

La règle de dérivation d'un déterminant fonctionnel est (voir chapitre d'algèbre linéaire) :

En considérant le premier déterminant, en faisant appel aux mineurs pour le développement


de sa première colonne :

Pour le terme , il vient :

Soit :

502/2001
Sciences.ch 14/03/2005

ou

Or, nous savons que : et sont des tenseurs métriques qui ont comme propriété
remarquable :

Ce qui nous permet d'écrire :

et donc :

Ce qui s'écrit également :

Nous pouvons adopter une autre variable. Soit cette autre variable :

et donc il s'ensuit le résultat que nous avions écrit avant cette démonstration.

Nous avons donc :

Donc finalement (selon les règles des dérivées intérieures) :

Cette relation ne veut pas dire grand chose tant que nous n'en ferons pas un usage plus
explicite lors de notre travail sur la relativité générale dans le chapitre de mécanique
relativiste.

Soit maintenant à déterminer la dérivée covariante seconde du tenseur métrique. Rappelons


que nous avant d'aller plus loin (car c'est important) que nous avions obtenu :

503/2001
Sciences.ch 14/03/2005

TENSEUR DE RIEMANN-CHRISTOFFEL

Rappelons que nous avons démontré plus haut que :

Cette relation exprime sauf erreur de la part du rédacteur de ces lignes…. la dérivée
covariante d'un tenseur d'ordre deux - tel que la métrique - sur un chemin géodésique dans
deux directions parallèles (la deuxième dérivée covariantes permettant de créer la
"perpendiculaires géodésique" entre les deux géodésique infiniment proches de la première
dérivée covariante). Nous appelons un tel déplacement : un "transport parallèle".

En y substituant :

Nous avons alors facilement :

Permutons maintenant les indices et dans l'expression précédente pour avoir une
différentielle par rapport à un autre chemin :

En admettant que les composantes vérifient les propriétés classiques , nous


obtenons par soustraction des deux expression précédentes :

Cette relation exprime le fait que, comme la gravité, la courbure de l'espace-temps cause une
accélération mutuelle entre les géodésiques. De plus, il est facile de constater, que
l'accélération mutuelle entre les géodésiques est nulle si les tenseurs de Riemann-Christoffel
sont nuls (typiquement en coordonnées cartésiennes, in extenso cela signifie pour un espace-
temps plat). C'est exactement ce que nous attendons de la gravité : si nous observons aucune
accélération, la courbure (nous allons de suite définir ce que c'est) est nulle et si la courbure
est nulle, nous n'observons aucune accéléréation. Morale de l'histoire : la gravité est courbure
et la courbure est gravité !!

Nous voyons que la quantité entre parenthèse est un tenseur d'ordre quatre que nous notons :

et qui résume à lui seul le transport parallèle et le fait que gravité et géométire de l'espace sont
liés. Le tenseur est appelé "tenseur de Riemann-Christoffel" ou "tenseur de l'espace

504/2001
Sciences.ch 14/03/2005

Riemannien". La courbure d'un espace Riemannien peut aussi être caractérisée à l'aide de ce
tenseur.

Si nous multiplions le tenseur par , nous avons alors les données covariantes de ce
tenseur tel que :

et soit les relations suivantes que nous avions démontrées :

Dès lors, il vient :

et remplaçons les quantités par . Nous obtenons alors :

Nous avions aussi démontré que :

D'où :

et comme :

Nous avons :

et nous avions aussi démontré que :

505/2001
Sciences.ch 14/03/2005

et ne les reportant dans l'avant dernière relation, nous obtenons :

Nous avons donc finalement pour l'expression covariant du tenseur de Riemann-Christoffel :

Il convient de remarquer que (c'est trivial par vérification sur la relation précédente) le tenseur
de Riemann-Christoffl est donc anti-symétrique :

Enfin, la permutation en bloc des indices et nous donne, par suite de la symétrie des
et en invertissant leur ordre de dérivation (trivial) :

Effectuons maintenant une permutation circulaire sur les indices dans l'expression :

il vient :

et nous avons alors (c'est très simple à contrôler… un simple addition) :

L'identité précédente est appelée "première identité de Bianchi". Par extension, il est trivial
que nous avons aussi (nous changeons les notations des indices afin d'être plus conforme aux
écritures habituelles en relativité générale) :

506/2001
Sciences.ch 14/03/2005

et par extension :

Rappelons qu'implicitement, cette relation exprime toujours simplement (si l'on peut dire…)
le fait que gravité et géométrie de l'espace sont liés ensembles..

TENSEUR DE RICCI

Avant de voir les conséquences de l'identité de Bianchi, nous avons besoin de définir le
tenseur de Ricci :

qui est donc la contraction des premier et troisième indices. D'autres contractions d'autres
indices pourraient aussi être possible mais parce que est anti-symétrique sur et
alors la contraction sur ces indices reviennent à avoir .

De manière similaires, nous définissons le scalaire de Ricci par la relation :

TENSEUR D'EINSTEIN

Appliquons une contraction à l'identité de Bianchi :

Rappelons que et de même par extension que . Donc finalement ceci


nous amène à écrire de par la propriétés des dérivées (produit en somme) :

et donc à obtenir :

En utilisant la propriété d'anti-symétrie du tenseur de Riemann-Christoffel, nous écrivons :

Ce qui revient finalement à écrire de par la définition du tenseur de Ricci :

507/2001
Sciences.ch 14/03/2005

Cette relation est appelée "identité de Bianchi contractée". Contractons cette relation encore
une fois :

Ce qui revient identiquement à écrire :

Ce qui équivaut à :

Comme , nous avons :

En montant l'indice par multiplication avec , nous obtenons :

Le tenseur d'Einstein qui est donc une constante dans un espace Riemannien donné est dès
lors défini par :

et exprime de la façon la plus courte qui soit, le transport parallèle.

Identiquement, nous pouvons obtenir la forme covariante :

Le tenseur est donc construit pour une métrique uniquement Riemannienne (ce qui fait
cependant quand même pas mal d'espaces possibles…), et est automatiquement non
divergent :

Nous retrouverons ce tenseur naturellement en relativité générale lorsqu'en faisant usage du


principe variationnel nous décomposerons l'action en deux termes :

508/2001
Sciences.ch 14/03/2005

1. l'action de la masse dans le champ gravitationnel

2. l'action du champ gravitationnel en l'absence de masse

En exprimant le tout dans un espace Riemannien nous obtiendrons alors la non moins
fameuse "équation d'Einstein" des champs (sans plus d'explication dans ce chapitre) :

Remarque : comme nous le voyons, nous pouvons très bien rajouter un terme constant à
l'expression du tenseur d'Einstein, sans que cela ne change la nullité de sa divergence. Ce fait,
utilisé en astrophysique, permet de construire des modèles d'Univers particuliers que nous
traitons dans le chapitre d'astrophysique.

509/2001
Sciences.ch 14/03/2005

CALCUL SPINORIEL

Comme nous le verrons en premier en physique quantique ondulatoire, les spineurs jouent un
rôle majeur dans la théorique quantique et en conséquence dans toute la physique
contemporaine (théorique quantique des champs, modèle standard, théorie des cordes,…).

Ce fut à partir de 1927 que les physicien Pauli, puis Dirac introduisirent les spineurs pour la
représentation des fonctions d'onde. Cependant, sous leur forme mathématique, les spineurs
avaient été découverts par Élie Cartan dès 1913 lors de ses recherches sur les représentation
des groupes en faisant suite à la théorie générale des espaces de Clifford (introduits par le
mathématicien W.K. Clifford en 1876). Il montra, comme nous le verrons, que les spineurs
fournissent au fait une représentation linéaire du groupe des rotations d'un espace à un nombre
quelconque de dimensions. Ainsi, les spineurs sont donc étroitement liés à la géométrie mais
leur présentation est souvent faite de manière abstraite sans signification géométrique
intuitive. Ainsi, nous allons nous efforcer (comme toujours sur ce site) dans ce chapitre
d'introduire de la manière la plus simple et intuitive possible les théorie des spineurs.

Le formalisme spinoriel n'intéresse pas seulement la mécanique quantique et ses travaux,


entre autres, de Roger Penrose ont montré que la théorie spinorielle était une approche
extrêmement féconde de la théorie de la relativité générale. Bien que le plus couramment
utilisée pour le traitement de la relativité générale soit le calcul tensoriel, Penrose a montré
que dans le cas spécifique de l'espace à quatre dimensions et la métrique de Lorentz, le
formalisme des spineurs à deux composantes est plus approprié.

La théorie des spineurs est extrêmement vaste mais ce site ayant plus pour objectif de
s'adresser aux physiciens, nous nous limiterons aux spineurs utiles en physique quantique
ainsi que leurs propriétés y relatives.

SPINEUR UNITAIRE

Nous allons donner ici un première définition (ou exemple) particulière des spineurs. Ainsi,
nous allons montrer qu'il est possible à partir d'un tel outil de représenter un vecteur d'un
espace à trois composantes à l'aide d'un spineur à deux composantes. La méthode est
extrêmement simple et celui qui a déjà la partie du chapitre de physique quantique ondulatoire
traitant de l'équation de Dirac et de la conditions de normalisation de Broglie y verra une
analogie grandiose.

Considérons la sphère suivante d'équation :

510/2001
Sciences.ch 14/03/2005

Considérons-y les coordonnées d'un point de la sphère de et de rayon unité et


notons et les points d'intersection de l'axe avec la sphère.

Le point a pour coordonnées . Nous obtenons une projection dite


"stéréographique" du point en traçant la droite qui traverse le plan équatorial
complexe au point de coordonnées .

Les triangles semblables et (avec étant la projection orthogonale sur l'axe


du point ) nous donnent les relations suivantes en appliquant le théorème de Thalès :

Remarque : les deux dernières relations s'obtiennent par application du théorème de Thalès
dans le plan équatorial complexe.

Posons maintenant . Il vient, compte tenu de la relation précédente


que :

en prenant le module au carré (voir les nombres complexes dans le chapitres des nombres) :

et comme nous avons finalement :

511/2001
Sciences.ch 14/03/2005

Mettons maintenant le nombre complexe sous la forme où sont deux


nombres complexes auxquels nous pouvons toujours imposer de vérifier la condition
d'unitarité :

Remarque : les nombres complexes suivant satisfont la relation précédente :

Rappelons avant de continuer que nous avons démontré lors de notre étude des nombres
complexes que :

Dès lors il vient :

d'où finalement :

Comme nous avons :

alors :

tenant compte des derniers développements nous avons finalement :

Ainsi, à tout point situé sur la sphère de rayon unité, nous pouvons faire correspondre un

512/2001
Sciences.ch 14/03/2005

couple de nombre complexes vérifiant la relation d'unitarité. Ce couple de nombres


complexes constitue par définition un "spineur unitaire". Ainsi, comme nous l'avons vu, un
spineur unitaire peut se mettre sous la forme :

de même un spineur quelconque peut se mettre sous la forme :

La projection stéréographique conduit donc à représenter certains vecteurs l'espace euclidien


avec des éléments d'un espace vectoriel complexe de dimension deux qui est l'espace des
spineurs.

Remarque : cette représentation n'est pas unique car les arguments de nombres complexes
sont (sous forme trigonométrique) déterminés qu'à une constante près.

Le lecteur qui aura déjà étudié un peu la physique quantique ondulatoire aura certainement
remarqué l'étrange similarité de la condition et des relations :

par rapport à la condition de normalisation de Broglie (l'intégrale sur tout l'espace de la


somme des produits des fonctions d'ondes complexes conjuguées sont égales à l'unité) et des
développement déterminant l'équation de continuité en physique quantique ondulatoire.

Voyons maintenant pour les besoins ultérieurs, que nous pouvons trouver deux nouveaux
vecteurs de l'espace euclidien , associés à un spineur unitaire déterminé sur la
sphère unité. Ces vecteurs seront cherchés orthogonaux entre eux et de norme unité, chacun
étant orthogonal au vecteur .

Notons et , les composantes respectives des vecteurs


sont bien sûr liés par le produit vectoriel :

d'où tenant compte de l'expression des composantes en fonction de celles du spineur


associé, ainsi que du fait , nous obtenons :

513/2001
Sciences.ch 14/03/2005

Ecrivant l'orthogonalité des vecteurs entre eux nous obtenons bien évidemment six équations
supplémentaires. Cependant l'orientation des vecteurs n'étant pas fixée, il existe une
certaine indéterminée sur les valeurs de leurs composantes. Choisissons des valeurs telles
que :

Prenant les quantités complexes conjuguées des relations précédentes, nous obtenons par
addition les composantes de :

Par soustraction, nous obtenons de même les composantes du vecteur :

Nous vérifions aisément que ces valeurs redonnent bien les relations du produit vectoriel. A
tout spineur unitaire nous pouvons donc associer trois vecteur . Nous pouvons
vérifier directement que les vecteurs ainsi calculés sont bien orthogonaux entre eux et de
norme unité.

PROPRIÉTÉS GÉOMÉTRIQUES

Nous allons étudier les transformations des vecteurs de associés à un spineur afin d'en
déduire les propriétés correspondantes de transformation du spineur. Les rotations dans
l'espace pouvant toujours s'exprimer sous forme du produit de deux symétries planes (faire
dans la tête l'expérience imaginaire), nous commençons par l'étude de ces dernières.

SYMÉTRIES PLANES

Considérons dans un premier temps la symétrie plane d'un vecteur :

Lors d'une symétrie par rapport à un plan , un vecteur quelconque se transforme en un


vecteur . Déterminons une matrice qui représente cette symétrie par rapport à ce plan.
Soit un vecteur unitaire normal au plan et soit le pied de la perpendiculaire
abaissée d'un point de l'espace sur la plan .

514/2001
Sciences.ch 14/03/2005

Soit le point symétrique de par rapport à , nous avons :

Soient les composantes cartésiennes de et les composantes


respectives des vecteurs , la relation précédente nous donne les relations linéaires :

La matrice qui fait passer du vecteur au vecteur a donc pour


expression :

Gardons en mémoire ce résultat et considérons à présent deux vecteurs ,


orthogonaux entre eux et unitaires, définissant comme nous l'avons vu un spineur unitaire
. Une symétrie par rapport à un plan transforme les vecteurs en vecteurs
auxquel est associé le spineur . Nous allons maintenant montrer que la
transformation suivante du spineur en spineur est :

(1)

et transforme précisément les vecteurs en vecteurs , ces vecteurs se déduisant


respectivement – comme nous allons le montrer – les uns des autres par une simple symétrie
plane et que la matrice représente bien la transformation cherchée.

515/2001
Sciences.ch 14/03/2005

La relation (1) nous donne donc :

En tout nous avons :

Nous en déduisons :

Par suite du fait que , nous obtenons :

Nous retombons donc bien sur la matrice de symétrie :

Ainsi, la matrice :

engendre donc la transformation d'un spineur en un spineur telle que les


vecteurs associées se déduisent respectivement de par une symétrie
plane.

ROTATIONS

516/2001
Sciences.ch 14/03/2005

Comme nous l'avons vu dans le chapitre de géométrie euclidienne, il est possible faire une
rotation d'un vecteur dans le plan ou dans l'espace à l'aide de matrices. De même, par
extension, il est évident que la multiplication de deux rotations est une rotation (c'est de
l'algèbre linéaire élémentaire – du moins nous le considérons tel quel).

Considérons dès lors, deux plans dont l'intersection engendre une droite (ligne) et
notons et des vecteurs unitaires portés par les normales respectives à
ces deux plans sécantes en :

Notons l'angle des vecteurs entre eux (la raison de cette notation provient de notre
étude des quaternions – voir le chapitre traitant des nombres dans la section d'arithmétique).
Soit le vecteur unitaire porté par la droite résultant de l'intersection des plans et tel
que :

Explications : sont unitaires mais pas nécessairement perpendiculaires et nous devons


quand même nous assurer que soit un vecteur unitaire (sa norme soit égale à l'unité donc).
Dès lors, la relation ci-dessus nous assure que :

Le produit vectoriel précédent nous donne pour les composantes de :

D'autre part, le produit scalaire s'écrit :

517/2001
Sciences.ch 14/03/2005

Remarque : nous allons nous servir des ces deux plans comme plans de symétrie pour nos
rotations

Comme nous l'avons fait remarquer précédemment, une rotation dans peut toujours se
faire avec au plus deux symétries planes. Ainsi, une rotation se noter par l'application
(multiplication) de deux matrices de symétrie selon les résultats obtenus plus haut :

Développant le produit des ces deux matrices et tenant compte de relations découlant du
produit vectoriel et scalaire nous obtenons :

Ainsi, nous pouvons écrire la transformation d'un spineur et un spineur à l'aide


d'une matrice de la forme :

dont les paramètres sont appelés sont appelés "paramètres de Cayley-Klein".

La matrice peut être écrite sous une autre forme si nous faisons un développement
limité pour des rotations infiniment petites (eh voilà la physique qui revient….).
Ainsi, les développement de MacLaurin nous donnent :

En utilisant seuls les termes du premier ordre, la matrice de rotation s'écrit finalement :

518/2001
Sciences.ch 14/03/2005

Cette matrice constitue le développement limité de la matrice de rotation au voisinage de la


matrice identité, cette dernière correspondant évidemment à la rotation nulle. Nous notons
cette dernière également sous la forme :

où la matrice est la matrice unité d'ordre deux et s'appelle la "matrice infinitésimale


de rotation". Maintenant, si nous posons dans nous obtenons :

Comment interpréter ce résultat ? Eh bien c'est assez simple, choisir , nous


donne un vecteur colinéaire à l'axe de . Dès lors, nous pouvons très bien nous
imaginer les plans générant l'axe qui porte . Comme (in extenso ) est généré
par les vecteurs perpendiculaires à et donc à , alors l'angle (ou sa variation)
représente une variation de la direction des plans normaux à qui par symétrie servent à
construire la rotation (rappelons que ne sont pas nécessairement orthogonaux entre eux).
Donc par extension, avoir ne permet plus que de faire des rotations
(symétries) autour de .

De même, une rotation autour de l'axe correspond à , ce qui donne :

et de même avec nous avons enfin :

Les matrices infinitésimales précédentes font donc apparaître de manière habile les matrices
suivantes :

Ces matrices sont appelées "matrices de Pauli" et nous les retrouveront en physique quantique
ondulatoire dans le cadre de notre étude de l'équation de Dirac et de la détermination de ses
solutions explicites (utilisant les spineurs).

En utilisant ces matrices de Pauli, la matrice de rotation infinitésimale peut finalement


s'écrire :

519/2001
Sciences.ch 14/03/2005

Définissons un vecteur ayant pour composantes les matrices de Pauli :

L'expression peut alors s'écrire sous forme d'une sorte de produit scalaire
qui représente une somme de matrices :

Le développement limité s'écrit alors :

La matrice de rotation :

peut à l'aide des matrices de Pauli s'écrire sous la forme remarquable :

Ce qui peut s'écrire aussi :

qui a donc la forme d'un quaternion de rotation d'angle et d'axe . D'où la raison d'avoir
depuis le début choisi la notation de .

Il est clair, pour que l'analogie avec les quaternions soit plus forte, que les matrices de
Pauli forment un ensemble de quatre matrices linéairement indépendantes ! Tel que la base
canonique pour les quaternions !

Remarque : si nous notons alors :

520/2001
Sciences.ch 14/03/2005

Cette matrice constitue comme nous en avons déjà fait mention, au développement limité de
la matrice de rotation au voisinage de la matrice identité, les composantes de étant
associées à un spineur dont la rotation se fait par la double symétrie définie par deux plans
dont l'intersection est définie par le vecteur .

PROPRIÉTÉS DES MATRICES DE PAULI

Le lecteur vérifiera aisément (si ce n'est pas le cas il pourra toujours nous contacter pour que
nous en rédigions les détails) les propriétés suivantes des matrices de Pauli :

P1. Unitarité :

P2. Anticommutativité : pour et

Les deux dernières propriétés nous donnent :

avec

P3. Cyclicité :

P4. Commutation :

P4. Produit vectoriel

Soit le carré des composantes de :

521/2001
Sciences.ch 14/03/2005

Ce qui conduit à écrire que :

Considérons maintenant les produits suivants :

Ce qui s'écrit :

Nous retrouvons donc ici les composantes du produit vectoriel

522/2001
Sciences.ch 14/03/2005

THÉORIE DES NOEUDS

René Descartes avait imaginé un système du monde, où l’Univers était animé par des
tourbillons. À la fin du siècle dernier, Tait et Thomson (plus connu sous le nom de Lord
Kelvin) ont ressuscité cette théorie, et interprété les liaisons chimiques en imaginant des
molécules nouées qui s’enlaceraient. Les développements ultérieurs de la physique et de la
chimie ont amené une autre théorie de la liaison chimique, fondée sur le partage d’électrons
entre les atomes (voir chapitre de chimie quantique). Mais le sujet des noeuds était lancé ;
dans certains domaines, les noeuds seront... le noeud du sujet.

Remarques : le dénommination "théorie des noeuds" qui c'est imposée dans la communauté
scientifique est assez malheureuse. Certains mathématiciens (francophones) ont choisi à juste
raison d'utiliser plutôt la dénommination "théorie des tresses et entrelacs" qui est plus
correcte..

Ainsi, en biologie moléculaire : la double hélice de l’ADN se surenroule, et ce


surenroulement joue un rôle important dans la réplication des gènes, et dans les phénomènes
viraux. La reptation des polymères est un autre exemple de théorie physique sérieuse où ces
idées jouent un rôle important. Les méthodes modernes de calcul en physique mathématique –
en mécanique statistique ou en physique des particules élémentaires – reposent sur un usage
important de méthodes inspirées de la théorie des noeuds.

La théorie mathématique des noeuds a été lancée par les travaux de Little et Kirkman, qui
cherchaient donc à donner un fondement aux idées physiques de Tait et Kelvin (voir plus loin
pour le détail de l'histoire). Les premières classifications des noeuds utilisaient une image
filiforme des noeuds, sans épaisseur, et une projection plane, comme l’ombre portée sur un
écran. Un des caractères immédiatement perceptibles concerne les croisements où nous
distinguons le brin au-dessus et le brin au-dessous. Les cannages, ou les tressages de bandes,
reposent ainsi sur la considération des croisements, et le nombre de tels croisements sera le
premier élément de classification.

Une première difficulté apparaît alors : un noeud est un objet géométrique à trois dimensions,
et nous utilisons une représentation plane obtenue en projetant le noeud sur un plan. Il existe
alors de nombreux points de vue possibles, et diverses apparences d’un même noeud. Deux
noeuds de projections différentes sont-ils distincts (non isotopes) ? Dans la première table
publiée (celle de Tait et Little) le nombre minimal de croisements est utilisé comme principe
de classification (jusqu’à dix croisements) et il fallut presque un siècle pour détecter une
duplication : deux noeuds identiques avaient été pris pour différents.

Avec le temps et les efforts des mathématiciens, trois points de vue mathématiques essentiels
pour l’étude des noeuds se sont dégagés :

1. Topologique, où le noeud est conçu comme la réunion d’un nombre fini de courbes
fermées, à déformations près.

2. Algébrique, où l’on dénombre des croisements par exemple, et où l’on associe les groupes
aux nœuds.

3. Géométrique, où l’on tient compte de la forme du noeud, en mesurant longueurs ou angles ;


en particulier, l’idée de nombre de rotations apparaît sous la forme de vrillage et de nombre
d’entrelacements, et ces notions sont fondamentales pour l’étude des ADN en biologie

523/2001
Sciences.ch 14/03/2005

moléculaire.

L’articulation entre ces points de vue est délicate. Il y a des évidences difficiles à prouver
rigoureusement – qu’on songe au théorème de Jordan qui affirme qu’une courbe fermée
plane, sans croisement, délimite un intérieur et un extérieur ! Il a fallu presque deux siècles
pour définir correctement la notion de courbe, et il y a des nœuds sauvages à écarter avant
toute classification. Il faut du soin pour définir correctement les déformations des noeuds, que
le mathématicien appelle "isotopies".

L’idée mathématique la plus efficace pour l’étude des noeuds est celle "d’invariant". Un
invariant d’un noeud est une caractéristique qui reste inchangée lors d’une déformation. Si
nous disposons d’un invariant, nous pouvons affirmer que deux noeuds sont vraiment
différents quand l’invariant ne prend pas la même valeur pour les deux noeuds. Mais si deux
noeuds ont le même invariant, nous ne pouvons affirmer qu’ils sont du même type
(déformable l’un en l’autre). Il faudrait pour cela disposer d’un système complet d’invariants.
Le mathématicien russe V. Vassiliev a introduit en 1990 une classe nouvelle d’invariants ; il
reste à les rendre explicitement calculables et à prouver qu’ils forment un système complet,
comme on le pense généralement.

Henri Poincaré a introduit vers 1900 la notion de groupe fondamental d’un espace, qui décrit
les possibilités de parcours avec retour au point de départ. Appliqué à l’espace extérieur à un
noeud, cela fournit le "groupe du noeud" et le polynôme d’Alexander qui lui est lié.

La même construction appliquée à ce qu’on appelle l’espace de configuration donne une


définition efficace des groupes de tresses. Ces groupes ont été introduits, sous une forme
intuitive, vers 1920, par le mathématicien viennois Emil Artin, un des pères de l’algèbre
moderne. Dès 1937, le mathématicien russe Markov relie les nœuds et les tresses, et donne
une méthode théorique pour définir, au moyen des tresses, des invariants des noeuds.

Il y a 15 ans, les groupes de tresses étaient une curiosité et leur complexité était rebutante.
Puis, brusquement, ils sont devenus un thème central de la recherche scientifique. Donnons
une idée de la diversité des points de vue qui mènent aux groupes de tresses :

1. En géométrie, le mathématicien russe Vladimir Arnold a classifié sous le nom de


"catastrophes" des singularités de configurations géométriques, qui amènent aux espaces de
configuration.

2. En algèbre, plus précisément dans la théorie des groupes, deux avatars des groupes de
tresses (les groupes de Coxeter et les algèbres de Hecke) jouent un rôle central.

3. En mécanique statistique, l’étude des modèles exactement résolubles se fait grâce à


l’emploi des relations de Yang-Baxter et des groupes quantiques ; le lien avec les groupes de
tresses est profond.

4. La physique à deux dimensions a pris récemment beaucoup d’importance, et on en attend


un modèle de la supraconductivité à haute température. La classification usuelle des particules
en fermions et bosons se complique à deux dimensions. La notion nouvelle est celle d’anyon,
dont le modèle mathématique est lié aux groupes de tresses.

5. La théorie quantique des champs est le modèle mathématique des particules élémentaires.
Edward Witten a fait le pont entre cette théorie et les groupes de tresses, via le polynôme de

524/2001
Sciences.ch 14/03/2005

Jones.

La théorie des noeuds constitue ainsi une interface très active entre physique et
mathématiques. Les noeuds et les tresses fournissent aujourd’hui un outil de modélisation
efficace de la physique des polymères aux cristaux liquides, en passant par la biologie
moléculaire. Dans la direction opposée, les idées importées de la physique ont déclenché une
révolution en mathématiques : d’un sujet un peu marginal il y a encore 15 ans, la théorie des
nœuds est devenue aujourd’hui l’un des grands chantiers mathématiques.

NŒUDS DE TAIT

L'objectif principal de la théorie des nœuds est de classifier tous les nœuds et trouve son
origine dans la physique au début du 19ème siècle comme nous en avons déjà fait mention.
Pourquoi ?

Rappelons qu'à cette époque, les atomes étaient un mystère : pourquoi ceux-ci semblaient-ils
indestructibles et pourtant existant en tellement de variétés et capables de se combiner pour
donner d'innombrables autres composants ?

A cette époque, les plus belles équations de la physique (qui sont souvent de bons candidats
pour expliquer des choses que nous ne comprenons pas…) étaient les équations de Maxwell,
il était alors naturel (ou tentant) pour les physiciens d'essayer d'expliquer la mécanique
atomique en terme d'électromagnétisme, même si nous savons aujourd'hui que cette voie était
destinée à l'échec. Plus tard au milieu du 19ème, les ondes électromagnétiques étaient
largement conceptualisées comme des vibrations d'un milieu appelé à l'époque "éther
luminophore". Le référentiel de cet éther était alors défini (ou du moins supposé) comme étant
un référentiel absolu. Mais seulement… plus tard, les expérimentateurs Michelson et Morley,
montrèrent que le mouvement relatif de notre planète dans cet éther était indétectable (et
même pire… ils mesurèrent la constance absolue de la vitesse de lumière!). Leurs expériences
amenèrent par ailleurs Einstein et Poincaré a développer leur fameuse théorie de la relativité
restreinte (voir chapitre de mécanique relativiste)..

Il était alors à l'époque très gênant de travailler avec le concept suivant : il y a avait des ondes
sans rien qui ondulait ! Ceci du au fait, qu'à l'époque, les physiciens avaient fortement
tendance à comprendre l'électrodynamique avec des analogies mécaniques. Maxwell, par
exemple, a passé pas mal de temps à conceptualiser les champs électriques et magnétiques en
terme de "tubes fins, de section variable, transportant un fluide incompressible". Une raison
pour cela était la forme des équations de Maxwell dans le vide (voir le chapitre
d'électrodynamique) :

ce qui est, il est vrai, similaire à la mécanique des fluides (voir chapitre du même nom) où
nous avons pour un fluide incompressible sans viscosité et sans tourbillons :

Plus généralement, dans le cas où la rotationnel est non nul, Helmoltz montra en 1858
que les lignes de champ du vortex – définies par les lignes de - se déplacent dans la
direction de comme si elles avaient une existence propre (alors là c'est la brèche ouverte

525/2001
Sciences.ch 14/03/2005

bien évidemment…!). Ces lignes ne pouvaient avoir de fin mais pouvaient former des
boucles. En 1867 le mathématicien P. G. Tait (assistant de Hamilton et un champion des
quaternions) trouva une méthode ingénieuse pour démontrer cet effet en coupant un trou
circulaire dans une boîte, en remplissant celle-ci avec de la fumée, et en expulsant ensuite la
fumée par compression de l'air dans la boîte formant ainsi des cercles de fumée. Il montra par
ailleurs ceci a son ami Kelvin qui nota l'analogie avec l'électromagnétisme et proposa une
théorie dans laquelle les atomes étaient des vortex (nœuds) dans l'éther ! Il émit l'hypothèse
que les différentes types d'atomes correspondaient a différents types de vortex noués (oui c'est
un peu tiré par les cheveux mais bon…) ! Tait essaya par la suite de classifier les lignes
nouées en accord avec le nombre d'entrelacements quand celles-ci sont projetées sur un plan.
La liste que Tait obtint dans un premier temps fut les nœuds suivants (dans l'espoir d'obtenir
la tableau périodique des éléments version "éther"…) :

526/2001
Sciences.ch 14/03/2005

Remarque : ce tableau est très important nous y ferons très souvent référence lors d'exemples
applicatifs en utilisant la nomenclature qui y est proposée.

La beauté de cette théorie des "atomes vortex" résidait dans le fait qu'il était en accord avec
l'aspect continu du monde merveilleux des fluides, ou aux équations de Maxwell par
extension, pour discrétiser les différentes types d'atomes. Un difficulté cependant avec cette
théorie était la remarquable stabilité des atomes. En 1905 Kelvin admit qu'après de
nombreuses années d'échecs à tenter de prouver que le mouvement des cercles de Helmoltz
était stable, que la conclusion était que ces cercles étaient essentiellement instables et devaient
donc se dissiper. Curieusement c'est cette stabilité extrême des atomes qui fut une des pièces

527/2001
Sciences.ch 14/03/2005

du puzzle pour construire la physique quantique corpusculaire.

De plus, avec la théorie de la relativité, le concept d'éther cher à Maxwell et ses


contemporains, en particulier en ce qui concerne la théorie des nœuds, devint synonyme d'un
concept inutile et avec en plus la théorique quantique la théorie des atomes vortex fut
complètement oubliée. La théorie des nœuds ressurgit à cause de quelques conjectures que
Tait ne fut pas capable de démontrer (nous y reviendrons) qui le furent seulement dans les
années 1980 dans un tournant hasardeux de la physique théorique.

Ce que les physiciens abandonnèrent intrigua et continue d'intriguer les mathématiciens. La


question de base restant la même : comment pouvons nous dire que deux nœuds sont
"isotopes" (nous définirons plus loin de quoi il s'agit). Cette question est intimement reliées
aux fameuses conjectures de Tait. Pour attaquer ces conjectures et les questions basiques de
ressemblance des nœuds, les topologistes ont développé les "nœuds invariants". Un exemple
d'un nœud invariant connu et ayant eu beaucoup de succès sont les polynômes d'Alexander
découverts par J. W. Alexander en 1927. Ainsi, si les polynômes de deux nœuds sont
différents, ceux-ci ne sont alors pas isotopes. Malheureusement, il existe quelques noeuds
ayant des polynômes d'Alexander équivalents et qui sont pourtant non isotopes…

La théorie mathématique des noeuds se développe alors pendant une cinquantaine d’années et
était un peu tombée en désuétude lors du coup de tonnerre de la découverte par Jones en 1984
d’un nouvel invariant des noeuds (le polynôme de Jones). La découverte de Jones est assez
exemplaire du point de vue scientifique et peut donner lieu à méditation sur l’organisation
actuelle de la science. Jones n’était pas du tout un spécialiste des noeuds. Il s’intéressait à la
classification des facteurs dans les algèbres de Von Neumann (analyse fonctionnelle). Il a
obtenu des algèbres de matrices dont les relations de commutation (équations de Yang-
Baxter) étaient proches des relations du groupe de tresses ; des tresses aux noeuds, il n’y a
qu’un pas qu’il a franchi avec l’aide de Joan Birman qui est une spécialiste des noeuds. Nous
assistons ensuite à une explosion de découvertes : version purement combinatoire, nouveaux
polynôme, etc.. En 1989, Witten montre que le polynôme de Jones peut être obtenu à partir de
la théorie quantique des champs au moyen d’une intégrale de Feynman, donnant ainsi la
première définition n’utilisant pas les projections planes du noeud. D’une certaine fa¸con la
théorie de Jones-Witten est une extension non commutative du travail de Gauss. Le groupe de
Lie (voir le chapitre de théorie des ensembles) qui intervient en magnétisme est U(1) , alors
que l’invariant de Witten est une intégrale de Feynman sur un espace de SU(2)-connections.

FORMALISATION MATHÉMATIQUE

Un noeud est modélisé mathématiquement par une application injective, différentiable et dont
la dérivée ne s’annule pas, du cercle dans l’espace orienté de dimension 3. Un problème
central est de pouvoir décider de façon calculable si le noeud est trivial (peut se défaire sans
couper la ficelle...) ou non (ce problème n’est pas résolu). Nous associe au noeud des objets
mathématiques calculables (polynômes, nombres) appelés "invariants du nœud" et qui sont
insensibles à une déformation du noeud ; si l’invariant n’est pas égal à celui du noeud trivial,
on est sûr que le noeud n’est pas trivial. Le problème est donc de trouver des invariants assez
fins. On en décrirons deux :

1. Le nombre d’entrelacement (de 2 noeuds) du à Gauss et qui intervient en


électromagnétisme

2. Le polynôme de Jones (introduit dans les années 85 par Vaughan Jones médaille Fields
1990), qui est assez subtil pour distinguer par exemple le noeud de trèfle droit du gauche.

528/2001
Sciences.ch 14/03/2005

Nous décrirons aussi une classe générale d’invariants : les invariants de type fini ou de
Vassiliev. Ces invariants définis de façon assez peu constructive sont peut-être des invariants
complets, mais nous ne le savons pas à ce jour. Nous décrirons le nombre d’entrelacement de
2 noeuds comme un invariant combinatoire calculable à partir d’un diagramme des noeuds.
Nous écrirons ensuite la formule intégrale classique liée au magnétisme (Gauss) pour le
calculer. Nous ferons alors un petit détour par la géométrie différentielle globale des courbes
de R3 pour montrer la formule de White qui relie 3 invariants géométriques associés à un
ruban. Nous décrirons ensuite les nouveaux invariants polynomiaux d’un point de vue
combinatoire. Le point de vue intégrales de Feynman sera évoqué.

Vassiliev a introduit une famille générale d’invariants qui contient la plupart des invariants
connus et dont nous pouvons dire qu’ils sont de type fini ; nous en décrirons le principe.

Remarque : nous avons délibérement choisi de ne pas énumérer un certain nombre de


définitions (aussi nombreuses qu'en théorie des graphes) que le lecteur pourra trouver
facilement dans littérature ou sur Internet (comme les mouvements de Reidemeister qui ne
servent formellement à rien!). Nous nous permettons de le omettre dans le sens qu'elle ne
nous seront pas utiles dans l'application de la théorie des noeuds en physique quantique des
champs (et que mis à part pour ceux qui aiment faire de petis dessins elles sont inutiles).

Définitions :

D1. Un nœud peut-être défini (car il existe plusieurs définitions possibles et certaines ont de
petits aléas assez embêtants...) par l'image du cercle noté par une application continue (la
ficelle étant supposée telle quelle), injective (ceci évitant que la ficelle rentre dans elle-
même) :

autrement dit, c'est une courbe sans point double, tracée dans l'espace euclidien de dimension
trois.

Un nœud est donc représenté par une application injective (imposer des
nœuds de classe permet d'éviter d'avoir des courbes trop… sauvages) vérifiant que
(nœud fermé). L'image de f est parfois appelée "support du nœud f" : c'est la
réalisation "physique" du nœud dans l'espace.

Remarque : l'ensemble des nœuds sera noté par la lettre N

D2. Nous disons qu'un nœud est un "nœud trivial" si l'application f qui le définit se prolonge
en une application du disque continue et toujours injective : un nœud trivial est
donc un nœud qui bord un disque plongé de .

D3. Deux nœuds sont équivalents s'il existe une application continue :

telle que et . Reste donc à trouver F qui est une courbe dans l'espace des

529/2001
Sciences.ch 14/03/2005

courbes.

Pour résumer grossièrement..., un nœud est une ficelle dont nous avons soudé les deux
extrémités.

D3. Le d'un nœud K est le nombre entier naturel représentant le nombre minimum de
croisements pour tout diagramme d'un type de nœud (c'est une mesure naturelle de
complexité).

Exemples : le nœud à un nul. Il n'existerait pas de nœuds avec un


est à un ou à l'unité. Une preuve consiste à énumérer tous les diagrammes possibles avec un
ou deux croisement et de voir que ceux sont au fait sont des nœuds équivalents de type ou
des entrelacs. Le trèfle (nœud ) a un .

D4. L'image miroir d'un nœud K est obtenu par réflexion sur un plan dans R3. Le nœud K
peut-être construit par inversion des croisement du diagramme du nœud :

Nous pouvons acilement nous en convaincre en prenant une réflexion en pliant la page de
lecture ou encore mieux… en s'équipant du matériel adéquat et d'un mirroir (...).

Exemple : Avec le nœud ("trèfle gauche" et "trèfle droite") :

D5. Deux nœuds sont dits "isotopes" si nous pouvons passer de l’un à l’autre par des
manipulations continues (le trèfle gauche et le trèfle droit ne sont par exemple pas isotopes !)
et il s'agit du problème numéro 1 de la théorie des noeuds : détecter les noeuds isotopes.

D6 Deux nœuds sont dits "équivalents" s’ils sont isotopes ou si l’un est isotope à l’image de
l’autre dans un miroir. D’après ce qui précède, chaque noeud est donc forcément équivalent à
sa propre image-miroir mais seuls les noeuds réflexifs sont isotopes à leur image dans un
miroir. Le noeud en huit est un bon exemple de ce genre de noeuds, noeuds par ailleurs
assez rares :

530/2001
Sciences.ch 14/03/2005

D7. Un "entrelac" est une sous-variété (voir chapitre de géométrie différentielle) compacte
(voir chapitre de topologie), de classe et de dimension 1. Le "nombre de composantes
connexes" de est noté . Si nous disons que E est un nœud.

La plupart du temps les entrelacs seront orientés ("orientés" dans le même sens que les
graphes orientés – voir chapitre de théorie des graphes), et nous identifierons les entrelacs
isotopes. Nous représentons donc les entrelacs dans le plan en les projetant et en spécifiant le
type de points de croisement.

Exemple : entrelacs à trois composantes connexes et nœud de trèfle.

Les isotopies permettent de "déméler" les entrelacs. Elle donnent dans le plan trois types de
mouvements particuliers appelés "mouvements de Reidemeister" :

531/2001
Sciences.ch 14/03/2005

Théorème : deux entrelacs sont isotopes si et seulement si nous pouvons passer de l'un à
l'autre par une suite finie de mouvements de Reidemeister.

Démonstration : à faire avec un lacet….

D8. Trois entrelacs sont dits "associés" (ou "en association") s'ils ne diffèrent qu'en
un point de croisement et qu'en ce point ils sont dans une des configurations suivantes :

Nous notons l'ensemble des classes d'entrelacs et nous nous intéressons désormais à des
fonctions où A sera un anneau commutatif (le lecteur n'oubliera pas que nous
avons vu que les coefficients de polynômes sont des éléments d'un anneau).

Remarque : il faut aussi se rappeler qu'un nœud est une courbe et que toute courbe peut être
représentée par un polynôme d'où l'idée !

D9. P est dit "invariant par association" (par association des entrelacs...) si et s'il
existe inversibles (!) tel que pour tout triplet d'entrelacs associées
nous ayons :

Nous pouvons déjà démontrer de façon assez élémentaire que si un tel polynôme existe, alors
il est uniquement déterminé par les coefficients de la relation précédente. Nous résumons cela
dans le théorème suivant

Théorème : si P est invariant par association, alors il est uniquement déterminé par les
coefficients .

Démonstration :

Remarquons d'abord que :

où désigne le nœud composé de r cercle démêlés. En effet, la relation et la


propriété d'invariance de P appliquée aux entrelacs suivants :

532/2001
Sciences.ch 14/03/2005

donne :

Nous obtenons alors :

Ainsi, par récurrence sur nous obtenons :

En d'autres termes, la fonction P peut s'exprimer uniquement par ses coefficients !!! Donc
nous pourrions maintenant essayer de voir si un nœud plein d'entrelacs peut être toujours se
ramener à des de manière récursive.

Remarque : il fallait y penser cependant….

REPRÉSENTATION PLANAIRE

Nous supposons que le nœud est dans l'espace euclidien de dimension trois orienté. Nous
nous intéressons aux projections de ce nœud sur le plan . Il est claire intuitivement que
nous pouvons supposer que nœud n'a aucune tangente verticale et que les points de
croisement sont seulement doubles et transversaux. Une telle projection sera appelée "bonne
projection".

Nous indiquons ensuite à chaque point de croisement quel est le brin qui passe au-dessus de
l'autre. Un tel dessin représente un nœud de façon non ambiguë : nous disons que nous avons
un "diagramme de nœud". Bien sûr, deux nœuds équivalents ont des bonnes projections qui
donnes des diagrammes de nœuds différents en général (c'est là que réside une des difficultés
aussi) Il est donc important de pouvoir lire l'équivalence de deux noeuds directement sur leurs
diagrammes. Un diagramme du nœud du trèfle droit :

533/2001
Sciences.ch 14/03/2005

Remarque : Le noeud de trèfle est le noeud ayant le nombre minimal de croisements, à savoir
3 ; il en existe en fait deux, énantiomorphes (images l'un de l'autre par réflexion). Il s'agit au
fait d'un simple noeud dont on a soudé les extrémités. Le noeud de trèfle est enfin le bord d'un
ruban de Möbius à 3 demi-torsions ainsi que le noeud torique d'ordre (3,2) (3 enroulements
autour du tore, sur deux tours), ainsi que celui d'ordre (2,3).

Comme un dessin n'est pas forcément facile à transmettre, ni à mettre dans un ordinateur,
nous pouvons aussi donner un codage du diagramme du nœud par une matrice à cœfficients
entiers à trois lignes et dont les nombre de colonnes est égal au nombre de points doubles.

Nous numérotons les 2n points de croisement sur la courbe fermée (cercle) dans l'ordre où ils
arrivent. Nous remarquons que les paries sont toutes formées d'un nombre pair et d'un nombre
impair. Nous fabriquons alors les deux premières lignes de la matrice en mettant dans chaque
colonne les deux numéros donnant la même projection : les impaires sur la première ligne, les
pairs sur la seconde. Nous ajoutons alors à chaque colonne, un qui indique l'orientation
des 2 brins (orienté) (+1 si celui de dessous traverse de droite à gauche quand nous
parcourons celui de dessus, -1 sinon). Par exemple, la matrice associée au noeud de trèfle de
la figure précédente est :

534/2001
Sciences.ch 14/03/2005

TRIGONOMÉTRIE

La trigonométrie fait partie intégrante de la science de la géométrie. Cette première ayant pour
racine "mesure de la terre" la trigonométrie a pour racine "mesure des corps a trois angles
(trigone)".

Remarques :

R1. Il existe actuellement trois trigonométries connues (définies) couramment utilisées en


mathématique : la trigonométrie du cercle, la trigonométrie hyperbolique et la trigonométrie
sphérique (nous ne traiterons pas ici des trigonométries quatratique et rhombique qui sont
utilisées par les électroniciens et qui n'ont peu voir pas d'intérêt en physique théorique). Nous
proposons dans le présent texte une tentative d'approche rigoureuse de toutes les relations les
plus connues dans ce domaine.

R2. Nous avons eu beaucoup de mal à choisir ou placer les trigonométrie dans l'étude des
mathématiques. Effectivement, certains mathématiciens définissent les fonctions
trigonométriques à partir des nombres complexes et un autre problème vient aussi du fait que
la trigonométrie utilise des concepts de la géométrie plane et spatiale. Il faut donc que le
lecteur jongle un peu avec les différentes sections du site pour avoir une présentation
rigoureuse de tous les concepts. C'est cet état de fait qui nous a amené finalement a consacrer
un chapitre seul à la trigonométrie.

R3. Le lecteur qui chercherait la démonstration des dérivées et intégrales des fonctions
trigonométriques définies ci-après devra se reporter au chapitre de calcul différentiel et
intégral où les dérivées et intégrales des fonctions usuelles que nous pouvons trouver dans les
formulaires sont toutes démontrées.

RADIAN

Quand nous parlons de trigonométrie, la première chose qui devrait venir à l'esprit et
s'imposer comme tel comme standard de mesures d'angles plans (voir le chapitre de géométrie
plane pour la définition du concept d'angle) est la notion de "radians".

Définition : 1 radian (noté [rad]) est l'angle plan décrit par une sécante à un cercle, passant par
son centre, tel que l'arc de cercle ainsi défini par l'axe horizontal passant par le centre du
cercle et la sécante soit d'égale longueur au rayon de ce cercle.

Par exemple, pour un cercle de rayon donc de circonférence (ou périmètre )


la longueur de l'arc de cercle définit par une sécante ayant une angle de 1 radian par
rapport à l'horizontale passant par le centre du cercle sera égale à 1.

Dès lors il vient que l'angle pour "un tour" du cercle sera de :

L'exemple précédent se généralise à un cercle de rayon quelconque car l'angle pour un tour

535/2001
Sciences.ch 14/03/2005

complet sera toujours et pour un demi-tour de pour un quart de


Malheureusement dans les écoles, les professeurs du primaire apprennent encore aux enfants à
mesurer les angles en degrés. Heureusement la conversion à faire n'est pas trop difficile…
(c'est une simple règle de trois).

Soit la mesure d'un angle en radians, la mesure du même angle en degrés et les
mesure du même angle en grades (vieille unité) nous avons évidemment par définition :

Les astronomes et astrophysiciens aiment bien parler en minutes ou secondes d'arc tel que :

(minutes d'arc) (secondes d'arc)

TRIGONOMÉTRIE DU CERCLE

Soit la figure ci-dessous représentant un cercle quelconque centré à l'origine dans une base
directe :

De par l'application du théorème de Pythagore, nous y avons:

avec étant le rayon du cercle.

A partir de cette représentation, nous pouvons définir des êtres mathématiques nommés
"fonctions trigonométriques" telles que (pour les plus importantes):

536/2001
Sciences.ch 14/03/2005

Remarque : lisez "cosinus" pour "cos", "sinus" pour "sin", "tangente" pour "tan", "cotangente"
pour "ctg", "sécante" pour "sec", "cosécante" pour "csc".

A partir des ces fonctions, nous pouvons faire des combinaisons et tirer des relations
remarquables très simples mais dont l'utilité profonde est discutable (et qui sont très peu
utilisées) telles que :

Dont voici un superbe schéma qui résume le tout :

Propriétés :

P1. Si nous nous plaçons dans l'étude du cercle dit "cercle trigonométrique", il faut poser pour
les définitions ci-dessus . Ainsi, apparaît plus nettement le sens physique de ces
définitions et il en découlera une nombre de propriétés et d'applications directement
exploitables dans la physique théorique et la mathématique pure.

Effectivement, si nous avons trivialement:

et en appliquant le théorème de Pythagore (voir le chapitre traitant des théorèmes):

537/2001
Sciences.ch 14/03/2005

d'où:

P2. Si est un réel, et , les réels et sont associés au même point de


par la périodicité du cercle trigonométrique. En effet, et sont deux mesures du
même angle orienté. Ainsi :

idem pour toutes les fonction trigonométrique qui découlent de la définition des fonctions
sinus et cosinus.

P3.

Par définition, sinus et le cosinus de tout nombre réel font partie de l’intervalle . Plus
précisément, la position de nous permet d'en savoir plus sur le cosinus et le sinus de .
Ainsi :

Il existe également une autre représentation des fonction trigonométrique du cercle, un peu
plus technique au sens visuel mais assez important pour bien comprendre, plus tard, la

538/2001
Sciences.ch 14/03/2005

mécanique ondulatoire :

Nous avons vu au début de ce chapitre, que de par la définition des fonctions


trigonométriques nous avons :

et également:

De façon exactement identique nous démontrons que:

A partir de ces dernières relations nous tirons sans trop de peine que:

identiquement nous aurons :

par le raisonnement inverse nous tirons tout aussi facilement que:

539/2001
Sciences.ch 14/03/2005

et

Il vient également sans difficultés en observant le cercle trigonométrique que:

Voici les schémas qui résument la manière d'analyse de quelques de ces propriétés (pour les
autres relations, la méthode est dentique):

RELATIONS REMARQUABLES

Le dessin ci-dessous va nous permettre d'établir des relations qui permettront de résoudre des
équations impliquant des fonctions trigonométriques (toutes ces relations sont de première

540/2001
Sciences.ch 14/03/2005

importance en physique pour la simplification de la résolution de problèmes).

Nous noterons sur le schéma la relation suivante:

Donc:

En résumé:

Ce qui implique trivialement si :

et d'où:

Nous avons également:

d'où:

Ce qui implique trivialement si :

Avec la relation déjà démontrée nous obtenons également les relations


très importantes:

541/2001
Sciences.ch 14/03/2005

Relations avec lesquelles nous obtenons très facilement:

et d'où:

Nous avons aussi:

Ceci, pour en arriver à la relation:

qui implique:

et évidemment:

d'où:

Nous obtenons également de manière triviale des relations précédentes (nous faisons un petit
mélange et nous secouons…):

et

542/2001
Sciences.ch 14/03/2005

Nous avons aussi :

avec :

d'où :

de manière similaire nous obtenons :

avec :

d'où :

Déterminons maintenant les formules trigonométriques complémentaires. Soit les relations


déjà démontrées précédemment:

(1)

(2)

Posons et d'où et .

Nous obtenons par sommation de (1) et (2):

543/2001
Sciences.ch 14/03/2005

et par différence:

De la même manière nous obtenons :

et par différence:

et inversement nous retombons très facilement sur les relations:

THÉORÈME DU COSINUS

Démontrons encore le théorème du cosinus, utile en géométrie:

Dans un triangle quelconque, le carré d'un des deux côtés est égal à la somme des autres
diminués du double produit de ces deux côtés par le cosinus de l'angle compris entre eux :

544/2001
Sciences.ch 14/03/2005

Démonstration:

mais dans le triangle , rectangle en , nous avons la relation d'où:

Nous obtenons donc une des relations du "théorème du cosinus":

Par permutation circulaire, nous obtenons les deux autres relations connues.

THÉORÈME DU SINUS

Si nous nous imaginons un simple triangle rectangle de cotés et d'angles de sommets


inscrit dans un cercle de façon à ce que chacune de ses extrémités y soit tangent (ce
que nous nommons un triangle rectangle "inscrit" habituellement…). Nous avons dès lors
trivialement (c'est vraiment trop simple pour que nous en fassions la démonstration - à moins
qu'il y ait une demande dans ce sens de la part du lecteur):

Cet ensemble d'égalités est appelé "théorème du sinus". Dans les formulaires, ce théorème est
souvent donné sous la forme :

Evidemment, il n'y a pas ici toutes le relations trigonométriques existantes comme nous
l'avons déjà dit, mais au moins les plus importantes qu'il faut savoir retrouver lors de l'étude
de systèmes physiques.

TRIGONOMÉTRIE HYPERBOLIQUE

Nous avons démontré en analyse fonctionnelle que toute fonction peut se décomposer

545/2001
Sciences.ch 14/03/2005

en un fonction paire et impaire tel que :

Ainsi, pour la fonction , nous obtenons :

Rappelons lors de notre étude des nombres complexes que nous avions démontré que :

Nous définissons alors par analogie le sinus et le cosinus hyperbolique (nous démontrerons la
provenance de ce terme plus loin) par :

et nous pouvons donc écrire :

Relation que nous pouvons à nouveau mettre à nouveau en analogie avec :

Remarque : chose intéressante, nous pouvons travailler en trigonométrie avec des angles
complexes. Effectivement, si nous posons , nous avons alors :

Or :

Donc :

Donc la fonction hyperbolique d'un angle complexe existe et l'image en est un nombre
complexe aussi. Nous pouvons ainsi voir abusivement la géométrie hyperbolique comme une
sorte de généralisation de la trigonométrie du cercle aux angles réels et complexes.

Par opposition à la trigonométrie du cercle, le lecteur remarquera et vérifiera facilement

546/2001
Sciences.ch 14/03/2005

(auquel cas, nous rajouterons la démonstration) que nous avons par opposition :

Posons maintenant :

avec une restriction à et donc .

Donc nous pouvons écrire :

Or, comme nous le verrons lors de notre étude des coniques dans le chapitre de géométrie
euclidienne :

1. la première de ces deux relations, constitue pour l'ensemble de définition donné, un cercle
de rayon unité centré à l'origine. Le lecteur remarquera qu'il est assez curieux pour la
trigonométrie du cercle d'obtenir un cercle…

2. la deuxième de ces deux relations, constitue pour l'ensemble de définition donné, une
hyperbole équilatérale orientée selon l'axe dont le sommet est à et de foyer
. Le lecteur remarquer à nouveau qu'il est assez curieux pour la trigonométrie
hyperbolique d'obtenir une hyperbole…

Ces deux dernières constations devraient permettre, nous l'espérons, au lecteur de comprendre
l'origine du nom de la trigonométrie hyperbolique et de constater que l'étude la trigonométrie
hyperbolique sur l'hyperbole est l'analogue de l'étude de la trigonométrie du cercle sur le
cercle.

Si nous représentons le cercle trigonométrie et l'hyperbole trigonométrique et rajoutons


quelques information complémentaire, voici ce que nous obtenons :

547/2001
Sciences.ch 14/03/2005

Explications :

Pour tracer à la règle et au compas le point de l'hyperbole, nous nous donnons ,


donc le point . Nous traçons la tangent au cercle qui relie ce qui nous
donne le point de tangence . Nous traçons le cercle de centre et passant par .
Ce cercle coupe à la perpendiculaire en à .

Nous voyons apparaitrre sur la figure plusieurs valeurs des fonctions hyperboliques
correspondant à mais aussi etc. Entre autres, le cercle
coupe l'axe Ox en deux points dont les abscisses sont et .

Si le lecteur veut s'assure de cette constat de faits que donne la figure, il pourra contrôler qu'en
tout point de l'hyperbole, nous avons toujours les relations (entre autres) :

qui sont toujours vérifiées.

Si nous traçons maintenant sur un graphique :

Nous obtenons (ça c'est juste pour avoir vu une fois à quoi ressemble ces fonctions) :

548/2001
Sciences.ch 14/03/2005

RELATIONS REMARQUABLES

Soit par définition :

A partir de ces définitions et à l'aide des opérations élémentaires d'algèbre nous pouvons
déterminer le relations remarquables suivante (c'est beaucoup plus facile que la détermination
de relations remarquables de la trigonométrie du cercle, donc sauf demande nous donnons ces
relations sans démonstration) :

Egalement :

Et nous avons les relations d'addition :

et encore :

549/2001
Sciences.ch 14/03/2005

et encore :

TRIGONOMÉTRIE SPHÉRIQUE

L'objectif de la trigonométrie sphérique est de déterminer les relations remarquables existants


entre les angles et les côtés de formes projetées (dites également "formes géodésiques" car
suivant la courbure de l'espace) sur la surface d'une sphère. Pour déterminer ces relations,
nous allons nous intéresser au cas particulier d'une sphère de rayon unité et des relations entre
les côtés d'un triangle (élément de surface plane élémentaire) et les différents angles existants.
Nous verrons que les résultats sont au fait indépendants du rayon de la sphère et de la forme
considérée initialement.

Soit la figure sur laquelle se trouve un triangle géodésique de sommets d'angles


d'ouverture respectifs et de côtés opposés et trois vecteurs unitaires tels
que et que l'extrémité de est confondu avec le sommet :

550/2001
Sciences.ch 14/03/2005

L'angle entre les points et , noté , n'a pas pu être représenté sur le schéma ci-dessus
faute de place.

Rappelons que le périmètre d'un cercle de rayon unité sur la sphère de rayon unité vaut bien
évidemment . Le périmètre du cercle en fonction de l'angle d'ouverture de ce dernier
étant donnée par:

Si le cercle à rayon (comme c'est le cas pour notre sphère), le calcul de la longueur d'arc
se simplifie et devient:

Conséquence relativement aux points sur notre sphère; les côtés du triangle sont donnés par:

Considérons maintenant le produit scalaire (voir le chapitre traitant du calcul vectoriel dans la
section d'algèbre) :

551/2001
Sciences.ch 14/03/2005

et comme nous avons:

Si nous décomposons les deux vecteurs et sur les vecteurs tangents unités nous
avons:

Ce qui nous donne:

ce qui donne (distributivité du produit scalaire):

Comme et , la relation précédent se réduit à:

et comme:

Nous avons:

relation dit "relation fondamentale" que nous pouvons tout aussi bien écrire:

Cette dernière relation est invariante par permutation circulaire des variables .

Il est que les sinus de tous les angles sont positifs (puisque inférieurs à ), ainsi nous
pouvons écrire:

552/2001
Sciences.ch 14/03/2005

Cette dernière relation est bien évidemment également invariante par permutation circulaire
des variables . Donc nous obtenons une relation remarquable du triangle sphérique,
appelée "relation des sinus":

Comme la trigonométrie sphérique est souvent utilisée pour des repérages terrestres, avec
souvent 2 cercles très particuliers et orthogonaux : l'équateur terrestre et une méridien ou un
parallèle quelconque et un méridien, ce cas revêt un intérêt particulier. Le lecteur pourra
s'exercer à retrouver les relations ci-dessous. Dans le cas d'un triangle rectangle en nous
avons bien évidemment:

Tout les relations que nous avons déterminées jusqu'à maintenant nous permettent dans le cas
où de tirer des relations très intéressantes pour la géophysique:

Evidemment, je nous n'avons pas présenté ici toutes le relations de trigonométrie sphérique
existantes, mais au moins les plus importantes qu'il faut savoir retrouver.

Remarque: nous définissons "l'excédent" ou "excès sphérique" par le nombre:

Pendant que nous y somme, profitons-en pour calculer un problème classique qui est celui de
la surface d'un triangle sur une sphère. Soit la figure:

553/2001
Sciences.ch 14/03/2005

Si nous prolongeons les arcs de géodésique et jusqu'à , nous obtenons une


tranche de sphère dont la surface est proportionnelle à l'angle ,en . Si cet angle valait
, nous aurions toute la sphère et la surface vaudrait . Comme l'angle vaut , la
proportionnalité nous dit que vaut:

De la même manière, si nous prolongeons les arcs et jusqu'à et si nous


prolongeons les arcs et jusqu'à , nous obtenons deux autres tranches dont les
surfaces et valent:

Supposons maintenant que nous additionnons ces trois surfaces:

nous obtenons alors la moitié de la sphère , mais le triangle géodésique de surface a été
compté trois fois : il faut enlever deux fois sa surface pour obtenir la surface d'une demi-
sphère. Donc:

comme , nous avons:

Après simplification nous en déduisons que la surface du triangle vaut::

554/2001
Sciences.ch 14/03/2005

Il est assez simple de généraliser ce concept à d'autres formes du même acabit (en particulier
celles composées de triangles…).

ANGLE SOLIDE

Il se pose le problème dans la géométrie spatiale le concept d'angle d'ouverture d'une portion
de l'espace (en extension à l'angle dit "angle plan"). Nous définissons alors l'angle solide
par la mesure de la portion d'espace limitée par une surface conique de sommet et nous
l'exprimons en stéradian, défini par le rapport :

étant l'aire de la calotte découpée par le cône sur une sphère de rayon .

Si est le demi-angle du cône, nous obtenons pour ce rapport (pour le calcul de la calotte
d'une surface sphérique voir le chapitre traitant des formes géométriques) :

D'où l'on conclut que l'angle solide total vaut par définition :

Nous pouvons également calculer "l'angle solide élémentaire" tel que représenté ci-dessous :

555/2001
Sciences.ch 14/03/2005

Soit un angle solide élémentaire et l'axe du cône. Nous posons :

Nous considérons une surface quelconque passant par le point . découpe sur cette
surface une portion .

Si nous traçons la sphère de centre et de rayon , cet angle solide découpe sur cette
sphère une calotte d'aire :

Soit la normale à qui fait un angle avec . Nous avons, en assimilant et


à des portions de plan :

d'où :

Ce concept d'angle solide nous sera très utile en partie dans le domaine de la physique
théorique qui traite du rayonnement thermique (voir chapitre d'optique et de
thermodynamique).

Nous pouvons encore calculer à partir des concepts précédents, "l'angle solide élémentaire" de
révolution tel que présenté sur la figure ci-dessous :

556/2001
Sciences.ch 14/03/2005

Il est compris entre deux angles solides de révolution dont les demi-angles au sommet
diffèrent de .

où :

557/2001
Sciences.ch 14/03/2005

GÉOMÉTRIE EUCLIDIENNE

L'objet de la géométrie euclidienne (dite également plus commuménement "géométrie plane")


est, en principe l'étude des formes et des propriétés des corps naturels. Ceux-ci sont beaucoup
trop variés pour qu'une pareille étude soit possible dans qu'un seul ouvrage (mais nous verrons
dans cette section que pouvons réduire toutes les formes géométriques à partir d'un nombre
fini de formes). Aussi, le mathématicien substitue-t-il à ces corps des figures, appelées
"figures géométriques", qui en sont des images schématisées par des représentations
mathématiques algébriques, figures qu'il est possible de définir rigoureusement (avec un
nombre fini d'axiomes) et par conséquent d'étudier avec précision. La géométrie n'est donc
pas une science expérimentale, puisque son objet est, non pas d'étudier certains aspects de la
nature, mais une reproduction nécessairement arbitraire de celle-ci: c'est pourquoi il est
d'usage de dire que la géométrie est une "science abstraite", bien qu'à la vérité elle puise ses
inspirations dans l'étude des phénomènes expérimentaux et qu'elle contrôle ses résultats, en
principe théoriques, par des mesures applicables à des exemples concrets.

Nous allons procéder dans ce chapitre un peu comme Euclide dans son ouvrage "Eléments".
C'est-à-dire qu'après avoir défini les notions de dimension, de point, de segment, de droite, de
plan, d'angle, de triangle et de cercle, dans lesquelles seront présentées sous forme diluée les 5
axiomes d'Euclide (rappelons qu'un axiome est non-démontrable par définition), nous les
condenserons dans un sous-chapitre qui leur sera exclusivement consacré. Ensuite, nous
présenterons une extension de ses axiomes que nous devons à Hilbert.

Remarques :

R1. Nous avons tenté de préserver au mieux les notations propres à Euclide.

R2. La forme actuelle de l'étude de la géométrie de nous plait guère (y compris le texte que
nous avons rédigé ci-dessous). Par ailleurs, la géométrie est souvent vu comme l'équivalent de
la thermodynamique en physique, c'est-à-dire : rébarbative, trop de termes et de vocabulaire
pour parler de choses semblabes, démonstrations discutables. C'est pourquoi une fois que
nous aurons terminé de rédiger les points les plus importants de la géométrie plane sous forme
traditionnelel nous tenterons de remanier le tout pour le formuler autrement (les axiomes
restant).

Quelques définitions préalables :

D1. La notion expérimentale la plus simple est celle de "volume". Nous disons qu'un corps
occupe un certain volume lorsqu'il occupe dans l'espace à trois dimensions une certaine place
(pour des espace à des dimensions supérieures, nous parlons d'hyper-volumes).

D2. Nous admettrons comme une chose évidente qu'un volume est limité par une "surface";
mais si l'existence du volume est physiquement contrôlable et mesurable, la surface est une
création de l'esprit; c'est quelque chose d'analogue à une baudruche, par exemple, enveloppant
un volume quelconque, mais d'analogue seulement. C'est un être géométrique à deux
dimensions sans épaisseur.

D3. Lorsqu'une surface est limitée, cette limite est une "ligne". Ici encore, la ligne est une
création de l'esprit, une ligne n'a pas d'existence expérimentale; c'est quelque chose
d'analogue à la figure formée par un fil de fer. Etre géométrique encore mais d'une dimension
sans hauteur ni largeur..

558/2001
Sciences.ch 14/03/2005

D4. Quand une ligne est limitée , sa limite est un "point": le point est quelque chose
d'analogue à l'intersection de deux fils tendus. C'est encore une création de l'esprit, un être
géométrique.

Remarque : il est d'usage, en géométrie, de représenter un point par une lettre , ,…; une
ligne, ou une surface par une lettre entre parenthèses (mais cela est rarement respecté car nous
supposons souvent que le lecteur sait de quoi nous parlons). Nous disons aloars, par exemple:
la ligne , la surface .

Remarques :

R1. L'expression "la segment " désigne en général une ligne limitée par les points et
. Nous dirons qu'un point est sur le segment , pour traduire le fait suivant: tout
segment peut être séparé d'une infinité de façons en deux morceaux limités par et
d'une part, par et d'autre part – fait inspiré au géomètre par la possibilité de couper
expérimentalement un bout de fil de fer en deux, et cela d'une infinité de façons (nous y
reviendrons lors de l'axiomatisation)

R2. Lorsqu'un point est sur le segment sans que sa position sur cette ligne soit
précisée, nous disons qu'il "décrit" cette ligne.

R3. L'expression: "la ligne est tracée sur une surface " signifie que la surface
pourrait être divisée en plusieurs morceaux, de manière que la ligne soit la frontière ou
une partie de frontière d'un de ces morceaux. Cette définition est inspirée du fait qu'il est
possible de découper une étoffe, par exemple, en suivant avec des ciseaux un trait quelconque
tracé sur cette étoffe.

R4. Lorsqu'un ligne est tracée sur une surface , tout point qui est situé sur la ligne
est aussi, par définition, situé sur la surface . On dit que c'est un point de cette
surface.

DIMENSIONS

Nous avons parlé de volume, surface et de ligne auxquelles nous pouvons associées des
dimensions. Mais qu'est-ce une dimension. Nous allons tacher d'essayer de définir au mieux
ces dernières. D'abord, il faut savoir qu'il existe en géométrie plusieurs types de dimensions.
La plus connue et commune est celle que nous appelons la "dimension topologique".

Par exemple, le point (abstraction mathématique et géométrique) à une dimension topologique


de 0, la courbe (trait continu d'épaisseur nulle) une dimension de 1, la surface une dimension
de 2, un volume une dimension de 3 et un hyper-volume une dimension 4 (pour représenter un
hyper-volume, prenez un volume dessiné sur papier (...) et faites en une translation et reliez
les sommets) Ce sont toutes des valeurs entières par définition. La figure ci-dessous montre
un exemple :

559/2001
Sciences.ch 14/03/2005

Pour calculer la dimension de certains objets, nous allons utiliser la méthode de la géométrie
métrique plane qui consiste à un étalon de cet objet, c'est à dire cet objet lui même mais en
plus petit, et nous allons le reporter sur notre objet un certain nombre de fois :

Soit la longueur totale du segment. Nous allons prendre un étalon de longueur que nous
allons reporter sur le segment. Cet étalon sera reporté fois. Nous remarquons que:

Nous pouvons appliquer le même raisonnement à une surface:

Soit la surface totale du carré. Cette fois, nous prenons un autre carré, plus petit, de côté
et de surface . Nous reportons le petit carré sur le grand fois pour obtenir la
surface du grand carré. Nous remarquons que:

Dans ces deux exemples, nous avons fait apparaître le nombre 1 pour le segment, et le nombre
2 pour le carré. Ces nombres sont la "dimension" de l'objet.

560/2001
Sciences.ch 14/03/2005

Généralisons: soit le nombre de fois que nous reportons l'étalon de longueur sur notre
objet de longueur , et soit la dimension de l'objet, nous avons:

Dans le cas des fractales (voir la section d'analyse numérique du site) les dimensions sont
variables et fractionnaires. Considérons la courbe de Von Koch (par exemple) après une
itération de la suite la définissant:

Soit sa taille tel que . Pour calculer sa dimension nous prenons l'élément fondamental
de la courbe (ci-dessous en rouge):

Soit la taille de cet étalon tel que . Nous voyons très bien que nous pouvons le
reporter 4 fois sur la courbe. Donc:

Le dimension de Van Koch à donc un valeur fractionnaire.

Nous pouvons donc calculer la dimension de n'importe quels objets fractals à la condition de
connaitre leurs mesures.

Ne nous hasardons pas à aller chercher des objets complexes dans quelques galaxies alors que
la fractale la plus connue se trouve dans votre assiette. Eh oui ! Le chou-fleur est bien un
fractal ! Vous avez sûrement déjà remarqué que quand nous découpons le chou-fleur, nous le
cassons au lieu de le couper, et ça donne plein de petits choux-fleurs, qui eux même peuvent
donner d'autres plus petits choux-fleurs. Cette particuarité d'auto-similarité à différentes
échelles fait du chou-fleur un fractal.

Calculons à présent la dimension fractale du chou-fleur. Quand nous cassons le chou-fleur,


nous obtenons entre 12 et 14 branches qui ressemblent au chou-fleur entier à une dilatation
près. Cette dilatation est, si nous la calculons, de facteur 3. Donc, selon la formule ci-dessus,

561/2001
Sciences.ch 14/03/2005

la dimension du chou-fleur est d'environ:

Il existe également d'autres dimensions. Prenons pour exemple, les dimensions d'homothétie
dont voici quelques exemples simples:

Le segment, de dimension 1 à par homothétie vu sa longueur doubler et nous remarquons que:

Le carré, de dimension 2 à par homothétie vu sa surface doubler et nous remarquons que:

Le cube, de dimension 3 à par homothétie vu son volume doubler et nous remarquons que:

Le facteur de duplication d'échelle (homothétie) est donc égal à:

Comme vous pouvez le voir, il s'agit toujours d'une valeur entière mais d'une autre type de
dimension.

LA LIGNE DROITE

La figure géométrique la plus simple (mis à part le point...) est la "ligne droite". C'est celle
dont l'image est donné par un fil tendu d'épaisseur nulle et de longueur infinie. Nous pouvons
également définir la "droite" comme une infinité de points mis à côté les uns des autres dans
une même direction sur un plan

Nous constatons également dans notre environnement le fait suivant (nous reviendrons sur
cette observation lors de notre énumération des 5 axiomes d'Euclide) : deux fils tendus ayant
mêmes extrémités sont confondus.

Le mathématicien devra admettre l'axiome suivant comme étant dans dans un espace plat

562/2001
Sciences.ch 14/03/2005

suffisamment consistant :

AXIOME DE PROLONGEMENT

Enoncé (premier axiome d'Euclide) : par deux points distincts et , il passe une droite et il
n'en passe qu'une seule

Autrement dit:

Deux droites et qui ont deux points communs sont confondues, tout point de l'une
est un point de l'autre et réciproquement.

Il résulte de cette proposition que deux droites et , ou bien n'ont aucun point
commun (nous disdons alors qu'elles ne se coupent pas ou qu'elles ne sont pas "sécantes"), ou
bien ont un seul point commun (elles sont alors sécantes et distinctes) qui s'appelle "point
d'intersection", ou bien ont plus d'un point commun (elles sont alors confondues). Nous
constatons que ces trois hypothèses correspondent à des faites expérimentaux très facilement
réalisable.

DEMI-DROITE

Nous appelons "demi-droite" la portion de droit limitée à un point appelé "origine".

L'expression: "la demi-droite " désigne la demi-droite d'origine , point nommé le


"premier", qui contient le point .

Nous disons que deux demi-droites , sont "opposées" lorsqu'elles constituent la droite
toute entière.

SEGMENT

Nous appelons "segment" une portion de droite limitée par deux points et . Ces
points sont appelés les "extrémités" du segment.

GRANDEURS DE MÊME ESPÈCE

Nous disons que des figures géométriques sont des "grandeurs de même espèce" lorsqu'il est
possible de définir:

1. Dans quel cas une figure ( ) sera dite égale à une figure ( ) et , si elles sont inégales,
laquelle est la plus petite

2. Ce que nous devonst entendre par somme d'une figure ( ) et d'une figure ( )

Les définitions choisies doivent être telles que si ( ) est déclaré plus petit que ( ) et ( )
plus petit que (C), ( ) soit déclaré aussi plus petit que (C); il faut, en outre, que la figure
appelée somme de ( ) et de ( ) soit égale à celle qui est appelée somme de ( ) et de ( ).
Enfin, la substitution dans une comparaison, une égalité ou une somme, d'une figure par une
figure égale ne doit pas modifier le résultat des opérations.

563/2001
Sciences.ch 14/03/2005

Pour faire comprendre ce que sont des grandeurs de même espèce, prenons l'exemple des
segments de droite. Nous admettrons qu'il est possible de décider de l'égalité de deux
segments et lorsque nous pouvons les faire coïncider. Nous admettrons aussi
qu'il est possible de remplacer le segment par un segment égal et porté sur la
demi-droite . Enfin, nous admettrons qu'il est possible de distinguer entre trois points ,
, , pris au hasard sur une droite, lequel est entre les deux autres.

Nous convenons alors de dire que le segment est plus petit que le segment , ce qui
s'écrit en abrégé:

lorsque le point (obtenu en portant sur la demi-droite un segment égal à )


tombe entre et .

Si le point était en , les segments et seraient égaux et nous écririons :

Nous convenons d'appeler la somme de deux segments , , le segment obtenu en


portant sur la demi-droite opposée à la demi-droite un segment égal à . Nous
traduisons cette opération en écrivant:

Considérons toujours des grandeurs de même espèce. Ajouter entre elles plusieurs de ces
grandeurs, c'est ajouter l'une d'elles à une autre, la somme obtenue à une troisième, etc. Par
exemple, ajouter les segments , , , c'est ajouter et ce qui donne .
Nous résumons l'opération en écrivant:

Multiplier une grandeur par un nombre entier , c'est ajouter grandeurs égales à celle-là.
Par exemple, si nous avons , la relation précédente s'écrirait:

Nous allons définir ce que nous appelons "comparer deux grandeurs ( ) et ( ) de même
espèce" :

Choisissons arbitrairement une grandeur ( ) de même espèce que ( ) et que ( ) et plus


petite que chacune d'elles. Formons une suite de grandeurs telles que:

Nous constatons que la grandeur ( ) s'intercale entre deux grandeurs et et que (


) se trouve entre deux autres et . Nous disons alors par définition que le rapport
des grandeurs ( ) et ( ) est un nombre ( )/( ) positif compris entre :

564/2001
Sciences.ch 14/03/2005

et

Prenons alors, par exemple, deux segments , . Pour réaliser l'opération précédente,
utilisons une règle graduée dont l'unités sera la grandeur , ici un segment arbitrairement
choisi. Nous appliquons le zéro de la règle en , et s'intercale entre deux graduations de la
règle numérotée et ; pour , le zéro étant en ', et ' s'intercale entre deux
grandeurs de la règle numérotée et . Nous exprimerons le résultat de ces mesures en
écrivant:

s'appelle une mesure par "défaut", et une mesure par "excès".

Définition: nous appelons "mesure d'une grandeur" ( ) le nombre positif qui mesure le
rapport de cette grandeur et d'une grandeur ( ) arbitrairement choisie et que nous appelons
"l'unité".

La mesure de l'unité étant "1", par définition.

Nous pouvons démontrer que si est la mesure de ( ), celle de ( ) évaluées toutes deux
avec une même unité ( ), le nombre ( )/( ) est égal au rapport / . Ce rapport étant
indépendant de l'unité choisie.

Remarque : nous disons que ( ) est une "partie aliquote" de ( ) si le rapport ( )/( ) est un
nombre entier.

Nous conviendrons une fois pour toute, qu'en géométrie toutes les grandeurs de même espèce
qui interviennent dans une figure donnée sont mesurées avec la même unité.

Soit ( ), ( ), ( ), …, ( ) des grandeurs de même espèce et , , , …, , des


grandeurs de même espèce, mais qui ne sont pas nécessairement de même espèce que les
précédentes. Nous disons que ces grandeurs "homologues", si nous pouvons les grouper deux
à deux, homologue de ( ), homologue de ( ), …, etc., de manière que les
conditions suivantes soient réalisées:

- Si ( ) est égal à ( ), est égal à

- Si ( ) est plus petit que ( ), est plus petit que

- Si ( ) est la somme de ( ) et de ( ), est la somme de et de

Pour calculer le rapport ( )/( ), formons la suite et pour calculer le


rapport / , formons la suite , obtenue comme la précédente, mais
à partir de la grandeur homologue de ( ).

Il est évident que si ( ) s'intercale entre et , s'intercalera entre et

565/2001
Sciences.ch 14/03/2005

; de même, si ( ) s'intercale entre et . Les rapports ( )/( ) et /


seront encadrés par les mêmes nombres : et .

Par conséquent: Le rapport de deux grandeurs ( ) et ( ) est égal au rapport des grandeurs
homologues et .

Si, en particulier, les grandeurs ( ), ( )… sont mesurées avec une unité ( ), et si les
grandeurs , ,… sont mesurées avec une unité , homologue de ( ), les rapport
égaux :

( )/( ) et /

ne sont autres que les mesures de ( ) et de . Par conséquent:

Les mesures de deux grandeurs homologues ( ) et sont égales, à condition que les
unités choisies pour les mesurer soient des grandeurs homologues.

AXIOME DE CONTINUITÉ DE LA DROITE

Enoncé (deuxième axiome d'Euclide) : tout segment est prolongeable en une droite
passant par et (compte tenu du premier axiome, elle est unique)

Autrement dit : Choisissons sur une demi-droite un point . Soit la mesure de .


A chaque point de la demi-droite correspond un nombre positif et un seul; nous
admettrons qu'à un nombre positif arbitrairement choisi correspond un point de la
demi-droite et un seul.

Une conséquence de cette hypothèse est qu'il existe un point, et un seul, qui divise le
segment en parties égales. Ce point est le point de la demi-droite , tel que:

Nous l'appelons "milieu" du segment .

Théorème: Il existe un point et un seul, situé sur le segment tel que le rapport
soit égal à un nombre positif donné .

Remarque : si , ce point est le milieu du segment.

Soit un point quelconque du segment ; soit , la mesure de , et la mesure de


: la mesure de sera puisque est placé entre et . Nous aurons alors:

Pour que ce rapport soit égal à , il faut, et il suffit, que soit solution de l'équation:

566/2001
Sciences.ch 14/03/2005

Or, cette équation admet la seule solution:

A cette valeur positive et inférieure à de correspond un point et un seul de la demi-


droite tel que . Ce point satisfait, et satisfait seul, aux conditions imposées.

Théorème: Il existe un point et un seul de la droite , situé en dehors du segment ,


tel que le rapport soit égal à un nombre donné différent de 1.

Démonstration :

1. Supposons . Soit un point quelconque de la droite situé en dehors du segment


: ou bien est sur le segment , ou bien est sur le segment . Si est sur le
segment , nous avons nécessairement , donc :

Le point ne répond donc pas à la question de l'unicité.

Si est sur le segment , , , . Nous aurons donc:

Pour que ce rapport soit égal à , il faut, et il suffit que soit solution de l'équation:

Cette équation admet, nous l'avons vu, comme seule solution:

qui est bien positive et supérieure à . A cette valeur positive et supérieure à 1de
correspond un point et un seul de la demi-droite . Ce point satisfait, et satisfait
seul aux conditions imposées d'uncitié.

2. Supposons maintenant . Nous chercherons le point pour lequel (nous avons


simplement inversé le rapport) :

567/2001
Sciences.ch 14/03/2005

nombre supérieur à 1. Il y en a un et un seul d'après (1.) . Il satisfait seul aux conditions


imposées.

Remarque: il n'existe aucun point situé en dehors du pour lequel . En


effet, si est sur le segment , nous avons, quel que soit , , et si est sur
le segment , .

PLAN

Considérons une surface finie et deux points et de cette surface. Deux cas peuvent
se présenter:

1. Il y a des points de la droite qui ne sont pas sur la surface . Nous dirons dans ce
cas: la droite coupe la surface; les points communs à la droite et à la surface
sont les points d'intersection de la surface et de la droite . Parmi ces points communs
se trouvent, en particulier les points et .

2.) Tous les points de la droite sont des points de la surface . Nous disons alors que la
droite est sur la surface (S).

Définition : nous appelons "plan" la surface telle que toute droite qui joint deux points
arbitrairement choisis sur la surface, soit sur la surface.

Nous admettrons qu'une pareille surface existe et que par trois points , non alignés, il
passe un plan et un seul. L'étude des plans sera faite ultérieurement: nous nous proposons
actuellement l'étude des figures géométriques tracées dans un plan donné, figures dites
"planes". Leur étude constitue la "géométrie plane". Dans la pratique, les figures sont tracées
soit sur une feuille de papier, soit sur la surface du tableau noir; nous admettrons que ces
surfaces sont des images suffisantes de la surface appelée plan.

DÉPLACEMENT ET RETOURNEMENT

Soit un dessin effectué sur un tableau plan: effectuons sur un papier transparent, dont le
recto est appliqué sur le plan du tableau, un calque du dessin . Effectuons, en
appliquant ce calque en un autre point du tableau, un nouveau dessin identique à .

Définition : si le recto du papier transparent est demeuré appliqué sur le tableau, le dessin
se déduit de par une opération appelée "déplacement"; si, au contraire, le papier a
été retourné, et si c'est le verso qui est appliqué sur le tableau, l'opération s'appelle
"retournement".

A chaque point du dessin , l'une quelconque de ces deux opérations fait correspondre
un point ' du dessin , que nous appelons "l'homologue" de . Un segment de
vient en coïncidence avec un segment homologue de ; ces deux segments sont
par définition égaux et cela quels que soient et .

568/2001
Sciences.ch 14/03/2005

Définition : sous disons communément que le dessin est "superposable" au dessin


et que ces dessins représentent des figures égales.

ANGLES

Nous avons déjà (trop) brièvement défini le concept "d'angle" dans le chapitre précédent
traitant de la trigonométrie. Nous allons maintenant y revenir plus en détail et en voir les
concepts sous-jacents :

Définitions :

D1. Nous appelons "angle" (ou "angle plan) ou plus rigoureusement "angle rectiligne" la
portion de plan limitée par deux demi-droites , , par exemple. Le point 0 s'appelle
"sommet" de l'angle, les demi-droites , , s'appellent les "côtés" de l'angle.

D2. Nous appelons "angle formé par deux segment , ", l'angle de sommet dont les
côtés sont les demi-droites , .

D3. Les demi-droites , divisent le plan en deux régions: elles définissent donc deux
angles: l'un constitué par la région couverte de hachures (voir la figure à l'extrémité gauche ci-
dessous) s'appelle "angle saillant"; l'autre, constitué par la région couverte de hachures (voir la
figure au centre ci-dessous) s'appelle "angle rentrant".

La notation ou désigne un de ces deux angles: la lettre qui indique le sommet doit
être écrite au milieu. Lorsque aucune précision n'accompagne cette notation, elle représente
par définition l'angle saillant !!

D4. Nous appelons "angles adjacents" deux angles qui ont le somment et un côté communs et
qui sont placés de part et d'autre de ce côté commun. Sur la figure ci-dessus à l'extrême droite,
les angles saillants , , sont adjacents.

Soit, , deux angles d'un même plan. Nous avons admis précédemment qu'il
existe un déplacement qui amène en et en un point de la demi-droite ; ce
déplacement amène soit en , de manière que les deux angles , ne soient
pas adjacents, soit en , de manière que et soient adjacents. Dans ce dernier
cas, un demi-tour supplémentaire autour de amènera dans la position . Ce
déplacement et ce retournement, s'il y a lieu, remplace par un angle , égal par
définition.

569/2001
Sciences.ch 14/03/2005

Si est confondu avec , il y a des points de l'un des deux angles et qui
sont égaux, tout point de l'un étant un point de l'autre : nous dirons, dans ce cas, que les angles
, sont "égaux", ce qui s'exprime par l'égalité .

Si n'est pas confondu avec , il y a des points de l'un des deux angles , par
exemple, qui ne sont pas des points de . Sur la figure ci-dessus, l'angle est couvert
de hachures, l'angle également; les points dont nous parlons sont ceux de l'angle
couvert une seule fois de hachures. Nous conviendrons de dire que l'angle et,
par conséquent, l'angle égal à sont, dans ce cas, plus grands que l'angle , ce qui
s'exprime par l'inégalité .

SOMME DE PLUSIEURS ANGLES

Etudions d'abord le cas de la somme de deux angles , adjacents. Deux cas


peuvent se présenter suivant que les angles sont saillants ou rentrants:

1. Soit et les deux angles à additionner (voir figure ci-dessous à gauche). Par
définition, la somme de ces angles est l'angle , ce que l'on exprime par l'égalité :

2. Soit un angle rentrant à additionner à l'angle saillant (voire figure ci-dessous à


droite). Si nous couvrons de hachures successivement les deux angles, l'angle se trouve
couvert deux fois.

Dans ce cas, la somme des angles et est égale à augmenté de deux angles

570/2001
Sciences.ch 14/03/2005

plats (voir un peu plus loin pour la définition), ce qui s'exprime en écrivant :

Etudions maintenant le cas de la somme de deux angles quelconques :

La somme de deux angles , est par définition, égale à la somme de l'angle


et d'un angle égal à l'angle et adjacent à l'angle .

Un pareil angle est obtenu par un déplacement qui amène en et en un point ,


suivi ou non d'un retournement autour de .

Etudions comme dernier cas la somme de plus de deux angles :

La somme de plusieurs angles , , etc., est, par définition, égale à la somme


obtenue en ajoutant le premier au second, la somme au troisième, et ainsi de suite. Soit
le premier angle, un angle égal au dernier des angles à ajouter et adjacent au
précédent. Le résultat de l'addition sera augmenté d'autant de fois deux angles plats que
le plan a été recouvert qu cours des opérations. On constate aisément que ce résultat ne
dépend pas de l'ordre des angles à ajouter , , etc.

MESURES DES ANGLES

Nous avons défini l'égalité et la somme de deux ou plusieurs angles. Ces définitions satisfont
aux conditions de grandeurs de même espèce que nous avons déjà vues précédemment.
Choisissons donc arbitrairement un angle du plan , qui sera l'unité d'angle pour le plan: la
mesure du rapport , effectuée comme il a été expliqué précédemment lors de notre
discussion sur les grandeurs de même espèce, sera un nombre positif , appelé par
définition : "mesure de l'angle , avec l'unité choisie ".

Nous désignons par la lettre grecque (lire "pi") minuscule la mesure d'un angle
plat. Comme tous les angles du plan sont plus petits que deux angles plats, le nombre (qui
est la mesure de ) doit être inférieur à .

Soit les mesures de plusieurs angles , , .

Nous n'insistons pas sur le fait évident que les égalités ou sont

571/2001
Sciences.ch 14/03/2005

équivalentes, ainsi que les inégalités , . Ces remarques de bon sens


s'imposeront chaque fois que des grandeurs de même espèce auront été mesurées, bien
entendu avec la même unité. En revanche, nous insisterons sur le fait que, d'après la définition
même de la somme de plusieurs angles, est la mesure de l'angle augmentée
d'autant de fois deux angles plats que le plan a été recouvert au cours des opérations
d'addition.

Le nombre entier qui s'introduit dans ce calcul a une valeur qui pourrait être précisée, mais
qui n'a pour le géomètre aucune importance, comme nous pourrons le constater
ultérieurement. Nous décidons donc de ne pas écrire en géométrie le inutile (mais sous-
entendu). Egalement, nous décidons par convention d'écrire:

Ainsi, nous avons cette convention d'écriture signifie que est la mesure de
l'angle si nous avons .

Si est supérieur à , l'égalité signifie que la mesure de l'angle est ,


étant un nombre entier positif ou nul choisi de manière que nous ayaont .

Remarques:

R1. Il existe un nombre entier positif et un seul, tel que nous ayons ,
c'est-à-dire:

car les deux nombres et sont positifs et différents de 1.

R2 Dire que est la mesure de l'angle suppose que nous ayons et entraîne
l'égalité . Mais écrire n'entraîne en général, que soit la mesure de
; il faut, en outre, que l'on ait .

SYSTÈMES D'UNITÉS

Définition : nous appelons "degré" la 180ème partie de l'angle plat.

Tous les calculs anciens sont effectués en degrés; les sous-multiples du degré sont: "la minute
sexagésimale", égale au 60ème du degré, et la "seconde sexagésimale", égale au 60ème de la
minute sexagésimale. La notation se lit: trente degrés, dix-huit minutes, onze
secondes. Nous utilisons encore aujourd'hui couramment le degré dans les écoles mais sans la
notation usant des minutes et secondes (pas commode pour la somme des angles). Nous

572/2001
Sciences.ch 14/03/2005

notons alors l'angle en degrés avec une notation décimale comme par exemple

Définition : nous appelons "grade" la 200ème partie de l'angle plat.

Le grade est également une ancienne unité d'angle. Ses sous-multiples sont: la "minute
centésimale", égale au 100ème du grade, et la "seconde sexagésimale", égale au 100ème de la
minute centésimale. La notation se lit: quarante grades, dix-huit minutes,
vingt-quatre secondes.

Remarque : aujourd'hui nous devrions utiliser le "radian" comme unité d'angle internationale.
Ainsi un angle plat est égal à et tous les autres angles sont des multiples réels de cette
constante dont nous donnons une des origines dans le calcul du perimètre d'un cercle dans le
chapitre traitant des algorithmes dans la seciton d'analyse numérique. Nous avons également
déjà défini dans le chapitre de trigonométrie ce qu'était un radian, nous ne reviendrons donc
pas dessus.

AXIOME DE CONTINUITÉ DU PLAN

Enoncé (troisième axiome d'Euclide) : A chaque angle du plan correspond sa mesure


, effectuée avec une unité choisie une fois pour toutes; est un nombre positif, inférieur à
. Réciproquement, soit un nombre positif quelconque compris entre 0 et , nous
admettrons qu'il existe une infinité d'angles égaux entre eux dont la mesure avec l'unité
d'angle choisie soit .

ANGLES DROITS, AIGUS, OBTUS, SUPPLÉMENTAIRES ET COMPLÉMENTAIRES

Définitions :

D1. Nous appelons "angle droit", tout angle égal à la moitié d'un angle plat. La mesure d'un
angle droit est de (90° degrés, ou 100 grades).

D2. Nous appelons angle aigu", tout angle inférieur à un angle droit; "angle obtus" tout angle
supérieur à un angle droit.

D3. Nous disons que deux angles sont "supplémentaires" lorsque leur somme vaut deux
angles droits; si est la mesure de l'un, est trivialement celle de l'autre. La condition
nécessaire et suffisante pour que deux angles adjacents , soient supplémentaires
est que les côtés non adjacents , soient deux demi-droites opposées.

D4. Nous disons que deux angles sont "complémentaires" lorsque leur somme vaut un angle
droit. Si la mesure de l'un est , celle de l'autre est trivialement de . Deux angles
complémentaires sont évidemment aigus par définition.

DROITES PERPENDICULAIRES

Il est évident que deux droites sécantes forment quatre angles plans dont les
mesures sont:

573/2001
Sciences.ch 14/03/2005

parce que chacun d'eux est supplémentaire du précédent. Cela nous amène à la définition
suivante :

Nous disons que deux angles droits et sont perpendiculaires (noté : )


lorsque l'un quelconque de ces quatre angles est droit. Nous voyons que dans ce cas, et dans
ce cas seulement, ils sont tous les quatre droits.

BISSECTRICE D'UN ANGLE

Théorème: il existe une demi-droite et une seule qui divise un angle donné en
deux parties égales.

Pour qu'une demi-droite divise l'angle donné, de mesure , en parties égales, il


faut que et que les angles , ne soient pas adjacents.

Définition: nous appelons "demi-bissectrices" de l'angle , la demi-droite qui divise


cet angle en deux parties égales.

Théorème: La demi-bissectrice de l'angle saillant et la demi-bissectrice de l'angle


rentrant sont deux demi-droites opposées.

De plus, étant située entre et nous avons :

Si est la mesure de l'angle saillant , la mesure de est ; la mesure de l'angle


rentrant est , et celle de est ; la mesure de est donc:

L'angle est plat; et sont des demi-droites opposées.

Définition: nous appelons "bissectrice" d'un angle , la droite dont une moitié divise
en partie égales l'angle saillant et la seconde moitié l'angle rentrant .

Deux droites et qui se coupent forment comme nous l'avons déjà vu, quatre angles:

Les angles et , dont les côtés sont opposés, sont dites "opposés par le sommet".
De même, les angles . Si est la mesure de l'angle , la mesure de l'angle

574/2001
Sciences.ch 14/03/2005

adjacent est ; celle de l'angle adjacent au précédent est ; celle


de est . Soit la demi-bissectrice de l'angle , celle de ,
celle de , celle de , nous aurons:

et, par conséquent :

Nous aurions de même

Nous résumons ainsi tous ces résultats de mesure:

1. Deux angles opposés par le sommet sont égaux

2. Deux angles opposés par le sommet ont même bissectrice

3. Les bissectrices de deux angles adjacents supplémentaires sont rectangulaires

4. Les bissectrices des angles formés par deux sécantes sont deux droites rectangulaires, que
nous appelons, par abréviation, "bissectrice de ces deux droites".

TRIANGLES

Nous avions étudié jusqu'à présent le concept de dimensions, de point, de segment, de ligne,
d'angle et de plan ouvert (infini). Cependant un plan peut-être délimité par plusieurs lignes
pour obtenir ainsi des formes géométriques dont les plus simples peuvent être considérées
commes les triangles.

Définitions : nous appelons "triangle" la figure formée par trois segments , les
points n'étant pas alignés. Les segments , sont les "côtés" du triangle.
Les points sont les "sommets" du triangle. L'angle saillant , qui contient toues
les points du côté , s'appelle angle du triangle; nous emploions la notation lorsque
aucune confusion n'est possible; à défaut, nous utilisons la notation avec le même sens.

Il y a six éléments dans un triangle, à savoir : trois angles , , et trois côtés .

Nous désignerons par , , les longueurs des côtés mesurés avec la


même unité; par , , , les mesures des angles. Chaque angle d'un triangle est compris
entre 0 et 2 angles droits.

Définitions :

D1. Le côté d'un triangle compris dans l'angle est dit "côté opposé" à cet angle: nous

575/2001
Sciences.ch 14/03/2005

l'appelons dans certains cas la "base" relative au sommet "principal" .

D2. Nous disons que deux triangles sont égaux lorsque nous pouvons par un déplacement soit
par un retournement ou les deux combinés, superposer tous les somment du premier triangle
au deuxième. Nous disons alors aussi que les triangles sont "homologues".

La somme des angles d'un triangle plan est toujours égale à 180° (ou radians). La
démonstration est assez simple :

Sur la figure ci-dessous, est un triangle quelconque, et la parallèle à ( ) qui passe


par . Nous observons :

1. Les angles bleus ont même mesure car ils sont alternes-internes (les droites ( ) et
étant parallèles).

Remarque : pour la démonstration de l'égalité des angles alternes-internes voir plus loin le
quatrième axiome d'Euclide.

2. De même, les angles verts ont même mesure car ils sont alternes-internes.

3. Nous remarquons que la somme des angles bleu + rouge + vert forme un angle plat en ,
puisque est une droite. Donc angle bleu + angle rouge + angle vert = 180°.

4. D'après les égalités d'angles constatées en (1.) et (2.), nous déduisons que :

Cette démonstration étant valable quel que soit le triangle tracé dans le plan.

TRIANGLES ÉGAUX

Définition: Nous disons que deux triangles sont "égaux" lorsque soit:

1. ils ont un côté égal et duex angles égaux

2. deux côtés égaux et un angle égal (réciproque de (1.))

576/2001
Sciences.ch 14/03/2005

3. (trivial) lorsque tous leurs côtés sont égaux

Démonstrations :

Premier cas d'égalité : deux triangles qui ont un côté égal , compris entre deux
angles égaux , sont égaux.

Puisque (voir figure ci-dessous), il existe un déplacement qui amène en et


en .; ce déplacement amène en situé du même côté par rapport à la droite ,
ou symétrique de par rapport à cette droite. Si est en , un demi-tout autour de
l'amènera en .

Les deux demi-droits et font par hypothèse, avec le même angle ;


comme elles sont par construction d'un même côté de , elles sont confondues. Les deux
demi-droites et sont confondues pour la même raison et parce que . est
donc confondu avec . Les deux triangles sont donc égaux.

Deuxième cas d'égalité : deux triangles qui ont un angle égal compris entre deux côtés
égaux sont égaux.

Puisque (voir figure ci-dessous) il existe un déplacement situé par rapport à


du même côté que le point. S'il l'amenait en symétrique de par rapport à , un
demi-tour autour de l'amènerait en . Les demi-droites situées d'un même
côté de font, par hypothèse le même angle avec , puisque . Elles sont donc
confondues. L'hypothèse entraîne alors que et sont confondus. Les deux
triangles sont donc égaux.

577/2001
Sciences.ch 14/03/2005

TRIANGLE ISOCÈLE

Définition: nous disons qu'un triangle est "isocèle" lorsque deux de ses côtés sont égaux
("iso" signifiant "même") et sont égaux. Le troisième côté est alors appelé la
"base" de ce triangle.

Remarque : nous disons qu'un triangle est "scalène" quand il n'est pas isocèle.

Définition : nous appelons "médiatrice" d'un segment , la perpendiculaire à la droite


au point de cette droite, milieu de .

Théorème: Dans un triangle isocèle comme représenté ci-dessus:

1. Les angles et opposés aux côtés égaux sont égaux

2. La médiatrice de et la bissectrice de l'angle sont confondus (figure à droite ci-


dessus)

Démonstration : les deux triangles définis par la bissectire de ont un angle


égal par construction compris entre deux côtés égaux : qui est commun et
par hypothèse. Comme les angles sont droits et égaux et que la
somme des angles d'un triangle est égal à un angle plat, alors les angles et sont
donc égaux.

LIEU GÉOMETRIQUE

Définition : nous appelons "lieu géométrique" d'un point , assujetti à des conditions,

578/2001
Sciences.ch 14/03/2005

l'ensemble des positions occupées par le point . Nous bornerons l'étude des lieux en
géométrie plane, au seul cas où les conditions imposées suffisent pour que le point décrive un
arc de courbe noté .

Pour démontrer qu'un arc de courbe est un lieu géométrique défini par un ensemble de
conditions, nous devons établir dans un ordre arbitraire:

1. Que les conditions imposées sont suffisantes, c'est-à-dire que l'hypothèse entraîne la
conclusion: le point est sur la courbe .

2. Que les conditions imposées sont nécessaires, c'est-à-dire que l'hypothèse – le point M est
sur la courbe – entraîne la conclusion: les conditions imposées sont remplies.

L'expressions: le point appartient au lieu, équivaut à l'expression: les conditions imposées


au point sont remplies.

L'expression: la condition nécessaire et suffisant pour que le point soit un point du lieu est
qu'il soit sur la courbe , résume les propositions (1.) et (2.).

Théorème: Le lieu géométrique des points équidistants (à même distance) de deux points
et donnés est la médiatrice du segment .

Démonstration :

1. Tout point du lieu est sur la droite . Autrement dit, l'hypothèse entraîne que
est la médiatrice de . En effet, si , le triangle est isocèle et le
sommet est sur la médiatrice de .

2. Tout point de est un point du lieu. Ce qui revient à dire que si est sur la médiatrice
de , nous avons . En effet, si est sur la droite qui rencontre en ,
milieu de , la droite , les triangles sont égaux (deuxième cas d'égalité :
parce que ces angles sont droits, commun; parce que est le
milieu de ) : les côtés sont donc égaux et nous avons bien . Le point
est un point du lieu.

A l'aide de ce théorème nous pouvons en énoncer un second : Par un point pris hors d'une
droite , nous pouvons mener à cette droit une seule et unique perpendiculaire :

Démonstration :

579/2001
Sciences.ch 14/03/2005

1. Soit un triangle , faisons subir à ce triangle un demi-tour autour de (symétrie


horizontale) : vient en symétrique de par définition, par rapport à . Puisque les
figures sont égales, et . est donc la médiatrice de
et les droites et sont perpendiculaires. est donc bien une perpendiculaire à
menée par .

2. Nous ne pouvons en mener plusieurs : soit une perpendiculaire menée de à ,


elle rencontre la droite en qui est différent soit de , soit de . Supposons que
soit différente de . qui se déduisent l'un de l'autre par retournement, sont
égaux, et, comme chacun d'eux est droit, l'angle est plat. La droite est confondue
avec la droite est donc bien la seule perpendiculaire à qui passe par .

Définitions :

D1. nous appelons "projection orthogonale" d'un point sur une droite le point où la
perpendiculaire menée par à cette droite la rencontre. Le point s'appelle aussi "pied" de
cette perpendiculaire.

D2. Nous appelons "distance" du point à la droite la longueur du segment .

Puisqeu est la médiatrice de , est le milieu de ; donc : Un point et son


symétrique par rapport à une droite sont caractérisés par les deux propriétés
suivantes :

P1. est perpendiculaire à

P2. le milieu de est sur

La droite , qui joint le point à un point de la droite , autre que le pied de la


perpendiculaire menée de à cette droite, s'appelle "oblique". Le point s'appelant "pied
de cette oblique".

TRIANGLE ÉQUILATERAL

Définition : nous disons qu'un triangle est "équilatéral" lorsque tous ses côtés sont de
longueur égales ou que tous ses angles sont égaux. Chacun de ces côtés est donc une
base.

580/2001
Sciences.ch 14/03/2005

Remarque : nous prenons prend pour habitude d'annoter les côtés égaux par deux traits
parallèles disposés au milieu de la base.

Comme la somme des trois angles de ce triangle doit faire 180° et que les trois angles ont
même mesure, chacun d'eux mesure donc : 180°/3 soit 60°.

TRIANGLE RECTANGLE

Définition: Un triangle rectangle est un triangle qui a un angle droit :

Dire que le triangle est rectangle en signifie c'est en se trouve l'angle droit.

Remarque : dans un triangle rectangle, le côté le plus grand est toujours le côté opposé à
l'angle droit. Nous l'appelons "l'hypoténuse". Nous démontrons cette propriété avec le
théorème de Pythagore (voir plus bas)

TRIANGLE RECTANGLE-ISOCÈLE

Définition : un triangle rectangle-isocèle est à la fois rectangle et isocèle, ce qui signifie


qu'il a à la fois un angle droit et deux côtés de même longueur.

Remarques : le sommet principal correspond à l'angle droit. En effet, comme ,


l'hypoténuse, doit être le côté le plus grand, ce sont les côtés et qui ont même
longueur (plus petite).

THÉORÈME DE PYTHAGORE

581/2001
Sciences.ch 14/03/2005

Maintenant que nous avons vu ce qu'était le triangle et certaines de ses propriétés ainsi que le
concept d'angle, nous pouvons démontrer le fameux et éternel théorème de Pythagore.

Remarque : il existe plusieurs démonstrations de ce théorème dont en voici une parmi tant
d'autres :

Soit un carré (4 angles droit) dans lequel est inscrit un autre carré, nous déterminons la
surface du carré inscrit à partir des triangles rectangles résultants de l'espace vide entre les
deux carrés tel que présenté sur la figure ci-dessous :

La surface du carré blanc est bien sûr :

Pour avoir la surface du carré gris on peut soustraire au carré blanc la surface des 4 triangles
rectangles (d'un esurface de moitié de celle d'un quadrilatère de même longueur et hauteur),
chacun de surface :

La surface du carré gris est donc finalement :

Le résultat obtenu étant équivalent au carré des côtés de la surface grise, on a:

C'est au chinois Tchao Kiung K'ing (2ème siècle) que l'on doit cette démonstration.

THÉORÈME DE THALÈS

Comme nous avons démontré le théorème de Pythagore et que les concepts de parallèles,
segements, angles et autres nous sont connues, nous pouvons enfin démontrer le théorème de
Thalès dont voici une possible démonstration :

Lemme 1: triangles de même surface

582/2001
Sciences.ch 14/03/2005

Soit la figure:

Nous avons:

est un rectangle car ses côtés sont parallèles deux à deux et il a au moins deux angles
droits. Donc ses côtés opposés ont même longueur: .

est la hauteur relative à dans le triangle et est la hauteur relative à


dans le triangle .

La surface du triangle ne dépend que de la longueur du côté et de la longueur de la hauteur


relative à ce côté. Pour les deux triangles et , ces longueurs sont égales, donc ils
ont la même surface.

Conclusion: si deux triangles ont un côté commun et si les troisièmes sommets sont une
parallèle à ce côté comme, alors ils ont la même surface.

Lemme 2: rapports égaux

Soit le rapport de proportions ("calcul proportionnel" ou "produit en croix"):

alors:

Si , alors (nous ajoutons un même nombre positif ou négatif aux


deux membres). D'où après factorisation:

et en appliquant inversement la règle des produits en croix:

583/2001
Sciences.ch 14/03/2005

Exposons maintenant le théorème de Thalès:

Soit la figure:

Avec:

Nous avons montré précédemment que si deux triangles ont un côté commun et si les
troisièmes sommets son sur une parallèle, alors ils ont la même surface. Donc les triangles
et ont la même surface.

En ajoutant à chacune de ces deux surfaces celle du triangle , nous obtenons que les
triangles et ont la même surface.

Nous en déduisons que en utilisant à nouveau le rapport en croix:

Soit la hauteur issue de dans le triangle et la hauteur issue de dans le


triangle :

et

Conclusion:

584/2001
Sciences.ch 14/03/2005

Soit maintenant la figure:

Les triangles et ont la même surface (lemme 1) ainsi que les triangles et
donc :

d'où :

et

De la même manière dans les triangles et , nous obtenons :

D'après le lemme 2, comme :

alors :

Donc finalement en reprenant tous les résultats obtenus:

585/2001
Sciences.ch 14/03/2005

qui constitue le "théorème de Thalès" des rapports.

AXIOME D'UNICITÉ DU PARALLELISME

Enoncé (quatrième axiome d'Euclide) : Par un point pris en dehors d'une droite, nous ne
pouvons mener à cette droite qu'une seule droite.

Cet axiome est connu sous le nom de "postulatum d'Euclide" et constitue un des axiomes qui
a le plus boulversé et impregné l'histoire des mathématiques (voir l'introduction du chapitre
traitant de la théorie de la démonstration) . La géométrie construite en admettant la postulatum
d'Euclide s'appelle géométrie euclidienne; les géométries construites en le remplaçant par une
autre proposition, en admettant, par exemple, que nous pouvons par un point mener plusieurs
parallèles à une même droite, sont des géométries non-euclidiennes. Ces géométries sont tout
à fait comparables à la notre; les théorèmes peuvent y être rangés dans le même ordre; la suite
des raisonnements et des démonstrations y est aussi solidement et irréprochablement ordonnée
que dans la géométrie euclidienne. Au point de vue de la pure logique, il n'y a aucune raison
de préférer l'une de ces géométries à une autre; mais c'est ici le lieu de se souvenir que si la
géométrie n'est pas une science expérimentale, elle tire de l'expérience ses inspirations : c'est
la comparaison des résultats théoriques aux résultats expérimentaux qui incline le géomètre à
préférer aux autres géométries la géométrie euclidienne.

Conséquence du postulatum d'Euclide :

1. Si deux droites et sont parallèles, toute droite qui coupe l'une coupe
l'autre.

Démonstration :

Soit le point commun à la droite et à la droite : si la droite ne coupait


pas la droite , elle lui serait parallèle, et par le point passeraient deux droites et
parallèles à une même troisième , ce qui n'est pas le cas. Donc, la droite
, coupe la droite .

2. Deux droites et parallèles à une même troisième sont parallèles entre


elles.

Démonstration :

Si la droite n'était pas parallèle à la droite , elle la couperait : elle couperait aussi
la droite parallèle à la droite , elle ne serait donc pas parallèle à .

Théorème : si deux droites parallèles sont coupées par une sécante :

1. les angles alternes-internes sont égaux

2. les angles alternes externes sont égaux

586/2001
Sciences.ch 14/03/2005

3. les angles correspondants sont égaux

Démonstration :

Soient deux parallèles et et la sécante (voir figure ci-dessous) :

1. Par le milieu de menons la perpendiculaire à , qui est aussi


perpendiculaire à . Les triangles rectangles et ont un angle aigu égal à,
et l'hypoténuse égale, . Ils sont égaux, et les angles et
sont égaux.

2. Les angles alternes externes et sont égaux, car est opposée par le
sommet à l'angle , qui est alterne interne avec l'angle .

Réciproque : si deux droites sont coupées par une sécante qui forme avec ces droites :

- soit deux angles alternes internes égaux

- soit deux angles alternes externes égaux

- soit deux angles correspondants égaux, ces deux droites sont parallèles

alors ces deux droites sont parallèles.

Remarque : pour démontrer le parallélisme de deux droites, il faut et il suffit que les angles
alternes internes, alternes externes ou correspondants, formés par ces deux droites avec une
sécante, soient égaux.

Définition : nous disons que deux segments ou deux demi-droites sont parallèles
lorsque les droites sont parallèles. Nous disons que deux demi-droites
sont parallèles et de "même sens" lorsqu'elle sont placées d'un même côté par
rapport à la droite qui joint leurs origines.

CERCLES

Définition : nous appelons "cercle" le lieu géométrique des points du plan qui sont à une
distance donnée , appelée "rayon" de ce cercle, d'une point fixe , appelé "centre" de ce
cercle.

587/2001
Sciences.ch 14/03/2005

Le mot "rayon" désigne soit le segment , soit sa mesure .

Nous appelons "diamètre" d'un cercle toute droite qui passe par le centre du cercle. Tout
diamètre rencontre le cercle en deux points et , définis par , que nous
appelons "extrémités du diamètre". Nous réservons la notations "diamètre " pour le
diamètre d'extrémités et . Nous disons que deux points d'un cercle sont "diamétralement
opposés" quand ils sont les deux extrémités d'un même diamètre.

Un cercle divise le plan en deux régions : celle qui contient le centre, que nous appelons
"intérieure", et celle qui ne le contient pas, que nous appelons "extérieur".

Théorème : la condition nécessaire et suffisante pour qu'un point soit strictement intérieur
à un cercle , de centre et de rayon , est .

Démonstration :

1. La condition est nécessaire : Si, par hypothèse, est à l'intérieur du cercle , il est situé
soit en , soit entre les extrémités et du diamètre délimité par le lieu géométrique des
points . S'il est en , la proposition est évidente, s'il n'est pas en , il est entre et par
exemple, et nous avons , c'est-à-dire .

2. La condition est suffisante : Si, par hypothèse , se trouve entre les extrémités
et des lieux géométriques définis par les points , donc à l'intérieur du cercle .

Corollaires : la condition nécessaire et suffisante pour que soit extérieur au cercle est
.

Nous appelons "corde" d'un cercle le segment dont les extrémités et sont sont sur
ce cercle.

Théorème : la médiatrice d'une corde est un diamètre

Démonstration (voir figure ci-dessous) : La médiatrice de , corde du cercle de centre


et de rayon , passe par le point parce que comme nous l'avons démontré lors de notre
étude des triangles nous avons .

Corollaire : la perpendiculaire menée par le centre d'un cercle à une corde passe par le

588/2001
Sciences.ch 14/03/2005

milieu de cette corde.

Théorème : par trois points non alignés, il passe un cercle et un seul.

Démonstration (voir figure ci-dessous) : Tracer la médiatrice de et la médiatrice


de . Si et étaient parallèles, la perpendiculaire à serait
perpendiculaire à , donc confondue avec . seraient alignés. Donc et
non parallèles se coupent en un point :

1. Il passe un cercle par : le point étant sur , médiatrice de , par


définition : le point étant sur , médiatrice de , . Le cercle , de centre
et de rayon , passe par (puisque ) et par (puisque ). Il passe
donc par .

2. Il ne passe qu'un seul cercle : S'il passait par un cercle différent du cercle
de centre et de rayon , son centre se trouverait sur la médiatrice de et de
qui sont deux cordes de ce cercle; il serait donc confondu avec .

Remarque : la médiatrice de , corde du cercle , passe par le point . Nous pouvons


donc dire (résultat important) que les trois médiatrices des côtés d'un triangle
concourent.

BARYCENTRE

Remarques :

R1. La définition du barycentre nécessite certains des outils mathématiques définis dans le
chapitre de calcul vectoriel de la section d'algèbre du site. La lecture de ce chapitre est donc
recommandée si le lecteur souhaite comprendre ce qui va suivre.

R2. Les développements qui vont suivre aussi bien utilisé en géométrie qu'en physique mais
avec une prédominance pour ce premier.

Définition : nous appelons "barycentre" ou encore en physique "centre de gravité" des points
du plan ou de l'espace affectés respectivement des coefficients ( où les
sont des réels tels que ) l'unique point tel que :

589/2001
Sciences.ch 14/03/2005

Le couple noté est appelé "point pondéré" ("point massif" en physique quand
représente une masse).

Remarques :

R1. Sur ce site, nous parlerons toujours de "centre de gravité" pour désigner aussi bien ce
dernier que le "barycentre".

R2. Lorsque pour tout point massif nous avons , nous parlons
alors de "isobarycentre".

Pour un point arbitraire, nous avons bien évidemment par simple addition vectorielle :

d'où le résultat majeur :

Remarque : en passant à la limite, nous avons :

Nous pouvons très bien également travailler avec les éléments de surface ou de volumes (pour
ne faire mention que des plus triviaux) pour déterminer le centre de gravité :

et

Dans l'espace muni d'un repère en notant les coordonnées du point


pondéré et celles de , nous avons alors :

590/2001
Sciences.ch 14/03/2005

Voyons quelques propriétés du centre de gravité :

P1. Soit , points pondérés. Si , nous avons alors pour


tout point :

Démonstration :

Puisque par définition du centre de gravité :

nous avons alors bien :

P2. Pour , les points pondérés et


ont même centre de gravité car :

(invariance du centre de gravité)

La démonstration est évidente (si vous ne voyez pas, contactez-nous).

P3. Le centre de gravité de points pondérés est invariant quand on remplace d'entre
eux, par leur centre de gravité , affecté de la condition de leur coefficient,

591/2001
Sciences.ch 14/03/2005

est alors le centre de gravité de :

Démonstration :

Si est le centre de gravité des points pondérés alors :

Pour le cas particulier où :

Or étant le centre de gravité des points pondérés donc :

Comme l'égalité précédente prouve que bien que est le centre de gravité

des points pondérés :

P4. Si , pour tous points :

Démonstration :

Pour calculons :

592/2001
Sciences.ch 14/03/2005

puisque , nous avons alors :

Remarques : quand un corps a une certaine symétrie, les calculs se simplifient car le centre de
gravité doit coïncider avec l'élément de symétrique. Si un corps, comme une sphère, un
parallélépipède, etc., a un centre de symétrie, le centre de gravité est confondu avec lui. Si le
corps a seulement un axe de symétrie, le centre de gravité est alors sur cet axe.

AXIOMATIQUE D'EUCLIDE-HILBERT

Dans le texte précédent nous avons présenté un par un, de manière diffuse les cinq axiomes
d'Euclide et toutes les définitions élémentaires de la géométrie. En souhaitant faire honneur
aux "Eléments" d'Euclide et à son travail, nous avons souhaité énumerer tous ces derniers de
façon condensée :

AXIOMES D'EUCLIDE

A1. Etant donnés deux points et , il existe une droite passant par et

A2. Tout segment est prolongeable en une droite passant par et

A3. Pour tout point et tout point distinct de , on peut décrire un cercle de centre
passant par

A4. Tous les angles droits sont égaux entre eux

A5. Par un point extérieur à une droite, nous pouvons mener une parallèle et une seule à cette
droite

Outre les axiomes, il y a des définitions qui permettenat au mathématiciens de conceptualiser


mathématiquement le langage commun.

DÉFINITIONS D'EUCLIDE

Nous énumérons ici les définitions telles que Euclide les a énoncées :

D1 : Un "point "est ce dont la partie est nulle.

D2 : Une "ligne" est une longueur sans largeur.

593/2001
Sciences.ch 14/03/2005

D3 : Les extrémités d'une ligne sont des points.

D4 : Une ligne droite est celle qui est également placée entre ses points.

D5 : Une surface est ce qui a seulement longueur et largeur.

D6 : Les extrémités d'une surface sont des lignes.

D7 : Une "surface plane" est celle qui est également placée entre ses droites.

D8 : Un "angle plan" est l'inclinaison mutuelle de deux lignes qui se touchent dans un plan et
qui ne sont point placées dans la même direction.

D9 : Et lorsque les lignes qui comprennent cet angle sont des lignes droites, l'angle est appelé
"rectiligne".

D10 : Lorsqu'une droite tombant sur une droite forme deux angles adjacents égaux entre eux,
chacun des angles égaux est droit, et la droite placée au-dessus est dite "perpendiculaire" à
celle sur laquelle elle est placée.

D11 : Un angle "obtus" est celui qui est plus grand qu'un droit.

D12 : Un angle "aigu" est celui qui est plus petit qu'un droit.

D13 : Nous appelons "limite" ce qui est l'extrémité de quelque chose.

D14 : Une "figure" est ce qui est compris par une seule ou par plusieurs limites.

D15 : Un "cercle" est une figure plane, comprise par une seule ligne que nous nommons
"circonférence" telle que toutes les droites qui y sont menées à partir d'un des points placés
dans cette figure sont égales entre elles.

D16 : Et ce point se nomme le "centre" du cercle.

D17 : Un "diamètre" du cercle est une droite menée par le centre et terminée de part et d'autre
par la circonférence du cercle de telle sorte qu'il partage le cercle en deux parties égales.

D18 : Un "demi-cercle" est la figure comprise par le diamètre et la portion de la circonférence


soutendue par le diamètre, et le centre du demi-cercle est le même que celui du cercle.

D19 : Les figures rectilignes sont celles qui sont terminées par des droites : les figures
trilatères sont terminées par trois droites, les quadrilatères par quatre, et les multilatères par
plus de quatre.

D20 : Parmi les figures trilatères, un triangle équilatéral est celle qui a ses trois côtés égaux,
un triangle isocèle, celle qui a seulement deux côtés égaux, et un triangle scalène, celle qui a
ses trois côtés inégaux.

D21 : De plus, parmi les figures trilatères, un triangle rectangle est celle qui a un angle droit,
un triangle obtusangle, celle qui a un angle obtus, un triangle acutangle, celle qui a ses trois
angles aigus.

594/2001
Sciences.ch 14/03/2005

D22 : Parmi les figures quadrilatères, un carré est celle qui est équilatérale et rectangulaire, un
rectangle, celle qui est rectangulaire et non équilatérale, un losange, celle qui est équilatérale
et non rectangulaire, un parallélogramme, celle qui a ses côtés et ses angles opposés égaux
entre eux et qui n'est ni équilatérale ni rectangulaire ; les autres quadrilatères, ceux-là
exceptés, se nomment trapèzes.

D23 : Les parallèles sont des droites qui, étant situées dans un même plan et étant prolongées
à l'infini de part et d'autre, ne se rencontrent ni d'un côté ni de l'autre.

Remarque :

Des imperfections de la construction d’Euclide sont remarquées dès l’Antiquité. Parmi les
axiomes, le cinquième (l'axiome des parallèles) fut le plus critiqué; certains continuateurs et
commentateurs d’Euclide avaient cherché à démontrer d’autres axiomes (par exemple celui de
l’égalité des angles droits et ainsi la non-indépendance) ou avaient reconnu l’insuffisance de
certaines définitions comme celles de la droite et du plan.

Toutefois, malgré les critiques que nous soulignons ci-dessous, jusqu’au 18ème siècle, les
Éléments ont été en général acceptés. C'est au 18ème siècle que sont apparues les géométries
non-euclidiennes et la violation du cinquième axiome. De son côté Leibniz remarque
qu’Euclide utilise l’intuition géométrique sans le mentionner explicitement (par exemple
lorsqu’il admet que deux cercles dont chacun passe par le centre de l’autre ont un point
commun; propriété utilisée pour la construction d’un triangle équilatéral par exemple). Gauss
remarque l’importance de "entre", relation qui n’est pas définie et qui, d’ailleurs, pose
problème sur la sphère.

Arrive le 18ème siècle, où l’on s’attache à la rigueur mathématique. Les critiques de la


construction euclidienne, dans le cadre imposé, se multiplièrent, dans le mouvement général
vers plus de rigueur en mathématiques. Elles ne visent d’ailleurs pas la correction des
inférences d’Euclide au cours de ses démonstrations, mais le fait que ces dernières sont
insuffisamment fondées.

Le sentiment général était qu’en complétant convenablement ces bases des raisonnements, on
arriverait à un exposé entièrement satisfaisant. C’est ce travail que réalisèrent Pasch et Hilbert
à la fin du 19ème siècle.

Entre 1890 et 1910, de nombreux mathématiciens donnent des présentations variées de la


géométrie euclidienne; par exemple, Peano et surtout Hilbert, qui en quelque sorte clôt le
sujet, non seulement donnent des axiomes, mais les classent et s’attachent à montrer la portée
de chacun en construisant des modèles de géométrie vérifiant une partie des axiomes. Mais ce
n'est pas tout, son axiomatique contient une construction complète du corps des réels (ce que
n'avait bien-sûr pas Euclide) basé sur les axiomes d'ordre, de continuité, et de congruence (ce
dernier permettant d'axiomatiser ce que nous avons appelé "déplacement" dans notre étude
préalable).

AXIOMES D'HILBERT

Groupe A : Axiomes d'association

AA1. Pour tous points distincts et , il existe une unique droite passant par et

595/2001
Sciences.ch 14/03/2005

AA2. Toute droite contient au moins deux points distincts

AA3. Il existe au moins trois points non-alignés

Groupe B : Axiome d'ordre

BA1. Si le point est entre les points et , alors sont distincts et est aussi
entre et .

BA2. Pour tous points et distincts, il existe un point tel que est entre et .

BA3. Pour trois points alignées distincts, il en existe un et un seul situé entre les deux autres.

Pour faciliter l'énoncé de l'axiome suivant, nous allons définir une nouvelle notion.

Définition : nous appelons "segment ouvert " l'ensemble de tous les points situés entre
et . Nous appelons "segment fermé " ce même ensemble auquel nous ajoutons
et (ces concepts sont complètement assimilables aux intervalles ouverts et fermés que
nous avons définis en analyse fonctionnelle).

BA4. (Axiome de Pasch) Soient trois points non-alignés, et une droite. Si


contient un point de , alors elle contient soit un point de , soit un point de
.

Autrement dit (BA4.) : une droite qui entre par l'un des trois côtés d'un triangle doit ressortir
par l'un des deux autres côtés)

Groupe C : Axiome de congruence

Remarque : intuitivement "congruent" noté " " signifie en géométrie "superposable"

CA1. Pour toutes droites et et tous points et distincts de , et de , il existe


un unique couple de point distincts de tels que , et
.

CA2. Si et alors

CA3. Si alors

Remarques :

R1. Ces axiomes permettent de comparer les segments, et aussi les angles de définir le milieu
d'un segment, les droites orthogonales, de parler de triangles équilatéraux, isocèles, etc...Ils
permettent également de définir rigoureusement les déplacements dont Euclide faisait si
souvent usage sans les avoir définis.

R2. Ces axiomes permettent aussi d'énoncer le fait suivant : Pour toute droite et tout point
sur , partage les points de en trois classes distinctes que nous définissons comme
étant respectivement deux demi-droite d'origine et le point lui-même. Ayant défini les

596/2001
Sciences.ch 14/03/2005

demi-droites, on peut définir les angles : c'est juste un couple de demi-droites de même
origine et grâce à l'axiome de Pasch, nous pouvons parler de droites passant à l'intérieur ou à
l'extérieur d'un angle.

Groupe D : Axiomes de continuité

DA1. (axiome d'Archimède) Soient et deux segments quelconques. Alors il


existe une suite finie de points : appartenant à la droite et tels que
, avec (en d'autres termes : nous
pouvons former un segment plus grand que en mettant bout-à-bout suffisamment de
segments courants à .

DA2. (axiome de Cantor) Si et sont deux suites infinies de points telles que
et telles que , alors il existe un point
appartenant à tous les segments (en d'autres termes : soit une suite de segments
emboîtés dont la longueur tend vers 0 : alors il y a un point commun à tous les segments).

Remarque : ces axiomes permettent d'établir une correspondance entre les points d'une droite
et l'ensemble des nombres réels. Les axiomes jusqu'à présent énoncés permettent de
démontrer des théorèmes qui sont communs à la géométrie d'Euclide et à celle de
Lobatchevski (géométrie non-euclidienne de type hyperbolique). Nous appelons parfois la
théorie issue de ces axiomes "la géométrie absolue''.

Groupe E : Axiome des parallèles

EA1. Nous disons que deux droites sont parallèles lorsqu'il n'existe aucun point appartenant
simultanément aux deux droites

EA2. Soit une droite et un point n'appartenant pas à . Il passe une et une seule droite
par qui soit parallèle à .

Remarque : l'ajout de l'axiome EA1. permet de satisfaire aux particularités des géométries
non-euclidiennes sans être exclusif. L'axiome EA2. sans pouvoir être vérifié dans certaines
géométrie non-euclidienne ne violent pas ce dernier.

Il existe cependant une autre axiomatique beaucoup plus abstraite et générale que nous
appelons les "axiomes de Bachmann" et que nous ne présenterons pas pour l'instant car elle
fait appel à des outils de la théorie des ensembles que nous n'avons pas encore définis sur ce
site.

TRANSFORMATIONS DANS LE PLAN

Les transformations dans le plan (et plus) sont habituellement définies rigoureusement à l'aide
de la théorie des groupes mais nous les outils nécessaires pour cela n'ont pas encore été
présentés sur ce site. Nous ferons donc dans ce chapitre uniquement une très peu formelle
(donc plus intuitive) aux opérations et propriétés de transformations dans le plan.

Cette partie du site est encore pauvre donc le lecteur nous excusera des raccouris que nous
nous sommes parfois permis de prendre mais cela évoluera nous l'espérons dans le bon sens.

597/2001
Sciences.ch 14/03/2005

Remarque : par définition, "l'isométrie" est une transformation qui conserve les distances et
les aires. Comme nous le verrons ci-après, la translation, la rotation et la réflexion sont des
isométries, l'homothétie n'étant elle pas du tout une isométrie dans le plan.

TRANSLATION

Soit une droite dans un plan sur laquelle deux points et définissent un segment de la
droite noté .

Définition : une translation ("déplacement" dans une direction donnée comme disait
Euclide) de ce segment de droite associe à chaque point et de nouveaux points '
tels que . Nous pouvons donc restreindre la notion de translation à un point
uniquement tel que nous puissioins écrire mathématiquement:

Autrement dit, une fonction de transformation de type translation de l'ensemble du plan à lui-
même associe à chaque pré-image au plus une seule et unique image. La translation est donc
une fonction bijective. Nous pouvons donc définir une application de transformation
réciproque notée telle que (rappel de ce qui a été vu en arithmétique) :

Nous disonspar définition qu'un point est "invariant par translation" si et seulement si :

Dans un autre type de formalisme, le déplacement du point au point selon le vecteur


est appelé "translation de vecteur" . Elle se traduit mathématiquement par la somme
des coordonnées du point et de la matrice des coordonnées du vecteur.

Par exemple dans un espace à trois dimensions:

La translation n'étant pas une transformation linéaire (voir chapitre d'algèbre linéaire), nous ne
pouvons nous autoriser à la représenter dans une matrice carrée (2x2 dans le plan ou 3x3 dans
l'espace).

HOMOTHÉTIE

Soit une forme quelconque dans le plan (point, droite, ovale, polygone,...), un nombre , et
un point placé à un endroit prédéfini.

Définition : une "homothétie" (appelée aussi "changement d'échelle") de rapport et de


centre est l'application qui à chaque point de la forme associe au segment un
nouveau point colinéaire à mais disposé à une distance supérieure ou inférieure de
rapport par rapport au centre tel que

598/2001
Sciences.ch 14/03/2005

Nous pouvons restreindre la notion de translation à un segment de droite tel que nous
puissions écrire mathématiquement:

Autrement dit, une fonction de transformation de type homothétie de l'ensemble du plan à lui-
même associe à chaque pré-image au plus une seule et unique image. L'homothétie est donc
une fonction bijective. On peut donc définir une application de transformation réciproque
notée telle que :

Si , alors est le seul point invariant. Si , alors tous les points sont invariants et
l'homothétie est dite de type "identité". Si , alors nous disons alors que nous avons une
"symétrie centrale".

Dans un autre type de formalisme, une homothétie de centre et de rapport , associe au


point un point tel que . Le point se trouvant sur la droite et à une
distance . Le signe de détermine la position de par rapport à O.

Nous nous permettons maintenant de faire un petit passage dans la géométrie spatiale (le saut
n'étant pas bien grand et nécessitant juste la connaissance du calcul vectoriel) :

Nous pouvons également peut remplacer ici le scalaire par une matrice 3x3 tel que:

une solution triviale est de poser que d'où la forme matricielle


diagonale évidente de :

599/2001
Sciences.ch 14/03/2005

Cette matrice est appelée "matrice de transformation par homothétie de centre (origine du
repère) et de rapport ".

Remarque : dans le cas présenté précédemment, l'homothétie conserve les formes dans toutes
les axes (sa géométrie est invariante par transformation) nous utilisons en effet le même
facteur pour tous les axes. Mais nous pourrions également utiliser la matrice suivante:

qui elle déformerait l'objet selon un facteur différent pour chaque axe.

La transformation inverse est bien évidemment l'homothétie de centre et de rapport


soit sous la forme d'une matrice:

Lorsque le centre d'homothétie ne coincide pas avec l'origine du repère choisi (ce qui arrive
quasiment tout le temps), la procédure de calcul des coordonnées du point image est très
simple. Il faut :

1. Réaliser une translation pour faire correspondre le centre de l'homothétie avec l'origine du
repère et appliquer cette translation à tous les points en jeu.

2. Réaliser l'homothétie proprement dite comme décrit précédemment (le centre est l'origine
du repère).

3. Réaliser la translation inverse pour ramener le centre et l'image à sa place.

Nous obtiendrions ainsi :

ROTATION

Soit une forme quelconque dans le plan (point, droite, ovale, polygone), un nombre , et un
point placé à un endroit prédéfini.

Définition : une rotation d'angle et de centre l'application qui à chaque point de


la forme associe au segment un nouveau point mais ayant subie une rotation positive ou
négative d'angle et de centre tel que et ont même longueur mais pas même

600/2001
Sciences.ch 14/03/2005

direction.

La rotation est également une application bijective dans le plan, nous pouvons donc
également définir une application de transformation réciproque notée .

Si , alors est le seul point invariant. Si (avec ), alors tous les points
sont invariants et la rotation est dite de type "identité". Si nous choisissons un système d'axes
perpendiculaires adéquat tel que leur intersection se confonde avec et que alors
est dite une "symétrie centrale".

Dans un autre type de formalisme, la rotation s'exprime de manière beaucoup plus rigoureuse.
Nous allons nous aider du dessin d'un cercle de rayon unité (donc dans le plan) pour étudier
ce type de transformation. Nous allons considérer le premier cas ou l'origine du repère et de la
translation son confondus :

où ' est l'image par la rotation de centre et d'angle .

Nous avons dans le plan pour le point (voir le chapitre traitant de la trigonométrie) :

et identiquement pour le point ':

avec .

Ce qui nous amène à écrire:

601/2001
Sciences.ch 14/03/2005

Identiquement (en sa basant sur le fait les relations trigonométriques élémentaires présentées
dans le chapitre de trigonométrie du site sont connues), nous trouvons :

ce qui nous permet d'écrire la matrice de rotation dans le plan:

La transformation inverse consiste très simplement à la rotation de centre (le même


qu'auparavant) et d'angle . Cela correspond à la matrice (nous utilisons à nouveaux les
relations trigonométriques évidentes des angles opposés):

Lorsque nous souhaitons procéder à une rotation autour d'un point quelconque, tout comme
pour l'homothétie, il convient de réaliser une translation de vecteur ( étant l'origine du
repère de l'homothétie ) pour faire confondre et , puis de réaliser la rotation simple
autour de , et enfin de ramener (confondu alors avec ) à son point de départ.

Lors de la rotation d'un objet dans l'espace (nous profitons de la lancée...), la transformation
est assez similaire à la précédente mais définie par rapport à deux angles :

602/2001
Sciences.ch 14/03/2005

Soient et (il est pour nous plus conventionnel d'utiliser que ). Lors
d'une rotation d'angle , la coordonnée ne change pas. Ce qui nous amène à écrire la
matrice de rotation dans l'espace tridimensionnel par rapport au plan comme étant:

Lors d'une rotation d'angle , nous voyons bien que les coordonnées doivent changer à
cause du fait que la projection du vecteur sur le plan est dépendant de cet angle. Ce qui
nous amène à écrire les matrices de rotation dans l'espace tridimensionnel par rapport à l'axe
comme étant:

Nous avons donc finalement trois matrices de rotation correspondant chacune à un des plan
de l'espace tridimensionnel. Si nous cherchons à réaliser la composition d’une
rotation et d'une homothétie d’échelle (dans cet ordre) la matrice de transformation
sera :

Remarque : nous rappelons que la multiplication de 2 matrices n’est pas commutative

RÉFLEXION

Définition : la réfexion notée " " (en géométrie...) par rapport à la droite est l'application
qui associe à chaque point extérieur à le point ' tel que soit la médiatrice de
. Si appartient à , alors . Mathématiquement:

Autrement dit, une fonction de transformation de type réflexion de l'ensemble du plan à lui-
même associe à chaque pré-image au plus une seule et unique image. La réflexion est donc
une fonction bijective. Nous pouvons donc définir une application de transformation
réciproque notée telle que:

603/2001
Sciences.ch 14/03/2005

Remarque : tous les points de sont trivialement invariants par la réflexion dans le plan.

604/2001
Sciences.ch 14/03/2005

GÉOMÉTRIE NON-EUCLIDIENNES

Les géométries non-euclidiennes sont toutes les géométries qui satisfont non nécessairement
tous les axiomes de Hilbert (voir chapitre de géométrie euclidienne) mais sans en contredire
aucune (contrairement aux anciens axiomes d'Euclide et en particulier le cinquième).

Avant d'aborder ce chapitre, nous recommandons vivement au lecteur d'avoir lu et compris les
chapitres traitant du calcul tensoriel, de trigonométrie et de géométrie euclidienne car nous
allons utiliser grand nombre de résultats, non nécessairement triviaux, que nous avons pu y
démontrer

En géométrie euclidienne, nous avons étudié à certain nombre de théorèmes relatifs aux plans.
Insistons maintenant sur le fait que le "plan" et une figure bi-dimensionnelle plongée dans un
espace à 3 dimensions (donc le plan peut dès lors s'orienter) dont la courbure est nulle. Ceci
précisé, il convient peut-être de définir plus rigourseusement ce qu'est le concept intuitif de
"courbure".

Définition : une figure est dite "courbe" s'il existe au moins en un point se situant sur la ou les
droites, surfaces, volumes, ... la délimitant une tangente non confondu au délimitateur et donc
tangent en un seul point.

Nous allons voir dans ce chapitre différentes géométries non-euclidiennes dont les plus
connues sont les géométries riemannienne (à courbure constante) et les géométries de
lobatchevski (de type hyperbolique donc à courbure non-constante).

L'intérêt de l'étude de ces géométries est que nous ne pouvons déterminer si l'Univers dans
lequel nous vivons est fait d'un type de géométrie plutôt que d'un autre car étant donné notre
taille (physique), plongés que nous sommes dans quelque géométrie que ce soit à faible
courbure, toute surface de l'espace nous semble localement euclidienne (deux droites
parallèles ne se coupent pas). Cependant, la relativité générale, qui fait usage à outrance du
calcul tensoriel (généralisation de n'importe quelle géométrie) montre qu'il existe des zones de
l'espace où la géométrie est très fortement courbée et donc localement non-euclidienne et
seulement l'étude de ce genre de géométries nous permet de tirer des théories expliquant des
observations qui ne sont pas exploitables uniquement avec l'intuition humaine.

ESPACES DE RIEMANN

Pour mieux comprendre ce qu'est un espace de Riemann, nous allons de suite passer par un
petit exemple d'une surface à deux dimension (exemple très classique) :

Considérons une sphère de rayon , de surface , située dans l'espace ordinaire à trois
dimensions. Les coordonnées cartésiennes d'un point de la surface peuvent
s'exprimer, par exemple, en fonction des coordonnées sphérique . La sphère est
entièrement décrite pour un rayon donné et et .

Trois tels paramètres, permettent de déterminer un point sur la surface d'une sphère, sont nous
le savons (voir le chapitre traitant du calcul tensoriel) des coordonnées curvilignes sur la
surface ou également dites "coordonnées de Gauss" (Gauss étant un des premier
mathématicien à s'intéresser à l'étude des corps plongés dans les espaces non-euclidiens).
D'autres paramètres quelconques peuvent évidemment être choisis comme

605/2001
Sciences.ch 14/03/2005

coordonnées curvilignes sur la surface.

L'élément linéaire de la surface , carré de la distance entre deux points infiniment voisins
, s'écrit en fonction des coordonnées sphériques, comme nous l'avons démontré dans le
chapitre traitant de la relativité générale (et en partie dans le chapitre de calcul tensoriel) :

Nous obtenons ainsi une expression de l'élément linéaire en fonction des trois seules
coordonnées de Gauss . Nous pourrions bien sûr imposer le rayon comme étant un
constante ainsi l'élément linéaire ne serait plus fonction que de .

Etant écrire à l'aide des trois paramètres, la surface de la sphère (considérée comme un espace
à deux dimensions) constitue un exemple d'espace de Riemann à deux dimensions:

L'élément linéaire de cet espace est étant de la forme générale (voir le chapitre traitant du
calcul tensoriel) :

où les sont bien évidemment les composantes contravariantes du vecteur par


rapport au repère naturel .

Supposant sur une sphère constant et posant et , nous obtenons par


identification :

Les quantités avec constituent les composantes d'un tenseur qui est le tenseur
fondamental (ou la "métrique riemannienne") de l'espace riemannien formé par la surface
de la sphère.

Les propriétés géométriques des figures tracées sur la surface d'une sphère ne sont plus celles
de la géométrie euclidienne. Ainsi, le plus courte chemin d'un point à un point , sur la
surface sphérique, est constitué par un arc de grand cercle passant par les points et . Les
arcs de grand cercle jouent le même rôle pour la sphère que les droites dans le plan. Ce sont
les "géodésiques" de la sphère.

Remarque : l'étude des figures sur des surfaces riemanniennes fait partie de la géométrie
différentielle à laquelle nous consacrons un chapitre entier dans cette section.

Rappelons également pour souvenir les tenseurs fondamentaux de quelques autres géométries
riemanniennes classiques (elles ont toutes été démontres dans le chapitre de calcul tensoriel et
de relativité générale ) :

- La sphère :

606/2001
Sciences.ch 14/03/2005

- Le cylindre :

Mais considérons à présent un surface quelconque de coordonnées . Les coordonnées


cartésiennes de l'espace ordinaire où se trouve plongée cette surface s'écrivent de
manière générale :

Il découle très facilement de calculs que nous avons effectué dans le chapitre de calcul
tensoriel que l'élément linéaire s'écrit alors (si ce n'est pas évident pour vous n'hésitez pas
nous le faire savoir et nous détaillerons alors les calculs), en fonction des variables :

avec :

Remarque : l'expression donnée ci-dessus de l'élément linéaire s'appelle"forme quadratique


fondamentale" de la surface considérée. Les coefficients sont des fonctions des
coordonnées curvilignes. De manière générale cette surface, considérée comme un espace à
deux dimensions, constituera un exemple d'espace de Riemann, pour des coordonnées
curvilignes arbitraires.

Remarque : les différents espaces de Riemann constituent ce que nous appelons sous une
forme générale (parce qu'il n'y pas que des espaces de type riemannien à courbure constante)
une "variété" munie d'une métrique riemannienne. Une variété peut être définie (non
formellement), par exemple, par un ensemble de points situés dans un espace préexistant. De
manière générale une surface donne l'idée d'une variété à deux dimensions. La sphère et le
tors sont des variétés à deux dimensions sans frontière. Un cylindre de révolution, un
paraboloïde hyperbolique, sont des variétés à deux dimensions ouvertes, avec frontières à
l'infini. Mais nous pouvons aussi envisager des variétés abstraites. C'est le cas par exemple
d'un espace de configuration. Il s'agit alors d'un espace de points à dimensions représenté
par un ensemble (ou noté )de coordonnées généralisées (voir l'introduction au
formalisme lagrangien dans la section de mécanique analytique), ces dernières pouvant avoir
des valeurs comprises dans un domaine fini ou non.

Nous pouvons maintenant mieux définir ce qu'est un espace de Riemann.

Définition : un espace de Riemann est une variété à laquelle nous avons attaché une métrique.
Cela signifie que, dans chaque partie de la variété, représentée analytiquement au moyen d'un

607/2001
Sciences.ch 14/03/2005

système de coordonnées , nous nous sommes donnés une forme différentielle quadratique :

qui constitue la métrique de l'espace.

Les coefficients ne sont pas entièrement arbitraires et doivent vérifier, nous l'avons
démontré dans le chapitre de calcul tensoriel, les conditions suivantes :

C1. Les composantes sont symétriques .

C2. Le déterminant de la matrice est différent de zéro.

C3. La forme différentielle de l'élément linéaire, et par conséquent le concept de distance


défini par les , est invariantes vis-à-vis de tout changement de coordonnées.

C4. Toutes les dérivées partielles d'ordre deux des existent et sont continues donc de
classe .

Un espace de Riemann est donc un espace de points, chacun étant repéré par un système de
coordonnées , doté d'une métrique quelconque telle que la forme différentielle de
l'élément linéaire vérifiant les conditions précédentes. Cette métrique est dite dès lors
"riemannienne".

Remarques :

R1. Si la métrique est définie positive, c'est-à-dire si pour tout vecteur non nul,
nous disons que l'espace est "proprement riemannien". Dans ce cas, le déterminant de la
matrice est strictement positif et toutes les valeurs propres de la matrice sont
strictement positives.

R2. Par définition, nous disons qu'une métrique d'un espace est euclidienne lorsque tout
tenseur fondamental de cet espace peut être ramené, par un changement approprié de
coordonnées, à une forme telle que (voir chapitre de calcul tensoriel) la base orthonormée
canonique : .

R3. La définition des espaces riemanniens montre que l'espace euclidien est un cas très
particulier de ces espaces. Il n'existe donc qu'un seul espace euclidien alors que nous pouvons
créer une infinité d'espaces riemanniens.

608/2001
Sciences.ch 14/03/2005

GÉOMÉTRIE PROJECTIVE

Depuis Chasles et jusque dans les années 1930, la géométrie projective était souvent
synonyme de "géométrie supérieure". Elle s'opposait à la géométrie euclidienne :
élémentaire... , et analytique. A l'époque de Monge, de Carnot, de von Staudt, on parlait aussi
de "géométrie de position" ou de "situation". Ces géométries étudient les figures au point de
vue de leurs positions respectives et des propriétés invariantes qui les lient dans une
transformation géométrique (rotation, symétrie, homothétie,...), homographique tout
particulièrement. Outre la division harmonique, notion de base, elle fait appel au célèbre
rapport anharmonique (birapport), à l'inversion, l'involution, la transformation par polaires
réciproques, la projection stéréographique, la corrélation, l'homologie, la dualité, les coniques,
etc. (voir plus loin dans ce texte pour les définitions)

La géométrie projective, certes supérieure car assez ardue, permet d'établir de façon élégante
des résultats de la géométrie élémentaire (géométrie descriptive, géométrie spatiale, ...).
Désireuse de théoriser et compléter avec rigueur la géométrie euclidienne, mettant à mal le
5ème postulat et usant elle-même d'un principe assez flou (principe de continuité), elle n'a pas
complètement convaincu malgré les efforts de Klein et son programme d'Erlangen visant à
l'intégration des diverses géométries (euclidiennes et non euclidiennes) dans une même
théorie unificatrice basée sur les groupes de transformation. Ses travaux marqueront un point
final à son extension.

Cette géométrie très abstraite en dehors de quelques généralités et principes de base exposés
ci-dessous, est relativement difficile à appréhender et requiert, avant de s'y plonger, une bonne
connaissance en géométrie élémentaire voire, dans l'espace, une parfaite maîtrise de l'espace
tridimensionnel, dans le cycle observation-représentation-interprétation. Ceci nous amené à
introduire certains concepts qui n'ont normalement pas leur place ici mais qui nous le
pensons, peuvent aider grandement l'intéressé à mieux comprendre cette branche des
mathématiques.

Dans un premier lieu, nous allons étudier les concepts élémentaires de la perspective en
s'attardant particulièrement sur le concept de présentation "projective" (il existe d'autres
méthodes de perspective empiriques : cavalière, isométrique, militaire, … mais ces dernières
n'ont pas de sens mathématique ou réel même si elle représentent assez convenablement des
objets volumiques). Ensuite, nous étudierons les représentations mathématiques de quelques
objets tri-dimensionnel dans le cadre d'applications pour enfin passer à l'étude de la géométrie
projective dure. Enfin, nous étudierons la mathématique utilisé dans la représentation
informatique des formes géométriques (splines, courbes de bézier, etc...)

Remarque : la "géométrie descriptive" est une forme artistique rigoureuse de la géométrie


projective mais non formelle (dans le sens qu'elle ne s'étudie pas avec des êtres
mathématiques).

PERSPECTIVE CONIQUE (CENTRALE)

Un des problèmes de l'étude des volumes tri-dimensionnels et de leur représentation est le


concept de "perspective". Effectivement, l'être humain ne peut voir les 3 dimensions d'un
objet, c'est le cerveau qui interprète les ombres et reflets d'un objet afin que nous
l'interprétions comme ayant un volume (il existe des illusions d'optique qui vont dans ce
sens…: les trompe l'œil).

609/2001
Sciences.ch 14/03/2005

Nous allons nous intéresser à la "perspective conique", aussi appelée "perspective centrale" ou
encore "linéaire".

Remarque (importante) : dans le domaine de la géométrie projective nous ne parlons pas de


"perspective conique" mais de "projection conique".

La perspective conique est par construction la représentation la plus proche de nos perceptions
visuelles, elle permet notamment de voir une sphère comme un cercle (au moins en première
approximation, si la sphère n'est pas placée trop en marge du champ de vision ; pour avoir
toujours des cercles, il faudrait projeter non sur un plan mais une sphère, modélisant mieux la
rétine).

La perspective conique est celle des peintres de la Renaissance. C'est aussi celle qui apparaît
sur une photo.

La difficulté de la représentation en perspective est de traduire dans un plan (celui de la feuille


de papier par exemple) une construction qui est définie - de manière assez simple, d'ailleurs -
dans l'espace à l'aide d'outils mathématiques.

Une projection conique de l'espace à 3 dimensions usuel est donc transformation projective
qui envoie tous les points de cet espace sur un même plan de cet espace. Elle nécessite la
donnée d'un point O (équivalent à la position de l'oeil de l'observateur) et d'un plan de
projection dit "tableau" (la Vitre de Dürer, l'équivalent de la rétine).

Nous verrons lors des développements théoriques que contrairement aux projections affines
(voir le sous-chapitre suivant), la projection conique ne conserve pas le barycentre (donc les
rapports de longueurs sur une droite donnée) mais elle conserve l'alignement et le birapport.

Lorsqu'on parle de perspective à conique, on utilise quelques plans et droites particuliers dans
l'espace tri-dimensionnel :

- Le plan du tableau (ou vitre de Dürer), noté , est le plan sur lequel on fait le dessin.

- Le plan du sol, noté , est un plan fixé, perpendiculaire à .

- Le point de vue, noté , est un point hors de et de : c’est le point où devra se placer
l’oeil pour que le dessin sur coïncide avec l’image réelle.

- Le plan de l’horizon, , est le plan parallèle à passant par .

- La ligne d’horizon, , est l’intersection de et de .

- La ligne de terre, , est l’intersection de et de .

- Un plan ou une droite parallèles à sont appelés "horizontaux".

- Un plan ou une droite perpendiculaires à sont appelés verticaux.

- Un plan ou une droite parallèles à sont appelés "frontaux".

610/2001
Sciences.ch 14/03/2005

- Un plan ou une droite perpendiculaires à sont appelés de "bout".

Voici un schéma qui représente ces différentes définitions:

IMAGES DE POINTS

Tout objet volumique (ce qui ne peut être déterminé qu'au touché ou au niveau de l'abstraction
mathématique) composé par un ensemble de points , est à notre cerveau, l'image d'une
projection plane dont le support est une surface dans l'espace se trouvant entre l'objet
observé et notre œil. En mathématique, cette surface est appelée "tableau" et est délimitée
dans sa vue centrale par la ligne d'horizon (là où se situent les points de fuite) et par un
référentiel physique appelée "ligne de Terre" (voir schéma ci-dessous).

611/2001
Sciences.ch 14/03/2005

La hauteur entre la ligne de Terre et le point de vue est appelée la "hauteur d'horizon".

L'objectif à partir de ce schéma est de déterminer mathématiquement une représentation d'un


objet volumique sur une surface (plan dans un cas simple, quelconque sinon) en connaissant
l'équation de la droite entre le point et le point (point de vue) afin d'en déterminer les
coordonnées d'intersection entre cette droite et le tableau.

Nous pouvons du schéma ci-dessus tirer les relations suivantes selon les théorèmes de Thalès
dans les différents triangles:

avec .

Si nous posons les coordonnées du point deviennent:

et

A partir de ces relations, le problème de la représentation plane d'une forme volumique est
complètement résolu, puisque nous pouvons toujours projeter un point (ou la distance entre
deux points) sur un tableau à partir des coordonnées de l'original.

Le terme est communément appelé la "longueur focale" du point de vue à l'écran et les
spécialistes de l'optique le notent habituellement par la lettre .

Pour mieux comprendre ce dernier résultat, nous pouvons nous mettre dans la contexte d'une
étude bi-dimensionnelle où l'observateur est à la hauteur de la ligne de Terre ( ) et
disposé de façon à représenter une personne regardant le tableau (assimilable à un écran télé,
ordinateur ou tout autre) dans lequel nous posons les axes conventionnels et dans le plan
de l'écran et perpendiculairement (ainsi, relativement au premier schéma, devient et
inversement).

Ainsi la relation précédente des rapports devient:

et comme :

Remarque : cette relation est une forme particulière de ce que nous appelons les
"transformations homographiques". Nous reviendrons plus loin sur celles-ci et démontreront
leurs propriétés.

Si le tableau est posé sur l'axe du référentiel, nous avons alors ce qui nous donne :

612/2001
Sciences.ch 14/03/2005

et en procédant de même:

Remarque: ces deux dernières relations sont celles que l'on utilise pour dispenser nos cours de
programmation 3D dans Macromedia Flash.

Nous voyons sur les deux dernières relations un terme identique:

ce terme correspond à la "profondeur" de la perspective.

Dans certains ouvrages, cette profondeur est notée (simple mise en facteur):

Si nous considérons deux points ( ou ) visibles de la surface d'un volume vu par


un observateur et leur distance respective ou , ces grandeurs se conservent si les deux
points se confondent dans le plan du tableau car nous avons alors:

puisque .

Il est intéressant d'étudier quelle doit être la valeur de la focale pour afin d'avoir
ou . Ainsi, si nous prenons la limite:

en appliquant la règle de l'Hospital (dérivée au nominateur et dénominateur) et en se rappelant


que est fixé, alors:

De ce résultat nous pouvons conclure la chose suivante:

613/2001
Sciences.ch 14/03/2005

Pour que tout distance réelle entre deux points non confondus dans le tableau mais se trouvant
dans un même plan aient une distance de projection égale, il faut que les équations des deux
droites qui déterminent leur intersection avec le tableau soient parallèles. Ce qui implique,
puisque l'observateur est un point convergent, qu'il faut éloigner l'observateur à une distance
infinie du plan pour conserver les grandeurs ainsi projetées sur le tableau.

Un très bon exemple pour visualiser ces résultats est de programmer en pseudo-3D sur un
ordinateur.

IMAGES DE DROITES

Déterminons à partir des résultats précédents, l'image d'une droite parallèle à la ligne de Terre
(donc à l'axe ) du tableau assimilable à un écran. Dans ce cas, nous avons:

et pour

ce qui nous donne d'après les relations obtenues précédemment:

Donc toute droite parallèle à la ligne de Terre devient en perspective une droite se trouvant à
une hauteur dans le plan parallèle à de notre écran (on pouvait le deviner
intuitivement…).

Pour toute droite parallèle à l'axe de l'écran (donc dans sa "profondeur"), nous avons:

et pour

ce qui nous donne:

Ces droites d'équation:

passent toutes par le point qui est le "point de fuite principal" et par le
point telle que représenté sur la projection ci-dessous faite dans Adobe
Photoshop (les lignes horizontales ont été rajoutées pour donner l'effet de perspective):

614/2001
Sciences.ch 14/03/2005

A partir de la figure ci-dessus, nous pouvons définir le concept "d'angle de fuite" donné par la
figure ci-dessous:

Une représentation géométrique peut autre peut aider à mieux comprendre le résultat.
Rappelons donc que le point de fuite d'une droite est le point d'intersection du plan du
tableau avec la droite parallèle à passant par . Deux droites parallèles et ont
donc le même point de fuite. Représenté comme ci-dessous:

Si nous notons le point d'intersection de avec , le dessin en perspective de est la


droite , intersection de avec le plan contenant et .Puisque deux droites parallèles
ont le même point de fuite , elles sont donc représentées par deux droites sécantes en .

Pour toute droite quelconque se situant dans le plan de l'écran (donc dans sa
"profondeur"), nous avons:

615/2001
Sciences.ch 14/03/2005

et pour

ce qui nous donne:

De cette dernière équation, nous déduisons:

en portant dans l'expression de :

nous remplaçons et dans l'équation de la droite , et calculs et simplifications


faits, nous trouvons:

Examinons le cas particulier de droites passant par les sommets opposés d'un carrelage, c'est-
à-dire inclinées à donc avec un coefficient directeur (une pente) de .

L'image de ces droites est alors donnée par:

Si , nous avons selon la relation ci-dessus:

cela signifiant que toute projection de droites de coefficient directeur se situant dans le
plan pour constitue des points de fuite secondaires situés sur la ligne d'horizon à une
distance égale de part et d'autre du point de fuite principal tel que représenté ci-dessous (dans
le contexte d'un cours sur Adobe Photoshop, nous y avons rajouté un cube dans cette
perspective):

616/2001
Sciences.ch 14/03/2005

Nous voyons bien dans la figure ci-dessus la symétrie par rapport à l'axe vertical et les deux
points de fuites qui sont l'origine du carrelage.

Considérons maintenant des droites parallèles à l'axe de l'écran et leur équation de


projection si et :

Ces droites images restent donc des droites parallèles à l'axe . Autrement dit, les droites
images restent parallèle aux droites "objet" tel que représenté ci-dessous (pour différentes
positions du point d'observation):

Prenons pour exemple de ce dernier résultat, des segments de même hauteur dont le pied
est sur le plan horizontal:

617/2001
Sciences.ch 14/03/2005

La hauteur du segment image se déduit par:

Considérons maintenant , c'est-à-dire des colonnes verticales de même hauteur


alignées sur la droite . Calculons les coordonnées des sommets images:

C'est l'équation d'une droite et remarquons que toutes ces droites joignant les sommets passent
par le point de coordonnées qui n'est d'autre que le point de fuite principal .

Une représentation géométrique peut à nouveau aider à al compréhension des résultant


précédents. Soit la figure suivante:

La ligne de fuite du plan est la droite d'intersection du plan , parallèle à et passant


par , avec le plan du tableau. Elle contient par conséquent les points de fuite de toutes les
droites contenues dans comme nous l'avons déjà démontré.

Le point de fuite principal du plan est le projeté orthogonal du point sur la droite
. C'est le point de fuite des droites de parallèles à , donc orthogonales à .

Il résulte de ces définitions que deux plans parallèles ont les mêmes éléments de référence.

A partir de l'exposé précédente, nous avons une nouvelle méthode pour présenter un objet en
rotation dans un espace tridimensionnel. Au lieu de faire tourner l'objet autour de différents

618/2001
Sciences.ch 14/03/2005

axes, nous pouvons imaginer à l'aide des équations ci-dessus faire tourner l'observateur autour
de l'objet (c'est un point de vue…).

Nous n'avons considéré ici que la perspective projective sur un plan. Au fait, pour travailler
sur des méthodes de projection quelconques (sphère sur plan, plan sur sphère, sphère sur
sphère, n'importe quoi sur n'importe quoi) il suffit d'étendre l'analyse que nous avons faite ci-
dessus dans un système de coordonnées adapté au système étudié (coordonnées polaires,
cylindriques, sphérique, …). C'est probablement ainsi que procèdent les logiciels de
simulation 3D pour projeter une image sur une surface réfléchissante et semi-transparent tel
qu'une verre ondulé.

Remarque: des résultats que nous avons obtenu ci-dessus, nous pouvons tirer un conclusion
intéressante. Pour que l'observateur d'un photo ou d'un tableau voie l'image telle qu'elle était à
l'origine, celui-ci doit se placer à des coordonnées déterminées du tableau (de la photo ou du
tableau).

PERSPECTIVES AFFINES

Même si la meilleure méthode de la représentation en perspective est la méthode la


perspective conique, nous ne pouvons nous permettre systématiquement de faire des grosses
quantités de calcul pour représenter un volume. Ainsi, il est possible de définir des techniques
de perspectives qui découlent d'une approximation des résultats mathématiques obtenus
précédemment pour arriver à deux techniques (il en existe un plus grand nombre mais ces
deux perspective sont de loin les plus utilisées) que l'on retrouve quotidiennement sur de
nombreux supports papiers techniques ou artistiques. Ces deux techniques sont
respectivement la "perspective cavalière" et la "perspective isométrique" qui font partie de la
famille des "perspectives affines" dites également "projections affines".

Par définition:

Une projection affine de l'espace à 3 dimensions usuel est une transformation affine qui
envoie tous les points de cet espace sur un même plan de cet espace. Si le point
n'est pas sur le plan de projection, lui et son image forment une droite
dont la direction est constante: on l'appelle "direction de projection". La Perspective qui en
découle est appelée familièrement Perspective Parallèle ou Perspective Cylindrique. Comme
toutes les transformations affines de l'espace, une Projection Affine conserve:

- le parallélisme entre les droites

- le barycentre, donc toutes les proportions existantes sur une droite donnée.

Seule les longueurs et les angles situés dans un plan parallèle au plan de projection sont
conservés.

Sans trop nous attarder sur ces deux techniques, nous les présentons brièvement car elles
doivent faire partie de la culture générale du physicien.

PERSPECTIVE CAVALIERE

Prenons une vue (par exemple la vue de face), et nommons les axes (horizontale) et
(verticale). L'axe étant l'axe perpendiculaire à la vue.

619/2001
Sciences.ch 14/03/2005

Dans la perspective cavalière, nous traçons l'axe avec un certain angle par rapport à l'axe
(par exemple ou ), et l'on y reporte les distances en les multipliant par un
coefficient inférieur à 1 en appliquant les règles trigonométriques de base tel que:

C'est en mathématique, par exemple, que la perspective cavalière est fréquemment choisie
pour représenter sur le tableau des classes d'écoles les figures géométriques
tridimensionnelles dans une base orthonormée canonique de direction .

Si la direction de projection n'est pas orthogonale au plan de projection, alors la perspective


cavalière transforme une sphère en ellipse.Cette distorsion de la sphère rend la perspective
cavalière tout à fait impropre à une utilisation en dessin d'art.Cet inconvénient n'est par contre
pas rédhibitoire dans une utilisation en dessin industriel.

PROJECTION ORTHOGONALE

Si la direction de projection est orthogonale au plan de projection, alors la perspective


transforme une sphère en cercle. C'est donc un type de perspective utilisable en dessin comme
alternative à la perspective conique (avec laquelle elle va d'ailleurs coïncider quand l'oeil de
l'observateur est placé infiniment loin du tableau).

La projection orthogonale la plus simple à exprimer est évidemment celle qui envoie l'espace
sur un plan parallèle au tableau, de cote constante égale à . Autrement dit, tel que:

On obtient alors trivialement les coordonnées dans un repère orthonormé 2D propre à ce plan
où et .

Inconvénient de cette méthode: l'effet réel de la profondeur, est entièrement perdu. Pour y
remédier il existe deux solutions équivalentes (généralisables aux autres perspectives): l'une
consiste à tourner l'objet par isométrie de l'espace et l'autre à changer la tableau.

Un cas particulier de la projection orthogonale est la "perspective isométrique". Elle est très
utilisée en dessin industriel, elle projette orthogonalement les points de l'espace sur le plan
isotrope, d'équation:

La direction de projection est donc la normale à ce plan, de vecteur directeur .

620/2001
Sciences.ch 14/03/2005

Le perspective isométrique consiste à placer les axes à les uns des autres et y
reporter les distances telles quelles (d'où son nom).

À titre de comparaison, nous avons représenté selon les deux perspectives présentées
précédemment un cube avec un cercle inscrit dans le carré de chaque face.

Perspective cavalière (gauche) et isométrique (droite)

621/2001
Sciences.ch 14/03/2005

GÉOMÉTRIE ANALYTIQUE

La "géométrie analytique" est la branche de la géométrie qui s'occupe de l'étude des formes
géométriques et de leurs propriétés en utilisant les outils avancés du calcul algébrique tel que
l'analyse fonctionnelle, le calcul vectoriel ou l'algèbre linéaire. Sa frontière se situe au niveau
des outils utilisés. Lorsque nous faisons usage pour ces mêmes études du calcul différentiel et
intégral, alors nous faisons de la "géométrie différentielle" (voir chapitre suivant).

La géométrie analytique est un très vaste domaine (comme tout le reste) mais certains sujets
étudiés dans les petites écoles sortent sont connus tel que ceux que nous abordons ici (cités
dans l'ordre) : les coniques, les équations de la droite, du plan, de la sphère, etc... leurs
intersections, leurs plans tangents et encore bien d'autres.

CONIQUES

Il nous a été très difficile de choisir s'il fallait mettre l'étude des coniques dans la section
d'algèbre ou de géométrie. Nous avons finalement décidé de mettre cette étude dans le présent
chapitre (donc de géométrie...) qui permet de supposer que le lecteur ayant fait une lecteur
linéaire du site a déjà parcouru tous les chapitres présentant les outils mathématiques
nécessaires à l'étude des coniques. Nous espérons que notre choix s'avérera le meilleur pour le
lecteur.

Remarque : l'étude des côniques nous sera très utile en astrophysique ainsi qu'en optique il
convient donc de s'y attarder dans les détails.

Soit un repère orthonormé du plan. Les courbes algébriques les plus simples que
l'on trouve après les droites dont les équations sont sous forme générale (rappel):

sont les courbes de degré 2, à savoir:

avec non tous nuls. Ces courbes de second degré sont appelées "coniques" (appelées
également "quadriques" de par la présence d'un terme quadratique).

Notre première tâche va consister à obtenir, par translation et rotation du repère dans laquelle
cet relation est exprimée, une équation réduite beaucoup plus simple tel qu'en premier lieu
. En effet, choisissons un nouveau repère se déduisant de l'ancien par une rotation
d'angle . Soit et les nouvelles coordonnées des points. Nous avons :

D'où:

622/2001
Sciences.ch 14/03/2005

L'équation devient:

Les termes en valant:

Puisque (voir le chapitre de trigonométrie):

et

nous avons:

Pour avoir , il suffit donc de choisir l'angle de rotation tel que:

Nous considérerons désormais l'équation:

1. Si nous posons et . Quitte à diviser par , nous pouvons nous ramener à une
équation du type:

où:

- si , nous nous retrouvons avec une équation décrivant la figure d'une "parabole" d'axe
parallèle à .

- si , il s'agit d'un cas dégénéré

2. Si nous posons et le cas se traite comme précédemment

3. Si et , nous pouvons supprimer les termes et de la façon suivante:

623/2001
Sciences.ch 14/03/2005

Par un simple changement de repère de translation, nous arrivons donc à une équation du
type:

- si , alors la relation précédente se réduit à un point dans si et sont de même


signe, et à une droite si et sont de signe contraire.

- si et posons:

où signifie: 1 multiplié par le signe de .

Et divisions le tout par tel que:

Posons:

Nous obtenons:

Nous avons donc plusieurs situations possibles:

624/2001
Sciences.ch 14/03/2005

Deux termes ci-dessus sont impossibles dans , c'est pourquoi nous les avons tracés (la
somme de deux nombres positifs ne peuvent êtres négatifs et inversement).

Il y a plusieurs cas de figures intéressants:

- Pour:

ou

et nous avons un cercle.

- Pour:

et nous avons une ellipse.

- Pour:

et , nous avons des hyperboles dont l'axe de symétrie est soit parallèle à soit à

Remarque: pour voir les figures, utilisez la fonction implictitplot(…) dans Maple

Le terme "conique" provient du fait que l'une des premières définitions des conques consistait
en l'intersection d'un cône et d'un plan.

En effet, soit l'équation d'un cône ayant un angle de au sommet (voir


géométrie spatiale)

l'équation d'un plan de vecteur normal (nous utilisons les cosinus


directeurs):

Posons:

Explications: nous avons ainsi un vecteur normal de le plan et un plan qui n'est jamais

625/2001
Sciences.ch 14/03/2005

en intersection avec l'axe . Si le cosinus directeur , nous avons un plan vertical


translaté de sur l'axe des . Si , nous avons un plan horizontal translaté de sur
l'axe des

Soit la matrice de rotation dans l'espace par rapport à l'axe :

avec:

Nous avons donc pour expression de rotation du plan:

Après simplification:

Donc après rotation, nous avons un plan vertical translaté de selon l'axe des .

Identiquement, pour le cône, une rotation correspond selon l'axe des Z (donc il ne se passe pas
grand chose):

Après développement et simplification:

Equation qui donne un cône horizontal si et un cône vertical si .

Ainsi, nous avons le système général:

Si nous tracons dans Maple la fonction (en s'amusant avec les angles):

implicitplot3d({x^2-(y^2-z^2)*cos(2* )+y*z*2*sin(2* )=0,z= },x=-20..20,y=-20..20,z=-


20..20)

Nous voyons que pour:

626/2001
Sciences.ch 14/03/2005

- nous obtenons un intersection entre le plan et le cône donnant une ellipse

- nous obtenons une parabole

- nous obtenons une hyperbole

Voici à peu près ce que cela donne:

Nous donnons également à la courbe d'équation le nom d'hyperbole car, par


changement de variable:

Ce qui nous ramène à:

ce qui comme nous l'avons vu précédemment, est bien l'équation d'une hyperbole.

Cependant, les coniques on aussi une définition géométrique:

Soit un point du plan, une droite ne contenant pas et un réel strictement positif.
Nous nous intéressons à:

s'appelant le "foyer", la "directrice de la conique" et l'excentricité.

Nous choisissons comme origine du repère, de façon que ait pour équation:

avec

627/2001
Sciences.ch 14/03/2005

Alors:

Nous nous retrouvons bien avec l'équation d'une conique. Nous pouvons considérer
maintenant plusieurs cas particuliers:

1. Cas où :

L'équation se limite alors à:

Il s'agit d'une parabole d'axe orthogonal à , dont le sommet est le milieu du segment
, où est la projection de sur .

Relativement à l'origine , l'équation se réduit à:

où est appelé "paramètre de la parabole" et relativement à , le foyer sera donné par les
coordonnées et la directrice par l'équation

2. Cas où :

Il s'agit d'une ellipse:

628/2001
Sciences.ch 14/03/2005

Le dernier terme donnant après développement :

Posons que est l'origine de l'ellipse. L'équation précédente se simplifie et devient:

Pour connaître le demi-grand axe de l'ellipse il suffit de poser . Ainsi:

d'où le demi-grand axe valant:

de la même manière, nous obtenons le demi-petit axe:

en posant étant le "paramètre de l'ellipse", nous obtenons :

Puisque , nous avons :

629/2001
Sciences.ch 14/03/2005

Etant donné que est sur l'axe , nous pouvons prendre le cas particulier où tel
que :

il existe donc deux foyers à l'ellipse à une distance équivalente mais opposée de .

Nous définissons dès lors l'excentricité d'une ellipse par le rapport:

Nous pouvons dès lors démontrer une relation que nous retrouvons courrament dans les
formulaires :

C'est-à-dire :

L'égalité est donc démontrée.

Une représentation paramétrique utile et évidente de l'ellipse est:

Effectivement si nous considérons l'équation cartésienne de l'ellipse démontrée


précédemment :

630/2001
Sciences.ch 14/03/2005

et en posant et alors nous obtenons . Si nous nous souvenons


du cercle trigonométrique, cette équation admet les solution et . Il vient
alors :

et

Voilà…

Cependant, il existe une autre forme d'équation de l'ellipse, bien plus importante, que l'on
retrouve aussi bien en physiqu classique, astrophysique et physique quantique corpsuculaire.

Rappellons que:

En coordonnées polaires, cela donne:

Donc:

ou

après mise en évidence:

ou

Nous obtenons deux équations différentes, mais il s'agit en fait de la même courbe. Nous
remarquerons en effet que:

Etant donné que est défini comme le paramètre de la conique, l'équation polaire de
l'ellipse s'écrit:

Dans le cas général, peut faire un angle quelconque avec l'axe des angles polaires, et
l'équation générale est alors:

631/2001
Sciences.ch 14/03/2005

2. Cas où :

Il s'agit d'un hyperbole (même raisonnement que l'ellipse):

Posons que :

est l'origine de l'ellipse. L'équation précédente se simplifie et devient:

Mais encore:

ce qui s'écrit sous forme condensée:

et nous avons pour demi-grand axe et demi-petit axe (raisonnement identique à l'ellipse):

et:

632/2001
Sciences.ch 14/03/2005

PARAMÉTRISATIONS

Pour certaines des formes présentées ci-dessous, il est possible de choisir un autre système de
coordonnées que les coordonnées cartésiennes tel que par exemple les coordonnées
cylindriques ou sphériques qui sont dans certains cas beaucoup plus simples à mettre en place.
Nous tacherons dans la mesure du possible de présentes les plus importantes.

ÉQUATION DU PLAN

Soit un plan dont nous connaissons un vecteur normal et unitaire mais pas
l'équation et un point de .

Pour qu'un point de coordonnée appartienne au plan il faut et il suffit que les
vecteurs et soient orthogonaux. Donc soit le point étant de coordonnées:

Si est perpendiculaire à alors le produit scalaire doit être nul tel que:

Ce qui s'écrit aussi :

tel que nous obtenions l'équation cartésienne générale du plan:

633/2001
Sciences.ch 14/03/2005

Cette équation où qui vérifie que les coordonnées d'un point


quelconque du plan appartienne à ce plan est donc appelée " équation
cartésienne du plan ".

Si nous écrivons l'équation avec les cosinus directeurs de (voir chapitre de calcul vectoriel),
nous avons dès lors aussi :

Remarque : pour obtenir un cube dans l'espace, il suffit d'avoir 6 plans délimités par des
conditions telles que

ÉQUATION D'UNE DROITE

Comme nous l'avons vu en analyse fonctionnelle, une droite dans le plan peut-être décrite par
la fonction :

L'équation cartésienne de la droite est alors simplement donnée par :

Effectivement, en simplifiant nous retrouvons "l'équation cartésienne réduite" :

Définition : nous appelons "vecteur directeur" d'une droite , tout vecteur non nul de même
direction que la droite.

Théorèmes :

T1. Si une droite à pour équation alors le vecteur est directeur de cette
droite

T2. Si une droite à pour équation alors le vecteur est directeur de


cette droite.

Démonstrations :

D1. Soit et deux points de cette droite pris tel que . Comme
sont deux points de alors est un vecteur directeur de alors :

634/2001
Sciences.ch 14/03/2005

D2. Soit donc alors le vecteur est un


vecteur directeur de ainsi que tout vecteur . Ainsi, il existe une infinité de
manières de définir la même droite, puisque la droite est composée d'une infinité de points
(qui peuvent tous servir de point d'ancrage) et qu'il existe une infinité de multiples du vecteur
directeur.

Souvent, nous recherchons la distance entre une droite et un point externe à celle-ci. Ainsi,
considérons la figure suivante :

avec la projection orthogonale de sur la droite , un point arbitraire de et un


vecteur orthogonal (normal) à .

Nous avons (voir chapitre de calcul vectoriel au besoin) :

car ou . Ainsi :

Nous obtenons donc la relation :

Considérons maintenant le point et la droite .

Choisissons un point ainsi qu'un vecteur , normal à (rappelons

que est vecteur directeur). Ainsi, en appliquant la relation précédente nous avons :

635/2001
Sciences.ch 14/03/2005

Si nous considérons maintenant deux plans non parallèles de l'espace, leur intersection est une
droite. Soit deux plans d'équations respective:

et leur droite d'intersection.

Un point de l'espace appartient à la droite si et seulement si le point satisfait


le système d'équations:

Remarque: alors que dans le plan une droite est caractérisée par une équation du type
(voir chapitre d'analyse fonctionnelle). Dans l'espace, une seule équation de la
forme caractérise un plan. Pour caractériser une droite en dehors des
plans des axes, il est nécessaire (équation paramétrique mis à part) d'avoir deux équations.

Il est trivial (mais nous allons quand même le démontrer) que l'équation paramétrique d'une
droite est un système d'équations du type :

Ainsi, chaque composante croit linéairement par rapport à la même variable à une constante et
un facteur près. Ceci s'écrit aussi sous forme vectorielle (plus traditionnelle) :

Le vecteur est appelé "vecteur directeur".

Démonstration :

Nous avons donc le système d'équations (deux équations à trois inconnues, ainsi une inconnue
sera indéterminée) :

636/2001
Sciences.ch 14/03/2005

Eliminons une des variables (commençons arbitrairement par ):

où donc d'où :

donc (c'est un peu bête à écrire mais bon…) :

De manière similaire avec tel :

Finalement nous avons :

Le vecteur directeur et le vecteur d'ordonnée sont des constantes. Ce qui nous permet d'écrire
de manière plus générale :

Remarques :

R1. l'équation d'une droite est presque ce qu'il y a de plus important en synthèse d'images 3D
car à partir de ces dernières nous pouvons construire des polygones et assembler ces derniers

637/2001
Sciences.ch 14/03/2005

pour construire des formes tridimensionnelles plus complexes.

R2. Pour savoir si une droite est perpendiculaire à un plan il faut déterminer au moins deux
droites sécantes dans ce même plan et effectuer le produit vectoriel de leur vecteur directeur et
ensuite calculer le produit scalaire entre le résultat du produit vectoriel et la première droite
dont nous cherchons l'orthogonalité. Effectivement, une seule droite du plan ne permet pas de
déterminer l'orientation de ce dernier il en faut au moins deux.

ÉQUATION D'UN CÔNE

Soit la figure ci-dessous:

Nous remarquons tout d'abord que , d'où:

Or ici, d'où:

étant donné que:

donc :

c'est l'équation cartésienne d'un cône dans l'espace.

ÉQUATION D'UNE SPHÈRE

Considérons le repère orthonormé , soit la sphère de centre et de rayon


:

638/2001
Sciences.ch 14/03/2005

appartient à la sphère de centre et de rayon si et seulement si c'est


à dire :

D'où l'équation cartésienne de la sphère dans le repère :

Il existe une autre manière de décrire la sphère en utilisation l'équation paramétrée.


Effectivement, nous avons vu dans le chapitre de calcul vectoriel que le passage des
coordonnées cartésiennes aux coordonnées sphériques sont données par els coordonnées
curvilignes :

Ainsi, nous avons bien :

Nous retrouvons donc bien l'équation cartésienne d'une sphère à une constante de translation
près.

ÉQUATION D'UN ELLÏPSOÏDE

Nous avons lors de notre étude des coniques que l'équation d'un ellipse dans le plan était
donnée par :

639/2001
Sciences.ch 14/03/2005

avec étant les deux axes deux l'ellipse (le petit et le grand).

Ainsi, sans démonstration rigoureuse, nous pouvons vérifier à la main ou à l'aide des
ordinateurs que l'équation cartésienne :

est une ellipsoïde :

Cependant, il existe une autre manière de décrire l'ellipoïde en utilisant les coordonnées
curvilignes :

Nous avons donc :

d'où :

Finalement :

ÉQUATION D'UN CYLINDRE

Il va sans dire que l'équation d'un cylindre de rayon est donné par l'équation paramétrique :

640/2001
Sciences.ch 14/03/2005

Nous voyons bien que les composantes satisfont l'équation cartésienne d'un cercle
puisque :

Au même titre l'équation paramétrique d'un cylindre à base elliptique est donnée par :

qui vérifie aussi l'équation paramétrique d'une ellipse dans le plan :

SURFACES DE RÉVOLUTION

De manière plus générale de nombreuses surfaces (dont certaines que nous avons vues
précédemment) peuvent être décrites par révolution d'une forme primaire de dimension
inférieure et ensuite par rotation.

Définition : une "surface de révolution" est une surface obtenue en faisant tourner une courbe
plane (par exemple autour de l'axe . Ainsi, nous passons alors d'un plan de a
un repère de , l'axe engendre dès lors un plan devenu .

Prenons deux exemples classique (parmi l'infini) :

E1. Soit la parabole d'équation (rappelons que ) qui tourne autour de l'axe
. Nous avons bien évidemment (en coupant la paraboloïde par un plan ce qui donne un
cercle de rayon ) la relation (dite "équation cylindrique") . Or, nous avons aussi
d'où l'équation du paraboloïde de révolution :

E2. La droite tourne autour de . Donc ce qui nous donne :

Définition : toute surface engendrée par une droite est une "surface réglée".

641/2001
Sciences.ch 14/03/2005

Prenons l' exemple important (cheminée de centrales nucléaire, engrenages, etc.) qu'est
l'hyperboloïde à une nappe d'équation :

Pour simplifier l'exemple prenons . Nous avons donc :

ce qui s'écrit aussi comme le produit de l'équation de deux droites tel que :

Ainsi, ses deux droites (de pente opposées) appartiennent à la nappe et tout point appartenant
à une de ses deux droites y est contenu. Les figures ci-dessous montrent bien qu'au fait, tout
point appartient à ses deux droites.

On pourrait ceci dit très bien décrire par des cercles tel que :

642/2001
Sciences.ch 14/03/2005

où .

643/2001
Sciences.ch 14/03/2005

GÉOMÉTRIE DIFFÉRENTIELLE

Comme nous l'avons déjà en géométrie non-euclidienne, la géométrie différentielle et la


branche de la géométrie qui vise à étudier les propriétés locales (au voisinage d'un point) et
intrinsèques des courbes et des surfaces non-euclidiennes. La géométrie différentielle tient
son nom du fait qu'elle est née de la possibilité d'une interprétation cinématique que le calcul
infinitésimal apporte à l'étude des courbes.

Remarque : il existe plusieurs méthodes d'étudier la géométrie différentielle dont une un peu
trop formelle à notre goût que nous laisserons pour l'instant le soin au mathématicien d'étudier
(elle est assez brièvement exposée cependant dans le chapitre de topologie de la section
d'algèbre).

Définition : nous assimilerons "l'espace physique" à et le supposerons muni d'un repère


et nous noterons la base

Soient un ensemble et une fonction telle que :

Remarques :

R1. Si est continue, alors est une courbe de l'espace "d'un seul tenant".

R2. Une parabole, une sinusoïde sont des courbes appelées "courbes planes". Une ellipse, un cercle
sont elles appelées des "courbes planes fermées". Pour ces exemples, tous les points des courbes
considérées sont situés dans un même plan. Inversement, une courbe est appelée "courbe
gauche" (gauchir = dévier, tordre) s'il n'en est pas ainsi.

Choisissons et posons que nous noterons par abus de langage nous


pouvons alors énoncer la définition suivante : le couple où est une fonction continue
est appelé "arc paramétré". est appelée le "support" de et est une "origine" de
.

Remarques :

R1. Abusivement, nous disons aussi que est un "paramétrage" de .

R2. Il est facile de définir d'autres arcs paramétrées admettant aussi comme support. Pour
ce faire, il suffit de se donner une fonction bijective de vers et telle que
.

Considérons maintenant l'abscisse curviligne (voir le chapitre traitant du calcul tensoriel) :

644/2001
Sciences.ch 14/03/2005

nous savons que dans un espace euclidien canonique dans l'abscisse curviligne s'écrit
alors :

avec et comme nous avons , il reste :

Dans le système cartésien :

il vient donc que :

Qui est donc l'élément différentiel linéaire d'un espace euclidien (le plus court chemin ou
encore la "géodésique" ou encore " l'abscisse curviligne différentielle").

Nous pouvons bien évidemment écrire (par multiplication des deux côtés de l'égalité) :

Voyons une application avec une hélice (les exemples sont jolis en géométrie différentielle et
valent donc la peine d'être vus...) qui est un exemple typique de courbe gauche :

Soit et la fonction :

avec et les coordonnées paramétriques :

645/2001
Sciences.ch 14/03/2005

Remarque : la fonction est un arc paramétré dont le support est appelé une "hélice", en
est le rayon et le pas. En prenant comme origine, l'abscisse curviligne de cette hélice
(un morceau) est donné par :

Donc :

et donc

TRIEDRE DE FRENET

Soit une courbe, son l'abscisse curviligne et son origine. Appelons :

par définition de la différentielle la "tangente" à au voisinage de . De plus, par


définition de l'abscisse curviligne :

et donc unitaire.

Intéressons nous maintenant à :

646/2001
Sciences.ch 14/03/2005

Nous savons que :

donc :

Ce résultat va nous être utile pour détermine les conséquences de la définition suivante.
Posons:

Etant donné le résultat précédent, est le vecteur perpendiculaire unitaire à (nous disons
que ce couple de vecteur est "orthonormal direct") en et en est par définition la
"courbure". Si , alors :

où est appelé le "rayon de courbure".

Quant à la relation :

elle est appelé "1ère formule de Frenet".

Pour donner une interprétation géométrique de la courbure à en , il suffit d'étudier la


projection de dans le plan défini par . Ainsi, nous définissons par le point
du plan contenant le centre du "cercle osculateur" ou "cercle de courbure" qui tangent le
mieux et tel que :

Le cercle de centre et de rayon est le cercle qui tangente le mieux et . Il est appelé
"cercle osculateur" à en .

647/2001
Sciences.ch 14/03/2005

Dans le cas particulier où est un vecteur constant :

et donc ce qui implique que n'est plus défini. Nous disons quelque fois dans ce cas
que le rayon de courbure à est infini (une droite présente alors une courbure nul en tout
point).

Etudions maintenant le vecteur :

Nous pouvons déjà dire, étant donné que et sont unitaires que l'est aussi.

Démontrons que est orthogonal à :

Etant donné que est perpendiculaire à , et que est aussi perpendiculaire à nous

pouvons en conclure que est colinéaire à colinéaire à .

Posons :

avec

Cette relation constitue la "2ème formule de Frenet".

Par définition, est le "vecteur binormal" de au point et en est la "torsion" et


le rayon de torsion.

Nous pouvons maintenant établir la "3ème formule de Frenet" :

d'où nous tirons :

Or de par les propriétés du produit vectoriel :

648/2001
Sciences.ch 14/03/2005

d'où la 3ème formule de Frenet :

Nous appelons "trièdre de Frenet" associé à au point , le repère naturel orthonormale de


l'espace :

Cherchons le rayon et le centre de courbure en tout à notre hélice définie plus haut.
Rappelons que la fonction paramétrique est donnée par :

et que :

Nous avons dès lors :

649/2001
Sciences.ch 14/03/2005

Ainsi :

Donc le rayon de courbure vaut :

et il vient par la première formule de Frenet :

De par la 3ème formule de Frenet :

et le rayon de torsion étant donné par :

650/2001
Sciences.ch 14/03/2005

NAPPE PARAMETRÉES

Soient :

avec

Appelons . Si est continue, alors est une surface de l'espace "d'un seul tenant".
Par définition, dans ce qui suit, le couple où est une fonction supposée continue
sera appelé "nappe paramétrée", et le "support" de la nappe paramétrée. Nous disons
encore que et sont des paramétrages de .

Remarquons que pour une surface (par exemple un disque), il existe plusieurs nappes
paramétrées associées (par exemple les coordonnées cartésiennes, polaires, sphériques).

Soit maintenant et:

tels que

Nous pouvons définir :

Si nous supposons continue, il est claire que est un arc paramétré. Appelons son
support, nous avons et nous disons que est une "courbe tracée" ou "inscrite" sur .

Remarque : Nous supposerons toujours désormais que

Soit . Intéressons nous aux deux courbes tracées sur définies par les
arcs paramétrés suivants :

avec

651/2001
Sciences.ch 14/03/2005

avec

et sont les deux fonctions dites "partielles" de en .

Les supports de et sont appelés "courbes-coordonnées" de en


relativement au paramétrage . Nous les notons respectivement et . Nous
appelons aussi "1ère courbe-coordonnée et "2ème courbe-coordonnée".

Il est bien sûr évident (voir chapitre de calcul différentiel et intégral) que :

est tangent à en et que est tangent à en .

METRIQUE D'UNE SURFACE

Soit :

avec

Notons , autrement dit :

Nous avons aussi (voir chapitre de calcul différentiel et intégral) :

652/2001
Sciences.ch 14/03/2005

et nous avons démontré au début de ce chapitre que l'abscisse curviligne dans un espace
cartésien était donnée par :

Nous avons donc après substitution :

Ce qui est équivalent à écrire :

De manière plus traditionnelle avec la notation :

Nous obtenons la "première forme quadratique fondamentale" :

Comme nous l'avons déjà démontré en calcul tensoriel, cette expression est indépendante de
la nappe paramétrée car l'élément de longueur infiniment petit est indépendant du
paramétrage de . Cette forme quadratique est donc un invariant qui représente la métrique
sur .

653/2001
Sciences.ch 14/03/2005

FORMES GÉOMÉTRIQUES

Nous avons déjà défini au début du chapitre de géométrie euclidienne les concepts de
dimensions topologiques, ce qu'était un point de dimension nulle et une courbe de dimension
unité. Nous ne reviendrons pas sur ces dernières et nous intéresserons au formes de
dimensions supérieures.

Le but du présent chapitre est de répertorier avec démonstrations quelques propriétés


mathématiques remarquables des formes et corps géométriques connus (surface, volume,
centre de masse, moment d'inertie). Effectivement, il existe nombre de formulaires les
réportoriant sans démonstration mais peu voire pas, d'ouvrages les démontrant toutes (nous
n'en avons jamais vu en tout cas...). La liste ci-dessus est à ce jour loin d'être exhaustive
(puisqu'il existe une infinité de formes géométriques) mais elle sera complétée avec le temps.

Les quelques formes que nous avons souhaité présenter permettent assez facilement de
trouver les propriétés remarquables d'un très grand nombre de formes non repertiorées sur
cette page par assemblage ou décomposition.

Remarques :

R1. Les relations trigonométrique remarquables dans les formes géométriques ci-dessous ne
sont pas démontrées dans ce chapitre. Celles-ci se trouvent déjà toutes dans le chapitre traitant
spécifiquement de la trigonométrie.

R2. Nous entendons par "centre de gravité", le "barycentre" tel que vu dans le chapitre de
géométrie euclidienne.

SURFACES CONNUES

Définition (d'Euclide) : une "surface" est ce qui a longueur et hauteur.

Définition (moderne - topologique) : une surface est une variété topologique de dimension 2

Remarque : nous nous intéresserons dans un premier temps uniquement aux propriétés
(périmètre, surface, centre de gravité,...) de surfaces plongées dans des géométries
euclidiennes.

POLYGONES

Définition : un "polygone" est une surface plane fermée par des segments de droites finis dont
les sommets sont confondus.

Exemple de polygone quelconque :

654/2001
Sciences.ch 14/03/2005

Par définition, un quadrilatère, pentagone, hexagone, heptagone sont des polygones à


respectivement quatre, cinq, six, sept… côtés.

RECTANGLE

Définition : le rectangle est un cas particulier du quadrilatère (forme à quatre côtés délimités
par des segments finis tel que : losange, carré, rectangle, trapèze, etc.) dans le sens où ses
quatre côtés sont égaux et à angle droit.

Remarque : le rectangle peut être vu comme la composition de deux (ou plus) triangles
rectangles (voir plus loin la définition). Pour construire un rectangle, il suffirait d'avoir un seul
et unique triangle rectangle et lui faire subir une double réflexion et une rotation par rapport à
une axe bien choisi (voir le chapitre de géométrie euclidienne).

De par les axiomes d'Euclide (voir chaitre de géométrie euclidienne), le périmètre est donné
par :

Et par définition, la surface par :

et la diagonale par (application du théorème de Pythagore) :

655/2001
Sciences.ch 14/03/2005

La position du centre de gravité du rectangle, si nous posons le repère cartésien dans le coin
inférieur gauche de la forme, est trivialement donné par :

CARRÉ

Définition : le "carré" est un cas particulier du rectangle dans le sens où ses quatre côtés sont
égaux tel que .

De par les axiomes d'Euclide (voir chaitre de géométrie euclidienne), le périmètre est donné
par :

Ainsi, il vient pour la surface que :

Pour la diagonale :

La position du centre de gravité du carré, si nous posons le repère cartésien dans le coin
inférieur gauche de la forme, est trivialement donné par :

TRIANGLE

Définition : le "triangle" est un polygone à trois côtés et englobe dans les cas particuliers, les
triangles : isocèles, équilatéraux et rectangles.

656/2001
Sciences.ch 14/03/2005

De par les axiomes d'Euclide (voir chaitre de géométrie euclidienne), le périmètre est donné
par :

Le triangle quelconque est toujours décomposable en deux triangles rectangles. Ainsi, celui de
la figure ci-dessous peut se décomposer en deux triangles rectangles de base respective et
(définis par la projection orthogonale du sommet opposé au segment ) tels que :

La surface de ces deux triangles rectangles sont commes nous l'avons déjà implicitement dit
dans notre étude du rectangle, la moitié de la surface d'un rectangle de même longueur et
même hauteur. Ainsi :

Ainsi la somme de ces surfaces, nous donne la surface du triangle quelconque :

Nous pouvons de cette dernière relation, que la surface tout triangle quelconque est
assimilable à la moitié de la surface d'un rectangle de longueur et hauteur .

Remarque : quelque soit la base et la hauteur respective , le raisonnement


précédent reste bien évidemment totalement juste.

La détermination du centre de gravité est un peu moins intutive. Nous pouvons bien sûr nous
servir d'un repère et des outils du calcul vectoriel pour très facilement déterminer ce dernier.
Malheureusement dans les écoles, les professeurs préférent le principe du dessin des
médianes. Nous allons donc démontrer que le centre de gravité d'un triangle quelconque est à
l'intersection de toutes les médianes :

Soit un triangle . Nous appelons le milieu du segment , celui de et


celui de :

657/2001
Sciences.ch 14/03/2005

Nous allons démontrer que le seul point vérifiant (voir le chapitre de géométrie
euclidienne) :

est le point de concours des trois médianes du triangle . Cette démonstration s'effectuera
en deux étapes, en deux propositions. Au terme, nous pourrons conclure par le théorème.

Propositions :

P1. Si est un triangle alors il existe un et un seul centre de gravité tel que

P2. Les trois médianes d'un triangles sont concourantes. Leur point d'intersection est ce point
.

Démonstration P1. :

Soit un point du plan tel que . Nous pouvons alors écrire que :

d'où :

Cette relation vectorielle garantit que le point est unique et que nous pouvons même le
placer !

Démonstration P2. :

Pour démontrer que les trois médianes sont concourantes, nous allons prouver que
appartient à chacune des trois médianes.

Au point P1., nous avons démontré que vérifie l'égalité :

658/2001
Sciences.ch 14/03/2005

Comme est le milieu du côté , nous pouvons alors écrire que :

Il vient alors que :

Les vecteurs et sont donc colinéaires! Donc les points sont alignés.
Autrement écrit, le point fait partie de la médiane du triangle . Nous pouvons
même dire qu'il se trouve au deux tiers du segment à partir du sommet .

Ce que nous venons de montrer avec la médiane est bien évidemment aussi vrai pour les
deux autres médianes. Ainsi :

En résumé, le point fait donc partie des trois médianes , et . Ces trois droites
sont donc concourantes et le point en est le point d'intersection.

TRIANGLE ISOCÈLE

Définition : un "triangle isocèle" est un cas particulier du triangle quelconque, dans le sens où
il a deux côtés égaux.

Le périmètre d'un tel triangle reste :

mais comme il a deux côté égaux tel que par exemple :

659/2001
Sciences.ch 14/03/2005

La surface comme nous l'avons démontré dans le cas général reste :

Et le centre de gravité reste, comme nous l'avons démontré dans le cas général, à la position :

Propriétés remarquables d'un triangle isocèle :

P1. La médiatrice et la médiane du troisième côté non égal aux deux autres sont confondus
(démonstration : voir le chapitre de géométrie euclidienne).

TRIANGLE ÉQUILATÉRAL

Définition : un "triangle équilatéral" est un cas particulier du triangle, dans le sens où il a trois
côtés égaux.

Le périmètre d'un tel triangle reste :

mais comme il a trois côtés tel que :

La surface comme nous l'avons démontré dans le cas général reste :

Et le centre de gravité reste comme nous l'avons démontré dans le cas général, reste à la
position :

660/2001
Sciences.ch 14/03/2005

Propriétés remarquables d'un triangle isocèle :

P1. Toutes les médiatrices et médianes sont confondus (démonstration : voir le chapitre de
géométrie euclidienne).

TRIANGLE RECTANGLE

Définition : un "triangle rectangle" est un cas particulier du triangle, dans le sens sur un de ses
trois angles, il a au moins un angle droit.

Le périmètre d'un tel triangle reste :

La surface comme nous l'avons démontré dans le cas général reste (surface de la moitié d'un
rectangle de même base et de même hauteur):

Et le centre de gravité reste comme nous l'avons démontré dans le cas général, reste à la
position :

Propriétés remarquables d'un triangle isocèle :

P1. Le triangle rectangle à ceci de particulier, que nous pouvons directement lui appliquer le
théorème de Pythagore (voir le chapitre de géométrie euclidienne).

661/2001
Sciences.ch 14/03/2005

TRAPÈZE

Définition : un "trapèze", est un quadrilatère dont deux côtés sont parallèles mais de longueur
inégale.

PARALLÉLOGRAMME

Définition : le "parallélogramme" est un cas particulier du quadrilatère, où les côtés sont


parallèles deux à deux :

LOSANGE

Définition : le losange est un cas particulier du parallélogramme dans le sens où ses quatre
côtés sont égaux.

CERCLE

Définition 1. : un "cercle" est un cas particulier d'un polyèdre avec une infinité de côtés.

Définition 2. : un "cercle" est une courbe plane dont tous les points sont à égale distance d'un
point fixe appelé centre.

662/2001
Sciences.ch 14/03/2005

Nous démontrons dans la section d'analyse numérique (chapitre traitant des algorithmes), que
le périmètre d'un cercle de rayon et donc de diamètre est donné par :

La relation de surface peut être obtenue de deux manières :

1. Par recherche de la primitive du périmètre ce qui nous donne :

2. La seconde méthode est plus esthétique et fait appel à l'équation paramétrique du cercle,
trivialement donnée par les projections orthogonales des coordonnées cartésiennes :

Nous savons que l'aire décrite par une fonction est donnée par :

Il nous suffit alors de substituer dans cette intégrale les variables paramétrées :

Ainsi :

Les bornes d'intégration étant bien évidemment nous avons :

663/2001
Sciences.ch 14/03/2005

Nous avons donc aussi par cette méthode :

La longueur d'une tranche d'angle d'ouverture d'un cercle de rayon est bien
évidemment donné par :

et la surface d'une tranche d'angle d'ouverture d'un cercle de rayon de manière


identique par :

Soit connue la relation de calcul de la surface d'un triangle. Nous avons selon la figure ci-
dessous (la démonstration tient seulement dans le résultat lui-même) :

Remarque : par définition du cercle, il est évident que le centre de gravité du cercle se
confond avec le centre de celui-ci.

ELLIPSE

Définition : une "ellipse" est une courbe fermée dont chaque point est tel que la somme de ses
distances à deux points fixes appelés "foyers" est constante.

664/2001
Sciences.ch 14/03/2005

Introduisons pour commencer un petit texte relativement au calcul du périmètre de l'ellipse.


Soit l'équation paramétrique en coordonnées cartésiennes d'une ellipse :

La distance entre le centre du foyer et l'ellipse est alors donné par le théorème de Pythagore :

Un élément d'arc est alors donné par :

Le périmètre de l'ellipse est alors donné par l'intégrale :

et là sa commence à se corser… Ce genre d'intégrale n'est pas facilement calculable à l'aide


des primitives connues, intégration par parties, changements de variable ou autre. Il s'agit de
ce que nous appelons une "intégrale elliptique du second ordre en " pour (voir
chapitre de calcul différentiel et ingtégral) :

De longs développements que nous présenterons dans quelques années dans le chapitre de
calcul différentiel et intégral donne pour le périmètre après un calcul en série limitée :

665/2001
Sciences.ch 14/03/2005

La relation de surface de l'ellipse peut être obtenu de manière très similaire à celle du cercle et
les calculs sont curieusement beaucoup plus simple que ceux du périmètre. Rappelons que
l'équation paramétrique l'ellipse est :

Nous savons que l'aire décrite par une fonction est donnée par :

Il nous suffit alors de substituer dans cette intégrale les variables paramétrées :

Ainsi :

Les bornes d'intégration étant bien évidemment nous avons :

Nous avons donc aussi par cette méthode :

Remarques :

R1. Nous supposons comme évident que le centre de gravité de l'ellipse se confond avec le
centre de celle-ci.

R2. Nous renvoyons le lecteur à l'étude des coniques (chapitre de géométrie euclidienne) pour
le caclul de la surface d'une ellipse à partir de son "paramètre d'ellipse" et son
"excentricité" (tout y est démontré).

VOLUMES CONNUS

Définition (d'Euclide) : un "volume" est ce qui a longueur, largeur et hauteur.

666/2001
Sciences.ch 14/03/2005

Définition (moderne - topologique) : une volume est une variété topologique de dimension 3

Remarque : nous nous intéresserons dans un premier temps uniquement aux propriétés
(surface, volume, centre de gravité, moment d'inertie...) de volumes plongés dans des
géométries euclidiennes.

POLYÈDRES

Nous définissons (mauvaise définition pour l'instant...) par polyèdre un "solide" à trois
dimensions et donc à plusieurs faces.

PARALLÉLÉPIPÈDE

Le parallélépipède est volume à six faces parallèles deux à deux.

Son volume est simplement donné par la définition même du volume... :

Quand à sa surface, il s'agit simplement de la somme des surface des rectangles sans rien de
particulier.

Calculons maintenant le moment d'inertie d'une plaque (parallélépipède) d'épaisseur et de


surface transversale dont l'axe de rotation est :

Un élément de volume du rectangle (en gris) est donné par :

et :

667/2001
Sciences.ch 14/03/2005

et occupons nous maintenant du moment d'inertie de ce rectangle par rapport à l'axe


(perpendiculaire à et à donc) et disposons les axes de façon à :

Nous avons :

Avec :

d'où :

Soit le moment d'inertie d'une plaque rectangulaire :

si la plaque est carrée de côté :

Nous allons montrer qu'il est dès lors possible de calculer le moment d'inertie du triangle
équilatéral et rectangle.

668/2001
Sciences.ch 14/03/2005

Le moment d'inertie toujours par rapport au même axe mais pour la moitié du carré est donnée
par :

Si le centre de gravité est posé sur le tiers de la médiane partant du centre de gravité du carré
et que nous faisons usage du théorème de Steiner (voir chapitre de mécanique classique), il
vient :

Qui est donc le moment d'inertie d'un triangle équilatéral.

En procédant exactement de même pour un triangle rectangle de côtés dont l'axe de


rotation passe par le centre de masse , il vient :

CUBE (ou hexaèdre)

Le cube est un polyèdre particulier à 6 faces à six faces carrées égales et perpendiculaires. Il
s'agit d'un cas particulier du parallélépipède à six côtés égaux.

Son volume est donc simplement donné :

PYRAMIDE

La pyrmaide est un polyèdre qui a pour base un polygone et pour faces latérales des triangles
réunis en un point appelé sommet.

669/2001
Sciences.ch 14/03/2005

Considérons une surface de la section de la pyramide avec le plan d'équation , alors


le volume cherché est égal à :

Nous parlons d'équation de plan alors qu'il n'y a pas de repères défini pour l'instant. Au fait,
dans l'intégrale, varie entre 0 et . Cela sous-entend que nous prenons un repère centré en
(le pied de la hauteur de la pyramide), d'axe de la droite (la hauteur de la pyramide)
orientée de vers (du pied de la hauteur vers le sommet). Les deux autres axes sont
choisis quelconques dans le plan de la base de la pyramide.

Il nous faut préciser maintenant ce que vaut en fonction de :

Soit l'aire de la base de la pyramide. La section de la pyramide par le plan d'équation


se déduite par l'homothétie de centre et de rapport . Donc l'intégrale s'écrit :

Le fait d'avoir pris le carré de provient du fait que chaque terme intérieur de est le
produit de deux termes (selon le calcul de la surface d'un triangle) chacun de rapport
d'homotétie .

Ainsi, nous avons :

TETRAÈDRE

Définition : le tetraèdre est un polyèdre irrégulier à 4 face égales dont la base est un triangle

670/2001
Sciences.ch 14/03/2005

quelconque.

Il s'agit d'un cas particulier à trois faces de la pyramide dont le volume est aussi trivialement
donné par le même raisonnement et s'exprime donc par :

La surface de celui-ci étant aussi donnée trivialement par la somme des surfaces des triangles
qui le composent.

OCTAÈDRE

Définition : l'octaèdre peut être considéré comme la représentation volumique d'un losange
(dont la base est elle-même un losange (si la base était un carré, alors il s'agirait d'une
pyramide a base carrée).

Il s'agit d'un cas particulier à quatres faces de la pyramide et dont le volume est aussi
trivialement donné par le même raisonnement mais doublé et s'exprime donc par :

La surface de celui-ci étant aussi donnée trivialement par la somme des surfaces des triangles
qui le composent.

PRISME DROIT

Le prisme est un polyèdre dont les bases sont deux polygones égaux à côtés parallèles, les
faces latérales étant des parallélogrammes.

671/2001
Sciences.ch 14/03/2005

Pour calculer le volume d'un prisme droit, nous devons tout simplement multiplier l'aire de
sa base par sa hauteur :

Sa base est un polygone, c'est-à-dire qu'elle peut être un triangle, un quadrilatère, ou un


pentagone… Il faut donc savoir calculer ces aires pour calculer le volume du prisme droit.

DODÉCAÈDRE

Le dodécaèdre est un polyèdre comportant 12 faces.

ICOSAÈDRE

L'icosaèdre est un polyèdre comportant 20 faces

CORPS DE RÉVOLUTIONS

CYLINDRE

Définition : un "cylindre" est une surface engendrée par une droite qui se déplace
parallèlement à une direction fixe en rencontrant une courbe plane fixe, dont le plan coupe la

672/2001
Sciences.ch 14/03/2005

direction donnée.

Le volume d’un cylindre de révolution de rayon et de hauteur égale à se calcule par la


méthode des disques en sachant que la surface d'un cercle (disque) vaut :

La surface d'un disque étant simplement la somme de la surface des deux disque de base et du
sommet et de la surface du rectangle plié de hauteur et de longueur :

Calculons maintenant le moment d'inertie d'un cylindre plein par rapport à son axe de
symétrie vertical (axe de révolution) :

Nous avons :

Donc :

673/2001
Sciences.ch 14/03/2005

Soit maintenant le centre de gravité du cylindre, coïncide avec l'axe de révolution du


cônes. Les axes et jouent des rôles identiques. Les moments d'inertie et par
rapport à ces axes sont donc égaux et s'écrivent :

d'où :

d'où :

La première intégrale est en fait le moment d'inertie du cylindre par rapport à l'axe et nous
savons quelle vaut :

La deuxième intégrale se calcule facilement en découpant le cylindre en tranches d'épaisseur


perpendiculaires à l'axe . La masse de la tranche élémentaire est soit :

Le moment d'inertie d'un cylindre par rapport à un axe perpendiculaire à son axe de révolution
s'écrit donc :

Calculons maintenant le moment d'inertie d'une tube ou d'un cylindre creux d'épaisseur non
nulle (toujours donné dans les formulaires techniques) : le moment d'inertie d'un tube par
rapport à son axe de révolution est un grand classique du traitement du moment d'inertie du
cylindre. Ainsi, considérons un tube de rayon extérieur et de rayon intérieur . Comme
(voir chapitre de mécanique classique) :

Il vient dès lors que le moment d'inertie d'un tube peut-être vu comme le moment d'inertie du
cylindre de rayon égal au rayon externe du tube diminué du moment d'inertie du cylindre de
rayon égal au rayon interne du tube. Ainsi :

674/2001
Sciences.ch 14/03/2005

et si , il vient dès lors la relation classique disponible dans nombre de formulaires


de physique :

CÔNE

Définition : un "cône" est une surface engendrée par une droite mobile, passant par un point
fixe et s'appuyant sur une courbe fixe; solide déterminé par cette surface.

Le volume d’un cône de révolution de rayon à la base et de hauteur égale à se calcule


également par la méthode des disques.

La droite passant par les points (extrémité de la base du cône) et (sommet du


cône) est :

La rotation de cette droite par rapport à l’axe des donne le volume du cône :

Calculons maintenant d'inertie d'un cône par rapport à son axe de révolution :

Pour ce calcul, nous allons utiliser la valeur du moment d'inertie du cylindre et


considérer le cône comme un empilement de cylindre infinitésimaux.

675/2001
Sciences.ch 14/03/2005

Donc :

SPHÈRE

Définition : la "sphère" est le volume engendré par la rotation d'un disque (ou cercle) autour
de son centre de gravité.

Nous pouvons voir une sphère de rayon , comme une surface qui est formée par la rotation
d'un demi-cercle autour de son grand axe. La fonction décrivant un demi-cercle étant :

La sphère peut être disséquée donc comme un somme de disques d'épaisseur . Les demi-
disques étant tangents à l'axe des abscisses et de largueur à la position (voir figure ci-
dessous).

Nous avons ainsi :

Le volume d'un disque (cylindre) étant donné par (en passant à la limite) :

et le e rayon étant donné par la fonction :

676/2001
Sciences.ch 14/03/2005

nous avons alors :

En intégrant entre , nous avons alors le volume de la sphère :

Nous pouvons également prendre les bornes entre cela revenant au même à un
facteur 2 près :

Après simplification, nous obtenons pour le volume :

L'expression de la surface étant donnée par dérivant par rapport à l'élément générant la
surface, nous obtenons ainsi :

Calculons maintenant le moment d'inertie d'une boule pleine homogène de masse et de


masse volumique . Pour cela, la boule présentant une symétrie maximum, il est plus
commode de calculer d'abord le moment d'inertie polaire (voir chapitre de mécanique
classique), puis de déterminer le moment d'inertie axial à partir de ce premier :

Comme sont égaux par symétrie de la boule, il vient :

677/2001
Sciences.ch 14/03/2005

TORE

Soit l'équation d'un demi cercle de centre :

Afin d'écrire sous la forme d'une fonction de , isolons dans cette équation:

Le cercle est constitué des graphes des deux fonctions :

- Demi-cercle supérieur :

- Demi-cercle inférieure :

Le volume demandé est la différence entre les volumes engendrés par la rotation des surfaces
(surfaces définies par l'aire comprise entre la fonction du cercle concerné et l'axe des abscisses
compris entre ) dans l'espace autour de l'axe des abscisses.

En appliquant la relation d'intégration des corps de révolution :

Calculons cette dernière intégrale par la substitution classique donc :

678/2001
Sciences.ch 14/03/2005

si :

si :

donc :

Linéarisons cette expression en utilisant à nouveau les relations trigonométriques :

Donc le volume d'un tore de rayon mineur et de rayon majeur est donné par :

Adapté à la figure ci-dessous (prise de la littérature) :

et la surface (par dérivation de l'élément génération de surface) :

679/2001
Sciences.ch 14/03/2005

Le moment d'intertie du tore relativement à son de révolution se calcule de la manière


suivante :

Soit le volume du tore (démontré précédemment) noté :

La densité volumique du tore est données par :

En coordonnées cylindriques, nous avons :

d'où :

Le moment d'inertie est alors donné par :

Posons , dès lors :

1. Les bornes d'intégration deviennent dès lors puisque nous ramenons tous les points
d'intégration à l'origine en posant

680/2001
Sciences.ch 14/03/2005

2. Trivialement, puisque nous avons donc

Ce qui nous donne :

Comme l'intégrale entre deux bornes égales d'une fonction ou produit de fonction impaires est
nul (voir chapitre de calcul différentiel et intégral), les intégrales de :

sont nulles.

Nous avons donc à calculer :

Posons maintenant et donc . Il vient donc :

Or, comme :

Donc :

681/2001
Sciences.ch 14/03/2005

Soit (voir chapitre de calcul différentiel et intégral) :

Donc finalement :

ELLIPSOÏDE

Définition : "L'ellipsoïde" est un solide engendré par la révolution d'une ellipse autour de l'un
de ses axes.

Pour calculer le volume délimité par l'ellipsoïde, prenons l'équation que nous avons
déterminée lors de notre étude des coniques dans le chapitre de géométrie euclidienne :

La section par un plan parallèle au plan et se trouvant à la distance de ce dernier,


donne l'ellipse :

ou :

682/2001
Sciences.ch 14/03/2005

avec pour demi-axes :

Mais comme nous l'avons démontré, la surface d'une ellipse vaut . Par conséquent :

Le volume de l'ellipsoïde est alors égal à :

Donc :

et si , nous retrouvons l'expression du volume d'une sphère :

PARABOLOÏDE

Le paraboloïde est un solide engendré par la révolution d'une parabole autour de son foyer :

La méthode de calcul du volume du paraboloïde à base elliptique est exactement la même que

683/2001
Sciences.ch 14/03/2005

celle pour la pyramide à la différence que l'équation d'une parable est du type et que
nous avons aussi . Dès lors, nous avons évidemment . Le carré de la fonction
nous amène à écrire :

et idem pour . Dès lors :

684/2001
Sciences.ch 14/03/2005

THÉORIE DES GRAPHES

L’histoire de la théorie des graphes (ou des "complexes cellulaires") débute peut-être avec les
travaux d’Euler au 18e siècle et trouve son origine dans l’étude de certains problèmes, tels que
celui des ponts de Königsberg (voir page de couverture, les habitants de Königsberg se
demandaient s’il était possible, en partant d’un quartier quelconque de la ville, de traverser
tous les ponts sans passer deux fois par le même et de revenir à leur point de départ), la
marche du cavalier sur l’échiquier ou le problème de coloriage de cartes.

La théorie des graphes s’est alors développée dans diverses disciplines telles que la chimie
(isomères), la biologie, les sciences sociales (réseaux de transports), gestion de projets
(C.P.M.), informatique (topologie des réseaux, complexité algorithmique), etc.. Depuis le
début du 20e siècle, elle constitue une branche à part entière des mathématiques, grâce aux
travaux de König, Menger, Cayley puis de Berge et d’Erdös.

De manière générale, un graphe permet de représenter la structure, les connexions d’un


ensemble complexe en exprimant les relations entre ses éléments : réseau de communication,
réseaux routiers, interaction de diverses espèces animales, circuits électriques, ...

Les graphes constituent donc une méthode de pensée qui permet de modéliser une grande
variété de problèmes en se ramenant à l’étude de sommets et d’arcs.

Les derniers travaux en théorie des graphes sont souvent effectués par des informaticiens, du
fait de l’importance qu’y revêt l’aspect algorithmique (voir le début du chapitre de méthodes
numériques pour un petit exemple).

La théorie des graphes connaît un assez grand engouement ces 30 dernières, peut-être est-ce
parce qu'elle ne nécessite pas dans ses concepts élémentaires de bagage mathématique
considérable. Effectivement, il suffit d'avoir parcouru les chapitres de probabilités et
statistiques, de théorie des ensembles et d'algèbre linéaire ainsi que de topologie présentés sur
le site pour déjà se sentir à l'aise avec les différentes définitions.

Nous allons introduire le vocabulaire de base de la théorie des graphes. Les termes employés
sont ceux du langage commun de la géométrie euclidienne (et malheureusement ils sont aussi
en grand nombre... foutue langue commune).

Définitions :

D1. Un "graphe" (ou "polygraphe") est un couple constitué d'un ensemble


non vide et fini, et d'un ensemble de paires d'éléments de ou autrement dit (...) d'une
partie du produit cartésien (voir le chapitre de théorie des ensembles).

Remarque : Un graphe est dit "planaire" quand nous pouvons le représenter dans un plan sans
qu'il y ait intersection d'arêtes

D2. Les éléments de sont les "sommets" du graphe , ceux de sont les "arêtes" du
graphe (effectivement, une arrête est composée de deux sommets, d'où l'allusion aux paires
d'éléments dans la définition précédente).

Remarque : Dans un "multigraphe", les deux sommets d'une arête peuvent être identiques

685/2001
Sciences.ch 14/03/2005

(boucle) et deux arêtes distinctes peuvent avoir leurs deux extrémités communes. Un
multigraphe ne satisfait plus alors la définition D1.

D3. Soit une arête de , nous disons que les sommets qui sont les
"extrémités" de l'arête de , sont "adjacents" ou "voisins" dans le graphe , et que l'arête
est "incidente" aux sommets .

D4. Si deux arêtes et ont une extrémité en commun, nous dirons qu'elle sont
"incidentes", autrement, qu'elles sont indépendantes.

Remarque : si est une arête de , nous noterons le sous-graphe de


. Si est un sous-ensemble de , nous noterons le graphe
privé des sommets de .

D5. Ce que nommons "ordre" du graphe est le nombre de ses sommets.

Remarque : soit un graphe d’ordre , l’ensemble doit être par définition choisi comme
sous-ensemble de l’ensemble des paires d’éléments de l’ensemble , donc d’un ensemble
(trivial – puisque un sommet ne peut pas être voisin à lui-même) de cardinal :

En conséquence, il existe (voir le chapitre de statistique et probabilités : arrangements de


éléments non-distinguables par couple de deux) :

choix possibles pour et donc autant de graphes admettant pour ensemble de sommets.
Certains de ces graphes, sont par le fait que nous considérons leurs sommets comme non-
distinguables "automorphes" (voir la définition de ce terme un peu plus loin dans ce
chapitre).

Le résultat obtenu signifie qu'il existe environ 2 millions de graphes à 7 sommets, et quelques
graphes à 27 sommets – chiffre à comparer avec le fait que nous estimons à moins de
le nombre d’atomes dans l’Univers (...).

D6. Le "voisinage" d'un sommet est l'ensemble de ses voisins.

D7. Nous appelons "degré" d'un sommet, le nombre de ses voisins, qui est également le
nombre d'arêtes qui lui sont incidentes (un sommet de degré zéro étant appelé un "sommet
isolé").

Remarque : un sommet de degré 1 est appelé "sommet pendant"

Propriétés (triviales) :

P1. Dans un graphe, le nombre de sommets impairs est toujours pair

686/2001
Sciences.ch 14/03/2005

P2. Un graph ayant tous ses sommets de degré pair est d'ordre de d'odre impair (excepté pour
le sommet isolé).

Remarque : un graphe "régulier" est un graphe dont tous les sommet ont même degré

D8. Nous dirons qu'un graphe est un "sous-graphe" ou "sous-graphe induit" d'un
graphe lorsque et .

D9. Un "sous-graphe recouvrant" d'un graphe est un sous-graphe ,


c'est-à-dire un sous-graphe dont sont sommets tous les sommets de et dont les arêtes sont
dans .

D10. Pour un graphe d'ordre , il existe deux cas extrêmes pour l'ensemble de ses arêtes : soit
le graphe n'a aucune arête, soit toutes les arêtes possibles pouvant relier les sommets deux à
deux sont présentes. Dans ce dernier cas le graphe est dit "complet".

Remarque : Un graphe complet est donc un graphe où chaque sommet est relié à tous les
autres. Le graphe complet d'ordre est noté . Dans ce graphe chaque sommet est de degré
("l'étoile de David" n'est complète que si l'on joint tous les sommets entre eux - ainsi
nous perdons la géométrie de l'étoile mais obtenons un graphe ).

D11. Un "graphe stable" est sous-graphe sans arête et une "clique" un sous-graphe complet.

D12. Dans un graphe il est naturel de vouloir se déplacer de sommet en sommet en suivant les
arêtes. Une telle marche passant par sommets est appelée une "chaîne " ou un "chemin" :

Un "chemin" ("path" en anglais) est une liste de sommets telle qu'il


existe dans le graphe une arête entre chaque paire de sommets successifs :
. La longueur du chemin correspond au nombre d'arêtes
parcourus :

Remarque : un chemin est dit "simple" si chaque arête du chemin est empruntée une seule
fois. Ainsi, nous définissons aussi un "cycle"("cycle" aussi en anglais...) :

comme étant un chemin simple finissant à son point de départ tel que:

D13. Un "cycle simple" est un cycle dont toutes les arêtes sont différentes.

D14. Un "graphe orienté" est un graphe (sous entendu non-orienté jusqu'à présent) dont les
arêtes (dès lors appelés "arcs") ont une direction et un sens (donc à l'opposé du graph non-
orienté qui a lui aussi des arêtes qui ont une direction mais pas de sens).

Remarque : les termes de chemin et de circuit s'emploient en propre pour les graphes orientés.
Pour les graphes non orientés que nous manipulons principalement ici, nous parlons de chaîne
et de cycle. Cependant la définition formelle est exactement la même dans les deux cas, seule
change la structure (graphe orienté ou non) sur laquelle ils sont définis.

687/2001
Sciences.ch 14/03/2005

D15. Un chemin est dit "chemin élémentaire" si chacun des sommets du


parcours est visité une seule fois : . Un chemin élémentaire est
donc un chemin simple et sans cycle.

Propriétés : Dans un graphe d'ordre :

P1. Tout chemin élémentaire est de longueur au plus . Effectivement, Un chemin


élémentaire visitant au plus 1 fois chaque sommet du graphe, sa longueur (nombre d'arêtes) ne
peut effectivement excéder .

P2. Le nombre de chemins élémentaires dans le graphe est fini. Effectivement, le nombre de
chemins de longueur est au plus la combinatoire du choix d'une suite de
sommets distinguables parmi . Il y en a donc (voir chapitre de probabilité et
statistiques):

Remarque : les chemins élémentaires sont la restriction naturelle que nous recherchons à la
notion de chemin. La question qui se pose est de savoir si nous "perdons" quelque chose en ne
considérant que les chemins élémentaires dans un graphe : peut on toujours remplacer un
chemin du graphe par un chemin élémentaire?

Le "lemme de König" répond affirmativement à cette question : de tout chemin nous pouvons
extraire un sous-chemin élémentaire.

L1. S'il existe un chemin entre 2 sommet et , alors il existe un élémentaire entre et .

Démonstration :

L'idée de la preuve est de choisir un chemin particulier entre et et de montrer qu'il est
élémentaire. Quel chemin choisir? Si un chemin comporte un circuit, ce circuit est un détour
sur la route menant de et . Un bon candidat à être un chemin élémentaire semble donc
être un plus court chemin.

Parmi tous les chemins reliant à , choisissons ainsi un chemin


comportant le moins d'arêtes. Supposons par l'absurde que n'est pas
élémentaire. Il existe alors un sommet apparaissant au moins 2 fois le long du chemin .
Soient les 2 premiers indices tels que et :

Pour obtenir une contradiction, il suffit de "supprimer" le cycle entre et . Alors :

est un chemin, reliant à . Sa longueur est strictement inférieure à celle de , ce qui

688/2001
Sciences.ch 14/03/2005

contredit notre choix de comme étant un plus court chemin.

D16. Un graphe est dit "connexe" si et seulement si, il existe un chemin entre chaque paire de
sommets (le chemin n'étant donc implicitement pas nécessairement direct - pouvant passer par
un sommet intermédiaire).

D17. Un "arbre" est un graphe connexe, sans cycle simple et sans boucle. Dans un arbre le
nombre d'arrêtes est égal au nombre de sommets - 1.

D18. Un "arbre valué" est un arbre où les arêtes ont des valeurs (pondérations) positives. La
somme de toutes les valeurs qui sont sur les arêtes parcourues d'un arbre est appelé alors le
"coût d'un arbre valué".

Remarque : Que se passe-t-il si le graphe n'est pas connexe? Il apparaît alors comme un
ensemble de graphes connexes mis les uns à coté des autres. Chacun de ces graphes est un
sous-graphe particulier de , appelé "composante connexe". Il est souvent utile de se placer
sur les composantes connexes d'un graphe pour se ramener au cas d'un graphe connexe.

D19. Une "composante connexe" d'un graphe est un sous-graphe connexe


maximal.

Remarque : Un graphe ne possédant qu'une seule composante connexe est simplement un


graphe connexe. Un sommet isolé (de degré 0) constitue toujours une composante connexe à
lui seul. La relation sur les sommets "il existe un chemin entre ..." est une relation
d'équivalence (réflexive, symétrique et transitive). Les composantes connexes d'un graphe
correspondent aux classes d'équivalences de cette relation.

Propriété (triviale) : Un graphe d'ordre connexe comporte au moins arêtes.

D20. Un "cycle" est un chemin simple rebouclant sur lui-même. Un graphe dans lequel il
n'existe aucun cycle possible est dit "acyclique". Les graphes acycliques constituent une
classe intéressante de graphes, avec des propriétés remarquables et un nom : "les forêts". Il
existe des relations fortes entre l'existence d'un cycle dans un graphe, le degré des sommets, et
le nombre d'arêtes.

Propriétés :

P1. (triviale) Si dans un graphe tout sommet est de degré supérieur ou égal à 2, alors
possède au moins un cycle.

Remarque : cette propriété simple implique qu'un graphe sans cycle possède au moins un
sommet de degré 0 ou 1. A l'inverse, nous pouvons lier cette fois l'absence de cycle dans un
graphe avec le nombre d'arêtes.

P2. (triviale) Un graphe acyclique à sommets possède au plus arêtes.

D21. Un "cycle eulérien" est un cycle passant une et une seule fois par chaque arête du graphe
et revenant au point de départ (nous verrons plus loin les propriétés que doit posséder un tel
graphe pour qu'un tel cycle y existe)

689/2001
Sciences.ch 14/03/2005

D22. Un graphe est dit "graphe eulérien" s'il admet une cycle eulérien.

D23. Un "cycle hamiltonien" est un cycle simple passant par tous les sommets du graphe une
et une seule fois. Pour avoir un cycle hamiltonien, le graphe doit être connexe et il ne doit pas
y avoir de sommets pendant.

D24. Un "graphe hamiltonien" est une graphe qui possède un cycle hamiltonien.

Il convient d'ouvrir maintenant une parenthèse (pour les paillettes…) sur le problème le plus
connu en théorie des graphes : les ponts de Königsberg.

Euler (voir page des biographies) , aimait à faire une promenade dans sa bonne ville de
Königsberg. Il affectionnait tout particulièrement de parcourir les 7 ponts qui enjambent la
rivière. L'âge venant (les connaissances mathématiques aussi…), il se demanda si sans
sacrifier à sa promenade, il pouvait en raccourcir la longueur en ne parcourant chaque pont
qu'une seule fois. Ce problème est sans doute l'un des plus anciens en théorie des graphes :
celui de l'existence d'une chaîne passant une et une seule fois par chaque arête.

La rivière sépare la ville de Königsberg en quatre parties, . Un pont relie deux de ces
parties. Nous pouvons alors représenter notre problème par un graphe avec quatre sommets,
où chaque arête représente l'un des sept ponts de Königsberg. Sur cet exemple le graphe n'est
pas un graphe simple :

690/2001
Sciences.ch 14/03/2005

Comment savoir si un graphe est eulérien ou non ? Si pour notre problème le graphe obtenu
est eulérien, il faut exhiber un cycle eulérien, ce qui ne semble pas facile. Mais s'il ne l'est
pas ? Euler a donné une caractérisation très forte des graphes eulériens donnée par l'énoncé
suivant :

Théorème d'Euler : Un graphe est eulérien si et seulement s'il est connexe et tous ses sommets
sont de degré pair sauf au plus deux

De façon plus précise :

- le graphe n'a pas de sommets impair, alors il est eulérien (et la chaîne est donc cyclique)

- le graphe ne peut avoir un seul sommet impair de par la propriété (déjà énoncée plus haut)
que dans une graphe, le nombre de sommets de degré impair est toujours pair.

- si le graphe a deux sommets impairs, ces sommets sont alors les extrémités de le chaîne
eulérienne

Corollaire : une graphe ayant plus de deux sommets impairs ne possède pas de chaîne
eulérienne.

Avec cette caractérisation (que nous allons démontrer de suite après), les sommets
étant de degré impair, on sait immédiatement qu'il est impossible de parcourir tous
les ponts de Königsberg seulement une fois au cours d'une promenade.

Démonstration :

1. Supposons qu'un graphe soit eulérien. Il existe alors une chaîne parcourant une et une
seule fois chaque arête (jusque là c'est facile). Bien évidemment, dans le cas d'une chaîne, les
sommets se situant aux extrémités de la chaîne sont de degré impair et sont au nombre de
deux.

2. Considérons maintenant un sommet et considérons cette fois-ci un cycle eulérien. Lors du


parcours du cycle, à chaque fois que nous passons par le sommet , nous sommes au point de
départ et nous pouvons repartir par 2 arêtes non encore parcourues dans le début du nouveau
cycle (le chemin peut-être parcouru dans les deux sens puisque le graph est non orienté). Le
sommet est donc de degré pair et peut être défini n'importe où dans le cycle, d'où le fait que
l'ensemble des sommets sont de degré pair.

3. Réciproquement considérons un graphe connexe dont tous les sommets sont de degré
pair. Nous allons montrer par induction sur le nombre d'arêtes que est alors eulérien :

- Si se réduit à un unique sommet isolé, il est évidemment eulérien. Sinon tous les
sommets de sont de degré supérieur ou égal à 2. Ceci implique qu'il existe un cycle sur
:

- Considérons le graphe partiel constitué des arêtes en dehors du cycle . Les sommets de
sont également de degré pair, le cycle contenant un nombre pair d'arêtes incidentes pour
chaque sommet. Par induction chaque composante connexe de est un graphe eulérien,
et admet donc un cycle eulérien . Pour reconstruire un cycle eulérien sur , il nous suffit

691/2001
Sciences.ch 14/03/2005

de fusionner le cycle avec les différents cycles . Pour cela nous parcourons le cycle
depuis un sommet arbitraire; lorsque nous rencontrons pour la première fois un sommet
appartenant à , nous lui substituons le cycle . Le cycle obtenu est un cycle eulérien
pour , le cycle et les cycles formant une partition des arêtes.

Remarque : ce principe de décomposer un graphe en graphes connexes et de les sommer


permet de constuire un algorithme récursif permettant de déterminer si un graphe est eulérien
ou non.

D25. Deux graphes et sont "complémentaires" lorsqu’ils vérifient les conditions


suivantes :

1. Ils ont le même ensemble de sommets

2. Deux sommets sont voisins dans ne sont pas voisins dans

D26. Un "graphe biparti" est un graphe tel que nous puissions partitionner l’ensemble de ses
sommets en deux classes de sorte que toute arête ait une extrémité dans chacune des deux
classes.

Remarque : le "graphe biparti complet " est un graphe de sommets de sorte que
chacune des deux classes de cardinaux respectifs de sorte que chaque sommet d'une classe
soit adjacent à tous les sommets de l'autre et seulement à ceux-ci.

D27. Deux graphes sont isomorphes s’il existe une bijection de dans telle que, pour
tous sommets et de :

adjacent à dans adjacent à dans

Nous disons aussi que est un "isomorphisme de sur ".

S'il existe une bijection de dans lui-même telle que :

adjacent à dans adjacent à dans

Nous disons alors que est un "automorphisme dans " (par permutation des sommets il

692/2001
Sciences.ch 14/03/2005

existe beaucoup d'exemples possibles...).

Remarques :

R1. Attention ! Parfois nous parlons de graphes équivalents à "un isomorphisme près". Cela
signifie plus clairement, qu'à l'exception d'une et unique violation parmi l'ensemble des arêtes,
les graphes sont isomorphes.

R2. Comme l'isomorphisme dans le cas des graphes vas d'un ensemble à un autre de même
cardinal , le nombre de bijection possible différentes est (voir le chapitre de probabilité et
statistique sur les arrangements) :

Cela signifie qu'il existe au maximum graphes qui peuvent se regrouper dans une même
classe d'équivalence - mais cependant qu'il n'en existe pas une seule (sans que cela en donne
le nombre, nous en connaissons le majorant). En conséquence, il existe au minimum
(minorant) le rapport du nombre total de sommets sur le cardinal majoré de la plus grande
classe d'équivalence possible (mais pas nécessairement existante) :

En utilisant la majoration grossière , nous avons :

D'où :

Soit encore :

Ainsi, quand tend vers l'infini, admet un minorant de l'ordre de .

D28. Une "étoile" d’ordre dont un sommet est voisin à tous les autres dont il est lui-même
l’unique voisin

MATRICE D'ADJACENCE

Au plan formel, un graphe est aussi un ensemble sur lequel nous avons défini une relation
binaire, antiréflexive (aucun élément n’est en relation avec lui-même) et symétrique (si est

693/2001
Sciences.ch 14/03/2005

en relation avec , alors est en relation avec ). La structure de graphe peut alors sembler
particulièrement pauvre.

Mais nous pouvons aussi associer à un graphe de sommets une matrice carrée
de dimensions appelée "matrice d’adjacence" du graphe et dont les éléments valent
0 ou 1. En notant le terme située au croisement de la ligne (représentant le sommet )
et de la colonne (représentant le sommet ), est défini par :

si et seulement si sont adjacents

De par cette définition et celle du graphe lui-même, il vient que dans une matrice d’adjacence
que les éléments diagonaux pour lesquels valent tous 0 et que . Rappelons
qu’une telle matrice est dite "symétrique".

CATEGORIES

L'introduction des catégories (théorie des catégories) par Eilenberg et MacLane en 1942 avait
pour but de transformer de difficiles problèmes de Topologie en problèmes plus abordables
d'Algèbre. Plus tard, la Théorie des Catégories s'est beaucoup développée, à la fois pour elle-
même et pour ses applications dans les domaines les plus variés des Mathématiques (e.g. en
Géométrie Différentielle). Même si une partie de son développement autonome a parfois été
critiquée comme "abstract non-sense", les catégories sont maintenant reconnues comme un
langage puissant pour développer une sémantique universelle des structures mathématiques.
On les utilise aussi (via la théorie des topos) en Logique et plus récemment en Physique, et
une collaboration fructueuse semble se développer entre catégoriciens et informaticiens.

Définitions :

D1. Intuitivement une catégorie est juste un graphe orienté sur lequel nous nous sommes
donné une loi pour composer des flèches consécutives, vérifiant certains axiomes.

D2. Un "graphe orienté" est formé d'un ensemble d'objets, appelés sommets du graphe, avec
des liens entre eux, représentés par des flèches d'un sommet vers un sommet , ce que
nous notons . Nous disons que est la "source" de la flèche, et son "but". Il
peut y avoir plusieurs flèches de même source et de même but (nous les disons "parallèles") et
il peut y avoir des flèches "fermées", dont la source et le but sont confondus.

D3. Deux flèches sont dites "consécutives" si le but de la première est en même temps la
source de la seconde:

Nous disons alors qu'elles forment un chemin de longueur 2 de vers . Plus généralement,
un chemin (de longueur ) de vers est une suite de flèches
consécutives :

694/2001
Sciences.ch 14/03/2005

Une catégorie est donc un graphe dans lequel nous définissons une composition de flèches,
associant à tout chemin de longueur 2 de vers une flèche du graphe de vers
, dite composée du chemin, et notée :

Cette composition vérifie les axiomes suivants:

A1. Associativité : Si est un chemin de longueur 3, les deux composés et


que nous en déduisons sont. Il s'ensuit qu'à tout chemin de longueur est aussi associé
un seul composé de sommets (invariance de l'itinéraire).

A2. Identités : A tout sommet est associée une flèche fermée de vers , dite "identité"
de et notée , dont le composé avec une flèche de source ou de but est égal à cette
autre flèche.

Remarques :

R1. Les sommets du graphe sont aussi appelés "objets" de la catégorie et ses flèches
"morphismes" (ou simplement "liens") dans le cadre de la théorie des catégories

R2. Une flèche est un isomorphisme s'il existe une flèche g (appelée "inverse") telle que
les composés et soient des identités (cet inverse est alors unique).

Ainsi, une catégorie est formée par des objets (les sommets du graphe) et des liens entre eux
(les flèches ou morphismes), mais l'idée essentielle est de privilégier les liens sur les objets.
En fait, le succès des catégories dans les domaines les plus variés est dû à la richesse des
informations sur les objets qui peuvent être déduites de la seule considération des liens et des
opérations sur ceux-ci, quelle que soit la nature et l'anatomie de ces objets.

695/2001
Sciences.ch 14/03/2005

PRINCIPES

En introduisant la mécanique nous faisons enfin, après une longue incursion préalable et
obligatoire dans la mathématique, nos premiers pas dans le domaine de la physique théorique.

Comme nous l'avons déjà dit, la physique est une science fondamentale qui a une profonde
influence sur toutes les autres sciences et sur la société humaine. Les futurs physiciens et les
futurs ingénieurs ne sont ainsi pas les seuls qui doivent avoir parfaitement compris ses idées
fondamentales, mais tous ceux qui envisagent une carrière scientifique (y compris les
étudiants qui se spécialisent en biologie, en chimie et en mathématiques), doivent avoir acquis
la même compréhension.

Le but premier de ce site est comme nous l'avons dit dans l'introduction de ce site, de donner
au scientifique et à l'étudiant une vue unifiée de la physique en présentant ce que nous
pensons être les idées fondamentales constituant l'essentiel de la physique théorique
contemporaine.

Jusqu'à présent, la physique est enseignée comme si elle était une juxtaposition de plusieurs
sciences, plus ou moins bien reliées, mais sans aucun réel souci d'unité. Nous avons rejeté ce
mode de présentation (pour l'avoir subi pendant nos études) et avons opté pour une
présentation logique et unifiée en faisant au besoin à chaque fois référence à un chapitre du
site qui contiendrait les démonstrations des outils mathématiques utilisées ou d'une autre
théorie physique sous-jacente.

Ce site diffère des supports habituels de physique enseignées à l'université non seulement
dans sa conception mais aussi dans son contenu. Nous y avons inclus des sujets fondamentaux
que nous ne trouvons pas dans la plupart des cours de physique générale et les avons (très)
soigneusement développés et démontrés tout en présentant rigoureusement dans la section de
mathématiques du site, les outils nécessaires à leurs développements.

Nous espérons que ce qui va suivre pourra aider les enseignants de physique soucieux de
progresser et qui luttent constamment pour améliorer l'enseignement qu'ils donnent. Nous
espérons aussi qu'il stimulera les nombreux étudiants qui méritent une présentation de la
physique plus complète et plus évoluée que celle des cours traditionnels.

Nous insistons sur le fait que tout étudiant devrait connaître les bases de la logique,
arithmétique, algèbre, analyse vectorielle, calcul tensoriel, calcul différentiel et intégral et de
l'analyse dimensionnelle avant toute étude des phénomènes physiques ceci afin de travailler
avec rigueur et toute la compréhension nécessaires aux raisonnements mathématiques qui
vont être introduits à partir de maintenant (les mathématiques sont les fondations de
l'immense édifice de la physique théorique). Effectivement, pas un des outils ou résultats
mathématiques présentés jusqu'à maintenant ne sera pas utilisé dans notre étude de la
physique théorique.

Rappelons tout de même que la "physique" est donc la "science exacte/déductive" qui
s'occupe de modéliser mathématiquement au mieux les phénomènes naturels, aritificels,
observables ou non-observables. En de plus brefs termes, nous pourrions parler de description
de la "réalité" (quant à savoir s'il s'agit de la réalité sensible ou vraie...).

696/2001
Sciences.ch 14/03/2005

Lorsque nous voulons prédire ou décrire un phénomène physique concret, nous pouvons
généralement passer par un modèle analytique où les différentes grandeurs sont exprimées par
des indéterminées (valeurs abstraites) et les lois de la physique par des fonctions, dans la
mesure où elles sont connues (le cas échéant, nous pouvons faire une hypothèse et la tester).
En mettant en équation un phénomène physique, nous traduisons la réalité en une expérience
mathématique, virtuelle, selon certaines règles. Nous procèdons à une simulation de la réalité
portée sur des grandeurs exprimées.

Les différentes "lois" sont élaborées sur des faits empiriques et ont été vérifiées
expérimentalement (voir la méthode hypotético-déductive dans le chapitre de théorie de la
démonstration). En admettant que ces lois soient valables dans le contexte, nous pouvons
donc nous attendre à ce que l’expérience mathématique soit en adéquation avec les faits
expérimentaux attendus (ou inversement). Bien sûr, une expérience virtuelle n’est pas réelle et
ne saurait exprimer la réalité dans toute sa subtilité. Ce n’est qu’un modèle ! Il est donc clair
que la prédiction d’un phénomène physique peut diverger des faits expérimentaux réels. Ces
questions relèvent cependant plus de la métaphysique et de l’épistémologie.

Remarque : il convient peut-être de rappeler (faute d'un abus ou d'une mauvaise


compréhension que nous retrouvons trop fréquemment sur les divers forums de l'Internet),
qu'une "expérience scientifique" est un travail pratique de l'étude d'un phénomène qui est
reproductible (par des groupes de chercheurs indépendants) et dont le nombre de
reproductions est suffisamment élevé pour s'assurer que les erreurs (écarts-types) sur les
mesures deviennent négligeables.

Il convient aussi de préciser que la plupart des modèles théoriques que nous allons exposer sur
ce site et qui font usage de l'analyse vectorielle peuvent êtres récrits avec les outils de
l'analyse tensorielle et basés sur un raisonnement propre au formalisme Lagrangien (voir
chapitre de mécanique analytique pour ce savoir ce qu'est cela...). Or, ces dernières méthodes
ne peuvent êtres facilement utilisées pour une introduction simple à la physique car elles
demandent des efforts supplémentaires de la part du lecteur et beaucoup plus de papier
(souvent en tout cas) et de temps pour les mêmes résultats. Cependant, et nous y reviendrons,
ces méthodes sont aujourd'hui incontournables et de première importance dans les différents
domaines de la physique moderne comme la mécanique des fluides, la relativité générale, la
physique quantique des champs, l'analyse de systèmes chaotiques et bien d'autres.

Avant de commencer notre étude des phénomènes physiques, il nous faut définir les concepts
sur lesquels se base la physique théorique. Ainsi, nous verrons dans l'ordre que :

- L'être humain a créé un système d'unités de mesures et de dimensions de bases, dont les
grandeurs représentatives sont arbitraires à un coefficient près, propres à identifier chaque
phénomène physique de façon simple

- Certains concepts indossociables de la vision de notre environnement nous amènent à poser


des hypothèses et des principes (à postuler quelque chose donc..) qui sont relatifs à notre
réalité sensible tout en étant transposable à tout autre réalite de ce type.

- La physique fondamentale nous amène à considérer les fondements de la nature en tant que
concepts mathématiques abstraits. Ainsi, notre observation commune nous donne une vue
concrète mais abstraite de l'Univers alors que la physique théorique nous en donne une vue
concrète mais abstraite.

SYSTÈMES D'UNITÉS

697/2001
Sciences.ch 14/03/2005

Définition : une "grandeur" est l’expression nomologique quantitative d’une propriété, d’un
effet ou d’une quantité abstraite définie par un modèle que présente l’objet ou le phénomène
étudié. Une grandeur ne s’explique pas, elle se décrit par rapport à une définition.

Nous reconnaîssons deux types de grandeurs :

- Les constantes : elles possèdent une valeur concrète exprimable numériquement et


n'évoluent pas au cours du phénomène étudié. Ce sont des "grandeurs passives" (nous y
reviendrons plus loin et énumérerons quelques unes d'entre elles)

- Les variables : elles ne possèdent une valeur concrète que dans un état déterminé, mais pas
lorsque nous observons le phénomène physique dans son ensemble. Ce sont des "grandeurs
actives". Les différentes variables décrivant une phénomène physique sont souvent corrélées
entre-elles par le biais de fonctions. Nous disons alors par définition que ces variables ont une
"relation fonctionnelle" entre elles.

Mesurer une grandeur physique revient à la comparer à une grandeur physique connue, de
même nature (nous disons aussi "de même dimension"), pris comme étalon arbitraire. Le
résultat de la mesure s'exprime ainsi à l'aide de deux éléments :

- un nombre qui est le rapport de la grandeur mesurée à la grandeur étalon

- un nom identifiant l'étalon choisi

Le "nombre" constitue au fait la valeur mesurée de la grandeur et le "nom" est ce que nous
appelons comunément "unité physique", ou plus simplement "unité" (l'expression quantitative
d'une variable ou d'une fonction). Ces deux éléments sont indissociables, la valeur mesurée
n'a de sens que si nous indiquons en même temps l'unité choisie. Elle change si nous
changeons d'unité.

Remarque : la passage d'une unité à une autre pour exprimer une même grandeur est appelé
"conversion d'unité".

Définition : certaines grandeurs peuvent, par souci de simplification d'écriture, s'exprimer à


partir d'autres grandeurs. Nous disons alors que la nouvelle grandeur "dérive" des unités de
bases. Nous disons également que deux grandeurs physique sont "homogènes" si elles sont de
même nature physique ou si nous pouvons les exprimer toutes les deux dans la (les) même(s)
unité(s) de base.

Ainsi, après un longue période de réflexion, et en dernière analyse le monde physique semble
pouvoir se ramener aux concepts d'espace, d'énergie et de temps.

Ainsi apparaît donc une autre définition possible de la physique :

Définition : la physique est la science des propriétés et des relations mutuelles dans le temps
de la matière et de l'énergie à un facteur de charge près.

Notre rôle consiste donc à donner une description de ces propriétés et relations sous forme de
lois ou relations physiques appliquées aux phénomènes observés, dans le cadre d'une théorie
fournissant les éléments de prévision.

698/2001
Sciences.ch 14/03/2005

Les grandeurs physiques ne sont pas toutes indépendantes les unes des autres mais reliées
entre elles par certaines lois ou relations. Il serait alors peu raisonnable, quoique possible, de
choisir une unité particulière pour chacune des grandeurs physiques sans tenir compte de leurs
relations mutuelles.

Constituer un système cohérent d'unités revient donc à déterminer un nombre minimum


d'unités qui établissent les règles de construction de ces relations mutuelles. Ce sont les
"unités fondamentales". A partir des lois physiques et les relations entre les différentes unités
fondamentales, nous déduisons les unités des autres grandeurs qui deviennent alors par souci
de simplification d'écriture les "unités dérivées".

Les unités fondamentales sont au nombre de quatre (nous le justifierons plus loin): la
longueur (mètres), la masse (kilogrammes), le temps (secondes), la charge électrique
(coulombs). Le système ainsi constitué est le système M.K.S.C. (l'auteur assume le choix
d'ajouter le Coulomb).

Les unités du système M.K.S.C sont donc :

1. le mètre , pour la longueur (nous avons déjà défini le concept de longueur dans le
chapitre géométrie mais nous y reviendrons à nouveau plus loin)

2. le kilo , pour la masse (nous reviendrons plus loin sur la définition du concept de
masse)

3. la seconde , pour le temps (le temps n'existe pas en soi mais l'intervalle de temps
est un concept arbitraire tout à fait valable - nous reviendrons également plus loin sur la
définition de ce concept)

4. le coulomb utilisé comme unité élémentaire de charge électrique (ne dérive


d'aucune unité connue à ce jour - nous reviendrons également plus loin sur la définition de ce
concept).

Remarques :

R1. Le concept d'angle (en radians, degrés ou stéradian - voir les textes traitant de la
trigonométrie plane, trigonométrie sphérique et géométrie plane dans la section de géométrie)
n'a pas d'unité puisqu'il s'agit par définition d'un rapport de longueurs (pour le radian ou le
degré d'angle) ou de surface (pour le stéradian). Il convient donc de l'assimilier à une unité
dérivée non pas comme unité fondamentale. Cependant, en physique, nous avons pris pour
habitude d'indiquer sa présence dans les équations dimensionnelles afin d'aider à le relecture
de certaines de celles-ci et de savoir que leur résultat est donné par rapport à une unité d'angle
(sinon cela pourrait générer des erreurs d'interprétation hasardeuses pour ceux qui utilisent des
équations sans en avoir vu la démonstration...).

R2. Le lecteur remarquera que toutes les unités du système M.K.S.C. sont "extensives" c'est-
à-dire que dans un système sur lequel nous effectuons une mesure, celles-ci sont additives
(contrairement aux grandeurs intensives). Nous reviendrons plus en détails sur les grandeurs
extensives et intensives en grande partie lors de notre étude de la thermodynamique (voir
chapitre du même nom).

699/2001
Sciences.ch 14/03/2005

R3. C'est une énorme chance d'avoir un système homogène tel que celui que nous avons au
21ème sciècle. Effectivement, pour l'anecdote, en 1522 rien que dans la région de Baden
(Allemagne) il y avir 112 mesures différentes de longueur et 92 de surfaces.... c'est dire....

Ces précisions étant faites, toute grandeur physique connue à ce jour peut être exprimée à
l'aide d'une unité qui s'exprime comme le produit de cinq facteurs dimensionnels et d'un
facteur d'échelle arbitraire :

où les nombres appelés respectivement "ordre de masse", "ordre de longueur",


"ordre de temps", "ordre d'angle" et "ordre de charge" sont des entiers positifs, négatifs ou
nuls.

L'expression précédente s'écrira sous la "forme canonique" définie par les étalons:

l'angle n'ayant pas d'unité, nous ne le notons plus (mais il s'y trouve implicitement).

Toute grandeur physique s'exprime donc comme:

où est la valeur de la grandeur physique dans le système d'unité associé au facteur d'échelle
. Il existe plusieurs couples possibles, mais nous aurons toujours:

où la constante est la valeur de la grandeur physique lorsque nous choisissons de


l'exprimer dans le système M.K.S.C.

Donc deux grandeurs physiques et sont homogènes si et seulement si les quadruplets:

qui leur sont attachés sont égaux:

Il découle, de ce que nous avons dit, que :

P1. La somme ou la différence d'un nombre quelconque de grandeurs n'a un sens que si ces
grandeurs sont homogènes et le résultat aura donc les mêmes unités que les opérandes.

P2. Le produit ou la division de plusieurs grandeurs a pour unité le produit, respectivement la


division des unités des opérandes.

700/2001
Sciences.ch 14/03/2005

Remarques :

R1. Les unités des différentes grandeurs ont un côté pratique mais pas infaillible en physique
théorique: elles permettent cependant au physicien de vérifier si une relation entre deux
grandeurs qu'il a démontré est au moins correcte au niveau des unités. Nous appelons ce genre
de démarche une "analyse dimensionnelle".(nous vous conseillons d'aller voir la
démonstration de la loi de Stokes dans le chapitre de mécanique des fluides pour un très bon
exemple d'application).

R2. Le développement des sciences a conduit la conférence générale des poids et mesures à
introduire quelques unités supplémentaires pratiques (mais pas nécessaires) telles que: la
température exprimée en "Kelvins" (qui dérive de l'énergie moyenne - mouvemen brownien),
la quantité de matière exprimée en Moles, l'intensité de courant exprimée en Ampères et
l'intensité lumineuse exprimée en Candelas. Ainsi, le systme système international (S.I.)
actuel, composé de sept unités de base (centimètre, gramme, seconde, kelvin, candela, mole et
l'ampère) et de dix-sept unités dérivées suggère-t-il que sept unités sont nécessaire décrire
toute la physique ? En fait non ! Comme l'analyse de Gauss le suggèe, parmi les sept unités de
base, quatre - le Kelvin, le Candela, la Mole et l'Ampère - peuvent être dérivées des trois
autres. L'introduction de sept unités de base représente un équilibre pragmatique des
expérimentateurs qui ont besoin d'unités adaptées à leurs mesures, et l'idéalisme des
théoriciens, dont le but est de réduire l'arbitraire, la redondance, à son minimum.

NOTATIONS SCIENTIFIQUES

Il est fréquent en physique que les grandeurs manipulées soient très grandes et lourdes à
écrire. Par exemple, il est toujours embêtant d'avoir des grandeurs comme 8'000'000'000 ou
0.000'000'000'1.

Alors nous pouvons adopter une convention d'écriture en puissance de dix dite "notation
scientifique" telle que :

- 8'000'000'000 s'écrive (neufs zéros après le "8")

- 0.000'000'000'1 s'écrive (10ème position après la virgule) ou (neufs zéros


après la virgule)

Un écriture encore plus simplifiée consiste à utiliser le tableau ci-dessous mais uniquement si
nous avons affaire à des grandeurs physiques :

701/2001
Sciences.ch 14/03/2005

Par exemple, 10'000'000 grammes notés conventionnellement:

10'000'000 [g]

sera écrit en notation scientifique:

mais en écriture physique (selon le tableau ci-dessus):

ou

Autre exemple, 0.000'000'153 mètres notés conventionnellement:

0.000'000'153 [m]

sera écrit en écriture scientifique:

mais en écriture physique (toujours selon le tableau ci-dessus):

Remarque : si nous avons un chiffre de la forme 154'434'347'786, fréquemment et selon le


contexte, nous nous permettons de tronquer ce dernier et l'on écrit alors fréquemment avec
une précision de trois chiffres après la virgule ainsi ce dernier nombre devient ce
qui est plus simple à écrire mais dangereux à manipuler à cause de l'erreur induite par la

702/2001
Sciences.ch 14/03/2005

troncation.

TEMPS

Le temps est une variable d'état (et non un "mesurable") et donc une notion impalpable mais
cependant rigoureusement définie. Il s'agit aussi d'un outil mathématique qui permet de mettre
en équation l'observation de phénomènes physiques (observables) et d'en tirer ainsi un certain
nombre d'informations. Cet outil existe car il existe des êtres pour observer (et mesurer) la
nature et ses changements (principe socratique) et de la matière et du mouvement pour qu'il y
ait ces changements.

Remarques :

R1. Le temps (et ses intervalles) étant un concept arbitraire, il est symétrique c'est-à-dire que
tout phénomène observé enregistré peut dans l'imaginaire du temps inversé retrouver ces
conditions initiales. Nous parlons alors de "symétrie du temps" (pour l'instant il n'a jamais été
à notre connaissance démontré ou ne serait-ce observé, que le temps peut subir une "brisure
de symétrie").

R2. Le temps n'est ni une grandeur extensive ou intensive. On ne peut ni additionner le temps
des éléments d'un système physique pour avoir la durée totale de celui-ci (de plus cette
question n'a pas de sens) ni la pondérer. Cependant on peut additioner les intervalles de temps
qui décrivent l'évolution d'un système !

Nous représentons très souvent en physique le temps (compris dans un intervalle) par une
flèche (axe) horizontale représentant le sens du temps. Comme le temps est une notion
purement utilitaire, nous pouvons alors définir chaque instant du temps comme étant le temps
zéro noté . Cette notion est très utilisée en physique car souvent la seule chose qui intéresse
les physiciens est la différence de temps notée (de par l'utilisation du calcul différentiel et
intégral).

Démontrons maintenant que la référence temporielle est indéependante du choix pour


observateur au repos. Soit un temps noté par la lettre , nous avons alors :

où est la base arbitraire (non nécessaire) lorsque nous comparons une différence temporelle.

L'intervalle de temps est donné par une mesure étalon qui ne peut être qu'un mouvement au
mieux parfaitement périodique (qui se répéte dans le temps). Ainsi, les premiers moyens de
mesure du temps ont été le jour et la nuit, les positions du soleil et de la lune dans le ciel, le
mouvement du pendule, la détente de ressorts, la période de dégénrescence du césium 137 ou
encore les système binaires d'étoiles massives. Bref, tant qu'un système observable produit un
phénomène périodique stable et suffisament petit pour que toute mesure physique puisse y
être réduite, celui-ci peut être utilisé comme étalon d'intervalle temporel.

LONGUEUR

Définition : le concept de longueur est donnée par l'information qui donne le chemin
parcouru par un objet dans un intervalle de temps donné.

703/2001
Sciences.ch 14/03/2005

Remarques :

R1. S'il n'y avait pas de matière dans l'Univers il n'y aurait pas de notion de mouvement et
donc de longueur parcourue et aussi comme nous l'avons déjà fait remarquer, de temps (et
encore... c'est sans considérer certains résultats de la physique quantique que nous
démontrerons dans le chapitre qui lui est consacré).

R2. La longueur est une grandeur extensive (additive). Effectivement, la longueur totale d'un
système est la sommes des grandeurs.

Comme pour le temps il n'y a pas d'origine absolue de mesure des longueurs (il n'existe pas de
point zéro dans l'Univers comme le postule la théorie de la relativité) et les physiciens
s'intéressent de toute façon plus particulièrement aux différences de chemin parcouru par
rapport à une origine comme ils le font pour le temps.

Ainsi, de manière identique au temps, nous avons pour un observateur au repos qui observe
un point matériel en mouvement:

où est une base arbitraire mathématiquement inutile lorsque nous comparons une
différence de position dans une différence de temps d'un point matériel.

Si un point matériel se situe dans un espace à trois dimensions spatiales (cas le plus fréquent
en mécanique classique) dont nous avons arbitrairement choisi l'origine , nous notons la
position de ce corps par sa distance en longueur , largeur et hauteur (appelées
"coordonnées cartésiennes") par une flèche imaginaire dit "vecteur" (voir le chapitre traitant
du calcul vectoriel dans la section d'algèbre) reliant le point d'origine arbitraire du référentiel
spatial au point intéressé de la façon suivante (nous en profitons pour introduire également la
notation tensorielle) :

Remarque : la flèche au-dessus du signifie bien évidemment qu'il s'agit donc d'un vecteur.

La notation:

est une notation simplificatrice utilisée fréquemment en physique et qui devrait s'imposer dans
les petites classes (attention le fait que les chiffres soient abaissés en indice ne siginife
absolument pas ce que sont des composantes covariantes - voir chapitre de calcul tensoriel de
la section d'algèbre - il s'agit juste d'un convention simplificatrice d'écriture). Cependant sur le
présent site Internet nous passerons de l'une à l'autre des notations en fonctions des besoins et
des traditions en vigueur (ce sera donc à vous de faire attention à ne pas confondre).

La matrice:

704/2001
Sciences.ch 14/03/2005

est quant à elle le tenseur métrique d'un espace pré-euclidien canonique à signature positive
(voir les chapitres d'analye vectorielle et de calcul tensoriel). Ceci constitue un cas particulier
en physique théorique mais cependant un cas très fréquent d'étude en mécanique classique (il
faut commencer par des espaces simples avant d'aller plus loin...).

Nous reviendrons plus en détails sur ces concepts lors de notre étude des espace ponctuels
plus loin.

MASSE

Définitions:

D1. La masse d'un corps est dans un système fermé une quantité qui se conserve et qui
caractérise l'amplitude avec laquelle ce corps interagit avec d'autres corps par le biais de
différentes forces (attractives).

Remarques :

R1. Dans un système isolé, il ne peut pas y avoir création ou destruction spontanée de masse.
L'apparition de masse ne peut être due qu'à une action extérieure. Une autre façon de dire la
même chose est que la masse totale contenue dans l'Univers est constante.

R2. La masse est un grandeur extensive (additive). Effectivement, la masse totale d'un
système est égale à la somme des masses qui le compose.

En toute rigueur, nous devrions définir également :

D2. La "masse grave" (ou "masse de gravitation") qui est l'amplitude avec laquelle un corps
matériel interagit avec un champ de potentiel (selon la loi de gravitation de newton - voir
chapitre de mécanique classique).

D3. La "masse inerte" (ou "masse inertielle") qui est l'amplitude qui caractérise la résistance
avec laquelle un corps en translation est susceptible de changer de vitesse (c'est-à-dire celle
intervenant dans la deuxième loi de Newton - voir chapitre de mécanique classique)

Remarque : Des expériences ont toutefois prouvé que ces deux masses étaient
proportionnelles au dix-milliardième près. Cette identité expérimentale appelée "principe
d’équivalence galiléen" est à la base d'un des postulats de la relativité générale (voir chapitre
de mécanique relativiste).

Contrairement aux charges électriques (voir plus loin de la définition de la "charge"), qui
caractérisent elles l'amplitude d'interaction par la force électrique, il n'existe que des masses
positives. Ainsi les charges électriques peuvent se repousser aux mêmes titres qu'elles peuvent
s'attirer.

De plus, la masse est étant une propriété additive (donc "extensive" comme nous l'avons déjà

705/2001
Sciences.ch 14/03/2005

dit) de la matière : pour un système de points matériels de masse , la masse


totale est :

De même, pour une distribution continue en volume de la masse d'un système de volume total
:

où est la "masse volumique" du système au point , c'est-à-dire la masse d'un


élément de matière, centré autour de , de dimensions caractéristiques devant celles du
système, mais grandes devant les distances inter-atomiques dans ce système ( est la
masse volumique du système au point repéré par ) définie par :

Remarques :

R1. L'intégrale est une intégrale triple, mais elle pourra être ramenée à une intégrale simple en
exploitant les symétries du système pour choisir judicieusement les volumes élémentaires
d'intégration.

R2. Le calcul de la masse lors d'une distribution non continue (discrète) de matière doit être
faite avec les composantes vectorielles calculées séparément. Une fois ce travail effectué, il
convient d'en prendre la norme.

R3. La masse volume est une grandeur intensive. Effectivement, la densité d'un
système physique n'est pas égal à la somme de ces densités (c'est du bon sens!). Le lecteur
remarquera que cette grandeur intensive qu'est la masse volumique est égale au rapport de
deux grandeurs extensives.

Définitions :

D1. Nous disons qu'un système est "homogène" si sa charge volumique, surfacique, linéique
(voir définition ci-dessous) est constante.

D2. Nous disons qu'un système est "isotrope", si ses propriétés physique sont identiques en
tout point

Nous définissons aussi parfois la "masse surfacique" (ou densité de surface de matière) pour
des systèmes quasiment sans épaisseur et une "masse linéique" (ou densité linéique de masse)
pour des systèmes de section négligeable devant leur longueur. Nous avons alors ( étant une
surface et une abscisse curviligne) :

706/2001
Sciences.ch 14/03/2005

ou

avec dans le cas général :

Remarque : souvent, dans la littérature, ainsi que dans le présent site internet, la masse
volumique est notée simplement , la masse surfacique , et la masse linéique .

ÉNERGIE

Nous ne savons pas ce qu'est exactement l'énergie (notée sous sa forme générale par la lettre
) mais nous en connaissons ses effets. Ce que nous savons cependant, c'est qu'il en existe
plusieurs formes dont voici une liste des plus connues :

- "L'énergie travail" qui est l'énergie créée par l'application d'une force sur un corps lui
donnant une certaine énergie cinétique (voir chapitre de mécanique classique pour la
démonstration) ou énergie potentielle (qu'elle soit gravifique, électrostatique comme démontré
en mécanique classique ou électrodynamique).

- "L'énergie chaleur " qui est une forme d'énergie déterminée par le nombre de micro-états
d'un système (voir chapitre de thermodynamique pour la démonstration)

- "L'énergie de masse" qui est l'énergie contenu dans une certaine quantité de masse (voir
chapitre de relativité restreinte pour la démonstration)

Remarques :

R1. La masse et l'énergie sont équivalentes comme nous le verrons lors de notre étude de la
relativité restreinte (voir le chapitre de mécanique relativiste), si nous définissons un système
d'unités telle que la vitesse de la lumière vaille (convention très utilisée par les
physiciens dans la recherche de pointe).

R2. L'énergie au mêmet titre que la masse est une grandeur extensive.

Nous pouvons quand même tenter de nous demander ce qu'est l'énergie exactement?

Définition : l'énergie est l'effet d'une cause d'un changement local des propriétés d'un système.
Cette cause étant non déterministe et en moyenne nulle et conservative dans un système
fermé.

Remarques :

R1. La vitesse, le potentiel, le nombre de micro-états peuvent êtres considérés comme


l'acquisition d'une quantité d'informations sur un système.

R2. Dans un système isolé, il ne peut pas y avoir création ou destruction spontanée d'énergie.
L'apparition d'énergie ne peut être due qu'à une action extérieure. Une autre façon de dire la

707/2001
Sciences.ch 14/03/2005

même chose est que la l'énergie totale contenue dans l'Univers est constante.

CHARGE

Il est difficile de dire quelque chose sur la charge électrique (vous pouvez chercher une
définition sur l'internet vous verrez...). Cependant si nous nous référons à l'approche de
Yukawa (voir le chapitre de physique quantique des champs) nous pouvons tenter d'en donner
la définition suivante :

Défintion : une charge électrique est une propriété conservative qu'a une particule se situant
dans un champ de potentiel à symétrie sphérique à interagir avec la source de ce champ dans
le cadre de l'échange d'un quantum d'interaction (le photon en l'occurrence créé par les
fluctuations quantique du vide en présence d'une masse) définissant un champ vectoriel de
type Coulombien.

Remarques :

R1. Dans un système isolé, il ne peut pas y avoir création ou destruction spontanée de
charges. L'apparition de charges ne peut être due qu'à une action extérieure. Une autre façon
de dire la même chose est que la charge totale contenue dans l'Univers est constante.

R2. La charge est une grandeur extensive. Effectivement, la charge totale d'un système
physique est égale à la somme algébrique des charges qui la constitute.

Ou une autre défintion similiare à la masse :

Définition : La charge d'un corps est dans un système fermé une quantité qui se conserve et
qui caractérise l'amplitude avec laquelle ce corps interagit avec d'autres corps par le biais des
forces électrostatiques et magnétiques.

Contrairement à la masse, il existe des charges électriques positives et négatives. La charge


électrique reste cependant une propriété additive (extensive). Ainsi, pour un système de
particules de charge , la charge totale est :

et est donc aussi comme la masse, une propriété extensive.

De même, pour une distribution continue en volume de la charge d'un système de volume
total (nous notons les densités de charge de manière identique si l'ambiguïté n'est pas
possible de la même manière que pour la masse):

où est la "densité volumique de charge" du système au point , c'est-à-dire la charge


d'un élément de matière, centré autour de , de dimensions caractéristiques devant celles du
système, mais grandes devant les distances inter-atomiques dans ce système ( est la

708/2001
Sciences.ch 14/03/2005

densité volumique de charge du système au point repéré par ) définie par :

Remarques :

R1. L'intégrale est une intégrale triple, mais elle pourra être ramenée à une intégrale simple en
exploitant les symétries du système pour choisir judicieusement les volumes élémentaires
d'intégration.

R2. Le calcul de la masse lors d'une distribution non continue (discrète) de matière doit être
faite avec les composantes vectorielles calculées séparément. Une fois ce travail effectué, il
convient d'en prende la norme.

R3. La charge volumique est une grandeur intensive. Effectivement, la densité de


charge d'UN physique n'est pas égal à la somme de ces densités (c'est du bon sens!). Le
lecteur remarquera encore une fois que cette grandeur intensive qu'est la masse volumique est
égale au rapport de deux grandeurs extensives.

Définitions :

D1. Nous disons qu'un système est "homogène" si sa charge volumique, surfacique, linéique
(voir définition ci-dessous) est constante.

D2. Nous disons qu'un système est "isotrope", si ses propriétés physique sont identiques en
tout point

Nous définissons aussi parfois la "densité surfacique de charge " (ou densité de surface de
charge) pour des systèmes quasiment sans épaisseur et une "charge linéique" (ou densité
linéique de charge) pour des systèmes de section négligeable devant leur longueur. Nous
avons alors ( étant une surface et une abscisse curviligne) :

ou

avec :

Remarque : souvent, dans la littérature, ainsi que dans le présent site internet, la densité
volumique de charge est notée simplement , la densité surfacique de charge , et la masse
linéique .

DISTRIBUTIONS

Définitions :

709/2001
Sciences.ch 14/03/2005

D1. Une masse ou une charge sont dites "ponctuelles" si elles occupent un volume dont les
dimensions sont très inférieures aux distances d'observations.

Remarque : la charge élémentaire est une excellente approximation d'une charge ponctuelle
étant sa petite taille dont le rayon classique est de l'ordre du femtomètre, ce qui est bien sûr
très grand devant les dimensions d'observation classiques.

D2. Si nous considérons corps de charge ou masse finies dans un volume . Si ce volume
est supposé suffisamment grand pour que la distance moyenne entre les corps soit très
supérieur à la dimension de ceux-ci, nous avons affaire à une "distribution discontinue" ou
"discrète" de ces corps (nous parlons parfois aussi de distribution non-uniforme).

Les calculs sont impossibles à faire en partant d'une distribution discrète car, en général, le
nombre de corps en considération est très élevé lorsque le volume est de dimension
macroscopique. Dans ce cas, il faut introduire une autre type de distribution.

D3. Si nous considérons corps de charge ou masse finies dans un volume . Si ce volume
est supposé suffisamment grand pour que la distance moyenne entre les corps soit très
équivalents à la dimension de ceux-ci, nous avons affaire à une "distribution discontinue" ou
"discrète" de ces corps (nous parlons parfois aussi de distribution non-uniforme).

Remarque : nous pouvons préciser parfois, comme nous en avons déjà fait mention lors des
définitions de la masse ou de la chargem que les distribution définies précédemment peuvent
être de type volumique, surfacique ou linéique. Si cela n'est pas précisé, c'est que
l'information est implicitement triviale.

CONSTANTES

La physique a l'opposé des mathématiques est une science exacte dans le sens que sa
vérification et sa validité se base et est mise constamment à l'épreuve par des faits
expérimentaux.

Comme l'être humain a du choisir arbitrairement un système de mesures, certaines lois


établies théoriquement à l'aide de propriétés de la matière ne sont souvent exactes qu'à un
facteur multiplicatif constant près de normalisation relativement à ce système de mesure.
Apparaissent alors dans les équations de la physique des constantes dont l'existence n'est due
qu'à ce système de mesure mais cependant ce n'est pas toujours le cas, certaines constantes
bien qu'en adaptant le système de mesure n'égaleront (du moins il semblerait) jamais l'unité.

Il existe de nombreuses constantes en physique (une infinité au fait) mais certaines ont un
statut particulier dans le sens qu'elles ne peuvent se déduire d'autres constantes. Nous en
proposons ici la liste et les valeurs (non exactes) et nous le retrouverons fréquemment lors de
nos développement dans ce site.

Remarque : les constantes sont données pour certaines au temps auquel le lecteur les lit (…).
Donc elles varient (pour certaines) au cours du temps

CONSTANTES UNIVERSELLES

710/2001
Sciences.ch 14/03/2005

Constante gravitationnelle

Température absolue

Vitesse (célérité) de la lumière

Nombre d'Avogadro

Charge de l'électron

Constante de Planck

Constante de Boltzmann

Permittivité du vide

Susceptibilité magnétique

Pi

Constante de Dirac (utilitaire)

Constante de Coulomb
(utilitaire)

Remarque : La célérité de la lumière, la permittivité du vide et la susceptibilité magnétique du


vide se déduisent les uns des autres par une relation que nous lors de notre étude des équations
de Maxwell.

Il existe d'autres constantes d'ordre pratique qui se déterminent théoriquement et dont la


valeur sera utile à tout ingénieur ou physicien qui souhaiterait appliquer dans la pratique
certaines des relations qui seront démontrées sur ce site :

CONSTANTES PHYSIQUES DIVERSES

Masse de l'électron (au repos)

Masse du neutron (au repos)

Masse du proton (au repos)

Constante de structure fine

Quantum de flux magnétique

Constante de Stefan

Constante de Stefan-

711/2001
Sciences.ch 14/03/2005

Boltzmann
Rayon classique de l'électron

Impédance du vide

Magnéton de Bohr

Constante de Rydberg

Rayon de Bohr

Electron-Volt

Accélération gravitationnelle
terrestre moyenne

Pression standard

CONSTANTES PHYSICO-CHIMIQUES DIVERSES

Constante molaire des gaz

Constante de Faraday

Volume molaire

Unité de masse atomique

CONSTANTES ASTROPHYSIQUES DIVERSES

Constante de Hubble

Densité critique de l'Univers

Distance Terre-Soleil (parsec)

Rayon Terrestre

Rayon Solaire

Masse Terrestre

Masse Solaire

CONSTANTES DE PLANCK

712/2001
Sciences.ch 14/03/2005

Longueur de Planck

Temps de Planck

Masse de Planck

Température de Planck

Energie de Planck

Densité de Planck

Force de Planck

Puissance de Planck

Pulsation de Planck

Charge de Planck

Courant de Planck

Tension de Planck

Impédance de Planck

Malgré les exemples donnés combien y-a-til de constantes ? Pourquoi jouent-elles un "rôle
central" dans les théories physiques" ? Ont elles toutes la même importance ou certaines sont -
elle plus fondamentales ? Selon quels critères ? Peut-on alors tester si elle sont vraiment
constantes ?

Pour essayer de répondre à certaines de ces questions, remarquons tout d'abord qu'à chaque
étape de nos constructions théoriques il subsiste des paramètres constants qui ne sont pas et ne
peuvent pas être expliquées en termes de quantités plus fondamentales, simplement parce que
ces derniers n'existent pas dans l'état de nos connaissances. Quant les théories s'affinent, il est
en effet possible qu'une constant se trouve expliquée en termes de nouveaux paramètres, plsu
fondamentaux. Ainsi, la masse du proton est une constant fondamentale de la physique
nucléaire, mais doit en principe pouvoir se calculer, dans le cadre de la chromodynamique
quantique, en fonction de la masse des quarks et des énergies des liaisons électromagnétiques
et forte. Ce changement de statut est associé à celui du proton, qui de particule élémentaire
devient corps composite.

Nous définirons modestement les constantes comme tous les paramètres non déterminés dans
un cadre théorique donné. Cette définition revient à accepter que nous soyons incapable
d'écrire une équation d'évolution pour ces constantes qui se révèlent donc comme la limite de
ce que les théories où elles apparaissent sont en mesure d'expliquer. Cependant l'hypothèse de
constance est implicitement contrôlée par la validation expérimentale de ces théories. Les
résultats des expériences doivent être reproductibles à divers moments et dans divers
laboratoires. Si c'est le cas, dans la limite des précisions expérimentales, alors il est légitime

713/2001
Sciences.ch 14/03/2005

de considérer que l'hypothèse de constance est valide. Cette définition implique qu'il n'existe
pas de liste absolue de constantes, car l'appartenance à une telle liste dépend des cadres
théoriques choisis pour décrire la nature et peut donc changer avec les progrès de la
connaissance.

Se pose maintenant la question de savoir s'il est possible de caractériser plus préciséement le
concept de constante et de déterminer si, parmi toutes les constantes, certaines sont plus
fondamentales que d'autres. Pour cela, il faut commencer par révéler uen relation entre
constantes et unités.

Ainsi, Planck découvra en 1900 qu'il était possible d'utiliser les trois constantes physique
fondamentales :

pour définir les trois unités de masse, de temps et de longueur à partir de la masse de Planck,
de la longeur de Planck et du temps de Planck (voir le chapitre de physique quantique
ondulatoire pour la démarche mathématique qui permet de déterminer leur valeur).

Planck baptise ce suntiés "unités naturelles" car "elles sont indépendantes d'un corps ou d'un
matériau et [...] gardent nécessairement leur signification pour tous les temps et toutes les
civilisations, même celles qui sont extra-terrestres et non humaines". La signification de ces
unités met longtemps à émerger. Elles signalent l'échelle où gravitation et mécanique
quantique deviennent de même amplitude; elle sont donc très adaptées à la cosmologie
primordiale et à l'étude des trous noirs.

Le choix des unités de Planck comme unités naturelles est lié aux considérations justifiant que
G, c, h sont les trois constantes dimensionnées les plus fondamentales (connues à ce jour).
Dans ces unités, la valeur numérique de ces trois constantes fondamentales est 1 comme nous
l'avons déjà fait déjà remarquer.

La rôle des constantes dans la structuration des théories physique peut être assez
magnifiquement illustré par le cube magique des théories physique ci-dessous (dont la validité
reste à vérifier bien sûr). L'idée consiste à "allumer" ou "éteindre" une à une les trois
constantes fondamentales afin de voir comment les théories physiques s'articulent les unes par
rapport aux autres.

Remarque : le lecteur comprendre mieux les explications qui vont suivre lorsqu'il aura étudié
la relativité générale, la physique quantique des champs ainsi la physique quantique
ondulatoire donc si jamais il peut sauter ce texte en attendant.

714/2001
Sciences.ch 14/03/2005

Quand G est mis à 0, cela revient à supprimer toutes les forces gravitationnelles et à découpler
la matière de l'espace et du temps. Quand h est mis à , nous supprimons le caractère quantique
de la nature et nous découplons les natures corpusculaires et ondulatoire (de par la relation de
De Broglie), quand 1/c est mis à 0, la vitesse de la lumière est infinie et le temps et l'espace se
découple l'un de l'autre (de par les transformation de Lorentz). Pour visualiser cela, nous
considérons le cube ci-dessus introduit par le physicien soviétique Mikhaïl Bronshtein qui
reprend une idée développée initialement par Lev Landau, Dimitri Ivanenko et Georgi
Gamow.

Tout naturellement, au niveau le plus bas, nous trouvons la mécanique newtonienne,


qui ne prend pas en compte les effets relativistes, quantiques et gravitationnels. Au niveau
supérieur où nous considérons l'effet d'une constante, nous trouvons les trois théories de la
relativité restreinte , de la mécanique quantique en et de la gravitation
newtonienne en , trois théories testées avec un grande précision dans leur domaine de
validité.

A un niveau encore supérieur, la théorique quantique des champs en prend en compte


les effets quantiques et relativistes; la relativité générale en prend en compte les effets
gravitationnels et relativistes et al gravité quantique newtonienne en est censée offrir
une description quantique et non relativiste de la gravitation. Seules les deux premières
théories sont actuellement fondées expérimentalement et théoriquement.

Au niveau ultime se trouve en la théorie de Tout (dénomination très prétentieux et trop


commerciale), censée donner une description quantique et relativiste de la gravitation. Sa
formulation n'est pas encore connue, bien que les théorie des cordes, intensivement étudiées
de nos jours, semblent des candidats sérieux. Ces théories apparaissent comme des cas limites
d'une théorie plus large et plus profon mais non encore formulée : la théorie M (le M pour
"Mère")

Remarques :

715/2001
Sciences.ch 14/03/2005

R1. Le lecteur intéressé par les différentes constantes de Planck (longueur de Planck, masse
de Planck, etc.) devra se rendre dans le chapitre de physique quantique ondulatoire du site où
ces constantes sont déterminées avec les détails nécessaires.

R2. Le lecteur intéressé par les propriétés des éléments chimiques peut télécharger le tableau
périodiques des éléments proposé dans la rubrique de téléchargement du site.

PRINCIPES DE LA PHYSIQUE

Les progrès de la science en général et de la physique en particulier étaient fondés il y deux


siècles principalement sur l'expérimentation, c'est-à-dire que l'on reproduisait en laboratoire
des phénomènes donnés pour les analyser systématiquement (le reproduction d'une
observation validant un hypothèse). Cela revenait systématiquement à poser des questions
précises à la nature et à décrire et étudier les réactions ainsi provoquées. La répétition à
volonté d'un phénomène lors d'une expérience ne serait pas garantie s'il n'existait pas un
principe général de causalité.

PRINCIPE DE CAUSALITÉ

Définition : Nous définissons le "principe de causalité" par le fait que dans exactement les
mêmes conditions, les mêmes causes conduisent toujours aux mêmes effets. Autrement dit, si
certaines conditions initiales sont parfaitement connues, le phénomène se déroulera de façon
déterminée, toujours la même.

Au fait, l'expérience n'est pas nécessaire si nous considèrons les principes de premier ordre
qui sont par définition "les principes logiques que nous pouvons déduire par induction et que
nous ne pouvons vérifier expérimentalement avec certitude".

Or, les exigences de la société ont très peu souvent laissé le temps aux grands hommes de
science de penser à ces principes du premier ordre par des expériences imaginaires (méthode
très usitée par Albert Einstein pour la parenthèse…).

C'est dans un trilemne proposé par le sceptique de l'antiquité Agrippa, selon un argument
rapporté par Sextus Empiricus, que la question de la justification de la connaissance a été
posée le plus explicitement :

H1. Ou bien la connaissance est fondée en dernière instance sur des principes premiers mais
arbitraires

H2. Ou bien nous ne trouvons pas de tels principes et nous avons une régression à l'infini

H3. Ou bien la justification est circulaire

Ce trilemne porte aussi souvent, dans la philosophie contemporaine, notamment chez Karl
Popper, le nom de "trilemne de Fries" ou "trilemne de Münchhausen" et nous ne savons
actuellement pas dans quel cas de figure (H1, H2 ou H3) nous nous situons.

Énoncons maintenant trois principes (ou hypothèses) premiers élémentaires :

PRINCIPE PREMIER DE CONSERVATION DE L'ÉNERGIE

716/2001
Sciences.ch 14/03/2005

Le principe premier de conservation de l'énergie s'énonce ainsi :

L'énergie interne, notée (à ne pas confondre avec la notation du potentiel électrostatique...)


ou la masse notée de tout système isolé et inertiel ne varie pas en fonction du temps s'il n'y
a pas apport ou retrait d'énergie (ou de masse) ou de chaleur de l'extérieur de ce système.

Nous notons mathématiquement cet énoncé de la façon suivante:

L'énergie que l'être humain quantifie avec l'unité "Joules" ne peut être définie avec exactitude.
Répondre à cette question revient à savoir ce qu'est la masse (relation d'équivalence
d'Einstein) et donc à connaître l'élément fondamental de l'Univers (nous en avons déjà fait
mention plus haut dans le présent texte).

Remarques :

R1. L'énergie peut sous trouver sous plusieurs formes (cela ne voulant pas dire qu'il existe
plusieurs énergies différentes !!!) comme la chaleur, l'énergie cinétique, potentielle,
électrique, magnétique, etc...

R2. La violation de ce principe dans un système isolé n'a encore jamais été observé mais sa
valadité ne peut être démontrée (d'où le fait que ce soit un principe premier)

R3. Certains physicient débattent du fait que ce principe premier découle de théorème de
Noether que nous verrons plus. Mais cela est tout à fait discutable étant donné que le
théorème de Noether considère l'énergie potentielle comme constante dans le temps d'où...

PRINCIPE PREMIER DE MOINDRE ACTION

Le principe premier de moindre action (dit également "principe premier d'économie" ou


"principe variationnel") s'énonce ainsi :

Tous les phénomènes naturels s'accordent avec le fait que, la Nature, dans la production de
ses effets, agit toujours par les voies les plus simples et les plus directes.

Avec cet énoncé et le principe de conservation de l'énergie, nous pouvons alors établir des
outils mathématique d'une formidable puissance pour l'étude de la physique théorique. Mais
nous ne pouvons développer à ce niveau du discours le formalisme mathématique de ce
principe car il demande des outils que nous souhaiterions introduire plus loin, dans le chapitre
de mécanique analytique (lors de l'étude du formalisme lagrangien pour être plus précis). En
attendant voici les deux relations qui le résument :

717/2001
Sciences.ch 14/03/2005

Remarque : la violation de ce principe dans un système isolé n'a encore jamais été observé
mais sa validité ne peut être démontrée (d'où le fait que ce soit aussi un principe premier)

PRINCIPE PREMIER DE NOETHER

Le principe premier de Noether (appelé traditionnellement "théorème de Noether") associe de


façon élégante des quantités physiques conservées aux symétries des lois de la nature. La
symétrie de translation dans le temps (phénomène invariant dans le temps) correspond à la
conservation de l'énergie, celle de translation dans l'espace à la conservation de l'impulsion,
celle de rotation dans l'espace à la conservation du moment cinétique etc.. En d'autres termes
la physique est :

- Symétrique par translation dans le temps

- Symétrique par translation dans l'espace

- Symétrique par rotation

Ce résultat établi en 1915 par Emmy Noether juste après son arrivée à Göttingen, fut qualifiée
par Albert Einstein de "Monument de la pensée mathématique". C'est maintenant un des
piliers de la physique théorique.

Aujourd'hui, il est souvent présenté à l'occasion de cours sur la théorie quantique des champs.
Cela le fait paraître plus compliqué et mystérieux qu'il n'est, et c'est oublier qu'il s'applique
aussi à la mécanique classique.

Remarque : il est recommandé au lecteur de lire la démonstration du théorème de Noether en


parallèle des chapitres de mécanique analytique et de mécanique classique.

Ainsi, les symétries jouent un rôle majeur en physique. Elles permettent d’une part de
simplifier les problèmes d’une part et de tirer de nouvelles lois d’autre part. Pour illustrer la
première application des symétries il suffit d’évoquer la forme mathématique du potentiel
gravitationnel engendré par une masse ponctuelle située à l’origine du référentiel (voir
chapitre de mécanique classique) . En coordonnées cartésiennes, l’expression du potentiel
gravitationnel est relativement complexe

alors qu’en coordonnées sphériques - système de coordonnées qui tire partie de la symétrie
sphérique du potentiel - il prend une forme très simple :

Les propriétés de symétrie d’un problème sont ici exploitées de façon à simplifier le
traitement mathématique des lois physiques. Même si ces considérations mathématiques nous
renseignent sur les propriétés physiques du système considéré, elles conservent cependant un
caractère purement technique.

718/2001
Sciences.ch 14/03/2005

Les symétries trouvent pourtant une autre application dont la signification physique est
beaucoup plus profonde. Le fait, non fortuit, qu'un système possède des symétries doit
certainement avoir des implications physiques. Intuitivement, nous pouvons saisir que la
présence de symétries dans un système physique se traduit par l'invariance de certaines de ses
propriétés physiques sous l'application de transformations spatio-temporelles ou, plus
généralement, des transformations géométriques. L'invariance de propriétés physiques doit
induire nécessairement des relations d'une nature nouvelle entre les variables du système. De
telles relations doivent à leur tour révéler des lois plus profondes qui associent la géométrie du
système aux lois de la nature. Ce raisonnement, bien qu'intuitif, nous invite à explorer plus en
profondeurs les relations qui pourraient exister entre les lois physiques et les propriétés
géométriques de l'espace-temps.

Considérons une expérience de mécanique plus ou moins complexe observée simultanément


par deux physiciens et situés en des lieux différents tel que chacun d’eux choisit un
référentiel dont il est l’origine.

Ils entreprennent de mesurer diverses grandeurs physiques et obtiennent des résultats


numériques qui dans l’ensemble diffèrent. Cependant, les lois physiques qu’ils en tirent (à
niveau de connaissance égal) sont identiques. Cette conclusion est triviale car nous savons
tous que les lois de la nature ne doivent pas dépendre pas de l’emplacement des observateurs.

Mathématiquement, la différence entre les référentiels de et selon le référentiel de


l'expérience étudiée est le passage de l'un à l'autre dans un plan par une rotation une
translation (voir le chapitre de géométrie euclidienne).

Le fait que les lois physiques sont indépendantes de la position de l’observateur implique
qu’elles ne varient pas après leur avoir appliqué une rotation et/ou une translation. Nous
disons alors qu’elles sont "invariantes par rotation et par translation" ou encore qu’elles sont
"symétriques par rotation et par translation".

Rappel : En géométrie le terme symétrie prend un sens plus général qui peut se définir comme
suit : transformation qui ne change ni la forme, ni les dimensions d'une figure. Nous pouvons
remarquer que le sens courant du mot symétrie correspond à un cas particulier de symétrie au
sens géométrique du terme, qui consiste à inverser les objets par rapport à un plan.

Remarque : En physique, la définition d'une symétrie est semblable à celle des


mathématiciens mais s'applique aux lois de la nature et non plus aux figures géométriques.
Ainsi une symétrie en physique est une transformation des variables du système - qui peuvent
être des variables géométriques ou des variables plus abstraites - qui ne change pas la
formulation des lois physiques.

Donnons une définition rigoureuse d’une symétrie en physique.

Soit un système dont l’état évolue au cours du temps. Désignons l’état de à l’instant
par . A l’instant initial , se trouve donc dans l’état . Considérons une
transformation géométrique qui agit en chaque point de l’espace et éventuellement du
temps. En un instant , l’action de sur le système a pour effet de le transformer en un
système tel qu'à l’instant , le transformé par de est .

Définition : La transformation est appelée une "symétrie" si le transformé par du

719/2001
Sciences.ch 14/03/2005

système (ce qui donne ) évolue de la même façon que , c'est-à-dire que si nous
appliquons les lois de la mécanique sur pour connaître son état en un instant
postérieur alors .

INVARIANCE PAR TRANSLATION DANS L'ESPACE

Considérons un système isolé constitué de particules en interaction repérées par les


vecteurs position . L’interaction de deux particules dérive d’un potentiel
(voir la démonstration dans le chapitre de mécanique classique). Chaque particule est soumise
à des forces résultant de l’interaction avec les autre particules. Pour une particule donnée, la
résultante de ces forces s’exprime selon la loi de Newton (voir chapitre de mécanique
classique) :

Appliquons au système la translation dans l’espace suivante :

où est un vecteur quelconque. Dire que la translation du système est une symétrie signifie
que l’accélération et la force qui agit sur chaque particule sont inchangées après la
transformation.

Ce qui implique :

Cette égalité doit être vraie quelle que soit la position des particules, donc quels que soient
et . Il est clair que la seule manière de vérifier la dernière égalité dans ces conditions est
d’égaler deux à deux les potentiels entre chaque particule j avec la particule , c'est-à-dire :

Les potentiels sont alors nécessairement (et c'est là la puissant du théorème de Noether) des
fonctions de tel que :

Dès lors, on en déduisons que :

720/2001
Sciences.ch 14/03/2005

Ce qui entraîne immédiatement que la résultante de toutes les forces appliquées aux particules
du système est nulle et que donc la quantité de mouvement totale est conservée :

L’invariance par translation de la loi de Newton entraîne donc nécessairement :

1. Le potentiel entre les particules d’un système isolé est une fonction de leur distance relative
(cela se confirmera en mécanique classique lors de notre étude du champ de potentiel
gravitationnel, ainsi qu'en électromagnétisme en ce qui concerne le potentiel électrostatique et
les potentiel de Yukawa à symétrie sphérique en théorie quantique des champs).

2. La loi de l'égalité entre l'action et la réaction.

3. La conservation de la quantité de mouvement totale d'un système !

INVARIANCE PAR ROTATION DANS L'ESPACE

Imposons maintenant que les rotations autour d’un point fixe soient des symétries. Cette
propriété doit être vraie quel que soit le point fixe considéré, notamment, si ce point fixe est
précisément la position de l’une des particule du système. Il s’ensuit que le potentiel présente
nécessairement une symétrie sphérique. Les forces agissant entre les particules sont donc
colinéaires aux vecteurs qui les relient.

Le moment cinétique du système s’exprime comme suit (voir chapitre de mécanique


classique) :

La dérivée par rapport au temps du moment cinétique total donne :

Or le dernier terme peut s’écrire :

Où les sont les forces internes au système des particules agissant sur la particule .
L'avant dernière expression devient alors :

Nous pouvons regrouper les termes et deux à deux et de par la propriété du


produit vectoriel nous avons nécessairement :

721/2001
Sciences.ch 14/03/2005

Donc nous en concluons que le moment cinétique est donc conservé !

INVARIANCE PAR TRANSLATION DANS LE TEMPS

L’énergie totale du système est la somme de l’énergie cinétique de toutes les particules et de
l’énergie potentielle résultant de l’interaction mutuelle des particules, soit sous la forme de la
mécanique classique :

Nous supposerons que le potentiel ne varie pas avec le temps. Cette hypothèse se
justifie de manière empirique par le constat que les potentiels observés dans la nature sont
indépendants du temps. Calculons la dérivée de l’énergie par rapport au temps :

Donc nous en concluons que l’énergie totale du système est donc une constante. !

Quelle est la grandeur mécanique invariante par translation revient donc à se demander
quelles sont les grandeurs mathématiques qui sont inchangées lorsque nous leur appliquons
une translation. Il en existe deux : les scalaires et les vecteurs.

Intuitivement, un scalaire est assimilé à un nombre réel (voir chapitre d'arithmétique). Or, en
mécanique, les nombres réels que nous pouvons construire le sont à l’aide de grandeurs
vectorielles comme le vecteur position, la vitesse, etc. Pour qu’un tel nombre réel ait le statut
de scalaire il doit être indépendant de l’espace. Ainsi, une vecteur position ne peut
manifestement être considéré comme un scalaire. L’énergie de la particule est un nombre réel
mais n’est pas un scalaire car elle dépend explicitement, dans sa formulation, de la position de
la particule dans l’espace au travers de l’énergie potentielle.

De la même façon, un vecteur n’est pas seulement un être mathématique possédant des
composantes dans une base. Pour jouir du statut de vecteur, une entité mathématique doit se
transformer de la même manière que les vecteurs de base de l’espace vectoriel. Selon cette
définition, le moment cinétique n’est pas un vrai vecteur car, étant la composition par produit
vectoriel de deux vecteurs, il ne se transforme pas comme les vecteurs de base. D’un point de
vue mathématique il s’agit un pseudo-vecteur (voir chapitre de calcul vectoriel).

Le seul vrai vecteur qui reste est la quantité de mouvement car il est construit à l’aide de la
dérivée du vecteur position qui est, bien évidemment, un vrai vecteur. Nous en déduit que la
seule grandeur susceptible d’être conservée par translation est la quantité de mouvement
totale du système.

Par un raisonnement analogue au précédent, il est possible de supposer quelle grandeur


pourrait être invariante par rotation. Sachant que seuls les scalaires et certains pseudo-vecteurs

722/2001
Sciences.ch 14/03/2005

sont effectivement invariants par rotation, nous en concluons que la seule grandeur
susceptible d’être conservée lors de rotations est le moment cinétique total du système.

Enfin, toujours par le même raisonnement, l’invariance des lois de la mécanique par
déplacement dans le temps, revient à rechercher les grandeurs conservées par une translation
dans le temps. Ces grandeurs sont les vrais scalaires et les vecteurs sur la droite du temps.
Aucune grandeur mécanique ne peut être assimilée à un vecteur sur la droite du temps. En
revanche, l’énergie est bien un scalaire invariant par translation dans le temps puisque
l’énergie potentielle est par hypothèse indépendante du temps. L’invariance des lois de la
mécanique par déplacement dans le temps laisse donc supposer intuitivement la conservation
de l’énergie.

Ces raisonnements ne peuvent évidemment faire office de démonstration mais ils mettent en
évidence une relation étroite entre la géométrie et les propriétés d’invariance d’un système.

THÉORÈME DE NOETHER

Soit le lagrangien (voir chapitre de mécanique analytique) d’un système représenté par les
coordonnées généralisées dans l’espace de configuration. Supposons que ce système
est invariant par la transformation infinitésimale suivante :

Où s est un paramètre réel et continu et pour lequel nous avons :

La fonction agit continûment sur le chemin variationnel selon la démarche


intellectuelle qui sera énoncée en mécanique analytique.

Supposons que les fonctions sont solutions des équations de Lagrange (ce que
démontrerons en mécanique analytique). D’après nos hypothèses les fonctions (définies) :

sont dès lors nécessairement également solutions des équations de Lagrange, ce qui se traduit
par (nous omettrons l'indication de la somme par la suite afin d'alléger la lecture!) :

D’autre part, par hypothèse, le lagrangien est invariant pour les transformations du type de
celles décrites par . Il s’ensuit que sa dérivée par rapport au paramètre est
nécessairement nulle :

723/2001
Sciences.ch 14/03/2005

Et nous démontrerons par ailleurs en mécanique analytique (sous forme d'intégrale comme
étant nulle) la relation :

ce qui peut finalement s'écrire :

mais nous avons aussi de par l'équation d'Euler Lagrange :

Nous obtenons alors :

Donc la grandeur est une constante du mouvement ! Le théorème de Noether


s’énonce alors ainsi :

Soit un système ayant un lagrangien auquel nous appliquons une transformation


infinitésimale , où est un paramètre réel et continu. Alors il existe une
constante du mouvement notée dont l’expression est donnée par :

Appliquons le théorème de Noether aux cas étudiés précédemment. Fixons un référentiel


arbitraire cartésien. Notons la base orthonormée de ce référentiel. Considérons un
système constitué de n particules repérées dans par leur vecteur position . Le lagrangien
de ce système est alors bien évidemment , où distingue les
composantes spatiales des vecteurs .

Supposons maintenant que le système soit invariant par translation de longueur le long de
l’axe . La translation le long de cet axe s’écrit comme suit :

724/2001
Sciences.ch 14/03/2005

La constante du mouvement donnée par application du théorème de Noether est alors :

Nous définirons par ailleurs en mécanique analytique comme étant le moment conjugué

. Nous en déduisons dès lors que la quantité conservée est : , c'est-à-dire la quantité de
mouvement totale du système le long de l’axe !!!

En procédant de même avec les autres axes, nous démontrerions aisément la conservation de
la quantité de mouvement totale le long des axes pour ceux-ci, ce qui nous permet de conclure
que dans le cas général d’une translation infinitésimale la grandeur
conservée est la quantité de mouvement totale du système.

Supposons maintenant que le système soit invariant par rotation d’une angle infinitésimal
autour de l’axe . Cette rotation s’écrit :

La dérivée de par rapport à donne :

En remarquant encore une fois que , la grandeur conservée obtenue par application du
théorème de Noether est alors :

et nous avons démontré dans le chapitre de calcul vectoriel que :

ce qui nous amène à écrire :

725/2001
Sciences.ch 14/03/2005

On montrerait de la même façon que l’invariance du lagrangien sous les rotations selon les
autres axes ce qui conduit à la conservation des composantes suivant ces axes du moment
cinétique total du système.

En conclusion, nous avons mis en évidence trois lectures différentes des lois de la physique :

Observation Loi de conservation Signification physique


Invariance des lois de la Conservation de la quantité Homogénéité de l’espace :
physique par translation de mouvement l’espace présente les mêmes
propriétés en tous points
Invariance des lois de la Conservation du moment Isotropie de l’espace : l’espace
physique par rotation cinétique présente les mêmes propriétés
dans toutes les directions
Invariance des lois de la Conservation de l’énergie Homogénéité du temps : les lois
physique par déplacement de la nature ne varient pas dans le
dans le temps temps

PRINCIPE PREMIER DE CURIE

Le principe de Curie (que nous devons à Pierre Curie) découle un peu intuitivement du
théorème de Noether et s'énonce ainsi :

Si une cause présente une certaine symétrie ou invariance, alors son effet aura la même
symétrie (ou la même invariance), ou une symétrie supérieure, à condition toutefois que la
solution du problème soit unique.

Remarque : A noter que les éléments de symétrie agissent sur les directions des grandeurs
vectorielles, tandis que les invariances agissent sur les variables dont dépendent ces
grandeurs.

Exemples : conservation de l’énergie/invariance par translation dans le temps, conservation de


la quantité de mouvement/invariance par translation dans l’espace, conservation du moment
cinétique/invariance par rotation dans l’espace tel que nous l'avons démontré lors de notre
étude du théorème de Noether.

Ainsi, dans un espace homogène et isotrope, si nous faisons subir une transformation
géométrique à un système physique susceptible de créer certains effets (forces, champs), alors
ces effets subissent les mêmes transformations.

Autrement dit, si un système physique possède un certain degré de symétrie, nous pourrons
alors déduire les effets créés par ce système en un point à parti des effet en un autre point.

Voici les six propriétés de symétrie découlant du principe de Curie :

P1. Invariance par translation : si est invariant dans toute translation parallèle à un axe, les
effets sont indépendants des coordonnées de cet axe (l'intérêt étant alors de travailler en

726/2001
Sciences.ch 14/03/2005

coordonnées cartésiennes).

P2. Symétrie axiale : si est invariant dans toute rotation autour d'un axe donné, alors ses
effets exprimés ne dépendent pas de l'angle qui définit la rotation (l'intérêt étant alors de
travailler en coordonnées cylindriques).

P3. Symétrie cylindrique : si est invariant par translation et rotation, alors ses effets ne
dépendent que de la distance à l'axe de rotation (l'intérêt étant alors aussi de travailler en
coordonnées cylindriques).

P4. Symétrique sphérique : si est invariant dans toute rotation autour d'un point fixe, alors
ses effets ne dépendent que de la distance à ce point fixe (l'intérêt étant alors de travailler en
coordonnées sphériques).

P5. Plan de symétrie : si admet un plan de symétrie, alors en tout point de ce plan :

- un effet à caractère vectoriel est contenu dans le plan

- un effet à caractère pseudo-vectoriel (voir le chapitre de calcul vectoriel pour voir la


définiton d'un pseudo-vecteur) lui est perpendiculaire

P6. Plan d'anti-symétrie : si, par symétrie par rapport à un plan, est transformé en alors
en tout point de ce plan :

- un effet à caractère vectoriel est perpendiculaire au plan

- un effet à caractère pseudo-vectoriel est contenu dans ce plan

La symétrie est fondamentale dans les sciences quelles que soient les disciplines. La symétrie
est partout. Elle permet de décrire de manière précise de nombreux systèmes, de clarifier et de
simplifier l'étude de leurs propriétés. Des résultats très importants peuvent ainsi être prédits de
manière rigoureuse sans que l'on ait à faire appel à des théories mathématiques sophistiquées.

ESPACES PONCTUELS

L'étude des phénomènes physiques recourt dans un premier temps à leur représentation dans
l'espace de la géométrie classique euclidienne à une dimension temporelle et à un nombre
quelconque de dimensions spatiales.

Les vecteurs que nous avons étudié dans le chapitre de calcul vectoriel (tenseurs d'ordre 1) et
les tenseurs (d'ordre quelconque) que nous avons aussi étudié dans le chapitre de calcul
tensoriel peuvent comme nous avons en déjà fait mention, êtres utilisés pour relier chacun des
points de l'espace-temps à un référentiel et former ainsi des champs de vecteurs ou/et de
tenseurs. Cet était de fait mathématique, nécessite la définition mathématique d'espaces
formés de points ou également appelés "espaces ponctuels".

La définition précise d'espace vectoriel ponctuel que nous allons faire sera construite à partir
de la notion d'espace vectoriel que nous avons vu dans le chapitre de calcul vectoriel (voir

727/2001
Sciences.ch 14/03/2005

section d'algèbre)

Voyons tout d'abord l'exemple particulier de l'espace ponctuel formé par des triplets de
nombres qui est issu directement de l'espace géométrique classique à trois dimensions.

Ainsi, donnons-nous des triplets de nombres notés:

etc… Appelons l'ensemble de tous les éléments formés par des triplets de
nombres. À tout couple de deux éléments de , pris dans cet ordre, nous pouvons
faire correspondre un vecteur , appartenant à un espace vectoriel espace vectoriel , noté
géométriquement , en définissant celui-ci par un triplet de nombres tel que (nous utilisons
la notation indicielle vue en calcul tensoriel) :

avec . Nous avons donc:

Si nous définissons par rapport à cet élément l'addition et la multiplication par un scalaire,
nous nous retrouvons comme nous l'avons déjà vu en théorie des ensembles avec une
structure d'espace vectoriel.

La correspondance que nous établissons ainsi, entre tout couple de deux éléments de
et un vecteur d'un espace vectoriel , vérifie manifestement les propriétés suivantes :

P1.

P2. Associativité par rapport à l'addition:

P3. Si est un élément arbitraire choisi dans , à tout vecteur de , il correspond un


point et un seul tel que .

Lorsque nous avons muni l'ensemble de cette loi de correspondance avec , vérifiant les
trois propriétés précédentes, nous disons que l'ensemble des triplets de nombres constitue un
espace ponctuel, noté . Les éléments de sont alors appelés des "points".

L'espace ponctuel se confond en tant qu'ensemble d'éléments avec l'ensemble mais il


s'en distingue en tant qu'espace ponctuel qui constitue un ensemble structuré par la loi de
correspondance que nous nous donnons. De même, les espaces et sont distincts par
suite de leur structure différente et nous pouvons établir une distinction entre les éléments de
chacun des espaces. Nous disons que constitue le support des espaces et .

728/2001
Sciences.ch 14/03/2005

Nous pouvons bien évidemment généraliser le support à . Ainsi, muni de la structure


d'espace vectoriel que nous avons définie précédemment constitue un espace ponctuel à
dimensions que nous noterons . Les éléments de étant appelés des "points".

L'espace vectoriel est appelé "l'espace associé à ". Lorsque l'espace vectoriel associé est
un espace pré-euclidien (muni du produit scalaire), nous disons alors que est un "espace
ponctuel pré-euclidien".

Considérons un point quelconque d'un espace ponctuel pré-euclidien et une base


de l'espace vectoriel associé .

Définitions :

D1. Nous appelons "repère de l'espace " l'ensemble constitué par les éléments
(origine) et de la base . Ce genre de repère est noté :

ou encore simplement :

D2. les coordonnées d'un point d'un espace ponctuel pré-euclidien , par rapport au
repère , sont les composantes (contravariantes) du vecteur de l'espace par
rapport à la base .

Soient deux points et de définis par leurs coordonnées respectives et , nous


avons:

En utilisant les propriétés P1 et P2 données précédemment :

Nous en déduisons que les composantes du vecteur , par rapport à la base , sont les
quantités , différences des coordonnées des points et .

Soient et deux repères quelconques de liés entre eux par les relations générales
(voir chapitre de calcul tensoriel et d'algèbre linéaire dans la section d'algèbre) :

et

729/2001
Sciences.ch 14/03/2005

Cherchons les relations entre les coordonnées d'un point de par rapport à ces deux
repères. Pour cela, exprimons les vecteurs et sur chacune des bases de :

ainsi que les vecteurs et , soit:

Nous avons d'autre part:

Identifiant ce résultat par rapport au vecteur dans l'expressions de , nous avons:

En de façon analogue:

Ces deux relations sont plus que pratiques en physique où nous avons souvent à considérer un
référentiel dans un repère (ainsi nous pouvons exprimer la position d'un point depuis l'un ou
l'autre repère en usant de ces deux relations).

Considérons maintenant un espace ponctuel pré-euclidien ainsi que et deux points de


cet espace. Nous avons démontré lors de notre étude de la topologie, que la norme du vecteur
est une mesure possible de la distance entre et . Nous avons donc :

Si les deux points et ont respectivement pour coordonnées et , par rapport à un


repère , nous savons que nous avons :

La norme au carré est donc donnée comme nous l'avons vu lors de notre étude du calcul
tensoriel par la relation:

Si le point est infiniment proche du point , ses coordonnées sont notées et le


vecteur a pour composantes les quantiques .

730/2001
Sciences.ch 14/03/2005

Si nous notons la distance entre les points et . La relation précédente donne


l'expression du carré de la distance entre ces points sous la forme:

Rappelons également (voir chapitre de calcul tensoriel) que pour un espace ponctuel pré-
euclidien où les vecteurs de base sont donc orthonormés, nous avons:

et l'expression de la distance devient alors :

Nous obtenons ainsi un expression qui généralise, à dimensions, le carré de la distance


élémentaire, par rapport à un repère cartésien orthonormé, dans l'espace de le géométrie
classique (euclidienne).

Les vecteurs de la physique sont généralement des fonctions de une ou plusieurs variables,
celles-ci pouvant être des variables d'espace ou du temps. Lorsque à un point d'un espace
ponctuel , nous attachons un tenseur, défini par ses composantes par rapport à un repère
, nous dirons que nous nous sommes donnés un "champ de tenseurs" (le champs de
tenseur d'ordre 1 étant des champs vectoriels).

Pour des vecteurs à dimensions, la notion de dérivée d'un vecteur à trois dimensions se
généralise et nous obtenons toutes les relations classiques relatives aux dérivées.

Considérons ainsi un vecteur appartenant à un espace pré-euclidien dont les


composantes, sur une base , sont des fonctions d'une paramètre quelconque . Nous
noterons ce vecteur et nous aurons:

Par définition, la dérivée du vecteur par rapport à la composante est un vecteur noté:

selon la notation utilisée par les mathématiciens. Ou :

selon la notation abrégée des physiciens. Ou encor:

selon l'humeur du physicien. Ou encore :

731/2001
Sciences.ch 14/03/2005

si nous respectons les écritures…

Dans ce site, nous basculons d'une notation à l'autre sans préavis en fonction de l'envie de
simplifier les écritures (il faudra s'y faire..).

Etant donné que nous faisons actuellement plus de la mathématique que de la physique, nous
noterons:

En rappelant (voir calcul différentiel et intégral) que la différentielle est donnée par:

Les différentes expressions de dérivations des vecteurs à trois dimensions relatives à la


somme de vecteurs, au produit par un scalaire de deux vecteurs, sont aisément transposables
aux vecteurs à dimensions.

Si un vecteur de dépend de plusieurs paramètres indépendants, , la dérivée


partielle du vecteur par rapport à la variable , par exemple, est un vecteur noté:

ou

dont les composantes sont les dérivées partielles des composantes de , soit:

La différentielle totale du vecteur s'écrivant (voir chapitre de calcul différentiel et


intégral dans la section d'algèbre):

Considérons maintenant un espace vectoriel pré-euclidien associé à un espace ponctuel


. Dans un repère tout point de est associé à un vecteur de tel que
. Si le vecteur dépend d'un paramètre et admet une dérivée , il en est de
même alors pour .

Montrons que le vecteur dérivé ne dépend pas du point origine (statique) mais
seulement du point considéré. En effet, si est un autre point origine, nous avons:

732/2001
Sciences.ch 14/03/2005

et puisque le vecteur est fixe et ne dépend pas de , nous avons:

d'où:

Nous pouvons donc noter la dérivée du vecteur en mentionnant seulement le point et


nous écrirons:

La différentielle de s'écrit alors:

Si un point de est associé, par rapport à un repère à un vecteur ,


les dérivées partielles de ne dépendront que du point et nous écrirons, par exemple:

Afin d'alléger les expressions des dérivées partielles totales des fonctions dépendant de
variables, nous utilisons quand le contexte s'y prête, les notations indicielles suivantes. Si
est une fonction des variables , nous noterons les dérivées partielles
sous la forme:

Les dérivées secondes par rapport aux variables et s'écriront:

Lorsque est un vecteur tel que , dont les composantes sont des fonctions de
variables , soit:

733/2001
Sciences.ch 14/03/2005

les dérivées partielles du vecteur seront notées, en utilisant la convention de sommation:

Le concept d'espace ponctuel étant maintenant introduit, nous pouvons maintenant passe à
l'étude du formalisme lagrangien et la détermination de la formulation mathématique du
principe de moindre action.

734/2001
Sciences.ch 14/03/2005

MÉCANIQUE ANALYTIQUE

Nous devons la forme actuelle de la mécanique analytique (appelée aussi parfois "mécanique
lagrangienne") aux travaux des frères Bernoulli et particulièrement d'Euler et Lagrange. C'est
effectivement en 1696 que commence l'histoire de la vraie physique théorique telle que nous
la connaissons aujourd'hui.

Au fait, l'événement de départ de la mécanique analytique provient de l'observation suivante


(énoncée au 17ème siècle) : tout système semble évoluer d'une état à un autre toujours en
utilisant les "moyens" les plus simples et en conservant une grandeur constante entre les deux
états.

Cet énoncé est appelé "principe de moindre action" ou "principe variationnel" ou encore
"principe d'économie".

Remarques :

R1. Les "moyens" précités peuvent êtres : le chemin le plus court, le chemin le plus rapide
(les trajectoires spatio-temporelles à plus faibles amplitudes en gros...).

R2. Selon le premier principe fondamental de la physique, la grandeur constante est choisie
comme étant l'énergie.

Au fait, bien que cet énoncé puisse paraître comme cohérent, il peut faire douter mais... nous
verrons :

1. Qu'en mécanique classique, nous pouvons démontrer la premièr loi de Newton en


admettant ce principe comme vrai et en y superposant le principe de conservation de l'énergie.

2. En électromagnétisme, nous retrouverons toutes les équations de maxwell (in extenso la loi
de Biot-Savart, Farady, Force de Lorentz, loi de Laplace, etc. ) à partir à nouveau des
propriétés du principe de moindre action et de conservation de l'énergie.

3. En optique, nous démonstrerons que le chemin suivi par la lumière est toujours la plus
courte et nous permettra donc de démontrer le principe de Fermat à la base de toute l'optique
géométrique.

4. En physique atomique, les propriétés du principe de moindre action nous permettront de


déterminer certaines propriétés mathématique des atomes et autres particules (les fermions et
le bosons en physique quantique des champs).

5. Le principe de moindre action permet également de démontrer que tout corps, avec ou sans
masse, est dévié par un champ d'accélération (déterminé par la géométrie de l'espace... tiens !
y'aurait pas du chemin là dedans... ?) et... permet donc de déterminer l'équation d'Einstein des
champs qui est à la base de toute la relativité générale.

Il va donc sans dire par ces cinq petits exemples les applications phénomènales de ce principe.
Au fait, tout peut se résumer en la phrase suivante :

«Toutes nos connaissances de l'Univers se résument au théorème de Noether et au principe de

735/2001
Sciences.ch 14/03/2005

moindre action.»

Historiquement, il est intéressant de savoir que c'est Pierre-Louis Moreau de Maupertuis (un
fervant croyant mais personne n'est parfait...) qui a énoncé le premier le principe de moindre
action sous la forme (peu scientifique) suivante :

«Tous les phénomènes naturels s'accordent avec le grand principe que la Nature, dans la
production de ses effets, agit toujours par les voies les plus simples. […] On ne peut douter
que toutes choses ne soient réglées par un Être suprême qui, pendant qu'il a imprimé à la
matière des forces qui dénotent sa puissance, l'a destinée à exécuter des effets qui marquent sa
sagesse…»

L'intervention d'Euler et Lagrange dans ce domaine a été de mettre sous forme mathématique
ce principe et de démontrer (tenez-vous bien...) qu'il découle d'un simple propriété
mathématiques des optima des fonctions continues. Il va sans dire, que sachant que cela a
permis de redémontrer toutes les lois de la physique en a dérangé plus d'un...

Ce principe a eu (et a toujours) des répercussions inimaginables et le problème fut d'appliquer


l'expression mathématique de ce dernier à tous les phénomènes physiques qui avaient déjà
étés démontrés de façon expérimentale et empirique à l'époque. Effectuer cette démonstration
revenait ainsi à expliquer pourquoi tel phénomène ou tel loi était ainsi plutôt qu'autrement.
Imaginez !

Ainsi, le premier à s'attaquer au problème fût donc le Bâlois (Suisse) Léonhard Euler. Mais
nous avons également gardé le nom de Lagrange (d'où l'appelation : "formalisme lagrangien")
pour définir toute la méthode et le formalisme mathématique construite autour du principe de
moindre action.

FORMALISME LAGRANGIEN

Cette technique est assez peu enseignée dans les petites écoles car il faut bien l'avouer le
formalisme lagrangien (contenant donc le principe de moindre action sous forme
mathématique) fait appel à un niveau d'abstraction un peu plus élevé que les méthodes
normales et malgré qu'il soit souvent d'une aide précieuse dans l'élaboratoin de théories
(physique fondamentale, physique quantique, relativité générale, théorique quantique des
champs, théorie des supercordes), il en découle rarement de nouvelles solutions (mais plutôt
une réduction et une méthode de validation utile et très puissante).

Commencons donc notre travail :

COORDONNÉES GENERALISÉES

Un réflexe naturel conduit généralement à référer la position d'un point dans l'espace à la
seule connaissance de ses trois coordonnées cartésiennes , , (voir ci-dessus les espaces
ponctuels). Cette attitude est d'ailleurs le plus souvent justifiée par la simplicité d'un grand
nombre de situations rencontrées dans la pratique, où il n'est pas nécessaire de rechercher de
méthodes plus élaborées ou de passées dans d'autres systèmes de coordonnées (voir le
chapitre de calcul vectoriel).

Pour repérer la position d'un mobile (ou d'un point matériel) en physique il est nécessaire dans
un premier d'associer un repère au référentiel. Ainsi, un"repère" est un système de repérage

736/2001
Sciences.ch 14/03/2005

dans l'espace associé au référentiel.

Les repères conventionnels en mécanique classique constituent majoritairement des bases


d'espaces pré-euclidiens canoniques (voir le chapitre d'analyse vectorielle dans la section
d'algèbre du site) orientés et où chaque point, ou vecteur de l'espace, peut-être représenté
algébriquement par ses valeurs d'affixes (la valeur à l'ordoonnée (projection sur l'axe vertical)
et la valeur à l'abscisse (projection sur l'axe horizontal)).

Voici quelques exemples triviaux:

(ou plan d'Argand-Cauchy)

Remarques:

R1. Comme nous l'avons vu en géométrie différentielle, la distance entre deux points d'une
trajectoire courbe en parcourant la courbe est appelée "abscisse curviligne". Sinon, la distance
entre deux points d'une trajectoire rectiligne est appelée simplement "abscisse".

R2. Un repère, assimilé à un référentiel, est dit "Galiléen" (c'est rare que nous en fassions
explicitement mention en physique par manque de rigeur) si:

- nous pouvons le considérer comme immobile pendant toute l'étude du mouvement du


système ou comme étant en translation rectiligne uniforme par rapport à un autre référentiel
lui même immobile.

ou:

- comme un système où les lois de Newton sont vérifiées (voir le chapitre de mécanique
classique)

Nous renvoyons le lecteur au chapitre de mécanique classique (chapitre suivant) pour une
étude plus approfondie sur le "principe de relativité galiléen".

R3. Un repère, assimilé à un référentiel, est dit "barycentrique" (voir le chapitre de géométrie
euclidienne) s'il a pour origine le centre de masse (voir le concept de "centre de masse au

737/2001
Sciences.ch 14/03/2005

chapitre de mécanique classique) du corps étudié. Cette remarque est important à prendre en
considération lorsque nous verrons le théorème de König en mécanique classique.

R4. Dire qu'un repère orthonormé est "direct" signifie que l'angle orienté a
pour mesure principale (dans le sens horaire). Dire qu'un repère orthonormé est
"indirect" signifie que l'angle orienté a pour mesure principale . Dans tout ce qui suit, si
nous spécifions par l'orientation, cela sous-entend que est direct.

Il est bien exact que les trois paramètres , , suffisent parfaitement à repérer un point
matériel dans l'espace usuel comme nous en avons déjà fait mention dans notre étude des
espaces ponctuels, mais il n'en demeure pas moins qu'il est parfois inévitable, ou même tout
simplement plus avantageux, d'utiliser un nombre de paramètres supérieur à trois. Nous
pouvons évidemment envisager toutes sortes de paramétrages pour atteindre les coordonnées
d'un point dans l'espace, de telle sorte que, d'une façon plus généralisée nous serons amenés à
prendre en considération des relations du type (nous ne gardons plus la même écriture que
celle que nous avions lors de notre étude des espace ponctuels par cohérence avec les
nombreuses références déjà existant sur le sujet):

Les paramètres portent le nom de "coordonnées généralisées", paramètres


auxquels un problème sera le plus souvent référé. Connaître leur expression en fonction du
temps est le problème fondamental de la dynamique. Cela signifie que nous serons parvenus à
une solution quand nous disposerons des relations indépendantes :

Il est donc important de retenir que le nombre de paramètres définissant le repérage d'un
point dans l'espace est au moins égal à trois, sans être nécessairement différent de trois. C'est
finalement la nature des situations envisagées qui suggèrent le choix du nombre des
paramètres à utiliser (coordonnées cartésiennes, cylindriques, sphériques,...).

Dans une vision plus générale, la configuration instantanée d'un système, quelle qu'en soit la
nature, sera déterminée par la connaissance, en fonction du temps, de paramètres,
définissant le nombre de "degrés de liberté" du système (voir le début du chapitre de la
mécanique classique pour voir la définition rigoureuse du concept de degré de liberté)..

Il est tout naturel, mathématiquement, d'associer la manipulation des paramètres au


recours à un hyper-espace à dimensions, dans lequel les apparaîtraient comme les
coordonnées d'un point représentatif de la configuration d'un système quelconque. Nous
donnons à cet espace à dimensions , le nom "d'espace de configuration".

738/2001
Sciences.ch 14/03/2005

Mais la rigueur de la mathématique-physique, nous amène à disposer d'une description plus


précise des phénomènes en ajoutant cette variable importante qu'est le temps, considérée
comme variable indépendante, aux . Nous en arriverons donc fatalement à utiliser un autre
hyperespace auquel nous avons donné le nom "d'espace des événements".

Ce dernier espace de référence revêt un intérêt capital pour un grand nombre de problèmes de
la science moderne et se trouve particulièrement bien adapté aux raisonnements de nature
relativiste. Les variables indépendantes constituant les coordonnées spatiales et temporelle
forment alors ce que nous appelons les "variables d'Euler".

Dans la mesure où les paramètres sont simplement présentés comme des fonctions
explicites du temps, le point décrit une courbe paramétrée, définie par , avec
. Cela revient à exploiter simultanément les équations:

Il arrivera fréquemment que, pour des raisons d'opportunité, nous souhaitions changer de
système de coordonnées généralisées, et utiliser un autre ensemble plus compatible avec les
spécificités du problème envisagé. Nous substituerons alors au jeu des un nouveau jeu de
coordonnées . Il est alors évident que nous devrons, avant toute chose, nous doter des
relations de dépendance existant entre les deux ensembles de coordonnées, à savoir disposer
des relations (voir dans la section algèbre du site au chapitre de calcul vectoriel les relations
de passages pour les systèmes de coordonnées cartésiennes, polaires, cylindriques et
sphériques) :

Les fonctions seront maintenant supposées définies, continues, de classe (pour


travailler avec l'accélération) par rapport aux et devront conduire à un jacobien
différent de zéro (voir le chapitre de calcul intégral et différentiel).

Dans ces conditions, à chaque point de l'espace des configurations des , noté ,
correspondra un point de l'espace de configuration des , noté . Nous avons ainsi
effectué une transformation ponctuelle, autrement dit une application de l'espace sur lui-
même.

Pour étudier des milieux continus (concept radicalement différent du point matériel), nous
aurons cependant deux approches différentes :

739/2001
Sciences.ch 14/03/2005

1. Soit nous attribuons aux particules du milieu les lois de la mécanique (dynamique des
corps en mouvement) ce qui implique un traitement statistique pour en établir une dynamique
pour l'ensemble des particules (cette méthode est pratiquée en théorie cinétique des fluides ou
encore en mécanique statistique - c'est également une approche dite "réductionniste").

2. Soit nous examinons le mouvement d'ensemble d'un milieu composé par un très grand
nombre de particules et nous le considérons comme un milieu continu. Ce concept de " milieu
continu " est acceptable pour autant que le volume infinitésimal pris autour d'un point
quelconque du fluide soit suffisant pour encore contenir un très grand nombre de particules.

Remarque : par "volume infinitésimal", nous sous-entendons plus précisément un volume


suffisamment petit par rapport au volume continu étudié mais suffisamment important par
rapport aux distances intermoléculaires. Ce sera donc un volume élémentaire contenant un
grand nombre de particules bien qu'il soit mécaniquement considéré comme ponctuel.

Pour décrire le mouvement d'un milieu continu, il y a deux méthodes :

1. Méthode de Lagrange :

Le mouvement du milieu est décrit par une formulation Lagrangienne consistant donc à le
caractériser en se donnant un système d'équations au sens newtonien :

C'est un système d'équations dans lequel sont les coordonnées cartésiennes d'une
particule du milieu continu à l'instant initial . En éliminant le temps, nous obtenons
l'équation de la trajectoire de la particule. Par dérivations, nous avons alors la vitesse et
l'accélération de la particule.

2. Méthode d' Euler :

Au lieu de suivre le parcours d'un point , nous portons notre attention sur l'évolution des
caractéristiques physiques en un point donné du fluide. Si (une propriété parmi tant
d'autres) est la vitesse en un point au temps , nous avons:

Dans un référentiel cartésien orthonormé, les composantes sont:

où nous avons bien évidemment:

740/2001
Sciences.ch 14/03/2005

et

Lorsque nous effectuons un modèle basé sur la méthode d'Euler, nous parlons fréquemment
de "système Eulérien". Nous en verrons un premier exemple en mécanique classique lorsque
nous formulerons la première loi de Newton pour un point matériel et pour un milieu continu.

PRINCIPE VARIATIONNEL

Le "principe variationnel" n'est donc que la forme mathématique contemporaine du principe


de moindre action qui est, comme nous en avons déjà fait mention, à la base du formalisme
lagrangien (qui est donc un cadre théorique de la plus haute importance dans les recherches
actuelles en physique théorique, et contient la totalité de nos connaissances actuelles en
physique).

Rappelons que selon l'énoncé du principe variationnel nous devons trouver dans tout
phénomène physique, une certaine quantité qui est naturellement optimisée (minimisée ou
maximisée) et qui décrit toutes les variables du système étudié et ainsi son issue.

Remarque : si aucune action extérieure n'intervient dans l'évolution du système, nous parlons
alors de "système libre".

Voici la démarche que nous allons suivre, une fois cette démarche présentée, nous nous
attquerons à sa formalisation mathématique. Les propositions (les idées) sont les suivante :

P1. Nous supposons donc le principe variationnel et le principe de conservation de l'énergie


comme justes.

P2. L'énergie totale d'un système fermé est constante et constituée de la sommation de
l'énergie cinétique et l'énergie potentielle (si nous ne considérons que l'énergie cinétique, alors
le système est dit "libre", si les deux énergies sont considérées, nous disons alors que les
système est "généralisé").

P3. Nous définissons une fonction mathématique (dont les variables sont les coordonnées
généralisées) appelée "Lagrangien" qui est donnée par la différence entre les deux énergies
précitées.

P4. Sur l'évolution d'un système entre deux états, nous cherchons les propriétés de la fonction
(du langrangien) qui donne la minimisation de la variation de la différence des deux énergies
(rappelez-vous que le principe variationnel s'appel aussi principe d'économie et ce n'est pas
pour rien) sur l'évolution temporelle ou métrique du système.

Enfin, une fois la propriété de cette fonction déterminée (propriété mise sous la forme que
nous appelons "équation d'Euler-Lagrange) nous chercherons toutes les propriétés possibles
autres qu'elle a afin d'avoir les outils nécessaires pour la physique théorique et vous allez voir
cela marche terriblement bien...

Donc, pour mettre cela sous forme mathématique, nous commencons par poser qu'il existe
une fonction réelle de variables:

741/2001
Sciences.ch 14/03/2005

que nous appellerons "Lagrangien généralisé" du système, dont l'intégrale satisfait à l'énonce
suivant :

Dans un mouvement naturel partant d'un point à l'instant , arrivant au point


à l'instant , l'intégrale suivante, appelée "intégrale d'action" ou simplement
"action":

ou dans une écriture abrégée dans le cas d'une paramétrisation temporelle :

doit être un extrêmum (en fait, "un minimum" ou "un maximum", puisque nous aurions pu
tout aussi bien prendre au lieu de dans le choix de la définition du Lagrangien
généralisé).

ÉQUATION D'EULER-LAGRANGE

Le principe de moindre action énonce que (l'intégrale) est extrêmale si:

est la trajectoire naturelle effectivement suivie par le système physique.

Considérons alors une trajectoire très voisine à la précédente, que nous noterons:

Remarque : nous avons omis maintenant l'écriture des arguments des fonctions du temps
afin d'alléger les écritures.

Si est bien l'évolution d'un système évoluant selon le principe de moindre action, alors
l'action donné par la variation :

est nulle pour et tendant vers zéro (sous-entendu que tout système physique revient à
son état initial).

Ce qui nous amène à écrire :

742/2001
Sciences.ch 14/03/2005

Ce qui nous permet de justifier la dénomination de "principe variationnel" :

Ce principe stipule donc que la trajectoire d'un particule (ou d'un système plus général)
s'obtient en demandant qu'une certaine fonctionnelle appelée "action" soit stationnaire par
rapport à une variation de la trajectoire. En d'autres termes, si nous effectuons une variation
infiniment petite de la trajectoire , la variation doit être nulle. Pour un système mécanique
simple, l'action est alors évidemment par le principe de conservation de l'énergie égale à
l'intégrale sur la trajectoire de (par définition du lagrangien) de la différence entre l'énergie
cinétique et l'énergie potentielle.

Dès lors, dans une théorie àpour laquelle les forces dérivent d'un potentiel , nous sommes
naturellement amenés à définir le "Lagrangien" par la relation (il faudra s'en souvenir !) :

où et sont la notation traditionnelle dans le formalisme Lagrangien de l'énergie cinétique


et de l'énergie potentiel données par :

et

Remarque : pour l'étude de la relativité générale, nous ne chercherons pas à ce que la variation
de de la différence des énergies soit minimale tel que c'est le cas pour les systèmes
mécaniques, mais la variation de la longueur d'un arc (non dépendant du temps
contrairement à l'exemple précédent) dans un espace quelconque lors d'une trajectoire d'un
système libre. Ce qui nous aménera à écrire simplement (rappelez-vous en aussi car ce sera
très important) :

Pour revenir à notre application du principe variationnel dans le cas du lagrangien généralisé,
nous pouvons alors écrire la différentielle totale exacte (voir chapitre de calcul différentiel et
intégral) de et nous obtenons alors la relation :

Intégrons par parties (voir chapitre de calcul différentiel et intégral) le deuxième terme de la
somme de l'intégrale précédente :

743/2001
Sciences.ch 14/03/2005

La premier terme de la dernière égalité est nul puisque

Effectivement, par définition, les ont exactement le même ordre de grandeur.

L'expression de l'intégrale de moindre action peut finalement s'écrire :

Mais les et tendent vers 0 d'une infinité de manières différentes et nous devons
cependant avoir néanmoins . Cela veut dire alors que chaque terme sommé de
l'intégrale peut être pris indépendamment et doit satisfaire :

Mais comme les fonctions et peuvent toujours tendre vers zéro de multiple façon, et
que cette intégrale doit être quand même nulle, nous en déduisons que ce sont les intégrandes
qui sont nuls :

Ces équations, satisfaites par le lagrangien généralisé du système pour le mouvement


effectivement suivi, sont appelées "équations d'Euler-Lagrange", ou plus brièvement (mais
plus rarement) "équations de Lagrange". Ce sont, comme nous allons le voir, les équations du
mouvement du système: résolues, elles donnent l'évolution effective du système dans le
temps.

Remarque : c'est en étudiant la physique (les chapitres suivant du site) que l'on comprend
mieux les applications de cette équation (obtenue quasiment que par des développement
purement mathéamtique !!!) et qu'il devient alors possible de comprendre sa signification. A
notre niveau du discours, il est inutile de dire quoi que ce soit. Il faut faire de la physique, et

744/2001
Sciences.ch 14/03/2005

encore de la physique pour la comprendre et la voir apparaître.

Donc dans l'approche lagrangienne, nous appronons à raisonner à partir de concepts d'énergie
potentielle et cinétique, au lieu de concepts de force. Les deux approches sont évidemment
équivalentes physiquement, mais les énergies n'étant pas des quantités vectorielles, elles sont
conceptuellement plus faciles à utiliser dans une vaste gamme de problèmes. En physique
quantique par exemple, la notion de force n'a aucune signification mais les notions d'énergie
demeurent valables. C'est une raison de plus pour se familiariser avec leur utilisation. De plus,
la force au sens de Newton est une action instantanée à distance. En relativité, une telle chose
est impossible. La notion de force est donc une création purement classique et macroscopique
contrairement à notre intuition, son intérêt est limité.

Exemple d'application (les autres exemples seront vus pendant notre étude des lois de
Newton, de l'électrodynamique, de la relativité restreinte, de la relativit générale, de la
physique quantique des champs, etc..):

Dans un premier temps, posons sous une forme mathématique conventionnelle l'équation
d'Euler-Lagrange (la notation des coordonnées généralisées n'est pas identique en
mathématiques à celle de la physique...):

Prenons un exemple mathématique pratique simple mondialement (voir universellement)


connu et très important (nous réutiliserons les développements effectués ici pour l'étude du
pendule de Huygens).

L'énoncé du problème est le suivant : déterminer quel est le plus court chemin entre deux
points d'un plan (nous devinons que c'est la droite mais il faut le démontrer!).

Dans cet exemple quelque soit le chemin, nous avons un élément de celui-ci qui est donné par
la relation de Pythagore dans :

d'où la différentielle :

Puisque n'est pas dépendant de , nous avons :

Dès lors, il vient que dans ce cas particulier que :

745/2001
Sciences.ch 14/03/2005

se réduit à :

mais comme n'est pas pas non plus de , cela signifie que nous avons :

Et puisque nous cherchons un optimum :

Si nous en calculons la primitive :

Or cela semble en condradication avec un résultat précédent :

Ceci nous amène donc à écrire :

Donc après intégration :

Finalement la primitive devient:

noté autrement en posant et nous obtenons :

746/2001
Sciences.ch 14/03/2005

Donc le plus court chemin entre deux points dans un plan est l'équation d'une droite... (simple
mais puissant)

Remarque :

Si est une trajectoire optimale (extrémale), nous devons avoir dans l'espace des fonction la
fonction telle que sa dérivée est nulle en tout point. Ce qui implique que . Dès lors,
nous pouvons écrire :

Nous avons aussi :

qui est une cas particulier de avec .

FORMALISME CANONIQUE

Le formalisme canonique n'introduit pas une nouvelle physique mais propose une nouvelle
gamme d'outils pour étudier les phénomènes physiques. Son élément central, "le
Hamiltonien", joue un grand rôle en physique quantique.

Comme dans le formalisme de Lagrange nous travaillerons avec des quantités comme
l'énergie, et plutôt qu'avec des quantités vectorielles comme la force de Newton.

Dans le formalisme de Lagrange, la description d'un système mécanique à degrés de liberté


décrits par les coordonnées générales indépendantes (non contraintes) nous mêne à
équations d'Euler-Lagrange:

qui sont des équations différentielles du 2ème ordre.

Dans le formalisme canonique (ou de Hamilton), un système mécanique à degrés de liberté


toujours décrits par des indépendants nous ménera à équations du premier ordre (plus
simple à résoudre).

Chez Lagrange nous comparons principalement des trajectoires et par conséquent les et les
sont tous indépendants. Chez Hamilton nous devrons d'abord apprendre à définir les
"moments généralisés", notés , pour remplacer les coordonnées généralisées et qui
sont aussi tous indépendants.

Remarque : l'origine des moments conjugués sera trivial dès que nous aurons vu un premier

747/2001
Sciences.ch 14/03/2005

exemple concret.

TRANSFORMATION DE LEGENDRE

Cette transformation est souvent utilisée en thermodynamique où elle permet de relier entre
eux les différents potentiels thermodynamiques. En mécanique elle permet de définir le
hamiltonien à partir du lagrangien. Nous en donnons une description simplifiée et suffisante.

Soit une fonction où sont les deux variables indépendantes dont dépend .

Définissons:

La transformation de legendre permet de définir une fonction qui peut remplacer


:

Soit maintenant la différentielle totale de (voir chapitre de cacul différentiel et intégral) :

De la définition de nous calculons:

et nous avons donc:

HAMILTONIEN

Soit un langrangien que nous traiterons comme la fonction ci-dessus avec les
jouant le rôle de et les le rôle de . A la place de , nous définissons les moments
généralisés également appelés "moments canoniques":

748/2001
Sciences.ch 14/03/2005

avec .

Avant de continuer voyons ce que nous permet de faire cette définition :

Nous définissons donc, en analogie avec , une fonction des et des que nous noterons
:

Attention! La relation obtenue :

est plus que importante (comme tout le reste d'ailleurs). Nous la retrouverons, entre autres, en
physique quantique des champs. Par ailleurs, un très joli exemple de tout ce que nous avons
vu maintenant est donné dans le chapitre de mécanique relativiste ou nous calculons le
lagrangien et hamiltonien d'une particule libre. Les résultats sont assez pertinents et leur utilité
et justesse en électrodynamique plus que étonnante.

Si dépend du temps (ce qui est quand même assez souvent le cas..) nous avons comme
différentielle totale :

nous calculons aussi la différentielle totale de et y substituons le résultat obtenu


précédemment :

ce qui montre bien que est fonction des (et du temps).

Nous pouvons donc aussi écrire pour sa différentielle totale :

749/2001
Sciences.ch 14/03/2005

et comme les et sont indépendants nous identifions, en comparant nos deux expressions
que:

Ces relations sont extrêmement importantes car nous les retrouverons en physique quantique
des champs sous une forme un peu plus barbare (mais magnifique aussi...).

Considérons maintenant le deuxième terme du premier membre de l'équation d'Euler-


Lagrange. Nous avons :

et ainsi, nous obtenons les équations ci-dessous :

Ces équations sont appelées "équations canoniques du mouvement" et sont des équations
différentielles du premier ordre.

Remarque : l'apparition du signe moins " - " entre les équations pour les et celles pour leurs
moments conjugés, s'appelle une "symétrie symplectique".

De :

nous pouvons, sur une trajectoire qui obéit aux équations canoniques, calculer:

750/2001
Sciences.ch 14/03/2005

Remarque : si ne dépend pas du temps nous avons alors , alors (ainsi que
), sont une "constante du mouvement".

Un exemple s'avère indispensable à ce niveau d'avancement de l'étude formalisme


Lagrangien. Nous allons nous restreindre à un cas particulier d'une particule soumis à une
force en une dimension. Mais bien que cet exemple et les développements qui y sont liés
soient simples nous retrouverons les résultats obtenus ici dans bien d'autres parties du site. Il
est donc important de bien l'étudier et de bien le comprendre (ce qui nécessite
malheureusement aussi que le contenu du chapitre de mécanique classique soit connu par le
lecteur).

Exemple :

Soit une particule de masse se déplaçant en une dimension (disons ) et soumise à une
force dérivant d'un potentiel tel que:

Nous savons que son lagrangien est:

Nous n'aurons qu'un seul moment (la quantité de mouvement), noté , conjugué à et défini
par:

équation que nous pouvons (que nous devons !) inverser (de la définition de la quantité de
mouvement) :

Nous pouvons noter en ce point le moment correspond (ô hasard !!) à la composante de


la définition élémentaire (ce qui ne sera pas toujours aussi trivialement le cas).

Selon la définition de l'Hamiltonien il vient alors :

751/2001
Sciences.ch 14/03/2005

que nous écrivons souvent sous la forme :

où est donc l'énergie cinétique exprimée en fonction des moments.

CROCHETS DE POISSON

Le crochet de Poisson est la façon standard de noter une certaine opération qui
implique les quantités et ainsi que l'ensemble des variables canoniques
définie par :

de cette définition nous pouvons déduire certaines propriétés triviales (si ce n'est pas le cas,
n'hésitez pas à nous contacter, nous ajouterons les démonstrations) :

où la dernière expression est appelée "identité de Jacobi".

Au delà d'une simple notation, le calcul des crochets de Poisson est assez facile et permet
d'obtenir nombre de résultats intéressants. D'autre part, ils sont intimement reliés aux
"commutateurs" de la physique quantique que nous étudierons dans le détail dans le chapitre
concerné.

Considérons maintenant une fonction quelconque dont la dérivée totale par rapport
au temps le long d'une trajectoire s'écrit (vous y reconnaîtrez quelque chose que vous
connaissez déjà... ) :

Si cette trajectoire est une trajectoire physique, elle obéit aux équations canoniques de
l'hamiltonien du système:

et alors:

752/2001
Sciences.ch 14/03/2005

En particulier, cette équation permet un calcul facile des constantes du mouvement,


. En effet, le calcul de est immédiat et le calcul de un assez simple
exercice.

Il existe une famille de résultats intéressants des crochets de Poisson. Parmi les plus
importants, calculons certains de ces crochets entre des variables canoniques, coordonnées et
moments :

puisque par définition, les coordonnées et moments ne sont pas directement dépendants :

d'où :

et de manière identique :

Mais :

où rappelons-le, est le symbole de Kronecker défini par :

Attention ! n'est pas commutatif. Effectivement, le lecteur contrôlera facilement


que :

Ce qui implique un résultat assez général que nous retrouverons en physique quantique :

753/2001
Sciences.ch 14/03/2005

TRANSFORMATIONS CANONIQUES

Nous disons des que ce sont des "variables canoniques généralisées". Ce n'est pas un
euphémisme puisqu'il n'y a pratiquement aucune limite à ce qu'elle peuvent représenter
physiquement.

Puisque tel est le cas, il doit exister des transformations entre ces différents choix. Nous
noterons les nouvelles variables canoniques obtenues suite à une telle transformation.

Nous ne sommes pas surpris par contre de constater que ces transformations sont soumises à
des conditions assez sévères. En effet, les sont généralisés et obéissent à :

et les équations canoniques :

sont invariantes de forme. Ainsi, à la suite d'une transformation des vers les et
définissant un nouvel hamiltonien que nous noterons nous devrons avoir :

et les équations canoniques :

Strictement, les équations de transformation peuvent s'écrire :

avec et doivent pouvoir s'inverser puisque la physique reste indépendante des


variables que nous employons pour la décrire, donc nous pouvons écrire les transformation
inverses :

avec . Les forment variables mais il est évident que seules

754/2001
Sciences.ch 14/03/2005

d'entre elles sont indépendantes.

755/2001
Sciences.ch 14/03/2005

MÉCANIQUE CLASSIQUE RATIONNELLE

Avant d'aborder l'étude des corps solides en mouvement, il peut sembler être dans l'ordre
logique des choses de définir et d'étudier les propriétés relativement à leur état statique.

Définitions :

D1. Un phénomène est "statique" ou en "équilibre" lorsque il ne subit aucune dynamique


(accélération ou in extenso : force), du moins apparente. Nous pouvons considérer un
équilibre comme un état statique, bien qu’il ne soit qu’apparent car il peut être le résultat de
deux dynamiques opposées qui se compensent ! Ainsi, les grandeurs qui décrivent un
phénomène statique sont des constantes, les valeurs concrètes de ces grandeurs sont
calculables.

D2. La "statique" est l'étude des conditions d'équilibre d'un point matériel soumis à des forces
en équilibre

D3. Toute cause capable d'accélérer ou de déformer un corps est appelé "force" (concept
introduit rigoureusement par Newton et sur lequel nous reviendrons en détail plus loin lors de
l'énoncé des trois lois de Newton).

POINT MATÉRIEL

Un système matériel (ensemble des points matériels ) est dit "solide


indéformable" (rigide), ou simplement "solide", si les distances mutuelles des points matériel
le constituant ne varient pas au cours du temps :

Remarque: dans un repère, la position relative des axes est invariante au cours du temps, c'est
pourquoi un repère est équivalent à un solide dont l'origine est alors assimilé un "point
matériel". Par suite, pour la commodité de l'étude de la mécanique classique de par rapport
à un référentiel , nous substituerons généralement le solide à un repère d'espace qui lui
est invariablement lié.

Positionner un solide par rapport à un référentiel revient à positionner le repère


lié au solide par rapport au repère .

Pour la suite, comme nous travaillerons que très peu en notation tensorielle en mécanique
classique, nous noterons:

Soit un repère lié au solide. Préciser la position et l'orientation du solide dans


revient à préciser la position et l'orientation du référentiel , lié au solide.
La position est donnée par les coordonnées de l'origine dans (en pratique,
est souvent confondu avec le centre de masse du solide afin de simplifier les calculs).

756/2001
Sciences.ch 14/03/2005

L'orientation du solide sera quant à elle donnée par l'orientation de la base dans
:

Pour simplifier, les origines et des deux référentiels sont supposées confondues (ce qui
n'enlève rien à la généralité du passage de l'orientation d'une base à une autre).

Trois paramètres angulaires sont nécessaire pour déterminer complétement par rapport à
. Ces paramètres sont appelés les "angles d'Euler" et ils sont associés à 3 rotations
successives qui permettent de superposer la base sur la base . Ces trois
rotations sont détaillées sur les figures ci-dessous :

- "rotation propre" afin d'amener le vecteur dans le plan . La direction de définit


la "ligne des noeuds", c'est-à-dire l'intersection d'un plan perpendiculaire à avec le plan
horizontal .

757/2001
Sciences.ch 14/03/2005

- "nutation" afin d'amener en coïncidence avec . De plus est après dans le plan
horizontal .

- "précession" afin d'amener en coïncidence avec et avec .

Ainsi, dans le cas général, le nombre de paramètres indépendants nécessaires pour préciser la
position et l'orientation du solide dans le référentiel est égal à 6 : 3 paramètres de position
et 3 paramètres d'orientation.

Une autre approche possible permettant de dénombrer le nombre de paramètres nécessaire à la


définition de la position et de l'orientation d'un solide est la suivante :

- la position d'un point quelconque du solide ( ) est déterminée par ses coordonnées dans
(3 paramètres)

- soit un second point du solide: lorsque le point est fixé dans , peut encore se
mouvoir autour de : il décrit alors la surface d'un sphère de rayon . Il faut donc trois
paramètres supplémentaires pour déterminer la position de sur cette surface.

Finalement le nombre de paramètres nécessaires pour préciser la position et l'orientation du


solide dans est encore une fois de : .

Remarque: si le mouvement du solide est retreint par une liaison, le nombre de degrés de
liberté est alors inférieur à 6. Par exemple, un solide en rotation autour assimilé au repère

758/2001
Sciences.ch 14/03/2005

principal et en rotation autour de l'axe fixe ne possède qu'un seul degré de liberté (l'angle de
rotation autour de cet axe).

LOIS DE NEWTON

Les trois lois de Newton (nous devrions plutôt dire "hypothèses Newton") sont à la base de la
mécanique classique. Elles sont à posteriori indémontrables et non formalisables car elles
énoncent des observations et découlent donc de notre expérience quotidienne.

Cependant, les développements de la physique moderne et qui se basent sur les conséquences
de ces trois lois sont en tel accord avec les conditions théoriques qu'impose le principe de
moindre action et les expériences y relatives, que leur validité pourrait ne plus être mise en
doute (...)

PREMIÈRE LOI (LOI D'INERTIE)

Définition : Tout corps ponctuel ou étendu persévère dans sa forme (géométrie) ou son état de
repos ou de mouvement rectiligne uniforme (décrit par le centre de masse), sauf si des forces
"imprimées" le contraignent d'en changer.

Corollaire : tout corps au repos est soit imprimé par un nombre de forces nul, soit la somme
des forces imprimées est nulle (principe fondamental de l'étude de la "statique").

Remarque : nous avons démontré ce corollaire lors de notre étude du théorème de Noether
dans le chapitre traitant des principes de la physique.

Après la virgule de la première phrase, jaillit en pleine lumière le mot "force". Questionnons
donc ce mot : le langage courant regorge de significations différentes: la force du poignet, la
force de l'âme… Aussi, la force peut-elle être aveugle ou majeure, selon le cas… Quoi qu'il en
soit, elle a le pouvoir de changer le cours (le mouvement) et la forme (géométrie) des choses.
Sans ignorer ce halo qui entoure le mot et qui a embarrassé plus d'un physicien avant lui,
Newton donne à la force une signification très précise, qui se démarque de l'idée intuitive d'un
effort physique.

Propriétés :

P1. La force est un grandeur vectorielle

P2. L'effet d'une force, ne change pas si nous faisons glisser la force sur sa droite d'action.

Une force est donc une grandeur physique qui se manifeste par ses effets :

E1. Effet dynamique : une force est une cause capable de produire ou de modifier le
mouvement ou la forme (géométrie) d'un corps

E2. Effet statique : une force est une cause capable de produire une déformation d'un corps.

Toute force peut être représentée par un vecteur dont les quatre propriétés sont :

P1. Direction : droite selon laquelle l'action s'exerce

759/2001
Sciences.ch 14/03/2005

P2. Sens : sens selon lequel l'action s'exerce sur la droite

P3. Point d'application : point où l'action s'exerce sur le corps

P4. Intensité : la valeur (norme) de la force

Il est possible de ranger la plupart des forces par famille telles que :

F1. Les forces de "réaction" : chaque corps exerce une force sur un autre corps qui est en
contact avec lui. Par exemple, si un objet repose sur une table, cette table exerce une force
égale et opposée sur l'objet (afin que ce dernier ne s'enfons pas dans la table - ce sont des
mécanismes quantiques qui sont à l'origine de cette force de réaction). Cette force est toujours
à la verticale du point de contact.

F2. Les forces de frottement : la force de frottement existe lorsque deux corps sont en contact.
Elle s'oppose toujours au mouvement. La force de frottement qui s'oppose au mouvement n'a
pas seulement un effet négatif, elle est indispensable pour assurer le contact entre deux
surfaces (par exemple : contact des pneus sur la route, freinage, …).

F3. Les forces de tension exercée sur un corps : c'est une force qui tire sur un élément d'un
corps comme par exemple, la tension exercée par un fil, par un ressort

F4. Les forces "à distance" : ce sont les forces qui agissent par l'intermédiaire de champs
vectoriels comme par exemple le champ électrique, le champ magnétique, le champ
gravitationnel. Ce dernier a comme particularité s'il est isotrope (nous le démontrerons lors de
notre étude de la statique des forces) de pouvoir se réduire à l'étude du centre de gravité du
corps.

DEUXIÈME LOI (PRINCIPE FONDAMENTAL DE LA DYNAMIQUE)

Définition : le changement de mouvement est proportionnel à la "force motrice imprimée, et


s'effectue suivant la droite par laquelle cette force est imprimée.

Une force, nous le savons, est dans le langage de Newton ce qui provoque le "changement du
mouvement" et pas autre chose… Mais, supplément au programme, les mots "changement du
mouvement" de cette loi cachent une signification mathématique, différente de l'intuition
"changement de vitesse". Pour Newton, nous avons vu qu'un corps au repos était caractérisé
par sa quantité de matière, sa masse. S'inspirant de certains prédécesseurs, Newton pose qu'un
corps en mouvement "transporte une certaine quantité", appelée sans fioritures : la "quantité
de mouvement". C'est en fait cette quantité qui, sous le simple mot "mouvement" est contenue
dans l'énoncé de la seconde loi. "La quantité d'un mouvement est la mesure que nous tirons à
la fois de sa vitesse (concept que nous définirons plus loin lors de notre étude de la
cinématique) et de sa quantité de matière", autrement dit, par définition, le produit de sa
masse par sa vitesse.

En utilisant les symboles mathématiques modernes, la première partie de cette deuxième loi
peut alors se reformuler :

La force est égale à la variation en fonction du temps de la quantité de mouvement, soit dans

760/2001
Sciences.ch 14/03/2005

un cadre non relativiste :

Cette relation est donc valable tant que la vitesse est très inférieure à celle de la lumière
comme nous le verrons en lors de notre étude de la mécanique relativiste bien plus tard, car
Newton supposa que la masse ne variait (ou ne semblait varier) en fonction de la vitesse.
Ainsi:

Rappel : la "masse" est une mesure pour la quantité de matière contenue dans le corps (pour
plus de détails voir le chapitre traîtant des principes de la mécanique). La masse est une
constante indépendante de l'endroit où elle se trouve (unité S.I. kilogramme : ). Le "poids",
correspond lui à la force (unité S.I. newton : ) qu'un objet exerce sur une autre par
l'intermédiaire d'un champ gravitationnel. Il dépend de l'endroit où nous nous trouvons (voir
ci-dessous l'équation de la force gravitationnelle de Newton).

Nous verrons (démontrerons) que dans le cadre d'un corps tombant dans un champ
gravitationnel à symétrie sphérique, nous avons :

dans le cadre de notre vieille Terre, nous avons pour habitude de poser:

Dans le système Eulérien et en coordonnées cartésiennes, une grandeur donné d'un milieu
continu aura une distribution en fonction des quatre variables indépendantes . Pour de
petites variations et , la variation totale de s'exprimant par (voir le chapitre
cacul différentiel et intégral dans la section d'algèbre):

En suivant une particule dans son mouvement, nous observons pendant un temps des
déplacements . Nous pouvons donc exprimer à partir de l'expression précédente la
variation totale de pendant le temps . Nous obtenons ainsi l'expression d'une dérivée très
importante en physique théorique dite "dérivée particulaire":

En mécanique nous allons particulièrement travailler avec le champ gravitationnel Newtonien.


Dès lors, la relation reliant la force à l'accélération prend une forme plus générale:

761/2001
Sciences.ch 14/03/2005

Soit la dérivée particulaire de la vitesse (pour les trois coordonnées spatiales):

Ce qui peut s'écrire aussi sous forme condensée:

La deuxième loi de Newton s'écrit alors:

Cette formulation de la deuxième loi de Newton est de la plus haute importance en physique.
Elle rend compte explicitement de la force subie par un point matériel dans un champ
vectoriel en fonction de la vitesse et non plus de la position. Nous retrouverons cette
formulation en mécanique des milieux continus dans notre étude des fluides et plasmas, en
électromagnétisme ainsi qu'en Relativité Générale.

TROISIÈME LOI (LOI D'ACTION ET RÉACTION)

Énoncé : la réaction d'un corps étendu ou ponctuel solide est toujours de sens opposée et
d'intensité et de direction égale à la force imprimée.

Cette troisième loi est plus connue sous le nom de : "principe d'action/réaction" et découle de
la première loi de Newton selon la raisonnemen mathématique lors de notre étude du
théorème de Noether dans le chapitre traitant des principes de la physique.

Nous pouvons également dire encore que deux corps solides ponctuels ou étendus en contact
exercent l'un sur l'autre toujours des forces opposées en sens mais égales en intensité et en
direction

CONDITIONS D'ÉQUILIBRE

Pour qu'un point matériel, soumis à des forces soit en équilibre statique, il faut
que la résultante de ces forces soit nulle. Soit :

Définitions:

D1. Un solide rigide est un ensemble de points rigidement liés.

D2. Si les lignes d'action de toutes les forces agissant sur un corps sont dans un même plan, le
système de forces est dit "coplanaire".

762/2001
Sciences.ch 14/03/2005

Une observation plus approfondie fait apparaître la force comme le résultat macroscopique de
phénomènes microscopiques complexes, à savoir des interactions à distance entre particules.
Ces interactions sont au nombre de quatre et je désire nullement en parler maintenant car elles
font appel à des outils mathématiques qui sont hors contexte dans cette section du site.

Remarque : la relation précédente, qui définit donc tout corps à l'équilibre, ouvre l'étude a de
très nombreux cas pratiques et constitue à elle seule un immense chapitre d'application
pratiques que nous appelons la "statique des forces" et que nous développerons après avoir
introduit le concept de moment de force.

CENTRE DE MASSE ET MASSE RÉDUITE

Il s'agit du cas particulier du barycentre avec toutes ses propriétés que nous avons déjà
largement développé dans le chapitre de géométrie euclidienne (donc nous vous conseillons
fortement de vous y référer) mais rapporté à la physique :

Soit un solide formé de points de masse et repérés par leurs vecteurs de


position respectifs.

Définition : nous appelons "centre de masse" (ou "centre d'inertie" s'il y a égalité stricte entre
masse grave et masse inerte comme nous en avons fait mention dans le chapitre traitant des
principes de la mécanique) un point auquel nous pouvons rattacher tout la masse du
système (et donc son analyse!!) et tel que, l'origine étant arbitrairement choisie il soit donné
par (nous démontrerons cette relation lors de l'étude de la statique des forces) :

De façon identique, nous définissons la masse réduite du système par la relation :

Si nous considérons le solide comme continu (vrai seulement à l'échelle macroscopique en


première approximation) alors il vient :

Intégrales étendues au volume du solide en entier.

De plus, si le solide est homogène (cas particulier), de masse volumique , alors ,

763/2001
Sciences.ch 14/03/2005

étant l'élément de volume. L'équation peur alors s'écrire (la notation de la triple intégrale
est réduite à une seule par souci de condensation d'écriture):

Soit en composantes :

Remarques:

- Si le solide possède un axe de symétrie, alors est sur cet axe

- Si le solide possède un plan de symétrie, alors est sur ce plan

- Si le solide possède plusieurs axes de symétrie, alors est à leur intersection

- Le centre de masse peut se trouver hors du solide (exemple: un tabouret, un boomerang,


etc.)

- il ne faut pas confondre centre masse et centre de gravité (dit également "barycentre" - voir
le chapitre traint de la géométrie euclidienne) qui se confondent seulement si et seulement si
la masse du corps étudié est homogène.

Il n'est pas évident de calculer le centre de masse d'un corps donné relativement simple. Ce
n'est pas que les outils mathématiques à manipuler soient complexes loin de là (simple
intégrale, Pythagore et quelques multiplications et intégrations par parties) mais il faut
aborder le problème d'une façon élégante et si nous n'avons pas tout de suite la bonne
approche nous nous casserons très vide les dents. Nous conseillons donc aux professeurs qui
abordent ce sujet et les exercices y relatifs, de les faire avec les élèves (donc en classe) mais
en laissant ces derniers débattre de la façon dont le professeur doit attaquer le problème au
tableau noir (cela marche très bien).

THÉORÈME DU CENTRE DE MASSE

Sous l'action des forces extérieures , agissant en chaque point du solide, chacun
de ces points prend l'accélération correspondant à la force appliquée . En utilisant la loi de
Newton (voir la définition de cette loi plus loin) pour chaque point et en sommant les effets
nous aurons (dans un cas non relativiste) :

en vertu de la position du centre de masse donnée par la relation :

764/2001
Sciences.ch 14/03/2005

il vient si le référentiel est posé sur le centre de masse :

soit:

C'est le théorème du centre de masse, que l'on peut énoncer ainsi:

Le centre de masse d'un solide se meut comme un point matériel de masse égale à celle du
solide et auquel serait appliqué la somme des forces extérieures. Un exemple simple est celui
d'une projectile explosif décrivant en absence de pesanteur une trajectoire courbe. Si le
projectile explose et se fragmente, le centre de masse des éclats continue à décrire la
trajectoire courbe qu'il avait entamée.

Remarque: dans le cas particulier du solide (ensemble de points) soumis au champ de la


pesanteur, est le poids du solide et s'appelle alors "centre de gravité" (d'où l'origine de
cette appelation).

Reprenons l'équation :

donnant la position du centre de masse. Sa vitesse vaut:

en posant :

où est la quantité de mouvement du système, il vient:

765/2001
Sciences.ch 14/03/2005

Cette relation montre que si la somme des forces extérieures est nulle alors:

Donc la quantité de mouvement du système entier est conservée et le mouvement du centre de


masse du système est inaltéré. Ceci justifie les remarques faites lors de l'étude de la
conservation de la quantité de mouvement.

Dans l'étude des interactions entre particules, il est souvent commode d'utiliser un système de
référence lié au centre de masse de l'ensemble des particules. Ce centre de masse étant au
repos dans ce référentiel sa vitesse y est nulle ainsi que la quantité de mouvement totale,
comme le montrent les équations ci-dessus. Cette propriété constitue le puissant avantage de
cette description.

Remarque : en mécanique, l'usage du centre de masse (point matériel) est


particulièrement aisé car le système de forces est régi seulement par la loi de Newton. Avec
des particules électrisées (charges), il en va tout autrement; Les effets électromagnétiques sont
dominants lors de leurs accélérations, ce qui induit des phénomènes ondulatoires interactifs
nettement plus complexes. C'est la raison pour laquelle nous ne verrons jamais une étude sur
ce site du "centre de charge" lorsque nous aborderons l'électrostatique dans la chapitre
d'électrodynamique.

THÉORÈME DE GULDIN

Le théorème de Guldin permet dans certains cas, de simplifier le calcul du centre de masse de
certains corps (voir la section de géométrie pour leur calcul).

Premier théorème : soit une plaque plane, homogène, d'épaisseur constante , de masse
volumique placé dans un plan cartésien . Nous avons alors par rapport à l'axe :

Envisageons une rotation autour de l'axe . Le volume décrit par un élément de surface

766/2001
Sciences.ch 14/03/2005

lors de cette rotation vaut :

et, par conséquent, le volume total décrit par la surface complète est :

Ainsi, en procédant de même pour , nous obtenons finalement :

Deuxième théorème :soit une tige courbe, homogène, de longueur , de section constante, de
masse linéique . Nous avons :

Envisageons une rotation autour de l'axe . La surface décrite par un élément de longueur
lors de cette rotations vaut :

et, par conséquent, la surface totale décrit par la tige de longueur est :

Ainsi, en procédant de même pour , nous obtenons finalement :

CINÉMATIQUE

767/2001
Sciences.ch 14/03/2005

Un phénomène est évolutif si, en l’observant, nous constatons un glissement de la valeur


concrète d’une ou plusieurs grandeurs. Ces grandeurs ne sont pas des constantes mais des
variables. Une évolution implique qu’il y a un début, une infinité d’états intermédiaires et une
fin. Un état est la description d’un "instantané" d’un phénomène évolutif (pas forcément au
sens temporel du terme).

La relation fonctionnelle entre grandeurs pour un état donné peut être décrite par une
équation. Pour un phénomène évolutif, il peut y avoir une infinité d’états que nous pouvons
décrire par autant d’équations. Sous cette forme, cela n’a pas d’intérêt. Nous cherchons alors à
trouver une équation unique qui met en relation les différentes grandeurs vérifiant tous les
états que le phénomène évolutif considéré peut admettre.Par cette équation, nous pouvons
ensuite calculer n’importe quel état du phénomène évolutif étudié : c’est "l’équation
d’état" (notion tirée de la thermodynamique).

La "cinématique" est donc la partie de la mécanique qui traite des mouvements.

POSITION

Définition : la position d'un objet est défini par son vecteur position dans le cas particulier
d'un espace tri-dimensionnel :

or chaque coordonnée d'un objet en mouvement peut varie fonction du temps comme:

Plutôt que cette notation un peu lourde en parenthèses… les physiciens notent fréquemment le
vecteur position (ou vecteur d'espace) sous la forme d'un vecteur de 4 dimensions:

- 3 dimensions spatiales

- 1 dimension temporelle

et nous écrivons alors :

et nous appelons alors ce vecteur un "quadri-vecteur d'espace-temps" dont les composantes


sont les coordonnées généralisées du système.

VITESSE

Définition : la vitesse, notée , est par définition la distance parcourue par un objet pendant
une certaine quantité de temps :

Lorsqu'un corps est en mouvement uniforme rectiligne, c'est-à-dire qu'il parcourt une distance

768/2001
Sciences.ch 14/03/2005

donnée selon une dimension avec en un temps toujours égal, le rapport précédent
est constant dans le temps:

La vitesse moyenne arithmétique est définie comme étant le rapport de la distance parcourue
entre un point de départ donné à un instant et un point d'arrivée à un instant :

Remarque : il faut prendre garde lors des calculs de la vitesse moyenne (voir le chapitre de
probabilités et statistiques dans lequel nous présentons la moyenne harmonique)

Ceci représente donc une moyenne (car nous ne nous intéressons pas comment le chemin
entre et a été parcouru) mais nullement la vitesse instantanée du véhicule à un
moment donné.

Si nous désirons connaître la vitesse dite "instantanée" du véhicule en un point de sa


trajectoire il faut faire passer le delta du temps à un différentiel (voir chapitre de calcul
différentiel et intégral) tel que :

avec qui tend vers zéro.

Mathématiquement, nous notons cela correctement de la façon suivante:

Ainsi, pendant une différence de temps infiniment petite, la distance parcourue sera également
infiniment petite. Nous aurons donc :

et finalement :

Si le corps étudié n'est pas en mouvement rectiligne dans un repère cartésien à trois
dimensions alors sa position sera donnée par le vecteur et nous noterons sa vitesse dès
lors par:

769/2001
Sciences.ch 14/03/2005

Remarque : si toutes les parties d'un corps se déplacent à la même vitesse et dans la même
direction, nous avons alors un "mouvement de translation". Par contre, dans un "mouvement
de rotation", les vitesses des diverses parties du corps ne sont pas les mêmes, en module et en
direction (nous le démontrerons plus loin) et peuvent varier avec le temps.

ACCÉLÉRATION

Définition : l'accélération, notée , est par définition, la variation de la vitesse pendant un une
certaine quantité de temps tel que (nous passons directement à la limite) :

À nouveau, si le corps n'est pas en mouvement uniforme rectiligne nous aurons :

Si le corps est en mouvement rectiligne et uniforme (nous pouvons toujours généraliser à un


mouvement non rectiligne) nous avons alors:

La constante est à déterminer en fonction des conditions initiales. Si la distance initiale


parcourue au temps zéro est nulle la constante sera nulle. Dans le cas contraire nous écrivons :

ce qui nous donne la distance parcourue par un corps pendant un laps de temps donné.

Si le corps est en mouvement rectiligne et accélère constamment nous avons alors:

770/2001
Sciences.ch 14/03/2005

La constante est à déterminer en fonction des conditions initiales. Si la distance initiale


parcourue au temps zéro est nulle la constante sera nulle. Dans le cas contraire nous écrivons :

Nous voyons plus fréquemment cette relation sous la forme :

ou

mais nous avons :

si nous intègrons cette relation, nous obtenons :

que nous retrouvons dans les écoles le plus fréquemment sous la forme :

Cette relation donne la position d'un mobile en mouvement rectiligne et uniformément


accéléré. De cette dernière, nous déduisons une énorme quantité de relations qui sont très
intéressantes en physique aussi bien en considérant des cas idéaux que des cas réels.

Le premier cas que nous considèrons comme le plus connu, est la vitesse de chute à
accélération constante d'un corps dans un milieu exempt de tout frottement.

Comme nous l'avons déjà démontré précédemment, nous avons:

et

Les deux relation mis ensemble donnent:

Nous pouvons tirer de cette relation la vitesse de libération d'un astre (relatio pratique quand
nous étudierons le chapitre d'astrophysique):

Supposons que vous savez déjà que deux corps s'attirent mutuellement avec une accélération
selon le modèle classique de Newton (que nous démontrerons plus loin):

771/2001
Sciences.ch 14/03/2005

Mis dans la relation de chute d'un corps , nous obtenons :

à la surface du corps attracteur principal :

Nous pouvons répondre à partir de cette équation, pourquoi certaines planètes du système
solaire ont un atmoshère et d'autres pas (il faut prendre en compte l'agitation moléculaire).

Ce qui est aussi intéressant dans cette relation c'est que nous pouvons calculer quelle doit être
le rayon d'un corps de masse pour que sa vitesse de libération soit égale à celle de la
lumière (allusion aux Trous Noirs).

Nous avons dès lors:

PLAN OSCULATEUR

Les vecteurs et liés à un point en mouvement forment, à chaque instant un plan


appelé "plan osculateur" de la trajectoire (généralement curviligne sinon quoi le plan se réduit
à une droite).

Il est souvent utile de décomposer le vecteur accélération dans le plan osculateur suivant
respectivement la tangente et la normale à la trajectoire :

où le premier terme du membre de droite est un vecteur parallèle à la vitesse et le deuxième


un vecteur perpendiculaire à la vitesse et situé du côté concave de la trajectoire.

Exprimons ces deux vecteurs (un exemple plus général est donné dans le chapitre de
géométrie différentielle) :

Nous pouvons écrire que :

772/2001
Sciences.ch 14/03/2005

où est un élément courbe (l'abscisse curviligne) de la trajectoire et un vecteur unité


tangent à la trajectoire lié au point .

L'accélération s'écrit alors:

Le premier terme à droite de l'égalité est l'accélération tangentielle quand au second terme,
même si la vitesse est constante ce dernier apparaît dans l'expression de l'accélération pour
exprimer le changement de direction de la vitesse.

Décomposons le vecteur dans la base orthonormée euclidienne générée par la famille de


vecteur :

Ensuite, en dérivant par rapport au temps:

En comparant avec l'expression initiale du vecteur , nous voyons que les termes entre
crochets ci-dessus sont les composantes d'un nouveau vecteur unité perpendiculaire au
vecteur , donc perpendiculaire à la trajectoire et dirigé vers le centre de courbure.

De plus par la définition du radian, nous avons :

où est le rayon de courbure de la trajectoire.

L'expression devient alors:

et le second terme de l'expression générale de l'accélération devient alors:

Nous avons donc finalement:

773/2001
Sciences.ch 14/03/2005

où "l'accélération tangentielle" donnée par :

est un terme qui exprime la modification de l'intensité de la vitesse sur la trajectoire du point
et où "l'accélération normale" :

est un terme qui exprime le changement de direction du point sans que nécessairement ce
dernier change donc de vitesse!

Nous constatons immédiatement que si le mouvement est forcément rectiligne,


accéléré ou non, tandis que si la trajectoire est nécessairement incurvée.

PRINCIPE DE RELATIVITÉ GALILÉEN

Définition : il est impossible pour un observateur animé d'un mouvement uniforme de savoir
s'il se meut par rapport à son environnement ou bien à l'inverse si l'environnement se déplace
par raport à lui. Dès lors, il ne peut exister de référentiel absolu qui puisse être considéré
comme fixe vis-à-vis de toutes les autres repères galiléens ce qui signifie clairement que tous
les repères galiléens doivent jouir du même statut en mécanique puisqu'ils ne peuvent être
distingués les uns des autres. Ce principe est nommé le "principe de relativité galiléen".

Ce principe, (à ne pas confondre avec le principe de relativité restreinte car les hypothèses de
départ diffèrent un tant soit peu…) découle directement de l'étude de ce que nous nommons
"la transformation de Galilée".

Définition : une "transformation de Galilée" est une suite d'opérations mathématiques sur une
loi physique qui permet de déterminer les propriétés d'un ou plusieurs "observable" (vitesse,
force quantité de mouvement, etc.) lorsque nous passons lors de l'étude d'un phénomène
physique d'un référentiel à un autre référentiel : l'un supposé au repos, et l'autre en
mouvement uniforme.

La question à l'origine historique était de répondre s'il est plus légitime d'étudier un
phénomène dans un référentiel ou un autre. Plus exactement, nous souhaitons déterminer si la
forme des lois physiques gardent les mêmes formes algébrique quelque soient les référentiels
dans lequel nous les étudions.

Voyons cela d'un peu plus près :

Soient deux référentiels en mouvements l'un par rapport à l'autre à une vitesse constante
. Pour un certain référentiel cartésien au repos (ou supposé tel quel)

774/2001
Sciences.ch 14/03/2005

nous allons poser le deuxième référentiel de façon à ce qu'il soit aligné avec l'axe
des afin de simplifier les calculs avec :

Nous allons également mettre dans le deuxième référentiel en mouvement, un point matériel
de cordonnées .

Remarque : nous supposerons connu le concept de "quantité de mouvement" défini plus


loin avec rigueur. Rappelons donc dès lors que la quantité de mouvement du point animé
d'une vitesse (norme) dans est alors donné par :

Nous avons alors en appliquant les relations classiques de la cinématique :

d'où et donc (nous supposons connu le concept de "force" défini plus loin avec
rigueur) :

Le résultat obtenu est donc fort intéressant puisque la deuxième loi de Newton garde
exactement la même forme, et la même valeur dans les deux référentiels. Le fait que nous
nous déplacions ou pas à vitesse constante ou pas n'a donc aucune influence sur notre vision
du monde qui reste exactement la même.

Toutefois notons bien que ce résultat est obtenu en supposant que :

775/2001
Sciences.ch 14/03/2005

c'est-à-dire que nous imposons que la vitesse relative est uniforme (constante) et la masse
constante et surtout, que .

Mais au fait, cette transformation est fondamentalement fausse comme nous le verrons plus en
détail lors de notre étude de la relativité restreinte. Effectivement, soit un objet se déplacent le
long de l'axe avec une vitesse mesurée dans le repère primé :

quel sera alors sa vitesse dans le repère non primé? Si la transformation de Galilée est
fondamentalement vraie, il suffit de remplacer dans la relation précédente et par leurs
expressions en fonction de :

ou

soit :

(loi d'addition des vitesses)

Seul petit hic… une expérience simple impliquant des rayons de lumière fut réalisée au début
du siècle, et montra que cette loi était fausse. Cette expérience dite de "Michelson-Morley"
bouleversa à tout jamais notre vision du monde... et amena Albert Einstein à développer la
théorie de la relativité restreinte en imposant que la vitesse de la lumière quelque soit le
référentiel est toujours constante : (voir le chapitre de mécanique relativiste pour de
plus amples informations sur le sujet)

MOMENT CINÉTIQUE

Le moment cinétique par rapport à un point O d'une particule de masse se déplaçant à la


vitesse en est défini par :

avec étant la quantité de mouvement (voir la définition plus loin) donnée par :

Par sa définition, le moment cinétique est un vecteur perpendiculaire au plan contenant les
vecteurs et et si la particule se déplace dans un plan, la direction de est constante mais
pas nécessairement de même direction.

Un cas particulier du calcul du moment cinétique est le mouvement circulaire (plan) de rayon
, le "rayon-vecteur" est alors toujours perpendiculaire à la direction du vecteur-vitesse
et donc:

776/2001
Sciences.ch 14/03/2005

Nous voyons apparaître ici la définition du "vecteur rotation" également noté parfois (à
tort) .

Pour un mouvement plan mais non circulaire (comme une conique par exemple), nous
introduisons les composantes normale et tangentielle de la vitesse:

pour obtenir (de par les propriétés du produit vectoriel):

et sous forme scalaire:

où est dès lors appelé le "rayon de courbure" de la trajectoire.

Etudions la dérivée du moment cinétique:

Dans le membre de droite, nous avons de par la définition du produit vectoriel:

et d'autre part:

Ce qui nous donne finalement:

La dérivée par rapport au temps du moment cinétique d'un mobile ponctuel est donc égal à ce
que nous définissons par "le moment de force" sur lequel nous reviendrons plus loin.

Remarques :

R1. Cette dernière relation fait que nous appelons parfois le moment cinétique "moment de la

777/2001
Sciences.ch 14/03/2005

quantité de mouvement" et en anglais "angular momentum".

R2. Il faut bien sûr prendre garde au fait que (voir chapitre de calcul vectoire) que :

R3. Ce qui est fortement impressionant dans ce résultat (variation instantanée du moment
cinétique), c'est que tout corps ayant un moment cinétique non nul et soumis à aucun moment
de force, conserve l'orientation de dans l'espace et le temps. Ce résultat nous permet de
comprendre la dynamique du du gyroscope et tous les autres corps ayant des propriétés
similaires. Nous étudierons plus loin le gyroscope et ses propriétés, car son comportement est
fascinant et les résultats théoriques en découlant trouvent des applications en astrophysique et
physique atomique.

Nous avons également :

La quantité :

s'appelle "l'impulsion de rotation" et l'équation précédente porte quelquefois le nom de


"Théorème du moment cinétique" (nous verrons une généralisation de ce théorème lors de la
démonstration du théorème de König). Il s'énonce ainsi :

L'impulsion de rotation fournie par un moment de force entre les instant et est égale à la
variation du moment cinétique durant cet intervalle de temps.

En dynamique du solide ce théorème joue un rôle fondamental, analogue à l'équation de


Newton en dynamique du point.

L'utilisation du moment cinétique permet de montrer facilement la loi des aires (deuxième loi
de Kepler), qui joue un rôle important dans le mouvement des planètes (comme nous le
verrons plus loin lors de l'étude des Lois de Kepler). Voyons cela:

Imaginons une particule en mouvement sous l'action d'une force constamment parallèle à
. Nous dirons que cette force est "centrale" si sa direction passe constamment par un même
point fixe, appelé le "centre de force". La grandeur de la force ne peut donc plus dépendre que
de la distance au centre de la force (dans le cas d'un champ de force).

Dès lors:

778/2001
Sciences.ch 14/03/2005

Donc le moment cinétique par rapport au centre de force est constant si la force est centrale.
La réciproque est aussi vraie: si le moment cinétique est constant, sa dérivée par rapport au
temps est nulle et la direction de la force est toujours colinéaire à donc la force est centrale.

Par exemple, dans le cadre du mouvement d'une planète autour du Soleil ou d'un électron
autour du noyau de l'atome (dans le cadre du modèle de Bohr) le moment de cette force par
rapport au centre est évidemment nul, c'est-à-dire :

donc:

D'autre part, l'élément de surface décrit par le mouvement du rayon vaut (selon la
figure ci-dessus et la propriété du produit vectoriel):

donc:

En utilisant la relation nous obtenons:

Conséquences:

1. La vitesse aréolaire est constante, c'est-à-dire que les aires balayées en des temps égaux
sont égales. C'est la loi des aires de Kepler!

2. Le plan est fixe car . Donc la trajectoire, d'une planète dans une cadre
idéal par exemple, est plane.

MOMENT DE FORCE

779/2001
Sciences.ch 14/03/2005

Nous venons de voir voir que le "Moment de force" se définissait par la relation (variation
temporelle du moment cinétique) :

où est donc le moment de la force par rapport au point d'rigine du vecteur .

Si nous exprimons le module de , de part la définition du produit vectoriel, nous obtenons :

Il apparaît un grandeur :

qui est par définition le "bras de levier" de la force et dont l'emplacement est donné par
l'axe de rotation du corps du au moment de forc résultant.

Exemples:

Pour qu'un point matériel, soumis à des forces soit en équilibre, il faut ainsi que
la résultante de ces forces soit nulle (pas de translation) et que la résultante des moments soit
nul aussi (pas de rotation). Soit :

et

Remarque : par définition, un "couple" est défini comme un ensemble de deux forces de grandeur
égale mais de direction opposée, agissant suivant deux droites parallèles sur un même corps étendu.
La résultante des forces est bien évidemmet nulle, indique que le couple ne produit aucun effet de
translation. Mais la somme des moment étant non nulle, le corps subit une rotation tel que :

Maintenant que nous avons convaneblement défini ce qu'était une force et un moment de force, nous
pouvons aborder l'étude de la statique des forces de suite :

STATIQUE DES FORCES

780/2001
Sciences.ch 14/03/2005

La statique des forces est un domaine difficile à généraliser. La plupart des ouvrages se
servent de nombreux exemples (comme les systèmes de poulies, les leviers, les équilibres, les
frottements, etc.) afin d'amener le lecteur à assimilier la méthode d'analyse qu'il faut pour
résoudre les problèmes relatifs à ce domaine de la mécanique classique. Loin d'être contre
cette méthode, nous n'avons pas souhaité nous restreindre ou nous étendre (suivant les points
de vue) à des exemples particuliers, mais à proposer une méthode d'analyse qui fonctionnerait
à coup sûr.

Définitions :

D1. La "statique des forces" est le domaine de la physique qui étudie l'effet de la résultante de
forces (ou moments de force) constantes au cours du temps, appliquées sur un corps ponctuel
ou étendu.

D2. Quand la somme vectorielle de toutes les forces et moments de force est nul, il n’y a
aucun mouvement. Nous parlons alors d’un "équilibre statique" (mais les forces existent tout
de même à l’intérieur du système) tel que les forces et moments de forces se compensent
mutuellement :

ou/et

Remarque : les relations précédentes, nous montrent bien que ce n'est pas parce qu'un système
est à l'équilibre statique qu'il n'est soumis à aucune force (la somme vectorielle des forces peut
s'annuler mais les forces sont non nulles).

Corollaires :

C1. Lors de l'analyse d'un système de statique des forces, il faut toujours (!!!) travailler avec
les composantes vectorielles des forces et moments de forces (de par la première loi de
Newton).

C2. Il faut donc s'imposer un repère par rapport auquel seront exprimé toutes les composantes
de forces :

- Dans le cas d'un corps ponctuel sur lequel est appliqué des forces, il faut assimiler l'origine
du repère à la position du point.

- Si la ligne de prolongement de toutes les forces sur un corps étendu sont toutes concurrentes
en un point donné, le système peut être considéré comme un corps ponctuel ramené à ce point

- Si le corps est étendu et plongé dans un champ de forces (gravitationnel, électrostatique,


magnétique...) isotrope, coplanaire et constant dans le temps, l'ensemble des forces imprimées
peut se rapporter au centre de gravité

Démonstration : nous avons vu lors de l'étude du calcul vectoriel (voir le chapitre du même
nom dans la section d'algèbre) que la somme des vecteurs d'un même ensemble, mis bout à
bout (au niveau de la représentation imagée) ou additionnés algébriquement constitue ce que
nous appelons la "résultante" du système de forces ou de moments de force :

781/2001
Sciences.ch 14/03/2005

ou/et

Il est clair qu'un point matériel est donc par définition à l'état statique si la résultante des
forces concourants est nul. Ainsi, un corps ponctuel est au repos (vitesse constante nulle) si la
grandeur est nulle (voir les lois de Newton plus loin).

Cet condition ne suffit cependant pas pour un corps étendu (non ponctuel) : celui-ci peut ne
pas se déplacer (pas de mouvement par translation), mais tourner sur lui même par application
de forces en dehors de son centre de gravité (les forces sont alors des moments de forces
agissant sur des points du corps en question).

Imaginons maintenant un ensemble de forces , chacune d'elles appliquée en un point de


vecteur-position d'un mobile étendu et toutes parallèles à une direction commune donnée,
repérée par un vecteur unitaire . La résultante des ces forces est alors :

Remarque : la norme de la résultante est donc :

De manière analogue, la somme vectorielle des moments parallèles s'écrit :

Recherchons maintenant, la position d'un point fictif , appelé le "centre des forces" tel
que le moment de la résultante appliquée au point soit égal au moment total . En
d'autres termes, doit être la solution de l'équation vectorielle :

S'il est possible de trouver un tel point , nous ne devons donc plus, en principe, calculer le
moment individuel de chaque force et en faire la somme vectorielle. Il suffit plutôt, de
déterminer la résultant et d'évaluer son moment résultant appliqué au point fictif .

En combinant les relations précédentes, nous avons :

782/2001
Sciences.ch 14/03/2005

À son tour, le vecteur peut être substitué tel que :

d'où nous tirons finalement :

comme (deuxième loi de newton) supposons maintenant (car particulier) que


nous pouvons alors écrire ce résultat très important :

C3. De par la troisième loi de Newton, tout corps solide rigide en équilibre stable, en contact
avec un ensemble de corps solides rigides en équilibre stable eux aussi, subissent tous une
force égale identique en chaque point de contact (identiquement répartie) mais opposée par
ces derniers (assimilable et passant par leur centre de gravité lorsque c'est un champ de
vecteurs isotrope et constant qui est à l'origine du contact). Ainsi :

- les repères des forces d'action/réaction doivent être placés sur les différents
point de contact lorsque ce sont une quantité dénombrable de forces qui en sont à
l'origine.

- les repères des forces d'action/réaction doivent être placés le centre de masse ou
de gravité si les forces à l'origine du contact (in extenso : de l'accélération) sont à
l'origine d'un champ vectoriel gravifique, respectivement
électrostique/magnétique.

BALISTIQUE

Le mouvement parabolique est le mouvement d'un mobile animé, dans le champ de la


pesanteur, d'une vitesse de translation non parallèle à l'accélération de la pesanteur . Par
exemple un projectile possédant au départ une vitesse inclinée d'un angle par rapport à
l'horizontale.

783/2001
Sciences.ch 14/03/2005

En l'absence de pesanteur et de frottement le mobile suivrait la ligne de visée


indéfiniment. L'action de la pesanteur est de le redescendre, au temps , de la valeur
connue

Nous posons la projection sur les axes :

combinaison d'un déplacement régulier selon et d'un mouvement de chute avec vitesse
initiale selon . Ce qui correspond aux équations suivantes:

et

en éliminant le temps entre ces deux équations nous obtenons la trajectoire

Nous calculons ainsi la portée du projectile en posant dans l'équation ci-dessus et


nous obtenons facilement:

la solution n'a aucun intérêt.

L'hauteur maximale peut être calculée en annulant la dérivée de l'équation de la


trajectoire. Ainsi nous obtenons facilement :

784/2001
Sciences.ch 14/03/2005

Nous remarquons pour la portée maximale que pour une vitesse initiale donnée, nous obtient
pour :

A) aucune valeur si . Nous nous sommes donnés une portée inaccessible.

B) Deux valeurs et complémentaires pour atteindre la même portée.

C) Une seule valeur donnant la portée maximale possible

La courbe enveloppant toutes les paraboles, tracée pour une vitesse donnée dans toutes les
directions possibles, est encore une parabole, appelée "parabole sûreté". Sa rotation autour de
l'axe y engendre un paraboloïde qui circonscrit (contient) la région de l'espace seule
accessible aux projectiles.

Ainsi, il n'est pas trop difficile de trouver l'équation de cette parabole de sûreté:

Le tir à la verticale nous est connu et est donné par

La portée maximale est quant à elle donnée par:

Donc quant tel que:

qui est l'équation de la parabole de sûreté.

MOUVEMENTS CIRCULAIRES

785/2001
Sciences.ch 14/03/2005

De tels mouvements décrivent la rotation d'un objet autour d'un axe. L'usage veut qu'on le
définisse par les données suivantes:

- la direction de l'axe dans l'espace

- le sens de rotation autour de cet axe

- la vitesse de rotation

Nous résumons ces trois indication par la donnée d'un vecteur "vitesse angulaire" instantaée:

Le sens de rotation est dit positif lorsque, le pouce dressé dans la direction de , nous
saisissons l'axe de la main droit et voit tourner l'objet dans le sens des quatre autres doigts.

La norme de la vitesse angulaire instantanée, représente l'angle parcouru par unité de temps,
par l'objet qui se déplace dans le plan perpendiculaire à :

Remarques:

1. L'usage veut que l'on note la vitesse angulaire par le même symbole que la pulsation des
mouvement périodiques. Il ne faut pas en conclure qu'une vitesse angulaire est une pulsation!

2. Dans le cas général du mouvement circulaire, la vitesse angulaire de l'objet étudié varie au
cours du temps:

3. Lorsque la direction de l'axe change, les composantes du vecteur unitaire sont


également des fonction du temps. C'est le cas d'une roue de moto dans un virage.

En tournant d'un angle , un point de l'objet situé à une distance R de l'axe de rotation décrit
un arc de cercle de longueur:

Donc dans le cas des petits angles:

Si dt est le temps nécessaire à ce mouvement, la vitesse curviligne du point est:

Si nous nous donnons un repère euclidien orthonormé tel que:

786/2001
Sciences.ch 14/03/2005

Nous voyons bien sur cette figure que :

Donc finalement nous avons :

Nous voyons alors que nous avons affaire à un produit vectoriel et tel que:

Nous avons donc:

que nous écrivons également:

L'accélération du mouvement circulaire est formée dans le cas général, de deux termes, le
premier étant "l'accélération tangentielle" exprimant toujours la variation de la vitesse sur la
trajectoire et le deuxième l'accélération perpendiculaire le long du rayon appelée également
"accélération centripète" (centripète signifiant: "qui tend à rapprocher du centre").

Remarque: si nous exprimons le mouvement circulaire du point P à partir d'un système d'axes
situés dans le plan de la trajectoire, pour simplifier, alors, la position du point P est donnée
par:

Ce qui montre que le mouvement circulaire peut être considéré comme la superposition de
deux mouvements sinusoïdaux déphasés de .

787/2001
Sciences.ch 14/03/2005

Si l'on écrit:

ce qui est tout à fait envisageable pour une trajectoire imparfaitement circulaire et que l'on
regarde les différentes caractéristiques paramétriques:

en faisant varier le déphasage et le rapport nous obtienons des courbes que nous
appelons des "figures de Lissajous" :

LOIS DE KEPLER

Au début du 15ème siècle les savants de l'époque étaient partagés à propos du mouvement des
planètes (pour plus de précisions, voir le chapitre d'astrophysique). Tournent-elles autour du
Soleil ou non? Tycho Brahe (1546-1601), un astronome danois, décida de résoudre la
question en mesurant avec soin les positions successives des planètes connues à l'époque. En
se détournant ainsi de querelles philosophiques stériles pour se livrer à une observation, une
expérimentation soigneuse, il fit exemple d'un esprit résolument moderne. Son travail, d'une
importance considérable, s'étendit sur plusieurs années. Après sa mort, Kepler

788/2001
Sciences.ch 14/03/2005

(historiquement avant Newton), reprenant ses résultats, mit en évidence 3 lois simples
caractérisant le mouvement des planètes, à savoir:

PREMIÈRE LOI

Les orbites sont des coniques (ellipses) dont le Soleil occupe l'un des foyers. Au fait, ce n'est
pas vraiment un "loi" puisque dans le chapitre traitant de l'astrophique (sur le site) vous en
trouverez la démonstration tel que:

DEUXIÈME LOI

Le segment qui joint une planète au Soleil balaie des aires égales en des temps égaux (Loi des
aires):

Nous constatons alors que la vitesse de la planète est variable; elle est plus grande à la
périhélie qu'à l'aphélie. Ceci se vérifie pour la Terre par exemple. En effet cette dernière est
plus proche du Soleil en hiver (pour l'hémisphère Nord) et elle a alors une vitesse sur
trajectoire un peu plus élevée qu'en été; le temps de parcours est donc plus faible (l'hiver
compte moins de jours que les autres saisons).

TROISIÈME LOI

Les carrés des périodes de révolution sont proportionnels aux cubes des demi-grands
axes des orbites:

Kepler n'a pas d'emblée publié ses trois lois dans cette provocante simplicité. Leur ordre
actuel n'est d'ailleurs pas celui de leur énonciation… Elles sont en réalité à dénicher au milieu
d'un foisonnement de spéculations physiques et de réflexions sur l'harmonie du monde.

Cependant, comme nous l'avons vu lors de la définition du moment cinétique, cette loi est
aussi démontrable !!

Pour vérifier l'exactitude de son hypothèse, Newton (longtemps après) retrouva les lois de
Kepler à partir de la loi de la gravitation, donnant ainsi l'explication du mouvement général
des planètes.

789/2001
Sciences.ch 14/03/2005

Newton considéra pour déterminer la loi de gravitation une planète théorique, gravitant autour
du Soleil sur une orbite circulaire à vitesse constante . Pendant une orbite complète, la
planète parcourt une distance égale à la circonférence du cercle de rayon , soit , en un
temps (sa période) égal à cette distance divisée par sa vitesse, soit:

Newton s'appuie ensuite sur la troisième loi de Kepler avec toujours l'hypothèse d'une orbite
circulaire.

Nous avons donc:

mais puisque :

alors

en enchaînant :

et

il vient:

nouvelle manipulation, nous renversons les termes, cette expression devient:

Par un autre calcul nous avons déjà établi l'expression de la force centrifuge:

en rapprochant cette expression à l'expression précédente nous obtenons :

Il existerait donc une force opposée à la force centrifuge qui maintient la cohésion orbitale et

790/2001
Sciences.ch 14/03/2005

qui s'écrit:

reste à déterminer la valeur de la constante!

Il est trivial que la masse centrale du système orbital doit intervenir d'une façon ou d'une
autre dans cette constante. Si la masse du corps secondaire intervient de façon proportionnelle
dans la force centrifuge, l'envie est grande de faire de même avec la masse du corps central.
Donc:

maintenant a priori il n'y aurait plus de paramètres à prendre en compte. La constante restante
est là pour satisfaire à l'analyse dimensionnelle de telle façon que l'on ait des "Newtons" (nom
donné à l'unité de force) des deux côtés de l'égalité.

Les scientifiques ont déterminé avec grande précision cette constante notée qui a priori
semble universelle (ce que j'essaierai une fois que j'aurai connaissance des outils nécessaire de
démontrer) et qui a comme valeur:

Evidemment il ne s'agit nullement d'une démonstration car nous nous sommes basés sur les
observations expérimentales de Kepler. Mais j'aurai ma revanche là-dessus.

A partir de cette relation:

nous pouvons retrouver toutes les lois de Newton. D'ailleurs nous l'avons déjà fait pour la
deuxième et troisième puisque ce sont ces dernières que nous avons utilisé pour obtenir la
relation de la force gravitationnelle.

Sous forme vectorielle nous avons ainsi :

Identiquement au champ électrique (voir la section d'électrodynamique), nous pouvons


développer:

791/2001
Sciences.ch 14/03/2005

Comme le champ électrique dérive d'un potentiel électrique, identiquement, le champ


gravitationnel dérive lui aussi d'un potentiel gravitationnel. En effectuant le même
développement qu'en électromagnétisme pour la première équation de Maxwell (voir le
chapitre traitant des équations de Maxwell dans la section d'électrodynamique), nous
démontrons que:

où est le potentiel gravitationnel et qui varie en raison inverse de la distance relative des
corps (ceci confirmant ce que nous avions démontré lors de notre étude du théorème de
Noether dans le chapitre traitant des principes de la physique). Ecriture qui implique bien
évidemment la relation suivante:

Evidemment en l'absence de champ nous a et donc sera nul.

Comme en électromagnétisme à nouveau, nous démontrons comme on l'a fait pour la


première équation de Maxwell que:

Si nous exprimons cette équation en fonction d'un potentiel gravitationnel , nous obtenons :

ce que l'on note de façon plus esthétique avec le laplacien scalaire :

qui est "l'équation de Newton-Poisson"

DÉCROISSANCE DE L'ACCÉLÉRATION GRAVIFIQUE À L'EXTÉRIEUR DE LA


TERRE

Soit la distance d'un objet du centre à l'extérieur! de la Terre nous avons :

il vient :

à la surface de la Terre nous avons:

792/2001
Sciences.ch 14/03/2005

Des deux dernières relations il vient:

DÉCROISSANCE DE L'ACCÉLÉRATION GRAVIFIQUE À L'INTÉRIEUR DE LA


TERRE

En surface nous avons :

à l'intérieur de la Terre en notant la distance par rapport au centre par la lettre et la masse
centrale par ' , nous avons :

Introduisons la masse volumique que nous supposerons égale partout.

En combinant ces quatre dernières relations nous obtenons :

TRAVAIL ET ÉNERGIE

Si un point de masse subit un déplacement élémentaire sous l'effet d'une force , cette
force effectue un travail élémentaire valant par définition:

793/2001
Sciences.ch 14/03/2005

Si cette masse est déplacée d'un endroit à un endroi , le travail total est:

Pour les unités, nous avons : (Joules)

Remarques:

R1. Si est positif le travail est dit "moteur". Dans le cas contraire il est dit
"résistant" (exemple: le freinage).

R2. Si la force est constante en grandeur et en direction (cas de la pesanteur au voisinage


de la surface terrestre), l'intégrale du calcul de prend une forme plus simple:

Ce résultat montre que le travail ne dépend alors que des positions initiale et finale et pas du
chemin parcouru. Le travail de la pesanteur est un cas particulier de ce type.

ÉNERGIE CINÉTIQUE

La loi de Newton est applicable le long du chemin - . En l'utilisant dans


l'expression du travail il vient:

et, en développant le produit scalaire au moyen des composantes, nous aurons :

Lorsqu'un corps se déplace sous l'action d'une force résultante quelconque, le travail de
cette force d'accélération sur un chemin quelconque , est égal à la variation d'énergie
cinétique du corps:

Par définition, la relation :

est appelée "l'énergie cinétique" et elle se mesure en Joules (ou d'autres unités dérivées
exotiques dont les phyisiciens théoriciens abusent parfois un petit peu trop...)

794/2001
Sciences.ch 14/03/2005

L'équation :

porte quelquefois le nom de "théorème de l'énergie cinétique".

MOMENT D'INERTIE

Pour un solide rigide tournant autour d'un axe à la vitesse angulaire . L'énergie cinétique
élémentaire d'un point quelconque de masse , situé hors de l'axe, vaut:

puisque et sont perpendiculaires.

L'énergie cinétique totale est alors :

Nous avons pris l'habitude en physique de noter cette dernière relation:

Par définition, le "moment d'inertie" est:

Remarque: Dans un solide, la répartition de la matière autour d'un axe sera évidemment
différente selon l'axe choisi. Le moment d'inertie correspondant sera aussi différent. Il est
donc indispensable de préciser l'axe par rapport auquel nous souhaitons déterminer ce
moment d'inerte. Nous observons dans la pratique ques les ingénieurs placent souvent l'axe de
façon à ce qu'il passe par le centre de masse. Dans les tables, nous trouvons fréquemment les
expressions des moments d'inerties de formes courantes (selon un axe donné) telles que le
cylindre, le cône, la sphère, la barre, le tube (voir les chapitre traitant des formes géométriques
dans la section de géométrie).

Nous avons vu lors de notre étude du moment cinétique que:

et le moment d'inertie étant donné par:

795/2001
Sciences.ch 14/03/2005

Nous avons donc:

d'où:

Nous obtenons finalement:

c'est l'expression donnant le moment cinétique d'un corps tournant sur lui-même (sur un de
ses axes possibles de rotation).

Etant donné que nous avons démontré lors de notre étude du moment cinétique que:

Il vient (dans l'hypothèse que la masse et la géométrie du solide reste constante) que:

Donc sous forme scalaire (plus répandue):

Si nous étudions un système dans lequel le moment cinétique est conservatif, il va de soi que:

Cette conservation du moment cinétique trouve une application dans un multitude


d'expérience tel que celle connue qui consiste à se faire tourner sur un chaise et à écarter les
mains ou les jambes ce qui fera diminuer sa vitesse de rotation (et inversement).

Une autre expérience curieuse (mais mathématiquement correcte) consiste à se poser sur un
plateau tournant avec une roue en rotation tenue à l'horizontale (le moment cinétique vertical
est donc nul) et de mettre celle-ci ensuite à la verticale. Comme le moment cinétique vertical
doit rester nul, pour contrecarrer cela, le plateau sur lequel est posé l'expérimentateur se
mettra à tourner dans le sens inverse de rotation de la roue.

Les déplacement de masses importantes à la surface de la Terre (icebergs, crues des fleuves,
plaques tectoniques, etc.) provoquement des variations du moment d'inertie de la Terre. Il
s'ensuit des fluctuations de la vitesse angulaire donc une imperfection de l'étalon

796/2001
Sciences.ch 14/03/2005

astronomique de temps (quelques millièmes par jour).

Revenons maintenant au méthodes de calcul des moments d'inertie. L'énergie cinétique d'un
corps étant la somme de l'énergie cinétique de chaque élément de ce corps, nous avons :

Dans le cadre d'un corps solide rigide en rotation autour d'un axe, nous avons :

Ainsi, pour un corps composé d'un ensemble de corps de géométrie différentes, le moment
d'inertie total est la somme des moments d'inertie par rapport à l'axe de rotation tel que :

Lorsque nous calculons le moment d'inertie d'un corps par rapport à un axe donné, il peut
être intéressant de savoir qu'elle est la distance à l'axe où nous pouvons placer fictivement
toute la masse de ce corps pour avoir le même moment d'inertie. Par définition, cette distance
notée et appelée le "rayon de giration" est trivialement donnée par :

où est le moment d'inertie connu du corps de masse par rapport à une axe .

Par définition, le "moment d'inertie polaire" (ou également "moment d'inertie quadratique")
est le moment d'inertie défini par rapport à un point (le pôle) et non plus par rapport à un axe
et noté :

Cette grandeur n'intervient en fait que pour les rotations libres et n'a d'intérêt, pour les
rotations autour d'un axe fixe, que parce qu'elle facilite quelquefois le calcul des moments
d'inertie axiaux en vertu de la relation suivante (en coordonnées cartésiennes) :

Démonstration :

Lemme 1 : Le moment d'inertie par rapport à un plan est donné trivialement par :

797/2001
Sciences.ch 14/03/2005

Lemme 2 : Le moment d'inertie par rapport à un axe est donné par :

En sommant ces relations, nous en déduisons :

Le moment d'inertie polaire est alors donnée par :

En comparant avec le lemme 2 il vient :

798/2001
Sciences.ch 14/03/2005

Si le corps en question à une symétrie sphérique, il vient de suite puisque


que :

Un exemple est donné avec le boule (sphère pleine) dans le chapitre traitant des formes
géométriques dans la section de géométrie.

Supposons maintenant connaître le moment d'inertie d'un corps solide rigide quelconque
par rapport à un axe (cet axe n'étant pas nécessairement uniquement assimilé à l'axe
commun) passant par le centre de masse . Calculons ensuite le moment d'inertie , par
rapport à un autre axe , parallèle à et distant de , et faisons apparaître la liaison existant
entre ces deux moment d'inertie différents :

Dans un référentiel cartésien, nous avons pour tout point :

et

Nous avons alors :

Le terme :

est nul car si le moment d'inertie est calculé par rapport au centre de masse comme nous
l'avons imposé dès le début, alors :

En définitive, nous obtenons finalement le théorème d'Huygens-Steiner :

Comme nous le verrons dans le chapitre des formes géométriques dans la section de
géométrie du site, il devient alors facile de pouvoir calculer le moment d'inertie d'un triangle

799/2001
Sciences.ch 14/03/2005

équilatéral en connaissant celui d'un plaque carrée et en déplaçant l'axe d'inertie au point où se
situe le centre de gravité du triangle (soit au tiers de la médiane située entre le centre du
rectangle et un des sommets du rectangle).

Comme il existe autant de moment d'inertie que d'axe de rotation et que ces derniers sont
souvent dans les cas d'études assimilés aux axes principaux d'inertie (axe assimilés aux axes
de révolutions ou aux plans de symétrie – voir plus loin), il peut être utile d'introduire un être
mathématique utile dans le cadre de représentation des moments d'inertie qui n'est autre que la
"matrice d'inertie" ou appelé encore (formulation plus moderne) "tenseur d'inertie".

La démarche pour déterminer rigoureusement l'expression de ce tenseur est la suivante : soit


un point donné d'un solide dont nous cherchons à calculer le moment d'inertie et l'axe
d'origine et de vecteur unité par rapport auquel nous souhaitons calculer le moment
d'inertie. Tout point du solide peut être projeté (projection orthogonale) sur un point
à partir de la connaissance de l'angle entre et tel que :

Dès lors :

D'après les propriétés du produit mixte (voir chapitre de calcul vectoriel) et du produit
scalaire :

et

nous avons :

et donc :

Comme est un vecteur de direction constante quelque soit le point d'intégration, nous
pouvons le sortir de l'intégrale tel que :

Nous pouvons vérifier que si nous remplaçons par , nous obtiendrons un résultat
de par la propriété de linéarité du produit vectoriel (voir le chapitre de calcul
vectoriel). Ainsi, l'application qui à associe est donc une application linéaire qui peut
être représentée, dans une base donne, par une matrice :

800/2001
Sciences.ch 14/03/2005

La matrice est le "tenseur d'inertie" du système par rapport au point , dans la base
.

Le moment d'inertie d'un système par rapport à un axe quelconque de vecteur unitaire
est donné par :

Le problème est donc maintenant de pouvoir calculer les éléments du tenseur , pour une
base donnée. Soit un repère tel que . Nous posons :

et

En utilisant le fait qu'un produit vectoriel puisse être représente par une matrice anti-
symétrique (vérifiez c'est facile) :

nous avons :

et donc :

Dans l'expression ci-dessus de la matrice d'inertie, nous reconnaissons les éléments


diagonaux : il s'agit tout simplement des moments d'inertie du système par rapport aux
différentes axes de la base. Nous appelons "produit d'inertie" les éléments non-diagonaux de

801/2001
Sciences.ch 14/03/2005

la matrice et nous les notons :

Nous avons donc :

Si est assimilé au centre de masse du solide considéré, nous notons simplement :

Nous pouvons également généraliser le théorème d'Huygens en faisant usage de ce tenseur de


symétrie. Pour ce faire, appelons les coordonnées d'un point quelconque dans
et ses coordonnées dans . Nous appelons les coordonnes de l'origine
de dans :

puisque .

Nous avons alors :

Or, si coïncide avec le centre de masse , alors selon la définition du centre de masse :

Nous en déduisons alors :

et de même :

802/2001
Sciences.ch 14/03/2005

ainsi que

avec .

Nous retombons sur le théorème d'Huyghens classique puisque n'est d'autre que la
distance au carré entre l'axe et et de même pour qui est la distance au carré
entre et et qui est la distance entre et .

Si nous nous intéressons maintenant aux produits d'inertie, il vient :

d'où, si coïncide avec :

En résumé, le théorème d'Huygens généralisé, s'écrit :

Le tenseur d'inertie étant réel et symétrique, nous avons dans le chapitre d'algèbre linéaire
(théorème spectral) qu'il est toujours possible de trouver trois directions perpendiculaires de
vecteurs telles que le tenseur (matrice) symétrique soit diagonalisable :

Le trièdre formée par les vecteurs est appelé "trièdre principal d'inertie" et ses axes
sont appelés "axes principaux d'inertie". Dans ce repère prend le nom de "tenseur
principal d'inertie". Si de plus est assimilé à , nous parlons de "tenseur central d'inertie".

En fait, pour trouver les moments d'inertie relativement aux axes principaux il n'est
pratiquement jamais nécessaire de diagonaliser le tenseur d'inertie, car il suffit souvent de se
laisser guider par la symétrie du système. Nous allons voir avec les théorèmes suivants que s'il
existe des axes ou des plans de symétrie pour la distribution de masse, les axes d'inertie sont
faciles à trouver. De plus, le système est en général suffisamment simple (ou décomposable
en éléments suffisamment simples…) pour que ces axes soient évident.

Premier théorème : si le système possède un plan de symétrie matérielle (in extenso :


si symétrique de par rapport au plan) alors tout axe perpendiculaire à ce
plan est axe principal d'inertie.

803/2001
Sciences.ch 14/03/2005

Démonstration : choisissons un repère dans le plan par rapport auquel le système a une
distribution de masse symétrique et un axe perpendiculaire à ce plan. Pour calculer
ou , groupons les points par deux, symétriques par rapport à . c'est-à-dire
tels que . Nous aurons alors et de même , c'est-
à-dire, puis (symétrie matérielle!) que toutes les contributions de paires de
points symétriques sont nulles, ce qui implique : , c'est-à-dire que l'axe des est
direction principale d'inertie.

Deuxième théorème : choisissons comme axe l'axe de symétrie. De même que ci-dessous,
nous avons car si nous groups les points par paire et symétrique
par rapport à , nous avons : mais donc toujours
et de même

Remarque : lorsque nous avons déterminé deux axes principaux d'inertie grâce aux symétries
précédentes, les troisième est tout simplement celui qu'il faut pour compléter un trièdre
orthogonal.

Troisième théorème :

Si un système admet un axe de révolution pour sa distribution de masse, alors tout trièdre
orthogonal incluant l'axe de révolution, est trièdre principal d'inertie. Le système matériel est
alors dit "cylindrique" et dans la trièdre principal d'inertie son tenseur prend la forme (en
supposant que l'axe de révolution est le 3ème axe du trièdre) :

Démonstration : si est un axe de révolution, tout plan comprenant est plan de symétrie
et tout droite perpendiculaire à est donc axe principal d'inertie (premier théorème). De
plus, toutes ces droites perpendiculaires à sont équivalentes.

Définition : si la matrice d'inertie en d'un système matériel est du type :

et nous disons alors que le système est "sphérique" (ou à "symétrie sphérique").

Remarque : le choix systématique d'un trièdre principal d'inertie permet de ramener le tenseur
d'inertie de 6 à 3 composantes, calculées une fois pour tout. Cependant, ce choix implique
l'utilisation d'une base qui sera le plus souvent en mouvement par rapport au référentiel
utilisé, ce qui pourra poser des problèmes de dérivations par rapport au temps des vecteurs de
la base. Nous pouvons alors, si c'est plus faciles, obtenir les composantes du tenseur de
symétrie dans une base quelconque à l'aide d'une matrice de passage entre la base principale

804/2001
Sciences.ch 14/03/2005

et le base utilisée pour le calcul du trièdre principal d'inertie.

Lorsque les moments d'inertie d'un solide sont connus dans les directions des axes principaux
d'inertie, nous pouvons facilement déterminer le moment d'inertie par rapport à n'importe
quel autre axe passant par le centre de gravité en utilisant que ce nous nommes un "ellipsoïde
d'inertie".

Démonstration :

Soient trois axes, centrés sur , parallèles aux axes principaux. Dans leurs directions, portons
des longueurs proportionnelles à :

Dans cet espace des phases des moments d'inertie, tout point désigne un moment
d'inertie tel que :

Pour déterminer en fonction des , sans devoir calculer , nous identifions les
cosinus directeurs (voir chapitre de calcul vectoriel) de l'axe de rotation à ceux de la droite
.

Ainsi, nous avons :

805/2001
Sciences.ch 14/03/2005

Soit :

Nous pouvons maintenant calculer les conditions de normalisation de cette relation. Ainsi, si
et , nous avons :

Respectivement nous aurons :

Puisque :

et

Ce qui nous amène à écrire :

Par substitution, nous obtenons :

Donc finalement :

Ainsi, en connaissant les moment d'inertie d'un corps par rapport à ses axes principaux
nous pouvons connaître son moment d'inertie par rapport à n'importe quel axe ayant
un angle par rapport aux axes principaux.

806/2001
Sciences.ch 14/03/2005

ÉNERGIE POTENTIELLE GRAVIFIQUE

Si le travail de la force entre les points et ne dépend pas du chemin suivi, nous
disons que cette force dérive d'une énergie potentielle ou bien que le champ de force est
"conservatif" (contre-exemple: dans un mouvement avec frottement le travail dépend
nécessairement de la voie choisie). Cette indépendance par rapport au chemin suivi implique
que:

Soit deux points et de l'espace. Il y a plusieurs chemins possibles pour joindre ces deux
points. Si l'on en choisit deux au hasard et que la champ est conservatif nous avons :

Sur le 1er chemin :

Sur le 2ème chemin : <

Si le champ est conservatif nous avons :

ou encre que le travail total sur un chemin fermé (aller et retour) est nul. Nous notons cela
(voir chapitre de calcul différentiel et intégral dans la section d'algèbre du site) :

Le travail en jeu est donc une fonction du lieu seul ( ) c'est-à-dire dépendant uniquement du
point de départ et du point d'arrivée. En effet, si le travail dépendait du chemin, il serait
possible de choisir la voie la plus généreuse quand le système fournit du travail et la voie la
plus économique quand nous la ramenons à l'état initial. Ce serait donc un mouvement
perpétuel et le principe de conservation de l'énergie l'interdit (pour plus de détails à ce sujet
voir la section de mécanique thermique).

Attachons alors à chaque point du champ de force une valeur de la fonction (un
nombre réel) correspondant au travail effectué par le champ de force lorsque le mobile passe
d'un point à 0, 0 étant un point de référence choisi arbitrairement. Donc par définition:

avec

807/2001
Sciences.ch 14/03/2005

En généralisant cette définition, nous dirons que le travail effectué par une force conservative
lorsque le mobile passe de à est égal à la diminution d'énergie potentielle entre et
:

Par définition est l'énergie potentielle et se mesure en Joules.

L'équation précédente s'utilise très souvent sous forme différentielle soit :

Remarque : il existe aussi rappelons-le une relation entre l'énergie est le gradient de la force
donnée qui découle simplement de la définition du travail :

Application: Travail de la pesanteur et énergie potentielle gravifique au voisinage de la


surface de la Terre. C'est donc un cas particulier où la force est constante…

808/2001
Sciences.ch 14/03/2005

Soit un point de masse se déplaçant selon une trajectoire quelconque . Le poids


effectue le travail:

En exprimant les différents vecteurs en composantes :

, ,

et en calculant le produit scalaire au moyen de ces composantes nous obtenons :

La différence représente la différence d'altitude entre les points et . Nous


constatons bien que le travail ne dépend pas du chemin suivi mais seulement des points de
départ et d'arrivée. Si, en sens inverse, nous voulons faire passer le point de à , le travail,
fourni alors par un agent extérieur vaut:

ce qui montre bien que le travail total sur un chemin fermé est nul:

En comparant l'équation et et en identifiant,


nous obtenons ainsi :

qui est l'énergie potentielle gravifique, étant l'altitude de la masse . Nous notons plus
simplement la plupart du temps cette relation sous la forme :

809/2001
Sciences.ch 14/03/2005

Remarque : Le choix de zéro de l'énergie potentielle est souvent arbitraire; nous le fixons par
commodité. Seules les différences d'énergie potentielle sont généralement intéressantes
comme nous allons le voir de suite.

La relation précédent est au fait une expression utile à proximité de la surface terrestre. A
distance où est le rayon de la terre, la force de gravitation faiblit et l'approximation
n'est plus valable (si aussi, d'ailleurs…).

Pour déterminer la relation correcte, considérons deux masses . La première est


supposée au repos et fixe la deuxième est amenée de l'infinie à une distance donnée de (le
même raisonnement est applicable pour le champ électrique). Le travail de la force
gravitationnelle en un point quelconque étant donc :

et l'énergie potentielle du système :

Alors :

d'où simplement (l'énergie potentielle en un point) :

Voyons si cela est cohérent avec …

A hauteur nulle de la surface terrestre, , nous avons :

Nous élevons l'objet de :

Nous utilisons l'approximation grossière :

810/2001
Sciences.ch 14/03/2005

valable quand d'où :

Comme à la surface de la terre nous avons l'habitude de poser en laboratoire , nous


obtenons bien finalement :

et nous voyons qu'il s'agit effectivement d'une grossière approximation.

Remarques : nous pourrions appliquer la même développement dans l'étude de la force de


Coulomb et du champ électrique mais jusqu'à maintenant nous n'avons jamais mit de
laboratoire à la surface d'une charge... (sic!)

ÉNERGIE POTENTIELLE D'UNE SPHÈRE DE MATIÈRE

Nous allons calculer ici l'énergie potentielle d'une sphère de matière. Cet exercice de style va
nous être très utile en astrophysique pour déterminer la température interne des étoiles

L'expression d'une énergie potentielle d'un système de deux masses mises en présence est
donnée par:

Soit une sphère de masse , de densité massique et de rayon et entourée d'un anneau
sphérique de rayon intérieur , de même densité massique et d'épaisseur

L'énergie potentielle de l'anneau sphérique de rayon interne et d'épaisseur se calcule


comme suit:

La masse de la sphère de rayon et de densité massique est:

La masse de l'anneau entourant la sphère de rayon , d'épaisseur et de densité massique


est:

En introduisant les deux dernières expression dans celle de l'énergie potentielle:

811/2001
Sciences.ch 14/03/2005

En intégrant l'expression précédente entre 0 et , cela revient à ajouter successivement une


suite d'anneaux d'épaisseur pour obtenir la sphère entière de rayon et donc l'énergie
potentielle de la sphère entière.

Ce qui s'écrit encore:

Soit finalement:

CONSERVATION DE L'ÉNERGIE MÉCANIQUE TOTALE

Comparons maintenant les équations:

puisqu'il s'agit du même travail.

Ce qui entraîne:

somme des deux formes d'énergie en chaque point ou encore, les lieux et . étant
quelconques, en écrivant l'équation sous une forme générale:

Remarque : nous nommons souvent l'énergie totale d'un système : "l'hamiltonien du système".

En l'absence de frottement s'il s'agit d'énergie mécanique, nous écrivons aussi la variation tel
que :

Une augmentation d'énergie cinétique entraîne donc une diminution d'énergie potentielle (et
réciproquement) puisque la somme des deux reste constante.

Contre-exemple: s'il y frottement, donc dégagement de chaleur, l'énergie mécanique totale


n'est plus constante! (L'énergie mécanique seulement).

812/2001
Sciences.ch 14/03/2005

Par ailleurs reprenons l'équation et donc:

D'autre part, étant une fonction scalaire dépendant des coordonnées d'espace formons sa
différentielle totale:

en comparant avec l'équation précédente et en identifiant terme à terme, nous avons :

d'où l'expression affirmant que la force dérive d'une énergie potentielle si le travail en jeu est
indépendant du chemin suivi. Si nous exprimons la force en termes de vecteurs-unités,
nous obtenons :

En définitive, l'affirmation que la force dérive d'une énergie potentielle peut se résumer
ainsi:

Dans le cas de la gravitation :

Le champ de gravitation est donc caractérisé par l'ensemble des vecteurs .

CONSERVATION DE LA QUANTITÉ DE MOUVEMENT

Un mobile, lors d'une interaction avec un autre point matériel, peut transmettre tout ou partie
de son mouvement (énergie cinétique ou/et potentielle). C'est le cas lors d'un choc, par
exemple. La grandeur ainsi échangée est la quantité de mouvement . Elle vaut par
définition (nous l'avons déjà vu lorsque nous avons parlé de la deuxième loi de Newton):

Evidemment, nous avons :

813/2001
Sciences.ch 14/03/2005

La quantité est parfois appelée "impulsion, et l'équation précédente porte quelque fois

le nom de "Théorème de la quantité de mouvement". Il s'énonce ainsi:

L'impulsion fournie par une force entre les instants et est égale à la variation de la
quantité de mouvement durant cet intervalle de temps.

Mais revenons en à notre conservation de la quantité de mouvement (et donc de l'énergie et


réciproquement…). L'intérêt de la grandeur de quantité de mouvement résulte du fait qu'elle
est conservée dans les interactions (en première approximation..). En effet, soient deux
mobiles en collision, en vertu de l'égalité de l'action et de la réaction (3ème loi de Newton)
nous avons :

et en utilisant le théorème de la quantité de mouvement nous pouvons écrire:

En additionnant membre à membre ces deux équations, nous déduisons :

car

et donc:

La quantité de mouvement totale est constante, elle se conserve donc.

LOI DE NEWTON GENERALISÉE

Revenons maintenant un petit peu à notre principe de moindre action dont nous avons parlé au
tout début de cette section:

Prenons le cas d’un objet lancé en l’air et repérons deux points de sa trajectoire en deux
instants quelconques. Une infinité de courbes passent entre ces deux points et pourtant la
nature n’en choisit qu’une seule. Qu’est-ce qui distingue cette courbe - la trajectoire physique
- de toutes les autres? A cette question nous pourrions, très justement, répondre que cette
courbe se distingue des autres par le fait qu’elle est solution de l’équation différentielle de la
trajectoire ... avec les conditions initiales appropriées. Mais dans le cas où nous ignorons les
conditions initiales ou lorsque le problème ne peut être ramené à une équation différentielle,
par quel moyen pouvons-nous alors distinguer la trajectoire physique de tous les chemins

814/2001
Sciences.ch 14/03/2005

possibles?

Le principe de moindre action s'exprime dans ce contexte par un minimum de vitesse pour un
minimum de chemin parcouru.

En fait de vitesse, il convient mieux en mécanique de considérer la quantité de mouvement


car cette dernière grandeur est directement liée aux propriétés inertielles des corps.
Mathématiquement Maupertuis traduisit le principe de moindre action comme suit.

Si nous considèrons le mouvement d’un corps entre deux points en et en , pour


une énergie totale donnée, la trajectoire sélectionnée par la nature est celle pour laquelle la
grandeur suivante est minimale:

La trajectoire physique entre deux points et aux instants et est celle pour laquelle
l’action est minimale.

En sachant que nous obtenons alors:

où est l’énergie cinétique du corps.

Nous le voyons, l’action prend une forme étonnamment simple et s’exprime directement en
fonction de l’énergie cinétique. Quelques années plus tard, à partir d’une intuition semblable à
celle de Maupertuis, Euler parvint à un énoncé très similaire de l’action mais en partant du
constat que les corps tendent à adopter un état où l’énergie potentielle est minimale. L’action
d’Euler s’exprimait en fonction de l’énergie potentielle au lieu de l’énergie cinétique. Qui de
Maupertuis ou d’Euler avait tort et raison?

En fait, leurs énoncés respectifs de l’action étaient équivalents. Nous savons que dans un
champ conservatif, si nous appelons l’énergie potentielle alors l’énergie totale vaut
+ et cette énergie est une constante. Nous en tirons que = – et que donc

815/2001
Sciences.ch 14/03/2005

. D’où:

Cette relation est vraie quel que soit le chemin d’énergie totale initiale . Nous en concluons
que la valeur de la constante ne permet pas de discriminer les différentes trajectoires et
peut donc être éliminée de la formulation de l’action. L’action de Maupertuis peut alors se
réduire à une nouvelle grandeur notée :

Cette nouvelle formulation de l’action fut donnée par Lagrange en 1788. s’appelle
"l’action lagrangienne" ou "hamiltonienne" et la fonction :

porte le nom de "Lagrangien mécanique". Ainsi formulé, le principe de moindre action devint
l’un des outils les plus puissants de la mécanique.

Nous avons déjà vu comment nous exprimons le principe de moindre action


mathématiquement. Dans le cas qui nous intéresse, l’action n’est pas une fonction de variables
analytiques mais de trajectoires!

Considérons le cas très simple d’un corps de masse m se mouvant sur une seule dimension
(que nous représenterons par un axe ) d’un point d’abscisse à l’instant à un point de
coordonnée à l’instant . Supposons qu’il est soumis à un potentiel qui ne varie pas
avec le temps c'est-à-dire . L’action de ce corps sur un chemin quelconque
menant de à est alors:

Soit le chemin physique et l’action sur ce chemin. Notons par les valeurs de la
position sur le chemin physique. Considérons maintenant un chemin très proche de
tel que les positions le long de aient les valeurs que nous écrirons, pour
alléger les écritures .

Calculons l’action pour ce chemin:

816/2001
Sciences.ch 14/03/2005

Comme est infiniment petit, il est possible de développer le potentiel en développement


limité:

Quant au premier terme, il se ramène à:

Comme nous ne considérons que les variations du premier ordre, le dernier terme peut être
négligé, ce qui donne pour l’action sur le chemin :

Posons maintenant que la variation de l’action entre le chemin physique et est


nulle :

et ainsi:

Le premier terme dans l’intégrale peut s’intégrer par parties comme suit:

Or, tous les chemins partent de à l’instant et arrivent à à l’instant . Ceci implique
qu’en et la variation est nulle ce que nous écrivons . Donc le
premier terme de l’intégration par parties est nul. La variation de l’action prend alors la
forme:

817/2001
Sciences.ch 14/03/2005

Cette intégrale doit être nulle pour tous les chemins très proches du chemin physique ,
donc quelle que soit la valeur de . Pour qu’une telle condition soit remplie il faut que le
terme devant soit nul, c'est-à-dire:

Or nous connaissons au fait cette équation: le premier terme n’est rien d’autre que où
est l’accélération du corps, et le second - l’opposé du gradient du potentiel - est l'intensité
de la force en un point donné. Celle-ci se réduit donc à l’équation:

qui n’est autre que la seconde loi de Newton généralisée! Le principe de moindre action
contient donc implicitement la mécanique newtonienne. Ainsi, il est possible de reconstruire
toute la mécanique de Newton avec le seul principe de moindre action!!!

Cet échafaudage de calculs peut paraître bien compliqué pour aboutir à un résultat que nous
connaissions déjà mais tout l’intérêt du principe de moindre action réside dans le fait qu’il
permet de tirer des lois fondamentales à partir de la seule connaissance du lagrangien d’un
système.

Les théories les plus récentes comme la théorie quantique des champs, les théories de jauge
ou la théorie des supercordes ont toutes pour point de départ l’expression de l’action du
système. Les physiciens en dégagent ensuite des lois fondamentales qui régissent le
comportement des particules élémentaires.

PUISSANCE

Définition : la puissance est le taux instantané de variation du travail (énergie sous forme
quelconque). Nous avons donc la "puissance instantanée" donnée par :

Si le travail est fourni de façon régulière, constant, nous avons alors la "puissance moyenne",
constante :

Remarques :

R1. L'unité de la puissance est le "Watt" et se note mais en technique, certains utilisent
encore souvent le "cheval" défini comme suite :

R2. En exprimant le travail (énergie) à partir de l'équation , où la puissance est donné

818/2001
Sciences.ch 14/03/2005

en et le temps en heures, il apparaît alors l'unité d'énergie (kilowattheure), très


utilisée en pratique.

PUISSANCE D'UNE MACHINE TOURNANTE

Le travail élémentaire effectué par la force faisant tourner le solide (un cylindre dans
la cea présenté de suite) autour de son axe d'une angle vaut :

La puissance instantanée est alors :

Or, moment de la force (supposée dans ce cas particulier perpendiculaire à ),


donc "moment de rotation". La puissance est alors donnée par :

RENDEMENT

A cause des frottements, la puissance restituée par une machine (dit "puissance utile") est
toujours inférieure à la puissance absorbée. Nous tenons compte de cet effet au moyen du
rendement défini par :

Nous y reviendrons beaucoup plus en détail lors de notre étude de la thermodynamique.

MOUVEMENTS RELATIFS ET FORCES D'INERTIES

Considérons un référentiel fixe et un référentiel mobile . Ils sont donc en


mouvement relatif et nous envisageons une rotation possible du référentiel mobile. Il s'agit
d'exprimer, la vitesse, l'accélération d'un point de l'espace au moyen des coordonnées du
référentiel fixe (coordonnées absolues) à partir de celles attachées au référentiel mobile
(coordonnées relatives) et du mouvement d'entraînement du référentiel mobile.

Nous définissons dans notre étude:

vecteur de position de par rapport au référentiel mobile


vecteur de position de par rapport au référentiel fixe
vecteur de position de par rapport à l'origine du référentiel mobile
vitesse absolue de par rapport au référentiel fixe (supposé inconnu)

819/2001
Sciences.ch 14/03/2005

accélération absolue de par rapport au référentiel fixe (supposé inconnu)


vitesse relative de par rapport au référentiel mobile (supposé connu)
accélération relative de par rapport au référentiel mobile (supposé connu)
vitesse d'entraînement du référentiel mobile (supposé connu)
accélération d'entraînement du référentiel mobile (supposé connu)
vitesse angulaire du référentiel mobile

la position du point est donc donnée par:

La vitesse absolue se calcule comme:

Le dernier terme est la contribution due à la rotation du référentiel mobile. Il s'agit maintenant
d'exprimer la valeur de cette contribution en envisageant des rotations d'angle
autour de chacun des axes, successivement:

820/2001
Sciences.ch 14/03/2005

Nous obtenons ainsi les vecteurs élémentaires figurant les déplacements des
extrémités des vecteurs-unités . Nous les introduisons dans l'expression ci-dessous qui
devient, après réarrangement des termes:

par définition du produit vectoriel. La vitesse absolue du point s'exprime donc ainsi:

nous constatons que dans le cas particulier où le référentiel mobile ne subit qu'une translation
, nous trouvons l'équation caractéristique de la transformation de Galilée.

En procédant de la même façon que pour la recherche de la vitesse absolue il vient, en


dérivant la relation nous avons :

821/2001
Sciences.ch 14/03/2005

Si nous regroupons les termes:

Si nous regroupons les termes:

Si nous regroupons les termes:

et nous avons :

Donc:

Finalement:

mais rappelons-nous que :

ainsi:

822/2001
Sciences.ch 14/03/2005

L'accélération absolue s'exprime alors comme:

Le terme:

est appelé "accélération de Coriolis" et le terme est simplement l'expression de


l'accélération centripète dans ce cas particulier.

La loi de Newton doit comporter tous les termes contenus dans l'équation générale
ci-dessus. Pour un observateur situé dans le système mobile, cette loi s'écrit:

où l'on a en premier terme à droite de l'égalité la force d'entraînement, en troisième la force de


Coriolis et en dernier la force centripète.

Si le point est lié rigidement au référentiel mobile, un observateur dans ce système ne


perçoit aucun mouvement, par conséquent aucune accélération . Nous avons donc affaire à
un système de forces en équilibre. Le problème de dynamique est alors ramené à un problème
de statique. C'est le "principe d'Alembert".

Exemple :

Etant donné que pratiquement toutes nos observations sont faites sur Terre, c'est-à-dire dans
un référentiel mobile dans l'Univers, la force de Coriolis peut y être mise en évidence.

L'étude du mouvement d'un corps par rapport à la Terre est l'une des applications les plus
intéressantes de l'équation démontrée précédemment. La Terre a une vitesse angulaire
(supposée constante!) dont la direction est celle de l'axe de rotation de la Terre. Appelons
l'accélération de la pesanteur mesurée en un point à la surface de la Terre si celle-ci ne
tournait pas. correspond alors à . En tirant l'accélération d'entraînement et relative nous
obtenons l'accélération mesurée par un observateur en mouvement avec la Terre:

823/2001
Sciences.ch 14/03/2005

où est négligé dans le cas de la rotation de la Terre.

Nous considérons d'abord le cas d'un corps initialement au repos, ou se déplaçant très
lentement de sorte que le terme de Coriolis est nul ou négligeable comparé au dernier terme.
L'accélération que nous mesurons dans ce cas est appelée "accélération effective" de la
pesanteur, et nous la désigne par .

Par suite:

En supposant que la Terre est une sphère (en fait sa forme s'en écarte légèrement) et qu'il n'y a
pas d'anomalies locales, nous pouvons estimer que est dirigé vers le centre de la Terre. Le
deuxième terme étant l'accélération centrifuge elle est dirigée vers l'extérieur.

Puisque est la somme de et de l'accélération centrifuge, la direction de , appelée la


"verticale", s'écarte légèrement de la direction radiale; elle est expérimentalement déterminée
par un fil à plomb. Les liquides se maintiennent toujours en équilibre avec leur surface
perpendiculaire à .

L'ordre de grandeur de l'accélération centrifuge est:

où r est le rayon de la Terre. L'accélération centrifuge décroît de l'équateur aux pôles car le
rayon de la Terre n'est pas constante (la Terre est aplatie au pôles). Cette variation de
l'accélération est toujours très petite quand nous la comparons avec la pesanteur
mais elle explique cependant la plupart des variations observées de la
valeur de la pesanteur avec la latitude.

Le gradient de l'accélération centrifuge a pour effet de déplacer légèrement la direction radiale


d'un corps qui tombe en chute libre: le déplacement est vers le Sud dans l'hémisphère Nord et
vers le Nord dans l'hémisphère Sud.

Considérons ensuite le terme de Coriolis. Dans le cas de la chute d'un corps, la vitesse est
dirigée vers le bas. D'autre part, comme se trouve le long de l'axe de la Terre , est
dirigé vers l'Ouest. Le terme de Coriolis est donc dirigé vers l'Est; le corps qui
tombe sera dévié dans cette direction.

Pour un corps tombant dans un plan parallèle et tangent à la surface de la Terre, nous avons :

824/2001
Sciences.ch 14/03/2005

C'est exactement ce phénomène que l'on observe dans le cas des cyclones (nous y reviendrons
plus en détail dans notre étude de la météorologie dans le chapitre de mécanique des fluides).
Une zone atmosphérique dépressionnaire (de faible pression relative) donnerait des courants
atmosphériques (vents) convergents vers la dépression si la Terre ne tournait pas autour de
son axe.

La force de Coriolis dure à la rotation de la Terre dévie donc les vents Nord-Sud en direction
de l'Ouest et les vents Sud-Nord vers l'Est pour un observateur se situant au Pôle Nord. Nous
observons dès lors la formation de cyclones tournants de le sens contraires des aiguilles d'une
montre dans l'hémisphère Nord et inversement dans l'hémisphère Sud (à cause de la direction
du vecteur dans cette partie de l'hémisphère).

Comme second exemple, considérons les oscillations d'un pendule. Pour des oscillation de
faible amplitude, nous pouvons supposer que le mouvement du pendule se fait selon une
trajectoire horizontale. Si l'on fait osciller le pendule initialement dans la direction Nord-Sud,
le force de Coriolis va dévier le mouvement du pendule vers la droite pour un observateur
situé au Pôle Nord. En d'autres termes, le pendule tourne dans le sens des aiguilles d'une
montre dans l'hémisphère Nord et dans le sens contraire dans l'hémisphère Sud. Cet effet
observable est nul dans à l'équateur (parallélisme parfait entre et ) et maximale aux
Pôles.

825/2001
Sciences.ch 14/03/2005

Cet effet fut démontré de façon spectaculaire par le physicien français Jean Léon Foucault,
quand en 1851 il suspendit un pendule de 67 mètres de long à l'intérieur du Dôme des
Invalides. A chaque oscillation, le pendule faisait tomber du sable sur un cercle, ce qui
démontrait expérimentalement que son plan d'oscillation de par heure. L'expérience de
Foucault est une preuve frappante de la rotation de la Terre. Même si la Terre était toujours
couverte de nuages, cette expérience aurait montré aux physiciens que la Terre tournait.

Comme troisième exemple parlons des tourbillons que l'on peut observer dans la baignoire ou
le lavabo. Ce n'est qu'une légende que ce dernier tourne différemment en fonction des
hémisphères. Car la vitesse et la masse mises en jeu sont beaucoup trop faible pour êtres
observables. Au fait, le sens de rotation est dû aux imperfections (aspérités) du siphon. Tant
pis pour la légende :-P

THÉORÈMES DE KÖNIG

Nous avons vu jusqu'à maintenant, comment calculer le moment cinétique ou l'énergie


cinétique d'un système dynamique par rapport à un unique référentiel (soit galiléen, soit
barycentrique)

Les théorèmes de König donnent eux les moments cinétiques et l'énergie cinétique totale d'un
système dynamique par rapport à un référentiel galiléen et barycentrique

PREMIER THÉORÈME DE KÖNIG

Utilisons pour démontrer ce théorème le moment cinétique d’un corps de masse


(l'exemple étant toujours facilement extensible un système dynamique discret ou continu de
matière).

Exprimons le moment cinétique d'un élément du corps solide par rapport à l'origine du
référentiel galiléen (noté : par la suite) :

Exprimons le moment cinétique dans par rapport à son centre de masse (noté :
):

Le référentiel étant en translation par rapport à , nous avons :

Sans oublier que :

826/2001
Sciences.ch 14/03/2005

que nous insérons dans l'expression du moment cinétique :

De par la propriété du produit vectoriel, nous avons :

Étudions maintenant la valeur que prend chacun des quatre termes de la relation précédente.
Nous savons que par la définition du centre de masse que (dans un cadre non relativiste) :

d'où :

et également :

Finalement, il vient :

Donc finalement :

Ce théorème qui se rapporte à un point fixe permet l’application plus aisée du théorème du
moment cinétique.

DEUXIÈME THÉORÈME DE KÖNIG

Utilisons pour démontrer ce théorème l'énergie cinétique d’un corps de masse (l'exemple
étant toujours facilement extensible un système dynamique discret ou continu de matière).

Exprimons le moment cinétique d'un élément du corps solide par rapport à l'origine du
référentiel galiléen (noté : par la suite) :

827/2001
Sciences.ch 14/03/2005

Exprimons l'énergie cinétique dans par rapport à son centre de masse (noté :
):

Avec de même que précédemment :

Il vient dès lors :

et donc :

et comme pour le moment cinétique, de par la définition du centre de masse, nous avons :

d'où le deuxième théorème de König :

MOUVEMENTS OSCILLATOIRES

Le mouvement oscillatoire est le mouvement d'un corps qui va et vient de part et d'autre de sa
position d'équilibre. Il existe un quantité incroyable de phénomènes physique de ce genre.
Nous allons traiter dans cette section les grands classiques à partir desquels les
développements sur des phénomènes plus complexes s'inspirent.

Nous étudierons dans l'ordre les pendules des plus simples aux plus complexes et utiliserons
souvent des résultats antérieurs pour en déterminer de nouveaux.

Nous retreindrons notre étude des mouvements oscillatoires aux pendules. Les autres
viendront au fur et à mesure dans leurs chapitres respectifs.

Il existe neufs pendules très connus qui sont les suivants (ordre dans lequel nous les
étudierons): pendule de Newton, pendule simple, pendule physique, pendule élastique,

828/2001
Sciences.ch 14/03/2005

pendule conique, pendule de torsion, pendule de Foucault, pendule de Huygens.

PENDULE DE NEWTON

Nous n'allons pas trop nous étendre à décrire le pendule de newton. Une photo suffira:

Le principe de fonctionnement est le suivant:

Si vous lancez une bille, à l'extrémité une seule et unique bille se déplacera. Cela semble
logique et cohérent d'après la conservation de la quantité de mouvement qui découle de la
conservation de l'énergie comme nous l'avons déjà vu.

Un peu plus curieux, lorsque vous lancez initialement deux billes, ce sont deux billes qui se
déplacement à l'autre extrémité!

La démonstration est simple et le fonctionnement se base sur une condition très simple que
nous allons déterminer pour le cas particulier de deux billes (c'est toujours le même principe
pour un nombre de billes supérieur).

Soit les quantités de mouvement des deux billes initiales et les deux billes se
situant à l'autre extrémité. Nous avons donc:

Nous avons pour l'énergie cinétique:

après regroupement et simplification:

Ensuite après division de la deuxième relation ci-dessus par la première, nous déduisons
l'expression des vitesses après le choc:

829/2001
Sciences.ch 14/03/2005

Hypothèse: supposons maintenant qu'en prenant une seule des billes ( ), il y en ait deux
qui partent à l'autre extrémité tel que::

Prenons le cas où toutes les billes du pendule de Newton ont la même masse (cas
correspondant à celui que l'on trouve dans le commerce). Alors:

Nous voyons que notre hypothèse initiale impossible: si à masses égales, une seule bille est
lancée alors, à l'autre extrémité, une seule bille partira.

Par contre, si nous lançons deux billes dans un pendule de Newton composé de masses
identiques nous avons après simplification des équations:

deux billes qui partent à l'autre extrémité.

Il suffit de procéder à des raisonnement identiques pour 3, 4, 5, … billes.

PENDULE SIMPLE

Soit, la période de temps nécessaire pour qu'un pendule simple (voir figure ci-dessous)
parcoure un cycle complet et que l'on peut écrire:

830/2001
Sciences.ch 14/03/2005

La variation de l'énergie potentielle du système étant:

Nous savons que et que la conservation de l'énergie nous permet de poser:

Après simplification nous obtenons:

Nous pouvons exprimer par rapport à la distance parcourue par le pendule:

Si nous dérivons cette expression par rapport au temps... Nous obtenons alors:

Si nous revenons à:

et que nous le dérivons, nous obtenons:

Si l'angle est petit, nous pouvons remplacer avec l'aide de la série de Taylor et sans erreur
trop grave, par le premier terme de son développement en série:

et comme nous obtenons:

Etant donné que dans un cadre périodique:

831/2001
Sciences.ch 14/03/2005

nous pouvons alors écrire que:

d'où:

Comme nous pouvons poser:

Si:

où est la position du centre de masse de l'objet et le nombre éventuels de maillons que


l'on aurait pris pour la longueur de la chaîne et étant le pas de la chaîne.

Ce qui nous donne finalement:

PENDULE PHYSIQUE

Nous appelons "pendule physique" un solide quelconque pouvant osciller librement dans la
pesanteur, autour d'un axe , avec une petite amplitude ( ).

Son mouvement est déterminé par l'équation suivante:

où est le moment de rappel et le moment d'inertie du pendule par rapport à son axe
d'appui .

En faisant une analyse des forces sur notre pendule nous obtenons une autre relation pour :

832/2001
Sciences.ch 14/03/2005

pour et où est la distance de l'axe d'appui du pendule à son centre de masse.


Le terme négatif apparaît ici pour exprimer le fait que la période diminue avec le temps.
Comme l'angle est petit, nous avons remplacé et sans erreur trop grave par le premier
terme de son développement en série de Taylor:

Donc le moment de rappel peut s'écrire:

d'où l'équation différentielle du mouvement:

Nous avons vu dans les mouvements harmoniques oscillants que nous obtenions la position
angulaire d'une masse par la relation:

ce qui nous permet d'écrire:

et par simplification nous obtenons:

d'où:

En exprimant le moment d'inertie au moyen du théorème de Steiner en déduisons que:

et en introduisant encore le rayon de giration :

833/2001
Sciences.ch 14/03/2005

d'où:

Soit la position de l'axe de rotation mesurée par rapport à une origine quelconque et la
position du centre de gravité par rapport à la même origine nous avons:

tel que représenté ci-dessous:

d'où:

ce qui nous donne aussi pour la période:

comme la racine nous gêne nous élèvoéns le tout au carré, ce qui nous donne finalement

Comme nous connaissons et , cette relation nous permettrait à partir du tracer un


graphique permettant de déterminer la position de et .

Ainsi, en portant sur un graphique en fonction de :

834/2001
Sciences.ch 14/03/2005

La courbe obtenue présente une asymptote verticale ( ) pour et deux minima.

En dérivant par rapport à et en annulant les dérivées, nous trouvons la position des
minima :

PENDULE ÉLASTIQUE

Étudions maintenant les oscillations propres d’un solide suspendu à un ressort élastique tel
qu'il oscille. Après l’écart du solide de la position d’équilibre, il accomplira des oscillations
harmoniques dans le sens vertical, si le ressort élastique subit des déformations
proportionnelles à l’allongement du ressort.

Nous aurons souvent dans ce site à faire avec de petits mouvements autour d'une position
d'équilibre. Ce type de mouvement caractéristique de ce que nous appelons un "oscillateur
harmonique" est très fréquent. Il se généralise à toutes sortes de situations physique, telles que
les circuits RLC, le modèle quantique corpusculaire et ondulatoire de l'atome, les résonateurs
à quartz ou toute autre structure vibrante faiblement autour de son point d'équilibre.

Nous supposerons que la force de rappel est proportionnelle et opposée à la déformation tel
que:

L'équation différentielle de l'oscillateur harmonique peut donc s'écrire:

Nous prendrons la démarche très simple qui consiste à essayer une solution, en l’occurrence:

C'est une solution, car en effet:

835/2001
Sciences.ch 14/03/2005

pour autant que nous prennions:

Nous avons aussi:

comme solution.

Une solution générale est donc:

Pour trouver et , il faut spécifier les conditions initiales. Prenons par exemple:

à .

Nous avons alors:

Calculons maintenant le travail (énergie) nécessaire pour déformer l'oscillateur harmonique.


Nous avons :

Ainsi, l'énergie potentielle élastique dans un ressort de constante , ayant subi une
déformation est donc donnée par :

Pour une description plus réaliste, une meilleure modélisation, nous allons supposer que

836/2001
Sciences.ch 14/03/2005

l'oscillateur est soumis à une force supplémentaire représentant les frottements. Il arrive
souvent que l'approximation par laquelle la force de frottement est proportionnelle à la
vitesse, et opposée à la vitesse, soit une bonne approximation. Ce n'est pas la seule possible, et
ce n'est pas toujours la meilleure. Nous parlerons des forces de frottement plus tard.

Ainsi nous considérons une force de friction de la forme (ne pas confondre avec la notation du
moment cinétique qui n'a absolument aucun rapport):

Pour notre système de coordonnées:

La deuxième loi de Newton impose:

Pour se conformer à une notation usuelle dans le cadre de l'oscillateur, nous notons:

d'où l'équation différentielle:

Nous prenons la fonction d'essai:

En substituant, nous trouvons:

Comme nous cherchons des solutions non nulles ( ) il faut que:

d'où:

837/2001
Sciences.ch 14/03/2005

et la solution générale est:

où deux constantes sont déterminées par les conditions initiales.

Nous verrons qu'il correspond à un amortissement faible. En effet, nous pouvons écrire avec
des racines carrées réelles:

et la solution générale peut alors s'écrire:

En utilisant les propriétés complexe des exponentielles (formule d'Euler – voir le chapitre
traitant des nombres) :

Choisissons et rappelons que (voir chapitre de trigonométrie).


Ainsi :

et comme nous avons aussi . Alors :

posons et comme la fonction trigonométrique est périodique à avec


alors :

L'allure générale de la normalisée à l'unité est la suivante:

838/2001
Sciences.ch 14/03/2005

Quand nous disons qu'il y a "amortissement critique", quand , qu'il y a


"amortissement sur-critique".

La rapport est quant à lui appelé "facteur de qualité".

PENDULE CONIQUE

Le pendule conique consiste à prendre un masse considérée comme ponctuelle et


suspendue en d'un fil fixé en .

La masse étant écartée d'un angle de la verticale, l'objectif de ce pendue est fréquemment
(car c'est le cas le plus simple) de déterminer la dépendance entre l'angle et la vitesse si l'on
considère que les trajectoires sont circulaires.

La masse se déplace autour de la verticale , en décrivant un cercle de rayon:

Les forces suivantes agissent sur la masse :

839/2001
Sciences.ch 14/03/2005

D'apèrs la figure, nous voyons que:

ou, comme:

alors:

L'angle est donc d'autant plus grand que la vitesse angulaire est élevée, ce que confirme
l'expérience. Pour cette raison, le pendule conique fut longtemps utilisé comme régulateur de
vitesse sur les machines à vapeur (il ferme l'arrivée de vapeur quand la vitesse dépasse une
limite fixée à l'avance et l'ouvre quand elle tombe au-dessous de cette valeur).

Nous avons aussi:

d'où après simplification:

PENDULE DE TORSION

Le pendule de torsion est un système qui fut utilisé par Coulomb pour mesure de la charge
électrique élémentaire et par Cavendish pour la mesure de la constante gravitationnelle .

Le pendule de torsions consiste en un solide rigide suspendu à fil de torsion vertical. Lors des
oscillations le fil exerce un moment de rappel que l'on supposera proportionnel à l'angle de
torsion :

840/2001
Sciences.ch 14/03/2005

où est la constante de torsion de ce ressort particulier.

Nous avons donc:

soit l'équation différentielle:

Par analogie avec le pendule physique où nous avions une équation différentielle identique à
un facteur près, il vient:

PENDULE DE FOUCAULT

Le pendule de Foucault est une expérience formidable pour rendre compte de la rotation de la
Terre. Il existe plusieurs méthodes mathématiques pour analyser le comportement du pendule
de Foucaul j'ai choisi de présenter le plus simple qui ne nécessite pas des pages de calcul (3
pages).

Soit la figure ci-dessous:

Nous considérons que c'est la vue d'un référentiel géocentrique (la Terre) vu en coupe selon
un plan qui contient l'axe de rotation.

La taille du pendule est bien évidemment exagérée sur la figure. Il oscille cependant quand
même dans un plan méridien, entre et (un observateur terrestre voit la droite AB tourner

841/2001
Sciences.ch 14/03/2005

par rapport au sol terrestre selon le cercle vert, vu en perspective, dans le sens rétrograde).

Soit la période de rotation de (ou ).

La vitesse de ( ) , sur ce cercle, est due au fait que, dans le référentiel géocentrique, le
point , à la verticale du point de suspension, et le point du sol Terrestre coïncidant avec
à un instant donné, n'ont pas la même vitesse dans le référentiel géocentrique: le point
étant plus éloigné de l'axe de rotation Terrestre: la distance étant plus grande que
(de même la vitesse de étant supérieure à la vitesse de ).

La différence de ces vitesses se calcule aisément en supposant que la rotation terrestre est
uniforme en raisonnant sur une période d'une journée (sidérale) .

Nous savons que:

De ceci il découle facilement que:

étant donné que dans le triangle :

alors:

Or, n'est autre que:

Donc:

Nous avons donc obtenu l'expression de la période du pendule de Foucault.

PENDULE DE HUYGENS

Nous cherchons à construire un pendule dont la période soit indépendante de l'amplitude.

842/2001
Sciences.ch 14/03/2005

Pour cela nous disposons deux lamelles de forme cycloïdale à des positions symétriques et
déterminées telles que représentées sur la figure ci-dessous:

Le choix de la cycloïde est du au fait qu'il s'agit d'une courbe "brachistochrone" (voir la
définition plsu bas) et depuis les travaux de Huygens en 1659, nous savons aussi qu'il s'agit
d'une courbe "tautochrone" (les balanciers dans les montres modernes ont par tradition cette
forme). C'est-à-dire que les corps qui tombent dans une cycloïde renversée arrivent au point le
plus bas dans le même temps, de quelque hauteur qu’ils commencent à tomber.

Donc contrairement à une idée reçue, le chemin le plus rapide pour un corps en mouvement
non horizontal tombant sur un support solide n'est pas la ligne droite.

En effet, l’un des problèmes les plus connus de l’histoire des mathématiques est le problème
du brachistochrone qui consiste donc à trouver la courbe le long de laquelle une particule
glisserait d’un point à un autre en un minimum de temps en étant soumis à un champ
uniforme de pesanteur. Ce problème a été posé par Jean Bernoulli en 1696 comme un
challenge pour les mathématiciens de son époque (et s'en fut un !!!). La solution fut trouvée
par Jean Bernoulli lui-même ainsi que par son frère Jacques Bernoulli, Newton, Leibniz et le
marquis de l’Hospital. Le problème brachistochrone est important dans le développement des
mathématiques et s'avère être une des applications principales de la méthode du calcul des
variations.

Nous considèrons dans le champ de la pesanteur deux points et et un point matériel


se déplaçant sans frottement sur une courbe d’extrémités et . Déterminer la courbe,
appelée brachistochrone, pour laquelle le temps de parcours est minimal lorsque le point
part du point avec une vitesse nulle.

Considérons le schéma ci-dessous:

A l’abscisse sur le graphe, l’énergie potentielle perdue est , équivalente à

843/2001
Sciences.ch 14/03/2005

l’énergie cinétique acquise par le point matériel depuis le départ telle que:

D’où sans trop de surprises:

La vitesse est mesurée le long de la courbe si bien que nous devons réécrire l’expression en
composantes horizontales et verticales:

Nous allons poser que représente l’abscisse curviligne et l’accroissement de cette


distance le long de la courbe. et représentent les composantes horizontales et verticales
de .

Ainsi:

- représente la vitesse le long de la courbe

- représente la composante de la vitesse

- et sont données par le théorème de Pythagore exactement de la même façon que nous
l'avions fait dans notre cadre d'étude du formalisme lagrangine.

En insérant l’équation obtenue d’après les principes de la dynamique:

Une simple intégration nous donne alors l’expression de à minimiser:

Nous nous retrouvons avec une fonction similaire à celle que nous avions lors de notre étude
d'un cas pratique du formalisme lagrangien.

Il s’agit maintenant de trouver le minimum atteint par t parmi toutes les fonctions
satisfaisant:

844/2001
Sciences.ch 14/03/2005

Le problème fondamental dit du "calcul des variations" consiste à chercher, parmi les
fonctions continûment dérivables sur un intervalle donné et pour lesquelles
les fonctions et sont des valeurs données, celles qui rendent maximum ou
minimum l’intégrale précédente.

Pour appliquer cette méthode, nous partons de l’équation d’Euler-Lagrange (voir chapitre de
mécanique analytique) :

qui donne les extremums de l'intégrale.

Identiquement à ce que nous avons vu dans notre exemple dans le cadre de notre étude du
formalisme lagrangien (voir chapitre de mécanique analytique) nous avons dans notre cas:

Donc:

En remplaçant dans l'équation différentielle d'Euler-Lagrange, nous trouvons:

ou autrement écrit:

Il faut donc résoudre cette équation différentielle pour trouver le fonction qui donne le chemin
le plus rapide.

Il existe une fonction paramétrique qui satisfait cette équation différentielle. C'est l'équation
paramétrique du cycloïde justement ! Donnée par:

Soit les dérivées:

845/2001
Sciences.ch 14/03/2005

Ainsi:

La conservation d’énergie:

s’écrit donc:

d'où:

Donc le temps requis pour aller du haut au bas de la cycloïde que décrit le pendule de
Huygens est :

Cette durée ne dépend donc que de paramètres fixes.

L'énoncé en 1696 du problème brachistochrone peut être considéré comme l'authentique acte
de naissance du calcul des variations, car c'est ce problème qui suscite la recherche de
méthodes générales progressivement élaborées au cours d'une véritable compétition.

Remarque : Une ligne brachistochrone d'une surface est une courbe sur laquelle doit glisser
sans frottement un point matériel pesant placé dans un champ de pesanteur uniforme de sorte
que le temps de parcours soit minimal parmi toutes les courbes joignant deux points fixés.
Autrement dit, ce sont les lignes les plus courtes en temps, alors que les géodésiques (voir
chapite de mécanique relativiste) sont les lignes les plus courtes en distance.

846/2001
Sciences.ch 14/03/2005

MÉCANIQUE ONDULATOIRE

Nous nous intéresserons ici à l'étude des propriétés mathématiques des cordes vibrantes que
l'on peut également par extension dans un souci de généralisation à des cas immatériels
assimilier au concept des "ondes". Cette étude est très importante car nous aurons besoin de
certains des résultats obtenus ici en thermodynamique, physique quantique, astrophysique et
électrodynamique (pour ne citer que les plus importants).

Définitions :

D1. Une onde est un transport d'énergie sans transport de matière. Elle est concrétisée par la
propagation d'une perturbation d'un milieu. La vitesse avec laquelle l'onde progresse (d'où
l'appellation de "ondes progressives") dépend des propriétés physique du milieu (c'est la
raison pour laquelle il est difficile de savoir si la mécanique ondulatoire doit être étudiée dans
le chapitre de mécanique des milieux continus).

D2. Dans le cas où la perturbation du milieu se fait verticalement à la direction de propagation


de l'onde, nous parlons "d'onde transversale" ou de "perturbation transversale" (typique des
ondes dans les cordes)

D3. Dans le cas où la perturbation du milieu se fait parallèlement à la direction de propagation


de l'onde, nous parlons "d'onde longitudinale" ou de "perturbation longitudinale" (typique des
ressorts).

FONCTION D'ONDE

Soit une perturbation définie dans une région donnée de l'espace. Si nous
remplaçons par , nous définissons dans cette même région, une perturbation
identique à mais translatée d'un distance dans la direction des positifs (à
droite donc si l'on adopte le système de représentation conventionnel vu en analyse
fonctionnelle).

Si représente un temps et si l'on pose , alors peut désigner la vitesse de


translation de la perturbation.

Ainsi, nous appelons "fonction d'onde", la relation mathématique :

qui décrit la progression d'une perturbation dans l'espace :

- décrivant une onde qui progresse vers

- décrivant une onde qui progresse vers

est par définition appelée "vitesse de phase de l'onde". Elle est constante un milieu
homogène. "L'amplitude de l'onde" est la valeur maximale de la perturbation :

847/2001
Sciences.ch 14/03/2005

En l'absence d'amortissement, elle conserver la même valeur en chacun des points où l'onde
passe.

EQUATION D'ONDE

Toute fonction dont l'argument est jouit de la propriété :

Démonstration :

Cependant, en dérivant une seconde fois, nous obtenons une autre forme de l'équation d'onde
que nous retrouverons aussi fréquemment :

Ce qui nous amène à écrire l'une des relations les plus importantes en physique :

Remarque : lorsque deux ou plusieurs ondes se propagent dans un milieu, la fonction d'onde
qui en résulte est la somme algébrique des fonctions d'onde de chaque onde. Nous disons
alors que les ondes "interfèrent" et nommons cette considération le "principe de superposition
des ondes".

Considérons maintenant une corde de longueur attaché l'une de ses extrémités à une
terminaison fixe. Supposons maintenant qu'une perturbation se propage sur cette corde.
Lorsque la perturbation arrive à la terminaison, nous observons que celle-ci change de signe
en même temps que sa vitesse de propagation s'inverse : l'onde subit ainsi une réflexion avec
inversion.

Pour décrire le phénomène, il faut imposer :

Une fonction d'onde quelconque, qui progresse vers la terminaison, ne peut pas
vérifier la condition :

848/2001
Sciences.ch 14/03/2005

pour toutes les valeurs du temps !

L'astuce consiste à la remplacer par une autre fonction d'onde dont la forme est
semblable à à grande distance de l'origine de la perturbation, et qui s'annule au point de
terminaison pour toutes les valeurs du temps. Pour cela, nous pouvons imaginer au point de la
terminaison, un miroir qui donne de la corde une image de même longueur dans laquelle nous
inventons une onde virtuelle , symétrique de ,
mais de signe opposé.

Nous décidons ainsi :

- que les deux ondes progressent l'une vers l'autre pour s'annuler au point de terminaison

- toute partie de l'onde réelle qui dépasse le point de terminaison devient virtuelle

- toute partie de l'onde virtuelle qui pénètre dans le corde devient réelle

A leur intersection, les deux ondes réalisent une interférence destructive au point de
terminaison. La somme algébrique de ces deux fonctions d'onde est aussi une fonction
d'onde :

qui a la propriété voulue en :

Si nous considérons maintenant une terminaison libre, sans frottements avec son support
d'attache, nous nous retrouvons dans un cas similaire au précédent à la différence que
l'interférence est constructive au point de terminaison plutôt que destructive telle que la
fonction d'onde s'écrive :

Remarques :

- lorsque l'onde arrive sur une terminaison libre ou fixe, l'énergie transportée est intégralement
renvoyée en arrière.

- lorsqu'une terminaison n'est pas exactement adaptée, seule une partie de l'énergie est
absorbée par le point , le reste est réfléchi.

TYPE D'ONDES

En physique théorique (et dans la pratique), nous restreignons fréquemment l'étude de certains
phénomènes à des cas particuliers d'ondes. Principalement, nous en distinguons trois que nous
allons brièvement mais soigneusement développer :

ONDES PÉRIODIQUES

849/2001
Sciences.ch 14/03/2005

Si un événement produit une onde qui ne transporte qu'une seule perturbation produite en un
point donné, il existe de nombreuses qui sont capables d'exciter un milieu de manière
répétitive.

Le point spatial de la source subit alors périodiquement la même perturbation. La durée d'un
cycle complet est appelé identiquement à l'étude des pendules : "la période ".

Si la perturbation peut se propager sous forme d'onde, à vitesse , elle est décrite par la
fonction d'onde que nous connaissons :

En chaque point du milieu perturbé, l'onde périodique impose une "périodicité temporelle" de
la perturbation qui nous impose d'écrire :

Après plusieurs cycles d'excitations de la source, plusieurs perturbations sont distribuées dans
l'espace. La distance entre deux perturbations successives est appelée "longueur d'onde ".

La "périodicité spatiale" impose ainsi aussi :

est le chemin parcouru par l'onde pendant le temps :

Si une fonction d'onde est périodique dans le temps, elle l'est aussi dans l'espace, pour autant
que l'impulsion ne se déforme pas lors de la progression.

Démonstration :

En posant , nous avons bien

ONDES HARMONIQUES

Pour ces ondes, la fonction d'onde est un fonction trigonométrique de type sinus ou cosinus :

ou

La présence de appelé "nombre d'onde" est exigée pour 2 raisons :

- s'exprime en pour la cohérence des unités des fonctions trigonométriques

850/2001
Sciences.ch 14/03/2005

- la valeur de doit assurer la périodicité de la fonction d'onde :

1. périodicité angulaire de la fonction mathématique :

2. périodicité spatiale de la fonction d'onde :

En égalant ces deux expressions :

ce qui implique :

Introduisons :

dans l'expression de :

d'où autre relation importante :

La fonction d'onde de l'onde harmonique peut alors s'écrire sous la forme :

ou progressive selon

ou progressive selon

ONDES STATIONNAIRES

Imaginons une corde excitée de manière harmonique. Au lieu d'adapter sa terminaison pour
extraire de l'énergie de la corde, imposons que cette terminaison soit fixe. L'onde est alors
réfléchie.

Une nouvelle fonction d'onde doit être définie pour décrire la superposition de l'onde
incidente :

851/2001
Sciences.ch 14/03/2005

et de l'onde réfléchie :

en analogie avec le résultat que nous avions trouvé lors de notre étude des terminaisons :

La relation trigonométrique :

nous donne :

Ce n'est plus une onde progressive car et ne se combinent plus comme . Certains
points de la corde ne bougent jamais . Ils satisfont :

et sont situés en :

Pour des raisons évidents, nous ne conservons que les valeurs de pour lesquelles .

Chacun de ces points est appelé "nœud de la vibration".

Nous observons dans un tel système, des fuseaux de vibration, de longueur , dans
lesquels la corde vibre transversalement dans une zone de hauteur (deux vers le haut,
deux vers le bas).

Les points où l'amplitude de vibration est maximale sont des "ventres de la vibration".

Puisque , les ventres sont distants de et situés à des nœuds.

Si nous imposons maintenant une terminaison fixe aux deux extrémités d'une corde en
vibration, nous nous retrouvons avec une "mise en résonance".

Le plus souvent, nous n'observons pas grand chose jusqu'à ce que nous trouvions la fréquence
d'excitation qui place les nœuds de vibrations sur les deux points de terminaison fixe.

Dès lors pour une corde de longueur :

852/2001
Sciences.ch 14/03/2005

implique :

La corde est alors le siège d'une onde stationnaire dont l'amplitude de vibration est
considérablement plus grande que l'amplitude d'excitation (quatre fois).

Nous disons alors que la corde est rentrée en "résonance" avec l'excitateur.

La relation :

montre qu'il y a plusieurs longueurs d'onde possible dont la plus grande correspondant à
est appelée "fondamentale" et vaut bien évidemment .

MODES DE VIBRATION DANS UN FIL TENDU

Nous avons vu comment une onde peut progresser dans une corde. Montrons maintenant
pourquoi c'est possible et établissons la relation , donnant la forme de la corde en
fonction du temps.

Soit un fil de diamètre , longueur et masse , la masse linéique du fil est alors :

Par un léger choc, créons une petite perturbation (afin de ne pas déformer le câble et maintenir
constant sa masse linéique) transversale. Isolons, dans la zone perturbée, un élément de fil, de
longueur .

Approximations :

A1. Chaque élément de la corde peut être découpé de façon infinitésimale de façon a être
presque parallèle à l'axe . Les angles sont donc considérés comme petits

A2. La corde est considérée comme déformable mais non allongeable donc la norme des
forces dans la corde est constante en tout point quelque soit la déformation.

Pour la suite du raisonnement, nous nous servons de la figure ci-dessous :

853/2001
Sciences.ch 14/03/2005

Si les angles sont petits, le bilan des forces donne :

: pas de déplacements selon

Si les angles sont vraiment petits, nous avons le premier terme du développement qui donne :

Donc :

: accélération selon

La loi de Newton appliquée à la masse donne (nous considérons que chaque point
de masse se déplace seulement selon car il n'y a pas allongement) :

Les tangentes sont données par les dérivées partielles de la fonction :

Qui s'égalise avec l'avant-dernière relation :

et donc :

854/2001
Sciences.ch 14/03/2005

Si , les deux tangentes tendent vers la même valeur, mais la fraction du membre de
droite tend vers une valeur finie :

Il en résulte l'équation différentielle :

Si nous vérifions les unités de sont celles du carré d'une vitesse , comme
l'exige l'analyse dimensionnelle. Pour simplifier l'écriture, nous posons :

Nous allons maintenant considérer un cas particulier très intéressant dans le cadre de la
musicologie qui est celui de la corde tendue (la plupart des instruments à corde fonctionnant
ainsi).

L'objectif est dans le cadre de l'équation différentielle obtenu précédemment (petites


déformations dans les cadres des instruments de musique) de trouver un fonction
solution de cette dernière avec les conditions initiales suivantes, typiques à un instrument de
musique :

C.I.1. (les extrémités et sont fixes)

C.I.2. (forme initiale du fil à l'excitation)

C.I.3. (vitesse initiale nulle en tout point)

Pour résoudre cette équation différentielle linéaire, nous allons faire usage de la méthode de
séparation de variables en posant :

L'équation différentielle devient dès lors :

855/2001
Sciences.ch 14/03/2005

Le membre de gauche de la dernière relation ne contient pas la variable et celui de droite ne


contient pas la variable . La seule et unique façon d'égaler ces deux expressions est de les
considérer chacune comme constante, que nous noterons :

Ainsi, nous avons deux équations différentielles :

et

Ces deux équations étant similaires, résolvons-les de manière générale (voir la chapitre de
calcul différentiel et intégral pour plus de précisions) :

avec

Équation caractéristique est donc :

d'où :

Nous savons que la solution générale si les racines de l'équation caractéristique est complexe,
est de la forme :

Pour nos deux équations différentielles, nous avons donc par similitude :

et

Cela donne pour la solution de notre équation d'onde :

856/2001
Sciences.ch 14/03/2005

Déterminons les constantes en tenant compte des conditions initiales.

Il ne reste que :

Posons :

La condition initiale impose :

Pour tenir compte de la vitesse initiale nulle, dérivons par rapport au temps :

Il ne reste :

La constante représente donc l'amplitude du déplacement transversal du fil. Cette amplitude


ne pouvant être la même partout en un temps donné et un position donné pour tout type
d'excitation satisfaisant les conditions initiales, il doit existe autant de valeur que nous
choisissons de valeurs dans .

Le principe de superposition des solutions des équations différentielles linéaires (voir chapitre
de calcul différentiel et intégral) permet d'écrire que la combinaison linéaire de toutes les
solutions pour la corde est finalement :

857/2001
Sciences.ch 14/03/2005

Les doivent être choisis de manière à satisfaire la condition initiale qui donne la forme de
la perturbation :

Cette expression pour suggère de la comparer au développement en série de Fourier


(voir le chapitre traitant des suites et séries):

Dans laquelle et . Le théorème de Fourier impose alors que les sont


donnés par :

Imaginons maintenant une corde de longueur fixée en ses extrémités et tendue. Choisissons
la perturbation la plus simple possible : nous grattons la corde en son milieu, pour l'écarter
d'une petite distance de sa positions d'équilibre.

La perturbation initiale est alors :

pour et pour

Calculons les coefficients de Fourier :

L'intégration par parties (voir chapitre de calcul différentiel et intégral) donne :

La fonction d'onde devient :

À cause du , les termes pour lesquels est pair sont tous nuls. Il reste :

858/2001
Sciences.ch 14/03/2005

Si nous retenons que le terme en , nous aurions :

Nous avons :

qui est le nombre d'onde correspondant à un longueur d'onde :

et :

qui serait la fréquence de vibration du fil de la première harmonique.

Ainsi, pour une valeur quelconque, il est facile de démontrer que la -ième harmonique est
donnée par :

avec

Ainsi, après avoir été gratté au milieu de sa longueur , un fil maintenu rigidement à ses deux
extrémités peut osciller suivant plusieurs modes. Le mode fondamental (harmonique
fondamentale) correspond à la plus petite fréquence possible. Il lui correspond la longueur
d'onde .

Les fréquences d'ordre supérieures sont appelées "harmoniques". Pour un même


déplacement initial , l'amplitude maximale de la vibration diminue selon .

Remarques :

R1. La théorie prédit que la vibration peut être une combinaison linéaire de plusieurs modes.
Ce phénomène porte le nom de vibration simultanée. Il se produit abondamment dans un
piano.

R2. Les instruments de musique sont conçus pour émettre des sons à des fréquences
conventionnelles, étant admis que la hauteur d'une note perçue par l'oreille est définie par la

859/2001
Sciences.ch 14/03/2005

fréquence fondamental, par exemple le : Do (264 Hertz), La (440 Hertz)

R3. Lors de la construction de l'instrument, nous décidons de la valeur de (en choisissant


le diamètre et de la nature de la corde) et nous déterminons la longueur en cherchant le
compromis entre l'intensité sonore que nous voulons émettre et la résistance mécanique de
l'instrument qui doit supporter les forces de tension.

MODES DE VIBRATION DANS UNE MEMBRANE TENDUE

Nous dérivons le phénomène de la même manière que la vibration transversale de la corde.


Toutefois, la masse linéique du fil doit être remplacée par la masse surfacique de la
membrane.

De plus, nous remplaçons la force de tension unidirectionnelle du fil par une force de
tension appliquée sur le pourtour de la membrane. Cette force s'exerce dans toutes les
directions du plan et se décrit par unité de longueur :

Nous avons (analyse dimensionnelle) :

Il est d'abord évident que :

et comme :

L'analyse dimensionnelle (eh oui … à nouveau…) donne :

Nous avons donc :

L'analyse dimensionnelle donne :

860/2001
Sciences.ch 14/03/2005

Donc finalement nous obtenons pour équation d'onde en coordonnées cartésiennes (exprimé
avec la laplacien) :

Nous cherchons la solution particulière de cette équation qui vérifie les conditions suivantes :

C.I.1. La membrane est fixée sur son pourtour (conditions aux limites)

C.I.2. La position et la vitesse initiales sont données (conditions initiales)

La symétrie du problème suggère d'utiliser le laplacien en coordonnées polaires (voir le


chapitre de calcul vectoriel pour l'expression de la différentielle seconde en coordonnes
polaires) :

Remarque : nous avons changé de notation

Et les conditions fixées :

(conditions aux limites)

(conditions initiales)

où les fonctions sont données.

Á nouveau, pour chercher la solution, nous allons utiliser la méthode de séparation des
variables tel que :

et de même que pour la corde :

et identiquement que pour la corde, nous obtenons pour une solution du type :

861/2001
Sciences.ch 14/03/2005

Pour la méthode change car nous avons maintenant une équation différentielle à deux
variables tel que :

Pour intégrer cette équation, nous cherchons les solutions de la forme ,


nous obtenons en reportant :

En se rappelant qu'en coordonnes polaires :

D'où, en séparant les variables :

Le membre de gauche de la dernière relation ne contient pas la variable et celui de droite ne


contient pas la variable . La seule et unique façon d'égaler ces deux expressions est de les
considérer chacune comme constante, que nous noterons . Les équations différentielles
vérifiées par et sont alors :

La fonction est périodique de période , il existe donc un entier naturel tel que
et donc manière identique à la corde, nous obtenons :

Dans la première équation différentielle :

Pour simplifier, nous effectuons le changement de variable . L'équation différentielle


devient :

862/2001
Sciences.ch 14/03/2005

Nous reconnaissons ici l'équation différentielle de Bessel d'ordre telle que nous l'avons
avec sa solution présentée dans le chapitre des suites et séries. Dès lors, la solution générale
est du type :

Ce qui nous donne finalement :

Parmi les solutions à cette équation, cherchons celles qui vérifient les conditions aux limites
en posant :

À moins que ou soit la fonction nulle, ce qui donne pour solution la position
d'équilibre… (qui ne vérifie sans doute pas les conditions initiales), nous devons avoir
, c'est-à-dire :

La fonction Bessel d'ordre a une infinité de zéros positifs (il suffit de tracer cette
fonction avec un ordinateur pour le voir tel qu'avec Maple en mettant la commande : plot
(BesselJ(2,x),x=0...100) où vous pouvez changer la valeur 2 par une autre valeure) qui
fournissent une infinité de valeurs convenables de telle que :

Ce qui correspond finalement à une infinité de solutions de l'équation différentielle initiale


que nous pouvons écrire :

En ayant modifié le nom des constantes d'intégration en ayant posé (ce qui vérifie
l'analyse dimensionnelle). Maintenant que cette solution satisfait les conditions aux limites,
nous devons nous attaquer aux conditions initiales.

D'abord pour les mêmes raisons que la corde, la solution finale est la superposition linéaire
des solutions telle que :

863/2001
Sciences.ch 14/03/2005

Nous allons déterminer les coefficients de façon à ce que la solution donné


précédemment vérifie également les conditions initiales, à savoir :

Ces deux relations sont similaires, étudions la première. Elle peut s'écrire :

qui est le développement en série de Fourier de la fonction . Nous avons donc (voir le
chapitre des suites et séries) :

En utilisant l'orthogonalité des fonctions de Bessel, que nous allons démontrer, nous
déduirons de ces relations les coefficients (et de même pour les autres).

Démonstration :

Supposons fixé et posons . Montrons où le produit


scalaire est défini par :

Puisque vérifient l'équation différentielle en , nous avons :

En combinant ces deux relations nous obtenons :

864/2001
Sciences.ch 14/03/2005

En intégrant membre à membre entre et et en tenant compte de :

et

Nous obtenons :

D'où le résultat énoncé puisque .

La relation :

Peut donc s'écrire :

Utilisant l'orthogonalité de pour nous en déduisons :

Les coefficients sont donc donnés par :

Ce qui n'est pas aisé à calculer à la main….

Nous procédons de la même façon pour les autres coefficients.

PHASEURS

Il existe plusieurs façons d'exprimer les fonctions d'ondes que nous avons vues
précédemment. Les physiciens (ainsi que les électrotechniciens) utilisent une formulation,
appelée "phaseur", permettant d'économiser avantageusement le poids des écritures et ainsi de
simplifier considéralement l'étude des problèmes complexes (ou simples). Les phaseurs font

865/2001
Sciences.ch 14/03/2005

usage des propriétés des nombres complexes pour exprimer les fonctions d'onde
trigonométriques sous une forme simplifiée.

Ce que nous appellons phaseur, est une fonction dont la valeur est complexe et qui, dans
un espace à 1 dimension, s'écrit:

Dans toutes les applications en physique, est la variable du temps.

Comme cette fonction est complexe, elle a une partie réelle que nous appelons ici et une
partie imaginaire que nous appelons . Leur identification est facile puisque comme nous
l'avons déjà démontré lors de notre étude des nombres complexes (voir le chapitre des
nombres dans la section d'arithmétique) :

Ainsi, les parties réelles et imaginaires sont simplement:

Le module de se calcule aisément en calculant:

Les parties réelles et imaginaires varient lorsque la position ou le temps varient. Le module ne
change donc pas, il est toujours égal à 1. Le changement se manifeste simplement par la
simple variation d'angle que fait le vecteur représentant dans son plan complexe. C'est là
une raison suffisante pour parler de phaseur, puisque la variation de peut être visualisée
comme un simple changement d'angle ou de phase.

Si nous sommes dans un espace physique à plus d'une dimension, disons 3, alors l'expression
pour devient:

La situation est un peu plus difficile à visualiser (…). Elle est la même qu'en une dimension,
mais là tout se passe le long d'une direction définie dans l'espace 3D par le vecteur . Plus
précisément, nous aurons:

La variation dans le temps reste la même qu'en une dimension spatiale mais un déplacement
dans l'espace est un peu plus compliqué qu'en une dimension. Ici tout déplacement spatial

866/2001
Sciences.ch 14/03/2005

dans une direction qui n'est pas orthonormale à fera que le produit scalaire changera de
telle sorte que l'argument variera. Ici ce n'est pas seulement la grandeur ou la norme du
vecteur qui donne le taux de variation de sous un déplacement spatial mais aussi l'angle
que fait ce déplacement par rapport à la direction de puisque nous avune un argument qui
varie comme et donc qui dépend de cet angle noté ici . En effet, nous avons:

La quantité est souvent appelée le "vecteur d'onde". Physiquement il est relié le plus
souvent à l'équivalent du moment (linéaire) de l'onde pour laquelle il est évident que la
définition usuelle de la quantité de mouvement ( ) n'a plus de sens.

Un partie importante des systèmes étudiés en physique ne peuvent êtres caractérisés par un
point et donc décrits par une trajectoire. Une vague, une onde, une bande élastique qui
oscillent n'ont pas une unique position définie, ce sont des "milieux continus" sur un certain
intervalle. La question que nous nous posons dans notre tentative de les décrire est plutôt la
suivante: comment décrire le déplacement de ce milieu dans l'espace et dans le temps. Par
exemple, pour une vague, si nous figeons le temps, comment l'amplitude , de cette vague
varie-t-elle d'un endroit à l'autre de l'espace? Nous pouvons aussi figer l'espace en regardant
un seul endroit et demander comment l'amplitude varie avec le temps?

Les coordonnées et le temps jouent maintenant un rôle similaire de paramètres indépendants.


Nous mesurons l'amplitude du phénomène en tout temps et en tout lieu. Nous chercherons
donc à obtenir une expression du type:

ou

en une ou trois dimensions.

Le point important est que nous cherchons à exprimer , dont le nom correct est un "champ",
comme une fonction des coordonnées du temps. Par exemple, si la vague est très régulière
peut-être est-elle décrite adéquatement par si je regarde à un seul endroit et par
lors d'une fixation imaginaire du temps ?

La quantité va caractériser la fréquence de la variation du même phénomène.

Le nom de "fréquence angulaire" est facile à comprendre puisque la fonction cosinus ou sinus
fait un cycle si son argument change de sur une de temps d'un période .

Rappelons que :

Dans la description des systèmes harmoniques, la notation phaseur peut être très utile comme
nous l'avons déjà dit. L'équation la plus souvent rencontrée est est l'équation d'onde (que nous
avons démontré au début de ce chapitre). En une dimension, elle s'écrit :

867/2001
Sciences.ch 14/03/2005

Nous vérifions par simple substitution que la solution est du type:

ou

ou une combinaison linéaire dont la forme la plus générale est:

Un manière rapide et efficace d'écrire toutes ces relations de façon condensée et utilement
imagée, est d'écrire:

Dans les trois cas, la substitution permet de le vérifier. Prenons, par exemple, la solution
sinus. Alors:

Le remplacement dans l'équation donne:

qui sera satisfait si et seulement si:

La substitution du phaseur comme solution de l'équation d'onde transforme cette dernière


équation différentielle à une simple équation algébrique: "la relation de dispersion".

En effet, cette expression qui donne s'appelle une relation de dispersion. Elle est
évidemment caractéristique de l'équation qui la génère. Celle qui apparaît ci-dessus est
particulièrement simple et caractérise une onde libre dans un milieu non-dispersif, tel que
décrit par l'équation d'onde que nous avons écrit.

La solution phaseur satisfait donc aussi l'équation, avec la même relation


de dispersion. Elle est donc aussi la description d'une onde ? La réponse est oui, et même
duex fois plutôt qu'une, comme nous allons le voir ci-dessous.

868/2001
Sciences.ch 14/03/2005

Une onde physique n'est évidemment pas complexe. La solution phaseur est complexe et a
donc une partie réelle et une partie imaginaire. Nous montrons ici que chacune des deux
parties peut représenter une onde réelle générale. Utilisons même un point de départ un peu
plus général. Imaginons que l'amplitude est elle-même complexe. Nous pouvons donc
l'écrire:

Nous avons donc:

Nous étudions d'abord la partie réelle de cette expression:

Cette partie réellle est donc de la forme la plus générale (et réelle) de la solution
monochromatique pour l'équation d'onde, soit:

Clairement, il suffit d'identifier:

qui relient deux paramètres à deux autres. La partie réelle du phaseur est donc suffisante pour
décrire entièrement l'onde monochromatique.

Nous pouvons refaire exactement la même chose avec la partie imaginaire du phaseur et
démontrer de façon identique qu'elle est suffisante pour décrire entièrement l'onde
monochromatique.

Conclusion: il est donc possible d'utiliser le phaseur pour faire toutes les manipulations
mathématiques demandées apr le problème physique et à la fin, ne garder que la partie réelle
ou imaginaire, selon ce qui a été convenu dès le début.

Comme nous l'avons déjà dit, la forme réelle la plus générale de la solution est:

Cette fonction a le comportement d'un sinus (ou d'un cosinus) dont l'amplitude est donnée par:

869/2001
Sciences.ch 14/03/2005

De plus les conditions initiales ajustent de telle sorte qu'à et (initialement), le


champ a la valeur donc. Ces deux conditions fixent ces deux paramètres. Nous
aurions pu utiliser la forme toute aussi générale:

Ici l'amplitude connu est est et les conditions initales sont telles qu'à et , le
champ a la valeur . Encore une fois, deux conditions fixent deux
paramètres.

L'amplitude est une chose évidente, la phase un peu moins. Pour qu'une fonction du type
ait n'importe quelle valeur que l'on veut lorsque son arg (argument)
est, disons nul, il suffit d'ajuster la valeur de la phase . C'est comme faire glisser la fonction
sinusoïdale le long de l'axe, de façon à satisfaire des conditions initiales physiques imposées
par le système étudié.

De deux fonctions de typs sinus ou cosinus qui ne commencent par au même point de leur
cycle, nous disons qu'elles sont "déphasées". Ceci dvient vital lorsqu'il y a plus d'une onde en
présence. Imaginons le cas le plus simple de deux ondes de même amplitude:

Ici l'argument est une variable et les phases des paramètres constants. Nous considérons le
résultat physique de l'onde résultant de l'addition de ces deux ondes.

Si l'onde résultante sera une onde sinusoïdale d'amplitude 2 fois .


Cependant, si , l'onde résultante sera identiquement nulle partout. La
différence est donc considérable et nous trouvons toutes les situations intermédiaires. Il est
donc important de garder en tête la phase à l'origine de l'onde ou mieux, sa phase relative par
rapport à d'autres ondes de notre système physique.

Dans le phaseur, soit la partie réelle, soit la partie imaginaire, est suffisante pour donner une
description générale de l'onde (toujours monochromatique jusqu'à maintenant). Elles sont
respectivement composées d'un cosinus et d'un sinus et donc déphasées de l'une par
rapport à l'autre !

Il est souhaitable de revenir la "relation de dispersion" que nous avions obtenu. Nous avons
vu que, pour l'onde monochromatique libre, celle qui est solution de l'équation homogène,
cette relation s'écrit pour que la phase de la solution corresponde à cette réalité (attention il
s'agit de ne pas confondre le symbole de la vitesse et de la fréquence!):

Toujours dans le cas libre, nous pouvons avoir une situation physique qui correspond à
l'addition de plusieurs ondes monchromatiques libres. Le résultat n'est pas monochromatique
et s'écrit évidemment comme une somme:

870/2001
Sciences.ch 14/03/2005

Nous lui donnons souvent le nom de "paquet d'onde" pour des raison évidentes. Puisque tout
est libre, chaque composantes satisfera:

Nous noterons ici deux choses pour des ondes libres:

- D'abord, même pour des ondes libres, elle est quadratique, nous pouvons donc changer le
signe du vecteur d'onde et/ou de la pulsations sans affecter l'équation. Nous observons
trivialement que pour une ou plusieurs composantes du vecteur d'onde positives l'onde se
propage vers les croissants pour ces composantes positives et qu'inversement, pour une ou
plusieurs composantes négatives l'onde se propage vers les décroissants. De même, pour
une pulsation négative ou positive signifie que le temps varie vers le passé, respectivement le
futur.

- D'autres part, certains types d'ondes n'obéissent pas à une équation aussi simple que
l'équation homogène. C'est le cas des vagues, par exemple, tant du fait de la nature du liquide
dans lequel elles se propagent que de la force de rappel gravitationnel. Parfois aussi, une onde
qui serait totalement libre, ou à peu près, cherche à se propager dans un milieu où les
conditions de propagation sont sérieusement affectées. Par exemple une onde sonore qui tente
de se propager dans le mastic ou une onde électromagnétique qui cherche à se propager dans
un conducteur (un métal). Dans ce cas, une partie importante de la différence entre onde libre
et onde modifiée par le mileu peut se décrire par un changement de la dispersion.

871/2001
Sciences.ch 14/03/2005

MÉCANIQUE STATISTIQUE

La mécanique statistique (appelée aussi "thermodynamique statistique") a pour but


d'expliquer le comportement des systèmes macroscopiques à partir de leurs caractéristiques
microscopiques. C'est de façon beaucoup plus générale, la physique quantique qui décrit les
propriétés et l'évolution des systèmes physiques à l'échelle microscopique. La mécanique
statistique est donc construite sur cette description quantique comme nous le verrons sur les
développements mathématiques qui suivront.

La démarche présentée ici est d'aborder la mécanique statistique élémentaire pour en déduire
ensuite la thermodynamique. La mécaniqe statistique constitue en effet, avec la physique
quantique et la relativité, l'un des piliers de la phyisque moderne; il est important de la
percevoir d'emblée comme une théorie fondamentale, et non pas comme une simple tentative
pour justifier à posteriori la thermodynamique. La thermodynamique elle-même y gagne en
retour compréhension plus juste et plus profonde de ses principes et de ses méthodes.

THÉORIE STATISTIQUE DE L'INFORMATION

Le mot "information" est utilisé dans des contextes très variés, dans des sens totalement
différents suivants les disciplines scientifiques : nous pouvons à titre d'exemple citer la
thermodynamique avec le concept d'entropie, la physique appliquée avec la théorie du signal,
la biologie avec la théorie du génome et la physique quantique avec la probabilité d'obtenir de
l'information.

Se pose alors la question, s'il est possible de construire une théorie de l'information et si elle
est unique ? Notre démarche ici, ne vise non pas l'information en tant que telle, mais la
quantité d'information. Lorsque nous parlons de quantité et de mesure, nous pensons à la
notion de contenu ou de valeur de l'information. La science de l'information de par son objet
doit se sentir concernée par ce questionnement. Si nous définissons "l'infométrie" comme
l'ensemble des techniques de mesures mathématiques et statistiques de l'information, nous
souhaiterions avoir une définition suffisamment claire du concept de quantité d'informations
qui puisse nous amener à définir une mesure, c'est-à-dire un ensemble d'opérations
parfaitement définies, nous amenant à des axiomes clairs et dont le résultat est un nombre. La
synthèse que nous développons ici n'est pas ambitieuse.

Nous nous intéressons donc ici aux fondements la théorie statistique de l'information connue
également sous le nom de "théorie de Shannon". La formule de Shannon qui en ressort est
certainement un des concepts fondamentaux de toute la physique puisqu'elle touche la brique
irréductible de la physique : l'information !! Par ailleurs, certains physiciens tentent de
reformuler mathématiquement les postulats de la physique quantique à l'aide de la théorie de
Shannon (et cela semblerait être en bonne voie). Nous y reviendrons plus en détail lors de
l'étude de la physique quantique ondulatoire.

En mécanique statistique, nous montrerons (plus loin) qu'un système phyisque isolé à pour
état le plus probable, celui qui contient le plus d'états et qui est donc à fortiori le plus
imprévisible. Or, un l'état le plus improbable est donc celui qui est le plus prévisible. Dès lors,
puisque l’imprévisibilité apparaît comme un attribut essentiel de l’information, nous
identifions la mesure quantitative de l’information à son improbabilité.

Ainsi, la quantité d’information apportée par la réalisation d’un événement de

872/2001
Sciences.ch 14/03/2005

probabilité sera une fonction croissante de son improbabilité :

De plus, la réalisation de deux événements indépendants et apporte intuitivement une


quantité d’information qui est la somme de leurs quantités d’information respectives, soit :

La fonction logarithme est donc par ses propriétés une candidate naturelle pour telle que:

où est bien évidemment un nombre positif.

Remarques: le choix de la base du logarithme définit l’unité d’information qui est


complètement arbitraire. Par la suite, et sauf précision contraire, "log" désignera le logarithme
en base .

Ainsi, la "quantité d'information intrinsèque" d’un événement est donc de par les propriétés
du logarithme:

Elle peut être considérée, comme nous l’avons fait, comme une mesure d’incertitude sur
l’événement, ou comme celle de l’information nécessaire pour résoudre cette incertitude.

Définitions :

D1. Nous définissons "l’information intrinsèque par paire" de deux événements et de


probabilité conjointe (voir chapitre de probabilités et statistiques) :

D2. Nous définissons de même "l’information conditionnelle" de sachant par (voir le


chapitre de probabilités et statistiques) :

Il s’agit de la quantité d’information restant sur après l’observation de . La formule de


Bayes (voir le chapitre de probabilités et statistiques) nous permet de remarquer
immédiatement que si et sont indépendants:

873/2001
Sciences.ch 14/03/2005

ce qui concorde avec le sens commun.

Nous souhaitons aussi mesurer la quantité d’information que la donnée d'une variables, par
exemple , apporte sur l'autre, . C'est le cas en particulier lorsque nous identifions au
choix d'un signal appliqué à l'entrée d'un canal et au signal correspondant observé en sa
sortie. est alors la probabilité à fortiori que soit émis et la probabilité à
fortiori que ait été émis, sachant que a été reçu.

Une mesure de cette quantité d'information, nommée "information mutuelle" est :

il s’agit de la mesure logarithmique de l’accroissement de la probabilité de (donc la baisse


de sa quantité d’information) dû à son conditionnement sur . Si la donnée de est
équivalente à celle de (cas d’un canal parfait), elle est égale à l’information intrinsèque
. Elle est nulle si, à l’inverse, et sont indépendants.

Nous avons bien évidemment:

et de par les propriétés des logarithmes:

cette dernière égalité justifiant le terme "mutuelle". Alors que les informations intrinsèques
étaient positives, l’information mutuelle peut être négative. Nous verrons que sa moyenne,
beaucoup plus importante dans la pratique, ne peut l’être.

Les événements individuels étant généralement moins importants que les moyennes, nous
considérerons par la suite une source aléatoire, discrète, finie, stationnaire, et blanche (i.e. de
réalisations successives indépendantes). Les événements sont donc interprétés comme le
choix d’un symbole dans l’alphabet de la source. Soit la taille de cet alphabet, et
ses symboles. La source est donc décrite par la variable aléatoire , qui prend ses
valeurs dans l’alphabet, avec des probabilités respectives , telles que:

La quantité d’information moyenne de cette source est l’espérance de l’information


intrinsèque de chaque symbole de l’alphabet de la source (voir le chapitre de probabilités et
statistiques pour la définition de l'espérance). Elle est appelée "entropie" (par la notation) de
et vaut donc :

874/2001
Sciences.ch 14/03/2005

Cette relation étant appelée la "formule de Shannon".

Cette écriture constitue un abus de notation: en effet, l’espérance mathématique a un sens si


est une fonction de . Or ne dépend pas des valeurs de , mais seulement des
probabilités associées. Nous noterons parfois plus rigoureusement l’entropie d’une
distribution .

Les "entropies conjointes et conditionnelles" sont définies de manières similaires avec les
notations idoines :

et:

Il faut noter dans la dernière expression que l’espérance est effectuée dans l’espace produit, et
que donc le coefficient est la probabilité conjointe.

"L’information mutuelle moyenne," appelée par abus de langage "information mutuelle" se


définit elle aussi de manière directe:

Remarque: Il est à noter que la définition de la quantité d’information, par une mesure
logarithmique peut paraître arbitraire, quoique raisonnable, compte tenu des propriétés
attendues d’une telle mesure. Shannon, et plus tard Khintchine ont montré que compte tenues
de certaines propriétés posées en axiomes, la fonction logarithmique est la seule à convenir.

Exemple important et pratique avec l'entropie d’une variable binaire:

Soit une variable aléatoire binaire, valant 1 avec une probabilité (et donc 0 avec une
probabilité ). Son entropie vaut :

875/2001
Sciences.ch 14/03/2005

avec et avec un logarithme en base 2 tel que pour un événements à deux états
équiprobables, l'entropie d'obtention d'un des deux états soit égale à l'unité. Ceci dit, il vient
naturellement que .

Elle est représentée à la figure ci-dessous, en "Shannon" (unité correspondant à l'utilisation du


logarithme à base 2). On remarque sa symétrie par rapport à ½, valeur pour laquelle elle
atteint son maximum, égal à 1.

Entropie d’une variable binaire

Il convient maintenant de faire la liaison entre la théorie statistique de l'information et la


mécanique statistique :

LOI DE BOLTZMANN

Nous allons d'abord démontrer par l'intermédiaire d'un cas simple, que pour tout système,
l'état le plus probable est l'état d'équilibre !

Considérons un système isolé (un système est dit "isolé" lorsqu'il est imperméable à tout flux
– chaleur (adiabatique), matière, champs, …) peuplé de particules discernables. Ce
système est partagé en deux compartiments (ou niveaux) identiques et séparés d'une paroi
imperméable. Chaque compartiment est supposé contenir un nombre de particules.

Pour une configuration donnée du système, nous parlons de "macro-état" dans le sens où il est
possible de par la quantité de particules de mesurer une grandeur dite macroscopique tel que
l'énergie, la masse, la pression, etc.

Si nous fixons ce système particulier, il est bien sûr possible pour un nombre de particules
de concevoir un nombre donné de macro-états. Tel que :

- 1 particule : 2 macro-états (1 configuration par macro-état)

876/2001
Sciences.ch 14/03/2005

- 2 particules : 3 macro-états (4 configurations possibles par permutation des compartiments)

- 3 particules : 4 macro-états (8 configuration possibles par permutations des compartiments)

- 4 particules : 5 macro-états (16 ")

etc.

Définition : nous appelons "micro-état", une configuration de permutation du macro-état.

Remarque : parfois au lieu de "micro-état" nous trouvons dans la littérature "probabilité


thermodynamique" ou "complexions".

Déterminons maintenant à l'aide de l'analyse combinatoire (voir chapitre de probabilités et


statistiques) le nombre de micro-états possibles pour chaque macro-état. Par analogie, ceci
correspond à s'imaginer que le système est une tige par laquelle sont enfilées des boules
(particules) et que la tige est séparée par une frontière imaginaire en un des ses points (boulier
chinois). Pour une telle situation, nous avons :

Ceci nous donne tous les arrangements possibles des particules "gauches" avec les particules
"droites" (de la frontière) pour un macro-état donné (le nombre de manières dont les particules
peuvent se partager entre les deux compartiments). Mais nous avons aussi dans ce cas
particulier :

Or cela correspond à la combinatoire tel que :

et donc :

Nous avons finalement pour tous les macro-états d'un système de particules, un total de :

micro-états (configurations) possibles. Or, nous avons bien vu dans l'exemple initial que :

877/2001
Sciences.ch 14/03/2005

Ainsi, la probabilité d'existence d'un micro-état donné est de et elle est équiprobable !!

Nous pouvons maintenant énoncer le premier postulat de la mécanique statistique (postulat de


Gibbs) : tous les micro-états discernables et accessibles d'un système isolé sont équiprobables.

Revenons-en maintenant à notre question initiale sur l'équilibre :

La notion d'équilibre associé à un macro-état nous est fournie par la thermodynamique


classique. Nous y voyons qu'un système est dit à l'équilibre lorsque son état est caractérisé par
l'indépendance temporelle des grandeurs macroscopiques (masse, énergie, pression, …) et de
la constance des potentiels thermodynamique (énergie interne, enthalpie, énergie de Gibbs,
…).

Pour savoir pourquoi l'équilibre est l'état le plus probable, il nous suffit de chercher quel est le
couple qui maximise :

puisque tous les micro-états sont de toute façon équiprobables. Il est facile de contrôler que ce
maximum est donné pour :

Nous pouvons dès lors énoncer le deuxième postulat de la mécanique statistique : l'état
d'équilibre est l'état qui correspond au plus grand nombre de configurations (micro-états) et
est l'état le plus probable.

Soit maintenant à considérer le système suivant :

878/2001
Sciences.ch 14/03/2005

La fonction de distribution qui décrit la position des particules selon l'axe à l'équilibre
va évoluer vers une autre fonction de distribution correspondant au nouvel équilibre
. À l'équilibre est constante. Mais entre les deux équilibres, elle évolue, et devient de
plus en plus large. Nous perdons donc de l'information sur la position des particules. Nous
pouvons donc ré-énoncer le deuxième postulat en disant qu'un système hors d'équilibre évolue
toujours dans le sens d'une perte d'informations (d'un élargissement de la fonction de
distribution caractéristique).

Parallèlement, le deuxième principe de la thermodynamique classique nous indique que cette


toute évolution naturelle doit nécessairement correspondre à un accroissement d'entropie
. Il doit donc exister un lien étroit entre l'information que nous possédons sur l'état de
chacune des particules et l'entropie du système.

Le cas que nous venons de décrire montre clairement que les paramètres ou concepts : nombre
de configurations, désordre, équilibre, quantité d'information et entropie d'un système isolé
servent à représenter l'état d'un système. Ces paramètres jouent le même rôle. Des relations
mathématiques doivent donc les relies les unes aux autres.

Rappelons que nous avons démontré que l'entropie statistique infométrique d'un système est
donnée par :

Si nous appliquons cette relation au cas d'un système physique en équilibre pour lequel nous
souhaitons calculer l'entropie, nous avons démontré :

879/2001
Sciences.ch 14/03/2005

Il nous faut encore savoir à quoi correspond cette probabilité constante. Nous avons démontré
précédemment qu'à l'équilibre, nous avions :

qui est donc le nombre de micro-états à l'équilibre. Ainsi, la probabilité de tirer un micro-état
parmi tous est de :

que nous notons, dangereusement par tradition simplement :

Nous avons ainsi :

Comme les probabilités des micro-états sont équiprobables et que nous sommons sur
l'ensemble de ces derniers, il vient :

et donc :

Puisque l'équilibre est liée au désordre maximum, que le désordre est lié à l'information
manquant, il paraît raisonnable de relier l'entropie statistique de l'information à l'entropie
statistique thermodynamique. Pour cela, il faut que la constante nous permette d'obtenir les
bonnes unités et il vient naturellement de choisir cette constante telle qu'elle soit égale à la
constante de Boltzmann qui a les mêmes unités que l'entropie thermodynamique. Ainsi :

Il nous faut encore choisir la base du logarithme. L'expérience montre qu'il faut choisir le
logarithme néperien qui permet de retrouver des résultats de la mécanique classique après
développements.

880/2001
Sciences.ch 14/03/2005

Ainsi, nous obtenons finalement la loi de Boltzmann :

Qui nous donne l'entropie thermodynamique d'un système à l'équilibre !

De par les propriétés mathématiques de l'écart-type, nous avons pour un ensemble de sous-
systèmes :

Et l'énergie interne de l'ensemble système étant alors :

DISTRIBUTIONS STATISTIQUES PHYSIQUES

Nous distinguerons quatre différentes statistiques qui proviennent ou non d'effets quantiques
et qui conduiront à quatre distribution distinctes connues. Ce sont les distributions de
Maxwell, Maxwell-Boltzmann, Fermi-Dirac et de Bose-Einstein. Elles trouvent de
nombreuses applications en physique comme le rayonnement du corps noir qui sera démontré
dans le chapitre de thermodynamique.

DISTRIBUTION DE MAXWELL (distribution des vitesses)

Pour un gaz en état d’équilibre, posons la question suivante. Quelle probabilité existe qu’une
molécule ait ses composantes de vitesse comprise entre et , et , et
dans un repère cartésien habituel ?

Cette probabilité dépend de (c’est à dire : ) et de . Elle ne


dépend pas de la position de la molécule puisque le gaz est supposé à l'équilibre par rapport à
son centre de masse.

Nous postulons dans un premier temps que est proportionnelle à chacun des intervalles
tel que :

et qu'il n’y a pas de directions privilégiées. Nous pouvons faire une rotation circulaire des
axes cartésiens, la probabilité sera inchangée (isotropie de l’espace).

L'isotrope amène que la fonction ne dépend pas du vecteur , au mieux elle dépend de
la norme de cette vitesse, tel que :

881/2001
Sciences.ch 14/03/2005

Soit la probabilité pour une molécule d’avoir sa composante suivant l’axe comprise
entre et alors :

de même :

L’isotropie de l’espace impose :

La loi des probabilités composées implique :

Déterminer les fonctions et relève de la méthodologie mathématique suivante :

Puisque :

Ce qui nous donne finalement :

Le membre de gauche de la dernière égalité dépend uniquement de , celui de droite


uniquement de . Le résultat ne peut être qu’une constante que nous noterons . Il suit
que :

En intégrant :

882/2001
Sciences.ch 14/03/2005

Donc :

et posons . Il vient donc :

Donc identique :

La loi des probabilités composées impliquant :

Nous avons finalement :

Remarquons que est nécessairement négatif sinon la probabilité pour une molécule d’avoir
une composante de vitesse infinie serait infinie ce qui voudrait dire que toutes les molécules
seraient à vitesse infinie et que l’énergie serait infinie !!!

Nous posons :

avec

Finalement, il vient que :

Il nous reste à normaliser . La probabilité pour une molécule d'avoir une composante de
vitesse comprise entre ou une intensité de vitesse comprise entre est égale
à (100% de chances).

Ainsi :

883/2001
Sciences.ch 14/03/2005

Nous avons jusqu'ici parlé en terme de probabilités. Un langage équivalent consiste à


chercher, dans une enceinte contenant molécules, le nombre de molécules ayant
certaines caractéristiques, à savoir par exemple, le nombre de molécules ayant une
composante de vitesse comprise entre et . Ce nombre étant bien évidemment égal
dans une dimension à :

Plus généralement :

Pour obtenir nous nous plaçons dans l’espace des vitesses c’est-à-dire un repère cartésien
de coordonnées . Les composantes ne sont pas indépendantes puisque
liées par la relation : .

L’extrémité des vecteurs vitesse ayant une intensité de vitesse , c’est à dire des
composantes de vitesse liée par la relation ci-dessus, se trouve dans l’espace des vitesses sur
la sphère de rayon . Il en sera de même pour l’extrémité des vecteurs vitesse ayant une
intensité .

Dans l’espace des vitesses, nous délimitons une portion d’espace comprise entre la sphère de
rayon et la sphère de rayon , de volume égale à .

La probabilité est proportionnelle à c’est-à-dire au volume élémentaire dans


l’espace de vitesse. Pour obtenir , nous devons intégrer à tous les vecteurs vitesse
possibles c’est à dire ayant leur extrémité entre les deux sphères. Cette intégration est
particulièrement simple puisque l’intensité de la vitesse dans cette espace (inter-volume) est
constante. Nous obtenons donc :

et ainsi, dans une enceinte contenant molécules, le nombre de molécules ayant un


module de vitesse compris entre et est :

Rappel : La valeur moyenne d’une grandeur est le produit de multipliée


(pondérée) par la probabilité d’obtenir intégré à toutes les valeurs possibles de cette
grandeur telle que :

884/2001
Sciences.ch 14/03/2005

Donc :

ou

La thermodynamique, ou la mécanique des fluides (voir théorème du Viriel) nous donne pour
un gaz parfait monoatomique, de capacité calorifique et volume constant :

Si nous formulons l’hypothèse que la partie de l’énergie liée à la température est due à
l’agitation cinétique des molécules, nous pouvons écrire :

et donc :

Ainsi, nous avons finalement :

Qui est donc la distributin des vitesses dans un gaz monoatomique.

DISTRIBUTION DE MAXWELL-BOLTZMANN (non corrigée)

En physique quantique corpusculaire, nous apprenons que l’énergie d’une particule est
quantifiée, c’est à dire que les valeurs possibles pour l’énergie forment un spectre discret.
Même si, dans un certain nombre de situations courantes, pour une particule et encore plus
pour un système constitué d’un grand nombre de particules, les niveaux d’énergie sont si
serrés que nous pouvons traiter, sur le plan mathématique, ce spectre comme continu, il
n’empêche qu’en toute rigueur ils sont quantifiés.

Une particule, ayant un niveau d’énergie , peut être dans différents sous-états.

Nous savons (nous n’avons pas utilisé l’équation de Schrödinger en physique quantique
corpusculaire pour le montrer strictement) que, pour décrire un atome, nous introduisons

885/2001
Sciences.ch 14/03/2005

quatre nombres quantiques, à savoir :

- le nombre quantique principal qui quantifie l’énergie,

- le nombre quantique secondaire qui quantifie le moment cinétique

- le nombre quantique magnétique qui quantifie le moment magnétique

- le spin qui quantifie la rotation propre des électrons de l’atome

Ainsi pour une même énergie (pour une valeur particulière du nombre quantique principal),
un atome peut posséder différentes valeurs des nombres quantiques secondaire, magnétique
ou de spin.

Pour qualifier la possibilité de sous-états correspondant à une même énergie, nous employons
l’expression "dégénérescence" et nous traduisons par la variable le nombre de
dégénérescences correspondant à un même niveau d’énergie .

Nous allons considérer un système composé de particules qui se placent sur différents
niveaux d'énergie . Nous trouvons particules sur le niveau d'énergie . Nous avons les
relations suivantes pour l'énergie totale (que nous notons par la même lettre que celle utilisée
en thermodynamique) et pour le nombre de particules (même remarque que pour l'énergie
totale) :

Nous supposerons (c'est important) ces quantités constantes. Le système est entièrement
déterminé par la distribution des particules sur les niveaux.

Il existe un grand nombre de configurations microscopiques possibles qui sont compatibles


avec la distribution . Il y en a (voir les permutations avec répétition dans le chapitre de
probabilité et statistiques) :

Mis nous avons négligé la dégénérescence possible des niveaux . S'il existe sous-niveaux
dont l'énergie est , nous avons alors trivialement :

En prenant le logarithme, il vient :

886/2001
Sciences.ch 14/03/2005

et en utilisant la formule de Stirling (voir le chapitre des algorithmes dans la section d'analyse
numérique) :

Nous avons :

Nous recherchons maintenant la distribution la plus probable, c'est-à-dire celle qui maximise
. Pour trouver l'extremum, nous allons différencier cette expression tel que :

Or, comme :

où sont des constantes qui permettent de s'assurer de la cohérence de l'analyse


dimensionnelle (des unités quoi...).

Il est donc équivalent et nécessaire d'écrire pour prendre en compte également ses paramètres
intrinsèques (le fait d'ajouter ainsi des termes nuls est nommé "méthode des multiplicateurs de
Lagrange"):

Donc :

ce qui donne après une première simplification (élimination simple de la dérivée des
constantes):

887/2001
Sciences.ch 14/03/2005

Ce qui nous amène à écrire :

Ce qui nous donne finalement :

Mais cela équivaut aussi à rechercher :

d'où :

Rappelons que nous avons pour l'entropie de ce système :

et donc :

et comme :

888/2001
Sciences.ch 14/03/2005

Nous avons donc :

La thermodynamique (voir chapitre du même nom) nous conduit à :

Or, si toutes les particules sont identiques donc :

Ce qui finalement conduit à :

Ce qui nous amène à :

et donc :

et

Nous pouvons donc récrire la relation de Maxwell-Boltzmann :

Comme , nous avons :

Nous pouvons alors calculer et nous obtenons ainsi :

889/2001
Sciences.ch 14/03/2005

Nous appelons le terme au dénominateur, la "fonction de partition canonique". Elle est le plus
souvent notée tel que :

DISTRIBUTION DE FERMI-DIRAC

Le principe d'indiscernabilité peut avoir des conséquences très importantes sur la statistique.
Nous distinguons deux types de particules indiscernables : les bosons et les fermions.

Rappels :

R1. Les premiers correspondent à des particules dont la fonction d'onde représentative est
toujours symétrique alors que celles des fermions est antisymétrique.

R1. Le principe d'exclusion de Pauli impose que 2 fermions ne peuvent pas se trouver dans le
même état quantique. Les bosons, eux le peuvent !

Leurs propriétés respectives ont pour conséquence importante que l'énergie minimale d'un
ensemble de bosons est égale à fois l'énergie minimale de chaque boson. Alors que pour
un ensemble de ferions, l'énergie minimale est égale à la somme des énergies les plus
faibles.

Ces deux types de particules entraînent deux types de statistiques : la statistique de Fermi-
Dirac (que nous allons démontrer en premier) et la statistique de Bose-Einstein (qui suivra).

Il n'existe donc qu'une seule manière de répartir fermions sur les états d'énergies
accessibles (au lieu des pour les particules discernables). Il ne peut pas y avoir plus de
particules dans un niveau d'énergie qu'il existe de dégénérescence . Donc
. Le nombre de combinaisons possible pour un niveau , dégénéré fois et
comportant particules est donc la combinatoire . Le nombre total de configurations est
donc :

La statistique est donc bien différente du cas classique de Maxwell-Boltzmann. En prenant le


logarithme du nombre de micro-états et en faisant usage de la formule de Stirling, il vient :

890/2001
Sciences.ch 14/03/2005

Que nous pouvons déjà simplifier une première fois :

et en différenciant cette expression pour trouver le maximum, nous obtenons :

Terme à terme :

Or, nous avons par conservation et par symétrie :

Donc finalement :

Pour respecter les contraintes sur l'énergie et le nombre de particules, nous utilisons encore
une fois la méthode des multiplicateurs de Lagrange :

Ce qui nous amène à la distribution de Fermi-Dirac :

Les paramètres et jouent le même rôle que dans la distribution de Maxwell-Boltzmann.


Nous avons ainsi :

891/2001
Sciences.ch 14/03/2005

et

La distribution s'écrit alors :

La principale application aux solides de cette statistique est la modélisation des phénomènes
de transport électronique (gaz d'électrons) : théorie des métaux, des semi-conducteurs
(population des niveaux d'énergie et propriétés de conduction).

DISTRIBUTION DE BOSE-EINSTEIN

Les bosons sont d'autres particules quantiques qui peuvent indistinctement se placer sur tous
les niveaux d'énergie. Le principe de Pauli ne s'applique pas. Dans ce cas, le nombre d'objet à
permuter est (les particules et les intervalles entre les niveaux). Parce que
les particules sont indiscernables et les niveaux et sous niveaux permutables, il faut diviser par
puis aussi par Le nombre de configurations sur un niveau , fois dégénéré
qui contient particules indiscernables est ainsi égal à :

Son logarithme avec usage de la formule de Stirling et après simplification est donné par :

Le maximum de correspond à annuler , soit :

Pour respecter les contraintes sur l'énergie et le nombre de particules, nous utilisons encore
une fois la méthode des multiplicateurs de Lagrange :

et donc :

qui est la distribution statistique de Bose-Einstein. Cette distribution diverge lorsque


. C'est la "condensation" de Bose-Einstein. Dans cet état, tous les bosons se

892/2001
Sciences.ch 14/03/2005

retrouvent dans le même état.

Les paramètres et jouent le même rôle que dans la distribution de Maxwell-Boltzmann


et Fermi-Dirac. Nous avons ainsi :

et

La distribution s'écrit alors :

La statistique de Bose-Einstein est utile à la compréhension des phénomènes


électromagnétiques ondulatoire car les photons sont des Bosons (rayonnement du corps noir,
interaction matière/rayonnement). Elle est très largement utile à l'étude des phénomènes
vibrationnel dans les solides (les phonons suivent la statistique de Bose-Einstein). Elle a aussi
été utilisée pour expliquer les transitions de phase dans l’Hélium (phénomène à très basse
température).

893/2001
Sciences.ch 14/03/2005

THERMODYNAMIQUE

La mécanique thermique (ou "thermodynamique") est la partie de la physique qui traite des
relations entre la mécanique, la chaleur et les transformations chimiques (d'où parfois une
distinction claire avec la thermodynamqique chimique) et la chaleur. À l'origine cette science
vient de l'étude des échanges thermiques des machines à vapeur du début du 19ème siècle.
Encore aujourd'hui, et cela en est fort regrettable, l'origine de la thermodynamique se fait
toujours ressentir de par la référence dans les écoles à ses affreux exemples (pistons,
détentes,...) qui ne sont d'aucune aide pratique (pour les étudiants) de par leur ancienneté et
rébarbatifs aux bon élèves théoriciens de peur leur particularié. Cette science a également
pour désavantage d'avoir un total manque de cohérence encore à ce jour dans la rigueur des
définitions, de la structure de présentation (ainsi, il nous semble indispensable de devoir
d'abord étudier la mécanique statistique avant la thermodynamique) et des outils
mathématiques dont il est fait usage.

Il convient cependant d'informer le lecteur qu'il existe plusieurs types de thermodynamique à


notre connaissance :

- La thermodynamique classique

- La thermodynamique chimique (voir la section de chimie)

- La thermodynamique relativiste (voir chapitre d'astrophysique)

- La thermodynamique statistique (classique et relativiste)

- La thermodynamique quantique (superfluides)

Pour l'instant, nous nous atterderons que sur la première.

Au risque de choquer nombre de lecteurs, nous assumons d'aborder la thermodynamique sur


ce site d'une manière nouvelle telle que nous ne l'avons jamais vu dans aucun autre ouvrage
(ce qui ne veut pas dire que cela n'a jamais été fait ailleurs déjà peut-être). Nous abandons
toute analogie aux cylindres et autres exemples pratiques ainsi que les représentations
graphiques des variables d'état qui n'ont pas leur place dans un site traitant de la physique
théorique. Les critiques et propositions d'améliorations sont donc la bienvenue.

Rappels :

R1. Nous ne reviendrons pas sur la définition de la température notée qui est comme nous
l'avons vu en mécanique des milieux continus (théorème du Viriel) et en mécanique
statistique (rayonnement du corps noir, distributions d'états), est un paramètre qui permet de
relier avantageusement le mouvement moyen de différents corps avec leur énergie cinétique
(sous-entendu leur "excitation" ou "désordre") ou le rayonnement de certains corps avec leur
énergie d'émission.

R2. Nous ne reviendrons également pas sur la définition du concept "d'énergie" et de ses
différentes formes (mis à part la "l'énergie chaleur" que dont nous devons encore démontrer
l'existence dans ce chapitre) et la conservation de cette dernière qui a été largement exposée
dans le chapitre traitant des principes fondamentaux (premiers) de la physique.

894/2001
Sciences.ch 14/03/2005

Remarque : il est très fortement conseillé (voire obligatoire) avant de parcourir ce qui va
suivre, de lire la partie du site (chapitre de calcul différentiel et intégral) traitant des formes
différentielles. Ceci au risque de ne pas comprendre les calculs que nous allons faire et la
provenance des notations dont nous allons faire usage.

Postulats :

P1. Nous postulons que tout système fermé peut au point de vue énergétique être décrit (dans
le repère de son centre de masse) entièrement par son volume , sa pression , sa
température (qui implique la connaissance de l'entropie dans les systèmes régis par la
mécanique statistique), sa masse et les propriétés (chimiques et physiques) de ses
constituants (ce qui implique la connaissance du nombre de ceux-ci).

P2. Nous postulons que tout système ouvert (dans un repère quelconque) peut au point de vue
énergétique être décrit par les paramètres du premier postulat plus par la connaissances de
tous les facteurs agissant depuis l'extérieur du système pour modifier l'état de celui-ci (champ
gravifique, champ électrostatique/magnétique, forces mécaniques, ...)

Définitions :

D1. Un système, ou un corps est dit "macroscopique" (inversement "microscopique") si nous


ne ne pouvons appliquer à l'échelle de celui-ci, les résultats de la mécanique statistique
(probabilité, distribution, désordre,...)

D2. Nous définissons "l'énergie interne" d'un système, par la somme de tous les types
d'énergie pertinents qui le distinguent tel que : le travail (voir la défintion D3 plus loin), la
chaleur (voir la définition D4 plus loin), l'énergie de masse (quand elle est spécifiée... ce
qui est rarement le cas en thermodynamique classique) et tout autant d'autres que nous
pourrions choisir étant donné les paramètres sous-jacents à ceux énoncés (entropie, pression,
volume, température, potentiel chimique, etc.).

Il convient de remarquer que nous différencions "l'énergie totale" utilisée en mécanique


classique par "l'énergie interne" utilisée en thermodynamique, dans le sens où la première fait
souvent référence uniquement à l'énergie potentielle et cinétique d'un système (en omettant de
préciser les autres types pertinentes - mais non différentes - d'énergie comme le potentiel
chimique, l'énergie de masse... et autres).

D3. Le "travail", noté est dans le cadre de la thermodynamique, l'énergie associée à la


valeur ou au changement de la dynamique d'un système ou d'un corps macroscopique de par
l'agissement de forces diverses (champs de force (champ gravifique, électrostatique,
magnétique,...), forces mécaniques, ...)

D4. La "chaleur", notée est dans le cadre de la thermodynamique, l'énergie associée à la


valeur ou au changement de la dynamique ou d'un système (ensemble) composé de corps
microscopiques de par l'agissement de forces diverses (autres que mécaniques donc !).

895/2001
Sciences.ch 14/03/2005

D5. "L'entropie", notée est donnée par les développements que nous avons fait dans le
chapitre de mécanique statistique (ce n'est donc pas une définition mais un rappel !!!) . Elle
mesure le désordre d'un système à l'équilibre (ou entre deux équilibres) et est dépendante
comme nous l'avons vu en mécanique statistique dans le cadre d'un système composé de corps
microscopiques, de la température. Ce dernier constat nous amène naturellement à devoir à
l'avenir rechercher une relation entre chaleur, température et entropie (voir plus loin).

D6. Le "potentiel chimique" est un paramètre d'un système thermodynamique régit par les
règles probabilistes de la mécanique statistique qui exprime une variation interne d'énergie
d'un système dû uniquement au nombre des composants qui le constitue.

D7. "L'enthalpie", notée est un concept pratique dont l'origine et la significationsera


démontrée et expliquée plus loin.

D8. "L'énergie libre de Gibbs", notée est un concept pratique (dans le sens où ce n'est pas
une entité à part mais juste une façon de décrire un cas particulier de système) introduit par les
thermodynamiciens pour exprimer une variation d'énergie interne d'un système régi par la
mécanique statistique dû aux variations de sa température , de sa pression , et du nombre
de ses constituants à entropie , volume et potentiel chimique constants.

D9. "L'enthalpie libre", notée est un concept pratique (dans le sens où ce n'est pas une
entité à part mais juste une façon de décrire un cas particulier de système) introduit par les
thermodynamiciens pour exprimer une variation d'énergie interne d'un système régi par la
mécanique statistique dû aux variations de sa température , de son volume , et du nombre
de ses constituants à entropie , pression et potentiel chimique constants.

SYSTÈMES THERMODYNAMIQUES

D'une manière générale, un système thermodynamique est l'ensemble des corps situés à
l'intérieur d'une surface fermée que nous appelons "frontière" et que nous notons . La
frontière est en général une surface géométrique imaginaire. Toutefois, rien ne s'oppose à ce
qu'elle coïncide avec une surface réelle, matérialisée par exemple par une paroi solide. La
frontière peut être "indéformable" ou "déformable". Quand elle est indéformable, nous
pouvons distinguer si elle est fixe ou mobile par rapport à un repère déterminé. Quand elle est
déformable, cette distinction n'a plus de sens. Enfin, signalons que la frontière peut se limiter
à une surface élémentaire enveloppant une particule fluide. Nous l'appelons dans ce cas
"frontière particulaire".

Il est souvent intéressant en thermodynamique, de faire le bilan des énergies qui sont
transférées entre le système thermodynamique et le milieu extérieur, c'est-à-dire de considérer
tout ce qui traverse la frontière . Les principaux transferts susceptibles d'être opérés sont les
suivants:

1. Transfert-travail (travail effectué par une force sur une distance)

896/2001
Sciences.ch 14/03/2005

2. Transfert-chaleur (énergie provenant de la variation du nombre de micro-état d'un


système régit par la mécanique statistique comme nous le démontrerons plus loin)

3. Transfert de masse

Définitions :

D1. Quand aucun transfert-travail n'est opéré, le système est dit "sans travail". Dans le cas
contraire, il est dit "avec travail".

D2. Quand aucun transfert-chaleur n'est opéré, le système est dit "adiabate". Dans le cas
contraire, il est dit "non adiabate".

D3. Quand aucun transfert de masse n'est opéré, le système est dit "fermé". Dans le cas
contraire, il est dit "ouvert".

D4. Quand il n'y a ni transfert-travail, ni transfert-chaleur, ni transfert de masse, le système est


dit "isolé" .

Remarques :

R1. Il n'empêche que certains systèmes voient le bilan des actions extérieures qui leurs sont
appliquées nul. Ils sont alors dit "pseudo-isolés".

R2. Pour ce qui est de ses constituants, un système est "homogène" si la nature de des
constituants est égale en tout point, alors qu'il est "uniforme" ou "isotrope" si ses
caractéristiques sont égales en tout point.

Conventions : les conventions adoptées sont les conventions habituelles à savoir :

- Nous noterons la frontière d'un système, et l'élément de surface de cette frontière


orientée par la normale sortante à

- Les différentes types d'énergie échangées avec le milieu extérieur seront affublées quand il
peut y avoir confusion, d'un signe positif lorsqu'elles seront reçues par le système
et négatif, dans le cas contraire.

VARIABLES D'ÉTAT

L'état thermodynamique d'un système est l'ensemble des propriétés qui le caractérisent,
indépendamment de la forme de sa frontière. Les variables qui décrivent l'état du système sont
appelées "variables d'état" ou "grandeurs d'état".

La définition précédente suppose implicitement l'existence d'un état et des variables d'état,
c'est-à-dire que les grandeurs caractéristiques du système sont définies (ou théoriquement
accessibles dans le sens de la mesure) à tout instant et en tout point du système. Ceci est loin
d'être évident si nous considérons des évolutions rapides telles que chose ou explosions. Cette
difficulté peut être éludée en se retranchant sur "l'hypothèse de l'état local".

Énoncé : nous supposons qu'à tout instant, les grandeurs caractéristiques ont localement les

897/2001
Sciences.ch 14/03/2005

mêmes expressions que dans une configuration stationnaire, ce qui sous entend que les temps
nécessaires aux changements d'état sont négligeables devant les durées caractéristiques de
l'évolution.

Le choix des variables d'état dépend de la nature du problème traité. Nous pouvons
néanmoins séparer l'ensemble de ces variables d'état en :

- variables d'état dites "extensives", proportionnelles à la quantité de matière du système


servant à les définir (dont elles sont additives). Exemples : la masse, le volume, ...

- variables d'état dites "intensives", indépendantes de la quantité de matière (donc par


extension, non additives). Exemples : la pression, la température, ...

D'une manière générale, une variable intensive dépend du point envisagé dans le système
étudié (température, concentrations, peuvent varier d'une point à l'autre) alors que la grandeur
extensive est définie sur la globalité du système.

Par l'exemple, montrons que le rapport de deux variables extensives est un grandeur intensive.
Rappelons la loi de Boyle-Mariotte (approximation de l'équation de Van der Waals démontrée
en mécanique statistique) :

Nous pouvons calculer la concentration (à ne pas confondre avec la notation de la capacité


calorifique que nous verrons plus loin), qui est une grandeur intensive donc, par le rapport de
deux grandeurs extensives , :

Définition : un système dans lequel les différentes grandeurs intensives varient de façon
continue constitue une seule "phase".

Nous pouvons donc considérer que toute grandeur intensive dépend des coordonnées du
point envisagé soit : le système est constitué par une seule phase si est
continue quand décrit tout le système. C'est le cas des gaz, des liquides et de certains
solides constituant des solutions solides.

Si présente une discontinuité (ou plusieurs), le système est dit "polyphasique").


Cepenant, si les grandeurs intensives ont même valeur en tout point du système, la
phase est dite uniforme : le système a alors même température, pression, composition en
chacun de ses points.

Pour un système homogène, il peut être commode de ramener les variables extensives à l'unité
de masse. Nous parlons alors de "grandeurs massiques" (ou "spécifiques"), généralement
notées en minuscules.

898/2001
Sciences.ch 14/03/2005

Nous utilisons les règles de notation suivantes :

- toute grandeur non massique est représentée par une lettre latine majuscule romaine

- toute grandeur massique est représentée par une lettre latine minuscule

LOIS D'ÉTAT

Une "loi d'état" (ou "relation de comportement" ou encore "fonction d'état") est une relation
entre les variables d'état du type :

L'ensemble des variables d'état peut comporter des variables utiles mais non nécessaires à la
description de l'état du système. Nous définissons alors un jeu de variables indépendantes,
nécessaires, auxquelles sont adjointes les variables complémentaires, fonctions des variables
indépendantes.

Le nombre de variables indépendantes définit alors ce que nous appelons la "variance du


système".

Par exemple, pour le cas d'un système particulier dont la loi d'état est de la forme :

le système est dit bivariant et nous pouvons indifféremment choisir l'un des couples de
variables indépendantes :

TRANSFORMATION THERMODYNAMIQUE

Une transformation thermodynamique est l'opération au cours de laquelle l'état du système se


modifie en pssant d'un état initial à un étant final. Un système peut ainsi subir une seule
transformation (1 à 2) ou parcourir une suite de transformations (1à 2 / 2 à 3 / 3 à 4 / etc.). Les
transformations sont caractérisées par des dénominations précisant leur nature. Dans le cas
général, la transformation est telle que toutes ses variables d'état changement simultanément.
La transformation est alors dite "polytropique".

Il est possible que certaines variables d'état restent constantes lors d'une transformation
thermodynamique, dans ce cas nous distinguons les cas suivants :

- Quand le système a un volume constant pendant la transformation, nous disons qu'il s'agit
d'une transformation "isochore"

- Quand le système a une pression constante pendant la transformation, nous disons qu'il s'agit
d'une transformation "isobare"

- Quand le système a une température constante pendant la transformation, nous disons qu'il
s'agit d'une transformation "isotherme"

899/2001
Sciences.ch 14/03/2005

- Quand le système a une énergie constante pendant la transformation, nous disons qu'il s'agit
d'une transformation "isoénergétique".

- Quand le système a une enthalpie constante, nous disons que la transformation est
"isenthalpique".

- Quand le système a une entropie constante, nous disons que la transformation est
"isentropique"

Remarque : si une transformation adiabatique est "réversible" elle alors isentropique

Dans les types de transformations thermodynamique nous en distinguons deux principaux :

1. Le cycle thermodynamique fermé : le système décrit une suite de transformations telle que
l'état final et l'état initial de la transformation est identique et que la quantité et les propriétés
des éléments participants au cycle sont toujours les mêmes.

2. Le cycle thermodynamique ouvert : le système décrit une suite de transformations telle que
l'état final et l'état initial de la transformation est identique et que la quantité et les propriétés
des éléments participants au cycle ne sont pas toujours les mêmes.

PRINCIPES DE LA THERMODYNAMIQUE

Les principes de la thermodynamique sont les briques de la mécanique énergétique ou


thermique (thermodynamique) elles sont censées être indémontrables et sont très souvent
présentées telles quelles (mais au fait nous les avons démontrées en partie en mécanique
statistique). Chaque principe implique une grande quantité de concepts que nous essaierons de
présenter et définir au mieux. C'est la partie "sensible" de ce domaine de la physique et le
lecteur ne doit en aucun cas hésiter à contacter les responsables du site si quelque chose leur
semble flou ou discutable.

Remarque : nous aborderons la forme mathématique des principes énconcés ci-après un peu
plus loin dans le texte.

PRINCIPE ZÉRO

P0. Le "principe zéro", qui concerne la notion d'équilibre thermique.

Énoncé : si deux systèmes thermodynamiques 1 et 2 sont en équilibre thermodynamique avec


un troisième 3, ils sont eux-mêmes en équilibre thermodynamique.

Remarque : nous avons démontré en mécanique statistique que l'état d'équilibre est l'état le
plus probable d'un système fermé

PRINCIPE PREMIER (PRINCIPE D'ÉQUIVALENCE)

P1. Le "premier principe" ou "principe d'équivalence", qui concerne le caractère conservatif


de l'énergie.

Énoncé : pour faire passer un système thermodynamique, adiabate (sans échange de chaleur )
et fermé (sans échange de masse), d'un état déterminé 1 à un autre état déterminé 2, il faut

900/2001
Sciences.ch 14/03/2005

mettre en jeu avec le milieu extérieur (dès lors le système n'est plus fermé ni adiabate) une
certaine énergie.

Cette énergie peut suivant les cas (et il faut alors le déterminer et le démontrer!), être
dépendante ou indépendante des états intermédiaires compris entre l'état 1 et 2.

PRINCIPE DEUXIÈME

P2. Le "deuxième principe" ou "principe de Carnot", qui concerne le caractère d'irréversibilité


et le concept d'entropie.

Énoncé :

PRINCIPE TROISIÈME

P3. Le "troisième principe" ou "principe de Nernst", qui concerne les propriétés de la matière
dans le voisinage du zéro absolu.

Énoncé :

LES FLUIDES

En thermodynamique, afin de permettre l'approche théorique simple des phénomènes ainsi


que le calcul des applications pratiques que les transvasements de matière ou modification
d'état de la matière sont approchés par :

1. les fluides (liquides ou gaz) parfaits

2. les fluides (liquides ou gaz) semi-parfaits

3. les fluides (liquides ou gaz) réels

Remarque : nous pourrions préciser également l'existence des "super-fluides" mais qui font
plutôt l'objet de la thermodynamique quantique.

Une fluide étant essentiellement caractérisé par les trois propriétés suivantes :

P1. Sa composition chimique

P2. Son état physique (solide/liquide/gazeux)

P3. Sa masse

Avant de voir les propriétés des trois fluides énoncés précédemment, il convient de définir le
mieux possible les différentes capacités d'une fluide à échanger de la chaleur.

CAPACITÉ CALORIFIQUE, CHALEUR SPÉCIFIQUE, MASSIQUE, MOLAIRE OU


LATENTE

Dans une transformation donnée, un apport de chaleur se traduit en général par une
élévation de la température du système. Nous appelons "capacité calorifique " du

901/2001
Sciences.ch 14/03/2005

système, la quantité :

Remarque : cette capacité n'est pas constante elle dépend bien évidemment de la température.
Mais la thermodynamique considère parfois certains fluides pour lesquels ce n'est pas le cas
(voir plus loin).

En thermodynamique, il faut toujours préciser quelle est la transformation considérée car


dépend de la nature de cette transformation. Nous distinguerons en particulier la capacité
calorifique à volume constant :

et la capacité calorifique à pression constante (isobare) :

Si au lieu de considérer le système entier, nous rapportons les mesure à une unité de masse,
nous définirons la "chaleur spécifique massique" à volume constant (isochore) :

et la chaleur spécifique massique à pression constante (isobare) :

Si au lieu de considérer le système entier, nous rapportons les mesures à une mole du corps
considéré nous définissons les chaleurs spécifiques molaire ( étant le nombre de moles du
système), nous définissons le "chaleur molaire" à volume constant (isochore) :

et la chaleur molaire à pression constante (isobare) :

Dans certaines transformations, nous avons un apport ou un retrait de chaleur alors que la
température du système reste constante (par exemple dans les transformations de changement
de phase d'un corps). Nous parlerons alors de "chaleur latente de transformation " (nous y

902/2001
Sciences.ch 14/03/2005

reviendrons).

Nous différencions trois modes d'échange de chaleur :

M1. Convection : fluide venant alternativement au contact d'un corps chaud et d'un corps
froid

M2. Rayonnement : un corps à température donnée émet un rayonnement électromagnétique


susceptible d'être absorbé par un autre corps.

M3. Conduction : le transfert d'énergie se produit des zones chaudes vers les zones froides par
collision des particules les plus excités (zone chaude) avec les particules voisines moins
excitées et ainsi de suite de proche en proche.

Remarque anecdotique : comment construire un système qui minimise les flux d'énergie
thermique ? Réponse : le vase Dewar ou plus simplement... la bouteille "thermos" qui permet
de minimiser la convection, le rayonnement et la conduction.

FLUIDE PARFAIT

La notion de fluide parfait permet l'établissement de relations élémentaires propres à


permettre une description simplifiée des divers phénomènes thermodynamiques.

Remarque : toutefois, en réalité, aucun fluide ne peut être considéré comme étant parfait :
l'application des relations établies pour les fluides parfaits à des cas réels doit donc être faite
avec circonspection et en tenant compte d'une marge d'erreur appréciable.

Par convention, le fluide parfait est défini comme suit :

D1. Il est constitué par des molécules ponctuelles sans interactions mutuelles (cette hypothèse
provient de la mécanique statistique)

D2. Il obéit aux lois de Boyle-Mariotte (approximation de l'équation de Van der Waals
démontrée en mécanique statistique) :

de Gay-Lussac (démontrée à partir de la loi de Boyle-Mariotte) :

et d'Avogadro (idem).

D3. Il obéit à la loi de joule et son énergie interne n'est dépendante que linéairement de la
température comme nous l'avons démontré dans le chapitre de mécanique des milieux
continus.

903/2001
Sciences.ch 14/03/2005

D4. Sa chaleur spécifique isobare massique et sa chaleur spécifique isochore massique sont
constantes.

FLUIDE SEMI-PARFAIT

La notion de fluide semi-parfait est intermédiaire entre celle du fluide parfait et celle du fluide
réel. Elle permet l'établissement de relations plus proches de la réalité bien qu'encore
simplifiées.

Par convention, le fluide parfait est défini comme suit :

D1. Il est aussi constitué par des molécules ponctuelles sans interactions mutuelles.

D2. Il obéit aussi aux lois de Boyle-Mariotte, de Gay-Lussac et d'Avogadro

D3. Il obéit à la loi de joule et son énergie interne n'est plus linéairement dépendante de la
température.

D4. Sa chaleur spécifique isobare massique et sa chaleur spécifique isochore massique ne sont
plus constantes, elles sont fonction de la température.

Toutes les relations établies pour le fluide parfait peuvent être utilisées pour le fluide semi-
parfait sous réserve de tenire compte des variations des différentes chaleurs spécifiques.

FLUIDE RÉEL

Les fluides réels sont ceux qui ne satisfont pas aux conditions de définition des fluides parfaits
et semi-parfait. Ce sont les fluides "industriels" qui doivent être bien connus afin de pouvoir
étudier et calculer convenablement les installations et équipements thermiques.

D'une manière générale, nous pouvons dire que les fluides réels sont "plus compressibles" que
les fluides parfaits et semi-parfaits, ce qui est mis en évidence par le facteur de
compressibilité dans la loi l'équation d'état des fluides parfaits :

où est le "coefficient de compressibilité".

Les différentes chaleurs spécifiques des fluides réels sont fonction de plusieurs paramètres,
tels que la pression, la température, la proximité de l'état liquide, etc.

Il est du rôle de la mécanique statistique d'établir une forme plus élaborée de l'équation d'état
des gaz perfait de manière à rendre celle-ci apte à représenter valablement les phénomènes
réels. Ce résultat s'obtient, d'ailleurs partiellement, grâche à l'introduction d'expressions de
plus en plus complexes à démontrer comportant de nombreux coefficients correcteurs
(équation de Van der Waals, de Berthelot, de Clausius, de Véron, etc.).

En pratique industrielle, les études et calculs sur les fluides réels sont condutis à l'aide de la
simulation numérique sur ordinateur.

904/2001
Sciences.ch 14/03/2005

ÉNERGIE INTERNE

En mécanique classique, nous avons vu (deuxième théorème de König) que l'énergie totale
d'un corps par rapport à un référentiel galiléen extérieur au centre de masse était donnée
par la somme de l'énergie cinétique et potentielle par rapport à ce même référentiel,
additionné de l'énergie cinétique et potentielle de ce même corps par rapport au référentiel
assimilé à son centre de masse (référentiel barycentrique).

Il en va de même pour un système thermodynamique pour lequel nous avons :

Ce que nous écrivons aussi sous la forme :

où est la grandeur énergétique propre au centre de masse du corps concerné. Sous une
forme plus simplifiée, la relation précédent s'écrit en thermodynamique :

Le deuxième principe de la thermodynamique s'écrit alors :

où est la chaleur correspondant à l'énergie cinétique moyenne des particules composant le


corps par rapport à son centre de masse et étant dont les composant sont régis par les règles de
la mécanique statistique.

En règle générale, les systèmes étudiés en thermodynamique sont globalement au repos (


) et donc . De même, nous avons en général (champ de potentiel constant et
isotrope) . En conséquence la loi de conservation de l'énergie ou premier principe de
la thermodynamique s'écrira :

Remarque : l'énergie interne n'est souvent donnée qu'à une constante additive près, c'est la
raison pour laquelle certains l'appelle à juste titre "surénergie interne". Comme nous l'avons
démontré en mécanique classique, l'énergie totale d'un système, est la somme des énergies
élémentaire de celui-ci. Ainsi, l'énergie interne est une grandeur extensive.

Considérons maintenant un système décrit par les variables d'état thermodynamiques


. Dans une transformation élémentaire le travail élémentaire se
met sous la forme (voir le chapitre de calcul différentiel et intégral) :

905/2001
Sciences.ch 14/03/2005

si nous avons la relation suivante qui est satisfaite :

Si cette relation n'est pas satisfaite tel que :

alors nous avons une différentielle totale inexacte :

Dans la même transformation, la quantité de chaleur se met sous une forme similaire :

si encore une fois :

ou dans le cas contraire :

Selon le premier principe de la thermodynamique, si l'énergie est conservative alors nous


avons dans un système fermé :

Ce qui implique que quelque soit la transformation les variations de travail et de chaleur sont
données par :

Donc quelque soient les façons dont les transformations se font, l'état final et initial sont
identiques ce qui nous impose que la transformation thermodynamique est indépendante de la
manière dont les phénomènes ont lieu à l'intérieur de celui-ci. est alors une différentielle
totale exacte que nous écrirons .

Or, rappelons que nous avons vu en mécanique classique par définition que le travail est
donné par une force sur une distance (quelque soit l'origine de cette force : mécanique,
rayonnante, nucléaire, etc.) :

906/2001
Sciences.ch 14/03/2005

Or, le chemin intervient dans cette expression classique du travail et donc le travail est
grandeur qui dépend du chemin parcouru et comme nous l'avons vu en calcul différentiel et
intégral, ceci implique que nous devons écrire au lieu de . Il existe bien sûr quantité
d'autres manières d'exprimer le travail mais par la définition de celui-ci même, il s'agira
toujours d'une différentielle inexacte.

Ce résultat à une implication directe sur l'expression de la variation de chaleur pour laquelle le
théorème du Viriel nous montre bien dans le cas d'un fluide, que celle-ci n'est donnée que par
l'agitation thermique de celui-ci. Il convient de rappeler que celle-ci est donnée par l'énergie
cinétique moyenne et que l'énergie cinétique existe de par l'application d'une force sur une
distance pour chaque particule du fluide. Ainsi, la chaleur est elle aussi une différentielle
inexacte .

Finalement, nous avons dans le cas d'un fluide (liquide ou gazeux) :

Au cours de son évolution, le volume du système peut donc varier. Si nous considérons
une évolution infiniment petite au cours de laquelle le volume varie de et si nous notons
la pression extérieure subie par le système, nous écrirons dans un cadre plus général :

où est le travail dit de "refoulement extérieur" (si , l'augmentation du volume


exprime ainsi la fourniture d'un travail, ce qui explique le signe) et où (à ne pas confondre
avec une variation de température!!) est une autre forme d'énergie (si le système est réactif au
niveau chimique par exemple il peut fournir une éventuelle énergie chimique aussi).

Sauf systèmes particuliers (piles, accumulateurs,…) la seule énergie échangée (autre que
l'énergie thermique ou de chaleur ) est le travail de refoulement du milieu extérieur, de
sorte que et dès lors nous avons .

Par ailleurs la plupart des système chimiques étudiés sont à la même pression que la pression
extérieur, soit , étant la pression dans le système. Dès lors, nous avons :

où dans ces deux systèmes, est la pression du système.

La quantité de chaleur mise en jeu dans une transformation isochore (à volume constant)
est bien évidemment égale dès lors à la variation de l'énergie interne tel que :

907/2001
Sciences.ch 14/03/2005

Si nous considérons un système évoluant d'un état 1 vers un état 2 de façon isobare (à
pression constante) :

tel que :

Nous pouvons alors définir une nouvelle fonction d'état commode, "l'enthalpie " (grandeur
extenvise) définie par :

Ainsi, la quantité de chaleur mise en jeu dans une transformation isobare (l'indice est
indiqué dans ce sens) est égale à la variation de la fonction enthalpie :

L'enthalpie est un concept énormément utilisée en thermodynamique chimique et nous


l'utiliserons sans cesse lors de son étude (voir la section de chimie).

CHALEUR

Avant de continuer, il va à tout prix nous falloir éliminer une deux des plus grandes difficultés
dans la bonne compréhension de la thermodynamique (mis à part celle de la différenciation
entre les différentielles totales exactes et inexactes qui a déjà été réglée dans le chapitre de
calcul différentiel et intégral) :

- La différence entre la chaleur et le température

- La différence entre l'énergie-travail et l'énergie-chaleur

Comme nous l'avons vu en mécanique des milieux continus, la température caractérise un état
d'équilibre thermodynamique et traduit l'existence d'une agitation thermique (théorème du
Viriel) et elle peut varier lorsque l'extérieur fournit un travail . Cependant, l'expérience
nous montre que c'est en "chauffant" un système que nous augmentons le plus aisément sa
température. Mais qu'est-ce donc la chaleur ? :

Considérons un système thermodynamique à l'équilibre, et écrivons son énergie sous la


forme statistique (variance de la variable aléatoire de l'énergie d'un micro-état de probabilité
- voir chapitre de mécanique statistique) :

l'énergie étant identifiée avec sa valeur moyenne puisque les fluctuations sont négligeables.
Sa variation au cours d'une transformation infinitésimale (que nous supposons à nombre de

908/2001
Sciences.ch 14/03/2005

particules constant) est (différentielle totale) :

où est le déplacement de l'énergie du micro-état provoqué par la transformation, et


la variation de la "population" de cet état .

Si au cours de cette transformation infinitésimale, le système reçoit le travail et la


chaleur , son énergie s'accroît de :

Nous pouvons maintenant comparons cette dernière relation (exprimant le premier principe de
la thermodynamique) avec celle qui la précède (découlant de la mécanique statistique).

Examinons d'abord le cas d'une transformation dans laquelle le système reçoit seulement de
lachaleur :

Dans ce cas, aucun des paramètres extérieurs au système ne varie en général dans la
transformation de sorte que . Nous en déduisons :

Ainsi, lorsqu'un système reçoit seulement de la chaleur, son énergie varie par modification
des populations de ses états microscopiques : si la quantité de chaleur reçue est positive, la
probabilité des états d'énergie élevée augmente, au détriment de celle des états de plus basse
énergie. Enfin, si nous tenons compte que le système doit être à l'équilibre (l'état le plus
probable comme nous l'avons démontré en mécanique statistique) dans les états initial et final
de la transformation, nous constatons, comme nous pouvions nous y attendre, que la
température du système varie : elle a augmenté si la quantité de chaleur reçu est positive (cela
se démontre en choisissant une distribution canonique pour décrire les états d'équilibre
macroscopique du système).

Cela explique la confusion fréquente entre ces deux concepts très différents que sont
température et chaleur. Cette confusion est accentuée par le décalage entre le langage
quotidien et la terminologie scientifique. Dans le langage quotidien, lorsque nous parlons de
chaleur d'un corps, nous affirmons en réalité que sa température est élevée. La confusion
regrettable parce que la notion de chaleur est bien présente en physique, mais que sa
signification est autre.

Ainsi, chauffer un système, c'est lui fournir de la chaleur, c'est augmenter son énergie interne
(le nombre de micro-états de haute énergie) par des moyens qui ne sont pas purement
mécaniques. La chaleur est donc une forme d'énergie particulière !

ÉQUATION DE CONTINUITÉ

909/2001
Sciences.ch 14/03/2005

Considérons de manière générale un système ouvert, limité par une frontière quelconque
(déformable ou non) et animé d'un mouvement quelconque (en déplacement ou immobile) par
rapport à un référentiel considéré comme fixe.

Ce système, qui est représenté sur la figure ci-dessous est susceptible de transférer de l'énergie
(ou de la masse) entre lui-même et l'extérieur. Ce système peut être inertiel ou non.

Soit une grandeur extensive . La grandeur quantitative correspondante est (elle peut
exprimer par exemple l'isotropie ou l'anisotropie du système).

D'une façon générale, la valeur de à l'intérieur du système est, à un instant quelconque:

étant la densité de la grandeur quantitative .

Le taux de variation spatial de est donné par la dérivée . Les causes de variations de
peuvent être liées à deux phénomènes différents: les flux et les sources ou puits.

En comptant positivement ce qui entre dans le système, le flux de à travers la frontière


est donnée par l'intégrale de surface:

dans laquelle nous définissons:

- comme le vecteur flux surfacique total relatif à , exprimé en

- comme l'élément de frontière, exprimé par un vecteur normal à la surface et dirigé vers
l'extérieur

910/2001
Sciences.ch 14/03/2005

Remarquons que, contrairement à l'acceptation usuelle en physique, le concept de flux


contient déjà la dérivation par rapport au temps. Par ailleurs, afin d'alléger le texte,
l'expression vecteur flux surfacique est réduite au terme flux dans tout ce qui suit.

Ce flux peut être décomposé en plusieurs flux, selon la relation:

Le terme est un flux par déplacement absolu, caractérisant un flux lié à un écoulement
fluide. Nous avons la relation:

où est la vitesse absolue d'une particule fluide par rapport au référentiel fixe.

Le terme est un flux par déplacement apparent, mis en jeu seulement lorsque la frontière
se déplace (par exemple si le volume est en révolution). Nous avons la relation:

où est la vitesse absolue de déplacement (dans le sens déformation!) d'un point de la


frontière , par rapport au référentiel fixe.

Le terme est le flux total par conduction, caractérisant un flux lié à un phénomène de
transfert de proche en proche, sans déplacement fluide (pex: conduction thermique,
conduction électrique, travail mécanique).

Le terme est un flux par déplacement relatif, résultant à la fois du déplacement du fluide
et de celui de la frontière . Nous avons la relation:

où est la vitesse relative d'une particule fluide par rapport à un point bien défini de la
frontière . En vertu du principe de composition des vitesses (vitesse absolue est la somme
la vitesse relative et de sa vitesse apparente), nous avons:

Lorsque la frontière est traversée par un fluide, le débit-masse élémentaire (c'est la masse
qui nous intéresse en physique donc sera une densité massique) est:

911/2001
Sciences.ch 14/03/2005

Le flux de correspondant est alors donné par:

où désigne la portion de frontière traversée par le débit masse (ou fluide).

Si nous comptons positivement l'effet d'une source, le taux d'augmentation de est donné
par:

où est le flux volumique d'une source de .

En tenant compte à la fois des flux et des sources, nous avons le taux de variation spatial de
:

Le bilan spatial de est finalement exprimé par la relation:

Dans le cas particulier d'un système en régime permanent (par exemple dans le cas d'un fluide
qui s'écoule ou d'un solide qui est le siège de conduction thermique, de conduction électrique,
de réaction nucléaire,…), toutes les grandeurs locales sont constantes en tout point du
système. Si, de plus, nous choisissons une frontière indéformable, il est possible de
raisonner par rapport à un référentiel lié au système. Nous avons alors, en tout point fixe du
système par rapport à ce référentiel:

; ;

Il en résulte pour l'ensemble du système:

Donc dans le cas particulier d'un système en régime permanent, avec une frontière
indéformable , liée au système, le taux de variation spatial de toute grandeur extensive
scalaire est nul.

Le taux de variation uniquement spatial de (d'où l'utilisation du lagrangien temporel) est:

912/2001
Sciences.ch 14/03/2005

La variation élémentaire du volume est due au déplacement (au sens de la déformation!) de


la frontière , de sorte que

Dès lors nous pouvons écrire que:

nous avons donc:

En prenant en compte les flux des sources et des puits nous avons:

Le théorème de Gauss-Ostrodradsky va nous permettre d'écrire l'intégrale de surface en une


intégrale de volume, et en groupant tous les termes sous le même signe intégrale, nous
obtenons:

Comme les limites d'intégration (frontière ) sont arbitraires, l'expression entre crochets est
identiquement nulle.

Considérons maintenant que la grandeur extensive scalaire soit la masse , nous avons
alors:

avec .

Comme la masse n'est pas susceptible d'être transférée par un phénomène de conduction (dans

913/2001
Sciences.ch 14/03/2005

un cas classique (non quantique)), nous avons qui est nul. Comme la masse est
conservative, il n'y a ni source, ni puits de masse de sorte que est également nul.

Nous avons dès lors:

Le relation:

est appelée équation de continuité (ou de conservation).

Le signe "-" est ici car nous avons défini le flux entrant comme étant positif. Il est possible
que dans la littérature ainsi que sur ce sit vous trouviez un "+" à la place de ce signe.

Il y a une autre forme beaucoup plus fréquente sous laquelle nous trouvons l'équation de
continuité. Le lecteur aura remarqué que le terme à les unités d'une densité de surface
de courant massique ce qui nous amène en analogie avec l'électronique à noter :

Ce qui ramène l'équation de continuité à :

Appliquons maintenant ce résultat à la diffusion de la chaleur:

Comme pour l'équation de conservation de la masse nous pouvons écrire pour la chaleur dans
le cas d'absence de sources:

où est la quantité de chaleur par unité de volume et le flux de chaleur dont la quantité
entrante a été définie comme négative.

Une variation de température entraînant une variation de la quantité de chaleur est défini en
première approximation par la loi physique suivante:

où est la densité de matière et est la capacité calorifique.

914/2001
Sciences.ch 14/03/2005

Le flux de chaleur étant trivialement induit par une différence spatiale de température nous
obtenons alors la "Loi de Fourier" qui exprime le flux de chaleur proportionnellement au
gradient spatial de température:

Le signe "-" étant simplement dû au fait que le flux de chaleur va du plus chaud au plus froid
et exprimant la conductivité thermique du matériau dépendant des propriétés atomiques de
la matière.

En insérant les deux précédentes relations dans l'équation de conservation de la chaleur nous
avons :

De façon plus esthétique nous la retrouvons sous la forme de "l'équation de diffusion de la


chaleur" :

D est appelé le coefficient de diffusion thermique. Son explication atomique est donnée par
qui est le produit de la vitesse moyenne des particules transportant la chaleur par
leur libre parcours moyen entre 2 collisions.

RAYONNEMENT THERMIQUE

L'étude du corps noir ou "récepteur intégral" est à la base de la célèbre théorie de la physique
quantique ondulatoire, un des piliers de la physique moderne. En effet, certains résultats
expérimentaux ne pouvaient pas être expliquées sans l'introduction d'une nouvelle constante
universelle : la fameuse constante de Planck.

Définition: un corps noir est défini comme un corps ayant un coefficient d'absorption
énergétique et un coefficient d'émissivité égaux à l'unité (voir la photométrie dans le
chapitre d'optique de la section traitant de l'électrodynamique).

Le premier principe de la thermodynamique établit une équivalence entre le travail et chaleur


comme modes de transfert d'énergie entre un système et son environnement (et en fait le bilan
au niveau de l'énergie interne). Nous nous intéressons ici à la chaleur, que nous pouvons
définir comme "l'énergie qu'un corps communique à un autre à cause de leur différence de
température".

La chaleur se communique d'un endroit à un autre de trois manières différentes:

- par conduction: c'est un transfert de chaleur dans ensemble de points matériels en contacts
qui se fait sans mouvements macroscopiques, sous l'influence d'un gradient de température.

915/2001
Sciences.ch 14/03/2005

La conduction est donc le résultat de collisions moléculaires. Nous l'observons principalement


dans les solides: dans les métaux, elle fait intervenir les électrons libres qui les rendent bons
conducteurs de chaleur. En revanche, dans les isolants, la conduction se fait mal. De là la forte
correspondance entre les propriétés thermiques et électriques des solides.

- par convection: la convection implique le transport de la chaleur par une partie d'un fluide
qui se mélange avec une autre particule. Elle prend sa source dans un transport macroscopique
de matière et ne concerne donc pas les solides.

- par rayonnement: la conduction et la convection supposent la présence de matière. Le


rayonnement, lui, permet un transfert d'énergie qui peut s'effectuer à travers le vide. Il s'agit
ici de rayonnement électromagnétique. Soulignons que le rayonnement n'est pas un mode de
transfert de chaleur mais d'énergie, celle-ci pouvant se transformer en chaleur au contact d'un
corps.

Le rayonnement thermique émis par un corps porté à une certaine température résulte d'une
conversion de l'énergie interne du corps en rayonnement. Inversement, l'absorption est la
transformation de l'énergie incident en énergie interne.

Lorsqu'un surface est soumise à un rayonnement absorbée, nous effectuons le bilan d'énergie
selon la loi de Kirchhoff vue en photométrie :

où rappelons-le quand même, est la fraction du rayonnement absorbée, est la partie


réfléchie (diffusée) et la partie transmise (qui traverse la surface). Ce bilan résulte du
principe de la conservation de l'énergie.

Nous allons maintenant nous pencher sur les mécanismes d'absorption et d'émission et établir
un lien entre chaleur et énergie rayonnante avant de nous intéresser directement au corps
noir :

LOI DE STEFAN-BOLTZMANN

Nous avions défini lors de notre étude de la photométrie (voir le chapitre d'optique dans la
section d'électrodynamique) le concept d'émittance (énergie irradiée par un corps non
ponctuel par unité de surface) pour l'ensemble du spectre.

Ce que nous avions omis de préciser cependant, c'est que pour qu'un corps rayonne (outre le
fait qu'il puisse être lui-même éclairé par un autre corps) il faut qu'il soit chauffé (que l'on
fournisse un énergie d'excitation aux constituants au corps en question – sous-entendu aux
électrons).

Donc nous devrions pouvoir établir une relation entre la température d'un corps et son
émittance.

En 1879, le physicien autrichien Stefan a pu établir expérimentalement que l'émittance totale


du corps noir à une température augmentait proportionnellement à la quatrième
puissance de la température tel que :

916/2001
Sciences.ch 14/03/2005

où est l'intégration sur toutes les longueurs d'onde (ou les fréquences... peu importe) de
:

avec donné par la loi de Planck que nous déterminerons plus tard.

Rappelons également que (ceci sera démontré lors de notre démonstration de la loi de
Planck) :

est la constante de Stefan.

En 1884, Boltzmann à démontré indirectement la loi de Stefan en se basant sur l'étude du


corps noir à l'équilibre thermique (où nous considérons que les bords de la paroi du corps noir
définissent les terminaisons des ondes électromagnétiques)à partir de la théorie de
l'électromagnétisme et d'un raisonnement thermodynamique.

Dans un premier temps, Boltzmann a déterminé qu'elle était la pression de radiation du


rayonnement dans une telle enceinte (ou dans un tel corps).

Voici les développements qui l'ont mené à déterminer la pression de radiation à la


température d'équilibre thermodynamique pour la densité interne d'énergie
correspondante :

Rappelons l'expression de la "relation d'Einstein" que nous avons démontrée lors de notre
étude de la relativité restreinte :

Considérons maintenant une enceinte de volume dont les parois sont réfléchissantes pour
les photons (cas du corps noir). Nous étudions la variation de la quantité de mouvement avant
et après la collision sur une surface infiniment petite (ce qui permet de considérer les
trajectoires avant et après le choc comme rectilignes et symétriques par rapport à l'axe orienté
perpendiculaire à la surface du corps noir et coïncidant avec la surface ).

Ainsi, nous avons avant collision pour la quantité de mouvement :

et après collision :

917/2001
Sciences.ch 14/03/2005

Si la collisions est élastique (ce qui est confortant relativement au photon…) :

et

Nous avons alors :

La variation de la quantité de mouvement est alors :

Comme :

nous avons alors :

En ne considérant que la norme de l'expression et qu'il s'agit d'un photon :

Remarque importante (très) : nous supposons qu'après son rebond, le photon conserve sa
fréquence (ce qui nous amène à supposer que le corps noir comporte des ondes stationnaires à
l'équilibre thermodynamique).

Jusqu'à présent, nous avons raisonné sur un photon mais l'enceinte contient un gaz de photons.
L'énergie interne volumique du rayonnement contient une densité volumique de
photons de fréquence identique égale à :

Remarque : nous précisons les unités car nous avons remarqué que la suite posait parfois
quelques problèmes de compréhension.

Nous considérons que pendant un intervalle de temps , le nombre de photons pouvant


potentiellement frapper la surface sous un angle d'indice est contenu dans un cylindre
de génératrice dont l'axe est incliné nécessairement d'un angle et ayant comme surface
de base . Le volume de ce cylindre est par la projection de la surface de base :

918/2001
Sciences.ch 14/03/2005

Le nombre de photons pouvant potentiellement heurter la paroi par unité de temps


est :

Dans cette dernière expression, nous avons supposé que tous les photons de avaient une
quantité de mouvement dans la direction sous tendue par . En réalité, les photons arrivant
réellement sur sont contenus dans un angle solide entre deux cônes de demi-angle au
sommet et (pour des raisons de géométrie de l'expérience du corps noir qui était,
sauf erreur, sphérique et par ailleurs cette symétrique sphérique facilite les calculs…).

La relation entre et est comme nous l'avons vu en trigonométrie (voir la section de


géométrie dans laquelle nous démontrons cette relation) :

Sachant que dans le volume entier (rappel), l'angle solide vaut :

Le nombre compris dans l'angle solide élémentaire qui parvient sur la surface
sous un angle d'incidence compris entre et est alors :

Soit maintenant la définition de la pression :

en substituant ce qu'il convient :

Ce qui donne après simplification :

La pression totale de radiation dans ce cas particulier étant donnée par :

919/2001
Sciences.ch 14/03/2005

Ce qui est équivalent à écrire (à l'équilibre thermodynamique pour une température donnée) :

L'énergie totale est la densité d'énergie multipliée par le volume considéré :

Supposons que ce volume puisse varier. Le travail de la pression de radiation lors d'une
dilatation du volume est :

La variation d'énergie interne du système en vertu du premier principe de la


thermodynamique est :

Or d'après , nous avons :

d'où :

et selon le deuxième principe de la thermodynamique (ne pas confondre la notation avec la


surface...) :

Nous avons :

Comme est une différentielle totale, nous avons dans ce cas:

920/2001
Sciences.ch 14/03/2005

Ce qui nous amène à écrire :

En calculant la dérivée du membre de droite :

En simplifiant :

ce qui s'écrit encore :

Soit :

qui devient l'équation :

Ce qui donne après intégration :

Finalement :

avec étant la constante de Stefan-Boltzmann dont la valeur


avait été donnée à l'époque dans un premier temps expérimentalement.

Nous voyons ci-dessus la correspondance qu'il y a entre la relation que nous avons posé au

921/2001
Sciences.ch 14/03/2005

début et celle que nous venons d'obtenir :

et

Comme nous n'avons pas encore, à ce point, démontré la loi de Planck, nous pouvons faire un
raisonnement osé mais que nous justifierons par la suite avec démonstration à l'appui.

Remarque importante : les deux dernières relations nous donnent une information
fondamentale comme quoi tous les corps qui ne sont pas à zéro kelvin (au zéro absolu)
rayonnent.

et sont différenciées au niveau des unités par les dimensions d'une vitesse. Or,
intuitivement et grossièrement (…), la vitesse qui peut tout de suite nous apparaître comme
triviale dans ce cas d'étude est la vitesse de la lumière . Ainsi, nous remarquons que :

Ce qui nous donne :

Curieux n'est-ce pas… mais nous le démontrerons plus loin car notre philosophie sur ce site
est de ne jamais (ou le moins possible) laisser place à l'intuition.

Remarque : lorsque nous étudierons la loi de planck, sera noté afin de ne pas
confondre la radiance avec une densité d'énergie (car la notation peu malheureusement porter
à confusion)

Considérons maintenant une chambre ou cavité isolée (comme une fournaise) en équilibre
thermique à une certaine température . Cette cavité sera sûrement remplie de rayonnement
électromagnétique de différentes longueurs d'onde. Supposons qu'il existe une fonction de
distribution dépendant uniquement de la température.

Logiquement, la quantité totale d'énergie électromagnétique, à toutes les longueurs d'onde,


absorbée par les murs de la cavité doit être égale à celle émise par les murs autrement le corps
formant la cavité verrait sa température changer. Kirchhoff raisonna que si le corps formant la
cavité est fait de différents matériaux (se comportant donc de façon différente avec la
température), l'équilibre entre radiation émise et radiation absorbée doit s'appliquer alors pour
chaque longueur d'onde (ou domaine de longueur d'onde).

Nous voyons ainsi que est une fonction universelle, la même pour toutes les cavités
sans égard à leur composition, leur géométrie ou la couleur de leur paroi. Kirchhoff ne donna
pas cette fonction mais il fit remarquer qu'un corps parfaitement absorbant, c'est-à-dire un
corps pour lequel apparaîtra (façon de dire…) noir.

Il vient alors que le rayonnement emmagasiné en équilibre dans une cavité isolée en équilibre
thermodynamique (comme le sont les étoiles) est à tous égards la même que celle émise par

922/2001
Sciences.ch 14/03/2005

un corps parfaitement noir à la même température.

Evidemment, si la cavité est fermée, nous ne pouvons pas mesurer le courant d'énergie qui
s'en échappe. Mais pratiquons un tout petit trou dans cette cavité (suffisamment petit pour ne
pas perturber l'équilibre du rayonnement électromagnétique à l'intérieur), alors l'énergie
électromagnétique s'échappant de ce petit trou est la même que celle émise par un corps
parfaitement noir.

Cependant, aucun objet n'est réellement un corps noir. Le noir de charbon a un coefficient
d'absorption très près de 1 mais seulement pour certaines fréquences (incluant, bien sûr, le
visible). Son coefficient d'absorption est beaucoup plus petit dans l'infrarouge lointain. Tout
de même, la plupart des objets s'approchent dans certaines gammes de fréquence. Le corps
humain, par exemple, est presque un corps noir dans l'infrarouge (d'où les lunettes de nuit
militaires…). Pour traiter les différents corps (appelés "corps gris"), nous introduisons un
facteur appelé émissivité totale, , qui relie l'émittance émise par le corps à celle émise par
un corps noir parfait pour lequel . Nous avons donc :

Remarque : la relation de Stefan-Boltzmann nous donne la puissance émise par un corps par
unité de surface en l'exprimant de façon proportionnelle à la quatrième puissance de la
température. Cet exposant nous donne la raison pour laquelle il devient de plus en plus
difficile d'augmenter la température d'un corps en le chauffant, celui-ci perdant de plus en
plus rapidement l'énergie que nous fournissons pour son échauffement.

LOI DE PLANCK

Définition : nous considérons le corps noir comme un système isolé à l'équilibre thermique.
Dans lequel le rayonnement est à l'état stationnaire et réfléchi totalement par les parois. Les
photons peuvent être dès lors considérés comme des particules n'interagissant pas entre elles
dans un puits de potentiel à parois rectiligne

Ainsi, identiquement à ce que nous avons vu dans le chapitre de physique quantique


ondulatoire, le résolution du problème est celui d'un puits de potentiel à parois rectilignes
pour laquelle nous avions obtenu pour fonction d'onde :

à propos de laquelle il faut appliquer les conditions aux limites.

Les conditions que nous avions imposées lors de notre étude de ce cas en physique quantique
ondulatoire étaient trop restrictives (c'est la raison pour laquelle elles sont appelées
"conditions aux limites strictes"). Effectivement, les atomes de la paroi absorbent et émettent
le rayonnement quel que soit la manière dont le rayonnement est incident. Mais l'équilibre
impose au moins qu'elles soient que les conditions aux limites soient périodiques de par la
définition même de l'équilibre. C'est la raison pour laquelle nous imposons ce que nous
appelons les "conditions au limites périodiques" :

923/2001
Sciences.ch 14/03/2005

- pour et , nous avons :

- la fonction d'onde doit présenter un nombre entier de demi-longueur d'onde sur la


longueur

- dans le corps noir, donc

- si aux extrémités ( et ) nous avons l'argument du sinus à la même valeur


(à un facteur multiplicatif réel près) en et en .

Donc nous devons avoir :

et comme , après quelques simplifications élémentaires, nous avons :

L'énergie totale de la particule présente donc une suite discrète de valeurs, les seules permises.
La valeur de est quant à elle déterminée à l'aide du modèle de Bohr ou de Sommerfeld en
fonction des cas.

Puisque les fonctions d'onde correspondantes dans le puits sont , nous avons
donc:

Ainsi, l'énergie totale peut s'écrire :

Ainsi, étant donné que la fonction d'onde est une probabilité conditionnelle, nous avons sous
forme de phaseur :

et les énergies discrètes associées sont alors :

924/2001
Sciences.ch 14/03/2005

Le vecteur étant donc défini par :

Remarque : nous constatons facilement que les écarts d'énergie entre niveaux consécutifs sont
d'autant plus faibles que les dimensions du corps noir (assimilé à une boîte) sont
plus grandes; pour des dimensions macroscopiques, ces écarts sont alors totalement
inappréciables. Ce constat nous permettra un peu plus loin de faire une petite approximation.

Explication : pour un électron ( ) enfermé dans une boîte cubique de côté


, l'écart entre deux niveaux consécutif est :

donc environ …

Les vecteurs qui nous intéressent (puisqu'ils représentent respectivement chacun un micro-
état possibles), plongé dans l'espace des phases des nombre d'onde, ont leur extrémité situées
en l'un des nœuds d'un réseau tridimensionnel constitué de mailles élémentaires dont les
arêtes sont parallèles aux axes et qui mesurent respectivement . Nous
voulons évaluer le nombre de vecteurs pour lesquels cette extrémité tombe dans l'intervalle
entre les deux sphères centrées à l'origine et de rayons de norme et . Le volume de
la coquille sphérique comprise entre les deux sphères est donc trivialement donnée par :

Le nombre de mailles élémentaires (de micro-états) incluses dans cette région de l'espace des
est, à peu de chose près, égal au nombre de fois que son volume contient celui de la maille
élémentaire, qui vaut :

Nous obtenons ainsi le nombre de micro-états dans le volume (donc la densité de micro-
états) :

925/2001
Sciences.ch 14/03/2005

Or, il ne faut pas oublier les relations suivantes (voir chapitre de mécanique ondulatoire,
physique quantique corpusculaire et relativité restreinte) :

Donc :

Il vient :

Dans un corps noir à l'équilibre thermodynamique, les photons forment un gaz dont les
constituant n'interagissent pas entre eux chimiquement. Ce type de situation est typiquement
décrite par la distribution de Bose-Einstein que nous avons vu en mécanique statistique. Ainsi,
puisque , nous avons dans le cas d'un spectre discret d'états :

et dans un cas que nous considérons comme continu :

Dans le corps noir, nous avons pour énergie interne :

La radiation d'un corps noir est donc donnée par :

926/2001
Sciences.ch 14/03/2005

et puisque :

et

donc :

Or, comme , il convient de prendre la valeur absolue tel que :

Enfin, nous obtenons encore une autre forme de la loi de Planck :

Planck a proposé cette loi en 1900 sans connaître la distribution statistique de Bose-Einstein !

Si , le développement de Taylor de pour petit donne donc :

Ce qui nous donne :

et la loi de Planck devient donc :

Que nous retrouvons aussi parfois sous la forme :

927/2001
Sciences.ch 14/03/2005

A l'inverse, nous avons :

Ce qui nous donne :

et la loi de Planck devient donc :

qui n'est rien d'autre que la " première loi de Wien".

Nous pouvons également redémontrer la loi de Stefan (nous l'avons déjà fait en
thermodynamique mais avec une autre démarche) mais en plus démontrer la provenance de la
constante de Stefan-Boltzmann .

Rappelons que d'abord que le flux énergétique (voir chapitre d'optique géométrique) est entre
autres donné par :

Comme la luminance dépend de la fréquence et donc de la température du corps émetteur,


nous pouvons ajouter :

L'énergie rayonnée à travers une surface élémentaire donnée est donc dès lors :

Si le volume d'émission est considéré comme un volume élémentaire assimilé à un cylindre


d'hauteur et de sommet ayant pour surface (voir chapitre d'optique géométrique)
la densité d'énergie est alors donnée est alors donnée par :

Compte tenu de l'isotropie du corps noir à l'équilibre, nous avons :

928/2001
Sciences.ch 14/03/2005

L'analyse dimensionnelle nous donne :

Enfin, il est utile de considérer la puissance totale émise par unité de surface (donc
l'émittance) :

Si nous intégrons sur la demi-surface d'une sphère (par rapport au point de surface de
l'émetteur) :

Effectivement pour une sphère (voir chapitre de trigonométrie) :

Comme la luminance est indépendante de (isotropie du rayonnement du corps noir),


l'intégration est élémentaire, et nous trouvons :

L'émittance totale est alors donnée par :

En posant , nous pouvons simplifier l'intégrande de sorte que :

Donc :

Franchement…, il était difficile de le deviner…

929/2001
Sciences.ch 14/03/2005

Déterminons pour quelle longueur fréquence, nous avons le maximum de densité d'énergie.
En d'autres termes cela revient à chercher où la dérivée :

s'annule. Donc :

Divisons par :

La dernière relation peut admet une seule racine positive que nous pouvons déterminer avec
Maple (evalf(solve(exp(-x)-1+1/3*x=0,x));) :

Ce qui nous donne la "deuxième loi de Wien" ou "loi de déplacement" :

où est appelée "constante de Wien".

Insistons sur le fait que la loi de Planck n'est valable que dans les cas où le rayonnement est à
l'équilibre thermique. Cette restriction est important dans la pratique, car la phénomènes
d'émission ou d'absorption de rayonnement par la matière se produisent le plus souvent dans
des conditions hors de l'équilibre : dans le cas par exemple de l'éclairage par une lampe
électrique ou du chauffage électrique par rayonnement infrarouge, il y a transformation
irréversible (et donc hors d'équilibre) d'énergie électrique en énergie de rayonnement; de
même, le rayonnement solaire est produit par les réactions nucléaires qui ont lieur à l'intérieur
du soleil et qui consument peu à peu sa substance; au niveau microscopique également,
l'émission d'un photon par un atome excité est très souvent un retour irréversible de l'atome à
son état fondamental (émission spontanée hors d'équilibre). Dans le cas du corps noir, au

930/2001
Sciences.ch 14/03/2005

contraire, le rayonnement est confiné à l'intérieur d'une enceint fermée (nous laissons
éventuellement une fraction négligeable de ce rayonnement s'échapper à l'extérieur pour y être
soumise aux mesures) et nous pouvons ainsi parvenir à l'équilibre thermique avec les parois.

La loi de Planck que nous avons démontrée précédemment est parfaitement vérifiée par
l'expérience dans tout le domaine de températures accessibles à ce jour :

931/2001
Sciences.ch 14/03/2005

MÉCANIQUE DES MILIEUX CONTINUS

Au sens strict du terme, la mécanique des milieux continus (abrégée "M.M.C." parfois) est la
branche de la mécanique qui se propose d'étudier l'étude des mouvements, des déformations,
des champs de contraintes au sein de milieux continus.

Définition : nous désignons par "milieu continu" tout fluide (solide, liquide, gaz ou plasma
selon ce que nous avons vu en thermodynamique), déformable ou non, quand nous le
considérons d'un point de vue macroscopique, par opposition à une description corpusculaire.

Cette branche apparaît souvent comme la science de l'ingénieur qui permet de comprendre et
de décrire le monde matériel qui nous entoure et les phénomènes courants qui s'y déroulent:
mouvements de liquides, de gaz, vol des avions, hélicoptères, fusées, satellites, navigation des
bateaux, déformations des corps solides, structure interne des étoiles, etc. Par ses attaches à la
mécanique thermique (thermodynamique), elle s'étend jusqu'à la thermique, l'énergétique,
l'acoustique.

Prenant en compte les comportements des milieux continus, elle englobe l'hydrodynamique,
la dynamique des gaz, l'élasticité, la plasticité et d'autres comportements. Elle est la clé de ce
que nous appelons aujourd'hui la "modélisation", qui n'est autre que l'art d'analyser un
phénomène physique et de le décrire en termes mathématiques, ce qui permet de l'étudier avec
la rigueur propre à cette discipline.

Cette section du site est séparée en 4 parties principales: solides, liquides, gaz et plasmas.

Dans chaque partie, nous introduirons les outils mathématiques spécifiques à l'étude de tel ou
tel milieu continu avec une complexité (toute relative) croissante. Cependant, par choix il a
été décidé d'exposer les théorèmes avec les outils mathématiques les plus simples possibles
mais tout en arrivant aux mêmes résultats. Ainsi, par exemple, l'équation de Navier-Stokes qui
prendrait 150 pages de développements mathématiques rigoureux n'en prend plus que 27. Il y
a donc un avantage non négligeable aussi bien pour l'auteur que pour le lecteur à procéder
ainsi.

Remarque : concernant les équations de Navier-Stokes, nous donnerons des exemples


pratiques de celles-ci lors de notre étude de la météorologie.

SOLIDES

Des atomes d'un même élément ou d'éléments différents s'assemblent en des édifices
spécifiques. Cela conditionne la force de leurs interactions électriques, qui définissent la
structure finale de la substance. Dans les conditions normales sur notre planète, la matière
existe à l'état solide, liquide, gaz ou plasma. Si les forces interatomiques sont assez intenses ,
la collection de particules conserve sa forme et son volume.

Cette propriété de conserver la forme et le volume, ainsi que des propriétés élastiques
distinguent les solides.

PRESSIONS

Les notions de "compression" et "contrainte" (que nous pouvons englober dans le terme de
"pression") sont de première importance en mécanique des fluides. Il convient donc de définir

932/2001
Sciences.ch 14/03/2005

ces différents types de pression avec le plus de rigueur possible.

D1. Nous appelons "pression de compression" et nous notons traditionnellement le rapport


entre la force qui s'exerce (s'appuie) sur un élément de surface . Ainsi, sous forme
scalaire:

Si une force agit sur une surface finie, nous parlons alors de "force répartie".

D2. Nous appelons "pression de contrainte" et nous notons le rapport entre la force qui tire
sur un élément de surface . Ainsi, sous forme vectorielle:

où et sont respectivement les contraintes normales et tangentielles.

Nous pourrions très bien englober les deux définitions ci-dessus en une seule et travailler avec
les signes des forces. Mais par souci de cohérence avec ce qui est enseigné dans les écoles,
nous garderons ces deux définitions qui s'identifient par définition par le fait que leurs forces
sont opposées par rapport à un élément de surface .

ÉLASTICITÉ DES SOLIDES

D'une manière ou d'une autre, une contrainte de compression ou de traction peut déformer le
triplet hauteur, largeur, épaisseur d'un corps. S'attaquer directement à l'étude d'un cas qui
déforme ces trois paramètres est une peu long et sera abordée dans le chapitre traitant de la
détermination de l'expression du module de Young de cisaillement.

Mais il est utile, ne serait-ce que du point de vue du vocabulaire de donner un exemple à partir
du cas le plus simpliste qui puisse être. Si nous imaginons un corps élastique d'une dimension
(ayant ni hauteur, ni largeur mais juste une longueur) sous l'application de deux forces de
contraintes parfaitement colinéaires mais antagonistes, nous pouvons imager que le corps en
considération s'allonge d'un certain facteur.

Définition: la déformation normale sous des forces axiales et antagonistes est donnée par le

933/2001
Sciences.ch 14/03/2005

rapport entre la variation de longueur du corps sur sa longueur initiale tel que:

Cette relation est une forme extrêmement simplifiée de tous les types de déformations qu'il
peut exister et que nous verrons plus loin en détails.

Il y a nécessairement une relation entre les forces de compression et de traction et la variation


de dimension d'un corps. Cette relation est dépendante de la structure atomique du matériau et
devrait rigoureusement faire appel à la physique quantique pour être déterminée (nous nous en
abstiendrons cependant dans cette section du site). Nous observons cependant suivant les
matériaux des caractéristiques diverses qui intéressent aux plus hauts points les ingénieurs:

Les figures ci-dessus représentent la variation de la contrainte de compression en fonction de


la déformation pour certains matériaux (habituellement nous représentons ces caractéristiques
en inversant les axes). Les matériaux ductiles comme l'acier doux (a), cessent d'être linéaires à
la limite d'élasticité . Sous traction les polymères (b) caoutchouteux s'allongent d'abord en
dépliant leurs molécules (voir la section de chimie sur les polymères) puis en tirant sur les
liaisons chimiques (voir chimie quantique). La plupart des matériaux biologiques (c) sont sous
contrainte, même lorsqu'ils ne sont pas déformés. La peau, par exemple, est comme un gant
de caoutchouc enveloppant le corps. L'élastine (d) est habituellement renforcée de collagène
dans les systèmes biologiques tels que les artères. Un tendon est fait principalement de
collagène.

Dans un cas plus général, les ingénieurs ont pour habitude de définir les points représentés ci-
dessous dans leurs mesures d'essais de traction:

934/2001
Sciences.ch 14/03/2005

La caractéristique ci-dessus comporte une partie linéaire comme c'est le cas d'une certaine
classe de matériaux. Cela signifie que la pente de la caractéristique est une constante, qui
reflète la déformation élastique du matériau sous l'effet de la contrainte croissante. Cette
contrainte élastique par unité de déformation définit le "module de Young" (il n'y a pas de
composante tangentielle dans ce cas d'étude !):

cette relation étant valable aussi bien en contraintes de compression qu'en traction.

LOI DE HOOK

Étant donné les définitions données précédemment, nous définissons la relation:

qui est par définition la "loi linéaire de Hook" en contrainte normale.

Il est assez intuitif de supposer que plus la force de liaison des atomes constituant le matériau
étudié est grande, plus grande est la force à appliquer pour éloigner les atomes, donc pour
étirer le corps. Les solides qui ont des grandes forces de liaisons, ont une haute température de
fusion (cela est approfondi dans le chapitre traitant de la chimie quantique).

Si nous notons :

Nous nous retrouvons avec la loi que nous connaissons:

935/2001
Sciences.ch 14/03/2005

qui est la force de rappel des ressorts.

Mais il existe plusieurs types de contraintes avec leurs modules respectifs. Ainsi voici la
définition des plus importantes dans la partie linéaire de leur caractéristique:

D1. Nous définissons le "module de cisaillement" ou "module de rigidité":

et le "module d'élasticité de glissement" ou "module de Coulomb" (dont nous démontrerons


plus loin la provenance):

où est l'angle de déformation et le coefficient de Poisson. Généralement cet angle étant


petit:

D2. Nous définissons le "module de compressibilité omnidirectionnel", comme le rapport de


la contrainte volumique à la déformation volumique (nous démontrerons plus loin les
développement mathématiques qui amènent au dernier terme de la relation):

Nous pourrions encore définir beaucoup de modules tels que le module de flexion, de flexion
pure, de flexion composée, de torsion… Nous étudierons certains d'entre eux plus loin.

Pour chacune des différentes définitions de modules que nous pouvons envisager, nous
pouvons définir une loi de Hook qui lui est adapté. Cependant, tout cela peut vous paraître
assez arbitraire mais au fait il n'en est rien car toutes les définitions de modules que nous
avons vues précédemment sont un cas particulier d'un relation mathématique généralisée
donnée par (nous le démontrerons plus loin) la relation tensorielle:

936/2001
Sciences.ch 14/03/2005

Nous espérons pouvoir un jour dans ce site présenter le développement qui nous permet
d'arriver à cette relation. En attendant, les développements qui vont suivre et qui n'utilisent par
choix personnel en aucun cas le calcul tensoriel, doivent suffire aux étudiants des hautes
écoles relativement aux objectifs qui doivent êtres atteints dans leur programme scolaire.

MODULE DE GLISSEMENT

La condition nécessaire pur qu'un solide rigide soit en équilibre statique est comme nous
l'avons vu en mécanique classique, que la résultante des forces que l'extérieur exerce sur le
corps soit nul:

Cependant, quand un solide subit des contraintes et qu'il peut en subir, il peut y avoir
déformation qui peut être suivie d'une rupture ou d'une modification similaire. Plus,
précisément, il y a "déformation" d'un corps (non nécessairement solide) quand les distances
entre certains points du corps ont changé.

Lorsque dans l'étude théorique de l'élasticité, nous excluons les modifications du corps étudié
telles que les ruptures: nous disons que nous nous restreignons aux "déformations élastiques".

Le géométrie et la physique des déformations peut être complexe. Leur description se déduit
de celle d'un certain nombre de déformations élémentaires dont nous préciserons plus loin les
caractéristiques.

Les forces scalaires de contraintes de traction engendrent sur leurs faces respectives
des tensions "normales" (perpendiculaire donc):

937/2001
Sciences.ch 14/03/2005

En admettant que la force agit seule, la déformation unitaire est par définition :

Lorsqu'un parallélépipède est soumis à un effort de traction , il y a intuitivement


contraction des dimensions dans la direction . Contraction observable de façon tout aussi
intuitive pour .

Nous avons alors si agit seul:

où le signe "-" indique une contraction et où est une coefficient appelé "coefficient de
poisson".

Si agit seule:

En acceptant le principe de superposition des forces, l'effet produit par plusieurs forces
agissant simultanément est égal à la somme des effets produits par chacune des forces
superposées agissant séparément.

Ceci est admissible, étant donné la linéarité des équations unissant la déformation unitaire et
la tension normale. Nous obtenons alors:

En ayant procédé de manière identique pour les deux autres directions et .

A partir des relations précédentes, il est aisé de trouver les équations unissant à :

938/2001
Sciences.ch 14/03/2005

Soit un matériau soumis à des contraintes diverses. A l'intérieur de celui-ci, nous opérons, par
la pensée, l'extraction d'un parallélépipède rectangle. Les faces de celui-ci sont sollicitées par
des contraintes normales et tangentielles (sur le schéma ci-dessous le solide est en
équilibre statique).

Les contraintes normales et de tangentielles représentent les actions du parallélépipède


de matériau ôté mentalement sur les faces de l’élément examiné.

Il est intéressant (dans le sens que cela facilite l'analyse) de rechercher les contraintes qui
existent dans un plan faisant un angle avec l’axe des . Pour ce faire, nous imaginons un
triangle de matière ayant un angle au sommet enlevé hors de la matière mentalement. Nous
négligerons l'effet de la pesanteur.

Soit :

939/2001
Sciences.ch 14/03/2005

Posons:

et étant l'épaisseur du solide (non représenté sur le schéma précédent).

Sur la longueur , des contraintes apparaissent et se décomposent en contraintes normale


et tangentielles (dites de "cisaillement" ou de "flexion" également) .

Le problème consiste à établir les relations entre et et .

Les conventions de signes sont :

- Les contraintes exerçant une traction sont positives alors que les tensions exerçant une
compression sont négatives.

- Les contraintes ayant tendance à faire tourner le parallélépipède dans le sens des aiguilles
d’une montre, sont positives. Dans le sens anti-horaire, elles seront négatives.

L’équation d’équilibre de projection sur la direction est :

Rappelons que:

Comme et nous avons :

940/2001
Sciences.ch 14/03/2005

comme :

et

alors :

Finalement :

Conclusion : en fonction de et , il est possible de calculer la tension normale s qui


existe sur une surface plane quelconque d’angle .

L’équation d’équilibre de projection sur la direction de est:

comme:

Finalement :

Conclusion : En fonction de et , il est possible de calculer la tension tangentielle


qui existe sur une surface plane quelconque d’angle .

Soit, à présent, la situation suivante:

941/2001
Sciences.ch 14/03/2005

Il s'agit d'un bloc de matière dont l'on extrait virtuellement un plan de forme carré que l'on va
étudier en prenant en première partie qu'un des triangles rectangle le composant pour ensuite
étudier l'ensemble.

Avant la sollicitation, nous considérons donc le losange qui est en fait un carré à
suivant la direction .

Pendant la sollicitation, ce losange se déforme sous l’action des contraintes tangentielles


décomposées de contraintes de cisaillement pur et devient le losange . La diagonale
est alors étendue et la diagonale est comprimée. L’angle en qui valait vaut
après déformation (en ). De même, l’angle en qui valait vaut à présent
(Fig. A).

Remarque : l’angle est appelé "angle de glissement" et nous le considérerons comme faible.

Nous pouvons nous rendre compte de l’effet de la déformation en isolant le losange et en lui
faisant subir une rotation de . Après déformation, nous avons la forme indiquée par les
lignes en pointillées (Fig. B).

L’angle de glissement étant petit, nous avons :

Donc représente le glissement du coté par rapport à divisé par la distance entre les
deux plans et . L'analyse qui vient d'être effectuée reste valable quel que soit le corps
solide ou liquide considéré.

Soit, à présent, le cas d'un solide élastique obéissant à la loi de Hook. Le problème va
consister à établir la relation entre l'angle de glissement et les contraintes tangentielles

942/2001
Sciences.ch 14/03/2005

agissant sur les cotés du losange.

Soit le triangle rectangle . L'allongement du coté et le raccourcissement du coté


pendant la déformation s'obtiennent à partir des équations suivantes :

Comme:

Nous avons :

et

Donc :

donc la longueur oa' diminue si augment .

donc ob' augmente si augmente.

Du triangle rectangle , nous avons :

Or:

943/2001
Sciences.ch 14/03/2005

Comme ( est petit) nous avons :

Soit:

Finalement nous avons la formule donnant le module de glissement :

MODULE DE COMPRESSIBILITÉ

Nous reste encore à voir la provenance mathématique de l'expression d'un autre module tout
aussi important que le module en cisaillement: le module de compressibilité .

Soit les équations déterminées dans l'étude précédente:

Si les forces appliquées sur le cube sont égales en intensité nous avons:

Ce qui nous donne:

944/2001
Sciences.ch 14/03/2005

En sommant les termes selon le principe de superposition linéaire des forces:

Or:

Finalement:

ce que l'on note également:

ou encore:

avec étant par définition le "coefficient de compressibilité".

MODULE DE FLEXION

Pour l'étude du module de flexion considérons la situation ci-dessous:

945/2001
Sciences.ch 14/03/2005

La figure de gauche ci-dessus représente un matériau à l'état statique. La figure de droite


représente le même matériau mais soumis à un moment de force couplé .

Comme la matériau subit à sa surface à la fois une compression et à l'opposé une tension, il
doit donc exister une frontière (un ligne ou un plan) ou aucune contrainte n'existe. Cette ligne
ou ce plan (c'est rare que nous ayons affaire à un matériau ayant uniquement deux
dimensions…) est appelé "plan neutre" (ou Neutral Plan en anglais, abrégé NP). Ce plan
neutre va nous servir de référence pour définir la contrainte de flexion.

Maintenant que ce plan est défini, considérons les figures ci-dessous:

Soir le rayon de courbure de la barre (cylindre, plaque, parallélépipède, …). La contrainte


sur le segment est définie par la relation:

Les longueurs et sont définies par:

et la longueur par:

ainsi l'expression de la contrainte devient:

946/2001
Sciences.ch 14/03/2005

ce qui indique que la contrainte varie de façon linéaire avec .

Nous pouvons définir le module de flexion par:

Considérons l'état statique de la barre. La somme des contraintes de traction et compression


sont alors nulles. Effectivement, nous le voyons bien si nous considérons le schéma ci-
dessous:

Considérons la force agissante sur un élément de surface . Nous pouvons considérer


l'équilibre des forces à l'état statique tel que:

En substituant l'expression de la contrainte obtenue précédemment:

En supposant linéaire la caractéristique de contrainte en première approximation donc


.

En simplifiant un tant soit peu:

Si nous multiplions l'intégrale par alors la relation doit être égale au moment de force
appliqué tel que:

947/2001
Sciences.ch 14/03/2005

En substituant par l'expression de la contrainte obtenue précédemment:

Ce qui nous amène à définir le terme:

comme ce que les ingénieur nomment "le moment d'inertie de la barre par rapport au plan
neutral". Ce terme représente une mesure de la rigidité de la section transversale de la barre
d'un point de vue géométrique, sans considérations des propriétés matérielles.

Substituant cette relation dans l'équation de contrainte de flexion, nous obtenons le "module
de flexion":

La difficulté pour l'ingénieur consiste souvent à localiser mathématiquement le plan neutral.

LIQUIDES

Les fluides usuels sont de deux types: les liquides et le gaz (les solides sont aussi parfois
considérés comme des fluides...ce n'est qu'une question d'opinion..). Etymologiquement, un
fluide est susceptible de s'écouler. Le liquide adopte la forme du récipient qui le contient tout
en conservant un volume propre à peu près invariable. Le gaz n'a pas de volume propre: il
envahit uniformément (mécanique statistique de Boltzmann) le récipient dans lequel il est
maintenu. Une atmosphère en constitue un cas spécial, du fait qu'elle est maintenue par la
gravité à la périphérie d'un astre, ce qui exclut l'uniformité de la densité ou pression.

La distinction entre liquide et gaz est subtile. Nous pouvons cependant dire que le volume
propre des liquides manifeste l'existence d'une cohésion liée à une densité assez grande
(liaisons de Van der Waals); cette cohésion disparaît avec le volume propre chez les gaz.

Si l'on compare les fluides avec les solides, la première remarque qui s'impose concerne
l'isotropie (les propriétés sont les mêmes dans toutes les directions spatiales) des fluides
usuels qui est toujours réalisée (si l'on agit pas sur le fluide en tout cas!).

Nous allons aborder la théorie de la mécanique des fluides en difficulté croissante et par
redondance. D'abord il va être démontré que les propriétés d'un fluide statique sont isotropes
(théorème de Pascal). A l'aide de ce résultat, il va être plus simple de comprendre le théorème
de Bernoulli qui va nous permettre, entre autres, de définir la concept de "pression
hydrostatique". Ensuite, nous construirons un modèle très important de la dynamique des
fluides, connus sous le nom de "équations de Navier-Stokes", que l'on dans tous les domaines
possibles (astrophysique, mécanique quantique, météorologie,..). Ce modèle de dynamique
des fluides est conséquent en développements théoriques et résultats expérimentaux et peut
être considéré comme un terrain difficile. Cependant, pour faciliter la lecture, nous avons
choisi de ne pas aborder celui-ci directement par usage du calcul tensoriel. Nous avons ainsi

948/2001
Sciences.ch 14/03/2005

fait en sorte que les variables tensorielles apparaissent d'elles-mêmes d'écoulant des résultats
simples de l'analyse vectorielle que nous obtiendrons. Une fois les équations de Navier-Stokes
déterminées et démontrées, nous verrons que nous pouvons retrouver l'expression du
théorème de Bernoulli à partir de ces mêmes équations.

La dynamique des fluides, ou "hydrodynamique", est de loin, le domaine de la mécanique


classique le moins aisé en ce qui concerne la description et la prédiction. C'est pourquoi le
théorème de Bernoulli s'utilise fréquemment, non pour expliquer en détail le comportement
d'un fluide, mais pour en faire une description qualitative.

THÉOREME DE PASCAL

Le résultat qui va suivre est de la plus haute importance pour comprendre l'ensemble de la
mécanique des fluides. Il faut prendre le temps de comprendre !

Si nous considérons les forces s’exerçant, en l’absence de mouvement, sur un tétraèdre


élémentaire de volume élémentaire . Il est toujours possible d’adopter un volume
suffisamment petit pour avoir une pression uniforme s’exerçant sur les faces du tétraèdre.

Soient , les pressions de réaction du fluide dues aux contraintes extérieures


sollicitant les faces respectives , , et de surface .
Soient également les cosinus directeurs (voir le chapitre d'analyse vectorielle du site) du
vecteur unitaire normal à la surface .

Le système étant en équilibre, la résultantes des forces de réaction du système est nulle.
Nous avons donc les équations suivantes résultant de la projections suivant les trois axes de
coordonnées:

949/2001
Sciences.ch 14/03/2005

Par simplification élémentaire il vient:

Nous obtenons alors la relation suivante:

Conclusion importante: en un point quelconque d’un fluide, la pression est indépendante de la


direction de la normale à la surface élémentaire sur laquelle elle s'exerce.

Par le principe de l'action et de réaction de Newton, nous sommes amenés à énoncer le


théorème de Pascal:

Les fluides incompressibles transmettent intégralement et dans toutes les directions, les
pressions qui leur sont appliquées.

Ce théorème est fondamental aussi bien en mécanique des fluides qu'en mécanique des gaz et
les implications pratiques sont énormes (ce théorème explique entre autres, que la pression est
indépendant de la géométrie du contenant du liquide) !

VISCOSITÉ

En mécanique des fluides, il est utile de considérer plusieurs types fluides ayant des
caractéristiques qui les différent. Ceci s'avère particulièrement pratique pour les simulations
tout en restant conforme à l'observation expérimentale.

Nous définissons la "viscosité " par les forces internes s'opposant au déplacement des
diverses couches composant le fluide. Nous distinguons la "viscosité dynamique" et la
"viscosité cinématique" .

1. La viscosité dynamique:

avec étant le coefficient de viscosité dynamique (l'unité étant le Poiseuil ),


variation de la force de frottement entre deux couches infiniment voisines, variation
de la vitesse par la distance entre deux couches infiniment voisines et étant la
surface considérée .

Conclusion: le Poiseuil est la viscosité d'un fluide nécessitant 1 Newton pour faire glisser à la
vitesse de 1 mètre pas seconde, deux couches fluides de 1 mètre carré distantes de 1 mètre.

950/2001
Sciences.ch 14/03/2005

Remarque: anciennement, nous employions comme unité la poise

2. La viscosité cinématique est définie par:

Une transformation de la définition de la viscosité dynamique donne (il faut se rappeler de


cette relation pour plus tard !!):

Soit:

Par définition les fluides ayant les caractéristiques suivantes:

sont nommés respectivement:

- fluides pseudo-plastique (1)


- fluides newtoniens (2)
- fluides dilatant (3)

Il existe encore un 3 autres types de fluide non représenté sur le schéma et dont la viscosité est
supposée nulle (voir chapitre de thermodynamique) :

- fluides parfaits (4)


- fluides semi-parfaits (5)
- fluides réels (6)

Nous reviendrons sur les propriétés de la viscosité dynamique et cinématique lors de la


démonstration des équations de Navier-Stokes-(Reynolds).

LOI DE POISEUILLE

951/2001
Sciences.ch 14/03/2005

En 1835 un médecin français, Jean Léonard Marie Poiseulle fit une série d'expériences
soignées, pour déterminer comment un fluide visqueux s'écoule dans un tuyau étroit. Son but
était de comprendre la dynamique de la circulation sanguine chez l'homme. Le plasma du
sang se comporte comme un fluide newtonien, tandis que le sang entier ne l'est pas. Presque la
moitié du volume normal du sang est faite de cellules assez grandes pour pérturber
l'écoulement laminaire, surtout quand elles entrent en contact avec les parois des vaisseaux,
un phénomène qui prend de l'importance dans le capillaires très étroits. Néanmoins, l'analyse
de Poiseuille s'applique à l'écoulement dans les veines et les plus grosses artères et elle a une
grande valeur, bien qu'elle soit un peu simpliste.

Le résultat de Poiseuille peut être établi en considérant le fluide dans un tuyau comme formé
de couches cylindriques orienté selon un axe de rayon concentriques qui se déplacent à
des vitesses qui vont en décroissant à parti du centre (symétrique circulaire supposée).

Alors la relation définissant la viscosité s'écrit :

Ce qui nous donne la force de viscosité sur le cylindre. La surface de contact de chaque
couche cylindrique de longueur est donnée par et donc :

L'origine de l'accélération (in extenso de la force) ne peut se faire que par une différence de
pression telle que ce qui nous amène à écrire :

En intégrant membre à membre, nous obtenons :

Soit :

La courbe représentative de la vitesse en fonction de est une parabole dont le sommet se


situe sur l'axe centre du cylindre ( ). Le débit volumique transporté par une couche
cylindrique entre et est . Ainsi, le débit total est :

952/2001
Sciences.ch 14/03/2005

et nous obtenons la loi de Poiseuille pour le débit laminaire visqueux :

Nous trouvons donc le résultat logique que le débit augment avec le gradient de pression
et le rayon du tube, et diminue avec la viscosité.

THÉORÈME DE BERNOULLI

Quand nous discutons du mouvement d'un fluide, l'équation de continuité (voir le chapitre
thermodynamique), qui exprime la conservation de la masse du fluide est une notion
importante.

Considérons cette équation dans le cas particulier qui nous intéresse ici un fluide non
visqueux en écoulement laminaire se déplaçant à l'intérieur d'un tube de lignes de courants
parallèles (le mouvement du fluide est de type irrotationnel - voir le chapitre d'analyse
vectorielle du site), délimité par la surface :

Nous sommes en régime stationnaire (l'aspect du mouvement est indépendant du temps) et la


masse n'est ni apportée par une source ni enlevée par un puits à l'intérieur de la région
considérée. Le volume de fluide qui traverse dans l'intervalle correspond à un cylindre
de base , de longueur et donc de volume . La masse de fluide qui a traversé
pendant le temps est donc:

De même:

est la masse de fluide qui a traversé:

953/2001
Sciences.ch 14/03/2005

pendant le même intervalle de temps. Avec les hypothèses faites, la conservation de la masse
exige que les deux masses soient les mêmes, ou que exprimé autrement:

D'où:

Ceci est la forme de l'équation de continuité dans le contexte qui nous intéresse. De plus, si le
fluide est incompressible, la densité est partout la même et l'équation précédente se réduit à:

Considérons maintenant une région dans un fluide où il y a un flux stationnaire comme


l'indique la figure ci-dessous:

Pendant un court intervalle de temps , le fluide qui, initialement, traversait a progressé


jusqu'à une surface à la distance tandis que le fluide qui traversait se
retrouve en à une distance . Puisque le reste du volume entre les surfaces et
reste inchangé, nous allons porter notre attention sur les deux volumes (égaux) hachurés
sur la figure.

Ces deux volumes sont égaux car le fluide est incompressible et l'équation de continuité est
valable. Soient et les forces exercées sur les surfaces et en raison de la pression
existant dans le fluide. A cause de ces forces, le fluide produit ou reçoit du travail en
déplaçant les deux volumes. En , la surface est poussée par le fluide et le travail exercé sur
le fluide alors qu'en le fluide pousse la surface et le travail effectué par le fluide est
. Le travail total exercé sur le volume de fluide situé entre et est donc:

en appelant et les pressions respectives en et et en écrivant:

954/2001
Sciences.ch 14/03/2005

d'après la définition de la pression. Comme:

d'après l'équation de continuité et l'hypothèse d'incompressibilité, nous pouvons écrire que:

Le travail extérieur exercé sur le système change son énergie propre comme l'établit la
thermodynamique ( ). Pour le volume de fluide considéré, l'énergie propre des
volumes mis en évidence comprend l'énergie cinétique et l'énergie potentielle de gravitation.
Le fluide entre et gagne de l'énergie dans le volume . Supposons que les deux
volumes aient une masse égale , de nouveau à cause de l'équation de continuité. Alors le
gain net d'énergie est:

Puisque nous avons déjà supposé le fluide incompressible, la densité est la même partout et
peut être remplacé par aux deux extrémités. D'où:

En combinant cette relation avec nous obtenons :

ou:

Comme l'équation ci-dessus concerne des grandeurs prises en deux points arbitraires le long
d'une ligne de courant, nous pouvons généraliser et écrire:

Ce résultat, connu sous le nom de théorème de Bernoulli, exprime la constance de la pression


le long d'une ligne de courant dans un fluide incompressible, irrotationnel et non visqueux
(nous reviendrons là-dessus après avoir déterminé les équation de Navier-Stokes).

955/2001
Sciences.ch 14/03/2005

Considérons maintenant deux applications importantes du théorème de Bernouilli.

Si le fluide se déplace dans un plan horizontal, l'énergie potentielle de gravitation reste


constante et l'équation de Bernoulli se réduit alors à:

Donc, dans un tuyau horizontal, la vitesse est d'autant plus grande que la pression est plus
faible et réciproquement. Nous utilisons cet effet pour créer la poussée d'un avion.

Le profil d'une aile est construit de telle sorte que l'air a une vitesse plus grande au-dessus de
la surface de l'aile qu'au dessous qu'au dessus, ce qui produit une pression plus forte au-
dessous qu'au dessus. Il en résulte donc une force résultant vers le haut.

Autrement dit, une spécialiste dans l'aérodynamique dirait:

- à l'extrados : Par effet de courbure, les particules d'air sont contraintes de parcourir une
distance plus grande ;leur vitesse va donc d'abord s'accroître fortement pour diminuer ensuite
afin de retrouver au bord de fuite la vitesse initiale de l'écoulement. Tout l'extrados est donc le
siège d'une dépression locale généralisée. La couche limite, d'abord laminaire, devient peu à
peu turbulente, voire tourbillonnaire lorsqu'on approche du bord de fuite.

- à l'intrados : le profil constituant un obstacle à l'écoulement, l'air va se trouver freiné : nous


voyons donc apparaître une surpression localisée sur l'intrados. En fait, avec la forme des ailes
d'avion actuelle, en position horizontale, l'effet Bernoulli serait négligeable. Pour qu'un avion
décolle, il faudrait que l'extrados ait une surface beaucoup plus grande.

C'est bien mieux ainsi non ?

THÉORÈME DE TORICELLI

Le théorème de Toricelli permet de déterminer la vitesse d'écoulement d'un liquide. C'est un


cas classique d'étude dans les petites écoles.

Considérons un volume fermé contenant un liquide de masse volumique et muni d'un


orifice de surface , duquel le liquide coule vers l'extérieur. Nous voulons déterminer la

956/2001
Sciences.ch 14/03/2005

vitesse d'écoulement du liquide de cet orifice. Le volume est supposé être assez grand pour
que ni le niveau du liquide, ni la pression au-dessus de sa surface ne varient de façon
appréciable pendant l'écoulement. Comme le tube d'échappement de liquide va de la région de
la surface du liquide à l'orifice ouvert à l'air libre, nous avons . Un liquide coulant à
l'air libre est à la pression atmosphérique , , car le liquide est entouré d'air libre et rien
ne peut maintenir une différence de pression. D'après l'équation de Bernoulli, avec
, nous trouvons :

d'où :

De l'équation de continuité ( ), nous déduisons que si alors et


est alors négligeable devant . Dans le cas particulier, mais fréquent, où le réservoir est
ouvert à l'air libre ( ), la densité d'énergie de pression disparaît. Le fluide coule sous
l'effet de la gravité, sans être poussé par une différence de pression. Nous trouvons alors :

Cette relation constitue le "théorème de Toricelli". Chose curieuse, nous avons déjà vu cette
relation en mécanique classique pour la vitesse de chute libre d'un corps. Il en retourne
l'observation faite par Toricelli : si le jet est dirigé directement vers le haut, il atteint presque
le niveau de la surface du liquide dans le volume. La raison pour laquelle le jet n'atteint pas
effectivement ce niveau est une certaine perte d'énergie à cause du frottement.

EFFET VENTURI

Certaines applications pratiques de la mécanique des fluides résultent de l'interdépendance de


la pression et la vitesse. Il y a une catégorie de situations dans lesquelles la variation d'énergie
potentielle gravitationnelle est négligeable. L'équation de Bernoulli relie alors la différence de
pression à la différence d'énergie cinétique donc la variation du carré de la vitesse.
Considérons par exemple, un segment de tuyau ayant une section droite , qui se rétrécit à
un certain endroit jusqu'à avoir une section , puis il retrouve sa section normale . Nous
savons (équation de continuité) que :

qui veut dire, comme nous l'avons vu, qu'une diminution de la section traversée par le fluide
se traduit par une augmentation de sa vitesse.

Dans toute situation où le flux entrant est environ au même niveau que le rétrécissement
, l'équation de Bernoulli s'emploie pour exprimer la différence de pression :

957/2001
Sciences.ch 14/03/2005

devient :

Utilisant l'équation de continuité, pour éliminer , nous obtenons :

Comme le second membre de la relation est positif et : il y a donc une chute


de pression dans la région étroite. En arrivant à la région divergente à nouveau en , la
pression du fluide augmente de nouveau et la vitesse reprend sa valeur initiale. Cette
diminution de la pression qui accompagne l'augmentation de la vitesse est appelée "effet
Bernoulli" ou "effet Venturi".

Remarque : Paradoxalement l'effet Venturi se produit aussi lors du franchissement d'un


sommet ou d'une crête par l'air atmosphérique ou également dans les rues des villes. En effet
l'air qui arrive sur la montagne ou la crête à tendance à "s'écraser" dessus. La section
d'écoulement de l'air au sommet est donc plus faible qu'à la base. Il se produit donc également
un effet Venturi : la vitesse du vent est plus élevée sur les sommets et les crêtes qu'en bas (les
professionnels du planeur en savent quelque chose…).

ÉQUATIONS DE NAVIER-STOKES

Soit un parallélépipède élémentaire extrait d'un fluide statique à l'équilibre de dimensions


représenté à la figure ci-dessous. La matière à l'équilibre composant le
parallélépipède est en général soumise à des forces de volume dans toutes les directions
(théorème de Pascal) dont les composantes sur les trois axes sont représentées sur la figure
ci-dessous (ces forces peuvent être de nature gravitationnelles, électromagnétiques ou
inertielles...)

958/2001
Sciences.ch 14/03/2005

Nous pouvons, comme nous l'avons représenté ci-dessus, décomposer et translater l'ensemble
des forces auxquelles est soumis le parallélépipède aux centre des faces de ce dernier. Nous
représentons bien évidemment chacune des contraintes sur chacune des faces comme la
somme des contraintes normales et tangentielles telles que nous l'avions fait pour l'étude des
solides sous contrainte (selon les trois axes toujours, d'où la somme de trois composantes!).

Au total, nous nous retrouvons avec 18 composantes de contraintes normales et tangentielles:

Nous cherchons à minimiser le nombre de composantes normales afin de déterminer quelles


sont les contraintes suffisantes sur chacun des axes. Ainsi nous poserons:

Donc trois composantes suffisent pour connaître les forces de contraintes normales aux
surfaces selon chaque axe.

Si nous effectuons la somme des moments de forces par rapport aux centres de gravité pour
chaque axe de symétrie du parallélépipède il est évident que sur les 12
composantes tangentielles, 6 suffisent pour décrire l'ensemble du système.

Ainsi pour le plan passant par le centre de gravité nous avons:

959/2001
Sciences.ch 14/03/2005

Pour le plan :

Pour le plan :

Donc pour chaque plan , une composante suffit pour décrire l'ensemble de
moments de forces.

Ainsi, par souci de simplification d'écriture, nous poserons (il est plus conforme de faire les
développements avec des indices en minuscules):

et

Au total, cela nous fait donc 3 composant tangentielle plus 3 composantes normales qui sont
suffisantes et nécessaires pour décrire les contraintes sur le parallélépipède selon chaque axe
du plan de symétrie de ce dernier:

Nous pouvons obtenir les mêmes composantes d’équilibre en considérant cette fois un
tétraèdre régulier élémentaire (extrait du cube ci-dessus) statique. Le but étant de démontrer
que nous retrouvons bien les 6 composantes déterminées précédemment.

960/2001
Sciences.ch 14/03/2005

Pour connaître l’aire des faces , nous multiplions la surface (notée ci-
après: ) par le cosinus de l'angle que forment les vecteurs et .

Effectivement, soit les surfaces:

et

Cependant, nous cherchons à exprimer les en fonction de . Le schéma ci-dessous (coupe


du tétraèdre) devrait aider à comprendre le raisonnement:

et donc:

Finalement:

961/2001
Sciences.ch 14/03/2005

Le rapport:

d'où:

Le principe d'analyse étant le même pour toutes les autres surfaces telles que:

Nous écrirons donc:

tel que:

Remarque: nous pouvons facilement connaître les valeurs des à l'aide de l'analyse
vectorielle. Effectivement, le plan étant d'équation:

en simplifiant par :

Le vecteur normal au plan étant bien:

pour connaître les cosinus de l'angle du vecteur normal avec les , il suffit d'assimiler ces
derniers au vecteurs de base tel que (trigonométrie élémentaire):

962/2001
Sciences.ch 14/03/2005

et en procédant de même pour tous les autres .

L'équilibre des forces nous donne:

Après simplification:

Suivant les autres axes:

Soit en résumé:

En utilisant la représentation matricielle, nous obtenons:

Soit en notation indicielle:

avec ( , si )

Nous voyons apparaître une grandeur mathématique ayant 9 composantes, alors qu’un
vecteur dans le même espace en possède 3. Nous connaissons ce genre d'être
mathématique que nous avons déjà étudié en algèbre dans le chapitre de calcul tensoriel. La
grandeur est appelée "tenseur des contraintes du second ordre". En outre, certaines
composantes peuvent êtres égales ( , si ) , ce qui le rendrait symétrique. Il ne
possède alors plus que les 6 composantes distinctes, relativement aux nombres de
composantes suffisantes pour d'écrire totalement un système à l'équilibre.

Pour étudier les déformations d’un milieu continu tel qu'un fluide, nous considèrerons d'abord
le cas de très faibles déformations. Les petits déplacements d’un point seront représentés
par parallèles aux axes d’un référentiel . Nous admettons que ces composantes

963/2001
Sciences.ch 14/03/2005

sont des quantités très faibles variant d’une façon continue dans le volume du corps considéré.

Soit un segment linéaire situé dans un solide avant déformation. Dans un référentiel
, nous noterons et les coordonnées de et .

Pendant la déformation, la ligne devient tel que représenté ci-dessous:

Soient les déplacements du point parallèlement aux axes et

les déplacements du point parallèlement aux mêmes axes.

Les coordonnées des points et sont alors :

et

Avant déformation, soit la longueur :

Après déformation, nous avons une longueur valant :

Si est l’allongement de l’élément pendant la déformation, nous avons:

En effectuant les quelques transformations suivantes:

964/2001
Sciences.ch 14/03/2005

En développant:

Soit:

En négligeant les termes de déplacement d’ordre supérieur et en tenant compte de la relation:

il vient que disparaît avec ainsi que les termes au carré,


nous avons:

Or, la géométrie analytique (trigonométrie élémentaire; rapport des côtés opposés et adjacents
à l'hypoténuse) donne les relations suivantes :

qui sont les cosinus directeurs de la droite .

Nous pouvons alors écrire:

965/2001
Sciences.ch 14/03/2005

La variation étant un déplacement faible, nous avons recours à un développement en série


de Taylor (voir section d'algèbre au chapitre traitant des suites et séries) dont nous négligeons
les termes d’ordre supérieur (linéarisation des équations) :

Nous avons également:

La différence donne:

Donc nous pouvons maintenant écrire :

Finalement:

En groupant, nous avons :

Cette expression permet en un point quelconque le calcul de la déformation dans une


direction ayant comme cosinus directeur en fonction des déplacements en ce
point !

Soit le cas où la ligne coïncide avec l’axe , nous avons , l’équation


précédente devient alors:

966/2001
Sciences.ch 14/03/2005

Nous avons, si coïncide avec l’axe ou avec l’axe


:

Les grandeurs sont appelées: "déformations normales" et non pas d'unités.

Pour l'interprétation des termes , nous nous référerons à


la figure suivante:

Soient deux segments de droite et situés dans le plan . Avant déformation


et coïncidaient avec le référentiel orthonormé . Après déformation, ils peuvent
prendre la position et . Les composantes du déplacement de sont .

- La composante du déplacement de est calculée comme suit:

avec

car l’angle est faible .

En toute généralité comme , nous écrirons:

967/2001
Sciences.ch 14/03/2005

- La composante du déplacement de est elle:

Comme avant déformation, l’angle est de , après déformation, l’angle droit est
réduit de . Cette réduction est appelée "déformation de cisaillement" ou
"déformation tangentielle" et est notée par .

Nous procéderons de la même façon pour les autres termes, d’où :

Compte tenu du quadruplet de groupes d'équations démontrés précédemment dans cette


section (voir les déformation des solides):

Nous pouvons résumer:

968/2001
Sciences.ch 14/03/2005

Généralement, nous posons pour simplifier les notations (il faut cependant pas croire que la
déformation en cisaillement devient une déformation normale ! ce n'est qu'une convention
d'écriture dont le physicien doit se rappeler !):

De même, nous posons:

Soit finalement:

En tenant compte que:

Nous obtenons les tensions de cisaillement comme suit:

969/2001
Sciences.ch 14/03/2005

Considérons maintenant, pour exemple, un fluide circulant dans la direction de avec un


gradient de vitesse dans la direction de :

En se plaçant au niveau de et au point 1 d’abscisse , nous avons une vitesse et au


point 2 d’abscisse , une vitesse:

(avec )

Dans la direction de , il n’y a pas de composante de vitesse donc:

(avec )

Nous supposons maintenant que les tensions de cisaillement sont proportionnelles à à un


facteur près tel que:

avec:

Il donc possible de considérer des déplacements par unité de temps en posant:

970/2001
Sciences.ch 14/03/2005

En rapprochant cette dernière relation de:

nous pouvons dire alors que initialement valable dans un milieu élastique solide considéré
par ses déplacements est l'analogue de dans le cas d’un fluide visqueux considéré par les
déplacement par unité de temps. Ainsi, nous voyons que les unités sont conservées.

En considérant également les déformations par unité de temps pour les contraintes normales
(nous y reviendrons en détail un peu plus loin), nous avons alors le système d'équations:

Ainsi, nous obtenons une écriture condensée:

où est le symbole de Kronecker :

Le tenseur décrit ainsi en partie l'ensemble de contraintes d'un fluide visqueux dans lequel
nous avons supposé dans le cadre de l'hypothèse d'une fluide newtonien qu'il y a des relations
linéaires entre les tensions et les déformations normales.

Nous posons maintenant la somme des contraintes dynamiques sous une forme générale que
nous allons justifier:

971/2001
Sciences.ch 14/03/2005

où le terme se justifie par le fait que dans le cas statique, une pression dynamique
constante existe toujours en un point d’un fluide que l'on a pas dans le cas d'un solide. Pour
justifier le signe négatif, nous observerons que dans l’expression de , les deux premiers
termes du membre de droite correspondent, dans l’étude précédente ,à des contraintes
d’extension, alors que la pression correspond à une compression du fluide

Il nous reste à présent, à déterminer le coefficient . Soit , nous avons alors . Il


vient successivement et par addition:

Cette expression doit répondre à un fluide qui est également dans une situation statique tel
que:

Il vient alors que dans la cas statique:

Puisque:

Nous avons alors:

L’expression générale des contraintes s’écrit alors pour un fluide newtonien:

Présentement, nous allons introduire les opérateurs de l’analyse vectorielle afin de disposer
d’une expression plus générale. De cette façon, nous pourrons adapter la formulation à
n’importe quel système de coordonnées (cartésiennes, cylindriques, sphériques,...) ce qui
facilitera la résolution de problèmes pratiques.

972/2001
Sciences.ch 14/03/2005

Nous avons vu que pour un solide, nous avions:

Nous allons déterminer les équations sous la forme indicielle en considérant toujours les
déplacements par unité de temps (vitesses).

tel que et que

Pour nous avons ainsi:

ou

Pour nous avons:

ou

Nous pouvons dès lors écrire:

En effectuant la somme des termes de:

Or, les outils de l'analyse vectorielle nous permettent d'écrire:

Pour le fluide, nous aurons ainsi:

L'équation dynamiques des contraintes générale s'écrira alors sous la forme suivante :

973/2001
Sciences.ch 14/03/2005

Il est, à présent, utile de repasser sous une forme développée pour l'équation précédente, en se
rappelant que:

Écrivons maintenant le système d'équations de Newton (sommes des contraintes dynamiques


internes et externes à un élément de volume d'un fluide) qui est:

où:

- est la somme des forces externes par unité de volume

- est la somme des forces internes par unité de masse volumique (il est intéressant de noter
cela ainsi, car ce facteur change en fonction de la température)

- est la densité du fluide

Nous avons:

En introduisant les expressions de obtenues dans la relation ci-dessus, nous aboutissons


aux équations:

974/2001
Sciences.ch 14/03/2005

Ce sont les "équations de Navier-Stokes" de la dynamique des fluides newtoniens. Il en existe


deux formes condensées que nous allons de suite déterminer.

En reprenant la première équation de Navier-Stokes et en la développant, il vient :

Comme:

et que:

Nous obtenons:

En simplifiant, il vient finalement:

En opérant de la même manière pour les deux autres composantes, nous pouvons réduire le
système d'équations de Navier-Stokes à une seule équation vectorielle :

975/2001
Sciences.ch 14/03/2005

Comme (voir le chapitre d'analyse vectorielle):

Nous avons:

Soit en final:

Remarque: nous trouvons également parfois dans la littérature, une équation contenant une
seconde viscosité , alors que se manifeste rigoureusement que lors du cisaillement pur
selon nos hypothèses, apparaît lors d'une compression omnidirectionnelle
s'accompagnant d'une variation de densité.

L'équation précédente s'écrit alors :

C'est "l'équation de Navier-Stokes".

FLUIDE INCOMPRESSIBLE

Dans un fluide incompressible, nous avons par définition . L'équation de conservation


qui est (voir cours de thermodynamique):

s'écrit alors:

soit:

L'équation de Navier-Stokes:

s'écrit alors:

976/2001
Sciences.ch 14/03/2005

ou autrement:

Si de plus la viscosité est négligeable, nous avons :

C'est équation est appelée: "équation d'Euler de 1ère forme".

Il existe une deuxième forme de l'équation d'Euler dans le cadre d'un fluide incompressible et
à viscosité négligeable que nous allons de suite déterminer:

Si , nous pouvons écrire:

Ce qui peut aussi s'écrire:

Ce qui s'écrit encore:

Le premier facteur peut être considéré comme le produit scalaire suivant :

Soit:

La dérivée particulaire peut alors prendre la forme condensée suivante :

977/2001
Sciences.ch 14/03/2005

L'équation d'Euler de 1ère forme:

devient compte tenu de la dérivée particulaire:

ou encore:

Nous avons vu en analyse vectorielle que:

Si nous posons , nous avons:

Soit:

Finalement, nous obtenons une nouvelle équation appelée "équation d'Euler de 2ème forme" et
qui s'écrit:

Bien que les deux équations d'Euler soient très importantes, il en existe une forme variée très
utile en météorologie que nous allons de suite déterminer.

Nous nous basons toujours sur l'écoulement d'un fluide incompressible et non visqueux, mais
dont les forces de volume dérivent cette fois-ci d'un potentiel ( étant un
potentiel).

Dans ce cas, nous recourons à l'équation d'Euler sous sa 1ère forme:

978/2001
Sciences.ch 14/03/2005

Puisque les forces volumiques dérivent d'un potentiel , nous avons:

Nous rappellons la relation:

Soit un vecteur , il vient:

donc:

donc nous pouvons aussi écrire:

En reprenant la relation:

L'équation:

devient:

Donc:

et puisque:

Nous pouvons écrire:

979/2001
Sciences.ch 14/03/2005

Nous savons que donc:

En écrivant le produit vectoriel sous forme développée, nous avons:

Ce qui donne:

Supposons que soit est un vecteur vitesse angulaire constant, nous avons alors:

L'équation:

s'écrit alors:

Nous retrouvons dans cette équation, utilisée en météorologie, l'accélération de Coriolis que
nous avions déterminé en mécanique classique du point matériel rigide.

Si l'écoulement s'effectue à vitesse constante et n'est pas rotationnel (non turbulent)


, alors l'équation précédente se réduit à:

En dynamique classique du point matériel rigide, nous avons montré que dans le cas d'un
potentiel gravitationnel Terrestre:

980/2001
Sciences.ch 14/03/2005

étant l'altitude d'un point du fluide par rapport à un niveau de référence . Si nous prenons
pour le niveau du sol, l'avant dernière relation devient :

Le terme entre crochet pour satisfaire cette relation doit être tel que:

Nous retrouvons donc bien le théorème de Bernoulli ce qui conforte notre modèle des fluides

FLUIDE COMPRESSIBLE

Dans ce cas est une fonction de la pression (cas des fluides barotropes). Nous
considérons également que la viscosité est négligeable. Il vient alors:

L'équation:

s'écrit alors:

FLUIDE STATIQUE

Dans le cas statique et l'équation:

devient simplement:

981/2001
Sciences.ch 14/03/2005

NOMBRE DE REYNOLDS

Considérons d'abord, pour simplifier, le cas incompressible. L'équation de continuité (vue en


thermodynamique) s'écrit alors:

s'écrit alors:

Nous choisissons maintenant plusieurs grandeurs de références notées par un indice tel que:

et

Alors:

donc l'équation des déformations par unité de temps devient:

Nous avons également:

Restreignons nous à l'étude d'une composante:

En multipliant par la densité :

982/2001
Sciences.ch 14/03/2005

Ecrivons l'équation de Navier-Stokes pour une composante:

Les termes ou apparaissent les coefficients de viscosité peuvent être réécrits tels que:

Ainsi par correspondance:

En introduisant les variables adimensionnelles:

car comme nous l'avons vu:

d'où:

ou encore:

Nous multiplions la relaiton:

par et la divisons par tel qu'elle devienne:

983/2001
Sciences.ch 14/03/2005

Au niveau dimensionnel, nous avons:

et

Finalement:

Cette équation différentielle exprimée en variables relatives et sans dimensions est appelé
"équation de Navier-Stokes-Reynolds adimensionnelle"

Le terme , appelé "nombre de Reynolds," représente au niveau symbolique le rapport des


forces d'inerties sur les forces visqueuses.

où est la viscosité cinématique relative.

La viscosité dynamique est donc un terme inversement proportionnel à la valeur du nombre


de Reynolds.

APPROXIMATION DE BOUSSINESQ

Soit la relation déjà démontrée précédemment:

En y remettant le terme contenant la viscosité:

sans oublier qu'au niveau des notations (nous savons… c'est un peu embêtant):

Si le potentiel est de type gravitationnel, il va de soi que:

984/2001
Sciences.ch 14/03/2005

Donc:

Si l'on peut considérer le contexte de l'expérience tel que la densité volumique est inférieure
ou égale à celle de l'eau et que les vitesses sont petites, alors nous pouvons éliminer les termes
de second degré, tel que la relation précédente s'écrive:

Nous nous plaçons dans le cadre d'un fluide faiblement turbulent, dans lequel la pression et la
densité s'écrivent:

où représentent le terme d'accroissement turbulents par rapport aux valeurs statiques du


fluide.

Nous négligeons également les frottements sur les bords et donc la viscosité en supposant que
l'effet des turbulences devient vite prépondérant sur la valeur du frottement.

Donc nous avons le système d'équations:

qui peut s'écrire:

et encore:

ce qui s'écrit aussi:

Mais dans le cas statique:

985/2001
Sciences.ch 14/03/2005

Il nous reste donc:

En divisant le tout par :

mais encore une fois:

L'approximation de Boussinesq consiste à supposer que le fluide étant bien incompressible et


que le système étant à température constante et peu turbulent, nous ayons:

Ce qui nous donne:

Cette équation s'appelle "équation de Boussinesq" et va nous permettre d'introduire la théorie


du chaos dans le domaine de la météorologie et des fluides dans le cas particulier des cellules
de convection.

LOI DE STOKES

La complexité de l'hydrodynamique est un terrain tout désigné pour l'application de l'analyse


dimensionnelle dont nous avons parlé au tout début de notre étude de la mécanique
analytique. L'exemple analysé ici montre clairement les possibilités, mais aussi les limites de
la méthode.

Nous envisageons un solide de forme quelconque plongé dans un fluide incompressible animé
d'une vitesse uniforme à grande distance (le problème est équivalent à celui d'un solide qui se
déplace à vitesse constante dans un fluide au repos). Nous cherchons à exprimer la force
qu'exerce le fluide sur l'obstacle, supposée immobile (et notamment dépourvu de tout
mouvement de rotation).

La solution analytique est trop complexe pour perdre son temps à résoudre ce genre de
problème pratiques. Il convient de recourir à l'analyse dimensionnelle.

Les paramètre pertinents sont dans notre étude:

- la dimension linéaire de l'obstacle

986/2001
Sciences.ch 14/03/2005

- la vitesse du fluide à grande distance

- la masse du fluide

- la coefficient de viscosité du fluide

Comme il se doit, tous ces paramètres sont des constantes, bien que la vitesse varie en
direction et en norme au voisinage de l'obstacle: à grande distance, elle es uniforme et sa
valeur est bien un paramètre pertinent.

Nous pourrions nous demander si la pression ne devrait pas compter au nombre de ces
paramètres. Ce n'est pas le cas. La pression est conditionné par la valeur de la vitesse et par
celles des paramètres constants comme nous l'avons voyons dans le théorème de Bernoulli.
Inutile donc de rajouter un terme redondant.

Sans chercher l'unique combinaison sans dimension des quatre premières, nous appliquons la
démarche systèmatique. Nous voulons déterminer tels que:

Comme:

Il vient:

Le système de dimensionnalité s'écrit:

Ainsi:

Dès lors:

et curieusement nous retrouvons ici ce que nous avions vu dans notre développement de
l'approximation de Boussinesq:

987/2001
Sciences.ch 14/03/2005

Donc la force exercée par le fluide s'écrit:

Dans la littérature nous trouvons la notation:

où dépend de .

Les limites de la méthode analytique dimensionnelle (et même analytique tout court…)
apparaît lorsque l'on confronte ce modèle à l'expérience (évidemment nous pourrions faire des
modèles numériques de l'équation de Navier-Stokes-Reynolds pour l'ordinateur et ainsi
l'honneur serait sauf):

Ce graphique correspond à l'écoulement autour d'un cylindre; la vitesse étant


perpendiculaire à l'axe du cylindre. Les régimes sont signalés en chiffres romains: stationnaire
(I), périodique laminaire (II), turbulent avec superposition d'état périodique (III), turbulent
(IV).

La courbe à deux caractéristique remarquables:

1. Elle a été obtenue en modifiant de manière indépendante les valeurs des quatre paramètres.
Nous constatons que ne dépend que du seul nombre sans dimension : c'est un succès de
l'analyse dimensionnelle.

2. Il est vain d'espérer trouver une fonction analytique simple qui reproduise la courbe
expérimentale. Il faut donc aller voir de plus près les divers régimes correspondants à cette
courbe complexe.

La figure ci-dessous schématise l'écoulement d'un fluide visqueux autour d'un cylindre pour
différentes valeurs du nombre de Reynolds:

988/2001
Sciences.ch 14/03/2005

Le régime correspondant à la figure (a) est dit "stationnaire". Nous pouvons parler d'un
déplacement "quasi-statique" de la part du fluide où en chaque point l'accélération est
négligeable. Nous devons donc nous attendre à ce que l'inertie du fluide n'intervienne pas
dans l'expression de la force. Pour cela, il faut et il suffit que:

où est indépendant de .

Nous avons donc:

Le paramètre sans dimensions ne peut dépendre que de la géométrie de l'obstacle. Dans le


cas où l'obstacle est sphérique (cas très important en physique avec ), a été
déterminé expérimentalement comme valant tel que:

connue sous le nom de "loi de Stokes".

Dans le régime décrit par (b), deux tourbillons s'installent symétriquement derrière le
cylindre. Quand augmente au-delà de 40, nous distinguons l'allé de tourbillons de von
Kármán.

PRESSION HYDROSTATIQUE

Nous avons précédemment démontré sans mal que:

989/2001
Sciences.ch 14/03/2005

Si la vitesse du fluide est nulle:

Ce qui donne sous forme différentielle:

Si nous mesurons la pression du liquide à partir de sa face supérieur :

Si nous prenons comme référence, nous pouvons poser que:

d'où:

Si nous nous trouvons dans le cas d'un récipient remplis d'un fluide en contacte avec
l'atmosphère, pour calculer la pression dans ce fluide à un hauteur donné, il faudrait prendre
en considération la pression atmosphérique qui "s'appuie" également sur le fluide. Ainsi:

Conséquence: dans un liquide au repos, homogène, les équipotentielles gravifiques sont


confondues avec les surface isobares. Sans quoi, il y aurait mouvement transversal.

POUSSÉE D'ARCHIMÈDE

La poussée d'Archimède, phénomène mondialement connu, est souvent rebelle à l'intuition


première. Au fait, nous avons trop tendance dans les écoles à poser la poussée d'Archimède
comme un "principe" et ce à tort puisque une simple analyse mathématique suffit à la
démontrer (nous laisserons de côté l'analyse de l'énergie mise en jeu dans la cohésion
moléculaire de l'élément analysé..).

Si l'on isole une portion arbitraire d'un fluide en équilibre statique, les conditions de cet
équilibre s'écrivent nécessairement (sinon quoi le volume "explose" ou se dissocie) :

990/2001
Sciences.ch 14/03/2005

désigne le poids ( en première approximation…) de alors que le terme


décrit la résultante des forces de pression exercées sur la surface de : chaque
élément de surface subit une force:

où p est la pression qui s'exerce localement sur . Quant à , il s'agit d'un vecteur unité
dirigé normalement (à la perpendiculaire) à et vers l'intérieur de . La résultant de
toutes ces forces se note historiquement de la façon suivante:

qui exprime donc, comme vous le devinez, la fameuse "poussée d'Archimède" que le reste du
fluide exerce sur l'élément. L'intégrale porte sur toute la surface (cette surface est fermée, d'où
l'intégrale correspondante) de l'élément .

La condition d'équilibre montre que . Nous comprenons que soit dirigé vers le
haut: sous l'effet du champ gravitationnel, augmente avec la profondeur.

Si l'on remplace le fluide contenu dans le volume par un objet fluide ou solide quelconque
mais qui occupe le même volume, la poussée d'Archimède n'est pas modifiée. A cause de la
relation nous avons coutume de dire "qu'elle est équivalent au poids du fluide
déplacé".

Dans le cas où la direction et l'intensité dans le temps de est uniforme et constant nous
pouvons écrire:

et nous retrouvons la relation bien connue de tous les écoliers:

Il existe un autre possibilité pour arriver à cette démonstration qui demande moins d'outils
mathématiques et qui est plus abordable. Elle consiste en la suivante: considérons un cylindre
de volume V plongé dans un liquide à la vertical. Les composant horizontales des forces de
pression s'annulent mais la composante verticale au somment du cylindre (proche de la
surface) est inférieur en intensité (sauf cause extérieure) à celle se trouvant à sa base .
Nous pouvons donc écrire:

991/2001
Sciences.ch 14/03/2005

C'est un peu plus simple et ça tient en une ligne…

GAZ

Les solides ont une forme bien définie et sont difficiles à comprimer. Les liquides peuvent
s'écouler librement et leur écoulement est limité par des surfaces autoformées. Les gaz se
dilatent librement pour occuper le volume du récipient qui les contient, et ont une densité
environ mille fois inférieure à celle des liquides et des solides. Ils conduisent peu la chaleur et
l'électricité, sauf si nous les ionisons (formation d'un plasma). Les molécules d'un gaz neutre
se déplacent suivant des trajectoires rectilignes qui changent de direction à chaque collision
avec une autre molécule. Contrairement aux solides et aux liquides, les interactions entre
molécules restent faibles. Les propriétés macroscopiques d'un gaz se déduisent donc
directement des propriétés des molécules qui le composent (ou des atomes dans le cas d'un
gaz monoatomique).

TYPES DE GAZ

En théorie des gaz (nous parlons souvent de "théorie cinétique des gaz") nous considérons
toujours deux types de gaz neutres:

GAZ PARFAIT

Il s'agit d'un modèle dans lequel nous négligeons les interactions moléculaires du gaz, à
l'exception des collisions, et dont le volume propre est négligeable devant le volume du
récipient.

Lorsqu'un gaz est à faible pression, les interactions entre ses molécules sont faibles. Ainsi, les
propriétés d'un gaz réel à basse pression se rapprochent de celles d'un gaz parfait. Nous
pouvons alors décrire le comportement du gaz par l'équation d'état des gaz parfaits que l'on
démontre à l'aide des outils de la physique statistique:

avec le nombre de moles de gaz, la pression du gaz, le volume occupé par les moles
et la température absolue du gaz. La constante R étant la constante des gaz parfaits.

Cette équation montre que:

- à température constante, le volume d'un gaz est inversement proportionnel à sa pression (loi
de Boyle-Mariotte)

- à pression constante, le volume est proportionnel à la température absolue du gaz (loi de


Gay-Lussac)

- à volume constant, la pression du gaz est proportionnelle à sa température absolue (loi de


Charles)

GAZ RÉEL

L'équation d'état des gaz parfaits est approximative. Par exemple, un gaz parfait ne pourrait ni

992/2001
Sciences.ch 14/03/2005

se liquéfier ni se solidifier, quels que soient le refroidissement et la compression auxquels il


est soumis. Les gaz réels, surtout dans des conditions de pression et de température proches de
la transition à l'état liquide, peuvent présenter des écarts considérables avec la loi des gaz
parfaits!; il faut donc l'adapter aux cas réels. L'équation d'état de Van der Waals est
particulièrement utile et bien connue et est démontrée à l'aide des outils de la physique
statistique:

pour une mole, a et b étant des paramètres adaptables déterminés par des mesures
expérimentales effectuées sur le gaz concerné. Ce sont des paramètres qui varient d'un gaz à
un autre.

L'équation de Van der Waals peut également être interprétée au niveau microscopique. Les
molécules interagissent les unes avec les autres. Cette interaction est fortement répulsive pour
les molécules proches les unes des autres, devient légèrement attractive pour un éloignement
moyen et disparaît lorsque l'éloignement est important. À pression élevée, la loi des gaz
parfaits doit être rectifiée pour prendre en compte les forces attractives ou répulsives.

THÉORÈME DU VIRIEL

Par définition, l'expression du viriel d'un point matériel est le scalaire:

Par définition, le viriel d'un système composé de N points matériels est:

Soumis à une force centrale, le viriel s'écrit (par les propriétés du produit scalaire):

Théorème du viriel:

Pour un système en équilibre (!), l'énergie interne est égale à l'opposé de son demi viriel total
lorsque toutes es particules sont repérées par rapport é son centre de masse.

Démonstration:

Soit la relation mathématique:

Sa dérivée seconde:

993/2001
Sciences.ch 14/03/2005

En multipliant par et en sommant sur :

Or:

et:

Donc:

Cette dernière expression est valable quelle que soit la position d'un système de coordonnées
adopté. Cependant, il est intéressant de placer son origine au centre de masse du système car
nous ne sommes plus dépendant de son mouvement.

Si le système est en équilibre, les quantités macroscopiques qui la caractérisent ne sont pas
dépendantes du temps. Nous en concluons alors que la somme de n'importe quelle quantité
attachée à n'importe quel point matériel du système est en fait une quantité dudit système.

Ainsi, est une quantité macroscopique indépendante du temps. Cela implique que:

Ce qui s'écrit encore (nous multiplions par ½ des deux côtés):

Nous avons donc finalement:

Cette expression de l'énergie cinétique est connue sous le nom de "théorème de Viriel": le
membre de droite est aussi appelé "le viriel du système".

Nous noterons que:

994/2001
Sciences.ch 14/03/2005

où est l'énergie cinétique totale associée à l'ensemble des points matériels du système.
Nous l'appelons "l'énergie interne du système". est l'énergie d'un point matériel
quelconque du système.

Il est possible de retrouver l'expression du viriel à partir d'un système de particules (nuage en
accrétion). Strictement, l'équilibre n'existe pas dans un tel cas. Néanmoins, nous pouvons
admettre que si la contraction gravitationnelle est suffisamment lente alors ses différentes
phases peuvent êtres considérées comme une succession d'états d'équilibre.

Dans le cas d'une force centrale et dérivant d'un potentiel, nous pouvons écrire:

et donc

Si l'énergie potentielle est de la forme (ce qui est le cas pour le potentiel électrique et
gravitationnel) alors il vient:

et il reste:

En résumé, le théorème de viriel nous donne une relation entre les énergies cinétique et
potentielle totales. Pour être valable, le mobile doit décrire une trajectoire autour du centre de
force central et rester indéfiniment dans un volume fini (état lié). Ce type de raisonnement est
applicable à un très grand nombre de phénomène, depuis la structure de certaines galaxies
jusqu'au dégagement d'énergie dans les explosions nucléaires en passant par l'étude du Soleil
et le comportement des gaz réels.

Dans un système gazeux, l'énergie potentielle peut s'écrire comme la somme de l'énergie des
forces agissant de l'extérieur plus celle qui sont interne même au gaz. Tel que:

Or les forces internes peuvent s'écrire comme:

Il ne faut pas dans cette somme prendre la force qu'exerce chacune des particules sur elle-
même. Tel que:

Ce qui nous donne:

995/2001
Sciences.ch 14/03/2005

Dans la double somme, nous pouvons regrouper les termes deux à deux et utiliser le principe
d'action-réaction tel que:

Pour obtenir:

Ce qui finalement nous donne:

Et:

Le premier terme de droite fait intervenir les forces intérieures (interactions) entre les (paires
de) particules et le deuxième terme de droite fait intervenir les forces extérieures.

Considérons maintenant un gaz contenu dans un récipient. Ses molécules ne sont sujettes à
des forces extérieures que lorsqu'elles heurtent une paroi et nous imaginons qu'en moyenne
cette force est perpendiculaire à la paroi (chocs élastiques).

Pour toutes les faces contenues dans les plans définis par les axes, nous avons toujours:

Puisque en moyenne est toujours perpendiculaire à .

996/2001
Sciences.ch 14/03/2005

Pour les autres faces (BCFE par exemple) nous avons et donc:

où nous appelons la coordonnée selon Oy de l'extrémité de . Dès lors pour chaque face:

Effectivement car la pression étant définie par:

Par le théorème du viriel, en ajoutant les contributions non nulles des faces , et
, il vient:

Si l'énergie cinétique moyenne d'une molécule est:

L'énergie cinétique moyenne totale pour molécules est alors:

Dès lors:

C'est l'équation générale d'état d'un gaz réel, c'est-à-dire l'équation d'état qui tient compte des
interactions entre molécules.

Si le gaz est parfait, il n'y a pas d'interactions entre les molécules (par hypothèse) et alors:

Nous retrouvons la loi de Boyle-Mariotte. En d'autres termes, les écarts par rapport à cette loi
nous renseignent directement sur les interactions entre les molécules.

Dans un cas particulier, si les interactions dérivent d'un potentiel central:

997/2001
Sciences.ch 14/03/2005

Il vient ainsi:

Si en outre l'énergie potentielle est du type:

nous avons:

et dès lors:

où est l'énergie totale moyenne du système.

Au fait, il faut bien prendre garde au fait que nous n'avons pas démontré l'équation des gaz
parfaits. Effectivement, lorsquenous avions posé:

Cela supposait implicitement que l'équation des gaz parfaits était déjà connue (…). Cependant
nous avons montré en mécanique statistique qu'il est possible de démonter la l'équation des
gaz parfaits.

PLASMAS

Nous définissons le plasma comme un état de la matière dans lequel certaines liaisons
électroniques ont été rompues, provoquant l’apparition d’électrons libres, chargés
négativement et d’ions, chargés positivement. Les gaz faiblement ionisés appelés "plasmas"
par abus de langage, possèdent les mêmes propriétés mécaniques (écoulements, ondes
acoustiques, etc.) que les gaz neutres, en revanche leurs propriétés électromagnétiques
(conductivité électrique, indice de réfraction) en diffèrent par suite de la présence d'électrons
libres en leur sein.

Dans leur état normal, les gaz sont des isolants électriques. Cela tient au fait qu'ils ne
contiennent pas de particules chargées libres, mais seulement des molécules neutres.
Cependant, si nous leur appliquons des champs électriques assez intenses, ils deviennent

998/2001
Sciences.ch 14/03/2005

conducteurs. Les phénomènes complexes qui se produisent alors portent le nom de décharges
dans les gaz et sont dus à l'apparition d'électrons et d'ions libres.

Le résultat d'une décharge dans un gaz est donc la production d'un gaz ionisé contenant par
exemple électrons, ions positifs et neutres (atomes ou molécules) par unité de
volume. En général, le gaz est macroscopiquement neutre. Nous avons alors alors:

Cette neutralité est la conséquence des forces électrostatiques très intenses qui apparaissent
dès que l'on a . La densité de particules est donc la première grandeur fondamentale.

Le degré d'ionisation d'un gaz est défini par le rapport:

où est la densité (nombre de particules par unité de volume) des neutres et celle des
électrons (ou des ions positifs). La valeur du degré d'ionisation dans les divers types de gaz
ionisés varie en pratique depuis des valeurs très faibles, de l'ordre de , par exemple,
jusqu'à 1.

La deuxième grandeur fondamentale est la température. Lorsqu'on chauffe un gaz à une


température suffisamment élevée ( de l'ordre de ), l'énergie moyenne (voir théorème
du Viriel) :

de translation de ses molécules peut devenir du même ordre que leur énergie d'ionisation Ei.
Dans ces conditions, lorsque deux molécules entrent en collision, il peut y avoir ionisation de
l'une d'entre elles.

Si le gaz est en équilibre thermodynamique, l'ionisation par collision est contrebalancée par
des processus de recombinaison entre électrons et ions et il en résulte que les trois variables
ne sont pas indépendantes : l'ionisation est déterminée par la pression et la
température, nous disons alors que le gaz est en "état d'équilibre d'ionisation thermique".

A des températures plus élevées, les atomes du gaz peuvent d'ailleurs s'ioniser plusieurs fois.
Dans de nombreux cas, l'ionisation est due à un champ électrique extérieur, et le gaz n'est pas
en équilibre thermodynamique. Il atteindra souvent un état stationnaire qu'on pourra
caractériser par les paramètres (température des électrons), (température des
ions) et (température des molécules).

Les trois températures ainsi introduites sont définies par la condition que représente

l'énergie cinétique moyenne des particules d'espèce a, dans un repère où elles ont une vitesse
moyenne nulle. L'écart entre , et peut être important : par exemple, dans un tube à

999/2001
Sciences.ch 14/03/2005

décharges typique, nous pourrons avoir : et . La forte valeur de


est due à l'action du champ électrique sur les électrons, et l'ionisation est alors produite par
les collisions de ces électrons chauds sur les molécules neutres du gaz.

En conclusion il n'y a que deux grandeurs de base permettant de caractériser un plasma la


densité et la température électronique. Nous allons maintenant nous pencher sur deux autres
grandeurs importantes mais non fondamentales dans le sens où elles s'expriment à partir de la
densité et de la température.

Si dans un plasma initialement neutre, nous produisons une perturbation locale sous la forme
d'un excès de charge électrique positive ou négative, celui-ci va tendre à revenir vers l'état
d'équilibre de neutralité. Cependant, nous pouvons voir facilement que la perturbation initiale
engendre en général une oscillation pendulaire non amortie du plasma autour de son état
d'équilibre. Considérons par exemple la situation représentée sur la figure ci-dessous.

À l'instant initial la région au centre contient un déficit d'électrons et la région tout autour un
excès d'électrons. Cela produit un champ électrique tendant à créer un mouvement des
électrons dans le sens des flèches. Dans ce mouvement, ceux-ci acquerront une certaine
énergie cinétique et ils pourront, au bout d'un certain temps, dépasser la position d'équilibre.
Un trop grand nombre d'électrons ayant quitté la région externe, il y aura un défaut d'électrons
dans cette région et un champ électrique tendant à les ramener vers elle (figure 1.3'). Au bout
d'un certain temps, la situation initiale est reconstituée et le cycle recommence. Les vibrations
ainsi produites sont appelées oscillations de plasma électroniques.

Nous pouvons étudier quantitativement ce problème en posant les équations générales d'une
oscillation de charge d'espace électronique et moyennant les hypothèses suivantes :

1. Les ions sont supposés immobiles étant donné qu'il sont beaucoup plus lourds que les
électrons, et leur densité uniforme égale à

2. L'agitation thermique est négligeable

3. Les collisions sont négligeables

4. Les oscillations sont de faible amplitude

5. Il n'y a pas de champ électrique ou magnétique imposé par des sources extérieures

Nous pouvons à présent écrire les équations hydrodynamiques des électrons:

1000/2001
Sciences.ch 14/03/2005

Soit l'équation de conservation des particules (ou de continuité selon démonstration dans le
chapitre de thermodynamique):

et la deuxième loi de Newton (voir chapitre de mécanique classique):

Dans la deuxième, nous avons négligé le terme de pression cinétique et le terme de collision
(hypothèses 2 et 3) et négligé le champ magnétique lié à l'oscillation. Nous pouvons simplifier
ces équations en utilisant l'hypothèse 4 sous la forme:

où est une petite perturbation. Supposons de plus que les quantités variables varient à
la pulsation , nous pouvons donc écrire:

A partir de l'équation de continuité et de Newton, les deux équations hydrodynamiques des


électrons s'écrivent donc :

(1)

(2)

Mais nous avons d'autre part la loi de Gauss (voir chapitre traitant des équations de
Maxwell) :

en effet compte tenu de la condition de neutralité du plasma non perturbé nous avons :

De l'équation (2) ci-dessus, nous tirons :

en remplaçant dans l'équation (1), nous avons :

1001/2001
Sciences.ch 14/03/2005

Finalement en remplaçant cette dernière expression dans la loi de Gauss, nous tirons :

Mais dans les oscillations de charges d'espace nous avons par définition . La
relation ci-dessus conduit donc à l'expression de la "fréquence plasma":

1002/2001
Sciences.ch 14/03/2005

ASTROPHYSIQUE

TRAJECTOIRES D'ORBITALES KEPLERIENNES

L'observation (outil principal du physicien) semble montrer qu'à première vue, les trajectoires
suivies par les corps célestes en orbite autour d'astres est de type côniques (voir géométrie
analytique). Sachant cela, nous pouvons afin de faciliter les calculs, anticiper la
complexification des calculs et exprimer directement la dynamique d'un point matériel en des
coordonnées polaires.

Comme nous l'avons vu dans la section d'algèbre au chapitre d'analyse vectorielle, la vitesse
en coordonnées polaires s'exprime par la relation (nous avons changé la lettre grec de notation
de l'angle pour nous adapter à la tradition):

où le premier terme est la composante radiale de la vitesse et le second la composante


tangentielle de la vitesse (angulaire).

Pour l'accélération:

où le premier terme est l'accélération radiale, le seconde l'accélération centripète, le troisième


l'accélération tangentielle et le quatrième l'accélération de Coriolis.

Maitenant que nous avons les outils nécessaires, attaquons nous au cas des orbites
képleriennes dans le cas d'un champ Newtonien.

Nous avons déjà démontré que:

Cependant, il est peu probable que le corps principal soit un sphère parfait et homogène. Les
astrophysiciens ont donc l'habitude de noter le potentiel Newtonien U sous la forme:

où est appelée "constante de gravitation de l'astre" et où est une fonction


représentant les hétérogénéités de l'astre.

S'il est un endroit de l'univers où les lois de la mécanique sont parfaitement vérifiables, c'est
bien l'espace, parce que le frottement ou les causes de dissipation y sont extrêmement faibles.
Dans le champ d'une seule force dérivant d'un potentiel, le mouvement vérifie la conservation

1003/2001
Sciences.ch 14/03/2005

de l'énergie mécanique.

Nous aboutissons ainsi à l'équation dite de l'énergie, dans laquelle désigne "l'énergie
spécifique" par unité de masse (kilgramme) envoyé.

donc

La force de gravitation newtonienne est centrale, donc de moment nul au centre du corps
principal. Il en résulte la conservation du moment cinétique, soit:

Le vecteur est l'unitaire de ou de appelé "moment cinétique réduit". est la


constante des aires telle que:

Nous rappelons que la norme de la vitesse exprimée en coordonnées polaires plane est donné
par la relation (n'oubliez pas que les deux vecteurs de la base polaire sont orthogonaux et que
l'on peut donc appliquer le théorème de pythagore pour calculer la norme comme il l'a été
démontré dans le chapitre d'analyse vectorielle du site):

Ce qui nous permet d'écrire pour :

Plaçons nous dans le plan orbital, en coordonnées polaires. Nous possédons deux intégrales
premières dépendant des deux constantes essentielles et .

Soit la relation déjà démontrée et sa norme . Or:

Remplaçons dans l'expression de :

1004/2001
Sciences.ch 14/03/2005

En égalant avec l'expression de résultant de la conservation de l'énergie, nous avons:

Ce qui nous donne une équation différentielle assez compliquée:

Et là nous nous demandons comment nous pouvons faire pour nous en sortir. Après quelques
heures de réflexions… nous nous rendons compte qu'il faut faire une substitution. Après une
autre heure de chaos neuronal cela finit par aboutir. Nous décidons de poser (nous en avons
tout à fait le droit ), sachant que est une fonction de :

Dérivons allégrement par rapport à :

Substituons dans l'équation différentielle:

Après simplification nous obtenons :

Nous séparons les variables pour intégrer:

1005/2001
Sciences.ch 14/03/2005

Nous avons deux solutions suivant le signe que nous choisissons. Cependant à la fin de la
résolution, nous remarquons que le seul choix physiquement intéressant est le signe négatif.
Ainsi:

Nous laissons, par approximation, de côté la constante d'intégration qui impliquerait des très
faibles oscillations sur la trajectoire de l'orbite (si vous faites une étude ou un TP sur le sujet,
communiquez-moi les graphiques que vous obtenez avec ou sans la constante, cela
m'intéresserait).

Ce qui nous permet d'obtenir :

Or, nous voyons que notre choix du signe pour l'intégration se justifie pleinement puisque
maintenant, si nous faisons un petit rappel sur les coniques, nous voyons que nous avons:

où est l'excentricité (rapport du petit axe ) et le paramètre focal ( )


d'une ellipse. Ce qui correspond bien aux trajectoires que suivent les astres en orbite.

Dans notre cas, nous avons:

et

Pour nous avons une parabole ou si un hyperbole. Pour la


trajectoire est un ellipse. Donc il y a une forte probabilité pour que les trajectoires des planètes
qui gravitent autour de notre soleil soient des ellipses. En effet, si nous examinons l'équation
différentielle de tout à l'heure, nous voyons que si nous ne voulons pas avoir de racine
négative, l'inégalité suivant doit être vérifiée:

La loi des aires permet de calculer la période orbitale képlérienne . En effet, l'aire de
l'ellipse valant et ayant déjà déterminé lors de la définition du moment cinétique la
relation:

1006/2001
Sciences.ch 14/03/2005

Il vient naturellement:

Par ailleurs, l'étude des coniques montre que et nous avons

Nous avons donc la relation:

PRÉCESSION DU PÉRIHÈLIE

Avant d'étudier la précession des orbites, nous souhaiterions rappeller que le champ
gravitationnel et un champ conservatif et central. Ceci implique donc que le moment cinétique
(voir mécanique classique du point matériel rigide) est constant et que la trajectoire a lieu
dans un plan dont le vecteur normal à la surface conserve toujours la même direction (le
vecteur moment cinétique est constant en grandeur et en direction).

Nous nous attaquerons à l'analyse de la précession du périhélie en prenant en compte les


résultats de la théorie de la relativité restreinte (cela permettant d'être plus "fin" dans les
résultats obtenus et de pouvoir appliquer ces mêmes résultats aux électrons en orbite autour
du noyau de l'atome).

Evidemment, le résultat que nous obtiendrons ne sera pas complet, puisque comme nous le
savons, il a fallu attendre le développement de la relativité générale pour donner avec
exactitude la précession du périhélie de Mercure. Il n'y avait effectivement que la relativité
générale qui pouvait prendre en compte la déformation de l'espace aux environs de Mercure
du aux aplatissements du Soleil à ses pôles (à cause de la force centrifuge).

Pour calculer cet effet de précession, nous allons rechercher l'équivalent d'une formule dite
"Formule de Binet" sous forme relativiste. Nous procèdons comme suit :

Le lagrangien relativiste du système (voir la partie relativité restreinte du site):

Avec:

1007/2001
Sciences.ch 14/03/2005

Le moment cinétique sous forme relativiste et appliqué à notre étude s'écrit:

En prenant la norme, nous avons sans oublier que dans note étude et donc
:

et rappelons que nous avons adopté l'écriture . Ce qui nous donne finalement:

Pour établir l'équivalent relativiste de la formule de Binet:

- nous partons du moment cinétique :

- nous recherchons une relation du type (puisque la trajectoire est une conique):

Effectivement car rappelons qu'en coordonnées polaires la vitesse est donnée par l'expression
suivante:

C'est-à-dire que . Cette dernière expression permet d'écrire que:

- nous cherchons ensuite une relation :

Soit:

1008/2001
Sciences.ch 14/03/2005

A partir des équations obtenues précédemment, nous avons successivement:

Rappelons que nous avions défini en relativité restreinte:

Avec les équations précédentes, cela nous donne:

D'autre part:

En introduisant l'avant dernière relation dans cette dernière:

En posant et comme:

L'avant dernière relation devient avec cette dernière expression:

En égalant cette dernière relation avec celle du lagrangien:

En dérivant cette dernière relation par rapport à :

1009/2001
Sciences.ch 14/03/2005

Effectivement, le lagrangien étant constant au cours du temps (le système est conservatif !),
nous avons donc:

et également:

Or, si nous continuons:

En se référant à:

Nous obtenons donc:

Ce qui donne finalement après quelques simplifications:

En multipliant cette dernière par :

Dans un potentiel gravitationnel:

1010/2001
Sciences.ch 14/03/2005

L'équation de Binet en relativité restreinte est:

Pour rechercher une solution à cette équation différentielle, nous allons grouper la variable u
dans le membre de gauche:

Nous posons :

et

L'équation différentielle s'écrit alors:

Nous posons :

En prenant la dérivée seconde:

Nous trouvons alors une simple équation différentielle dont la solution est bien connue:

Les solution sont du type:

Ce qui s'écrit encore puisque est une constante:

1011/2001
Sciences.ch 14/03/2005

avec

Pour déterminer les constantes nous nous placons d'abord dans la situation pours
laquelle , où est minimal et donc par définition maximal.

Nous dérivons par rapport à :

Donc ce qui fait que la relation:

devient:

Nous posons :

et

Au premier passage par le périhélie où , nous avons donc:

Au deuxième passage par le périhélie , nous avons , nous


avons donc également:

La trajectoire est toujours une ellipse mais l'angle qui était nul au départ est devenu
.

Soit si nous avons .

Alors:

1012/2001
Sciences.ch 14/03/2005

Ce qui nous donne:

Etant donné que , un développement en série de Taylor:

En se limitant à l'ordre 2:

Conclusion :

Il y a un avancement du périhélie s'effectuant dans le sens de rotation du satellite. Pour un


référentiel situé dans le plan de rotation de du satellite, la trajectoire est toujours une ellipse.

Cette avance est de:

par demi-période.

En appliquant exactement le même raisonnement pour la physique quantique corpusculaire


(potentiel électrique), nous trouvons :

avec étant le moment cinétique.

Nous prendrons pour un couple d'astre la distance moyenne pour calculer le moment cinétique
et dans le cas de l'atome nous prendrons (voir le chapitre du site traitant de la physique
quantique corpusculaire et relativiste):

avec la masse réduite valant:

1013/2001
Sciences.ch 14/03/2005

Si les positions du périhélie (et donc de l'aphélie) du barycentre Terre-Lune étaient constantes
dans le temps, la durée des différentes saisons serait, elle aussi constante. Mais l'orbite du
barycentre Terre-Lune tourne lui aussi dans son plan dans le sens direct à raison d'environ 12''
par an (soit une révolution en environ 100'000 ans). La précession des équinoxes s'effectue
dans le sens contraire (sens rétrograde) à raison d'environ 50'' par an (soit une révolution en
environ 26'000 ans). La combinaison de ces deux mouvements permet de calculer la période
du passage du périhélie de la Terre par la direction de l'équinoxe de printemps, cette période
d'environ 21'000 ans est appelée précession climatique. En effet, tous les 10'500 ans (demi-
période de la précession climatique) l'aphélie par de l'été à l'hiver. Or même si la distance
Terre-Soleil n'est pas le facteur prédominant dans la nature des saisons, la combinaison du
passe de la Terre à l'aphélie en hiver donne des hivers plus rudes. La distance Terre-Soleil
dépend également de la variation de l'excentricité de l'orbite terrestre (due aux planètes
extérieures et intérieures). Ainsi, les périodes glacières sont corrélées avec les minima de
l'excentricité de l'orbite terrestre.

Les travaux de l'institut de mécanique céleste (France), depuis les années 1970, ont permis de
confirmer définitivement les prédictions théoriques comme quoi la l'excentricité de l'orbite
terrestre subit de larges variations formées de nombreux termes périodiques dont les plus
importants ont des périodes voisines de 100'00 ans, et pour l'un d'eux, une période de 400'000
ans. Ces résultats confirment les variations climatiques de la Terre au cours de l'ère
quaternaire. Les paléoclimatologies montrent en effet la corrélation entre les variations des
éléments de l'orbite terrestre et les grandes glaciations du quaternaire.

Dans le cas de l'atome d'hydrogène (voir la section de physique quantique corpusculaire


traitant du modèle relativiste de Sommerfeld) avec , et la constante de

structure fine égale approximativement à , nous obtenons pour la précession du périhélie


de l'orbite donnée:

L'EFFET DOPPLER

L'effet Doppler des ondes électromagnétiques doit être discuté indépendamment de l'effet
Doppler acoustique. Premièrement parce que les ondes électromagnétiques ne consistent pas

1014/2001
Sciences.ch 14/03/2005

en un mouvement de matière et que par conséquent la vitesse de la source par rapport au


milieu n'entre pas dans la discussion, ensuite parce que leur vitesse de propagation est (la
vitesse de la lumière) et reste la même pour tous les observateurs indépendamment de leurs
mouvements relatifs. L'effet Doppler pour les ondes électromagnétiques se calcule donc
nécessairement au moyen du principe de relativité.

Pour un observateur dans un repère d'inertie , une onde électromagnétique plane et


harmonique peut être décrite par une fonction de la forme multipliée par un
facteur d'amplitude approprié. Pour un observateur attaché à un autre repère d'inertie, les
coordonnées et doivent être remplacées par et , obtenues par la transformation de
Lorentz (voir le chapitre de "mécanique relativiste "), et celui-ci écrira par conséquent pour sa
description la fonction où et ne sont pas nécessairement les mêmes
que pour l'autre observateur. Par ailleurs, le principe de relativité demande que l'expression
reste invariante quand nous passons d'un observateur d'inertie à un autre.

Nous aurons alors:

En utilisant les relations de transformation de Lorentz réciproque, nous avons:

Par suite:

Si l'on tient compte que dans le cas d'ondes électromagnétiques, nous pouvons écrire
chacune de ces équations sous la forme:

Le rapport:

donne le décalage spectral noté pour un mouvement de l'observateur par rapport à la source
suivant la direction de propagation. Si le mouvement relatif des deux observateurs n'a pas lieu
suivant la direction de propagation, la projection de la quantité de mouvement de l'onde
lumineuse sur l'axe de mouvement relatif des observateurs sur un analyse purement
énergétique donne:

1015/2001
Sciences.ch 14/03/2005

Il peut être pratique de s'attarder un moment sur la compréhension mathématique du


développement effectué ci-dessus. Effectivement, lorsque nous étudierons la relativité
générale, nous reviendrons sur le calcul de l'effet Doppler sous une forme mathématique
beaucoup plus générale pour s'habituer à la manipulation du calcul tensoriel. Donc si vous
avez compris ce qu'il y a ci-dessus, cela vous aidera à comprendre ce qu'il y aura en relativité
générale.

ÉQUATION DE DRAKE

L'équation de Drake a été développée par Frank Drake en 1961 dans le but de définir quelle
serait le nombre de planètes dans notre galaxie uniquement avec lesquelles le Terrien pourrait
prendre contacte en fonction de facteurs déterminants:

Cette équation s'écrit:

Les termes de cette formule (car s'en est une!) se définissent ainsi:

représente le nombre d'étoiles dans une seule et unique galaxie

est le nombre d'étoiles qui auraient une planète en orbite

est le nombre de planètes par étoile qui remplissent les conditions au développement de la
vie

est la fraction de planètes dont la vie s'est effectivement développée (compris entre 0 et 1)

est la fraction de celles ou une vie "intelligente" s'est développée (compris entre 0 et 1)

est la fraction qui a mis en oeuvre des moyens de communication radio (compris entre 0
et 1)

est la fraction de temps pendant laquelle les civilisation vivront (compris entre 0 et 1)

ÉTOILES

Avant d'aborder la formalisme mathématique relatif à la dynamique des étoiles, nous avons
souhaité suite à une demande des lecteurs, écrire une introduction vulgarisée afin de
compléter la culture générale relatif à ce domaine.

Les étoiles sont donc des corps célestes gazeux dont la masse va de 0.05 masses solaires à 100
masses solaires. La luminosité d’une étoile (sa puissance) va de 10-6 à 106 fois celle du
soleil ; grossièrement, lorsque la masse double, la luminosité décuple. Bien que la plupart des

1016/2001
Sciences.ch 14/03/2005

étoiles visibles à l’oeil nu dans notre ciel sont des géantes bleues de 104 à 105 fois plus
lumineuse que le soleil, les 90% des étoiles qui peuplent notre galaxie sont moins lumineuses
que le soleil.

Les astronomes ont mis plance une méthode de classification des étoiles basée sur la position
dans leur spectre, des raies spectrales d'absorption. Autrefois classées de A à Q, l'évolution de
la spectrométrie a permis leur regroupement et leur réorganisation. Les classes sont
aujourd'hui définies par les lettres OBAFGKM, et chacune est divisée en 10 sous-classes,
notées de 0 à 9. La classification spectrale (tirée d'un spectre continu dont il ne résulte
seulement certaines raies du spectre après le passage de la lumière dans un milieu donné) peut
être croisée avec les classes de luminosité dont nous tirons la température à la surface de
l'étoile (nous démontrerons comment obtenir mathématiquement cette information):

La grande courbe au centre indique l'évolution d'une étoile de même masse que le soleil.
Après un passage sur la séquence principale, elle devient une géante rouge, éventuellement
une nébuleuse planétaire (éjection du combustible de l'étoile à de grandes distances), puis elle
termine sa vie sous la forme d'une naine blanche. Par comparaison nous avons indiqué
l'évolution d'étoiles 10 ou 30 fois plus massives que le Soleil : elles quittent la séquence
principale pour devenir des supergéantes puis elle finissent en supernovae qui ne peuvent être
représentées sur ce diagramme !

Une étoile est dans un premier temps en équilibre hydrostatique. Les forces gravitationnelles
dues à sa masse sont compensées par les forces de pression interne due à la température
élevée entretenue par des réactions thermonucléaires à basse densité et à la pression de
dégénérescence des électrons à densité élevée. Une étoile passe 90% de sa vie à fusionner de
l’hydrogène en hélium qui s’accumule en son centre. Durant cette phase, elle évolue dans ce
que nous appelons "la séquence principale" du diagramme de Hertzprung-Russel représenté
ci-dessous. Ce diagramme met en relation la température de surface (abscisse logarithmique
présenté en ordre opposé) à la luminosité (ordonnée logarithmique) de populations d’étoiles.
La séquence principale apparaît comme une diagonale. La température de surface et la
luminosité étant directement fonction de la masse:

1017/2001
Sciences.ch 14/03/2005

Chacune des étoiles du ciel trouve sa place sur le diagramme introduit par Hertzsprung et
Russell (diagramme H-R ci-dessous) dont les diverses régions permettent d'en repérer le stade
d'évolution. Il est alors possible d'y tracer une courbe représentative de l'évolution d'une étoile
donnée à partir de la connaissance de son état au moment de l'observation.

Ainsi les étoiles massives évoluent plus vite que les étoiles de faible masse, mais ce résultat
est déduit d'autres considérations que celles permettant de construire le diagramme. Le
diagramme sert notamment à évaluer l'âge moyen d'un amas d'étoiles à partir de celui de ses
composants. De même, il permet de caractériser les étoiles variables et leurs composantes
telles les géantes rouges qui deviennent instables et pulsantes en viellissant. Cette famille
d'objets instables définit une bande d'instabilité sur le diagramme. Ce diagramme traduit la
classification spectrale des étoiles ou leur température de sur face en fonction de leur
magnitude absolue ou de leur luminosité.

Ce diagramme, sur lequel toutes les étoiles trouvent leur place dès que nous connaissons leurs
caractéristiques, fut développé indépendamment en Europe par Ejnar Hertzsprung et aux
Etats-Unis par Henry Norris Russell. L’axe horizontal indique la classification spectrale en
partant, à gauche, des étoiles les plus chaudes, les bleues, pour atteindre les moins chaudes,
les rouges, à droite. Les étoiles se positionnent en groupes spécifiques sur le diagramme :
celles qui évoluent sur leur séquence principale se situent sur une courbe incurvée qui
commence en haut, à gauche, et se termine en bas, à droite. C’est sur cette courbe que se
regroupent les étoiles stables qui brûlent leur hydrogène et, parmi elles, le Soleil qui se
positionne au centre du diagramme. Les géantes et les supergéantes apparaissent dans la partie
supérieure droite, tandis que les naines blanches se regroupent dans la partie inférieure
gauche. Au fur et à mesure qu’elle évolue, chaque étoile décrit une courbe particulière : elle
commence par suivre la trajectoire de Hayashi jusqu’à ce qu’elle atteigne sa séquence
principale sur laquelle elle évolue tant que son noyau brûle de l’hydrogène. Lorsque

1018/2001
Sciences.ch 14/03/2005

commence la combustion de l’hélium, elle remonte vers le haut où se concentrent les géantes
rouges et y reste jusqu’à ce que la fusion nucléaire s’arrête : elle s’effondre alors sur elle-
même pour rejoindre les naines blanches ou dans le cas d'une certaine valeur de masses
solaire, les étoiles à neutrons, Trou Noirs ou encore, si sa masse est très élevée, explose en
supernovae.

Lorsque la masse d’hélium d'une étoile devient suffisante, l’augmentation de pression induit
une augmentation de la température amorçant ainsi la fusion de l’hélium ("flash de l’hélium")
en carbone, oxygène et néon créant un second front de combustion à l’intérieur du premier.
Pour une étoile de masse solaire, les réactions s’arrêtent à ce stade. L’étoile grossit et se
refroidit en surface. Elle devient une géante rouge 104 fois plus lumineuse qu’auparavant. Elle
passe par des phases d’instabilité et finit par expulser progressivement ses couches externes
en formant une "nébuleuse planétaire". Son noyau, dont la densité est de plusieurs tonnes par
centimètre cube, se refroidit lentement : c’est la naine blanche (nous aborderons ce processus
sous forme mathématique plus loin). L’équilibre y est maintenu par la pression de
dégénérescence des électrons.

Pour une étoile plus massive, la température interne devient assez importante pour que le
carbone et l’oxygène puissent fusionner en silicium. A son tour, si il est en masse suffisante,
le silicium fusionnera en fer. Les fronts de combustion se développent dans un schéma dit "en
pelures d’oignon". Le fer est le nucléotide le plus stable : il se trouve au fond de la vallée de
stabilité (voir section de physique atomique). Il ne peut ni fusionner, ni fissionner. Lorsque la
densité atteint une valeur critique (cela correspond à une masse totale de l’étoile de plus de 8
masses solaires), la pression de dégénérescence des électrons n’arrive plus à maintenir
l’équilibre contre la gravitation. En un dixième de seconde, le noyau de fer s’effondre. Les
autres couches du coeur se précipitent vers le noyau effondré sous forme d’une onde dont le
maximum de vitesse correspond au rayon sonique.

La densité du noyau devient alors énorme. Il se produit des réactions inverse où les
protons capturent les électrons en formant des neutrons et libérant un flot de neutrinos.
Lorsque le noyau de l'étoile atteint la densité nucléaire de , la compaction
s’arrête brutalement (rayon d’environ 10km !). Les couches externes du noyau rebondissent
par un choc superélastique et entrent en expansion. Lorsque cette onde de choc réfléchie
rejoint le rayon sonique, la température monte tellement haut que la chiffrer n’a plus de sens.
La matière subit une photodésintégration complète (tous les nucléotides sont désagrégés en
gaz de nucléons). Finalement par un mécanisme pas clairement établis, toutes les couches
externes de l’étoile sont éjectées dans l’espace : c’est une "supernovae de type II".

Le noyau effondré, presque entièrement constitué de neutrons, sera en rotation rapide si


l'étoile initiale avait un moment cinétique non nul (conservation du moment cinétique oblige).
Le champ magnétique est également conservé et dépasse de loin tout ce qui sera jamais
réalisable en laboratoire. Cela provoque un rayonnement synchrotron qui donne l’illusion que
l’étoile clignote, c’est pourquoi nous appelons ces jeunes "étoiles à neutron" des "pulsars".

Les étoiles très massives (plus de 50 masses solaires), la masse totale du coeur qui s’effondre
pourrait dépasser 3 masses solaires. Dans ce cas, la gravité devient telle que sa masse
s’effondre au delà des dernières forces répulsives et se compacte en une singularité. La
courbure de l’espace devient telle qu’aucune matière, rayonnement ou information ne peut
plus s’échapper au delà d’un volume appelé horizon ou sphère de Schwarzschild . C’est un
"Trou noir". Tout ce qui y tombe perd son identité. Un trou noir ne présente plus que trois
propriétés : sa masse, son moment cinétique et sa charge électrique. Nous disons qu’un trou

1019/2001
Sciences.ch 14/03/2005

noir n’a pas de chevelure. De plus, une telle singularité devrait toujours être cachée par un
horizon, être habillée.

TEMPÉRATURE INTERNE DES ETOILES

Les étoiles sont supposées être des amas sphériques d'hydrogène gazeux où les interactions
entre molécules sont régies par l'attraction gravitationnelle.

Une étoile n'a pas de paroi qui la délimite, c'est-à-dire qu'il n'y a pas de forces extérieures
donc (voir théorème de viriel):

En utilisant le théorème de viriel:

Nous avons pour un masse sphérique gazeuse:

et

Pour le calcul de l'énergie potentielle nous nous reportons au chapitre de mécanique classique
du site. Donc:

où rappelons-le, est la constante de Boltzmann.

Ce qui nous donne:

Avec pour une étoile donnée N étant le rapport de la masse totale de l'étoile sur la masse
moyenne d'une molécule.

Pour le Soleil, il vient:

C'est la température centrale du Soleil. Les mesures optiques mesurées depuis la Terre ne
donnent que la température en surface (chromosphère), soit 6'000 °K. La température interne
calculée est donc environ 1'600 fois plus élevée qu'à la surface. Des méthodes indépendantes
basées sur les réactions nucléaires au centre du Soleil (mesure du flux de neutrinos solaires)
donnent le même ordre de grandeur, mais les valeurs précises diffèrent d'un facteur 2 à 3.

TEMPERATURE EXTERNE DES ETOILES

1020/2001
Sciences.ch 14/03/2005

Nous avons démontré dans le chapitre de thermodynamique que la loi de Stefan-Boltzmann,


permet de calculer la température d’un corps chauffé à partir de son émittance ou de son
énergie interne en termes de densité tel que :

avec :

étant la constante de Stefan-Boltzmann.

Prenons une exemple intéressant qui nous concerne directement :

L'émittance moyenne (dit aussi "émittance moyenne bolométrique") reçu par la Terre hors
atmosphère appelé "constante solaire" est directement mesurable en orbite et vaut
.

Connaissant la distance moyenne au soleil comme étant d'environ


(Unité Astronomique), nous pouvons calculer la surface de la sphère
à et donc la puissance solaire . Ainsi :

et

Supposant connu le rayon du soleil comme valant , nous pouvons calculer


sa surface puis l'émittance radiative solaire . Ainsi :

et

Remarque : la surface rayonnante d’une étoile est appelée "photosphère".

A l’aide de la loi de Stephan-Boltzmann, nous pouvons maintenant calculer la température


thermodynamique de la photosphère :

La loi de Planck (voir le chapitre de thermodynamique) appliqué à cette température nous


permettrait de calculer la distribution spectrale du rayonnement solaire et l'on voit alors que le
maximum de l’intensité est dans le domaine visible (notre visibilité…) du spectre qui va de
à

LUMINOSITÉ DES ÉTOILES

1021/2001
Sciences.ch 14/03/2005

La "luminosité bolométrique" intrinsèque d'une étoile correspond à sa puissance totale


rayonnée dans tout le spectre électromagnétique dans la direction de l'observateur exprimée
de façon relative à la puissance totale rayonnée par le Soleil. En supposant toutes les étoiles
sphérique et isotropes, nous pouvons l'exprimer en unités solaires :

La puissance rayonnée se calcule elle, en multipliant bien évidemment l'émittance radiative


(loi de Stefan-Boltzman) par la surface de l'étoile :

La luminosité bolométrique intrinsèque d'une étoile est donc proportionnelle au carré de son
rayon et à la quatrième puissance de sa température de surface. En prenant le soleil comme
référence, les constantes s'annulent. Nous pouvons alors écrire :

avec et d'où

En astrophysique, nous utilisons également une échelle logarithmique pour exprimer la


luminosité d'une étoile : la magnitude absolue . Cette unité a une origine empirique qui
sera expliquée plus bas.

ÉCLAT D'UNE ÉTOILE

L'éclat d'une étoile est sa "luminosité apparente". L'éclat d'une étoile correspond à la
densité de rayonnement reçu par l'observateur c'est-à-dire au flux et vaut le rapport entre la
puissance de l'étoile et la surface de la sphère dont le rayon est égal à la distance qui sépare
l'observateur de l'étoile :

L'éclat diminue ainsi avec le carré de la distance. En astrophysique, nous utilisons également
une autre échelle où la luminosité apparente est donnée par une autre grandeur d'origine
empirique : la magnitude apparente, qui sera expliquée de suite ci-dessous.

MAGNITUDE APPARENTE

Ptolémée en 137 après J.-C. avait défini une échelle de six grandeurs pour exprimer l'éclat des
étoiles, la première pour les plus brillantes et la sixième pour les étoiles tout juste visibles à
l'œil nu (6 grandeurs et donc 5 écarts).

Au cours du 19ème siècle, avec l'arrivée de nouvelles techniques d'observations


photométriques (photographiques puis photoélectriques), l'échelle de grandeurs a été

1022/2001
Sciences.ch 14/03/2005

remplacée par celle de magnitude apparente qui a été définie de telle sorte à ce que cette
nouvelle échelle soit proche de l'ancienne. La définition est la suivante :

- l'échelle est logarithmique en base 10 (par commodité des grandeurs manipulées)

- il y a 5 écarts de magnitude correspondant à un rapport de luminosité apparent de 1 pour 100


(1:100)

- l'échelle est inverse (une magnitude élevée correspond à un faible éclat).

A l'aide de ces définitions, nous pouvons construire une règle liant de façon relative les éclats
de deux étoiles à leur magnitude apparente .

Pour une étoile 2, cent fois plus "brillante" ou "éclatante" qu'une étoile 1, l'étoile 1 est 5 unités
de magnitude au-dessus de l'étoile 2 (n'oublions par que l'échelle est inverse). Donc :

correspond à

Nous pouvons alors poser les relations :

et

Par application de la règle de trois, nous construisons :

En simplifiant, nous trouvons la "loi de Pogson" qui exprime la relation entre magnitudes
visuelles et éclats de deux étoiles :

Ainsi définie, l'échelle de magnitudes visuelles n'est que relative. La référence est
photométrique est similaire à l'éclat de Véga .

Pous se faire une idée des magnitudes visuelle voici quelques exemples : Soleil –26.5, Pleine
Lune –15, Vénus au maximum –4.8, Sirius la plus brillante des étoiles –1.5 (type spectral A1
et distante de 8.6 années lumière), limite de la perception à l'œil nu 6, limite de perception à
travers un télescope amateur de 15 cm à ce jour (2003) 13, limite de perception du télescope
spatial Hubble 30.

Il faut préciser que la magnitude apparente visuelle ne correspond pas exactement à la


magnitude apparente réelle, bolométrique, car l'œil n'a pas la même sensibilité pour toutes les
longueurs d'onde. Les étoiles bleues ou rouge nous paraissent moins lumineuses à l'œil qu'elle

1023/2001
Sciences.ch 14/03/2005

ne le sont en réalité car une partie du rayonnement se trouve dans les ultraviolets,
respectivement dans l'infrarouge.

Il convient donc de préciser qu'il s'agit d'une magnitude apparente visuelle ou bolométrique.
En général, les astrophysicien utilisent les grandeurs bolométriques dans leurs communiqués.

LA MAGNITUDE ABSOLUE

La magnitude absolue (ne pas confondre avec la notation de l'émittance) d'une étoile est
une grandeur logarithmique aussi, qui exprime cette fois la luminosité . C'est la grandeur
présentée en ordonnée du diagramme de Hertzprung-Russel. L'échelle de cette grandeur est
basée sur la magnitude visuelle.

La magnitude apparent et la magnitude absolue sont liées par la distance qui nous sépare de
l'étoile. A luminosité intrinsèque constante, la luminosité apparent décroît donc évidemment
avec le carré de la distance comme nous l'avons déjà vu. Afin d'établir une relation, nous
avons dû choisir une distance de référence par une nouvelle définition :

La magnitude absolue d'une étoile est égale à sa magnitude apparente si elle est à une distance
de 10 parsecs ( ).

Soit une étoile placée à une distance quelconque . Son éclat est fonction de la distance et
de son éclat si elle était située à selon :

Par application de la règle de trois, nous construisons :

en reprenant la loi de Pogson et en assimilant à la magnitude apparente de l'étoile à la


distance quelconque, à la magnitude apparente de l'étoile à , soit par définition
sa magnitude absolue ainsi que son éclat à et sont éclat à la distance
quelconque, nous trouvons :

qui peut bien sûr aussi s'écrire :

1024/2001
Sciences.ch 14/03/2005

En partant de cette définition, la magnitude absolue du Soleil est de 4.7. Sa magnitude


apparente vue depuis la Terre est de –26.5. Elle est de 4.7 à donc faiblement visible à
l'œil nu.

La loi de Pogson exprime de même la relation entre magnitudes absolues et luminosité


de deux étoiles :

Ainsi, Déneb étant 300'000 fois plus lumineux que le Soleil, la magnitude absolue est de –9.

En reprenant la loi de Pogson, la magnitude absolue peut s'écrire relativement à la luminosité


bolométrique du Soleil :

Avec et , la magnitude absolue bolométrique se calcule ainsi à partir


de sa luminosité bolométrique :

En reprenant l'expression de la luminosité bolométrique :

La magnitude absolue bolométrique d'une étoile est directement fonction de sa température et


de son rayon :

Remarque :

La distance d'étoiles proches a pu être déterminée grâce au satellite Hipparcos. Par mesure du
parallaxe (mesure de la position de l'étoile à six mois d'intervalles et pas application des règles
trigonométriques élémentaires). Mais, au delà de quelque dizaines de parsec, la mesure de la
distance d'étoiles par parallaxe devient très imprécise. En étudiant le spectre de l'étoile, nous
pouvons déterminer sa classe spectrale, sa température de surface et la placer dans le
diagramme de Hertzprung-Russel. Il est donc possible d'estimer sa magnitude absolue et de
calculer approximativement sa distance.

Cet artifice de mesure est fondamental pour la cosmologie. C'est ainsi que l'on détermine la

1025/2001
Sciences.ch 14/03/2005

distance des galaxies proches en mesurant la période de certaines étoiles variables (nous y
consacrons un petit chapitre ci-dessous).

La distance des galaxies lointaines se calcule en mesurant la magnitude apparente de


supernovae qui s'y produisent fortuitement. En effet, la magnitude absolue des supernovae du
type Ia (nous les reconnaissons par l'absence de rayes d'hydrogène et par la décroissance de
leur luminosité) sont bien calibrées car l'énergie dégagée par ces explosions stellaires est
relativement constante.

ÉTOILES VARIABLES

Les étoiles de la séquence principale du diagramme de Hertzprung-Russel sont des objets très
stables. La force de gravitation, qui tend à contracter l'astre, est exactement compensée par les
forces de pression interne, qui tendent à le dilater. C'est au moment où l'étoile devient une
géante rouge que parfois l'équilibre est rompu. Commence alors une phase d'instabilité qui se
traduit par de fortes variations de la luminosité de l'étoile.

La rupture de l'équilibre est provoquée par un phénomène complexe qui met en jeu des
variations de transparence des couches d'hélium près de la surface de l'étoile. A partir de là,
l'astre se met à connaître une succession de dilatations et de contractions contrôlées par les
forces qui assuraient auparavant l'équilibre. Lorsque la force de pression l'emporte, le volume
de l'astre augmente. Mais la gravité freine le mouvement et finit par provoquer la contraction.
Le volume de l'étoile passe alors sous sa valeur moyenne, jusqu'à ce que la pression interne
s'oppose à la contraction et réussit à provoquer une nouvelle dilatation.

Ce ne sont pas les changements de taille qui provoquent les variations de luminosité, mais
ceux de la température. Effectivement, comme nous l'avons vu précédemment, la luminosité
d'un étoile varie avec la quatrième puissance de la température, alors qu'elle ne varie qu'avec
le carré du rayon. Lorsque le volume de l'étoile est cependant plus faible qu'en moyenne, sa
température est légèrement plus forte et la luminosité maximale. Dans le cas contraire, la
température est légèrement plus basse qu'en moyenne et la luminosité minimale. L'éclat de
l'étoile change donc de façon périodique, d'où le nom d'étoile variable.

Il existe dans le diagramme de Hertzprung-Russel une "bande d'instabilité" qui traverse ce


diagramme presque verticalement dans laquelle se produit justement les phénomènes
thermiques en question.

Les deux principaux types de variables pulsantes sont les céphéides et les étoiles RR Lyrae.
Ces astres jouent un rôle central en astrophysique. Les céphéides sont des étoiles de quelque
masses solaires. Elles sont dans la phase de combustion de l'hélium après avoir atteint le stade
de géante rouge. Les étoiles de masse solaire arrivées à ce stade deviennent des RR-Lyrae.
Leur luminosité varie avec une période comprise entre un jour et plusieurs semaines. La
propriété remarquable des céphéides est l'existence d'une relation entre leur luminosité
moyenne et la période de leurs oscillations. Par exemple, leur luminosité moyenne est de 1000
fois celle du Soleil pour une période de quelques jours et de 10000 fois cette valeur pour une
période de plusieurs semaines. C'est cette relation qui fait des céphéides l'un des outils de base
de l'astrophysique.

Si nous connaissons cette relation pour une étoile variable, il est relativement aisé, par la
détermination de sa période d'en tirer la magnitude absolue . En mesurant alors sa
magnitude apparente nous pouvons ensuite calculer sa distance en parsec à l'aide de la
relation (démontrée précédemment):

1026/2001
Sciences.ch 14/03/2005

La figure ci-dessous représente la courbe période-luminosité des Céphéides.

L'étalonnage de cette courbe ne peut se faire que par des mesures de parallaxe sur des
Céphéides proches. Il n'en existe malheureusement pas d'assez rapprochées pour qu'il soit
possible d'utiliser la parallaxe annuelle. Il faut avoir recours à la parallaxe secondaire qui est
basée sur le mouvement du Soleil dans la galaxie.

Exemple :

Nous repèrons une Céphéides grâce à son type de classe spectrale. Sa période est de 50 jours
et sa magnitude apparente . La figure précédente donne, pour cette étoile, une
magnitude absolue .

En appliquant ensuite la formule donnée précédemment, nous trouvons :

Cette céphéide est donc éloignée de .

Grâce aux propriétés des Céphéides, nous disposons d'un instrument de mesure qui porte
jusqu'à quelques dizaines de millions d'années-lumière. Il est donc applicable au delà de notre
Voie lactée jusqu'aux galaxies proches comme les membres du groupe local. Au-delà, il
devient difficile de détecter des Céphéides aux caractéristiques connues.

Les étoiles RR Lyrae sont quant à elles des étoiles peu massives et vieilles. Leur période
d'oscillation est inférieure à un jour. Contrairement aux céphéides, elles ont toutes la même
luminosité moyenne (magnitude absolue de 0.5), environ 100 fois celle du Soleil.

Il existe encore une certainte quantité d'étoiles variables différentes (variables à éclipses, des
variables explosives, variables binaires,...) dont nous peuvons trouver un source abondante
d'information sur l'Internet.

Il existe d'autres méthodes plus connues de mesure des distantes que celle des céphéides :

PARALLAXE TRIGONOMÉTRIQUE

La méthode de parallaxe trigonométrique est très simple (mais délicate à mettre en œuvre à la

1027/2001
Sciences.ch 14/03/2005

surface de notre planète pour les étoiles très distantes). Tout astronome amateur constate la
fuite de l'étoile qu'il observe dans son oculaire. Ce mouvement se nomme "mouvement
diurne". Il est dû à la rotation de la Terre sur elle même. L'étoile est également animée d'un
mouvement elliptique beaucoup mois facilement détectable : le "mouvement parallactique".

Il est dû, comme le suggère le schéma ci-contre, à la rotation de la Terre autour du Soleil.
Nous mesurons dont l'angle :

si l'angle est faible (ce qui est très fréquemment le cas étant donné la distance des étoiles),
nous pouvons prendre le premier terme du développement de Taylor de la fonction tangente :

Ce qui nous permet d'écrire :

où est la distance du Soleil à l'étoile et a celle de la Terre au Soleil comme représenté ci-
dessous :

LIMITE DE CHANDRASEKHAR

Nous avons déjà déterminé dans le chapitre de mécanique classique le rayon de


Schwarzschild (sous sa forme classique) qui exprime le rayon critique d'un corps pour que la
vitesse de libération à sa surface soit égale à la vitesse de la lumière. Nous avions obtenu la
relation ci-dessous qui exprimait typiquement le rayon que devrait avoir un astre donné pour
avoir une vitesse de libération égale à celle de la lumière :

1028/2001
Sciences.ch 14/03/2005

Dans ce cas particulier l'astre est ce que nous avions appellé un "Trou Noir". Cependant, avant
le trou noir, une étoile passe comme nous en avons parlé par plusieurs étapes intermédiaires
par lesquelles elle peut d'ailleurs se stabiliser. Ainsi, vous avez du souvent lire dans la
littérature que pour une naine blanche s'effondre en étoile à neutrons, que sa masse devait être
supérieur à 1.4 masses solaire. C'est ce que nous allons démontrer maintenant.

Nous allons introduire le sujet sur l'étude de l'influence du principe d'incertitude sur la taille
d'un système atomique (il en limite la dimension minimale). Cet exemple est fort puissant car
il montre que le principe d'incertitude ne régit pas seulement le processus de la mesure mais
aussi le comportement global des systèmes quantiques.

Le premier exemple que nous pouvons donner est celui de l'atome d'hydrogène, non que nous
attendions un résultat nouveau de cette méthode d'analyse, mais plutôt parce que nous
pouvons exposer l'usage du principe d'incertitude et insister sur sa signification.

Nous admettons que le proton, dont la masse l'emporte de beaucoup sur celle de l'électron,
peut être considérée comme fixe. L'énergie de l'électron s'écrit :

En physique classique, un système dont l'énergie est donnée par la relation précédente ne
possède pas de minimum : si nous faisons tendre vers zéro en conservant la forme circulaire
de l'orbite, il est facile de voir que tend vers . En revanche, en physique quantique,
cette limite n'a pas de sens : le principe d'incertitude s'y oppose.

Dans ce cas, la recherche du minimum de prend un sens, car une contrainte apparaît
qui maintient ce minimum à une valeur finie. Elle se détermine en physique quantique (voir le
modèle de Bohr de l'atome dans le chapitre de physique quantique corpusculaire) et impose:

ou

Cependant, cette relation mis à part, si le rayon de l'atome devient trop faible sous des
contraintes extérieures (attention! nous nous affranchissons des orbites quantifiées du modèle
de Bohr de l'atome qui impose une contrainte à ) la quantité de mouvement de l'électron
ne peut être inférieure à l'incertitude qu'impose le principe d'incertitude de Heisenberg,
dès lors que est de l'ordre du rayon de l'atome. La forme même de la relation
précédente limite la portée de la méthode : nous ne pouvons espérer déterminer mieux qu'un
ordre de grandeur du minimum de .

Afin d'évaluer le minimum de l'énergie totale, que nous interprètons comme l'état
fondamental de l'atome d'hydrogène, nous calculons le minimum de en éliminant de
l'expression:

1029/2001
Sciences.ch 14/03/2005

par

Nous obtenons :

Le rayon de l'atome dans l'état fondamental est la valeur de qui donne à sa valeur
minimale:

si bien que:

qui est l'expression bien connue du rayon de Bohr vue en physique quantique corpusculaire
lors de l'étude du modèle de Bohr de l'atome. L'énergie de l'état fondamental est donc
maintenant facilement calculable.

Le but de cet exemple est de montrer qu'avec le principe d'incertitude de Heisenberg nous
pouvons par un raisonnement très simple retrouver l'état fondamental d'un système. C'est
exactement de cette façon que nous allons procéder pour déterminer les conditions qui font
qu'un astre se retrouve dans son état fondamental.

Attaquons maintenant à l'étude d'une étoile. Schématiquement celle-ci se compose d'un


mélange de deux gaz: celui que est formé de noyaux d'une part, le gaz électronique de l'autre.

Au cours de la vie de l'étoile, de nombreux processus de fusion ont eu lieu. Ils ont accru à
chaque fois la taille et la masse des noyaux; FE (le fer) qui est abondant à la fin de la vie d'une
étoile, contient en moyenne 56 nucléons (voir la partie physique atomique du site).

Ces noyaux sont de nature chimique ou isotopique variée. Comme ils sont peu nombreux en
comparaison des électrons, leur pression est celle d'un gaz classique chargé, neutralisé par la
présence des électrons: elle peut être ignorée, et ce d'autant plus que la température est nulle.

La charge électronique seule ne permettrait pas aux électrons de résister à l'effondrement


d'une étoile puisque la matière stellaire est neutre. A très basse température, quand le
carburant est épuisé, la seule pression que le gaz électronique puisse opposer à la pression
hydrostatique due à la pesanteur est d'origine quantique.

En première approximation, les électrons exercent donc l'un sur l'autre une répulsion
apparente qui n'est pas d'origine coulombienne (principe d'exclusion de Pauli). En première
approximation, ils obéissent à une relation analogue à celle de l'électron atomique et qui

1030/2001
Sciences.ch 14/03/2005

s'écrit dans le cas minimal (ou maximal de pression) :

où est la distance moyenne qui sépare deux électrons voisins.

A température , l'équilibre est atteint quand l'énergie (la matière de l'astre) totale du
système est minimale.

Que se passe-t-il si nous essaions d'évaluer la variation du rayon de la Naine Blanche en


fonction de sa masse ?

L'énergie potentielle gravifique d'une étoile est donnée en bonne approximation par (voir
chapitre de mécanique classique) :

étant approximativement donnée par:

où est la masse du proton et le nombre de nucléons que contient l'étoile: la contribution


des électrons à la masse de l'astre est négligeable et il n'y pas lieu de distinguer entre la masse
du neutron et celle du proton, presque identiques.

La seconde contribution à l'énergie est essentiellement celle du gaz électronique dégénéré (la
dégénérescence correspond à l'existence de plusieurs états ayant la même énergie), d'origine
cinétique. Nous pourrions être tenté d'écrire simplement:

Cette manière de faire conduit à une impasse. Si nous exigons que la somme
atteigne une valeur minimale, nous aboutissons à une valeur du rayon de l'étoile
tellement faible que, par application de la relation la vitesse moyenne des électrons
dépasserait celle de la lumière!

Pour éviter cette contradiction, nous devons recourir à la mécanique relativiste qui nous a
montré que, dans ce cas (voir chapite de mécanique relativiste), nous pouvons exprimer
l'énergie cinétique comme:

si la valeur numérique de l'énergie cinétique l'emporte considérablement sur l'énergie de repos

1031/2001
Sciences.ch 14/03/2005

nous avons :

nous avons donc:

La distance moyenne entre électrons s'évalue en supposant que l'étoile est homogène,
approximation suffisante dès lors que nous cherchons l'ordre de grandeur d'une moyenne.
Nous simplifions encore la géométrie en admettant que chaque électron est entouré d'un
domaine sphérique de rayon dans lequel il n'y a pas d'autre électron de même spin et où
nous ne pouvons compter qu'un électron de spin opposé. Dès lors:

Il reste à évaluer le minimum de la somme:

compte tenu de la condition . Il vient encore:

puis

que nous évrivons finalement:

Face à ce résultat, nous sommes confrontés à une situation inattendue :

Si le facteur est positif, alors l'énergie totale de la naine blanche l'est


aussi, ce qui signifie que le système n'est pas lié: l'étoile est totalement instable (elle n'a pas
atteint son seuil d'énergie minimal). Elle ne peut réduire son énergie qu'en augmentant sans
limite son rayon .

1032/2001
Sciences.ch 14/03/2005

Nous voyons que la facteur est négatif si :

Si la Naine Blanche dépasse cette masse alors nous ne pouvons plus traiter le problème avec
les équations précédentes. Elle satisfait alors aux équations régissant un astre composé de
neutrons uniquement (étoile à neutrons) et ceci constitue alors un autre problème que nous
n'aborderons pas ici pour l'instant.

La masse (approximative) de la fameuse "limite de Chandrasekhar" est donc donnée par :

Elle constitue la masse au-delà de laquelle une naine blanche s'effondre en étoile à neutrons.

Conventionnellement, les astrophysiciens associent cette valeur limite à un facteur


multiplicateur de la masse du Soleil . Nous avons effectivement (numériquement)
.

MODÈLE COSMOLOGIQUE NEWTONIEN

Un modèle cosmologique est une représentation mathématique de l'Univers qui cherche à


expliquer les raisons de son aspect actuel, et à décrire son évolution au cours du temps.

Le modèle Newtonien s'applique dans le cadre des hypothèses de la mécanique de Newton


(action instantanée). La résultats que nous allons étudier ici ont été découvert avant le
développement de la Relativité Générale mais publié après! Mais ce modèle présente
l'avantage de la simplicité tout en étant capable de mettre en évidence et de discuter de la
dynamique de l'Univers et de se préparer à l'étude des modèles d'Univers faisant usage des
résultats de la Relativité Générale. Ses inconvénients, outre le fait qu'il ne correspond pas tout
à fait avec les résultats expérimentaux, est de n'être plus valable dans des conditions extrêmes
donc de ne pas être extrapolable à l'instant du Big-Bang.

Avant de commencer, nous devons définir le "principe cosmologique" formé des deux
assertions suivantes; en gros, il assure que nous ne sommes pas des observateurs privilégiés,
et que ce que nous observons est bien représentatif de l'ensemble de l'Univers:

- L'espace est homogène, c'est à dire qu'il présente les mêmes propriétés dans toutes ses
régions. Ceci doit s'entendre à très grande échelle, au-delà du millier de Mpc (Mégaparsecs).
Il est clair qu'à petite échelle existent des inhomogénéités, nous par exemple.

- L'espace est isotrope, c'est à dire qu'il n'existe pas de direction particulière de l'espace,
comme une direction d'aplatissement, ou un mouvement d'ensemble à l'échelle Universelle
par exemple.

Nous allons poser quelques autres hypothèses de travail :

1033/2001
Sciences.ch 14/03/2005

H1. Nous admettons que l'Univers est un milieu gazeux dont les particules sont des galaxies .

H2. Ce milieu gazeux est un fluide non visqueux.

H3. Ce milieu est homogène (ses propriétés sont les mêmes partout) et isotrope (ses propriétés
sont les mêmes dans toutes les directions). Ces propriétés sont le résultat d' observations.

H4. C'est un Univers en expansion et homothétique.

H5. Sa masse volumique est uniquement fonction du temps.

H6. Nous acceptons la dynamique newtonienne pour construire le modèle.

H7. Il y a conservation de la masse (et donc de l'énergie- nous rejetons la suggestion de Hoyle
d'une création continue).

H8. L'origine du temps est assimilée à l'origine de création de l'Univers

Sous l'hypothèse du principe cosmologique, la distance d'un point origine à un point


quelconque de l'Univers peut varier en fonction du temps sous la forme :

où est le "facteur d'échelle".

En écrivant cette relation, nous considérons que les points et sont sur un plan à
courbure nulle. Effectivement, si nous imaginons deux points sur une surface courbe cercle
(par exemple la surface d'une sphère) voyons ce qui ce passe:

La distance entre deux points du cercle (in extenso de l'espace sphérique) est donné par:

Nous voyons très bien dans cette relation que si le rayon (de l'Univers sphérique) change d'un
facteur , alors la variation de distance entre les deux points n'est pas proportionnelle à ce
facteur !! Ce qui n'est pas le cas dans un plan à courbure nulle.

1034/2001
Sciences.ch 14/03/2005

Conséquence: notre modèle Newtonien n'est valable que dans un Univers plat alors que la
relativité générale peut prendre en compte n'importe quelle type de courbure !

Nous voyons tout de suite que la relation:

est indépendante de l'origine choisie, en effet, si nous l'appliquons à deux points


quelconques, nous avons :

Soit par différence:

Remarques :

R1. Au temps il est évident que la relation précédente s'écrit :

et nous impose . Cette remarque est importante et nous y reviendrons


plusieurs fois pendant les développements qui vont suivre.

R2. La loi s'applique donc à un segment quelconque dans l'Univers c'est pourquoi
l'Univers ne comporte pas de centre géométrique et que nous pouvons nous donner une image
suggestive pour se donner une idée de l'expansion de la "trame" de l'Univers : soit un ballon
mi-gonflé sur la surface de laquelle nous traçons deux repères (par exemple : deux croix
tracées à l'encre). En le gonflant davantage, nous constaterons que ces deux croix s'écartent
l'une de l'autre et donc la distance qui les séparent s'accroître. C'est ce que nous constatons
avec les galaxies (hors mis, leur mouvement propre, il y a en plus un mouvement dû à
l'expansion de l'Univers).

Dérivons par rapport au temps l'équation:

Le premier membre donne alors la vitesse des particules (ou de tout autre objet) au point
:

Soit en éliminant :

1035/2001
Sciences.ch 14/03/2005

Nous posons pour simplifier l'écriture :

Nous avons donc :

Cette relation est connue sous le nom de "loi de Hubble".

Avant d'aller plus loin, il convient de s'arrêter sur cette équation pour l'instant présent :

Cette équation dit que les objets de l'Univers s'éloignent avec une vitesse proportionnelle à
leur éloignement dans tous les points de l'Univers sans référentiel privilégié (aucune galaxie
ne semble être fixe !). La constante étant bien sûr identifiable à la constante de Hubble
telle qu'elle est mesurée actuellement et valant environ .

Ainsi, une estimation actuelle de l'âge de l'Univers pourrait être interprétée comme l'inverse
de la constante de Hubble ce qui nous donnerait :

soit environ 13 milliards d'années.

Rappel : 1 parsec vaut

Inversement, nous pouvons nous amuser à calculer la distance à partir de laquelle nous
pouvons atteindre la vitesse de la lumière soit environ 13
milliards d'années-lumière. Telle est la distance de "l'horizon cosmologique". C'est-à-dire la
distance à partir de laquelle le redshift des galaxies devient infini. C'est donc là que se situe le
Big Bang, à environ 13 ou 15 milliards d'années d'ici.

Considérons maintenant une sphère de matière de rayon de masse en expansion à la


vitesse dans un Univers déjà existant mais vide, et contenant une boule de matière de masse
, qui, selon le principe cosmologique, est de densité constante (isotropie). Nous
pouvons appliquer à ce système la conservation de l'énergie mécanique car ce système est
isolé (c'est d'ailleurs le seul "vrai" système isolé). Nous obtenons l'équation :

1036/2001
Sciences.ch 14/03/2005

où est une constante. En divisant par chaque membre et en remplaçant par son
expression en fonction de la densité, nous obtenons :

Or la loi de Hubble nous donne :

et :

Nous obtenons:

que nous simplifions en:

Or, sont des constantes. Nous introduisons une nouvelle constante définie par (afin
de simplifier les écritures) :

Nous obtenons donc l'équation :

qui est l'équation de Friedmann.

Remarque :

Einstein rajouta à cette équation pour des raisons de conviction personnelles et quasi
religieuses une fameuse constante cosmologique qui lui permettait de rendre statique le
facteur d'échelle de l'Univers. Nous (les auteurs du site) rejetons cette constante arbitraire,
même si dans la physique contemporaine elle est revenue à la mode (sa valeur a été cependant
définie mathématiquement plutôt que religieusement) car elle permettrait d'expliquer la
provenance de la matière sombre, les lois actuelle de notre Univers, la période inflationniste
de notre Univers ainsi que sa géométrie. Ainsi, l'équation de Friedmann avec cette constante,
qui est un total artifice de travail, moderne s'écrit :

1037/2001
Sciences.ch 14/03/2005

avec :

C'est Andreï Sakharov qui a défini la valeur de cette constante cosmologique qui
s'apparenterait soit disant à l'énergie quantique du vide (fonction des champs de Higgs).

Information : deux idées guident les chercheurs de ce début de 21ème siècle : en physique
quantique les équations du champ associées aux particules élémentaires servent à définir la
théorie du Big Bang. La célèbre équation d'équivalence d'Einstein nous dit que l'énergie crée
un champ gravitationnel comme l'électron en mouvement provoque un champ
électromagnétique. Il découle de ces deux observations qu'en mesurant le champ
gravitationnel nous avons un moyen de déterminer l'énergie du vide. Le champ gravitationnel
ne concerne plus la matière mais bien la densité d'énergie du vide. Or la constante
cosmologique est directement proportionnelle à la constante de la gravitation, . Sa mesure
est un jeu très dangereux car de sa valeur dépend plusieurs lois fondamentales de physique et
des propriétés non négligeables quant à la dynamique de notre Univers. Le débat reste donc
complètement ouvert et si nous (les auteurs du site) trouvons une démonstration valable et
rigoureuse de cette constante, nous mettrons à disposition du lecteur les conséquence de cette
constante sur les modèles que nous allons voir ci-après.

Revenons en cependant à notre équation de Friedmann sans constante. En sachant que :

Nous obtenons :

qui se réarrange avec :

en :

L'exposant du terme de gauche impose que le terme de droite soit positif ou nul tel que :

1038/2001
Sciences.ch 14/03/2005

Rappelons que les conditions initiales nous imposent qu'au temps nous ayons :

et

Effectivement :

Il vient alors :

Ce terme devrait être accessible à l'observation, hélas est très mal connu et encore
plus. Autrement dit, compte tenu du signe "-" dans l'expression de , nous ne connaissons
aujourd'hui même pas le signe de cette constante.

Cependant, il peut-être important de noter qu'il existe une valeur critique qui annule
telle que :

Pour (valeur actuelles) nous trouvons .A


titre de comparaison, un atome d'hydrogène pèse , la densité critique
correspondrait donc à 3 atomes d'hydrogène par mètre cube.

Les physiciens ont défini une constante notée par la lettre grecque et donnée par :

Il est intéressant de travailler avec cette constante car dans le cas où :

- :

Nous avons :

ce qui en remplaçant dans l'équation de Friedmann donne : (un Univers plat comme
nous le verrons dans notre étude du modèle relativiste).

- :

1039/2001
Sciences.ch 14/03/2005

En effectuant le même raisonnement, et toujours en inégalités, nous avons alors: (un


Univers à courbure positive (fermé) comme nous le verrons dans notre étude du modèle
relativiste).

- :

En effectuant le même raisonnement, mais en inégalités, nous avons alors: (un Univers
à courbure négative (fermé) comme nous le verrons dans notre étude du modèle relativiste).

Remarque : toutes les mesures qui ont pu être faites jusqu'à présent n'ont pas permis de mettre
en évidence une courbure de l'univers. Les mesures du rayonnement fossile par le ballon
Boomerang et le satellite COBE tendent cependant à accréditer l'hypothèse d'un univers plat
relativement aux simulations numériques :

Revenons à l'équation :

1040/2001
Sciences.ch 14/03/2005

Nous pouvons écrire :

En adoptant la notation :

Remarque : les mesures actuelles donnent

D'où :

Il convient maintenant pour nous de considérer trois situation:

Remarque: nous ne pouvons poser car dans nos hypothèses initiales se trouvait le
principe de conservation de l'énergie.

MODÈLE DE FRIEDMANN-LEMAITRE

Le modèle de Friedmann-Lemaître consiste à supposer que . Autrement dit, nous


sommes dans un Univers dont la densité est dite "critique" ou également "plat" (comme nous
le verrons avec le modèle relativiste).

Nous avons alors l'équation :

En disposant les termes de manière adéquate :

et en intégrant, il vient :

1041/2001
Sciences.ch 14/03/2005

Qui se simplifie en (nous élevons au carré d'où la suppression du double signe ±):

Nous avons donc dans ce modèle la relation :

à laquelle il nous faut rajouter une constante pour avoir la condition qui reste
satisfaite :

Ce qui nous donne sur un tracé (nous avons représenté une échelle arbitraire du temps sur
l'axe vertical) une fonction à l'allure suivante (ne pas se fier aux valeurs indiquées elles sont
arbitraires) :

Nous avons mise la zone où en évidence pour bien rappeler que cette partie de la
solution est à rejeter.

Nous avons donc un modèle d'Univers dont le facteur d'échelle croit de façon exponentielle et
et ce indéfiniment.

Remarque : plus est grand, plus la croissance du facteur d'échelle est grand (sous-entendu
que la pente est bien évidemment plus grande).

MODÈLE HYPERBOLIQUE

Dans ce modèle, nous considérons . Donc l'équation à traiter reste :

1042/2001
Sciences.ch 14/03/2005

Ce qui s'écrit aussi :

Rappelons que nous avions supposé pour que si nous effectuons le


changement de variable , nous obtenons l'intégrale suivante :

Nous recherchons donc une primitive de :

et nous discuterons du signe ± après avoir trouvé la primitive.

Nous effectuons encore un changement de variable en posant donc


ce qui nous donne la primitive suivante à calculer :

en refaisant un changement de variable :

d'où à une constante multiplicative près :

nous avons :

Dans le chapitre de calcul différentiel et intégral nous avons vu que cette forme de primitive
se résout par la relation (nous rajoutons la constante d'intégration à la fin car nous faisons de
la physique et il faut satisfaire des conditions initiales auxquelles nous ne nous intéressions

1043/2001
Sciences.ch 14/03/2005

pas nécessairement en mathématique) :

avec :

d'où :

Il nous faut encore calculer :

Enfin :

en remettant en place tous les changements de variables et en introduisant à nouveau la


constante multiplicative, nous avons dans le cas où :

Entre les deux bornes d'intégration nous avons donc (la constante d'intégration
s'annule et nous reprenons le ± qui se trouvait initialement dans l'intégrale) :

Rappel : la théorie nous impose

Si nous traçons cette fonction pour une valeur fixe. Nous avons le tracé suivant dans
Maple (nous ne considérerons que le cas avec le signe "-" ci-dessous pour l'instant car le signe
"+" nous donnerait un tracé dans les différentiels de temps négatifs : ):

1044/2001
Sciences.ch 14/03/2005

Remarque : le temps est toujours représenté sur l'axe vertical ainsi que pour tous les
diagrammes suivants (il vous faut tourner un peu la tête si habituellement vous mettez le
temps sur l'axe des abscisses…).

Nous voyons que plus la constante est petite, plus l'Univers arrive rapidement à un valeur
finale. De plus pour une valeur de fixée, certaines valeurs de sont interdites (c'est à
cause de la condition d'intégration).

En fixant un valeur de , nous obtenons la représentation bi-dimensionnelle suivante :

Remarque: si nous effectuons un zoom au niveau , nous avons :

1045/2001
Sciences.ch 14/03/2005

Nous voyons que le critère est parfaitement et naturellement respecté sans


introduction d'une quelconque constante. Il suffit par ailleurs de remplacer par 1 dans
l'équation que nous avons obtenue pour voir que nous trouvons .

Remarque : comme nous l'avons déjà précisé, toutes les valeurs de inférieures à 1 sont à
rejeter !

Analysons l'avant-dernier tracé en rappelant que :

Une condition limite (condition d'intégration) pour que le terme de droite de l'égalité soit
positif est que :

ou

Donc, si est plus petit que , nous ne somme plus dans un domaine valable (réel) du
modèle.

Il faut donc que :

ou

Cette limite a été présentée par une ligne verticale bleue sur l'avant-dernier diagramme. Nous
y avons également représenté par une ligne horizontale verte la limite temporelle temps
correspondante .

Au fait, au-delà de cette limite temporelle, ce que ne sait pas l'ordinateur qui a tracé notre
fonction qu'il devrait basculer sur la fonction d'échelle avec le signe "+". Ainsi, lorsque nous
exécutons le tracé des deux fonctions avec les bornes adéquations :

1046/2001
Sciences.ch 14/03/2005

nous obtenons alors (le temps est représenté sur l'axe vertical) :

Nous voyons que alors que pour l'Univers entre dans un phase de contraction que nous
appelons communément "Big Crunch". Après cette phase de rétraction, il est possible soit que
l'Univers disparaisse totalement, soit qu'il entre à nouveau dans un phase dynamique cyclique
(mathématique les deux possibilités sont possibles).

MODÈLE SPHÉRIQUE

Dans ce modèle, nous considérons . Donc l'équation a traiter peut s'écrire :

Ce qui s'écrit aussi :

Rappelons que nous avions supposé pour que si nous effectuons le


changement de variable , nous obtenons l'intégrale suivante :

1047/2001
Sciences.ch 14/03/2005

Nous recherchons donc une primitive de :

et nous discuterons du signe ± après avoir trouvé la primitive.

Nous effectuons encore un changement de variable en posant donc


ce qui nous donne la primitive suivante à calculer:

en refaisant un changement de variable :

d'où à une constante multiplicative près :

nous avons :

Dans le chapitre de calcul différentiel et intégral nous avons vu que cette forme de primitive
se résout par la relation (nous rajoutons la constante d'intégration à la fin car nous faisons de
la physique et il faut satisfaire des conditions initiales auxquelles nous ne nous intéressions
pas nécessairement en mathématique) :

avec :

d'où :

1048/2001
Sciences.ch 14/03/2005

Il nous faut encore calculer :

Enfin :

en remettant en place tous les changements de variables et en introduisant à nouveau la


constante multiplicative, nous avons dans le cas où :

Entre les deux bornes d'intégration nous avons donc (la constante d'intégration
s'annule) :

Nous devons évidemment avoir (nous reprenons le ± qui se trouvait initialement dans
l'intégrale) :

Si nous traçons cette fonction pour une valeur fixe. Nous avons le tracé suivant dans
Maple (nous ne considérerons que le cas avec le signe "-" car celui avec le signe "+" n'a pas
de sens physique même translaté) :

1049/2001
Sciences.ch 14/03/2005

Nous voyons que plus la constante est petite, plus l'Univers arrive rapidement croit
indéfiniment rapidement. De plus pour une valeur de fixée, certaines valeurs de sont
interdites (il s'agit au toujours fait de la condition d'intégration).

En fixant un valeur de selon donne la représentation bi-dimensionnelle suivante :

Nous voyons à nouveau que le critère est naturellement parfaitement


respecté. Toutes les valeurs de inférieures à 1 sont à rejeter !

Nous avons donc ce modèle sphérique un Univers qui croit indéfiniment de façon
exponentielle (comme le modèle plat de Friedmann-Lemaître) car étant donné que , il
n'y a plus de condition limite d'intégration (contrairement au modèle hyperbolique précédent).

UNIVERS OBSERVABLE

Nous avons déterminé plus haute une estimation actuelle de l'âge de l'Univers comme pouvant
être interprétée comme l'inverse de la constante de Hubble ce qui nous a donné :

soit environ 13 milliards d'années.

Cependant il est difficile de s'imaginer ce que cela représente. A ce titre, nous avons trouvé
sur Internet une magnifique série d'illustrations (si l'auteur reconnaît ses créations qu'il se
manifeste afin que nous puissions en donner la source) que nous vous proposons :

1. L'univers jusqu'à 13 milliards d'années lumière (l'Univers visible) :

1050/2001
Sciences.ch 14/03/2005

Cette carte essaye de montrer l'ensemble de l'Univers visible. Les galaxies dans l'univers ont
tendance à se rassembler en vastes feuilles et superamas de galaxies, entourant de grands
vides, ce qui confère à l'univers une apparence cellulaire. Parce que la lumière dans l'univers
ne voyage qu'à une vitesse finie, nous voyons les objets sur le bord de l'univers quand celui-ci
était très jeune, il y a 13 milliards d'années.

Quelques chiffres (estimations) :

- Nombre de superamas de l'univers visible = 270'000


- Nombre de groupes de galaxies de l'univers visible = 500 millions
- Nombre de grandes galaxies de l'univers visible = 10 milliards
- Nombre de galaxies naines de l'univers visible = 100 milliards
- Nombre d'étoiles de l'univers visible = 2'000 milliards de milliards

2. L'univers jusqu'à 1 milliard d'années lumière (les superamas voisins) :

1051/2001
Sciences.ch 14/03/2005

Quelques chiffres (estimations) :

Les Galaxies et les amas de galaxies ne sont pas distribués régulièrement dans l'Univers. Au
lieu de cela, ils sont rassemblés en de larges amas, feuillets et murs de galaxies séparés par de
larges vides dans lesquels peu de galaxies semblent se trouver. La carte ci-dessus montre un
certain nombre de ces superamas, y compris celui de la Vierge - un superamas plutot petit
dont notre galaxie fait partie. La carte entière représente à peu près 7% du damètre de
l'Univers visible. Les galaxies sont trop petites pour apparaitre individuellement sur cette
carte, chaque point y représente un groupe de galaxies.

Quelques chiffres (estimations) :

- Nombre de superamas jusqu'à 1 milliard d'années lumière = 80


- Nombre de groupes galactiques jusqu'à 1 milliard d'années lumière = 160'000
- Nombre de grande galaxies jusqu'à 1 milliard d'années lumière = 3 millions
- Nombre de galaxies naines jusqu'à 1 milliard d'années lumière = 30 millions
- Nombre d'étoiles jusqu'à 1 milliard d'années lumière = 500 millions de milliards

3. L'univers jusqu'à 100 millions d'années lumière (le superamas de la Vierge) :

1052/2001
Sciences.ch 14/03/2005

Notre galaxie n'est qu'une parmi des milliers d'autres qui se trouvent à moins de 100 millions
d'années lumière. La carte ci-dessus montre comment les galaxies tendent à s'amasser par
groupes, le plus important des amas proches étant l'amas de la Vierge (Virgo), une
concentration de plusieurs centaines de galaxies qui domine les groupes de galaxies
environnants. Collectivement, l'ensemble de ces groupes est connu sous le nom de Superamas
de la Vierge. Le second amas le plus riche de ce volume est l'amas du Fourneau (Fornax),
mais il est bien moins riche que celui de la Vierge. Seules les galaxies brillantes sont
dessinées ici, notre galaxie est le point tout au centre.

Quelques chiffres (estimations) :

- Nombre de groupes de galaxies jusqu'à 100 millions d'années lumière = 160


- Nombre de grandes galaxies jusqu'à 100 millions d'années lumière = 2'500
- Nombre de galaxies naines jusqu'à 100 millions d'années lumière = 25'000
- Nombre d'étoiles jusqu'à 100 millions d'années lumière = 500'000 milliards

4. L'univers à moins de 5 millions d'années lumière (le groupe local de galaxies) :

1053/2001
Sciences.ch 14/03/2005

La Voie Lactée est une des trois grandes galaxies du groupe appelé Groupe Local qui contient
aussi plusieurs dizaines de galaxies naines. La plupart de ces galaxies sont portées sur cette
carte, mais il faut noter que beaucoup de ces galaxies naines sont très peu brillantes, et qu'il y
en a donc certainement d'autres à découvrir.

Quelques chiffres (estimations) :

- Nombre de grandes galaxies à moins de 5 millions d'années lumière = 3


- Nombre de galaxies naines à moins de 5 millions d'années lumière = 36
- Nombre d'étoiles à moins de 5 millions d'années lumière = 700 milliards

5. L'univers jusqu'à 500'000 Années Lumière (les galaxies satellites) :

1054/2001
Sciences.ch 14/03/2005

La Voie Lactée est entourée par plusieurs galaxies naines, qui contiennent chacune quelques
dizaines de millions d'étoiles, ce qui est insignifiant comparé à la population de la Voie Lactée
elle-même. La carte ci-dessus montre l'ensemble des galaxies naines les plus proches, elles
sont liées gravitationnellement à la Voie Lactée, et gravitent autour d'elle en quelques
milliards d'années.

Quelques chiffres (estimations) :

- Nombre de grandes galaxies jusqu'à 500'000 années lumière = 1


- Nombre de galaxies naines jusqu'à 500'000 années lumière = 9
- Nombre d'étoiles jusqu'à 500'000 années lumière = 200 milliards

6. L'Univers jusqu'à 50'000 Années lumière (la Voie Lactée) :

1055/2001
Sciences.ch 14/03/2005

Cette carte montre la Voie Lactée dans son ensemble - une galaxie spirale d'au moins deux
cent milliards d'étoiles. Notre Soleil est profondément enfoui dans le Bras d'Orion à environ
26 000 années lumière du centre. Vers le centre de la Galaxie, les étoiles sont beaucoup plus
proches les unes des autres qu'à la périphérie où nous vivons. Notez également la présence de
petits amas globulaires bien en dehors du plan galactique, et la présence d'une galaxie naine
voisine - dite du Sagittaire - qui est en train d'être lentement avalée par notre propre Galaxie.

Quelques chiffres (estimations) :

- Nombre d'étoiles jusqu'à 50 000 années lumière = 200 milliards

7. L' Univers jusqu'à '5000 Années lumière (le Bras d'Orion) :

1056/2001
Sciences.ch 14/03/2005

Ceci est une carte de notre coin de la Voie Lactée. Le Soleil est situé dans le Bras d'Orion - un
bras assez petit comparé au Bras du Sagittaire, qui se situe plus près du centre galactique. La
carte montre plusieurs étoiles visibles à l'oeil nu, situées loin dans le bras d'Orion. Le groupe
d'étoiles le plus marquant est composé des étoiles principales de la constellation d'Orion - de
laquelle le bras spiral tire son nom. Toutes ces étoiles sont des géantes et supergéantes
lumineuses, des milliers de fois plus lumineuses que le Soleil. L'étoile la plus brillante de la
carte est Rho Cassiopeia - à 4'000 années lumière de nous, c'est juste une étoile à peine visible
à l'oeil nu, mais en realité c'est une supergéante 100'000 fois plus lumineuse que le Soleil.

Quelques chiffres (estimations) :

- Nombre d'étoiles jusqu'à 5'000 années lumière = 300 millions

8. L'univers jusqu'à 250 Années lumière (le voisinage du Soleil) :

1057/2001
Sciences.ch 14/03/2005

Cette carte indique les 1500 étoiles les plus lumineuses situées à moins de 250 années
lumière. Toutes ces étoiles sont bien plus lumineuses que le Soleil, et la plupart sont visibles à
l'oeil nu. Environ un tiers des étoiles visibles à l'oeil nu sont situées à moins de 250 années
lumière, même si cette zone ne représente qu'une toute petite partie de notre galaxie.

Quelques chiffres (estimations) :

- Nombre d'étoiles jusqu'à 250 années lumière = 250'000

9. L'univers jusqu'à 12.5 Années Lumière (les étoiles les plus proches) :

1058/2001
Sciences.ch 14/03/2005

Cette carte montre toutes les étoiles jusqu'à une distance de 12.5 années lumière de notre
Soleil. La plupart de ces étoiles sont des naines rouges - des étoiles avec une masse du
dizième de celle du Soleil et une luminosité cent fois moins grande. Environ quatre vingt pour
cent des étoiles de l'univers sont des naines rouges, et l'étoile la plus proche - Proxima du
Centaure- en est un exemple typique.

Cette carte montre toutes les étoiles connues situées à moins de 20 années lumière. On y
trouve un total de 77 systèmes contenant 110 étoiles.

1059/2001
Sciences.ch 14/03/2005

Les distances entre les étoiles sont énormes. La distance du Soleil à Proxima Centauri est de
4.22 années lumière, soit quarante trillions de kilomètres. Marcher sur cette distance prendrait
un milliard d'années. Même les sondes spatiales les plus rapides mettraient soixante mille ans
pour faire le voyage. Il y a actuellement quatre sondes qui quittent le système solaire - Pioneer
10 et 11, et Voyager 1 et 2 mais nous perdrons vraisemblablement le contact avec elles d'ici
une vingtaine d'annéees. Le schéma ci-dessous essaye de montrer ces distances en élargissant
le champ depuis le système solaire intérieur jusqu'à Alpha du Centaure.

1060/2001
Sciences.ch 14/03/2005

RAYONNEMENT FOSSILE

L'existence et les propriétés du rayonnement cosmique découvert par Penzias et Wilson


s'expliquent essentiellement par les deux phénomènes physiques que nous allons maintenant
décrire dans leurs grandes lignes.

L'expansion de l'Univers a pour conséquence son refroidissement graduel. A partir des valeurs
fantastiquement élevées qui ont dû régner aussitôt après le Big Bang qui a engendré l'Univers,
sa température a progressivement décrû. Lorsqu'elle atteint environ se produit le
premier des deux phénomènes cruciaux qui nous intéressent ici : la rayonnement, qui jusque-
là était en équilibre thermique avec les particules matérielles, cesse pratiquement d'interagir
avec elles et en devient indépendant. Dans le "modèle standard" d'évolution de l'Univers, nous
calculons que ce moment crucial se situe ans après le Big Bang.

1061/2001
Sciences.ch 14/03/2005

Nous pouvons comprendre qualitativement les raisons physiques de ce phénomène. Un peu


avant, lorsque par exemple la température était de , l'Univers contenait
essentiellement des photons, des électrons et des noyaux atomiques "nus" (principalement des
protons, et, dans une moindre proportion, des particules , noyaux d'hélium 4). La
température était trop élevée pour que les électrons et les noyaux puissent former des atomes,
autrement que de manière transitoire et labile. L'interaction entre les photons et les particules
chargées (surtout les électrons, les plus légères d'entre elles) est suffisamment intense, et la
densité de ces dernière était alors suffisamment forte, pour que les photons soient sans arrêt
diffusés, émis et absorbés. Malgré son expansion, l'Univers était était alors à chaque instant en
équilibre; sa température était constamment bien définie, bien que décroissant au cours du
temps, l'énergie des photons, c'est-à-dire la pulsation du rayonnement, était donc distribuée
suivant la loi de Planck correspondant à cette température .

La diminution de la température a ensuite permis la formation d'atomes à partir des électrons


et des noyaux. Ce processus a entraîné une chute rapide de la section efficace moyenne
d'interaction entre les photons et les particules matérielles (principalement à cause de la
disparition des électrons libres), de sorte que l'Univers est devenu transparent aux photons.
Une évaluation quantitative des caractéristiques du phénomène situe ce découplage au
moment où la température est descendue à .

Au moment du découplage, la densité volumique d'énergie du rayonnement est distribuée


dans le spectre des pulsations selon la loi de Planck (voir chapitre de thermodynamique) :

où nous admettrons que est la température ( environ – température de


ionisation des atomes les plus simples) à ce moment-là. Cette distribution va ensuite évoluer
sous l'influence de l'expansion de l'Univers.

Considérons les photons situées, à cet instant dans le volume , et dont la pulsation est
à près. Leur nombre est donc égal à :

Comme il n'y a plus d'absorption ni d'émission de photons à cette température (c'est un


hypothèse mais comme les mesures expérimentales semblent confirmer ce modèle à défaut de
mieux…), ce nombre va rester constant. Mais à cause de l'expansion de l'Univers, ces photons
en nombre constant vont occuper un volume plus grand, et acquérir une longueur d'onde plus
grande (selon l'expansion de la structure même de l'espace du à la valeur positive de la
constante de Hubble) c'est-à-dire une pulsation plut petite (l'équivalent de l'effet Doppler).
Pour préciser, examinons la situation à un instant ultérieur. Toutes les longueurs de
l'Univers ont été multipliées entre, entre et , par le même facteur d'échelle selon la loi
de Hubble : l'arête du volume cubique choisi est ainsi devenue :

1062/2001
Sciences.ch 14/03/2005

et la longueur d'onde des photons considérés :

de sorte que leur pulsation vaut à l'instant :

Donc, l'énergie contenue à cet instant dans le volume et dans la bande de pulsations
, que nous écrirons est donne par :

La densité volumique d'énergie à l'instant , pour la bande de pulsation


, s'écrit donc :

Il s'ensuite que la distribution spectrale de l'énergie est encore à l'instant celle du corps
noir :

où la température correspondante est telle que :

Ainsi, après son découplage d'avec la matière, la rayonnement cosmique évolue en conservant
la distribution d'un corps noir dont la température décroît régulièrement, dans la même
proportion que s'accroissent les distances au cours de l'expansion de l'Univers (depuis le
moment du découplage, le facteur d'échelle est très voisin de 1000 puisque pour passer de
aux actuels il y a un facteur 1000…). Cette valeur de 1000 nous permet à
partir du modèle de Friedmann-Lemaître que nous avons démontré en partie ci-dessus de
facilement calculer à quel moment de l'âge de l'Univers ce découplage a eu lieu. C'est ainsi
que nous trouvons une valeur d'a peu près années.

1063/2001
Sciences.ch 14/03/2005

C'est en se fondant sur ce raisonnement que divers auteurs furent amenés à prédire l'existence
dans l'Univers actuel, d'un rayonnement fossile de quelques kelvins. La découverte de Penzias
et Wilson, qui confirme parfaitement le plus solide en faveur du "modèle cosmologique
standard", qui reconstitue l'histoire de l'Univers à partir de la "grande explosion" initiale.

1064/2001
Sciences.ch 14/03/2005

MÉCANIQUE RELATIVISTE

Nous avons toujours considéré jusqu'à maintenant lors de tous nos développements que les
interactions (relations de cause à effet) entre les corps se faisaient instantanément, ainsi que
l'observation d'un phénomène avait lieu instantanément après que celui-ci, soit. Or, deux
physiciens (Michelson et Morley) au cours d'une expérience découvrirent quelque chose qui
allait changer radicalement toute la physique classique : la vitesse de la lumière était
invariante (constante) quelque soit le mouvement que l'on avait par rapport à elle. Cette
observation est d'autant plus importante que nous savons que c'est la lumière qui nous permet
de percevoir, ressentir les choses. Il convient également de prendre en compte que le champ
électrostatique, magnéatique sont comme nous l'avons vu en physique quantique ondulatoire,
des champs dont le "vecteur d'interactions" sont les photons qui se déplacement à la vitesse la
lumière. Cette constation nous permet aussi de supposer que le champ gravitationel
finalement a aussi un "vecteur d'interaction" (qui seraient les "gravitons" dont l'existence
semble prouvée indirectement) qui se propage à la vitesse de la lumière. Il convient dès lors
de prendre en compte cette "non-instantanéité" des et les conséquences que cela entraîne dans
les phénomènes observés pour déterminer finalement ce qui est réellement que ce qui semble
être.

Avant de nous attaquer aux calculs, il convient de définir un petit peu ce qui va être étudié
dans ce chapitre :

1. La "relativité restreinte" : elle est confinée aux référentiels inertiels (galiléens), c'est-à-dire
à l'étude de corps animés d'un mouvement rectiligne uniforme ou accéléré mais depuis un
référentiel galiléen.

2. La "relativité générale" : elle a pour rôle de prendre en compte des référentiels non inertiels
et dans n'importe quel système de coordonnées en faisant usage de la puissance du calcul
tensoriel pour être applicable dans n'importe quel type d'espace.

Ces deux théories se basent principalement sur cinq concepts très importants :

1. Le principe de moindre action (principe variationnel - voir chapitre de mécanique


analytique). Celui-ci nous permettra entre autres de construire la théorie de la relativité
générale de manière beaucoup plus explicite qu'en mécanique classique où il en est rarement
fait mention bien que tout soit basé sur ce dernier.

2. Le postulat d'invariance (de la vitesse de la lumière).

3. Le principe de cosmologique (que nous définissons plus loin lorsque nous commencerons à
étudier la relativité restreinte)

4. Le principe de relativité restreinte (voir plus loin)

5. Le principe d'équivalence (qui est tout aussi puissant que le principe variationnel et qui est
au la vraie idée géniale d'Einstein pour développer la relativité générale).

Nous étudierons donc dans l'ordre :

- la relativité restreinte sous forme algébrique classique dans un premier temps et ensuite avec
une petite correspondance à la notation tensorielle et à l'aspect géométrique de cette théorie

1065/2001
Sciences.ch 14/03/2005

afin de préparer le terrain pour la relativité générale.

- la relativité générale en faisant usage à outrance du calcul tensoriel, de la mécanique


analytique (formalisme lagrangien) et de l'électrodynamique (si...si...)

Remarque : certains ouvrages font usage de la trigonométrie hyperbolique pour étudier la


relativité restreinte dans les détails. Sans vouloir en faire usage dans ce site nous nous
proposons de montrer lors de l'introduction des espaces de Minkowski de quelle méthode
d'approche il s'agit afin que le lecteur n'en ignore par l'existence.

RELATIVITÉ RESTREINTE

Les lois physiques expriment des relations entre des grandeurs physiques fondamentales. Si
les lois physiques sont invariantes par changement de référentiel galiléen comme nous l'avons
vu en mécanique classique, il n'en est pas forcément de même des grandeurs physiques. Ces
dernières peuvent se transformer d'un référentiel galiléen à un autre selon une loi de
transformation simple comme nous l'avons vu au chapitre de mécanique classique. Il en est de
même en relativité restreinte mais nous devons maintenant prendre en compte ce que nous
avions négligé lors de notre des transformations de galilée : l'intervalle de temps entre deux
événements n'est pas le même pour deux observateurs si la vitesse de la lumière est finie !
(trivial)
Nous allons donc voir maintenant l'invariance de la vitesse de la lumière, implique de
nouvelles règles mathématiques afin d'assurer l'invariance des lois de la physique lors d'un
changement de référentiel. Ces règles sont ce que nous appelons les "transformations de
Lorentz" et c'est ce que nous allons maintenant par une développement mathématique
extremement simple (beaucoup beaucoup plus simple que la relativité générale) démontrer
maintenant.

D'abord, il nous faut d'abord énoncer deux concepts :

POSTULAT D'INVARIANCE

Des mesures de laboratoire (expérience de Michelson-Morley comme nous en avons fait


mention) ont, depuis fort longtemps, montré que la vitesse mesurée par un référentiel
inertiel est bien constante quelque soit la vitesse d'entraînement. Nous devons alors postuler la
propriété suivante :

Postulat : la vitesse de la lumière (vecteur de transport de l'information) ne peut ni s'ajouter, ni


se soustraire, à la vitesse d'entraînement du référentiel dans lequel nous la mesurons (plus
clairement cela signifie que quelque soit la vitesse à laquelle vous vous déplacerez vous
mesurerez toujours la vitesse de lumière comme valant numériquement constant et fini!).

Corollaire : le principe de relativité Galiléen (voir chapitre de mécanique classique) selon ce


postulat est complétement mis à défaut et il nous faut alors développer une nouvelle théorie
qui prend en compte cette propriété de la lumière

Remarque : il est important de noter que nous considèrons que la lumière est dans le cadre
actuel de la relativité restreinte, le messager de l'information d'un corps sur un autre !!!

PRINCIPE COSMOLOGIQUE

1066/2001
Sciences.ch 14/03/2005

Définition : nous supposons que notre position dans l’Univers est typique, non seulement dans
l’espace comme l’affirme le modèle standard de l'Univers (voir chapitre d'astrophysique),
mais aussi dans le temps. Ainsi, un astronome situé dans une galaxie éloignée doit observer
les mêmes propriétés générales de l’Univers que nous, qu’il ait vécu un milliard d’années plus
tôt, ou qu’il l’observe dans un milliard d’années.

En fait, il est relativement naturel d’aller plus loin et d’énoncer que : l’Univers présente le
même aspect en chacun de ses points, c’est-à-dire qu’il est homogène. Cette homogénéité
s’énonce sous la forme du "principe cosmologique". Ce principe ne repose pas sur les
observations, si fragmentaires par rapport à la démesure du cosmos qu’elles ne sauraient
permettre d’établir sa validité. Il constitue bien un présupposé à toute étude physique de
l’Univers. Sa raison d’être tient à son caractère, indispensable à toute cosmologie scientifique,
et peut-être à une certaine réaction par rapport à l’ancienne vision géocentrique ou
héliocentrique : il est supposé désormais évident qu’aucun lieu n’est privilégié dans le
cosmos !

PRINCIPE DE RELATIVITÉ RESTREINTE

Rappelons (voir chapitre de mécanique classique) que les transformations galiléennes nous
disent qu’aucun référentiels ne peut être considéré comme un référentiel absolu puisque les
relations entre les grandeurs physiques sont identiques dans tous les référentiels galiléens
("principe de relativité galiléen"). Le mouvement galiléen est donc relatif.

Au 20ème siècle les physiciens constatèrent qu’une importante catégorie de phénomènes


physiques violait le principe de relativité galiléen : les phénomènes électromagnétiques.

En appliquant les transformations galiléennes aux équations de Maxwell on obtient un jeu


d’équations différent selon que l’observateur se trouve dans un référentiel fixe ou un
référentiel mobile. Par exemple, considérons un électron. Dans le référentiel qui lui est lié (le
référentiel propre) le seul phénomène électromagnétique observable est le champ électrique
dont l’électron est la source. Dans un référentiel galiléen mobile par rapport à l’électron,
celui-ci devient également la source d’un champ magnétique. Il en découle que les lois de
l’électromagnétisme varient d’un référentiel galiléen à un autre ou, en d’autres mots, que les
équations de Maxwell ne sont vraies que dans un seul référentiel, un référentiel de référence
absolu. Or, comme nous l’avons vu en analysant la relativité galiléenne, il n’est pas possible
de distinguer un référentiel galiléen d’un autre car le mouvement uniforme est un phénomène
physique relatif.

Ces remarques nous conduisent à conclure que :

· soit les équations de Maxwell sont fausses,

· soit les transformations galiléennes sont inexactes,

· ou enfin que notre compréhension du mouvement est incomplète.

Albert Einstein n’admettait pas la violation du principe de relativité galiléenne par


l’électromagnétisme. De son point de vue il fallait au contraire le généraliser à toutes les lois
physiques. Il postula que les lois physiques doivent être identiques dans tous les référentiels
galiléens ce qui implique, implicitement, que du point de vue des lois physiques, il n’est pas
possible de distinguer un référentiel galiléen d’un autre. Ce principe fut baptisé principe de

1067/2001
Sciences.ch 14/03/2005

relativité restreinte (cette relativité est en effet restreinte aux cas des référentiels galiléens
exclusivement).

Énoncé du principe de relativité restreinte : les lois physiques sont inchangées après un
changement de référentiel galiléen ou encore, les lois physiques sont identiques dans tous les
référentiels galiléens.

TRANSFORMATIONS DE LORENTZ

Pour que soit possible l'invariance de , nous devons admettre que le temps ne s'écoule pas de
la même manière pour l'observateur immobile que pour l'observateur dans un
référentiel en translation uniforme en (ce cas particulier de dispositions des référentiels dans
lesquels les axes d'espaces sont parallèles amènent à ce que nous appelons les "transorfmations de
Lorentz pures" ou "transformations de Lorentz spéciales") à vitesse relative (le terme "relative" est
important!) .

Pour étudier le comportement des lois physique, nous devons alors nous munir de deux
horloges qui donnent et (le référentiel qui contient son horloge/instrument de mesure est
appelé "référentiel propre")

Mettons en place l'expérience imaginaire suivante :

Lorsque les observateurs et sont superposés, nous posons et et nous


émettons un flash lumineux dans la direction d'un point repéré par et .

Il est évident que lorsque le flash arrivera en , l'observateur mesurera un temps et


un temps .

L'observateur conclut dès lors :

L'observateur lui, conclut :

1068/2001
Sciences.ch 14/03/2005

Étant donne que le déplacement de ne se fait qu'en , nous avons pour les deux
observateurs :

De plus, si la trajectoire du rayon lumineux se confond dans , nous avons :

Ce qui nous donne dès lors et d'où :

et

Ce deux relations sont donc égales (nulles) en tout entre les deux observateurs. Ce
sont les premiers "invariants relativistes" (valeurs égales quelque soit le référentiel). Nous
retrouverons ces deux relations sous une forme plus généralisée lors de la fin de notre étude
de la relativité restreinte il convient donc de s'en souvenir.

Il convient maintenant de se rappeler, que dans le modèle classique ("relativité galiléenne"),


nous aurions écrit que la position du point pour l'observateur à partir des informations
données par serait et réciproquement (voir chapitre de mécanique classique) tel
que :

Dans le modèle relativiste, nous devons par contre admettre que le temps qui est en relation
avec n'est pas le même que qui est en relation avec parce que le principe de relativité
oblige (sinon quoi il serait donc impossible d'expliquer l'invariance de la vitesse de la
lumière) !

Nous sommes alors ammenés à poser la relation précédente sous la forme suivante :

où serait une valeur numérique à déterminer.

Démonstration :

De plus, si , nous devons aussi pouvoir exprimer comme fonction de et de sous la


même similaire :

Résumons la forme du problème :

à déterminer :

1069/2001
Sciences.ch 14/03/2005

à déterminer :

Nous cherchons alors à déterminer la relation permettant de connaître la valeur des


coefficients , qui satisfont simultanément:

et

Remarque : ces deux relations nous permette d'écire une relation que nous ré-utiliserons bien
plus loin :

Donc, avec les dernières relations, nous obtenons :

Distribuons :

Pour satisfaire la relation:

Il faut que :

(1)

(2)

(3)

Il est facile de résoudre (2) :

Nous introduisons alors ce résultat dans (1) et (3) et nous arrivons à :

(1')

1070/2001
Sciences.ch 14/03/2005

(3')

Si nous divisons (2') par (3'), nous obtenons :

et en introduisant ce dernier résultat dans la relation , nous obtenons le résultat


remarquable suivant:

que nous notons souvent :

et que nous appelons "facteur de Michelson-Morley".

En introduisant également :

dans

nous obtenons :

Nous en tirons les relations de transformation de Lorentz :

1071/2001
Sciences.ch 14/03/2005

qui sont donc bien covariantes.

Rappel : certaines grandeurs physiques se transforment comme le système de coordonnées


(cartésiennes, polaires, etc.) lors d'un changement de référentiel, d'autres non. Nous qualifions
les grandeurs de la première catégorie des grandeurs "covariantes" (en analogie avec les
composantes covariantes vues dans le chapitre de calcul tensoriel) et les autres de grandeurs
"invariantes" ou "contravariantes" (en analogie avec les composantes contravariantes vues
dans le chapitre de calcul tensoriel)

Si nous posons :

avec

Nous pouvons alors écrire (le lecteur remarquera que les unités de tous les termes à gauche de
l'égalité sont toutes identiques – il s'agit à chaque fois d'une distance) :

Nous pouvons alors mettre les transformation de Lorentz des coordonnées et du temps sous la
forme matricielle suivante :

Vous retrouverez fréquemment cette "matrice de Lorentz" ou "tenseur symétrique de


Lorentz" (peu importe finalement) :

1072/2001
Sciences.ch 14/03/2005

dans certains ouvrages sous la forme condensée respectivement ou encore plus


souvent (et c'est la notation que nous adopterons sur ce site) en spécifiant que nous
effectuons une transformation de Lorentz des composantes spatiales et temporelles (puisqu'il
en existe aussi pour d'autres grandeurs physique comme nous allons le voir).

Remarques :

R1. La transformation inverse étant effectuée bien évidemment avec la matrice inverse

R2. Le vecteur est quant à lui, appelé le "quadri-vecteur d'espace-temps" ou encore


"quadri-vecteur déplacement".

Nous pouvons de même déterminer les transformations de Lorentz des vitesses. Considérons
une particule en mouvement dans un référentiel inertiel tel qu'au temps , ses
coordonnées sont . Dès lors, les composantes de la vitesse sont :

Quelles sont alors les composantes dans la vitesse dans . A nouveau, nous écrivons :

Nous pouvons différentier les équations de transformation des composantes que nous avons
obtenu avant et ainsi pouvons écrire :

Dès lors, nous avons :

et de même :

1073/2001
Sciences.ch 14/03/2005

et :

Et comme la vitesse constante du référentiel est donné par , nous avons alors :

et inversement :

Dans la limite de la mécanique classique, où la vitesse de la lumière était supposée comme


instantanée et donc . Nous avons :

qui sont les transformations de Galilée telles que nous les avons vues en mécanique classique.

De même, nous pouvons déterminer les transformations relativistes des accélérations entre
référentiels inertiels. Cependant ces relations sont relations sont très rarement démontrées
dans les livres ou instituts scolaires et chacun présente des résultats différents. Il convient de
prendre avec extrême précaution les développements qui vont suivre tant qu'ils n'auront pas ét
confirmés ou corrigés par d'autres. Ainsi :

et donc :

et donc :

1074/2001
Sciences.ch 14/03/2005

et de même :

et :

Et inversement :

ADDITION RELATIVISTE DES VITESSES

Comme la vitesse de la lumière est une vitesse indépassable nous venons maintenant à nous
demander quelle sera alors finalement la vitesse d'un objet lancé à un vitesse proche de celle
de la lumière (par exemple...) à partir d'un référentiel se déplaçant lui aussi à une vitesse
proche de la lumière (pourquoi pas non plus...).

Il nous faut alors trouver une relation qui donne la vitesse réelle à partir de la vitesse de
lancement et de la vitesse de référentiel .

1075/2001
Sciences.ch 14/03/2005

Nous savons que pour l'objet lancé :

Comme celui qui est intéressé ne connaît pas la vitesse réelle , il se doit d'utiliser les
transformations de Lorentz. Ainsi, nous savons que :

et nous avons également :

d'où :

Nous savons que d'où finalement la "loi d'addition relativiste des vitesses" :

VARIATION RELATIVISTE DES LONGUEURS

Considérons maintenant que longueur d'un objet est donnée par la distance entre ses deux
extrémités et . Considérons cet objet immobile dans le référentiel et orienté
selon l'axe . Sa longeur est donc la distance entre ses deux extrémités :

Pour l'observateur , l'objet est en mouvement. Les positions de et devraient donc être
mesurées simultanément :

d'où le résultat remarquable :

1076/2001
Sciences.ch 14/03/2005

Ainsi, la longueur d'une règle observée dans un référentiel mobile par rapport au référentiel
propre de la règle est inférieure à sa longueur propre. Ce phénomène porte le nom de
"contraction des longueurs".

VARIATION RELATIVISTE DU TEMPS

Un événement est un phénomène qui se produit en un endroit donné et à un instant donné.


L'origine du temps étant difficile à préciser, nous préfèrerons souvent définir la notion
d'intervalle de temps comme le temps qui s'écoule entre 2 événements comme d'habitude.

Considérons maintenant deux événements et consécutifs qui se produisent au même


endroit (!) dans le référentiel en translation.

Pour l'observateur , l'intervalle de temps est simplement :

Pour mesurer cet intervalle, l'observateur dans le référentiel fixe, doit aussi imposer que
est commun aux 2 événements :

d'où le résultat remarquable ci-dessous :

Conclusion: l'observateur mesure un intervalle de temps d'autant plus grand que le


référentiel dans lequel se déroule le phénomène se déplace rapidement. Le temps dans le
référentiel mobile semble comme dilaté (oui! il semble mais c'est tout!) par rapport à celui en
vigueur dans le référentiel fixe.

VARIATION RELATIVISTE DE LA MASSE

Toutes les expériences de physique fondamentales sur des particules à hautes énergies ont
conduit à l'observation que leur masse augmente, lorsqu'elle se déplacent à vitesse par
rapport à l'observateur selon :

Nous n'avons pas connaissance d'une démonstration mathématique de cette relation et si

1077/2001
Sciences.ch 14/03/2005

quelqu'un en connaît une, nous sommes preneurs.

ÉQUIVALENCE MASSE-ÉNERGIE

Sous l'action d'une force , la vitesse d'une masse augmente ou diminue sur chaque
portion de la trajectoire. Le travail de la composante peut s'interpréter alors en énergie
cinétique ..

Dans la théorie relativiste, la masse varie avec la vitesse, donc:

L'intégration par partie ( ) nous donne :

Le gain d'énergie cinétique d'une particule peut donc être considérée comme gain de sa masse.
Puisque est la masse au repos, la quantité est appelée "énergie au repos" de la
particule.

Nous avons donc :

où représente l'énergie de mouvement.

La somme :

représente donc l'énergie totale de la particule en absence de champ de potentiel. Ce qui


nous amène à écrire :

LAGRANGIEN RELATIVISTE

1078/2001
Sciences.ch 14/03/2005

Les développements suivants vont nous permettre dans l'étude de l'électrodynamique, de


déterminer l'expression du tenseur du champ électromagnétique ainsi qu'en physique
quantique ondulatoire de déterminer l'équation de Klein-Gordon avec champ magnétique. Il
faut donc bien lire ce qui va suivre.

En relativité, nous voulons donc que les équations du mouvement aient la même forme dans
tous les référentiels inertiels. Pour cela, il faut que l'action (voir chapitre de mécanique
analytique) soit donc invariante par rapport aux transformations de Lorentz. Guidés par ce
principe, essayons d'obtenir l'action d'une particule libre. Supposons que l'action soit dans le
référentiel :

Remarques :

R1. Le choix du signe moins deviendra évident lors de notre étude de l'électrodynamique.

R2. Le notation au lieu de pour le lagrangien permet simplement de mettre en évidence


qu'il s'agit d'un cas d'étude ou le système est libre. Cette distinction de notation sera utile lors
de notre étude de la relativité générale et de la détermination du tenseur du champ
électromagnétique.

Et rappelons que :

Dans le référentiel , nous avons alors :

Donc selon notre hypothèse initiale, nous avons pour le lagrangien relativiste (en l'absence de
champ de potentiel donc… puisque le système est "libre") :

Dans l'approximation non-relativiste , nous avons selon le développement de


MacLaurin :

Nous retrouvons donc le lagrangien habituel d'un système libre en mouvement mais plus un
constante qui n'affecte cependant pas les équations du mouvement que nous obtenons
en mécanique classique mais qui nous sera absolument nécessaire en électrodynamique.

1079/2001
Sciences.ch 14/03/2005

Rappelons maintenant que le moment généralisé (voir chapitre de mécanique analytique) est
défini par :

Nous allons voir maintenant que cette définition n'est pas fortuite. Effectivement :

L'hamiltonien (voir chapitre de mécanique analytique) vaut :

ce qui donne :

L'hamiltonien est dans ce cas égal à l'énergie totale de la particule. Son expression nous
amène à finalement à changer un peu notre hypothèse initiale et finalement à écire au lieu
de dans l'expression de l'action .

Ainsi nous avons finalement :

et

Dans l'approximation non relativiste , devient (développement de MacLaurin) :

Nous reconnaissons l'énergie cinétique usuelle, plus une constante : l'énergie au repos. Ce qui
correspond bien aux calculs que nous avions fait avant où nous avons obtenu :

QUANTITÉ DE MOUVEMENT RELATIVISTE

1080/2001
Sciences.ch 14/03/2005

L'énergie totale et la quantité de mouvement d'une particule peuvent donc


prendre n'importe quelle valeur positive (si la vitesse tend vers la valeur limite , la masse
s'adapte pour que le produit ne soit pas borné).

Dans l'expression de , nous pouvons remplacer la vitesse par une fonction de :

introduit dans :

nous avons :

d'où :

Nous n'avons pas gardé la partie négative de l'égalité précédente car elle n'a aucun sens en
physique classique. Cependant, lorsque nous étudierons la physique quantique, il s'avérera
indispensable de la préserver sinon quoi nous arriverons à des absurdités (voir le chapitre de
physique quantique ondulatoire)

Nous devons donc chercher les relations entre et ainsi qu'entre et , pour qu'il soit
possible à d'écrire :

Nous commencons alors à nous débarrasser de la racine carrée:

Si écrit :

1081/2001
Sciences.ch 14/03/2005

doit pouvoir écrire :

Nous avons donc :

Si nous comparons :

, , et

nous obtenons des expressions exactement semblables à celles utilisées pour les
transformations de Lorentz des composantes spatiales et temporelles. Nous pouvons alors
écrire, par similitude, que les transformations pour la quantité de mouvement et l'énergie sont
dès lors données par :

À nouveau, si nous prenons :

avec

Nous avons dès lors en exprimant toutes les relations précédentes de transformation dans les
mêmes en se souvent que :

Nous pouvons alors définir un matrice telle que:

1082/2001
Sciences.ch 14/03/2005

Vous retrouverez fréquemment cette "matrice de Lorentz" ou "tenseur symétrique de


Lorentz" :

qui se note aussi en spécifiant que nous effectuons une transformation de Lorentz des
quantités de mouvement et de l'énergie.

Remarques :

R1. La transformation inverse étant effectuée bien évidemment avec la matrice inverse

R2. Le vecteur est quant à lui, appelé le "quadri-vecteur d'énergie-impulsion".

FORCE RELATIVISTE

Suivant le principe de la relativité, nous voulons que la relation entre la force et la quantité de
mouvement s'écrive de la même manière par deux observateurs d'inertie en translation l'un par
rapport à l'autre:

Ainsi, si écrit :

doit pouvoir écrire :

La relation entre est assez compliquée dans le cas général. Nous nous limiterons ici
au cas particulier où un corps est momentanément immobile dans et où donc l'observateur
ne tiendra compte que de la force qu'il applique. Il l'appellera par ailleurs "force
propre", car il n'a pas à se préoccuper d'autres forces (comme une force centrifuge, par
exemple).

Il faut substituer et par et dans :

1083/2001
Sciences.ch 14/03/2005

Puisque :

nous aurons :

Nous avons par ailleurs vu que :

Il reste donc :

La composante de la force est donc invariable dans la direction du déplacement.

Pour les directions perpendiculaires au déplacement:

et

En résumé:

La matrice de transformation est triviale et nous ne l'avons jamais trouvée dans la littérature.
Nous n'en ferons donc pas mention.

CHAMPS ÉLECTRIQUE ET MAGNÉTIQUE RELATIVISTES

1084/2001
Sciences.ch 14/03/2005

Avec un spectromètre de masse, nous établissons que le rapport de la masse d'une


particule par sa charge électrique varie de la même manière que la masse lorsque la
vitesse de la particule varie :

Ainsi, il vient que :

La charge d'une particule est donc indépendante de sa vitesse comme nous l'avons démontré
dans la section d'électromagnétisme (chapitre d'électrodynamique) lors de la détermination de
l'équation de conservation de la charge.

Considérons maintenant deux charges et immobiles dans le référentiel en translation


à vitesse par rapport à :

Nous allons nous restreindre au cas où la vitesse est parallèle à l'axe :

La charge est placée en et elle est donc immobile pour . L'observateur conclut
qu'une force électrostatique :

agit donc sur la charge témoin placée en .

L'observateur voit également un champ électrostatique en , mais il voit aussi que


est en mouvement selon l'axe . Il en déduit donc l'existence d'un champ magnétique en
orienté dans le plan :

1085/2001
Sciences.ch 14/03/2005

Il mesure donc la force (voir le chapitre de magnétostatique) de Lorentz (supposée connue) :

Mais :

Donc :

Nous avons vu maintenant:

La comparaison des expressions ci-dessus donne les transformations relativistes du champ


électrique :

Comme pour la transformation de Lorentz des composantes spatiales et temporelles, nous


avons obtenu les transformations inverses en échangeant les champs et en considérant que
voit reculer (nous remplacons donc par – ).

Pour obtenir les transformations du champ magnétique nous procèdons comme ci-dessous:

Après quelques petites manipulations d'algèbre très élémentaire, nous obtenons :

1086/2001
Sciences.ch 14/03/2005

Nous faisons identiquement:

Après encore une fois quelques petites manipulations d'algèbre très élémentaire, nous
obtenons :

et ainsi de suite. Nous obtenons finalement :

Etudions maintenant le comportant du champ électromagnétique d'une charge en


mouvement :

Soient deux référentiels parallèles et , en translation à vitesse constante selon l'axe


':

1087/2001
Sciences.ch 14/03/2005

où une charge immobile est placée en . Il est clair alors que l'observateur mesure
partout et qu'au point du plan , en il mesure le champ
électrostatique :

Si l'observateur est informé des valeurs de et de , il peut les introduire dans les
transformées relativistes donnant le champ électrique qu'il observe:

Pour écrire une expression du champ au point , l'observateur doit déterminer, à un


instant de son temps local, les composantes du vecteur qui sépare le point de
la charge (en sommant les vecteurs position de ces deux derniers points matériels).

Le coordonnées du point et de la charge qu'il voit dans le plan sont donnés par les
tranformations de Lorentz habituelles :

et

Il en déduit donc facilement, pas sommation les distances .

Une autre méthode, plus simple, est que étant donné que la composante est une longueur,
elle subit donc les transformation de Lorentz et :

Car rappelons le :

et

La transformée relativiste du champ électrique donne alors:

1088/2001
Sciences.ch 14/03/2005

et :

Écrit sous forme vectorielle :

Il nous faut encore déterminer exprimer en fonction de :

car (théorème de Pythagore) :

L'écriture se simplifie si nous utilisons l'angle formé par le vecteur champ électrique et l'axe
. Nous notons alors dans et dans les angles données par :

et

avec à cause de la dilatation des longueurs selon l'axe .

Nous élimine avec :

Ainsi, le champ électrique que voit est donné par :

Le facteur contenant montre que le champ électrique d'une charge en mouvement n'a
plus la symétrie sphérique. Il dépend de la direction du vecteur :

A distance égales, le champ électrique est plus intense dans la direction verticale à celle du
déplacement ( ) que dans la direction du déplacement de la charge ( ).

1089/2001
Sciences.ch 14/03/2005

Si , nous retrouvons par ailleurs l'expression classique et connue:

Remarque imortante : rappelons que nous avons effectué (et continuons dans ce sens) ici une
étude d'une charge en mouvement rectiligne uniforme, c'est-à-dire à vitesse constante.

Pour trouver maintenant l'expression du champ magnétique , nous introduisons :

et

et

dans:

Nous obtenons dès lors:

qui sont les composantes de :

Pour connaître en fonction de , nous substituons l'expression obtenue pour

Remarque: dans la cas où la vitesse est faible, le terme relativiste tend vers 1 et le champ
d'une charge se déplaçant à la vitesse devient:

car comme nous l'avons vu en électromagnétisme:

Remarques:

1090/2001
Sciences.ch 14/03/2005

R1. En chaque endroit, les lignes du champ sont contenues dans un plan perpendiculaire à
la direction de déplacement de la charge (produit vectoriel oblige)

R2. Si la charge en mouvement est vue comme un attaché au point , nous peuvons
interpréter son déplacement à vitesse comme un courant en un point du référentiel où
se trouve . Ainsi :

Cette dernière relation est connue sous le nom de la "loi de Biot et Savart" et nous la
retrouverons au début de la section traitant de l'éléctromagnétisme. Cet état de fait, valide
encore le modèle relativiste.

RELATION D'EINSTEIN

Suivant le principe de relativité, nous souhaitons que la relation entre la quantité de


mouvement et l'énergie d'une onde électromagnétique s'écrive de la même manière pour deux
observateurs d'inertie en translation l'un par rapport à l'autre:

Si écrit:

et

alors doit pouvoir écrire :

Reprenons la première relation ci-dessus et mettons-la au carré sans oublier que le photon à
une masse nulle . Alors :

et comme :

Étant donnée connue la relation de Planck (définie en thermodynamique) :

nous sommes amenés à écrire la fameuse "relation d'Einstein" que nous retrouverons en
physique quantique et aussi en thermodynamique :

1091/2001
Sciences.ch 14/03/2005

ESPACE-TEMPS DE MINKOWSKI

Nous avons démontré que:

Écrivons cela sous la forme :

Multiplions les deux membres par :

ce qui nous donne :

Si la vitesse est égale à celle de la lumière , l'équation s'annule :

Ce résultat traduit, que les dimensions d'espace et de temps sont comme arrêtées dans le
référentiel relativiste, car la vitesse de l'objet est égale à celle de la lumière!

Imaginons maintenant qu'un faisceau lumineux soit émis à l'instant et se propage sur
l'axe à la vitesse constante de la lumière, . Nous savons que et que dans l'espace-
temps de Minkowski (application du théorème de Pythagore dans l'espace euclidien à trois
dimensions), cette relation s'écrit:

En changeant de membre et en portant le tout au carré pour supprimer la racine, nous


obtenons :

1092/2001
Sciences.ch 14/03/2005

Remarque : nous pouvons assimiler cette équation à la représentation d'un front d'onde
sphérique d'une onde lumineuse se propageant à la vitesse de la lumière.

Considérons maintenant deux événements de coordonnées et et


pour éviter la confusion changeons de lettre . Nous pouvons dès lors écrire que :

En passant à la limite, nous avons obtenons la forme quadratique :

Qui à la même forme et même valeur quelque soit le référentiel considéré. est donc un
invariant relativiste que l'on appelle "l'abscisse curviligne d'espace-temps", c'est l'intervalle
d'espace-temps où, comme le dit simplement Einstein, le "carré de la distance"…. Le fait que
cette grandeur puisse être positive, négative (!) ou nulle est liée au caractère absolu de la
vitesse de la lumière (nous y reviendrons juste après).

Si nous mettons les deux relations suivantes en relation :

et

La corrélation entre ces deux relations nous donne lorsque que les deux événements
sont reliés à la vitesse de la lumière.

De plus, si nous posons nous pouvons alors écrire :

Ceci n'est rien d'autre que l'équation d'un cône d'axe d'ordonnée … le fameux "cône
d'Univers" (sur lequel nous consacrons tout une étude plus loin). Tout événement est donc par
extension dans ce cône et l'évolution de tout système peut donc y être décrit (par sa positition
spatiale et temporelle), par ce que nous appelons sa "ligne d'Univers". La ligne d'Univers
d'une particule est donc la séquence d'événements qu'elle occupe durant sa vie.

Revenons maintenant à nos transformation de Lorentz. Rappelons que nous nous sommes
restreints au cas particulier où les axes d'espaces étaient parallèles (ce qui nous avait amener à
définir le terme "transformations de Lorentz pures"). Cette configuration spéciale a une
propriété géométrique intéressant dont parfois certains ouvrages font usage. Voyons de quoi il
s'agit.

Nous avons vu dans le cadre des transformation de Lorentz des longueurs que nous avions
une transformation spéciale que selon l'axe , ayant pour les autres composantes
. Ce qui nous permet tout à fait de réduire la matrice de transformation que nous
avions à une matrice plutôt que comme nous l'avions obtenu plus haut :

1093/2001
Sciences.ch 14/03/2005

L'identification de et de par invariance (et découlant des transformation


relativistes) nous impose les relations suivantes :

La première relation peut être mise en relation avec une des relations remarquables de la
trigonométrie hyperbolique (voir le chapitre trigonométrie de la section de géométrie du site)
tel que et , la deuxième qu'il existe tel que et
. La troisième donne alors la relation remarquable :

et donc que nous noterons plus simplement . Finalement les transformation de


Lorentz spéciales de vitesse suivant l'axe peuvent aussi s'écrire

ce qui nous impose comme propriétés remarquables de par les relations remarquables de la
trigonométrie hyperbolique :

et

La quantité (sans dimensions) est appelée "rapidité" par ceux qui l'utilisent en physique des
hautes énergies. Nous nous arrêterons ici en ce qui concerne l'étude géométrique de la
relativité restreinte trouvant que cela à de moins en moins d'intérêt de procéder ainsi (bien que
ce soit fort sympathique).

CÔNE D'UNIVERS

Remarque : si nous posons que la vitesse de lumière est égale à l'unité, l'axe des ordonnées
devient alors par abus de langage "purement temporel". Nous ne ferons pas ce choix sur ce
site.

Un événement ponctuel apparaît instantané (approximation reposée sur l'optique géométrique)


à tout observateur capable de le voir. Une collision entre deux particules ponctuelles fournit
un exemple d'événement ponctuel. Il est tout à fait possible qu'un événement instantané non
ponctuel apparaisse instantané à un certain observateur mais, à cause de la vitesse de

1094/2001
Sciences.ch 14/03/2005

propagation finie de la lumière, non instantané à un autre observateur.

Définitions :

D1. Nous dirons par définition que deux événements ponctuels occupent le même point
d'espace-temps s'ils apparaissent simultanés à tout observateur capable des les voir.

D2. L'ensemble de tous les points de l'espace-temps est appelé "l'espace-temps".

D3. La frontière définie par le cône d'Univers est appelée "horizon cosmologique"

Rappel : Si aucune force n'agit sur une particule ponctuelle, nous la qualifions "d'inertielle";
nous disons également qu'elle est en "mouvement inertiel".

Étant donné le point , est une structure géométrique absolue, indépendante de


l'observateur. Sa composante future sera notée ; sa composante passée et elle
sera représentée lar le cône :

La ligne d'univers de tout observateur qui occupe instantanément (dont la ligne d'univers
passe par ) est contenue à l'intérieur de définit par un point unique sur sa sphère
céleste (pour un observateur donné, son temps propre pouvant être normalisé à l'unité, nous
avons alors une sphère). Cela veut dire qu'il peut y avoir autant de rayons nuls (foyers des
cônes) passant par que de points sur une sphère.

L'exemple suivant paraîtra plus évident (il faut comprendre par soi-même implicitement que
l'Univers a son propre cône d'Univers - si l'espace est de type Minkowskien bien sûr...) :

1095/2001
Sciences.ch 14/03/2005

Comme illustré sur la figure ci-dessus, un événement lumineux au point de l'espace-temps


produit un faisceau de photons, tous dans le cône nul du futur , (ces photons ont été
émis par des atomes dans des états de mouvement variés, dont les lignes d'univers et
passent par , mais sont entièrement contenues à l'intérieur de ). La ligne d'univers
ne peut seulement être décrite par une particule se mouvant à la vitesse de la lumière car elle
définit la frontière du cône (nous disons alors que la ligne d'Univers est "du genre lumière").

Remarque : la représentationd des lignes d'Univers dans la partie inférieur (cône renversé)
vient du fait qu'un événement peut également avoir un passé... donc le schéma généralise
l'exemple particulier

Soit la ligne d'univers d'un personnage immobile (d'où la verticalité de sa ligne


d'Univers sur la figure ci-dessus) et celle d'un rayon lumineux ayant pour origine . Tous
deux résident dans l'espace à quatre dimensions et ils se coupent selon un point unique .
Les points et se situent sur un rayon nul (d'un future cône), , de . En , le
personnage voit un flash soudain dans la direction définie par , pour lui la direction de
l'événement lumineux (décrite uniquement par sa vitesse donc, ainsi une ligne d'univers d'une
particule inertielle peut être décrite uniquement par le temps et sa vitesse).

Un atome dont la ligne d'univers coupe au point , absorbe un photon de l'événement


lumineux et réémet peu de temps après un faisceau de photons. Ceux-ci forment alors à
leur tour des rayons nuls dans , mais seuls ceux de direction atteindront le
personnage et seront vus par lui au point .

Les physiciens disent alors, en analogie avec la mathématique, qu'en considérant donnée une
ligne d'univers inertielle, nous avons une classe d'équivalence (voir le chapitre de théorie des

1096/2001
Sciences.ch 14/03/2005

ensembles) de lignes d'univers parallèles et, par extension étant donné un point sur une
ligne d'univers, nous avons une classe d'équivalence de points synchrones avec . Cette classe
d'équivalence de points forme bien évidemment un plan tri-dimensionnel passant par (à
priori c'est sympathique de se l'imaginer mais je ne suis pas convaincu de l'utilité de la chose).

Si se trouve à l'intérieur de , le cône nul de , nous dirons que sa ligne d'Univers est
de "genre temps". Dans ce cas, et sont situés sur la ligne d'univers d'un observateur ou
d'une particule massive. Il existe bien évidemment deux types de déplacements de genre
temps: si est dans le futur de (selon un observateur dont la ligne d'univers passe par
et ), nous dirons que "pointe vers le futur" dans le cas contraire, nous dirons bien
entendu qu'il "pointe vers le passé".

Si se situe sur , nous dirons alors qu'il est "nul" et n'est ni nul ni de genre temps,
alors se situe à l'extérieur de . Nous disons alors que qu'il est de "genre espace" :

Cela se traduit mathématiquement simplement par :

D1. : la ligne d'univers est donc de "type lumière" (selon ce que nous avons démontré
précédemment)

D2. : nous disons alors que la ligne d'univers est de "type espace". Effectivement, la
différence ne peut être négative de par l'élévation à une puissance paire de (à
moins que le temps soit de type complexe). Donc la ligne d'Univers est nécessairement à
l'extérieur du cône.

D3. : Nous disons alors que l'intervalle ou la ligne d'univers sont de "type temps".

1097/2001
Sciences.ch 14/03/2005

Revenons à nos équations après ce petit interlude... les équations conduisent donc à faire
plusieurs observations. Ainsi, dans l'Univers euclidien à quatre dimensions de Minkowski, les
trajectoires des objets dans l'espace-temps sont toujours des droites. Effectivement, l'exemple
trivial consiste à considéréer que l'objet reste au repos, seul le temps continue alors à
s'écouler. Nous avons dès lors:

en posant , cela nous nous donne:

donc :

et aussi :

La primitive étant (constante d'intégration nulle):

qui est bien une droite et reprèsente donc la ligne d'Univers de l'objet considéré dans le cône
d'Univers. Nous pouvons aussi observer aussi que dans ce cas, l'évolution du phénomène est
purement temporelle quand l'intervalle est postif (ce qui appuie ce que nous avions dit tout à
l'heure).

Remarque : si la vitesse de la lumière est infinie nous retrouvons le cas particulier de l'univers
newtonien, où un phénomène peut instantanément se produire en dehors de tout lien de
causalité (nous disons alors que l'effet à lieu avant la cause). Le temps y est absolu et il
n'existe pas d'horizon cosmologique.

RELATIVITÉ GÉNÉRALE

Le relativité restreinte est une réussite remarquable sur le point de vue théorique aussi bien
que sur lpoint de vue pratique. Cependant, celle-ci s'applique aux repères euclidiens
seulement et aux référentiels inertiels/galiléens (à vitesse constante pour rappel...)… Il
convient donc de généraliser l'ensemble de la mécanique d'abord en exprimant ses principes et
ses résultats fondamentaux sous une forme généralisée indépendante du type de systèmes de
coordonnées choisi (in extenso : du type d'espace) en faisant usage du calcul tensoriel et de
prendre en compte les systèmes non inertiels.

Il convien de prendre en compte aussi que le fait que la relativité restreinte ne s’applique
qu’aux référentiels galiléens est restrictif car toute masse crée un champ gravitationnel dont la
portée est infinie. Pour pouvoir trouver un vrai référentiel galiléen il est donc nécessaire de se
situer infiniment loin de toute masse. La mécanique relativiste bâtie à partir de la relativité
restreinte ne constitue donc qu’une approximation des lois de la nature, dans le cas où les

1098/2001
Sciences.ch 14/03/2005

champs gravitationnels ou les accélérations sont suffisamment faibles.

D'abord il faut s'avoir que si nous prenons en compte l'accélération dans les premiers
développements que nous avons fait pour la relativité restreinte, nous n'arrivons à aucune
simplification permettant d'obtenir des relations explicites des transformations relativistes
entre différents référentiels (essayez pour voir...). Il fallait donc trouver une autre approche
permet de se soustraire à ce problème. C'est ici qu'encore une fois 'intervient le génie d'Albert
Einstein .

Effectivement, Einstein croyait à une physique ne devant privilégier aucun référentiel puisque
telle était à ses yeux la réalité de l'Univers. Mais comment se soustraire alors au phénomène
d'accélération. L'idée géniale fut d'énoncer le postulat d'équivalence suivant (qui encore
aujourd'hui au début du 21ème siècle n'est toujours pas mis en défaut par les expériences
récentes) en plus du postulat d'invariance et du principe cosmologique que nous avons énoncé
au début :

POSTULAT D'ÉQUIVALENCE

Dans un premier temps, Albert Einstein (avec une idée derrière la tête que nous exposerons
plus loin) postule donc l'équivalence suivante :

Postulat : l'accélération d'une masse (hors champ gravitationnel) due à l'application d'une
force mécanique et l'accélération de cette même masse soumis à un champ gravitationnel sont
supposées parfaitement équivalentes. Ainsi, les résultats des analyses mathématiques dans un
cas, peut s'appliquer dans l'autre (déjà là c'est fort mais cohérent... l'idée est très très bonne
encore fallait-il l'avoir...!)

Corollaire : la masse au repos d'un corps doit alors être la même dans un champ gravitationnel
ou hors champ gravitationnel (nous parlons alors de masse inertielle et de masse pesante
comme nous l'avons vu au tout début de notre étude de la mécanique classique). Il faut bien
prendre en garde et vérifier que le corollaire du postulat d'équivalence est vrai sinon toute la
relativité générale s'écroulerait (en ce début de 21ème siècles des expériences sont toujours en
cours pour essayer de mettre à défaut cette équivalence) !

En quoi ce postulat permet-t-il de résoudre toutes les difficultés alors ? C'est simple ! L'idée
absolument géniale est la suivante :

Lorsque nous allons considérer un corps en accélération, nous allons d'abord toujours
assimiler celle-ci à l'accélération due à la chute dans un champ gravitationnel (de par
l'application du principe d'équivalence). Ensuite, nous allons supposer, et devrons le vérifier
en retrouvant la loi de Newton, que l'accélération due à ce champ gravitationnel n'est pas due
au champ lui même mais à la géométrie de l'espace déformée par la présence de la masse (in
extenso l'énergie) qui crée le champ gravitationnel. Ainsi, l'objet n'est plus en "chute libre"
mais sera vu comme 'glissant' sur la trame spatiale et acquérir ainsi son accélération.

Au fait, l'enjeu est double :

1. Si le calcul tensoriel permet d'exprimer les lois de la mécanique classique et relativiste


restreinte dans n'importe quel système de coordonnées, il est alors possible de voir comment
le système de coordonnées (la métrique) agit sur l'expression des lois de l'Univers (Albert
Einstein ne le savait pas tant qu'il n'avait pas terminé ces calculs mais le pressentait) !

1099/2001
Sciences.ch 14/03/2005

2. Si l'expression tensorielle naturelle des lois de la mécanique fait apparaître le glissement (in
extenso l'accélération) sur la trame spatiale suivant la métrique (locale) considérée, alors le
pari est gagné et alors l'accélération peut être vue comme un effet dont la cause est purement
géométrique.

Ainsi, l'extension de la relativité restreinte ne se fait plus en prenant en compte les systèmes
non inertiels mais la géométrie du système !! Nous pouvons (et arrivons!) ainsi à contourner
le problème initial et le pire... c'est que cela marche !!!!

Exemple de la fusée :

Supposons que deux fusées, que nous nommerons et , se trouvent dans une région de
l’espace éloignée de toute masse. Leurs moteurs sont arrêtés ce qui se traduit physiquement
par un mouvement rectiligne uniforme. Dans chaque fusée, des physiciens réalisent des
expériences de mécanique avec des objets dont ils connaissent la masse inerte. Soudain, le
moteur de la fusée démarre et lui communique une accélération dont l’effet ressenti à
l’intérieur du vaisseau spatial est une force d’inertie qui plaque les objets vers le plancher.
Pour les physiciens de la fusée les lois de la mécanique sont alors les mêmes que celles que
l’on observe dans un champ gravitationnel. Ils sont donc logiquement amenés à interpréter la
force d’inertie comme la manifestation d’un champ gravitationnel. A l’aide d’une balance, ils
peuvent alors peser leurs objets et leur attribuer une masse gravitationnelle.

Supposons que les physiciens de la fusée puissent observer ce qui se passe dans la fusée
. Ils savent que ce que leurs collègues interprètent comme le poids des objets n’est en fait
qu’une force d’inertie. La force d’inertie est proportionnelle à l’accélération et à la masse
inerte. Si la masse gravitationnelle était différente de la masse inerte les physiciens de la fusée
pourraient distinguer les effets des forces d’inertie de ceux d’un champ de gravitation car
les masses mesurées seraient distinctes. Or, nous savons que la masse inerte et la masse
gravitationnelle sont équivalentes (principe d’équivalence galiléen). Il s’ensuit que les
physiciens de la fusée n’ont aucun moyen de faire la différence entre des forces d’inertie
résultant d’un mouvement accéléré de leur vaisseau spatial et les forces d’attraction
gravitationnelles.

Il faut toutefois tempérer les conclusions de cette expérience : les vrais champs de gravitation
se distinguent d’un référentiel accéléré dans la mesure où l’accélération gravitationnelle varie
avec la distance qui sépare les corps alors que dans un référentiel accéléré, l’accélération est
identique en tout point de l’espace. Cependant, localement, un champ gravitationnel et un
référentiel accéléré ne peuvent être différenciés.

PRINCIPE DE MACH

Si le principe d’équivalence met en évidence l’égalité des masses inerte et gravitationnelle, il


ne nous éclaire pas sur la nature de ces deux masses. Finalement, que sont les masses inerte et
gravitationnelle ?

La nature profonde de la masse inerte devrait nous renseigner sur celle de l’inertie elle-même.
L’inertie se manifeste sous une forme passive - le principe d’inertie - et une forme active - la
seconde loi de Newton. D’une manière générale, elle exprime un comportement universel des

1100/2001
Sciences.ch 14/03/2005

corps à résister au changement du mouvement. Or nous savons que le mouvement inertiel est
relatif c'est-à-dire qu’il n’existe aucun référentiel absolu. En est-il de même du mouvement
accéléré ? Considérons, pour illustrer cette interrogation, une fusée dans laquelle se trouve un
physicien et réalisons deux expériences.

Première expérience. La fusée accélère : le physicien est soumis à une force d’inertie orientée
dans la direction opposée à celle de l’accélération.

Deuxième expérience. Maintenant supposons que l’on imprime à l’ensemble de l’Univers - à


l’exception de la fusée qui se déplace selon un mouvement inertiel - une accélération
exactement opposée à celle de la fusée lors de l’expérience précédente.

Si le mouvement accéléré est relatif alors, pour un observateur, il n’est pas possible de
distinguer les deux expériences. Notamment, le physicien situé à l’intérieur de la fusée doit
observer l’apparition d’une force d’inertie absolument identique à celle qu’il a notée lors de la
première expérience. La masse inerte trouverait alors son origine dans les interactions de la
masse gravitationnelle des corps avec l’ensemble des masses gravitationnelles de l’Univers !
Selon Ernst Mach, un physicien et philosophe du XIXe siècle, le mouvement quel qu’il soit,
inertiel ou accéléré, serait relatif.

Cette théorie fut baptisée par Einstein "principe de Mach". Jusqu’à ce jour, le principe de
Mach n’a pas été confirmé, mais pas davantage infirmé. Il est vrai que sa vérification
expérimentale dépasse de beaucoup les capacités humaines !

Tout se passe comme si en déplaçant toutes les masses de l’Univers, celles-ci entraînaient
avec elles les objets se trouvant dans la fusée, dont le physicien qui ressent alors une force qui
le tire dans le même sens que l’accélération appliquée aux étoiles.

GRAVITATION ET GÉOMÉTRIE

Einstein supposa donc que la gravitation n’était que la manifestation de déformations de


l’espace-temps. Pour tenter d’illustrer de façon simpliste mais très imagée l’idée d’Einstein,
considérons une roue dentée roulant à vitesse constante (disons une dent à la seconde) sur une
crémaillère. Imaginons que nous ayons le pouvoir de modifier simultanément le pas de la
crémaillère et celui de la roue quand et où nous le désirons. Faisons alors en sorte que le pas
de la crémaillère augmente légèrement d’une dent à l’autre. Pour des observateurs fixes la
roue est alors animée d’un mouvement uniformément accéléré car, en effet, à chaque tour
celle-ci parcourt une distance toujours plus grande. En revanche, si l’on choisit la crémaillère
comme référentiel et le pas de celle-ci comme étalon de mesure, le mouvement de la roue est
alors uniforme (une dent par seconde). L’accélération de la roue est la conséquence de
l’augmentation du pas de la crémaillère.

Poursuivons l’analogie : le pas de la crémaillère joue le rôle d’étalon de mesure local dans
notre espace à une dimension que constitue la crémaillère. En géométrie, il porte le nom de
"métrique". La métrique est ce qui permet de déterminer la distance entre deux points, elle
représente en quelque sorte l’étalon infinitésimal d’un espace. En géométrie euclidienne la
métrique est une constante ce qui nous permet de créer des étalons de mesure universels.
Bernhard Riemann, inventa une géométrie où la métrique peut varier d’un point à un autre de
l’espace, ce qui lui permit de décrire des espaces courbes comme la surface d’une sphère par
exemple.

En algèbre et géométrie (calcul tensoriel + géométrie différentielle), nous avons vu que la

1101/2001
Sciences.ch 14/03/2005

mesure de la distance entre deux points positionnés dans un espace à deux dimensions
peut s'effectuer au moyen d'un grand nombre de système de coordonnées par lesquels:

- Les coordonnées rectangulaires (dans ):

Si la distance au carré satisfait à cette relation alors nous sommes dans un espace plat.

- Les coordonnées polaires (dans ):

d'où:

d'où:

Si la distance au carré satisfait à cette relation alors nous sommes dans un espace plat.

- Les coordonnées cylindriques pour lesquelles nous avons :

à remplacer dans nous obtenons de façon quasiment identique à


précédemment:

Si la distance au carré satisfait à cette relation alors nous sommes dans un espace plat.

- Les coordonnées sphériques (dans ) pour lesquelles nous avons :

1102/2001
Sciences.ch 14/03/2005

à remplacer dans nous obtenons :

Petit rappel préalable:

Donc:

Après un première série de mise en commun et de simplifications élémentaires des termes


identiques, nous obtenons:

Si la distance au carré satisfait à cette relation alors nous sommes dans un espace courbe (de
type sphérique).

Jusque là, vous vous demandez peut-être où nous voulons en venir. Au fait, nous cherchons à
définir à partir des ces relations, un être mathématique qui en concordance avec l'hypothèse
d'Einstein, exprime les propriétés géométriques d'espaces donnés.

Comment allons nous faire? Nous allons d'abord changer d'écriture tout simplement. Au lieu
d'utiliser les symboles nous allons écrire . Attention! Les chiffres en
suffixes ne sont pas des puissances. Ce sont des valeurs muettes qui sont là uniquement pour
symboliser la -ième coordonnée d'un repère donné.

Ecrivons maintenant à nouveau nos équations avec cette nouvelle notation :

Coordonnées rectangulaires:

1103/2001
Sciences.ch 14/03/2005

Coordonnées polaires:

Coordonnées cylindriques:

Coordonnées sphériques:

Maintenant définissons un être mathématique que nous appellerons le "tenseur


métrique" (nommé ainsi car il 'étalonne' l'espace-temps) et notons le et relativement aux
propriétés du calcul tensoriel (voir chapitre de calcul tensoriel) écrivons :

Cet être mathématique qui est un tenseur contient donc les paramètres de la courbure (vous
pouvez également dire de contraintes ou tensions) dans lequel un espace se trouve. Mais alors
que contient le tenseur métrique d'espace-temps pour un espace euclidien plat?:

selon la convention d'écriture de sommation d'Einstein (voir section la section du calcul


tensoriel) par exemple, pour nous avons:

Donc si nous revenons à notre tenseur pour l'espace euclidien plat nous savons déjà
et nous avons dans notre tenseur pour et pour
(tenseur symétrique). Donc:

Ce résultat est remarquable car le tenseur métrique va nous permettre donc de définir les
propriétés d'un espace à partir d'un simple être mathématique facilement manipulable
formellement.

1104/2001
Sciences.ch 14/03/2005

En coordonnées polaires le tenseur s'écrit:

Vérification:

En coordonnées cylindriques le tenseur s'écrit:

La vérification ne se fait même plus tellement le résultant est évident.

En coordonnées sphériques le tenseur est un peu plus complexe et s'écrit:

La vérification ne se fait même plus tellement le résultant est évident.

En relativité restreinte, nous avons vu que la notion d'espace de temps étaient implicitement
liées. Ainsi, pour étudier la physique (cela intéresse peu le mathématicien), nous avons besoin
d'ajouter à notre tenseur métrique la composante du temps pour obtenir ce que nous appelons
le "tenseur métrique d'espace-temps". Pour déterminer l'écriture de ce tenseur, nous allons
nous placer dans un premier temps nous placer dans un espace de Minkowski où nous avions
rappellons-le :

Ainsi, en posant:

Nous avons:

1105/2001
Sciences.ch 14/03/2005

LAGRANGIEN LIBRE GÉNÉRALISÉ

Dans un espace sans champ de potentiel, nous avons vu en mécanique analytique que le
lagrangien se réduit à la simple expression de l'énergie cinétique tel que:

si nous souhaitons généraliser cette relation pour qu'elle soit valable dans n'import que type
d'espace (courbe ou plat), il nous faut introduire les coordonnées curvilignes telles que nous
les avons étudiées en calcul tensoriel (voir le chapitre du même nom dans le section d'algèbre
du site).

Dans un premier temps, cela donne:

où rappelons-le est l'abscisse curviligne de la trajectoire.

Mais nous avons démontré en calcul tensoriel que:

ce qui donne pour le lagrangien (avec ):

Ce qui nous permet d'écrire (attention il faut bien se rappeler des différentes relations que
nous avions déterminées lors de notre étude de formalisme lagrangien dans le chapitre traitant
des principes de mécanique analytique):

par conséquent l'expression de l'Hamiltonien devient bien évidemment:

1106/2001
Sciences.ch 14/03/2005

puisque nous considérons être dans un espace sans champ de potentiel. Le carré de la vitesse
étant dès lors constant sur toute la trajectoire, nous avons:

Etablissons maintenant les équations du mouvement de tout corps. Nous avons:

et

et donc:

puisque:

et comme:

en mettant en commun :

que nous pouvons écrire identiquement pour les en procédant de façon identique à ci-
dessus.

La relation précédente donne donc la trajectoire d'un corps en mouvement, dans un espace
sans champ de potentiel, en fonction de ses coordonnées curvilignes et de la métrique de
l'espace considéré.

Remarque : ce qui est particulièrement intéressant dans ce résultat, c'est que la masse
s'élimine identiquement.

Conclusion: aux mêmes conditions initiales de position et de vitesse curvilignes dans un


espace (plat ou courbe) sans champ de potentiel, correspond la même trajectoire quelle que
soit la masse de la particule (même pour les photons – la lumière – dont la masse est
nulle !!).

Nous pouvons maintenant étudier le principe de moindre action dans le but de rechercher le

1107/2001
Sciences.ch 14/03/2005

plus court chemin (aussi bien au niveau spatial que temporel) entre deux points dans un
espace de géométrie donnée avant de s'attaquer au cas beaucoup plus complexe du lagrangien
qui prend en compte le tenseur des champs...

ÉQUATIONS DES GÉODÉSIQUES

En partant de:

avec une paramétrisation telle que et sont fonction d'une paramètre temporel ou spatial.

Pour une surface donnée paramétriquement, nous cherchons donc à minimiser la longueur
d'un arc en appliquant le principe variationnel (non dépendant du temps car les photons
ne peuvent avoir un chemin plus rapide (au sens temporel du terme entre deux points mais
uniquement un chemin plus court (au sens métrique du terme)):

Or:

En développant, et comme les indices ont le même domaine de variation:

d'où:

En travaillant sur la seconde intégrale, nous posons:

et

Donc par l'intégration par partie (voir chapitre traitant du calcul différentiel et intégral):

1108/2001
Sciences.ch 14/03/2005

il vient:

Soit finalement:

Le terme non intégré ci-dessous est négligeable à cause de la présence du facteur :

Donc nous avons:

Nous effectuons un changement d'indice:

ce qui nous permet de factoriser :

Comme et sont différents de zéro, c'est l'intégrant qui doit être nul:

1109/2001
Sciences.ch 14/03/2005

En développant le second terme:

Qui s'écrit encore:

et qui se simplifie en:

Nous obtenons le système d'équations qui définissent les géodésiques, c'est-à-dire les droites
de . Ces dernières constituent donc les extrémales de l'intégrale qui mesure la longueur d'un
arc de courbe joignant deux points donnés dans .

Cette dernière équation, est celle qui nous intéresse dans le cas du lagrangien libre.
Effectivement, si nous prenons le cas extrême de la lumière (ou des photons si vous préférez),
cette dernière ne va pas chercher le chemin le plus rapide (le plus vite) au niveau temporel. Ce
serait totalement en contradiction avec le postulat d'invariance de voir la lumière accélérer en
fonction du chemin!!! Dans ce contexte, cela signifie que sur la trame spatio-temporelle, la
seule chose qui à un sens est le plus court chemin spatial et non le plus court chemin
temporel! C'est la raison pour laquelle cette dernière équation est appelée "équation des
géodésiques" ou encore "équation d'Euler-Lagrange généralisée".

Cependant, nous pouvons écrire cette dernière équation de façon plus condensée en
introduisant les symboles de Christoffel si la métrique est un tenseur symétrique tel que
. Effectivement:

et comme:

Alors l'équation d'Euler-Lagrange s'écrit:

La multiplication contracté de la relation précédente par nous donne, avec

1110/2001
Sciences.ch 14/03/2005

(nous considérons toujours le cas particulier mais intéressant d'un tenseur


métrique symétrique) et , alors :

Cette relation est de la plus haute importance car elle va nous permettre de déterminer (plus
loin) comment un corps en mouvement va naturellement se déplacer dans un espace courbe et
peut-être... ceci indépendamment de la masse. De plus, cette expression va aussi nous
permettre de savoir comment dans un chemin parcouru (géodésique) la métrique varie d'un
point infiniment voisin à un autre. En gros nous nous rapprochons du gâteau et percevons que
gentillement la voie semble être la bonne...

1111/2001
Sciences.ch 14/03/2005

ÉLECTROSTATIQUE

Jusqu'ici nous nous sommes concentrés sur l'interaction gravitationnelle et la grandeur


caractéristique de la matière, appelée "masse", qui lui est associée. Nous avons évoqué
l'interaction électromagnétique, en analysant des phénomènes macroscopiques, comme le
frottement, la cohésion, l'élasticité, les forces de contact, etc. Maintenant nous nous penchons
sur les forces électroniques et la caractéristique de la matière, appelée "charge", qui leur est
associée. L'interaction électromagnétique lie la matière, sous toutes ses formes observables.
C'est elle qui fait tenir les électrons au noyau dans l'atome, qui fait tenir ensemble les atomes
dans les molécules, les molécules dans les objets et même votre nez à votre visage (eh oui...
nous ne tenons pas à grand chose.. lol).

La "charge" produit la "force électrique" ou "force de Coulomb" et nous commençons


seulement à comprendre cette force. La charge est une notion fondamentale, qui ne peut pas
être décrite en termes de concepts plus simples et plus fondamentaux. Nous la connaissons par
ses effets et malheureusement pas par ce qu'elle est (c'est idem pour la masse rappelons-le
aussi).

L'expérience a montré aussi que bien que la charge ait comme la masse une propriété additive,
elle comporte cependant aussi des valeurs négatives (et non exclusivement positive comme
l'est à priori la masse). Ainsi, dans le langage actuel et comme l'expérience le confirme, deux
charges identiques se repoussent et deux charges différentes s'attirent.

Voyons maintenant la force qui est associée à la charge :

FORCE ÉLECTRIQUE

Il a expérimentalement été établi par Coulomb (et démontré théoriquement bien plus tard par
Yukawa - voir chapitre de mécanique quantique des champs) qu'une particule témoin subit
une force d'une intensité proportionnelle à sa charge , lorsqu'elle est placée au voisinage
d'une ou plusieurs charges électriques , dans un milieu de permittivité (permittivité au
champ électrique bien sûr...) donnée par (sous forme vectorielle et non relativiste) :

où est le vecteur position d’une charge témoin.

Dans le cas d'un système à deux particules séparées d'une distance , nous avons la même
relation simplifiée et nous retrouvons la forme plus commune de la force électrique telle
qu'elle est donnée dans la plupart des ouvrages (sous forme scalaire et non relativiste) :

1112/2001
Sciences.ch 14/03/2005

Remarques :

R1. Fréquemment, cette dernière relation est définie sous le nom de "loi de Coulomb" dans la
plupart des écoles car supposée non démontrable. Au fait, il n'en est rien ! Cette relation peut
se démontrer comme nous le verrons lors de l'étude de la physique quantique des champs
(voir section de physique atomique) en utilisant l'équation de Klein-Gordon dans le contexte
d'une champ de potentiel à symétrie sphérique.

R2. Pour la forme relativiste de la loi de Coulomb, le lecteur se reportera au chapitre traitant
de la mécanique relativiste où il est démontré que (forme vectorielle) :

La permittivité dans le vide est elle donnée expérimentalement par :

et relativement au milieux considéré, nous définissons une permittivité relative qui permet
plus facilement de déterminer les propriétés d'un matériau par rapport au champ électrique tel
que :

Nous définissons également le rapport :

appelé "constante diélectrique".

Le facteur entre parenthèses ne dépend que de la distribution des charges dans l'espace et
de la permittivité du milieu considéré. Puisque sa valeur varie d'un endroit à l'autre et
dépend du vecteur position de la charge témoin, il forme un ensemble de vecteurs, dont la
propriété est celle d'une multitude de lignes de champs électriques d'où l'utilisation du terme
"champ électrique".

Chacun des éléments de cet ensemble porte le nom de "champ électrique" , au point ,
dans la distribution de charges :

La force Coulombienne, agissant sur la charge témoin , s'écrit alors de façon


conventionnelle:

1113/2001
Sciences.ch 14/03/2005

POTENTIEL ÉLECTRIQUE

Soient deux point et dans une région de l’espace où il existe un champ électrique
et soit un chemin reliant ces deux points, alors dans le cas particulier où la source
d'un champ est une sphère ou un corps ponctuel et que nous posons une charge à son
voisinage nous avons pour le travail effectué par la force pour déplacer la charge du point
au point :

Nous définissons ainsi la "différence de potentiel" ou simplement le "potentiel" donné par :

et donc :

Remarque : le potentiel est souvent appelé "tension" par les électriciens, électrotechniciens ou
autres ingénieurs. Parfois par abus de la langue anglophone le terme "voltage" est ensuite
utilisé par référence à l'unité de mesure du potentiel qui est le "Volt" noté .

Démontrons maintenant dans le cadre le plus général qui soit que le champ vectoriel
stationnaire "dérive" d'un champ de potentiel :

Soit une charge repérée par rapport à un référentiel par le vecteur . Alors en chaque
point de l’espace il existe un champ tel que:

développons cette expression:

1114/2001
Sciences.ch 14/03/2005

Si est un champ de potentiel stationnaire alors, il doit exister un potentiel de ce


champ qui satisfasse :

; ;

Regardons si le potentiel existe pour un champ de Coulomb.

Nous devons alors avoir pour le champ en :

d’où:

et si nous effectuons le même développement pour chaque composante, nous obtenons


également le même résultat. Donc le potentiel est un champ scalaire et non vectoriel comme
l'est le champ électrique !

est appelé dans le cas d'un champ de Coulomb "le potentiel de " ou "potentiel
coulombien" et est noté . Comme nous pouvons le constater par l’expression de
, est une constante arbitraire, qui impose dans le cas d'absence de charges que:

Ce qui nous donne finalement:

Ce qui donne pour toutes les composantes :

que nous notons plus brièvement:

1115/2001
Sciences.ch 14/03/2005

Remarque : les mêmes développements et résultats (et ceux qui vont suivre) sont applicables en ce qui concerne
le champ de potentiel gravitationnel. Cependant il est rare qu'il soient effectués dans la littérature ou les écoles
car l'être humain ne contrôle pas le champ gravitationel avec une facilité et une intensité équivalente à celle du
champ électrique.

INDÉPENDANCE DU CHEMIN

Démontrons maintenant que la différence de potentiel entre deux points et ne dépend


pas du chemin parcouru tel que nous l'avons fait pou le champ de potentiel gravitationnel
dans le chapitre de mécanique.

Soit un chemin reliant deux points et et un champ et faisons en sorte d'exprimer le


champ en et par rapport à une seule variable t (qui n'a rien avoir avec le temps...) qui
rendrait compte de sa variation lors d'un déplacement quelconque entre ces deux points:

Cette dernière expression montre bien que est indépendant du chemin quelle que soit la
manière dont nous paramétrisons celui-ci.

Le champ de Coulomb est donc un "champ conservatif". En effet, si nous considéron un


chemin fermé et soit et deux points confondus du chemin alors la différence de
potentiel est sera nul.

ÉQUIPOTENTIELLES ET LIGNES DE CHAMP

Nous pouvons maintenant à partir de ce que nous avons établit, définir les "équipotentielles"
et les "lignes de champ".

Soit un champ de Coulomb défini par rapport à un référentiel. Alors à chaque point
de l’espace, nous pouvons associer un vecteur champ électrique ainsi qu’un
potentiel électrique .

Défintion : nous définissons les "lignes de champ" comme étant une famille de courbes pour
lesquelles le vecteur est tangent et constant en chaque point et les "équipotentielles"
comme étant des lignes pour lesquelles le potentiel est aussi constant.

Dans ce cas, et c'est ce que nous allons démontrer, toutes les lignes de champ sont
perpendiculaires à toutes les équipotentielles.

1116/2001
Sciences.ch 14/03/2005

Démonstration:

Utilisons la propriété suivant de conservation du champ de coulomb pourla démonstration :

Comme nous sommes en présence d'un champ électrique, celui-ci dérive donc d'un potentiel
comme nous le savons. Ceci implique que si le champ n'est pas nul le potentiel ne l'est
également pas. Donc, dans l'intégrale curviligne:

un des termes est nul ! Ce n'est pas le champ électrique puisqu'on est présence d'un, ce qui
discrédite le potentiel et comme la charge se déplace n'est pas nul non plus. Écrivons
alors l'intégrale curviligne d'une autre manière:

d'où:

nous pouvons donc conclure que les équipotentielles sont bien perpendiculaires aux lignes de
champ électrique et inversement. C'est ce qu'il fallait démontrer.

Voici exemples de lignes de niveaux comprenant lignes de champs et lignes de potentielles


obtenu à l'aide de Maple (nous montrerons lors de notre étude des équations différentielles
comment obtenir les fonctions mathématiques des lignes de champs) :

1117/2001
Sciences.ch 14/03/2005

A gauche : un seule charge - A droite : deux charges de signes opposés

A gauche : deux charges de signes égaux - A droite : quatre charges de signes opposés

Remarque : mis à part avec les charges opposées, nous rappelons que les mêmes résultats sont
appliquables pour les masses avec le champ gravitationnel.

Deux applications de ces résultats sont très importants (pour lesquels nous nous limiterons à
l'études des propriétés les plus importantes) :

1. La détermination des lignes de champs et équipotentielles pour un fil rectiligne infini tel
que nous pouvons en approximation en considérer dans les circuits électriques ou les lignes
hautes tensions aériennes (afin de déterminer l'influences des champs des fils avec leur
environnement - cette étude fait partie du domaine de l'électrodynamique de l'ingénieur que
nous appelons la CEM pour "Compatibilité Électromagnétique"). Les résultats pourrant aussi
être utilisés pour déterminer la "tension de pas" pour certains systèmes rectilignes qui
détermine pour une distance donnée, le potentiel par mètre pour lequel un mammifère peut
être tué par électrochoc proche d'un tel fil. Une extensions (sur laquelle je ne souhait pas trop
m'attarder bien que le sujet soit passionnant mais très chaud) est aussi l'influence d'un tel type
de potentiel sur le fonctionnement du cerveau humain dans le cas de l'usage des téléphones
portables (atennes émittrices d'un potentiel) ou d'habitations proche de lignes hautes
tensions....

Remarque : nous déterminerons dans le chapitre traitant du champ magnétique de la loi de


Biot et Savart qui donne le champ magnétique pour un tel fil parcouru par une intensité de
courant donnée.

2. La détermination des lignes de champs et équipotentielles du dipôle électrique qui a une


énorme importance en chimie comme nous le verrons lors des développements. Nous verrons
également quelle est la dynamique de celui-ci lorsqu'il est plongé dans un champ électrique
uniforme l'énergie d'interaction entre dipôles (comme c'est souvent le cas en chimie).

FIL RECTILIGNE INFINI

Soit un vecteur unitaire de , nous avons :

1118/2001
Sciences.ch 14/03/2005

en faisant usage du concept de densité linéique de charges tel que nous l'avons défini dans le
chapitre traitant des principes de la physique dans la section de mécanique, nous avons :

Considérons une ligne infinie de section négligeable, et portant une charge linéique continue
. Le but est donc de calcul le champ électrique et le potentiel en tout point de l'espace
extérieur à cette ligne afin de connaître les influences des charges de cette ligne sur son
environnement en ne considérant que l'influence du champ électrique (si les charges étaient en
mouvement il faudrait également prendre en compte l'influence du champ magnétique ce que
nous ferons dans le chapitre consacré à ce champ).

Pour cela, la méthode consiste à découper la ligne en de petits éléments de ligne , chacun
de ces éléments portant une charge . Le champ créé par la charge en au point à
distance et de projection orthogonale sur la ligne est :

L'astuce consiste maintenant à prendre le symétrique de par rapport à (la projection


orthogonale de sur le fil) pour lequel nous avons identiquement :

Le champ total est donc :

Or, nous avons :

Donc :

Comme nous pouvons nous en douter, cette dernière relation montre bien que le champ est
orthogonal à la ligne (au fil…).

1119/2001
Sciences.ch 14/03/2005

La norme de est :

Cette relation comporte 3 variables dépendantes . La norme du champ total en un point


est donc la somme des normes sur l'ensemble de la longueur du fil puisque tous les vecteurs
ont même direction.

Pour effectuer ce calcul, nous allons effectuer un changement de variable, et mettre en


fonction de l'angle entre la ligne et le vecteur . Dans le triangle rectangle :

si nous prenons l'origine des en . Nous avons aussi :

et :

d'où :

L'intégration est facile, mais il faut faire attention aux bornes. Nous devons intégrer sur une
moitié de ligne, donc entre et :

et donc :

Le potentiel se déduit aisément en prenant la primitive de :

1120/2001
Sciences.ch 14/03/2005

La constante est indéterminée puisque lorsque tend vers l'infini, tendant vers zéro
conduit à une constant infinie. Cette indétermination est due essentiellement à l'approximation
de la ligne infinie.

DIPÔLE ÉLECTRIQUE RIGIDE

Une disposition très intéressant de charges est celle constituant un dipôle électrique. Elle
consiste en deux charges égales et opposées séparées par une très petite distance.
Nous allons chercher à déterminer le potentiel et le champ électrique en un point de
l'environnement du dipôle.

Pour déterminer cela, considérons une charge quelconque en un point et un point


très éloigné de . Prenons un repère quelconque centré en :

Le potentiel créé au point par la charge s'écrit :

Dans le triangle , la distance peut être écrite selon le théorème du cosinus :

Le potentiel devient :

ou encore :

1121/2001
Sciences.ch 14/03/2005

A très grande distance, devient très supérieur à , la quantité :

tend vers zéro. Nous pouvons donc effectuer un développement de MacLaurin de


au voisinage de (voir chapitre traitant des suites et séries dans la section d'algèbre).
Pour ne pas alourdir le calcul, nous nous limiterons à l'ordre deux en :

donc :

En ne gardant que les termes du second ordre en :

Le potentiel devient :

Nous avons gardé dans l'expression du potentiel trois termes. Le terme est le potentiel
créé par une charge qui se trouverait en . Autrement dit, à l'ordre zéro, le potentiel crée par
une charge située en un point proche de est identique au potentiel créé par une charge qui
se trouverait en . Les termes sont des termes correctifs, à l'ordre un et à l'ordre deux
respectivement. Nous remarquons que ces deux termes varient en , donc décroissant
plus vite que le premier. Ces deux termes sont donc plus efficaces à plus petite distance.

Nous voyons que les termes font intervenir la quantité . Cette quantité est ce que
nous définissons comme étant le "moment dipolaire" :

1122/2001
Sciences.ch 14/03/2005

Le potentiel créé à grande distance par une distribution discrète de charges s'obtient en
sommant toutes les contributions individuelles :

Ce qui peut aussi s'écrire :

Par définition, est le terme unipolaire ou monopolaire, le terme dipolaire,


quadrupolaire. Si la distribution de charge est au total nulle, comme c'est le cas d'un
atome ou d'une moélcule non ionisée, seuls subsistent les contributions multipolaires.

Revenons au dipôle. Le terme monopolaire est nul, puisque la somme des charges est nulle. Si
nous négligeons les termes d'ordre supérieurs à deux, il reste la contribution dipolaire. Les
angles et sont complémentaires, donc . Mais, comme , le
produit est constant. Le potentiel s'écrit alors :

ou encore :

où .

Rappelons que nous avons démontré :

et comme nous l'avons vu en analyse vectorielle, le gradient en coordonnées sphérique nous


amène à écrire :

1123/2001
Sciences.ch 14/03/2005

d'où :

Pour déterminer l'équation des équipotentielles, rappelons que ces lignes (ou "surfaces" dans
l'espace) s'obtiennent par la contrainte :

d'où :

avec .

Le champ électrique doit être par définition tangent aux lignes de champ, donc parallèle au
déplacement élémentaire.

Puisque , nous avons :

Donc finalement il ne reste plus que :

Qui est donc une équation différentielle qui s'intègre facilement :

Ce qui équivaut à écrire :

La tracé des lignes de champs et des équipotentielles donnent alors en coordonnées sphériques
(ne pas oublier que la composant verticale est nulle par symétrie) :

1124/2001
Sciences.ch 14/03/2005

Bien que dans un dipôle électrique les deux charges soient égales et opposées, donnant une
charge résultante nulle, le fait qu'elles soient légèrement déplacées est suffisant pour produire
un champ électrique non identiquement nul. Dans les atomes, le centre de masse des électrons
coïncide avec le noyau, et par conséquent le moment électrique dipolaire moyen de l'atome
est nul. Mais si un champ extérieur est appliqué, le mouvement des électrons est distordu et le
centre de masse des électrons est déplacé d'une distance par rapport au noyau. L'atome est
alors polarisé et devient un dipôle électrique de moment . Ce moment étant proportionnel
au champ extérieur .

Remarque : les molécules par ailleurs peuvent avoir un moment électrique permanent. De
telles molécules sont dites "polaires". Par exemple, dans la molécule l'électron de
l'atome d'hydrogène passe plus de temps à se déplacer autour de l'atome de chlore qu'autour
de l'atome d'hydrogène. Aussi, le centre des charges négatives ne coïncide-t-il pas avec le
centre des charges positives et la molécule possède un moment dipolaire. Par contre, dans la
molécule , tous les atomes sont alignés, et le moment électrique dipolaire résultant est nul
par raison de symétrie.

Quand un dipôle électrique est placé dans un champ électrique, une force s'exerce sur chacune
des charges du dipôle. La force résultante est :

Considérons le cas particulier où le champ électrique est dirigé le long de l'axe des et où le
dipôle est orient parallèlement à ce champ. Si nous considérons seulement les grandeurs :

avec étant la distance entre les deux charges, et par conséquent :

1125/2001
Sciences.ch 14/03/2005

Ce résultat montre qu'un dipôle électrique orienté parallèlement au champ tend à se déplacer
dans la direction dans laquelle le champ s'accroît (selon le gradient de celui-ci). Nous
remarquons que si un le champ électrique est uniforme, la force résultant sur le dipôle est
nulle.

L'énergie potentielle du dipôle est :

Si nous utilisons la relation :

pour décrire le champ électrique uniforme et si est l'angle entre le dipôle et le champ
électrique, le dernier facteur est juste la composante du champ
parallèle à . Donc :

ou

L'énergie potentielle est minimale pour , ce qui montre que le dipôle est en équilibre
quand il est orienté parallèlement au champ.

Ces applications d'un dipôle placé dans un champ électrique ont des application très
importantes. Par exemple, le champ électrique d'un ion en solution polarise les molécules du
solvant qui entoure les ions et elles s'orientent comme sur la figure ci-dessous :

Dans un solvant à molécules polaires tel que l'eau, les ions d'un électrolyte en solution
s'entourent d'un certain nombre de ces molécules en raison de l'interaction charge-dipôle. Ce
phénomène est appelé la "solvation" de l'ion, précisément "hydratation" si le solvant est de
l'eau.

Ces molécules orientées deviennent plus ou moins solidaires de l'ion, augmentant sa masse
effective et diminuant sa charge effective, qui est partiellement masquée par les molécules.
L'effet net est que la mobilité de l'ion dans un champ extérieur est réduite. De même,
lorsqu'un gaz ou un liquide, dont les molécules sont des dipôles permanents est placé dans un
champ électrique, les molécules à la suite des couples dus au champ électrique, tendent à

1126/2001
Sciences.ch 14/03/2005

s'aligner avec leurs dipôles parallèles. Nous disons alors que la substance a été "polarisée".

Il peut donc être intéressant de déterminer le champ électrique vectoriel produit par un dipôle
plutôt que le potentiel. Le champ électrostatique crée en un point par le doublet s'obtient
en effectuant la somme vectorielle des champs créés en ce point des charges positive et
négative , d'où :

La distribution des charges étant invariantes par rotation autour de l'axe du doublet, la
topographie est indépendante de l'angle azimutal des coordonnées sphériques. Nous
pouvons la représenter dans un plan méridien quelconque passant par l'axe . Le champ
est donc donné par :

Ayant :

vectoriellement, nous avons :

Le produit scalaire étant la multiplication des composantes une à une, nous avons :

d'où :

Finalement :

1127/2001
Sciences.ch 14/03/2005

Donc par un développement limité en série de MacLaurin comme nous l'avons fait au début :

soit en introduisant :

Il peut être pertinent aussi de calculer l'énergie d'interaction entre deux dipôles électriques. Si
nous appelons le moment dipolaire, nous pouvons écrire :

Si nous désignons par le moment du second dipôle et si nous utilisons la relation :

nous trouvons que l'énergie d'interaction entre les deux dipôles est :

Nous pouvons tirer plusieurs conclusions importantes de ce résultat. L'énergie d'interaction


est symétrique par rapport aux deux dipôles, car la permutation de et la laisse
inchangée. C'est un résultat prévu. L'interaction entre deux dipôles n'est pas centrale car elle
dépend des angles que le vecteur de position ou le vecteur unitaire fait avec et .

Un atome, une molécule ou un ion, dont le moment dipolaire est nul à l'état fondamental,
acquièrent un moment dipolaire sous l'action du champ électrique appliqué comme nous
l'avons vu puisque les charges de signes opposées sont sollicitées dans des sens opposés. Les
barycentres des charges positives et négatives ne coïncidant plus, il apparaît un "moment
dipolaire induit". Dans une approximation expérimentale linéaire valable pour des champs
excitateurs faibles, ce moment dipolaire induit est proportionnel au champ appliqué , ce que

1128/2001
Sciences.ch 14/03/2005

nous traduisons par (il s'agit au fait d'une approximation de la relation de Langevin-Debye que
nous démontrerons plus tard) :

La quantité , dont la dimension physique est celle d'un volume, est la "polarisabilité" de
l'édifice. L'interaction électrostatique dipôle-dipôle a été introduite par J.D. Van der Waal en
1873, dans le cas des molécules, afin d'interpréter les écarts réels par rapport au gaz parfaits.

Les forces de Van der Waals sont répulsives lorsque la distance entre les molécules est très
faibles car elles s'opposent à l'interpénétration des nuages électroniques, ce que nous
exprimons en introduisant leur volume (covolume).

En revanche, elles sont attractives lorsque cette distance est suffisante. Nous attribuons cette
attraction à trois types d'interaction mettant en cause des dipôles rigides ou induits :

1. Les forces entre molécules polaires (dipôles rigides), dites de W. Keesm

2. Les forces entre une molécule polaire (dipôle rigide), et une molécule polarisable (dipôle
induit) dites de Debye.

3. Les forces moyennes entre les dipôles induits instantanés qui apparaissent même lorsque
les molécules ne sont pas polaires, dites de F. London.

Dans ces trois cas, l'énergie électrostatique est négative (attraction) et varie comme . Pour
le montrer, calculons l'énergie d'interaction entre deux dipôles rigides, de moments dipolaires
et :

avec et

Par conséquent :

d'où :

Ainsi, la dépendance radiale de la force est en . Cette décroissance très rapide de la force
de Van der Waals avec la distance permet d'expliquer sa très courte portée et par conséquent
sont influence lorsque le milieu est suffisamment dense.

Remarque : l'interaction entre molécules polaires, de type Keesom, est rendue très importante
par la présence l'atome d'hydrogène, car ce dernier, en raison de sa petite taille, interagit aussi
avec les atomes des autres molécules. C'est elle qui est là l'origine de la "liaison hydrogène".

1129/2001
Sciences.ch 14/03/2005

FLUX DU CHAMP ÉLECTRIQUE

Soit un champ vectoriel et une surface (dite "surface de Gauss") dans l'espace. Si nous
divisons cette surface en un nombre de petites surfaces chacune traversée par un
champ et ayant un vecteur unitaire perpendiculaire (cas particulier) à leur surface, nous
pouvons alors former la somme:

Lorsque tends vers l'infini et tous les vers zéro, nous obtenons pour cette somme:

La valeur de cette intégrale est appelée "flux d’un champ à travers une surface
" délimitée par un domaine et où .

Dans le cas du champ électrostatique, nous écrivons :

Cette expression définit le "flux électrique". La question inévitable qui se pose alors est :
quelle est sa signification physique ?. Le flux d'un fluide est la quantité de fluide (notamment
le volume) qui traverse une surface par seconde; il y alors écoulement de quelque chose.
Quant au flux électrique, du point de vue classique, rien ne s'écoule, le champ électrique est
déjà établi et il est statique, mais il "traverse la surface". La valeur du champ électrique en
tout point de l'espace est l'intensité du champ en ce point, tandis que le flux peut être
considéré comme la quantité de champ qui traverse la surface . Il y a une centaine d'années,
les physiciens identifiaient le flux avec le nombre des lignes de champ traversant la surface.
Mais le moins que nous puissions dire est que la vision simpliste que les lignes de champ ont
une une réalité distincte et que nous pouvons les compter est trompeuse. Nous verrons en
mécanique quantique des champs que celle-ci soutient qu'un courant de photons virtuels est la
nature même des interactions électromagnétiques. Malgré cela, les phyisciens ne se sont pas
pressés d'associer le flux des photons virtuels du 20ème siècle à l'image des ligens de champs
continus du 19ème siècle. Quelle que soit sa nature, la notion de lfux est puissante et de
grande utilité pratique, aussi bien en électricité qu'en magnétisme.

Comme nous le démontrons dans le cadre des équations de Maxwell (voir chapitre du même
nom), la résolution de cette intégrale est (c'est la "loi de Gauss" ou également dit "théorème
de Gauss") :

CAPACITÉS

1130/2001
Sciences.ch 14/03/2005

Comme application directe du théorème de Gauss, très utile en électronique et pour les
ingénieurs, considérons une grande feuille mince et plane, portant une charge surfacique
homogène et baignant dans un milieu de permittivité . Dans la région proche de son
centre, le champ résultant de tous les champs des charges est normal, uniforme, constant et
s'éloigne de la feuille. Considérons une surface de Gauss en forme d'un cylindre limité par les
bases et sa surface tubulaire et symétrique par rapport la feuille. Elle enferme
donc une charge . Il en résulte que :

et comme et , nous trouvons :

Finalement, le champ électrique d'un grande feuille chargée plane et mince est :

Si nous mettons face à face deux plaques identiques mais avec des charges opposées, la
somme algébrique donnera bien évidemment :

A l'exception des extrémités, où l'effet de bord est important, le champ global est partout la
somme vectorielle des champs uniformes produits par les deux couches minces opposées.
Nous appelons un tel système un "condensateur plan et parallèle".

Le résultat est aussi remarquable car il est indépendant de la distance entre les plans. Le
calcul du potentiel électrique y est donc simplifié. Soit :

Ainsi, la capacité du condensateur plan et parallèle vaut donc :

LA RIGIDITÉ DIÉLECTRIQUE

La "rigidité diélectrique " d’un milieu isolant représente la valeur maximum du champ en
que le milieu peut supporter avant le déclenchement d’un arc électrique (donc d’un

1131/2001
Sciences.ch 14/03/2005

court-circuit). Pour un condensateur utilisé en électronique, si nous dépassons cette valeur,


nous observons la destruction de l’élément. Cette valeur maximale de la tension appliquée aux
bornes, est appelée "tension de claquage " du condensateur. Nous pouvons définir la
rigidité du milieu comme étant :

Exemple : pour l’air, on trouve dans les tables la valeur :

Lorsque nous parlons de rigidité diélectrique nous parlons aussi du diélectrique qui est un
isolant ou une substance qui ne conduit pas l'électricité et qui est polarisable par un champ
électrique. Dans la plupart des cas, les propriétés du diélectrique sont dues à la polarisation de
la substance. Lorsque le diélectrique (dans notre cas, l'air est le diélectrique) est placé dans un
champ électrique, les électrons et les protons de ses atomes se réorientent et, dans certains cas,
à l'échelle moléculaire, une polarisation est induite (comme nous l'avons vu lors de notre
étude des dipôles). Cette polarisation engendre une différence de potentiel, ou tension, entre
les deux bornes du diélectrique; celui-ci emmagasine alors de l'énergie qui devient disponible
lorsque le champ électrique est supprimé. L'efficacité d'un diélectrique est sa capacité relative
à emmagasiner de l'énergie comparée à celle du vide. Elle s'exprime par la permittivité
relative, déterminée par rapport à celle du vide. La force diélectrique est la capacité d'un
diélectrique à résister aux champs électriques sans perdre ses propriétés isolantes. Un
diélectrique efficace libère une grande partie de l'énergie qu'il a emmagasinée lorsque le
champ électrique est inversé.

ÉNERGIE POTENTIELLE ÉLECTROSTATIQUE

Considérons deux charges . La première est supposée au repos et fixe la deuxième est
amenée de l'infinie à une distance de (le même raisonnement a été applicé pour le
champ gravitationnel dans le chapitre de mécanique classique). Supposons que les deux
charges soient de même signe. Comme ont tendance à se repousser mutuellement, il
faut fournir une énergie potentielle pour approcher (infiniment lentement) de . Le
travail la force électrostatique en un point quelconque est par définition :

L'énergie potentielle du système est :

car est résistant. Donc :

d'où simplement (l'énergie potentielle en un point) :

1132/2001
Sciences.ch 14/03/2005

L'avant dernière relation peut aussi se mettre sous la forme :

Remarque : il existe aussi rappelons-le une relation entre l'énergie est le gradient de la force
donnée qui découle simplement de la définition du travail :

1133/2001
Sciences.ch 14/03/2005

MAGNÉTOSTATIQUE

Les aimants sont connus depuis l’Antiquité (sans pour autant qu'on savait qu'elle était l'origine
de leurs propriétés) sous le nom de "magnétite", pierre trouvée à proximité de la ville de
Magnesia (Turquie). C’est de cette pierre par ailleurs que provient le nom actuel de champ
magnétique. Les chinois furent les premiers à utiliser les propriétés des aimants différentes de
celles des particules chargées, il y a plus de 1000 ans, pour faire des boussoles. Elles étaient
constituées d’une aiguille de magnétite posée sur de la paille flottant sur de l’eau contenue
dans une récipient gradué.

Au même titre que le champ électrique, une bonne/meilleure compréhension de l'origine de ce


champ ne peut se faire que par l'intermédiaire de théories modernes comme la physique
quantique ondulatoire ou la physique quantique des champs. Le lecteur débutant devra donc
prendre son mal en patience avant d'avoir les connaissances nécessaires pour étudier ces
théories.

Nous allons commencer l'étude du magnétisme dans l'ordre de l'aspect historique de ses
découvertes mais en introduisant ensuite des concepts plus contemporains tel que le potentiel
vecteur (théorie de jauges) ou le facteur gyromagnétique (physique quantique).

L’étude quantitative des interactions entre aimants et courants fut faite par les physiciens Biot
et Savart seulement en à partir de 1820. Ils mesurèrent l'amplitude des oscillations d’une
aiguille aimantée en fonction de sa distance à un courant rectiligne. Ils trouvèrent que la force
agissant sur un pôle est dirigée perpendiculairement à la direction reliant ce pôle au
conducteur et qu’elle varie en raison inverse de la distance. C'est la premier cas que nous
allons étudier :

Soit un déplacement de charges électriques produisant dans l'espace un champ vectoriel dont
les effets sont mesurables et dont les propriétés diffèrent de celles du champ électrostatique.
Nous en déduisons l'existence d'un nouveau champ vectoriel que nous appelons "champ
magnétique" et que nous noterons .

Le cas d'étude le plus simple consiste en un fil rectiligne indéfini (exemple que nous pouvons
auss assimiler à un simple déplacement de charges sans nécessairement avoir un fil comme
support) parcouru par un courant (voir chapitre traitant de l'électricité pour le concept de
courant) montre que les lignes de champ magnétique sont des cercles ayant le fil pour axe.

Remarque : le sens de se définit habituellement par l'intermédiaire de "l'observateur


d'Ampère", c'est-à-dire un observateur qui serait placé le long du fil, de façon que le courant

1134/2001
Sciences.ch 14/03/2005

aille de ses pieds vers sa tête et qui regarderait le point où nous évaluons le champ ma.
est dirigé de la droite vers la gauche de cet observateur.

Il a été expérimentalement établi que la valeur de à la distance du fil est proportionnelle


au courant qui le parcourt inversement proportionnel à :

Ce résultat a été obtenu expérimentalement par les physiciens Biot et Savart et consitute
traditionnellement la base de l'étude théorique du champ magnétique.

Le coefficient de proportionnalité dépend comme toujours des unités choisies. Pour


l'ensemble de ces conséquences, il est avantageux d'écrire l'expression précédente sous une
forme qui fasse apparaître la longueur du cercle de rayon . Nous posons donc :

et obtenons ainsi :

où est une nouvelle constante que nous appelons "susceptibilité magnétique" (à nouveau
au meme titre que le permittivité électrique il existe une "susceptibilité relative")

THÉORÈME D'AMPÈRE

Il est intéressant de calculer la "circulation" de le long d'un contour qui tourne une fois
dans le sens positif autour du fil orienté dans le sens du courant (observateur d'Ampère) :

Remarque : le long du contour, le champ est colinéaire au contour comme nous l'avons vu
précédemment d'où le fait que le produit scalaire puisse s'écrire comme simple produite de
normes.

Nous obtenons ainsi par définition "Loi d'Ampère" (ou "théorème d'Ampère") :

L'expression que nous avons obtenue peut encore être simplifiée si nous introduisons un
nouvel être physique appelé "intensité du champ magnétique" ou encore plus couramment

1135/2001
Sciences.ch 14/03/2005

"excitation magnétique" qui est noté . Si nous considèrons que nous sommes dans le vide
où il n'y a aucun dipôle magnétique alors nous le définissons par :

Alors, finalement nous pouvons écrire la loi d'Ampère peut s'écrire :

L'intérêt de la loi d'Ampère ainsi que du concept de circulation du champ magnétique paraît
(peut paraître) ainsi plus évident.

Cette dernière relation à bien évidemment une grande utilité en physique théorique car elle
nous permettra de déterminer d'autres résultats forts importants. Sinon, au niveau de la
pratique, le physicien de laboratoire ou l'électricien/électrotechnicien sera souvent confronté à
utiliser pour de petites et moyennes expériences des électro-aimants dont il pourrait souhaiter
re-calibrer les valeurs nominales ou encore de solénoïdes.

ÉLECTRO-AIMANT

Déterminons donc par exemple (important et intéressant) le champ magnétique dans l'entrefe
de longueur et de section d'un électro-aimant d'un de longueur et de section .

La loi d'Ampère nous donne :

dans le cas de l'électro-aimant nous pouvons écrire que la circulation du champ est la somme
de la circulation du champ de l'entrefer et de l'aimant lui-même:

où correspondant au nombre de boucles de courant entourant l'aimant et qui permet l


production du champ magnétique.

Nous avons par définition:

et

d'où :

1136/2001
Sciences.ch 14/03/2005

Si l'entrefer n'est pas trop grand et que d'où :

ce qui revient à écrire alors :

d'où :

La relation est la même pour un électro-aimant ayant deux bobines.

BOBINE SOLONOÏDALE INFINIE

Une application aussi particulièrement importante en électronique et électrotechnique est celle


du calcul d'une bobine de fil parcourue par un courant que nous considérerons comme
constant dans un premier temps. Il s'agit ni plus ni moins d'une bobine d'induction ou plus
techniquement appelée un inductance. Voyons de quoi il s'agit.

Un solénoïde est une bobine formée par un fil conducteur enroulé en hélice et parcouru par un
courant d'intensité . Dans ce qui suit, nous supposons que le champ d'induction d'un
solénoïde est nul entre les spires et parallèle à l'axe du solénoïde.

Considérons le schéma suivant et intéressons nous en approximation qu'à la partie interne du


solénoïde en admettant que le champ extérieur est nul par la longueur infinie de celui-ci et la
parfait jointure des bobines :

Appliquons la loi d'ampère au trajet rectangulaire . Ainsi :

1137/2001
Sciences.ch 14/03/2005

La première intégrale du membre de droite donne où est la grandeur de à


l'intérieur du solénoïde et , la longueur du segment . Nous pouvons remarquer que le
segment , même s'il est parallèle à l'axe du solénoïde, ne doit pas nécessairement coïncider
avec lui.

La deuxième et la quatrième intégrale sont nulles car, pour ces deux segments. et sont
partout perpendiculaires : étant donné que est nul partout, les deux intégrales sont
nulles. La troisième intégrale est également nulle puisque le segment calculé se trouve à
l'extérieur du solénoïde où nous avons supposé que le champ magnétique de la bobine était
idéale.

Ainsi, l'intégrale pour tout le trajet rectangulaire est tel que :

mais le courant est la somme des courants passant dans chacune des contenues dans
le chemin d'intégration. Mais en électronique nous avons l'habitude de travailler avec la valeur
(nous choisissons la lettre minuscule par analogie avec le thermodynamique ou les
minuscules représentent des densités) qui est le nombre de spire par unité de longueur :

Ainsi, nous avons :

Bien que cette relation ait été établie pour un solénoïde idéal infini, elle donne une grandeur
assez précise du champ d'induction magnétique pour les points d'intérieur situés près du
centre d'un solénoïde réel. Cette relation révèle par ailleurs que le champ magnétique est en
approximation indépendant du diamètre du solénoïde et qu'il est uniforme à travers la section
de celui-ci. En laboratoire, un solénoïde est un dispositif pratique pour produire un champ
d'induction uniforme de la même façon que le condensateur plan est utilisé pour produire un
champ électrique uniforme.

BOBINE TOROÏDALE

La bobine toroïdale est un autre exemple important de l'application de la loi d'Ampère.


Effectivement, nous retrouvons particulièrement ce type de configuration dans l'électronique
de petite puissance (ordinateurs par exemple) ou les inductances sont pour la plupart
toroïdales ou la production d'énergie avec les fameux Tokomak qui de façon schématisée
(très…) se réduisent à des bobines toroïdales.

1138/2001
Sciences.ch 14/03/2005

Pour des raisons de symétrie il est claire que les lignes d'induction magnétique forment des
cercles concentriques à l'intérieur de la bobine. Appliquons la loi d'Ampère au trajet
d'intégration circulaire de rayon :

C'est-à-dire :

Il s'ensuit que :

Ainsi, contrairement à l'intérieur d'un solénoïde, n'est pas constant à l'intérieur de la


bobine toroïdale.

RELATION DE MAXWELL-AMPÈRE

Soit la densité de courant en un point quelconque de l'espace dans le cas d'une distribution
à trois dimensions et soit une surface fermée qui s'appuie sur un contour quelconque. Le
courant qui traverse est bien évidemment donné par :

D'après la loi d'Ampère, la circulation du champ magnétique le long de est égale à cette
intégrale. Elle peut donc prendre ici, selon le choix du contour , une infinité de valeurs
variables de façon continue. D'autre part, le théorème de Stokes (voir chapitre de calcul
différentiel et intégral) fournit que :

1139/2001
Sciences.ch 14/03/2005

d'où :

et nous en ressortons finalemement que :

Nous pouvons faire une similitude osée de ce résultat avec la relation ci-dessous (démontrée
dans le chapitre d'électrodynamique), par extension de la charge statique et de la charge
dynamique :

qui n'est d'autre que la première équation de Maxwell (voir chapitre d'électrodynamique). Dès
lors, comme nous avons vu en électrostatique, nous avons :

Par analogie, l'idée est de poser (cette hypothèse se vérifie un peu plus bas par les résultats
remarquables obtenus) :

relation que nous pouvons écrire de manière plus élégante en supposant le courant non
dépendant de la position de l'observateur dans l'espace et colinéaire au vecteur perpendiculaire
de la surface traversée :

où représente le périmètre du fil dans lequel le courant circule.

LOI DE BIOT-SAVART

Du dernier développement, nous tirons donc :

Rappelez-vous qu'à la dernière étape de notre développement précédent (nous l'avons précisé

1140/2001
Sciences.ch 14/03/2005

implicitement) que le chemin d'intégration est perpendiculaire au courant ! Mais le champ


magnétique ne peut pas être nul en tout point de la ligne du courant. Dès lors, nous sommes
amené à écrire ce qui est caché :

Le relation ci-dessus nous permet donc, par extension, d'écrire sous une forme plus générale :

qui n'est d'autre que la "loi de Biot-Savart" souvent présentée en premier dans les classes
scolaire comme début d'étude du magnétisme.

Cette dernière forme peut tout aussi bien s'écrire (forme très importante) :

Donc :

Nous retrouvons ici l'approximation non relativiste du champ magnétique tel que nous l'avons
déterminé lors de notre étude de la mécanique relativiste, où nous avons démontré que :

Une autre forme importante de l'expression du champ magnétique est :

Comme est colinéaire à , nous pouvons écrire :

Donc :

1141/2001
Sciences.ch 14/03/2005

Une remarque important s'impose à notre niveau du discours : dans le cadre des études
scolaires pré-universitaires, les formulations mathématiques des champs magnétique et
électrique sont considérées comme des lois indémontrables d'où l'on tire plus tard les
équations de Maxwell (de plus les développements ne sont pas des plus esthétiques et
rigoureux). L'aspect totalement expérimental de relations aussi importantes peut avoir une
image néfaste de la physique théorique sur les étudiants. Il convient dès lors de préciser que
lors des études universitaire, nous avons une approche juste un peu moins pragmatique.

Effectivement, nous postulons l'équation de Schrödinger (voir chapitre de mécanique


quantique ondulatoire) dont nous nous servons pour démontrer la formulation non relativiste
de la loi de Coulomb à l'aide de la théorie de Yukawa (voir chapitre de mécanique quantique
des champs). Ensuite, pendant l'étude de la relativité restreinte (voir chapitre de mécanique
relativiste), nous déterminons la forme relativiste de la loi de Coulomb. Ensuite, nous
admettons l'existence du champ magnétique dont l'expression est donnée expérimentalement
par la force de Lorentz (voir plus bas dans ce chapitre) et de par les propriétés des
transformations de Lorentz et de la connaissance de l'expression relativiste de la loi de
Coulomb nous déterminons l'expression relativiste du champ magnétique. Ensuite, par
approximation non relativiste, nous tombons sur la loi de Biot-Savart. Cette manière de
procéder est beaucoup mieux accueillie par les étudiants mais pas nécessairement accessible à
tous les niveaux.

Revenons maintenant sur la loi de Biot-Savart. Un exemple important en astrophysique de loi


de Biot-Savart dans le cadre des jets de plasmas des disque