ElementsMathematiquesAppliqueesV2 PDF
ElementsMathematiquesAppliqueesV2 PDF
MATHÉMATIQUES APPLIQUÉES
(deuxième édition)
10.03.2005
A PROPOS DE CE DOCUMENT
Que ce soit sur le point de vue de la quantité aussi bien que de la qualité du contenu ainsi que
sur l'audience recueillie par les sujets traités, cette nouvelle édition PDF de Sciences.ch n'a
aucune comparaison possible avec la précédente (de 2002). Cependant, cela n'empêche pas
que le travail restant par rapport aux objectifs fixés est considérable et qu'il reste énormément
de progrès et de corrections à effectuer jusqu'aux objectifs fixés.
Cependant, laissons parler les chiffres pour juger de la réussite du site Internet Sciences.ch :
plus de 2'000 pages, 100 documents PDFs disponibles, 70'000 téléchargements (2'000 pour ce
document à lui seul dans son ancienne version) correspondant a 15'000 pages de
documentation, 20'000 visiteurs par mois provenant d'un peu plus de 90 pays.
Ces augmentations faisant, de nombreux lecteurs se sont manifestés pour annoncer leurs
désirs, satisfactions ou déceptions face à ce défi intellectuel d'englober l'ensemble du
programme scientifique scolaire francophone de la plus petite classe jusqu'au plus haut degré
dans un cadre uniforme et continu et disponible gratuitement.
La relecture du site entre 2002 et 2005 a permis également de corriger de nombreuses zones
floues qui méritent pour certaines encore d'être éclaircies ou reformulées par des méthodes
autres que purement formelles de manière à les rendre accessibles au plus grand nombre mais
toujours avec la rigueur nécessaire ! Effectivement, bien qu'au début il y ait eu une grande
réticence quant au fait d'ajouter des textes, figures ou schémas explicatifs des équations
démontrées, le temps faisant, cette position va être complètement abandonnée ne pouvant
admettre qu'il soit parfois nécessaire au lecteur de passer plus de deux à trois heures à
construire des schémas mentaux d'un concept très abstrait. Par ailleurs, les illustrations et les
courts textes de vulgarisation permettent souvent d'obtenir une vision plus directe sur certains
résultats théoriques formels et cela fait toujours du bien, tant aux yeux qu'au mental. La
prochaine édition se verra donc certainement agrémentée de nombreuses illustrations.
Ce document est donc, vous l'aurez compris, toujours en pleine évolution et il faudra souvent
au lecteur se référer au site (www.sciences.ch) pour d'éventuels compléments d'informations
sur les nouveautés et corrections pouvant être publiées depuis sa date de parution. Le lecteur
ne devra également pas hésiter à contacter les responsables du site (et du présent document) à
l'adresse [email protected] pour tout type de remarques constructives.
Nous tenons également à informer le lecteur que Adobe Reader 7.0 est requis pour une lecture
optimale de ce document et que celui-ce rencontre actuellement des problèmes d'affichage sur
la version Adobe Reader 2.0 disponible sur les PocketPc. Dans Adobe Reader 7.0 le lecteur
aura la possibilité de suivre les corrections principales au cours des années à venir (en attendant
la nouvelle version en 2009) en activant les différents outils tels qu'indiqués sur la capture
d'écran visible à la page suivante :
2/2001
Sciences.ch 14/03/2005
Légende :
(1) Cliquez sur l'onglet Commentaires pour voir tous les commentaires ajoutés dès à présent
après la création de ce PDF
(2) Sinon, par un double clic sur une bulle jaune, croix rouge, trait rouge, bulle rouge etc.
apparaîtra la remarque du commentaire sélectionné tel que présenté ci-dessous :
3/2001
Sciences.ch 14/03/2005
Il reste donc beaucoup à faire comme nous l'avons déjà précisé et plus nous avançons, plus le
constat de la quantité de travail restante est sévère. Il faut aussi un regard plus critique envers
le monument que constitue la partie mathématique du site car certaines démonstrations sont
ridicules car elles n'apportent rien mis à part à perdre du temps et nous le préciserons à
l'avenir tel quel. Il y a aussi le regret de finalement constater qu'il n'est pas possible de se
rappeler de tout et de tout faire, ce qui montre les limites de l'individu humain. Mais cela n'est
pas nouveau et peut-être que la science permettra un jour d'envisager, à l'aide d'artifices, de
dépasser ces contraintes.
Je tiens personnellement en tant que responsable de ce projet à remercier encore une fois les
nombreux intervenants et contributeurs, ainsi que tous les internautes et l'ensemble de la
communauté scientifique passée et contemporaine pour leur aide et héritage culturel.
Vincent Isoz
4/2001
Sciences.ch 14/03/2005
5/2001
Sciences.ch 14/03/2005
Egalités..................................................................................................................92
Comparateurs ........................................................................................................93
Classes d'équivalences ..........................................................................................96
Lois fondamentales de l'arithmétique ........................................................................97
Addition ................................................................................................................98
Soustraction...........................................................................................................100
Multiplication........................................................................................................102
Division.................................................................................................................104
Polynômes arithmétiques...........................................................................................108
Valeur absolue ...........................................................................................................109
Règles de calcul .........................................................................................................110
Théorie des nombres.......................................................................................................115
Principe du bon ordre.................................................................................................115
Propriété archimédienne ............................................................................................115
Principe d'induction ...................................................................................................116
Divisibilité .................................................................................................................117
Division euclidienne..............................................................................................118
Plus grand commun diviseur (P.G.C.D)...........................................................119
Algorithme d'Euclide........................................................................................121
Plus petit commun multiple (P.P.C.M.) ...........................................................122
Théorème fondamental de l'arithmétique .........................................................124
Congruences..........................................................................................................125
Preuve par neuf.................................................................................................126
Théorie des ensembles ....................................................................................................127
Définitions .................................................................................................................128
Axiomes de ZF (Zermelo-Frankel)............................................................................130
Cardinaux ..............................................................................................................133
Produit cartésien....................................................................................................135
Bornes ...................................................................................................................136
Opérations ensemblistes ............................................................................................136
Inclusion................................................................................................................137
Intersection............................................................................................................137
Réunion .................................................................................................................138
Différence..............................................................................................................139
Différence symétrique...........................................................................................139
Produit ...................................................................................................................140
Ensemble vide .......................................................................................................140
Complémentarité ...................................................................................................141
Fonctions....................................................................................................................141
Loi de composition................................................................................................142
Loi interne/externe ................................................................................................142
Application linéaire...............................................................................................142
Noyau et image.................................................................................................142
Fonction surjective ................................................................................................143
Fonction injective..................................................................................................144
Fonction bijective..................................................................................................144
Fonction composée ...............................................................................................145
Théorème de Cantor-Bernstein .............................................................................145
Structures ...................................................................................................................147
Magma ..................................................................................................................148
6/2001
Sciences.ch 14/03/2005
Monoïde ................................................................................................................149
Groupe................................................................................................................... 151
Groupe abélien .................................................................................................151
Groupe cyclique ...............................................................................................151
Anneau .................................................................................................................. 155
Anneau abélien (commutatif)...........................................................................156
Anneau intègre .................................................................................................156
Anneau factoriel ...............................................................................................156
Sous-anneau......................................................................................................157
Corps ..................................................................................................................... 158
Corps commutatif .............................................................................................158
Espaces vectoriels .................................................................................................158
Sous-espaces vectoriels ....................................................................................160
Algèbres ................................................................................................................160
Homomorphismes......................................................................................................161
Homomorphisme de magma .................................................................................161
Homomorphisme de monoïde ...............................................................................161
Homomorphisme d'anneau....................................................................................161
Homomorphisme de groupe..................................................................................161
Homomorphisme de corps ....................................................................................161
Isomorphisme........................................................................................................163
Endomorphisme ....................................................................................................163
Automorphisme.....................................................................................................163
Idéal.......................................................................................................................163
Probabilités et statistiques .............................................................................................167
Probabilités ................................................................................................................167
Univers des événements........................................................................................167
Axiomes ................................................................................................................168
Evénements disjoints........................................................................................169
Evénements équiprobables ...............................................................................170
Evénements conjoints.......................................................................................170
Probabilités conditionnelles ..................................................................................170
Formules de Bayes ...........................................................................................172
Analyse combinatoire ................................................................................................172
Arrangements avec répétition ...............................................................................173
Permutations avec répétition .................................................................................174
Arrangements simples avec répétition ..................................................................175
Combinaisons simples...........................................................................................176
Combinatoire ....................................................................................................177
Statistiques .................................................................................................................177
Echantillons...........................................................................................................178
Variables discrètes ................................................................................................179
Espérance discrète ............................................................................................179
Déviation standard discrète ..............................................................................180
Formule de Huyghens..................................................................................180
Variable centrée réduite....................................................................................180
Covariance discrète ..........................................................................................181
Coefficient de corrélation.................................................................................183
Variables continues ...............................................................................................184
Densité de probabilité.......................................................................................184
7/2001
Sciences.ch 14/03/2005
Espérance continue...........................................................................................185
Variance continue.............................................................................................185
Fonctions de distribution.......................................................................................185
Fonction discrète uniforme...............................................................................185
Fonction de Bernoulli.......................................................................................186
Fonction binomiale...........................................................................................188
Fonction hypergéométrique..............................................................................189
Fonction multinomiale .....................................................................................190
Fonction de Poisson..........................................................................................191
Fonction de Gauss-Laplace ..............................................................................194
Loi normale centrée réduite .........................................................................199
Fonction uniforme ............................................................................................200
Fonction exponentielle .....................................................................................201
Fonction de Cauchy..........................................................................................203
Fonction bêta ....................................................................................................205
Fonction Gamma ..............................................................................................207
Fonction de Khi-Deux ......................................................................................209
Loi de Student ..................................................................................................209
Loi de Benford..................................................................................................210
Estimateurs............................................................................................................213
Tests d'adéquations ...............................................................................................216
Contrôle de qualité ................................................................................................218
Courbe d'efficacité............................................................................................220
Valeur de niveau de qualité acceptable ............................................................221
Moyennes ..............................................................................................................221
Moyenne arithmétique......................................................................................222
Médiane ............................................................................................................222
Moyenne quadratique .......................................................................................222
Moyenne harmonique.......................................................................................222
Moyenne géométrique......................................................................................223
Moyenne mobile...............................................................................................224
Moyenne pondérée ...........................................................................................225
Moyenne fonctionnelle.....................................................................................226
Propriété des moyennes....................................................................................226
Calculs d'erreurs....................................................................................................230
Incertitudes absolues et relatives......................................................................231
Erreurs statistiques ...........................................................................................231
Algèbre ............................................................................................................................... 233
Calcul algébrique ...........................................................................................................233
Equations et inéquations ............................................................................................234
Equations...............................................................................................................235
Inéquations ............................................................................................................239
Identités remarquables ..........................................................................................242
Triangle de Pascal ............................................................................................243
Polynômes..................................................................................................................245
Equations diophantiennes......................................................................................246
Polynômes de degré 1 ...........................................................................................246
Polynômes de degré 2 ...........................................................................................247
Déterminant ......................................................................................................247
Polynôme de degré 3.............................................................................................249
8/2001
Sciences.ch 14/03/2005
Polynômes cyclotomiques.....................................................................................252
Polynômes de Legendre ........................................................................................253
Analyse fonctionnelle......................................................................................................257
Représentations..........................................................................................................257
Représentation tabulaire........................................................................................258
Représentation graphique......................................................................................258
Propriétés des graphiques.................................................................................263
Représentation analytique .....................................................................................265
Fonctions....................................................................................................................267
Dépendances .........................................................................................................267
Domaines d'existence............................................................................................267
Croissance et décroissance....................................................................................267
Périodicité .............................................................................................................267
Parité .....................................................................................................................268
Composition ..........................................................................................................269
Types de fonctions ................................................................................................269
Fonctions puissances ........................................................................................269
Fonctions exponentielles ..................................................................................269
Fonctions logarithmiques .................................................................................269
Fonctions trigonométriques..............................................................................269
Fonctions polynomiales....................................................................................270
Fonctions rationnelles.......................................................................................270
Fonctions algébriques.......................................................................................270
Limite et continuité ...............................................................................................270
Asymptotes.......................................................................................................274
Logarithmes ...............................................................................................................274
Bases vulgaires......................................................................................................275
Base népérienne ....................................................................................................276
Fonction exponentielle naturelle ...........................................................................278
Produit scalaire fonctionnel .......................................................................................279
Topologie ........................................................................................................................281
Espace topologique ....................................................................................................282
Espace de Hausdorff .............................................................................................282
Espace métrique et distance.......................................................................................282
Distance hölderienne.............................................................................................284
Distance discrète ...................................................................................................285
Distances équivalentes ..........................................................................................285
Fonctions lipchitziennes........................................................................................286
Ensembles ouverts et fermés......................................................................................287
Boules....................................................................................................................287
Parties....................................................................................................................288
Boules généralisées ...............................................................................................290
Diamètre................................................................................................................291
Variétés ......................................................................................................................292
Variétés différentiables .........................................................................................293
Théorie de la mesure ......................................................................................................294
Espaces mesurables....................................................................................................294
Tribu......................................................................................................................294
Tribu borélienne ...............................................................................................296
Théorème de la classe monotone ...............................................................................299
9/2001
Sciences.ch 14/03/2005
10/2001
Sciences.ch 14/03/2005
Pseudo vecteurs..........................................................................................................380
Multiplication par un scalaire ....................................................................................380
Règle de trois.........................................................................................................380
Espace vectoriel..............................................................................................................382
Combinaisons linéaires ..............................................................................................383
Sous-espaces vectoriels..............................................................................................384
Familles génératrices .................................................................................................384
Dépendances et indépendances..................................................................................385
Bases d'un espace vectoriel........................................................................................386
Angles directeurs...................................................................................................387
Dimensions d'un espace vectoriel ..............................................................................388
Prolongements d'une famille libre .............................................................................388
Rang d'une famille finie.............................................................................................389
Sommes directes ........................................................................................................390
Espace affine..............................................................................................................390
Espace vectoriel euclidien .........................................................................................392
Norme d'un vecteur ...............................................................................................392
Produit scalaire......................................................................................................393
Projection orthogonale .....................................................................................393
Inégalité de Cauchy-Schwartz..........................................................................396
Inégalité triangulaire.........................................................................................397
Produit vectoriel ....................................................................................................398
Produit mixte.........................................................................................................403
Espace vectoriel fonctionnel......................................................................................404
Système de coordonnées............................................................................................405
Système cartésien ..................................................................................................405
Système sphérique.................................................................................................406
Système cylindrique ..............................................................................................408
Système polaire .....................................................................................................411
Opérateurs différentiels scalaires et vectoriel............................................................412
Gradient d'un champ scalaire ................................................................................412
Gradient d'un champ de vecteurs ..........................................................................416
Divergence d'un champ de vecteurs......................................................................417
Rotationnel d'un champ de vecteurs......................................................................418
Laplacien d'un champ scalaire ..............................................................................419
Laplacien d'un champ vectoriel.............................................................................424
Relation remarquables...........................................................................................425
Résumé..................................................................................................................426
Algèbre linéaire ..............................................................................................................427
Systèmes linéaires......................................................................................................429
Matrices .....................................................................................................................431
Matrice associée ....................................................................................................433
Opérations sur les matrices ...................................................................................435
Types de matrice ...................................................................................................435
Matrice inversible.............................................................................................435
Matrice transposée............................................................................................435
Matrice adjointe................................................................................................436
Matrice hermitique (self-adjointe)....................................................................437
Matrice nilpotent ..............................................................................................437
Matrice orthogonale .........................................................................................437
11/2001
Sciences.ch 14/03/2005
Matrice symétrique...........................................................................................438
Matrice anti-symétrique ...................................................................................438
Matrice triangulaire ..........................................................................................438
Matrice diagonale .............................................................................................439
Matrice de passage ...........................................................................................439
Déterminants..............................................................................................................440
Dérivée d'un déterminant ......................................................................................451
Changements de base.................................................................................................453
Valeurs et vecteur propres .........................................................................................455
Polynômes caractéristique.....................................................................................456
Calcul tensoriel ..............................................................................................................458
Notation indicielle......................................................................................................458
Sommation sur plusieurs indices ...............................................................................460
Symbole de Kronecker...............................................................................................460
Symbole d'antisymétrie..............................................................................................461
Métrique et signature .................................................................................................463
Composantes contravariantes et covariantes .............................................................465
Opérations dans les bases ..........................................................................................466
Méthode d'orthogonalisation de Schmidt..............................................................466
Changements de base ............................................................................................467
Bases réciproques..................................................................................................468
Tenseurs euclidiens....................................................................................................469
Tenseurs fondamental ...........................................................................................470
Produit tensoriel de deux vecteurs ........................................................................471
Espace tensoriel................................................................................................473
Combinaisons linéaires de tenseurs ......................................................................477
Contractions des indices........................................................................................477
Tenseurs particuliers ..................................................................................................479
Tenseur symétrique ...............................................................................................482
Tenseur anti-symétrique........................................................................................482
Tenseur fondamental.............................................................................................484
Coordonnées curvilignes............................................................................................485
Repère naturel en coordonnées sphériques ...........................................................488
Repère naturel en coordonnées polaires................................................................489
Repère naturel en coordonnées cylindriques.........................................................490
Symboles de Christoffel.............................................................................................491
Théorème de Ricci .....................................................................................................497
Dérivée de covariante............................................................................................499
Tenseur de Riemann-Christoffel................................................................................504
Première identité de Bianchi .................................................................................507
Tenseur de Ricci ........................................................................................................507
Scalaire de Ricci....................................................................................................507
Tenseur d'Einstein......................................................................................................507
Identité de Bianchi contractée...............................................................................508
Calcul spinoriel ..............................................................................................................510
Spineur unitaire..........................................................................................................510
Propriétés géométriques ........................................................................................514
Symétries planes...............................................................................................514
Rotations planes ...............................................................................................516
Propriétés des matrices de Pauli.......................................................................521
12/2001
Sciences.ch 14/03/2005
13/2001
Sciences.ch 14/03/2005
14/2001
Sciences.ch 14/03/2005
Tétraèdre...........................................................................................................671
Octaèdre............................................................................................................671
Prisme droit ......................................................................................................672
Dodécaèdre.......................................................................................................672
Icosaèdre...........................................................................................................672
Volumes de révolutions ........................................................................................673
Cylindre ............................................................................................................673
Cône..................................................................................................................675
Sphère...............................................................................................................676
Tore ..................................................................................................................678
Ellipsoïde..........................................................................................................682
Paraboloïde.......................................................................................................683
Théorie des graphes .......................................................................................................685
Définitions .................................................................................................................685
Ponts de Königsberg ..................................................................................................690
Théorème d'Euler.......................................................................................................691
Matrice d'adjacence....................................................................................................694
Catégories ..................................................................................................................694
Mécanique .......................................................................................................................... 696
Principes......................................................................................................................... 696
Systèmes d'unités .......................................................................................................698
MKSC ...................................................................................................................699
Notations scientifiques ..........................................................................................701
Temps....................................................................................................................703
Longueur ...............................................................................................................704
Masse ....................................................................................................................705
Energie ..................................................................................................................707
Charge ...................................................................................................................708
Distributions..........................................................................................................709
Constantes..................................................................................................................710
Constantes universelles .........................................................................................711
Constantes physiques diverses ..............................................................................711
Constantes physico-chimiques diverses................................................................712
Constantes astrophysiques diverses ......................................................................712
Constantes de Planck ............................................................................................713
Unités naturelles....................................................................................................714
Cube magique...................................................................................................715
Principes de la physique ............................................................................................716
Principe de causalité..............................................................................................716
Trilemne de Fries..............................................................................................716
Principe premier de conservation de l'énergie ......................................................717
Principe premier de moindre action ......................................................................717
Principe premier de Noether .................................................................................718
Invariance par translation dans l'espace ...........................................................720
Invariance par rotation dans l'espace................................................................721
Invariance par translation dans le temps ..........................................................722
Théorème de Noether .......................................................................................723
Principe premier de Curie .....................................................................................726
Espaces ponctuels ......................................................................................................727
Mécanique analytique..................................................................................................... 735
15/2001
Sciences.ch 14/03/2005
16/2001
Sciences.ch 14/03/2005
17/2001
Sciences.ch 14/03/2005
Vecteur d'onde.......................................................................................................867
Relation de dispersion ...........................................................................................868
Paquet d'onde ........................................................................................................871
Mécanique statistique ..................................................................................................... 872
Théorie statistique de l'information ...........................................................................872
Formule de Shannon .............................................................................................875
Information mutuelle moyenne .............................................................................875
Entropie infométrique ...........................................................................................876
Loi de Boltzmann.......................................................................................................876
Micro-états ............................................................................................................877
Equilibre thermodynamique..................................................................................878
Distributions statistiques physiques...........................................................................881
Distribution de Maxwell .......................................................................................881
Distribution de Maxwell-Boltzmann ....................................................................885
Distribution de Fermi-Dirac..................................................................................890
Distribution de Bose-Einstein ...............................................................................892
Thermodynamique .......................................................................................................... 894
Définitions .................................................................................................................895
Systèmes thermodynamiques.....................................................................................896
Variables d'état...........................................................................................................897
Variables intensives et extensives.........................................................................898
Lois d'état...................................................................................................................899
Transformation thermodynamique ............................................................................899
Principes de la thermodynamique..............................................................................900
Principe zéro (équilibre thermique) ......................................................................900
Principe premier (principe d'équivalence) ............................................................901
Principe deuxième (irréversibilité)........................................................................901
Principe troisième (principe de Nernst) ................................................................901
Fluides........................................................................................................................ 901
Capacités et chaleurs .............................................................................................902
Fluide parfait .........................................................................................................903
Fluide semi-parfait ................................................................................................904
Fluide réel .............................................................................................................904
Energie interne...........................................................................................................905
Enthalpie ...............................................................................................................908
Chaleur.......................................................................................................................908
Equation de continuité ...............................................................................................910
Loi de Fourier........................................................................................................915
Equation de diffusion de la chaleur.......................................................................915
Rayonnement thermique ............................................................................................915
Loi de Stefan-Boltzmann ......................................................................................916
Loi de Planck ........................................................................................................923
Première loi de Wien........................................................................................928
Constante de Stefan-Boltzmann ..................................................................929
Deuxième loi de Wien ......................................................................................930
Constante de Wien.......................................................................................930
Mécanique des milieux continus..................................................................................... 932
Solides........................................................................................................................932
Pressions................................................................................................................933
Elasticité des solides .............................................................................................933
18/2001
Sciences.ch 14/03/2005
Module de Young.............................................................................................935
Loi de Hook......................................................................................................935
Module de cisaillement ....................................................................................936
Module de glissement.......................................................................................937
Coefficient de poisson .................................................................................938
Module de compressibilité ...............................................................................944
Coefficient de compressibilité .....................................................................945
Module de flexion ............................................................................................945
Liquides .....................................................................................................................948
Théorème de Pascal ..............................................................................................949
Viscosité................................................................................................................950
Loi de Poiseuille...............................................................................................952
Théorème de Bernoulli..........................................................................................953
Théorème de Toricelli ......................................................................................957
Effet Venturi.....................................................................................................957
Equations de Navier-Stokes ..................................................................................958
Fluides incompressibles ...................................................................................976
Equation d'Euler de 1ère forme ...................................................................977
Equation d'Euler de 2ème forme .................................................................978
Fluide compressible..........................................................................................981
Fluide statique ..................................................................................................981
Nombre de Reynolds ........................................................................................982
Approximation de Boussinesq..........................................................................984
Loi de Stokes ....................................................................................................986
Pression hydrostatique ..........................................................................................990
Poussée d'Archimède ............................................................................................990
Gaz ............................................................................................................................. 992
Type de gaz ...........................................................................................................992
Gaz parfait ........................................................................................................992
Gaz réel.............................................................................................................993
Théorème du Viriel ...............................................................................................993
Plasmas .....................................................................................................................998
Degré d'ionisation .................................................................................................999
Fréquence plasma..................................................................................................1002
Astrophysique ................................................................................................................. 1003
Trajectoires d'orbitales keplériennes..........................................................................1003
Précession du périhélie ..............................................................................................1007
Formule de Binet...................................................................................................1008
Effet Doppler .............................................................................................................1014
Redshift .................................................................................................................1016
Equation de Drake .....................................................................................................1016
Etoiles ........................................................................................................................ 1017
Diagramme de Hertzprung-Russel........................................................................1018
Température interne des étoiles ............................................................................1020
Température externe des étoiles............................................................................1021
Luminosité des étoiles...........................................................................................1022
Eclat d'une étoile ..............................................................................................1022
Magnitude apparente ........................................................................................1022
Magnitude absolue ...........................................................................................1024
Etoiles variables ...............................................................................................1026
19/2001
Sciences.ch 14/03/2005
20/2001
Sciences.ch 14/03/2005
21/2001
Sciences.ch 14/03/2005
22/2001
Sciences.ch 14/03/2005
Modèle de Dalton.......................................................................................................1258
Modèle de Thomson ..................................................................................................1259
Modèle de Rutherford................................................................................................1260
Modèle de Bohr .........................................................................................................1261
Postulats de Bohr ..................................................................................................1261
Quantification........................................................................................................1262
Modèles des atomes hydrogénoïdes sans entraînement ........................................1264
Rayon de Bohr..................................................................................................1265
Formule de Balmer ...........................................................................................1267
Constante de Rydberg..................................................................................1267
Modèle des atomes hydrogénoïdes avec entraînement .........................................1268
Hypothèse du neutron ...........................................................................................1272
Modèle de Sommerfeld et Wilson .............................................................................1273
Nombre quantique azimutal ..................................................................................1275
Nombre quantique radial.......................................................................................1277
Modèle relativiste de Sommerfeld.............................................................................1278
Constante de structure fine....................................................................................1285
Constante de Rydberg ...........................................................................................1295
Moment magnétique dipolaire quantique..............................................................1295
Facteur gyromagnétique ...................................................................................1296
Magnéton de Bohr ............................................................................................1296
Nombre quantique magnétique ........................................................................1296
Spin ....................................................................................................................... 1298
Principe d'exclusion de Pauli ................................................................................1299
Couches électroniques...........................................................................................1299
Physique quantique ondulatoire.....................................................................................1304
Postulats .....................................................................................................................1306
1er postulat (état quantique)..................................................................................1307
2ème postulat (évolution temporelle d'un état quantique) ....................................1308
3ème postulat (observables et opérateurs) ............................................................1309
4ème postulat (mesure d'une propriété) ................................................................1311
5ème postulat (moyenne d'une propriété) .............................................................1311
Principes d'incertitudes classiques .............................................................................1311
Première relation d'incertitude classique...............................................................1313
Deuxième relation d'incertitude classique.............................................................1314
Troisième relation d'incertitude classique.............................................................1315
Algèbre quantique......................................................................................................1316
Opérateurs linéaires fonctionnels..........................................................................1316
Opérateurs de quantité de mouvement .............................................................1319
Opérateurs adjoints et hermitiques ...................................................................1319
Commutateurs et anti-commutateurs................................................................1321
Relations d'incertitudes de Heisenberg........................................................1323
Interprétation de Copenhague ..........................................................................1324
Dimensions de Planck ......................................................................................1326
Représentatives .....................................................................................................1329
Valeurs et fonctions propres..................................................................................1331
Formalisme de Dirac .............................................................................................1333
Kets et Bras ......................................................................................................1333
Modèle de Schrödinger..............................................................................................1335
Principe de complémentarité.................................................................................1336
23/2001
Sciences.ch 14/03/2005
24/2001
Sciences.ch 14/03/2005
25/2001
Sciences.ch 14/03/2005
26/2001
Sciences.ch 14/03/2005
27/2001
Sciences.ch 14/03/2005
Mots ......................................................................................................................1694
Langages ...............................................................................................................1696
Equations...............................................................................................................1698
Codes.....................................................................................................................1699
Codes préfixes ..................................................................................................1699
Algorithmes linguistiques ..........................................................................................1700
Algorithme de Huffmann ......................................................................................1700
Algorithme de Sardinas et Petterson .....................................................................1705
Informatique quantique ..................................................................................................1708
Polarisation du photon ...............................................................................................1711
QuBit..........................................................................................................................1714
Mathématiques sociales................................................................................................. 1720
Dynamique des populations ...........................................................................................1720
Modèle exponentiel....................................................................................................1720
Modèle logistique ......................................................................................................1721
Diagramme de Feigenbaum ..................................................................................1727
Propagation des épidémies.........................................................................................1731
Modèle Proies-Prédateurs (de Lotka-Volterra)..........................................................1734
Modèle de Hardy-Weinberg ......................................................................................1741
Théorie de la décision (jeux) ..........................................................................................1746
Représentatives ..........................................................................................................1748
Formes extensives .................................................................................................1748
Formes normales ...................................................................................................1749
Jeux répétitifs ...................................................................................................1754
Formes ensemblistes .............................................................................................1756
Jeux coopératifs et non-coopératifs ...........................................................................1760
Optimum de Pareto ...............................................................................................1761
Equilibre de Nash..................................................................................................1762
Utilité espérée .......................................................................................................1763
Jeux évolutionnaires ..................................................................................................1767
Equilibre de Cournot .............................................................................................1771
Econométrie....................................................................................................................1775
Concepts.....................................................................................................................1776
Micro-économie ....................................................................................................1778
Macro-économie ...................................................................................................1784
Modèle monétaire ......................................................................................................1785
Théorie de l'offre et de la demande............................................................................1791
Théorie de la préférence........................................................................................1791
Modèle contrarié à perte nette ..........................................................................1797
Calculs actuariels .......................................................................................................1804
Intérêt simple.........................................................................................................1806
Intérêt composé .....................................................................................................1806
Intérêt progressif ...................................................................................................1808
Théorie de la spéculation ...........................................................................................1809
Portefeuilles, titres actions et obligations .............................................................1810
Options .............................................................................................................1811
Return on investment ............................................................................................1814
Goodwill...........................................................................................................1816
Risque d'un portefeuille....................................................................................1818
Coefficient bêta ................................................................................................1819
28/2001
Sciences.ch 14/03/2005
29/2001
Sciences.ch 14/03/2005
INTRODUCTION
ABSTRACT
Ancien étudiant en physique, j'ai toujours regretté l'absence d'un bon livre complet et
rigoureux destiné à toutes et à tous contenant l'ensemble du programme de mathématique-
physique de la plus petite classe jusqu'au troisième cycle universitaire sans avoir à s'habituer
chaque fois à une notation ou un vocabulaire spécifique à l'auteur du livre concerné.
J'ai été de plus assez frustré pendant mes études à devoir ingurgiter assez souvent des
"formules" ou des "lois" soit disant (et à tort) indémontrables ou trop compliquées selon mes
professeurs ou même des livres d'auteurs de renomée internationale. Bien qu'aujourd'hui je
doive admettre qu'effectivement que la démonstration de certaines relations présentées dans le
cadre des cours de physique ou de mathématique ne puisse ce faire faute de temps dans le
planning scolaire ou de place dans le livre, je ne peux admettre qu'un professeur ou un auteur
dise à son étudiant (respectivement lecteur) que certaines lois ou théorèmes sont
indémontrables (car la plupart du temps c'est faux) ou que telle ou telle démonstration est trop
compliquée sans lui donner une référence bibliographique où l'étudiant pourrait trouver
l'information qu'il recherche. Ce site doit pouvoir se substituer, gratuitement, à toutes ces
références permettant ainsi à tout étudiant curieux de ne pas être frusté pendant de longues
années durant son cursus scolaire en physique. Sans quoi, la physique prend alors l'aspect
rébarbatif d'une science figée, à l'écart de l'évolution scientifique et technique, d'une
accumulation hétéroclite de connaissances et surtout de formules qui la font considérer
comme un sous-produit insipide des mathématiques...
Si ceux qui voient la physique-mathématique comme un outil (ce qu'elle est aussi) ou comme
l'ennemi des croyances religieuses, ou comme un domaine scolaire rébarbatif sont légions, il
est cependant peut-être utile de rappeler que, comme le disait Galilée "le livre de la Nature est
écrit dans le langage des mathématiques". C'est dans ce contexte que ce site aborde la
physique-mathématique pour les étudiants en sciences de la Nature, de la Terre et de la Vie
comme pour tous ceux qui exercent une profession liée à ces diverses matières y compris la
philosophie ou pour toute personne curieuse de s'informer de l'implication des sciences dans
la vie quotidienne.
La frontière entre la philosophie et les sciences pures et exactes est très mince. Effectivement,
comme le relate Platon dans le Phédon, Socrate à ses dernières heures s'est entouré de ses
amis et disciples dont Cébès et Simmias (deux pythagoriciens) considérés par Socrate comme
interlocuteurs privilégiés. Ce n'est pas un hasard puisqu'il convient alors de philosopher, déjà,
en s'inspirant du modèle pythagoricien qui fait des mathématiques une voie nécessaire d'accès
à la vérité, seule capable de se frayer un chemin fiable pour aborder des sujets aussi
importants que ceux de l'âme et de sa destinée...
Le choix de traiter la physique ici comme une branche purement mathématique, sans être
cependant trop formel, provient certainement du fait que la physique (philosophie naturelle) et
la mathématique sont à ce jour tellement peu discernables que la médaille de Fields (la plus
haute récompense à ce jour dans le domaine de la mathématique) a été décernée en 1990 au
physicien Edward Witten, qui a utilisé des idées physiques pour re-démontrer un théorème
mathématique. Cette tendance n'est certainement pas un mal, car nous pouvons observer que
toute science, dès qu'elle cherche à atteindre une compréhension plus détaillée du sujet qu'elle
étudie, finit finalement toujours sa course dans les mathématiques pures (la voie absolue par
excellence). Ainsi, pouvons nous présager dans un futur lointain, la convergence de toutes les
30/2001
Sciences.ch 14/03/2005
sciences (pures, exactes ou sociales) vers la mathématique (lire à titre d'exemple le document
PDF L'explosion des mathématiques disponible dans la rubrique de téléchargement du site).
Nous reprendrons les mots W. Jeans qui a dit une fois " le grand architecte semble être
mathématicien". Effectivement, il peut parfois nous sembler difficile (pour une raison obscure
d'une crainte non justifiée des sciences pures), bien que nous y mettions le plus de coeur
possible à l'ouvrage, de transmettre le sentiment de beauté de la nature, de sa beauté la plus
profonde et de la mécanique parfaitement huilée de l'Univers à ceux qui ne connaissent rien
aux mathématiques. Le physicien R. Feynmann a parlé une fois de "deux cultures". Nous
pensons au même titre que ces "deux cultures" séparent vraiment les gens qui ont, et ceux qui
n'ont pas eu de compréhension suffisante des mathématiques pour apprécier la nature au
moins une fois dans leur vie. Il est bien dommage qu'il y faille cependant des mathématiques
et que celles-ci aient aussi mauvaise réputation. Pour l'anecdote, on prétend qu'un roi ayant
demandé à Euclide de lui enseigner la géométrie se plaignit de sa difficulté. Euclide répondit:
"il n'y a pas de voie royale". Les physiciens et mathématiciens ne peuvent se convertir à un
autre langage. Si vous voulez apprendre à connaître la nature, à l'apprécier à sa juste valeur,
vous devez comprendre son langage. Elle ne se révèle que sous cette forme et nous ne
pouvons être prétentieux au point de lui demander de changer avant que nous ne consentions à
nous occuper d'elle.
Certes, dans le but partager ce savoir mathématique, nous concevons qu'il est paradoxal de
vouloir augmenter la liste déjà longue des ouvrages disponibles dans les bibliothèques, dans le
commerce et sur l'Internet. Si nous choisissons néanmoins de le faire, nous devons être en
mesure de présenter une argumentation solide qui justifie la création d'un tel site en
comparaison à des ouvrages comme ceux de Landau ou de Bourbaki. Voici donc les quelques
arguments qui nous paraissent cependant susceptibles d'être révélés :
1. Le grand plaisir que nous prenons à cette entreprise ("garder la main" et progresser)
31/2001
Sciences.ch 14/03/2005
mathématique
10. Présenter parmi toutes les pseudo-vérités, les seules vérités qui se démontrent
11. L'évolution des méthodes pédagogiques scolaires qui utilisent l'internet pour chercher la
solution à des problèmes de mathématiques
12. L'évolution des robots de traduction et de la puissance des ordinateurs qui feront de ce
site, nous le souhaitons, une référence mondiale dans les domaine des sciences dures
toutes langues confondues.
et aussi... le fait que tant qu'hommes de sciences, nous considérons que les résultats de la
recherche individuelle sont la propriété de l'humanité et qu'ils doivent être mis à la disposition
de tous ceux qui explorent où que ce soit les phénomènes de la nature. De cette façon le
travail de chacun profite à tous, et c'est pour toute l'humanité que s'amassent non
connaissances.
Nous ne cachons pas, au contraire, que notre contribution se limite en grande partie à ce jour à
celle de collectionneurs qui glanent leurs informations dans les ouvrages des maîtres ou dans
les publications ou pages Internet d'anonymes et qui complètent et argumentent les
développements en les améliorant quand ceci est encore possible. Ceux qui pourraient nous
accuser de plagiat devraient réfléchir au fait que les théorèmes présentés dans la plupart des
ouvrages payants et disponibles dans le commerce ont été faits par leurs illustres
prédécesseurs et que leur travail a aussi constitué, comme le notre, à mettre toutes ces
informations dans un ordre clair et moderne. De plus, il peut être vu comme douteux que l'on
fasse payer l'accès à une culture qui est certainement la seule véritablement valable et juste
dans ce bas monde.
Après avoir tenté un ordre de présentation rigoureux du sujet, nous avons décidé d'arranger ce
document dans un ordre plus pédagogique (thématique). Il est à notre avis très difficile de
parler d'un si vaste sujet dans un ordre purement mathématique en une seule vie, c'est-à-dire
lorsque les notions sont introduites une à une, à partir de celles déjà connues (où chaque
théorie, opérateur, outil, etc. n'apparaîtrait pas avant sa définition dans le document). Un tel
plan nécessiterait de couper le document, en morceaux qui ne sont plus thématiques. Nous
avons donc pris la décision de présenter les choses par ordre logique et non par ordre de
nécessité.
2. Il faut lire deux fois l'ensemble de l'ouvrage. Lors de la première lecture, on voit
l'essentiel et lors de la deuxième lecture, on comprend les détails (je félicite celui qui
32/2001
Sciences.ch 14/03/2005
Certains savent que pour chaque théorème et modèle mathématique, il existe quasiment
toujours plusieurs méthodes de démonstration. Nous avons personnellement toujours tenté de
choisir celle qui nous semblait la plus simple (par exemple en relativité il y a la présentation
algébrique et matricielle et idem en physique quantique). L'objectif étant d'arriver de toute
façon au même résultat.
Ce site étant à ses débuts, il manque forcément des vérifications de convergences (ce qui fera
grimper au plafond les mathématiciens...),de continuité et autres... ! Nous avons cependant
évité (dans le cas contraire nous faisons une autocritique) les approximations habituelles de la
physique et l'utilisation de l'analyse dimensionnelle, en y faisant recours le moins possible.
Nous essayons également d'éviter d'aborder des sujets dont les outils mathématiques n'ont pas
encore été présentés et démontrés avec rigueur.
Enfin, cet exposé n'est pas une référence et contient certainement des erreurs. Toute remarque
est donc la bienvenue. Nous nous appliquerons, dans la mesure du possible, à corriger les
erreurs signalées et à apporter les modifications nécessaires.
Nous tenons à préciser à ceux qui tenteraient de trouver par eux-mêmes les résultats de
certains développements présents sur ce site, de ne pas s'inquiéter s'ils n'y arrivent pas ou s'ils
doutent d'eux à cause du temps passé à la résolution d'une équation ou problème: certaines
théories qui nous semblent évidentes ou simples aujourd'hui, ont mis parfois plusieurs
semaines, plusieurs mois, voire plusieurs années, pour êtres élaborées par des mathématiciens
ou physiciens de renom !
Nous avons également tenté de faire en sorte que ce site soit agréable à l'oeil et à parcourir.
Les concepteurs web professionnels voudront cependant bien excuser la mauvaise qualité du
code HTML / PHP (qu'ils ne verront pas en partie..) / Javascript / CSS et l'abus de l'utilisation
du biseautage et estampage de Photoshop ainsi que le choix d'une interface optimisée pour
une résolution de 1024x768 et supérieure mais le temps nous manque pour épurer le code et
réaliser des finitions graphiques correctes (de plus, ce n'est pas vraiment le contenant qui nous
intéresse pour ce site).
Enfin, nous avons choisi d'écrire cet exposé à la première personne du pluriel ("nous").
Effectivement, la mathématique-physique n'est pas une science qui s'est faite ou évoluera
grâce à un travail individuel mais à l'aide d'une collaboration intensive entre personnes reliées
par la même passion et le même désir du Savoir. Ainsi, en faisant usage du "nous", nous
rendons hommage aux hommes de science disparus, aux contemporains et aux futurs
chercheurs pour le travail qu'ils effectueront dans le but de s'approcher de la vérité et de la
sagesse.
33/2001
Sciences.ch 14/03/2005
MÉTHODES
Ces définitions doivent servir le lecteur à utiliser les bonnes méthodes (nous parlerons des
principes de la méthode de Descartes juste après) pour résoudre des problèmes ou développer
des modèles théoriques. Effectivement, voici un tableau qui montre les différentes étapes que
nous devrions suivre lorsque nous faisons de la mathématique ou de la physique (pour les
définitions, voir plus loin) :
MATHÉMATIQUE PHYSIQUE
1. Poser "l'hypothèse", la "conjecture" la 1. Poser le ou les "problèmes" à résoudre de
"propriété" à démontrer de manière formelle manière formelle ou en langage commun (les
ou en langage commun (les hypothèses étant problèmes étant notés P1., P2, ...)
notes H1., H2., ... les conjectures CJ1.,
CJ2.,... et les propriétés P1., P2., ...))
2. Le mathématicien définit les 2. Le physicien théoricien définit les
"axiomes" (sous-entendu non-démontrables, "postulats" ou "principes" ou encore les
indépendants et non-contradictoires) qui vont "hypothèses" et "suppositions" (supposés non
donner les points de départ et établir des démontrables...) qui vont donner les points de
restrictions aux développements (les axiomes départ et établir des restrictions aux
étant notés A1., A2, ...). développements (habituellement, les
postulats et principes sont notés P1., P2, ... et
Remarque : parfois par abus, "propriétés", les hypothèses H1., H2., ... en essayant
"conditions" et "axiomes" sont confondus d'éviter pour les postulats et principes, une
alors que le concept d'axiome est beaucoup confusion possible avec l'énoncé du ou des
plus profond. problèmes qui sont notés de la même
manière).
Dans la même idée, le mathématicien définit
le vocabulaire spécialisé relié à des
opérateurs mathématiques qui seront notés
par D1., D2., D3., ...
3. Des axiomes posés, le mathématicien peut 3. Une fois le "modèle théorique" développé,
en tirer directement des "lemmes" ou des le physicien théoricien doit vérifier les
"propriétés" dont la validité découle équations dimensionnelles pour vérifier une
directement des axiomes et qui préparent au possible erreur dans ses développements (ces
développement du théorème censé valider vérifications étant notées VA1., VA2, ...).
l'hypothèse ou la conjecture de départ (les
lemmes étant notés L1., L2., ... et les
propriétés P1., P2.,...).
4. Une fois le ou les "théorèmes" (notés T1., 4. Le physicien théoricien peut chercher les
T2., ...) démontrés et le ou les hypothèses cas limites (dont les "singularités" font
validées, le mathématicien peut en tirer des parties) de son modèle en vérifier la validité
"corollaires" (notés C1., C2., ...) et encore des intuitive (ces contrôles aux limites étant notés
propriétés (notées P1., P2., P3.,...). CL1., CL2., ...)
5. Le mathématicien peut tester la force ou 5. Le physicien de laboratoire (ou
l'utilité de sa ou ses conjectures ou phénoménologique) teste expérimentalement
34/2001
Sciences.ch 14/03/2005
Procéder comme dans le tableau ci-dessus est LA bonne méthode à suivre pour travailler en
mathématique et physique. Évidemment, procéder de façon propre et traditionnelle comme ci-
dessus prend un petit plus de temps qu'en faisant un peu n'importe quoi, n'importe comment
(c'est pour cela que la plupart des professeurs ne suivent pas ces règles, le temps leur manque
cruellement pour parcourir tout le programme scolaire).
Pour l'instant le présent site Internet ne suit pas (non plus) totalement ces règles
fondamentales mais cela changera avec le temps (qui nous manque... sic!).
Profitons de l'occasion ceci étant dit, de présenter les quatre principes de la méthode de
Descartes :
P1. Ne recevoir jamais aucune chose pour vraie que je ne la connusse évidemment être telle;
c'est-à-dire, d'éviter soigneusement la précipitation et la prévention, et de ne comprendre rien
de plus en mes jugements que ce qui se présenterait si clairement et si distinctement à mon
esprit, que je n'eusse aucune occasion de le mettre en doute.
P2. De diviser chacune des difficultés que j'examinerais, en autant de parcelles qu'il se
pourrait, et qu'il serait requis pour les mieux résoudre.
P3. De conduire par ordre mes pensées, en commençant par les objets les plus simples et les
plus aisés à connaître, pour monter peu à peu comme par degrés jusques à la connaissance des
plus composés, et supposant même de l'ordre entre ceux qui ne se précèdent point
naturellement les uns les autres.
P4. Et le dernier, de faire partout des dénombrements si entiers et des revues si générales, que
je fusse assuré de ne rien omettre.
Remarques :
R1. le mathématicien aime parfois bien terminer ses démonstrations (quand il pense qu'elles
sont justes) par l'abréviation c.q.f.d. qui signifie "ce qu'il fallait démontrer" ou encore dans les
hautes écoles par souci d'esthétisme certains professeurs (et mêmes élèves) notent cela en
latin q.e.d. qui signifie "quod erat demonstrandum" (cela en jette...).
R2. Lors des définitions (elles sont nombreuses en mathématiques...) le mathématicien fait
souvent usage des terminologies suivantes :
35/2001
Sciences.ch 14/03/2005
Les 4 sont équivalentes (identiques au sens strict) nous en ferons usage en fonction de
l'humeur...
R3. Le lecteur s'habituera petit à petit aux nécessités de précision ou, au contraire, aux
habitudes/usages d'imprécision et d'abus de langage sous lesquels tout texte mathématique
serait pédant et/ou illisible.
Le tableau méthodique précédent contient des termes qui peuvent peut-être vous sembler
inconnus ou barbares. C'est la raison pour laquelle il nous semble important, voir fondamental
de présenter les définitions de ces derniers, ainsi que de quelques autres tout aussi importants :
Définitions
D1. Le mot "science" vient du latin "scienta" (connaissance) dont la racine est "scire" qui veut
dire "savoir".
Il est important que nous définissions rigoureusement les différents types de sciences
auxquelles l'être humain fait souvent référence. Effectivement, il semble qu'au 21e siècle un
abus de langage malsain s'instaure et qu'il ne devient plus possible pour la population de
distinguer la "qualité intrinsèque" d'une science d'une autre.
Cet abus de langage vient probablement du fait que plus les sciences pures et exactes perdent
leurs illusions d'universalité et d'objectivité, dans le sens où elles s'auto-corrigent. Ceci ayant
pour conséquence que certaines sciences sont reléguées au second plan et tentent d'en
emprunter les méthodes, les principes et les origines pour créer une confusion quant à leurs
distinctions.
D2. Nous définissons par "science pure", tout ensemble de connaissances fondées sur un
raisonnement rigoureux valable quel que soit le facteur (arbitraire) élémentaire choisi (nous
disons alors "indépendant de la réalité sensible") et restreint au minimum nécessaire. Il n'y a
que la mathématique (appelée souvent "reine des sciences") qui peut être classifiée dans cette
catégorie.
D3. Nous définissons par "science exacte" ou "science dure", tout ensemble de connaissances
fondées sur l'étude d'une observation, observation qui aura été transcrite sous forme
symbolique (physique théorique).
Remarque : les deux définitions précédentes sont souvent incluses dans la définiton de
"sciences déductives"
D4. Nous définissons par "science de l'ingénieur", tout ensemble de connaissances théoriques
ou pratiques appliquées aux besoins de la société humaine tels que : l'électronique, la chimie,
l'informatique, les télécommunications, la robotique, l'aérospatiale, biotechnologies...
36/2001
Sciences.ch 14/03/2005
D5. Nous définissons par "science" tout ensemble de connaissances fondées sur des études ou
observations de faits dont l'interprétation n'a pas encore été retranscrite ni vérifiée par la
rigueur mathématique mais qui applique des raisonnements comparatifs statistiques. Nous
incluons dans cette définition: la médecine (il faut prendre garde au fait que certaines partie de
la médecine étudie des phénomènes retranscrits sous forme mathématique tel que les réseaux
de neurones ou autres phéonèmnes associés à des causes physiques connues), la sociologie, la
psychologie, l'histoire, la biologie...
D6. Nous définissons par "science molle" tout ensemble de connaissances ou de pratiques qui
sont actuellement fondées sur des faits invérifiables (non reproductibles scientifiquement) ni
par l'expérience, ni par la mathématique. Nous incluons dans cette définition: l'astrologie, la
théologie, le paranormal (zététique), la graphologie...
En ce qui concerne les hommes de science..., Albert Einstein en avait une idée très arrêtée
mais que nous trouvons intéressante d'exposer (certains peut-être s'y reconnaîtront). Ainsi, les
vrais scientifiques, "individus bizarres, solitaires et renfermés" selon lui, sont nécessairement
des théoriciens - l'idée de devoir inventer des objets pour raffiner l''existence de ses
contemporains lui était "intolérable". Il travaillent dans l'abstraction, de préférence seuls, en
évitant si possible de faire de la science leur gagne-pain; juste une fructueuse activité annexe,
comme cela a été le cas pour lui à Berne (Suisse). Ils se doivent d'être sourds aux appels de la
chair et de l'estomac, l'un des motifs les ayant poussés à s'adonner à cette activité ardue,
solitaire et non rémunérée étant, d'après Einstein, le besoin irrésistible de "s'évader hors de la
vie quotidienne , de sa douloureuse grossiérété et de sa et de sa désolante monotonie, hors des
entraves de nos propres désirs éternellement changeants". Lui-même a toujours considéré les
basses aspirations humaines - réussite sociale, propriété, luxe - "comme méprisables, depuis
tout petit".
Ce portrait de savant en moine autiste correspond presque trait pour trait à celui du terrifiant
grand ancêtre, Isaac Newton. Isaac Newton était un parfait autodidacte, qui a défriché seul les
domaines du savoir dans lesquels il a brillé. Einstein a eu d'excellents professeurs mais a
butiné à sa guise les matières et les sujets qui l'intéressaient. Newton n'a jamais eu ni maître,
ni collègue, ni complice, ni élève ou assistant d'aucune sorte et ses théories sont toutes
casquées de son unique cerveau. Einstein a accouché seul (en s'inspirant de travaux existants)
de la théorie de la relaitivté restreinte et s'est engagé seul dans la voie de la relativité générale
(en parallèle et en concurrence avec David Hilbert), ne se résignant à appeler l'aide de son ami
le mathématicien Marcel Grossmann que lorsqu'il s'est trouvé devant un mur.
D7. Le "scientisme" est la doctrine fondamentale suivant laquelle il n'y a de vérité que dans la
science.
Ce qui est intéressant dans cette doctrine, c'est que c'est certainement une des seules qui
demande aux gens de devoir réfléchir par eux-mêmes et de comprendre l'environnement qui
les entoure en remettant continuellement tout en question et sans ne jamais rien accepter
comme acquis (...)
D8. Au-delà de son sens négatif, l'idée de "problème" renvoie à la première étape de la
démarche scientifique. Formuler un problème est ainsi essentiel à sa résolution et permet de
comprendre correctement ce qui fait problème et de voir ce qui doit être résolu.
Le concept de "problème" est intimement relié au concept "d'hypothèse" dont nous allons voir
la définition ci-dessous.
37/2001
Sciences.ch 14/03/2005
D9. Une "hypothèse" est toujours, dans le cadre d'une théorie déjà constituée ou sous-jacente,
une supposition en attente de confirmation ou d'infirmation qui tente d'expliquer un groupe de
faits ou de prévoir l'apparition de faits nouveaux.
Ainsi, une hypothèse peut-être à l'origine d'un problème théorique qu'il faudra formellement
résoudre.
Nous nous permettrons au passage de citer Gauss (voir la page des biographies):
"La méthode de l’hypothèse en Science théorique suppose que contrairement aux sciences
expérimentales, que les soi-disant données sensorielles sont totalement trompeuses. Rien de
ce que l’on peut voir, entendre, sentir, toucher goûter n’est ce qu’il a l’air d’être. Formuler
une telle idée n’est cependant que la première étape du travail de la méthode de l’hypothèse. Il
faut avoir une croyance passionnée - dans un sens proche de la véritable signification du mot '
Foi ' en la réalité d’une simple idée de ce genre. Ce n’est que si elle est guidée par une telle
passion, par un amour de l’idée, qu’une personne peut trouver la motivation nécessaire pour la
pousser d’avantage."
L'équivalent mathématique (mais en plus rigoureux) du postulat est "l'axiome" dont nous
verrons la définition plus loin.
D11. un "principe" (parent proche du "postulat") est donc une proposition admise comme base
d'un raisonnement ou une règle générale théorique qui guide la conduite des raisonnements
qu'il faudra effectuer.
Remarque: le mot "principe" est utilisé avec abus dans les petites classes ou écoles
d'ingénieurs par les professeurs ne sachant (ce qui est très rare), ou ne voulant (plutôt
fréquent), ou ne pouvant faute de temps (quasi exclusivement), pas démontrer une relation.
D12. Un "axiome" est une vérité (pas forcément vraie) évidente par elle-même
D13. Un axiome est une proposition générale dont l'admission est nécessaire pour établir une
démonstration
Remarque : Les axiomes doivent toujours êtres indépendants entre eux (on ne peut démontrer
un à partir de l'autre), non contradictoires (ils ne doivent pas se contredire - nous disons
également parfois qu'ils doivent être "consistants").
38/2001
Sciences.ch 14/03/2005
dire qu'un corollaire est une conséquence nécessaire et évidente d'un postulat (par exemple).
D15. Un "lemme" constitue une proposition déduite d'un ou de plusieurs postulats ou axiomes
et dont la démonstration prépare celle d'un théorème.
Remarque : Le concept de lemme est lui aussi (et c'est malheureux) quasi réservé aux
mathématiques.
D16. une "conjecture" constitue une supposition ou opinion fondée sur des probabilités d'un
résultat mathématique qui découle souvent d'un lemme.
D17. par-delà son sens faible de conjecture, une "théorie" est un ensemble articulé autour
d'une hypothèse et étayé par un ensemble de faits qui lui confèrent un contenu positif et
rendent l'hypothèse bien fondée.
D18. une "singularité" est une "indétermination" d'un calcul qui intervient par l'apparition
d'une division par le nombre zéro. Ce terme est aussi bien utilisé en mathématique qu'en
physique.
39/2001
Sciences.ch 14/03/2005
THÉORIE DE LA DÉMONSTRATION
2. Démontrer qu'une démonstration est indépendante du langage utilisé (ce qui étonnera les
réticents aux résultats théoriques souvent dits "déraisonnables" de la physique-mathématique)
Effectivement, quand un étudiant arrive dans une classe, quel que soit le niveau de cette
dernière, il a surtout appris à calculer, à utiliser des algorithmes. Il a très peu appris à
raisonner. Pour tous les raisonnements, le support visuel est fort, et les personnes qui ne
"voient pas" qu'en traçant telle ou telle courbe droite la solution apparaît ou qui ne "voient
pas" dans l'espace sont très pénalisés.
Au lycée ("collège" pour certains ou "gymnase" pour les autres), on manipule déjà des objets
"inconnus", mais c'est surtout pour faire des calculs, et quand on raisonne sur des objets
représentés par des lettres, on peut remplacer "visuellement" par un réel, un vecteur, etc. A
partir d'un certain niveau, on demande aux personnes de raisonner sur des structures plus
abstraites, et donc de travailler sur des objets inconnus qui sont des éléments d'un ensemble
lui-même inconnu, par exemple les éléments d'un groupe quelconque. Ce support visuel
n'existe alors plus.
Nous demandons aux étudiants de raisonner, de démontrer des propriétés, mais personne ne
leur a jamais appris à raisonner convenablement, à écrire des preuves. Si nous demandonsà un
étudiant de licence de mathématiques ce qu'est une démonstration, il a quelque difficulté à
répondre. Il peut dire que c'est un texte dans lequel on trouve des "mots clés": "donc", "parce
que", "si", "si et seulement si", "prenons un tel que", "supposons que", "cherchons une
contradiction", etc. Mais il est incapable de donner la grammaire de ces textes ni même ces
rudiments, et d'ailleurs, ses enseignants, s'ils n'ont pas suivi de cours, en seraient
probablement incapables.
Pour parler un enfant n'a pas besoin de connaître la grammaire. Il imite son entourage et cela
marche très bien: un enfant de six ans sait utiliser des phrases déjà compliquées quant à la
structure grammaticale sans avoir jamais fait de grammaire. La plupart des enseignants ne
connaissent pas non plus la grammaire du raisonnement mais, chez eux, le processus
40/2001
Sciences.ch 14/03/2005
Tant que le degré de complexité est faible (notamment lors d'un raisonnement de type
"équationnel"), la grammaire ne sert à rien, mais quand il augmente ou quand on ne comprend
pas pourquoi quelque chose est faux, il devient nécessaire de faire un peu de grammaire pour
pouvoir progresser. Les enseignants et les étudiants connaissent bien la situation suivante:
dans un devoir, le correcteur a barré toute une page d'un grand trait rouge et mis "faux" dans
la marge. Quand l'étudiant demande ce qui est faux, le correcteur ne peut que dire des choses
du genre "ça n'a aucun rapport avec la démonstration demandée", "rien n'est juste", …, ce qui
n'aide évidemment pas l'étudiant à comprendre. Cela vient en partie, du fait que le texte rédigé
par l'étudiant utilise les mots voulus mais dans un ordre plus ou moins aléatoire et qu'on ne
peut donner de sens à l'assemblage de ces mots. De plus, l'enseignant n'a pas les outils
nécessaires pour pouvoir expliquer ce qui ne va pas. Il faut donc les lui donner!
Ces outils existent mais sont assez récents. La théorie de la démonstration est une branche de
la logique mathématique dont l'origine est la crise des fondements : il y a eu un doute sur ce
que nous avions avait le "droit" de faire dans un raisonnement mathématique (voir la "crise
des fondements" plus loin). Des paradoxes sont apparus. Par exemple (ce paradoxe est connu
sous le nom de "paradoxe de Russel") : soit l'ensemble des ensembles ne se contenant pas
eux-mêmes. Il est facile de montrer que appartient à si et seulement si n'appartient
pas à , ce qui est manifestement une contradiction. Il a alors été nécessaire de préciser les
règles de démonstration et de vérifier que ces règles ne sont pas contradictoires . Cette théorie
est apparue il y a environ un siècle, ce qui est très peu puisque l'essentiel des mathématiques
enseignées en première moitié de l'université est connu depuis deux ou trois cents ans.
Cet essai traite de la façon la plus actuelle de comprendre la relation entre les mathématiques
et la connaissance empirique. Il se concentre sur deux questions :
2. Sinon, comment se fait-il que l’abstraction mathématique semble souvent avoir une telle
puissance prédictive dans le monde réel ?
Eric S. Raymond l'a écrit le 14 mai 1993 pour la liste de discussion des Extropians, et je la
republié avec des changements mineurs en 2001 à la demande d’un correspondant qui l’avait
41/2001
Sciences.ch 14/03/2005
Voici le texte :
Pour les premiers Grecs, la géométrie était considérée comme la forme la plus haute du
savoir, une puissante clé pour les mystères métaphysiques de l’univers. Elle était plutôt une
croyance mystique, et le lien entre le mysticisme et la religion était rendu explicite dans des
cultes comme ceux des Pythagoriciens. Aucune culture n’a depuis déifié un homme pour
avoir découvert un théorème géométrique! Plus tard, les mathématiques furent considérées
comme le modèle d’une connaissance a priori dans la tradition aristotélicienne du
rationalisme.
L’étonnement des Grecs pour les mathématiques ne nous a pas quitté, on le retrouve sous la
traditionnelle métaphore des mathématiques comme "Reine des Science". Il s’est renforcé
avec les succès spectaculaires des modèles mathématiques dans la science, succès que les
Grecs (ignorant même la simple algèbre) n’avaient pas prévus. Depuis la découverte par Isaac
Newton du calcul intégral et de la loi du carré inverse de la gravité, à la fin des années 1600,
les sciences phénoménales et les plus hautes mathématiques étaient restées en étroite
symbiose - au point qu’un formalisme mathématique prédictif était devenu le signe distinctif
d’une "science dure".
Après Newton, pendant les deux siècles qui suivirent, la science aspira à ce genre de rigueur
et de pureté qui sembraient inhérentes aux mathématiques. La question métaphysique
semblait simple ; les mathématiques possédaient une connaissance a priori parfaite, et parmi
les sciences, celles qui étaient capables de se mathématiser le plus parfaitement étaient les
plus efficaces pour la prédiction des phénomènes . La connaissance parfaite consistait donc
dans un formalisme mathématique qui, une fois atteint par la science et embrassant tous les
aspects de la réalité, pouvait fonder une connaissance empirique a postériori sur une logique
rationnelle a priori. Ce fut dans cet esprit que Condorcet entreprit d’imaginer la description de
l’univers entier comme un ensemble d’équation différentielles partielles se résolvant les unes
par les autres.
La première faille dans cette image inspiratrice apparut dans la seconde moitié du 19ème
siècle, quand Riemann et Lobachevsky prouvèrent séparément que l’axiome des parallèles
d’Euclides pouvait être remplacé par d’autres qui produisaient des géométries
"consistantes" (on reviendra sur ce terme plus loin). La géométrie de Riemann prenait modèle
sur une sphère, celle de Lobachevsky, sur la rotation dun hyperboloïde.
L’impact de cette découverte a été obscurci plus tard par de grands chamboulements, mais sur
le moment, il fut un coup de tonnerre dans le monde intellectuel. L’existence de systèmes
axiomatiques mutuellement inconsistants, et dont chacun pouvait servir de modèle à l’univers
phénoménal, remettait entièrement en question la relation entre les mathématiques et la
théorie physique.
Quand on ne connaissait qu’Euclide, il n’y avait qu’une géométrie possible. On pouvait croire
que les axiomes d’Euclide constituaient un genre de connaissance parfaite a priori sur la
géométrie dans le monde phénoménal. Mais soudain, nous avons eu trois géométries,
embarrassantes pour les subtilités métaphysique.
42/2001
Sciences.ch 14/03/2005
devenir empirique, basé sur leur pouvoir prédictif dans une situation donnée.
Bien sûr, Les théoriciens de la physique ont longtemps été habitués à choisir des formalismes
pour poser un problème scientifique. Mais il était admis largement, si ce n’est
inconsciemment, que la nécessité de procéder ainsi ad hoc était fonction de l’ignorance
humaine, et, qu’avec de la logique ou des mathématiques assez bonnes, on pouvait déduire le
bon choix à partir de premiers principes, et produire des descriptions a priori de la réalité, qui
devaient être confirmées après coup par une vérification empirique.
Cependant, la géométrie euclidienne, considérée pendant deux cents ans comme le modèle de
la perfection axiomatique des mathématiques, avait été détrônée. Si l’on ne pouvait connaître
a priori quelque chose d’aussi fondamental que la géométrie dans l’espace, quel espoir restait-
il pour une pure théorie "rationnelle" qui embrasserait la totalité de la nature ?
Psychologiquement, Riemann et lobachevsky avaient frappé au cœur de l’entreprise
mathématique telle qu’elle avait été conçue jusqu’alors.
La majorité des mathématiciens devinrent rapidement des "formalistes", soutenant que les
mathématiques pures ne pouvaient qu’être considérées philosophiquement comme une sorte
de jeu élaboré qui se jouait avec des signes sur le papier (c’est la théorie qui sous-tend la
prophétique qualification des mathématiques de "système à contenu nul" par Robert
Heinlein). La croyance "platonicienne" en la réalité nouménale des objets mathématiques, à
l’ancienne manière, semblait bonne pour la poubelle, malgré le fait que les mathématiciens
continuaient à se sentir comme les platoniciens durant le processus de découverte des
mathématiques.
43/2001
Sciences.ch 14/03/2005
Ceci nous emmène au début du vingtième siècle. Pour la minorité assiégée des platoniciens, le
pire était encore à venir. Cantor, Frege, Russell et Whitehead montrèrent que toutes les
mathématiques pures pouvaient être construites sur le simple fondement axiomatique de la
théorie des ensembles. Cela convenait parfaitement aux formalistes ; les mathématiques se
réunifiaient, du moins en principe, à partir d’un faisceau de petits jeux détachés d’un grand.
Les platoniciens aussi étaient satisfaisaits ; s’il en survenait une grande structure, clé de voûte
consistante pour toutes les mathématiques, la spécificité métaphysique des mathématiques
pouvait encore être sauvée. Malheureusement, il s’avère qu’il existe plus d’une façon
d’axiomatiser la théorie des ensembles. En particulier, il y a au moins quatre façons
différentes de combiner les propositions sur les ensembles infinis, qui conduisent à des
théories des ensembles qui s’excluent (l’axiome de choix ou sa négation, l’hypothèse de
continuité ou sa négation.)
D’une façon négative, pourtant, un platonicien eut le dernier mot. Kurt Godel mit son grain de
sable dans le programme formaliste d’axiomatisation quand il démontra que tout système
d’axiomes assez puissant pour inclure les entiers devait être soit inconsistant (contenir des
contradictions) soit incomplet (trop faible pour décider de la justesse ou de la fausseté de
certaines affirmations du système). Et c’est plus ou moins où en sont les choses aujourd’hui.
Les Mathématiciens savent que de nombreuses tentatives pour faire avancer les
mathématiques comme une connaissance a priori de l’univers doivent se heurter à de
nombreux paradoxes et à l’impossibilité de décider quel système axiomatique décrit les
mathématiques "réelles". Ils ont été réduits à espérer que les axiomatisations standard ne
soient pas inconsistantes mais incomplètes, et à se demander anxieusement quelles
contradictions ou quels théorèmes indémontrables attendent d’être découverts ailleurs, cachés
comme des champs de mines dans la noosphère.
44/2001
Sciences.ch 14/03/2005
Mais pourquoi existe-t-il seulement de bons choix de modèle mathématique ? C’est à dire,
pourquoi y a-t-il un formalisme mathématique, par exemple pour la physique quantique, si
productif qu’il prédit réellement la découverte de nouvelles particules observables ?
Pour "répondre" à cette question on observera qu’elle peut, aussi bien, fonctionner comme
une sorte de définition. Pour beaucoup de système phénoménaux, de tels formalismes
prédictifs exacts n’ont pas été trouvés, et aucun ne semble plausible. Les poètes aiment
marmonner sur le cœur des hommes, mais on peut trouver des exemples plus ordinaires : le
climat, où le comportement d’une économie supérieure à celle d’un village, par exemple -
systèmes si chaotiquement interdépendants que la prédiction exacte est effectivement
impossible (pas seulement dans les faits mais en principe).
RAISONNEMENT HYPOTHETICO-DEDUCTIF
45/2001
Sciences.ch 14/03/2005
La procédure déductive consiste à tenir pour vrai, à titre provisoire, cette proposition première
qu’on appelle, en logique le prédicat et à en tirer toutes les conséquences logiquement
nécessaires, c'est-à-dire à en rechercher les implications.
LOGIQUE PROPOSITIONNELLE
Ceci est un préliminaire absolument indispensable pour aborder une formation en sciences,
philosophie, droit, politique, économie, etc.
PROPOSITIONS
Définition : En logique (du premier ordre), une "proposition" est une affirmation qui a un
sens. Cela veut dire que l'on peut dire sans ambiguïté si cette affirmation est vraie ( ) ou
fausse ( ). C'est ce que l'on appelle le "principe du tiers exclu".
46/2001
Sciences.ch 14/03/2005
"Je mens" n'est pas une proposition. Si l'on suppose que cette affirmation est vraie, elle est
une affirmation de sa propre invalidité, donc nous devrions conclure qu'elle est fausse. Mais si
nous supposons qu'elle est fausse, alors l'auteur de cette affirmation ne ment pas, donc il dit la
vérité, aussi la proposition serait vraie.
Une proposition en logique binaire n'est donc jamais vraie et fausse à la fois. C'est que l'on
appelle le "principe de non-contradiction".
Ainsi, une propriété d'une proposition de l'ensemble des propositions est une application
de dans l'ensemble des "valeurs de vérité" :
Exemple:
Définition : Soit une propriété sur l'ensemble . Une propriété sur est une
"négation" de si et seulement si, pour tout :
- est si est
- est si est
Nous pouvons rassembler ces conditions dans une table dite "table de vérité":
En d'autres termes, et ont toujours des valeurs de vérité "contraires". Nous noterons ce
genre d'énoncé " est une négation de " (à ne pas confondre avec la moyenne):
CONNECTEURS
47/2001
Sciences.ch 14/03/2005
Il est facile de se convaincre que, si les parties de sont respectivement associées aux
propriétés que (voir théorie des ensembles) est associé à .
Le connecteur est associatif. Pour s'en convaincre, il suffit de faire une table vérité où nous
vérifions que:
Il existe également le connecteur pour "et" tel que soient deux propriétés définies sur
, est une propriété sur définie par :
48/2001
Sciences.ch 14/03/2005
associées aux propriétés que (voir théorie des ensembles) est associé à .
Le connecteur est associatif. Pour s'en convaincre, il suffit aussi de faire une table vérité où
nous vérifions que:
Les connecteurs sont distributifs l'un sur l'autre. A l'aide d'une simple table de vérité,
nous prouvons que:
ainsi que:
A nouveau, ces propriétés peuvent se démontrer par une simple table de vérité.
Soient deux propriétés sur . est une propriété sur définie par:
49/2001
Sciences.ch 14/03/2005
Parmi tous les cas, un seul correspond à une promesse non tenue: celui où l'enfant à son
diplôme, et n'a toujours pas d'ordinateur.
Et le cas où il n'a pas le diplôme, mais reçoit quand même un ordinateur? Il est possible qu'il
ait été longtemps malade et a raté un semestre, et le père a le droit d'être bon.
Que signifie cette promesse, que nous écrirons aussi : "Tu as ton diplôme je t'achète un
ordinateur" ? Exactement ceci:
- Si tu as ton diplôme, c'est sûr, je t'achète un ordinateur (je ne peux pas ne pas l'acheter)
signifie bien " et ont toujours la même valeur de vérité" ou encore " et
sont équivalents". C'est vrai si et ont même valeur, faux dans tout cas contraire.
Bien évidemment :
Si , nous pouvons dire que pour que soit vraie, il suffit que soit vraie. Donc
est une condition suffisante de . D'un autre côté, signifie . Donc, si
50/2001
Sciences.ch 14/03/2005
est fausse, il est impossible que soit vraie. Donc finalement est une condition
nécessaire de .
Les conditions de type "nécessaire et suffisant" peuvent être reformulés avec les termes "si",
"seulement si", "si et seulement si". Ainsi :
peut être énoncé: est vraie si est vraie. Mais si n'est pas vraie, ne peut
être vraie, donc: est vraie si et seulement si est vraie.
QUANTIFICATEURS
- le quantificateur universel:
- le quantificateur existentiel:
Lire: "pour tout élément de , est vraie", ou encore "pour tout élément de , a
la propriété ", ou encore "chaque élément de à la propriété "
Lire: "Il existe (au moins un) élément de , tel que est vraie", ou encore "il existe
(au moins un) élément de de , ayant la propriété .
Remarque: nous utilisons parfois le symbole pour dire brièvement : "Il existe un et un
seul":
Nous allons voir que la théorie de la démonstration et des ensembles, est l'exacte transcription
des principes et résultats de la Logique (celle avec un "L" majuscule").
GRAMMAIRE
51/2001
Sciences.ch 14/03/2005
En "logique du premier ordre" et, en particulier, en théorie de la démonstration, les objets que
nous étudions sont les formules et leurs démonstrations. Il faut donc donner une définition
précise de ce que sont ces notions. Les termes et les formules forment la grammaire d'une
langue, simplifiée à l'extrême et calculée exactement pour dire ce que l'on veut sans ambiguïté
et sans détour inutile (contrairement aux langues courantes).
Les "termes", ils désignent les objets dont on veut prouver des propriétés (nous reviendrons
un peu plus loin beaucoup plus en détail sur ces derniers) :
- En algèbre, les termes désignent les éléments d'un groupe (ou anneau, corps, espace
vectoriel, etc.). Nous manipulons aussi des ensembles d'objets (sous-groupe, sous-espace
vectoriel, etc). Les termes qui désignent ces objets, d'un autre type, seront appelés "termes du
second ordre".
- En analyse, les termes désignent les réels ou (par exemple, si nous nous placons dans des
espaces fonctionnels) des fonctions.
Les "formules", elles représentent les propriétés des objets que nous étudions (nous
reviendrons également beaucoup plus en détail sur ces dernières) :
- En algèbre, nous pourrons écrire des formules pour exprimer que deux éléments commutent,
qu'un sous-espace vectoriel est de dimension 3, etc.
- En analyse, nous écrirons des formules pour exprimer la continuité d'une fonction, la
convergence d'une suite, etc.
- En théorie des ensembles, les formules pourront exprimer l'inclusion de deux ensembles,
l'appartenance d'un élément à un ensemble,…
Les "démonstrations" :
Elles permettent d'établir qu'une formule est vraie. Le sens précis de ce mot aura lui aussi
besoin d'être défini. Plus exactement, elles sont des déductions sous hypothèses, elles
permettent de "mener du vrai au vrai", la question de la vérité de la conclusion étant alors
renvoyée à celle des hypothèses, laquelle ne regarde pas la logique mais repose sur la
connaissance que nous avons des choses dont nous parlons.
Il faut prendre garde en théorie de la démonstration à ne pas mélanger le niveau où vivent les
termes, les formules et les démonstrations, qui sont les objets de notre étude, et le niveau
"méta" où nous énoncons et prouvons les propriétés de ces objets. Dans cette même théorie
nous réservons également, dans la plupart des cas, la notation symbolique au niveau objet. Par
exemple, nous n'utiliserons pas l'abréviation pour "pour tout" au niveau méta.
LANGAGES
52/2001
Sciences.ch 14/03/2005
par les symboles utilisés. La définition ci-dessous exprime simplement qu'il suffit de donner
la liste de ces symboles pour préciser le langage.
Définition : un langage est la donnée d'une famille (pas nécessairement finie) de symboles.
On en distingue trois sortes (symboles, termes et formules).
Remarques :
R1. Nous utilisons quelquefois le mot "vocabulaire" ou le mot "signature" à la place du mot
"langage".
R2. Le mot "prédicat" peut être utilisé à la place du mot "relation". On parle alors de "calcul
des prédicats" au lieu de "logique du premier ordre" (ce que nous avons étudié
précédemment).
SYMBOLES
- les "symboles de fonction". A chaque symbole est associé un entier strictement positif qu'on
appelle son "arité": c'est le nombre d'arguments de la fonction. Si l'arité est 1 (resp. 2, …, ),
on dit que la fonction est unaire (resp. binaire, …, -aire)
- les "symboles de relation". De la même manière, à chaque symbole est associé un entier
positif ou nul (son arité) qui correspond à son nombre d'arguments et on parle de relation
unaire, binaire, -aire.
Remarques:
R2. nous considèrons (sauf mention contraire) que chaque langage contient le symbole de
relation binaire = (lire "égal") et le symbole de relation (à ne pas confondre avec le symbole
de connection) à zéro argument dénoté (lire "bottom" ou "absurde") qui représente le faux.
Dans la description d'un langage, nous omettrons donc souvent de les mentionner. Le symbole
est souvent redondant. Nous pouvons en effet, sans l'utiliser, écrire une formule qui est
toujours fausse. Il permet cependant de représenter le faux d'une manière canonique et donc
d'écrire des règles de démonstration générales.
R3. Le rôle des fonctions et des relations est très différent. Comme nous le verrons plus loin,
les symboles de fonction sont utilisés pour construire les termes (les objets du langage) et les
symboles de relation pour construire les formules (le propriétés de ces objets).
Dans toute la suite, nous nous donnerons un ensemble infini de variables. Les variables
seront notées comme il l'est par tradition : (éventuellement indexées: ).
TERMES
Les termes (nous disons aussi "termes du premier ordre") représentent les objets associés au
53/2001
Sciences.ch 14/03/2005
langage. Formellement
Définitions :
Soit un langage:
D1. l'ensemble des termes sur est le plus petit ensemble contenant les variables et
constantes obtenues par l'application des symboles de fonctions à des termes.
D3. Pour obtenir une définition plus formelle, nous pouvons écrire : où est une
variable ou un symbole de constante et, pour tout , où
est une fonction d'arité (rappelons que l'arité est le nombre d'arguments de la fonction).
D4. nous appellerons hauteur d'un terme le plus petit tel que
Remarques :
R1. la définition D4 signifie que les variables et les constantes sont des termes et que si est
un symbole de fonction -aire et sont des termes alors est un terme en soi
aussi. L'ensemble des termes est défini par la grammaire:
Cette expression se lit de la manière suivante : un élément de l'ensemble que nous sommes
en train de définir est soit un élément de (variables), soit un élément de (l'ensemble des
symboles de constantes), soit l'application d'un élément à éléments de .
Attention : le fait que soit de la bonne arité est seulement implicite dans cette notation. De
plus, l'écriture ne signifie pas que tous les arguments d'une fonction sont
identiques mais simplement que ces arguments sont des éléments de .
R2. il est souvent commode de voir un terme comme un arbre dont chaque nœud est étiqueté
par un symbole de fonction et chaque feuille par une variable ou une constante.
Dans la suite, nous allons sans cesse définir des notions (ou prouver des résultats) "par
récurrence" sur la structure ou la taille d'un terme.
R3. pour prouver une propriété sur les termes, il suffit de prouver pour les variables et
les constantes et de prouver à partir de . Nous faisons ainsi ici
une preuve "par induction" sur la "hauteur" d'un terme.
R4. Pour définir une fonction sur les termes, il suffit de la définir sur les variables et les
54/2001
Sciences.ch 14/03/2005
La taille (nous disons aussi la "longueur") d'un terme (notée ) est le nombre de
symboles de fonction apparaissant dans . Formellement:
Remarque: la preuve par induction sur la hauteur d'un terme sera souvent insuffisante. Nous
pourrons alors prouver une propriété sur les termes en supposant la propriété vraie pour
tous les termes de taille et en la démontrant ensuite pour les termes de taille . Il
s'agira alors d'une preuve par récurrence sur la taille du terme.
LES FORMULES
Les formules sont construites à partir des formules dites "atomiques" en utilisant des
"connecteurs" et des "quantificateurs". Nous utiliserons les connecteurs et les quantificateurs
suivants (certains nous sont déjà connus) :
- connecteurs binaires: qui se lit "et", qui se lit "ou", qui se lit "implique" ou
"flèche"
Cette notation des connecteurs est standard (elle devrait du moins). Elle est utilisée pour éviter
les confusions entre les formules et le langage courant (le métalangage).
Définition : soit un langage. Les formules "atomiques" de sont les formules de la forme
où est un symbole de relation -aire de et sont des termes de .
Nous notos "Atom" l'ensemble des formules atomiques. Si nous notons l'ensemble des
symboles de relation, nous pouvons écrire:
L'ensemble des formules de la logique du premier ordre de est défini par la grammaire
(où est une variable):
où il faut lire : l'ensemble des formules est le plus petit ensemble contenant les formules et tel
que si et sont des formules alors , etc. sont des formules.
55/2001
Sciences.ch 14/03/2005
Nous ferons attention à ne pas confondre termes et formules. est un terme, est
une formule. Mais n'est rien : nous ne pouvons ne pouvons, en effet, mettre
un connecteur entre un terme et une formule (aucun sens).
Définitions:
D1. une sous-formule d'une formule est l'un de ses "composants", in extenso une formule à
partir de laquelle est construite. Formellement, nous définissons l'ensemble des
sous formules par:
- Si est atomique,
- Si avec
- Si ou avec
D3. la taille (ou la longueur) d'une formule (notée ) est le nombre de connecteurs ou
de quantificateurs apparaissant dans . Formellement:
- avec
D4. l'opérateur principal (nous disons aussi le "connecteur principal") d'une formule est défini
par :
Voyons d'abord en quoi consiste une variable "libre", "liée", ou encore "muette" avant d'en
définir les propriétés.
D5A. une "variable muette" est par définition la variable que l'on utilise pour prouver la
propriété d'une autre variable.
56/2001
Sciences.ch 14/03/2005
D5B. une "variable liée" est la variable dont on veut prouver les propriétés à partir de l'énoncé
de la variable muette
D5C. une "occurrence" d'une variable dans une formule est une position de cette
variable dans la formule . Ne pas confondre avec l'objet qu'est la variable elle-même. Des
définitions précédentes il vient qu'une occurrence de la variable est liée (ou muette) dans la
formule si dans le domaine de cette variable on trouve . Dans le cas contraire, on dit
que l'occurrence est "libre".
Pour préciser les variables libres possibles d'une formule , nous noterons . Cela
signifie que les variables libres de sont parmi in extenso si est libre dans ,
alors est l'un des mais les n'apparaissent pas nécessairement dans .
Remarques :
R1. si est atomique alors est l'ensemble des variables apparaissant dans
les et nous avons
R2. si où : alors
R3. si alors et
R4. si avec et
D6. nous disons que les formules et sont -équivalentes si elles sont (syntaxiquement)
identiques à un renommage près des occurrences liées des variables.
D7. une formule "close" est une formule sans variables libres.
Remarques importantes:
R1. pour définir une fonction sur les formules, il suffit de définir sur les formules
atomiques et de dire comment on obtient (resp. ) à partir de
et (resp. )
R2. pour prouver une propriété sur les formules, il suffit de prouver pour les formules
atomiques et de prouver (resp. ) à partir de et
(resp. ).
R3. pour prouver une propriété sur les formules, il suffit de supposer la propriété vraie
pour toutes les formules de taille et de la démontrer pour les formules de taille .
57/2001
Sciences.ch 14/03/2005
R4. nous noterons qu'une variable peut avoir à la fois des occurrences libres et des
occurrences liées. Nous d'avons donc pas toujours (exemple:
où et )
R5. La notion de formule définie ici est la notion de formule de logique du premier ordre.
Certaines formules ne sont pas des formules du premier ordre (le nombre de quantificateurs
ne doivent pas êtres dépendant d'une variable !).
DÉMONSTRATIONS
Les démonstrations que l'on trouve dans les ouvrages de mathématiques sont des assemblages
de symboles mathématiques et de phrases contenant des mots clés tels que: "donc", "parce
que", "si", "si et seulement si", "il est nécessaire que", "il suffit de", "prenons un tel que",
"supposons que", "cherchons une contradiction", etc. Ces mots sont supposés être compris par
tous de la même manière, ce qui n'est en fait, pas toujours le cas.
Dans tout ouvrage, le but d'une démonstration est de convaincre le lecteur de la vérité de
l'énoncé. Suivant le niveau du lecteur, cette démonstration sera plus ou moins détaillée :
quelque chose qui pourra être considéré comme évident dans un cours de licence pourrait ne
pas l'être dans un cours de maturité.
Dans un devoir, le correcteur sait que le résultat demandé à l'étudiant est vrai et il en connaît
la démonstration. L'étudiant doit démontrer (correctement) le résultat demandé. Le niveau de
détail qu'il doit donner dépend donc de la confiance qu'aura le correcteur : dans une bonne
copie, une "preuve par une récurrence évidente" passera bien, alors que dans une copie où il y
eu auparavant un "évident", qui était évidemment… faux, ça ne passera pas!
Pour pouvoir gérer convenablement le niveau de détail, il faut savoir ce qu'est une
démonstration complète. Ce travail de formalisation a été fait qu début de XXème siècle!!
- il n'y a qu'un nombre fini de règles: deux pour chacun des connecteurs (et l'égalité) plus trois
règles générales. Il n'était pas du tout évident à piori qu'un nombre fini de règles soit suffisant
pour démontrer tout ce qui est vrai. Nous montrerons ce résultat (c'est essentiellement, le
théorème de complétude). La preuve n'en est pas du tout triviale.
- ce sont les mêmes règles pour toutes les mathématiques et la physique: algèbre, analyse,
géométrie, etc. Cela veut dire que nous avons réussi à isoler tout ce qui est général dans un
raisonnement. Nous verrons plus loin qu'une démonstration est un assemblage de couples , où
est un ensemble de formules (les hypothèses) et une formule (la conclusion). Quand
nous faisons de l'arithmétique, de la géométrie ou de l'analyse réelle, nous utilisons, en plus
des règles, des hypothèses que l'on appelle des "axiomes". Ceux-ci expriment les propriétés
particulières des objets que nous manipulons (pour plus de détails sur les axiomes voir la page
d'introduction du site).
58/2001
Sciences.ch 14/03/2005
Nous démontrons donc, en général, des formules en utilisant un ensemble d'hypothèses, et cet
ensemble peut varier au cours de la démonstration: quand nous disons "supposons et
montrons ", est alors une nouvelle hypothèse que nous pourrons utiliser pour montrer
. Pour formaliser cela, nous introduisons le concept de "séquent":
Définitions:
- est un ensemble fini de formules. représente les hypothèses que nous pouvons utiliser.
Cet ensemble s'appelle aussi le "contexte du séquent".
- est une formule. C'est la formule que nous voulons montrer. Nous dirons que cette
formule est la "conclusion du séquent".
Remarques:
R4. Nous écrirons pour dire que " est non prouvable"
D2. un séquent est "prouvable" (ou démontrable, dérivable) s'il peut être obtenu par
une application finie de règles. Une formule est prouvable si le séquent est prouvable.
RÈGLES DE DÉMONSTRATION
Les règles de démonstration sont les briques qui permettent de construire les dérivations. Une
dérivation formelle est un assemblage fini (et correct!) de règles. Cet assemblage n'est pas
linéaire (ce n'est pas une suite) mais un "arbre". Nous sommes en effet souvent amenés à faire
des branchements.
Nous allons présenter un choix de règles. Nous aurions pu en présenter d'autres (à la place ou
en plus) qui donneraient la même notion de prouvabilité. Celle que l'on a choisies sont
"naturelles" et correspondent aux raisonnements que l'on fait habituellement en
mathématique. Dans la pratique courante nous utilisons, en plus des règles ci-dessous,
beaucoup d'autres règles mais celles-ci peuvent se déduire des précédentes. Nous les
appellerons "règles dérivées".
Il est de tradition d'écrire la racine de l'arbre (le séquent conclusion) en bas, les feuilles en
haut: la nature est ainsi faite… Pourtant, nous construisons souvent l'arbre en allant de la
racine vers les feuilles. Comme il est également de tradition d'écrire, sur une feuille de papier,
de haut en bas, il ne serait pas déraisonnable d'écrire la racine en haut et les feuilles en bas. Il
59/2001
Sciences.ch 14/03/2005
- d'un ensemble de "prémisses": chacune d'elles est un séquent. Il peut y en avoir zéro, un ou
plusieurs
- d'une barre horizontale séparant les prémisses (en haut) de la conclusion (en bas). Sur la
droit de la barre, nous indiquerons le nom de la règle. Exemple:
- de bas en haut: si nous voulons prouver la conclusion, il suffit par utilisation de la règle de
prouver les prémisses. C'est ce qu'on fait quand nous cherchons une démonstration. Cela
correspond à "l'analyse".
- de haut en bas: si nous avons prouvé les prémisses, alors nous avons aussi prouvé la
conclusion. C'est ce qu'on fait quand nous rédigons une démonstration. Cela correspond à la
"synthèse".
RÈGLES
Pour les démonstrations il existe un nombre fini de règles au nombre 17 que l'on va définir ci-
après:
1. Axiome:
Explication: si la conclusion du séquent est une des hypothèses, alors le séquent est
prouvable.
2. Affaiblissement
Explications:
60/2001
Sciences.ch 14/03/2005
3. Introduction de l'implication
- de bas en haut: pour montre que nous supposons (c'est-à-dire que nous l'ajoutons
aux hypothèses) et nous démontrons .
4. Elimination de l'implication
5. Introduction à la conjonction
6. Elimination de la conjonction
et
7. Introduction de la disjonction
ou
8. Elimination de la disjonction
de bas en haut: si nous voulons montrer et que nous savons que nous avons , il suffit
61/2001
Sciences.ch 14/03/2005
9. Introduction de la négation
de haut en bas: si nous avons montré et , alors nous avons montré l'absurde ( )
Les deux règles mettent en valeur le rôle du symbole qui représente, intuitivement,
le faux universel indépendamment du langage utilisé.
Contrairement à beaucoup d'autres, cette règle peut être appliquée à tout moment: nous
pouvons en effet, souvent dire "pour prouver , je suppose et je vais chercher une
contradiction". Cela rend assez souvent la recherche de la preuve un peu plus difficile.
de haut en bas: de , nous pouvons déduire pour n'import quel terme . Ce que
nous pouvons dire aussi sous la forme: si nous avons prouvé pour tout , alors nous
pouvons utiliser avec n'importe quel objet (!!).
62/2001
Sciences.ch 14/03/2005
de bas en haut: pour démontrer , il suffit de trouver un objet (in extenso un terme ) pour
lequel nous savons montrer .
de bas en haut: quand nous avons une hypothèse de la forme , nous pouvons utiliser cette
hypothèse en prenant un qui satisfait . Cette condition est donc la formalisation du fait
que l'objet dont l'hypothèse affirme l'existence n'est pas nécessairement l'un des objets utilisé
pour la démonstration.
Explication: nous pouvons toujours montrer . Cette règle signifie que l'égalité est
réflexive (voir la chapitre traitant des opérateurs dans la même section du site).
63/2001
Sciences.ch 14/03/2005
64/2001
Sciences.ch 14/03/2005
NOMBRES
HISTOIRE
L'histoire des nombres (ou également appelés "scalaires") est beaucoup trop longue pour être
relatée ici, mais nous ne pouvons que vous conseiller un des meilleurs ouvrages sur le sujet:
Histoire Universelle des chiffres (~2000 pages), Georges Ifrah, ISBN: 2 221 05779 1
Cependant voici une petite bride de cette dernière qui nous semble fondamentale:
Notre système décimal actuel, de base 10, utilise les chiffres de 0 à 9, dits "arabes", mais au
fait d'origine indienne (hindous). En fait, les chiffres arabes sont différents :
Il faut lire: 0 "zéro", 1 "un", 2 "deux", 3 "trois", 4 "quatre", 5 "cinq", 6 "six", 7 "sept", 8
"huit", 9 "neuf"
Ces chiffres ne furent introduits en Europe que vers l'an 1000. Utilisés en Inde, ils furent
transmis par les Arabes au monde occidental par le pape Gerbert d'Aurillac lors de son séjour
en Andalousie à la fin du IXème siècle.
Le mot français "chiffre" est une déformation du mot arabe "sifr" désignant "zéro". En italien,
"zéro" se dit "zero", et serait une contraction de "zefiro", on voit là encore la racine arabe.
Ainsi nos termes "chiffre" et "zéro" ont la même origine.
Notre système décimal : l'usage précoce d'un symbole numérique désignant "rien", au sens de
"aucune quantité" ou "absence de quantité", c'est à dire notre zéro, provient du fait que les
Indiens utilisèrent un système dit "positionnel".
Dans un tel système, la position d'un chiffre dans l'écriture d'un nombre exprime la puissance
de 10 et le nombre de fois qu'elle intervient.
L'absence d'une puissance est notée par un petit rond... : c'est le zéro. Notre système actuel est
donc "décimal et positionnel".
65/2001
Sciences.ch 14/03/2005
Le nombre 324 s'écrit de gauche à droite comme étant trois centaines : 3 x 100, deux
dizaines : 2 x 10 et quatre unités : 4 x 1.
Attention!! Nous différencions un chiffre d'un nombre... Le nombre est composé de chiffres et
non inversement.
Nous voyons parfois (et c'est conseillé) un séparateur de milliers représenté par un guillemet '
en Suisse (posé tous les trois chiffres à partir du premier en partant de la droite pour les
nombres entier). Ainsi, nous écrirons 1'034 au lieu de 1034 ou encore 1'344'567'569 au lieu de
1344567569. Les séparateurs de milliers permettent de rapidement quantifier l'ordre de
grandeur des nombres lus. Ainsi:
- si nous voyons uniquement 1 guillement nous saurons que le nombre est de l'ordre du millier
- si nous voyons voit deux guillemets nous saurons que le nombre est de l'ordre du million
- si nous voyons trois guillements nous saurons que le nombre est de l'ordre du milliard
- et ainsi de suite...
Au fait, tout nombre entier, autre que l'unité, peut être pris pour base d'un système de
numérotation. Nous avons ainsi les systèmes de numérotation binaire, ternaire,
quaternaire,...,décimal, duodécimal qui correspondent respectivement aux bases deux, trois
quatre,...,dix, douze.
Une généralisation de ce qui a été vu précédemment, peut s'écrire sous la forme suivante:
Tout nombre entier positif peut être représenté dans une base sous forme de somme, où les
coefficients sont multipliés chacun par leur poids respectif . Tel que :
avec et
BASES NUMÉRIQUES
66/2001
Sciences.ch 14/03/2005
Pour écrire un nombre dans un système de base , nous devons commencer par adopter
caractères destinés à représenter les premiers nombres. Ces caractères sont comme
nous les avons déjà défini, les "chiffres" que nous énoncons comme à l'ordinaire.
Pour la numérotation écrite, nous faisons cette convention, qu'un chiffre, placé à gauche d'un
autre représente des unités de l'ordre immédiatement supérieur, ou fois plus grandes. Pour
tenir la place des unités qui peuvent manquer dans certains ordres, nous nous servons du zéro
(0) et par suite, le nombre de chiffres employés est toujours égal à la base du système.
Définition : pour la numérotation parlée, nous convenons d'appeler "unité simple", "dizaine",
"centaine", "mille", etc., les unités du premier ordre, du second, du troisième, du quatrième,
etc. Ainsi les nombres 10, 11,…,19 se liront de même dans tous les systèmes de numérotation;
les nombres 1a, 1b,a0, b0, … se liront dix-a, dix-bé, a-dix, bé-dix, etc. Ainsi, le nombre
5b6a71c se lira :
Cet exemple est pertinent car il nous montre l'expression générale de la langue parlée que
nous utilisons quotidiennement et intuitivement en base dix (faut à notre éducation).
Remarques :
R1. Les règles des opérations définies pour les nombres écrits dans le système décimal sont
les mêmes pour les nombres écrits dans un système quelconque de numérotation.
R2. Pour opérer rapidement dans un système quelconque de numérotation, il est indispensable
de savoir par cœur toutes les sommes et tous les produits de deux nombres d'un seul chiffre.
Le fait que la base décimale ait été choisie est semblerait t'il due au fait que l'humain a dix
doigts. Comme quoi cela ne tient pas à grand chose…
en ainsi de suite.
L'inverse (pour l'exemple de la base deux) est toujours un peu plus délicat. Par exemple la
conversion du nombre décimal 1'492 en base deux donne (le principe est à peu près identique
pour toutes les autres bases):
67/2001
Sciences.ch 14/03/2005
Ainsi, pour convertir le nombre 142'713 (base décimale) en base duodécimale (base
douze) nous avons (notation : est le "quotient", et le "reste") :
Ainsi nous avons les restes 6, 10, 7, 0, 9 ce qui nous amène à écrire :
Nous avons choisi pour ce cas particulier la symbolique que nous avions définie
précédemment (a-dix) pour éviter tout confusion.
TYPES DE NOMBRES
68/2001
Sciences.ch 14/03/2005
NOMBRES ENTIERS
Pour former des groupements d'objets, nous pouvons opérer ainsi: à un objet, ajouter un autre
objet, puis encore un et ainsi de suite; chacun des groupements, au point de vue de sa
collectivité, est caractérisé par un nombre; il résulte de là qu'un nombre peut être considéré
comme représentant un groupement d'unités tel que chacune de ces unités corresponde à un
objet de la collection.
Définition : deux nombres sont dits "égaux" si à chacune des unités de l'un nous pouvons faire
correspondre une unité de l'autre et inversement. Si ceci ne se vérifie par alors nous parlons
"d'inégalité".
Prenons un objet, puis un autre, puis au groupement formé, ajoutons encore un objet et ainsi
de suite. Les groupements ainsi constitués sont caractérisés par des nombres qui, considérés
dans le même ordre que les groupements successivement obtenus, constituent la "suite
naturelle" notée et appelée contenant la suite: 0,1, 2, 3, …, et que nous notons :
La présence du 0 (zéro) dans notre définition de est discutable étant donné qu'il n'est ni
positif ni négatif. C'est la raison pour laquelle dans certains ouvrages vous pourrez trouver
une définition de sans le 0.
Nous pouvons définir cet ensemble de façon plus générale mais non axiomatique (définition
personnelle) : est l'ensemble le plus commun et intuitif d'abstraits quantitatifs arbitraires
qui satisfont à des règles subjectives dépendantes de la complexe logique qui en est à
l'origine.
Et les constituants par (nous devons cette définition au mathématicien Gottlob) les propriétés
(avoir lu au préalable le chapitre de théorie des ensembles est recommandé...) : 0 (lire "zéro")
est le nombre d'éléments (défini comme une relation d'équivalence) de tous les ensembles
équivalents à (en bijection avec) l'ensemble vide. 1 (lire "un") est le nombre d'éléments de
tous les ensembles équivalents à l'ensemble dont le seul élément est 1. 2 (lire "deux") est le
nombre d'éléments de tous les ensembles équivalents à l'ensemble dont tous les éléments sont
0 et 1. En général, un nombre entier est le nombre d'éléments de tous les ensembles
équivalents à l'ensemble des nombres entiers le précédent!
La construction de l'ensemble des entiers naturels s'est faite de la manière la plus naturelle et
cohérente qui soit. Les naturels doivent leur nom à ce qu'ils avaient pour objet, aux prémices
de leur existence, de dénombrer des quantités et des choses de la nature ou qui intervenaient
dans la vie de l'homme. L'originalité de l'ensemble réside dans la manière empirique dont il
69/2001
Sciences.ch 14/03/2005
s'est construit car il ne résulte pas réellement d'une définition mathématique, mais davantage
d'une prise de conscience par l'homme du concept de quantité dénombrable, de nombre et de
lois qui traduisent des relations entre eux.
Remarquons immédiatement que la suite naturelle des nombres entiers est illimitée mais
dénombrable (nous le verrons plus bas), car, à un groupement d'objets qui se trouve représenté
par un certain nombre , il suffira d'ajouter un objet pour obtenir un autre groupement qui
sera défini par un nombre entier immédiatement supérieur . Deux nombres entiers qui
différent d'une unité positive sont dits "consécutifs".
AXIOMES DE PEANO
Lors de la crise des fondements des mathématiques, les mathématiciens ont bien évidemment
cherché à axiomatiser l'ensemble et nous devons l'axiomatisation actuelle à Peano et à
Dedekind dont voisci une énumération (nous utiliserons également certains de ces axiomes
pour la démonstration des propriétés des opérations élémentaires des mathématiques) :
A4. Si les successeurs de deux nombres sont égaux alors ces deux nombres sont égaux :
A5. Soit l’ensemble de tous les nombres si un ensemble de nombres est tel que :
1.
2. si et alors .
70/2001
Sciences.ch 14/03/2005
alors .
Démonstration :
1. par définition de
2. Si par définition de ,
Les nombres obtenus en comptant par deux à partir de zéro, (soit 0, 2, 4, 6, 8, …) dans cette
suite naturelle sont appelés "nombres pairs".
Les nombres que nous obtenons en comptant par deux à partir de un (soit 1, 3, 5, 7,... ) dans
cette suite naturelle s'appellent "nombres impairs".
Remarque : nous appellons "nombres parfaits", les nombres égaux à la somme de leurs
diviseurs entiers (concept que nous verrons en détail plus tard) comme par exemple: 6=1+2+3
et 28=1+2+4+7+14
NOMBRES PREMIERS
Par définition un nombre premier est un entier possédant exactement 2 diviseurs (ces deux
diviseurs sont donc "1" et lui-même).
A noter que la définition de nombre premier exclut le chiffre "1". Admettre "1" comme
nombre premier rendrait faux l'important "théorème fondamental de l'arithmétique" (voir la
théorie des nombres dans le site) qui dit qu'il existe une unique manière d'écrire un nombre
entier supérieur à "1" comme produit de nombres premiers (sans prendre en compte l'ordre
de la multiplication).
Cette définition est très important car elle nous permettra de démontrer que forme un
anneau intégralement clos (voir un peu plus loin lorsque nous définirons le conception de
"nombre algébrique).
71/2001
Sciences.ch 14/03/2005
Nous pouvons nous demander s'il existe une infinité de nombres premiers ? La réponse est
positive et en voici une démonstration (parmi tant d'autres) par l'absurde :
Supposons qu'il en existe qu'un nombre fini de nombres premiers qui seraient (nous utilisons
des nombres abstraits pour représent un nombre premier quelconque):
Nous formons un nouveau nombre. Le produit de tous les nombres premiers auquel nous
ajoutons "1":
Selon notre hypothèse initiale ce nouveau nombre devrait être divisible par l'un des nombres
premiers existants (selon le théorème fondamental de l'arithmétique – voir le chapitre de
théorie des nombres dans le site) selon:
Le premier terme se simplifie, car est dans le produit. On note cet entier:
Or, et sont deux entiers, donc doit être un entier. Mais est par définition
supérieur à 1. Donc n'est pas un entier.
Contradiction : les nombres premiers ne sont pas en nombre fini, mais infini.
L'ensemble à quelques défauts que nous n'avons pas énoncés tout à l'heure. Par exemple, la
soustraction de deux nombres dans n'a pas toujours un résultat dans (les nombres négatif
n'y existent pas). Autre défaut, la division de deux nombres dans n'a également pas toujours
un résultant dans (les nombres fractionnaires n'y existent pas).
72/2001
Sciences.ch 14/03/2005
ajoutant à l'ensemble des entiers naturels, les entiers négatifs (concept révolutionnaire pour
ceux qui en sont à l'origine) nous obtenons "l'ensemble des entiers relatifs" noté :
L'ensemble des entiers naturels est donc inclus dans l'ensemble des entiers relatifs. C'est ce
que nous notons sous la forme :
Cet ensemble à été crée à l'origine pour faire de l'ensemble des entiers naturels un objet que
nous appellons un "groupe" (voir le chapitre théorie des ensembles dans le site) par rapport à
l'addition et la soustraction.
Remarque: nous disons qu'un ensemble est "dénombrable", s'il est équipotent à . C'est-à-
dire s'il existe une bijection de (voir chapitre théorie des ensembles) sur . Ainsi, grosso
modo, deux ensembles équipotents ont "autant" d'éléments au sens de leurs cardinaux (voir
chapitre théorie des ensembles), ou tout au moins la même infinité.
L'objectif de cette remarque est de faire comprendre que les ensembles sont
dénombrables. Par choix, nous ne souhaitons pas démontrer maintenant que est
dénombrable. Cela sera évident lorsque nous démontrerons que l'ensemble des rationnels
(définition ci-dessous) est dénombrable.
NOMBRES RATIONNELS
L'ensemble à aussi un défaut. Ainsi, la division de deux nombres dans n'a également pas
toujours un résultant dans (les nombres fractionnaires n'y existent pas).
Nous pouvons ainsi définir un nouvel ensemble qui contient tous les nombres qui peuvent
s'écrire sous forme de fraction (rapport d'un dividende et d'un diviseur entiers) ou autrement
dit : les "nombres fractionnaires". Cet ensemble est noté :
La logique de la création de l'ensemble des nombres rationnels est similaire à celle des entiers
relatifs. Effectivement, les mathématiciens ont souhaité faire de l'ensemble des nombre
73/2001
Sciences.ch 14/03/2005
relatifs un "groupe" par rapport à la loi de multiplication et de division (voir théorie des
ensembles). De plus, contrairement à l'intuition, les nombres rationnels sont en même quantité
que les nombres entiers relatifs et naturels. Nous pouvons nous persuader de cette équipotence
en rangeant comme le fit Cantor, les rationnels dans un premier temps de la façon suivante:
Si nous éliminons de ce tableau les rationnels qui se répétent alors nous pouvons construire
sur celui une même diagonale (d'où le nom de la méthode : "diagonale de Cantor") que celle
présentée ci-dessus et celle-ci montre alors clairement que tout rationnel admet un rang.
Par exemple, 3/2 est classé 8ème et sera unique (puisque nous éliminons 6/4 et les autres
rationnels qui ont la même valeur).
Nous définissons ainsi une application qui est injective (deux rationnels distincts
admettent des rangs distincts) et surjective (à tout place sera inscrit un rationnel: on le cherche
par son dénominateur, puis en colonne pour son numérateur).
Outre les circonstances historiques de sa mise en place, ce nouvel ensemble se distingue des
ensembles d'entiers relatifs car il induit la notion originale et paradoxale de quantité partielle.
Cette notion qui a priori n'a pas de sens, trouvera sa place dans l'esprit de l'homme notamment
grâce à la géométrie où l'idée de fraction de longueur, de proportion s'illustre plus
intuitivement.
NOMBRES IRRATIONNELS
Ainsi, tous les nombres qui ne peuvent (négation) s'écrire sous forme de fraction (rapport d'un
dividende et d'un diviseur entiers) sont ce que nous appelons des nombres "irrationnels".
Pour démontrer l'irrationalité d'un nombre, nous utilisons un démonstration par l'absurde
74/2001
Sciences.ch 14/03/2005
utilisant les propriétés des nombres pairs et impairs. Par exemple, pour l'exemple fort connu
de nous procèdons de la façon suivante:
Puisque le carré d'un nombre impair est impair et le carré d'un nombre pair est pair, le cas (1)
est impossible, car serait impair et serait pair.
Le cas (2) est aussi est aussi impossible, car alors nous pourrions écrire , où est un
entier quelconque, et donc si on le porte au carré on a où l'on a un nombre pair des
deux côtés de l'égalité. En remplaçant dans on obtient . serait impair
alors que serait pair. Il n'y a pas de solution; c'est donc que l'hypothèse de départ est
fausse et qu'il n'existe pas deux entiers et tels que .
NOMBRES RÉELS
La réunion des nombres rationnels et irrationnels donne l'ensemble des nombres réels. Donc
nous pouvons écrire que :
Remarque : les mathématicien dans leur rigueur habituelle ont différentes techniques pour
définir les nombres réels. Ils utilisent pour cela des propriétés de la topologie (entre autres) et
en particulier les suites de Cauchy mais c'est une autre histoire qui dépasse le cadre formel du
présent chapitre.
Nous sommes évidemment amenés à nous poser la question si est dénombrable ou non. La
démonstration est assez simple. Par définition, nous savons qu'il doit y avoir une bijection
entre et pour que dire que soit dénombrable.
75/2001
Sciences.ch 14/03/2005
Pour simplifier, nous allons montrer que l'intervalle n'est pas dénombrable; ce qui
implique bien sûr que ne l'est pas.
Supposons cependant le contraire (démonstration par l'absurde): nous pouvons alors énumérer
, c'est-à-dire qu'il existe une suite qui contient tous les réels de .
Nous formons maintenant le nombre s'écrivant (nous prenons les chiffres de la diagonale
principale ci-dessus):
Nous formons enfin le nombre en remplaçant chaque décimale de par son prédécesseur:
Alors le nombre qui est bien défini, n'est pas dans la liste des valeurs parcourues par . En
effet:
(le premier chiffre décimal de ) est différent de (le premier chiffre décimal de )
donc et puis en procédant toujours avec le même raisonnement donc
etc.
Donc pour tout !! Nous avons donc construit un réel de qui n'est pas dans
tel que nous ayons une contradiction avec l'hypothèse initiale. Une telle suite
parcourant tous les réels de n'existe donc pas, donc est indénombrable.
La technique qui nous a permis d'arriver est connue sous le nom de "procédé diagonal de
Cantor" et l'ensemble des nombres réels est dit avoir "la puissance du continu" de par le fait
qu'il est indénombrable.
NOMBRES TRANSFINIS
Nous nous retrouvons donc avec un "infini" des nombres réels qui est différent de celui des
nombres naturels. Cantor osa alors ce que personne n'avait osé depuis Aristote: la suite des
entiers positifs est infinie, l'ensemble , est donc un ensemble qui a une infinité d'éléments,
alors il affirma que le cardinal (voir la théorie des ensembles de la présent section) de cet
76/2001
Sciences.ch 14/03/2005
ensemble était un nombre qui existait comme tel sans que l'on utilise le symbole fourre tout
, il le nota:
Ce symbole est la première lettre de l'alphabet hébreu, qui se prononce "aleph zéro". Canton
allait appeler ce nombre étrange, un nombre "transfini".
Cantor écrivit: «l'acte décisif fut d'affirmer qu'il y a, après le fini, un transfini, c'est-à-dire une
échelle illimitée de modes déterminés qui par nature sont infinis, et qui cependant peuvent
êtres précisés, tout comme le fini, par des nombres déterminés, bien définis et distinguables
les uns des autres.»
Après ce premier coup d'audace allant à l'encontre de la plupart des idées reçues depuis plus
de deux mille ans, Cantor allait poursuivre sa lancée et établir des règles de calcul,
paradoxales à première vue, sur les nombres transfinis. Ces règles se basaient, comme nous
l'avons défini tout à l'heure, sur le fait que deux ensembles infinis sont équivalent s'il existe
une bijection entre les deux ensembles. Elle permettent donc de distinguer plusieurs sortes
d'infinis.
Ainsi, par la même méthode que celle que nous avons utilisé, nous pouvons montrer que
l'infini des nombres pairs est équivalent à l'infini des nombres entiers. Pour cela, il suffit de
montrer qu'à chaque nombre entier, nous pouvons associer un nombre pair, son double, et
inversement. Ainsi, même si les nombres paires sont inclus dans l'ensemble des nombres
entiers, il y en a une infinité égale, les deux ensembles sont équivalents. En affirmant
qu'un ensemble peut être égale à une de ses parties, Cantor va à l'encontre ce qui semblait être
une évidence pour Aristote et Euclide: l'ensemble de tous les ensembles est infini ! Cela va
ébranler la totalité des mathématiques et va amener à l'axiomatisation de Zermelo-Frankel que
nous verrons en théorie des ensembles.
Démontrer que l'ensemble des réels est non dénombrable revient aussi à démontrer qu'il n'y a
pas plus de points sur la surface d'un carré que sur un de ses côtés (d'ailleurs Cantor écrivit:
«Je le vois mais je ne le crois pas»). En généralisant ce raisonnement, nous arrivons au fait
qu'un espace à dimensions ne contient pas plus de points qu'un espace à une dimension (il
fallut trois années à Cantor pour démontrer rigoureusement ce résultat) !
A partir de ce qui précède, Cantor établit les règles de calculs suivants sur les cardinaux:
Nous pouvons remarquer que ces règles ne sont pas nécessairement intuitives.
L'ensemble transfini des nombres réels amène à un "paradoxe" dit "paradoxe de Russell".
Si nous considérons le cardinal de l'ensemble de tous les cardinaux, il est nécessairement plus
grand que tous les cardinaux, y compris lui-même !
77/2001
Sciences.ch 14/03/2005
Nous reviendrons plus en détail là-dessus lors de notre étude des cardinaux dans la théorie des
ensembles.
NOMBRES COMPLEXES
Inventés au XVIIIème siècle entre autres par Jérôme Cardan et Rafaello Bombelle, ces
nombres permettent de résoudre des problèmes n'ayant pas de solutions dans . L'idée fut
d'introduire un nombre imaginaire tel que:
( et étant des nombres abstraits - voir plus loin la définition d'un nombre abstrait) et nous
notons l'ensemble des nombres complexes et avons donc par extension:
L'ensemble est identifié au plan affine euclidien orienté (voir le chapitre d'analyse
vectorielle dans la section d'algèbre du site) grâce au choix d'une base orthonormée directe
(nous obtenons ainsi le "plan d'Argand-Cauchy" ou "plan de Gauss" que nous verrons un peu
plus loin).
L'ensemble des nombres complexes (qui constitue un corps - voir théorie des ensembles),
donc noté , est défini par:
Pendant près de 150 ans les nombres complexes étaient purement des êtres mathématiques
abstraits n'ayant pas d'équivalents dans la nature. Avec l'avénement de la physique quantique,
il est apparu que les dimensions complexes (nous allons voir un peu plus loin ce qu'est une
dimension complexe) étaient inhérentes aux propriétés de la nature (voir le chapitre de
physique quantique ondulatoire dans la section de physique atomique du site).
78/2001
Sciences.ch 14/03/2005
A partir d'un complexe et de son conjugué, il est possible de trouver ses parties réelles et
imaginaires. Ce sont les relations évidentes suivantes:
et
Le "module" de représente la longueur par rapport au centre du plan de Gauss (voir un peu
plus bas ce qu'est le plan de Gauss) et est simplement calculé avec l'aide du théorème de
Pythagore:
La notation pour le module n'est pas innocente puisque coïncide avec la valeur absolue
de lorsque est réel.
T1.
Démonstration:
T2.
Démonstration:
79/2001
Sciences.ch 14/03/2005
T3.
Démonstration:
T4. et si
Démonstrations:
et:
T5.
Démonstration:
T6.
Démonstrations:
80/2001
Sciences.ch 14/03/2005
T7.
Nous nous restreindrons à la démonstration de la seconde relation qui est un cas général de la
première (où ):
Démonstration:
A priori cette inégalité peut ne pas paraître évident à tout le monde alors développons un peu
et supposons-la vraie:
Après simplification:
81/2001
Sciences.ch 14/03/2005
Après simplification:
Démonstration:
82/2001
Sciences.ch 14/03/2005
Nous calculons sans trop de difficultés avec les bases de trigonométrie (voir le chapitre de
trigonométrie dans la section de géométrie du site) que:
, ,
et inversement:
Les égalités suivantes sont vraies modulo pour tous nombres complexes non nuls
et tout entier naturel :
1. et
2.
3.
4.
5.
83/2001
Sciences.ch 14/03/2005
Démonstration: (1) et (2) proviennent des formules classique de trigonométrie. (2) entraîne (3)
par récurrence sur . (2) entraîne aussi:
Nous démontronse entre autres avec les séries de Taylor (voir le chapitre des suites et séries
dans la section d'algèbre) que:
et:
84/2001
Sciences.ch 14/03/2005
pour la division:
et
et
Dans le cas où nous avons un module unité tel que nous avons
évidemment:
Evidemment tous les résultats vus jusqu'ici sont périodiques de période avec
.
Ceci étant dit, une variation sinusoïdale peut être représentée comme la
projection (voir le chapitre de trigonométrie) sur l'axe vertical (axe des imaginaires de
l'ensemble ) d'un vecteur tournant à vitesse angulaire autour de l'origine dans le plan
85/2001
Sciences.ch 14/03/2005
Un tel "vecteur tournant" s'appelle "vecteur de Fresnel" et peut très bien être interprété comme
la partie imaginaire d'un nombre complexe donné par :
Nous retrouverons les vecteurs tournants de façon explicite lors de notre étude de la
mécanique ondulatoire et optique géométrique (dans le cadre de la diffraction).
Il est habituel de représenter les nombres réels comme points d'une droite graduée. Les
opérations algébriques y ont leur interprétation géométrique: l'addition est une translation, la
multiplication une homothétie centrée à l'origine.
En particulier nous pouvons parler de la "racine carrée d'une transformation". Une translation
d'amplitude peut être obtenue comme l'itération d'une translation d'amplitude . De
même une homothétie de rapport a peut être obtenue comme l'itérée d'une homothétie de
rapport . En particulier une homothétie de rapport 9 est la composée de deux homothéties
de rapport 3 ( ou -3).
La racine carrée prend alors un sens géométrique. Mais qu'en est-il de la racine carrée de
nombres négatifs? En particulier la racine carrée de -1?
Une homothétie de rapport -1 peut être vue comme une symétrie par rapport à l'origine;
toutefois si nous voulons voir cette transformation d'une manière continue, force nous est de
placer la droite dans un plan. Dès lors une homothétie de rapport -1 peut être vue comme une
rotation de radians autour de l'origine.
Ayant réussi à positionner le nombre il n'est plus guère difficile de disposer les autres
nombres complexes dans un plan (le plan de Gauss, d'Argand ou de Wessel). Nous pouvons
ainsi associer à le produit de l'homothétie de rapport 2 par la rotation de centre O et d'angle
, soit une similitude centrée à l'origine.
86/2001
Sciences.ch 14/03/2005
Dans ce plan réel toute opération sur les complexes prend un sens géométrique. L'addition
correspond à une translation. Quant à la multiplication par un nombre ,
elle est représentée par une similitude: 0 reste évidemment fixe et 1 est appliqué sur . Tout
nombre complexe est ainsi associé, par le biais de la multiplication, à une similitude:
l'amplitude de la similitude est son argument, le rapport de la similitude est son module.
Si nous désignons par et les axes de coordonnées du plan complexe (ou plan de Gauss)
nous avons (en laissant le soin au lecteur de faire les petits dessins s'il n'arrive pas à en
percevoir l'évidence mentalement):
- Translation d'amplitude :
- Symétrie d'axe :
- Symétrie d'axe :
Inversion:
87/2001
Sciences.ch 14/03/2005
NOMBRES QUATERNIONS
Appelés aussi "hypercomplexes", ces nombres ont été inventés en 1843 par William Rowan
Hamilton pour généraliser les nombres complexes. Ils s'écrivent sous la forme
où sont réels et où vérifient certaines propriétés.
NOMBRES ALGÉBRIQUES
Nous définissons tout nombre algébrique par un nombre qui est solution d'une équation
algébrique, à savoir un polynôme (concept que nous aborderons dans la seciont d'algèbre)
dont les coefficients sont des entiers relatifs et non nuls.
Un résultat intéressant (curiosité de mathématique) est qu'un nombre rationnel est un nombre
algébrique si et seulement si c'est un entier relatif (lisez plusieurs fois au besoin…). De par
cette propriété que nous allons de suite démontrer, nous disons que l'anneau est
"intégralement clos".
Dans ce cas:
Ainsi, divise une puissance de , ce qui n'est possible dans l'ensemble que si vaut
(puisqu'ils étaient premiers entre eux).
NOMBRES TRANSCENDANTS
Les nombres qui ne sont pas algébriques sont transcendants. Les transcendants sont donc
beaucoup plus nombreux que les algébriques.
Remarque: les transcendants les plus connus sont et . Les démonstrations de leur
transcendance est en cours de rédaction. Nous devrions pouvoir vous les fournir fin 2004.
NOMBRES ABSTRAITS
Le nombre peut être envisagé en faisant abstraction de la nature des objets qui constituent le
groupement qu'il caractérise; et ainsi qu'à la façon de codifier (chiffre arabe, romain, ou autre
système universel) on dit alors que le nombre est "abstrait". Arbitrairement, l'être humain a
adopté un système numérique majoritairement utilisé de par le monde et représenté par les
symboles 1, 2, 3, 4, 5... qui seront connus aussi bien en écriture qu'oralement par le lecteur
(apprentissage du langage).
Pour les mathématiciens il n'est pas avantageux de travailler avec ces symboles car ils
88/2001
Sciences.ch 14/03/2005
représentent uniquement des cas particuliers. Ce que cherchent les physiciens théoriciens ainsi
que les mathématiciens, se sont des relations applicables universellement dans un cas général
et que les ingénieurs puissent en fonction de leurs besoins changer ces nombres abstraits par
les valeurs numériques qui correspondent au problème qu'ils ont besoin de résoudre.
Ces nombres abstraits appelés aujourd'hui communément "variables" sont très souvent
représentés par:
2. Par l'alphabet grec qui est lui particulièrement utilisé pour représenter soit des opérateurs
mathématiques plus ou moins complexes (comme le sont le + pour l'addition, le - pour
l'addition par exemple), soit des variables physiques.
Bien que ces symboles puissent représenter n'importe quel nombre il en existe quelques uns
qui peuvent représenter des constantes dites Universelles (vitesse da la lumière, la constante
gravitationnelle, constante de Planck et bien d'autres).
Nous utilisons très souvent encore d'autres symboles que nous introduirons et définirons au
fur et à mesure.
Remarques :
R1. les lettres pour représenter les nombres ont été employées pour la première fois par Viète.
R2. habituellement, les premières lettres de l'alphabet latin désignent les nombres
connus, et les dernières les nombres inconnus.
DOMAINE DE DÉFINITION
Une variable est un nombre abstrait susceptible de prendre des valeurs numériques
différentes. L'ensemble de ces valeurs peut varier suivant le caractère du problème considéré.
Nous appellons "domaine de définition" d'une variable, l'ensemble des valeurs numériques
qu'elle est susceptible de prendre.
89/2001
Sciences.ch 14/03/2005
Définitions y relatives :
D1. nous appelons "domaine de définition" d'une variable, l'ensemble des valeurs numériques
qu'elle est susceptible de prendre.
D2. nous appelons "intervalle fermé d'extrémité et ", l'ensemble de tous les nombres
compris entre ces deux valeurs comprises et nous le désignons de la façon suivante :
D3. nous appelons "intervalle ouvert d'extrémité et ", l'ensemble de tous les nombres
compris entre ces deux valeurs non comprises et nous le désignons de la façon suivante:
D4. nous appelons "intervalle fermé à gauche, ouvert à droite" la relation suivante :
D5. nous appelons "intervalle ouvert à gauche, fermer à droite" la relation suivante :
Remarque : si la variable peut prendre toutes les valeurs négatives et positives possibles nous
écrivons dès lors: où le symbole " " signifie une infinité. Evidemment il peut y
avoir des combinaisons d'intervalles ouverts et infinis à droite, fermé et limité gauche et
réciproquement.
Remarque : nous rappelerons ces concepts lorsque nous étudierons l'algèbre (calcul littéral).
Nous disons que la variable est "ordonnée" si en représentant son domaine de définition par
un axe horizontal où chaque point de l'axe représente une valeur de , alors que pour chaque
couple de de valeurs, nous pouvons indiquer celle qui est "antécédente" (qui précède) et celle
qui est "conséquente" (qui suit). Ici la notion d'antécédente ou de conséquente n'est pas liée au
temps, elle exprime juste la façon d'ordonner les valeurs de la variable.
Définitions y relatives :
D1. une variable est dite "croissante" si chaque valeur conséquente est plus grande que chaque
valeur antécédente.
D2. une variable est dite "décroissante" si chaque valeur conséquente est plus petite que
chaque valeur antécédente.
D3. les variables croissantes et les variables décroissantes sont appelées "variables à
variations monotones" ou simplement "variables monotones".
90/2001
Sciences.ch 14/03/2005
OPÉRATEURS
Il existe en mathématiques, deux types d'outils fondamentaux pour le commun des individus
(nous verrons dans des cadres un peu poussés qu'il y en a beaucoup plus que deux au fait...) :
1. Les opérateurs
Il existe 6 relations binaires fondamentales (égal, différent de, plus grand que,
plus petit que, plus grand ou égal, plus petit ou égal) qui permettent de comparer
des grandeurs d'éléments se trouvant à gauche et à droite (donc au nombre de
deux, d'où leur nom) afin d'en tirer certaines conclusions.
Il est essentiel de parfaitement connaître ses deux outils et leurs propriétés avant de se lancer
dans des calculs plus ardus.
RELATIONS BINAIRES
Le concept de "relation" est la base de toute la mathématique dont le but est d'étudier - par
observation et déduction (raisonnement), calcul et comparaison - des configurations abstraites
ou concrètes de ses objets (nombres, formes, structures) en cherchant à établir les liens
logiques, numériques ou conceptuels entre ces objets.
Considérons deux ensembles non vides et (voir théorie des ensembles). Si à certains
éléments de nous pouvons associer par une règle mathématique précise (non
ambiguë) un élément de , nous définissons ainsi une relation de vers dite "binaire"
car faisant intervenir deux éléments. Nous écrivons :
et
Comme nous l'avons déjà dit, il existe 6 relations binaires fondamentales (égal, différent de,
plus grand que, plus petit que, plus grand ou égal, plus petit ou égal). Mais nous allons voir
qu'à partir de ces 6 relations fondamentales, nous pouvons en construire un plus grand
nombre.
Ainsi, de façon plus générale, une peut être définie comme un règle mathématique qui
associe à certains éléments de , certains éléments de .
Alors, dans ce contexte plus général, si , nous disons que est une "image" de par
et que est un antécédent de .
L'ensemble des couples ( , ) tel que soit une assertion vraie forme un "graphe" de la
relation . Nous pouvons représenter ces couples dans un repère adéquatemment choisi pour
en faire une représentation graphique de la relation .
91/2001
Sciences.ch 14/03/2005
ÉGALITES
Il est fort difficile de définir la notion "d'égalité" dans un cas général applicable à toute
situation. Pour notre part, nous nous permettrons pour cette définition de nous inspirer du
théorème d'extensionnalité de la théorie des ensembles (que nous verrons plus tard):
Définition: deux éléments sont égaux si, et seulement si, ils ont les mêmes éléments.
Le signe "=" signifie "égal à" ou "égalité de". Ce symbole a été introduit pour la première fois
par Le Recorde (1557).
Propriété (triviale) : si
nous avons et un nombre et une opération quelconque (tel que
l'addition, la soustraction, la multiplication ou la division) quelconque alors :
Cette propriété est très utilisée pour résoudre ou simplifier des équations de type quelconques.
Si deux éléments ne sont pas égaux (inégaux), nous les relions par le symbole :
Il existe encore d'autres symboles d'égalités, qui sont une extension des deux que nous avons
éfini précédemment. Malheureusement, ils sont mal utilisés (disons plutôt qu'ils sont utilisés
au mauvais endroits) dans la plupart des ouvrages disponibles sur le marché :
COMPARATEURS
Les comparateurs sont des outils qui nous permettent de comparer et d'ordonner tout couple
92/2001
Sciences.ch 14/03/2005
de nombres (et in extenso aussi des ensembles!) . La possibilité d'ordonner des nombres est
presque fondamentale en mathématiques dans le cas contraire (s'il n'était pas possible ou non
imposé d'ordonner), il y aurait des tas de choses qui choqueraient nos habitudes, par exemple
(certains des concepts présentés dans la phrase qui suit n'ont pas encore été vus mais nous
souhaitons quand même y faire référence) : plus de fonctions monotones (en particulier de
suites) et lié à cela la dérivation n'indiquerait donc rien sur un "sens de variation", plus
d'approche de zéros d'un polynôme par dichotomie (algorithme classique de recherche dans
un ensemble ordonné partagé en deux à chaque itération), en géométrie, plus de segments ni
de demi-droites, plus de demi-espace, plus de convexité, nous ne pouvons plus orienter
l'espace, etc. C'est donc important de pouvoir ordonner les choses comme vous l'aurez
compris.
Remarque : il est utile de rappeler que l'ensemble des réels est un groupe totalement
ordonné (voir théorie des ensembles), sans quoi nous ne pourrions pas définir des relations
d'ordre entre ces éléments.
Le symbole "<" est une "relation d'ordre" qui signifie "plus petit que" ainsi que ">" signifie
plus "grand que"..
et
Si :
et
Remarque: nous notons est équivalent (toujours noté avec le symbole " ") à
et
inversement :
et
Si :
93/2001
Sciences.ch 14/03/2005
Nous pouvons bien évidemment multiplier, diviser, addition ou soustraire un terme de chaque
côté de la relation telle que celle-ci soit toujours vraie. Petite remarque cependant, si vous
multipliez les deux membres par un nombre négatif il faudra bien évidemment changer le
comparateur tel que si :
et inversement :
Si :
Soit :
si est pair alors et si est impair (ce n'est évidemment qu'une question de
signe).
Finalement :
Les relations d'ordre (plus grand que, plus petit que, plus petit ou égal, plus
grand ou égal, beaucoup plus grand, beaucoup plus petit) ont été imaginés par Harriot en
1631.
Comme nous le verrons en théorie des ensembles, les relations de comparaisons sont définies
de façon un peu plus subtile et rigoureuse. Voyons cela de suite (le vocabulaire qui va suivre
est explicité dans le chapitre de théorie des ensembles du site):
Ainsi, soit une relation binaire d'un ensemble vers lui-même, une relation dans est
un sous-ensemble du produit cartésien (c'est-à-dire que la relation binaire
engendre un sous-ensemble de par les contraintes qu'elle impose aux éléments de qui
satisfont la relation) avec la propriété d'être :
D1. "réflexive" si :
94/2001
Sciences.ch 14/03/2005
D2. "symétrique" si :
D3. "antisymétrique" si :
D4. "transitive" si :
D5. "connexe" si :
D7. Une "relation d'ordre partiel" si et seulement si elle est réflexive, antisymétrique et
transtive
D8. Une "relation d'équivalence" si et seulement si elle est réflexive, symétrique, transitive
D9. Une "relation d'ordre total" si et seulement si elle est réflexive, antisymétrique, transitive
et connexe
Remarque : les relations d'ordre binaire ont toutes des propriétés similaires dans les ensembles
(en prenant le module pour l'ensemble des nombres complexes).
Si nous résumons :
Relation
d'ordre
réflexive oui oui oui
symétrique oui oui oui oui
transitive oui oui oui oui oui
connexe oui oui oui oui oui
anti-symétrique oui oui
transitive oui oui
Ainsi, nous voyons que les relations binaires forment avec les ensembles précités, des
relations d'ordre total.
95/2001
Sciences.ch 14/03/2005
Ainsi il est très facile de voir quelles relations binaires sont des relations d'ordre partiel, total
ou d'équivalence.
Nous avons donc associé à la relation une partition de . Réciproquement si est une
partition de alors nous vérifions facilement que la relation définie par: si et
seulement si il existe tel que , est une relation d'équivalence. Les deux
applications ainsi définies sont bijectives et réciproques l'une de l'autre.
Nous allons à présent appliquer ce que nous venons de voir à la construction des anneaux
.
Rappel : Soit deux nombres . Nous disons que " divise " et nous écrivons si
et seulement si il existe un entier tel que .
96/2001
Sciences.ch 14/03/2005
Rappel (voir chapitre de cryptographie aussi… si…si) : soit un entier. Nous définissons
la relation par si et seulement si ou dit autrement si et seulement si
il existe tel que . Généralement nous écrivons ceci aussi (modulo
) au lieu de et nous disons que " est congru à modulo ". Rappelons aussi que
(mod. ) si et seulement si divise .
Maintenant, démontrons que pour tout entier , la congruence modulo est une relation
d'équivalence sur .
1. Réflexivité : car .
Remarque : souvent pendant les études (cours) de mathématiques nous cherchons par
exemple, les valeurs pour lesquelles l'anneau devient un corps et nous remarquons
alors que ce sont les valeurs premières de .
Comme nous l'avons déjà dit précédemment, il existe deux opérateurs de base (addition et
soustraction) à partir desquels il possible de définir la multiplication et la division et autours
desquels nous pouvons construire toute la mathématique analytique.
ADDITION
97/2001
Sciences.ch 14/03/2005
Définition : L'addition des nombres entiers est une opération notée "+" qui a pour seul but de
réunir en un seul nombre toutes les unités contenues dans plusieurs autres. Le résultat de
l'opération se nomme "somme" ou "total". Les nombres à additionner sont appelés "termes de
l'addition". Les signes d'addition "+" et de soustraction "-" sont dus à Widmann (1489).
Ainsi, ... sont les termes de l'addition et le résultat est la somme des termes de
l'additon.
Axiomes :
A1. La somme de plusieurs nombres ne dépend pas de l'ordre des termes. Nous disons alors
que l'addition est une "opération commutative".
A2. La somme de plusieurs nombres ne change pas si nous remplacons deux ou plusieurs
d'entre eux par leur résultat intermédiaire. Nous disons alors que l'addition est "associative".
A3. Le zéro est l'élément neutre de l'addition car tout nombre additioné à zéro donne ce
même nombre.
A4. L'addition peut comporter un terme de telle façon à ce que le total soit nul. Nous disons
alors qu'il existe un "inverse" pour l'addition.
Soit des nombres quelconques alors nous pouvons noter également la somme
ainsi:
Exemples:
L'addition de deux nombres relativement petits est assez facile dès que nous avons appris par
cœur à compter jusqu'au nombre résultant de cette opération. Ainsi (nous basons nos
98/2001
Sciences.ch 14/03/2005
, ,
Pour les beaucoup plus grands nombres il faut adopter un autre méthode qu'il s'agit
d'apprendre par cœur. Ainsi par exemple:
Démarche : nous additionnons les colonnes (4 colonnes dans cet exemple) de droite à gauche.
Pour la première colonne nous avons donc 4+5=9 ce qui nous donne :
et nous continuons ainsi pour la deuxième 4+7=11 mais à la différence que comme nous
avons un nombre supérieur à la dizaine, nous reportons le premier chiffre (de gauche) sur la
colonne suivante de l'addition. Ainsi:
La troisième colonne se calcule dès lors comme 4+2+1=7 ce qui nous donne:
Pour la dernière colonne nous avons 9+5=14 et à nouveau nous reportons le premier chiffre
(de gauche) sur la colonne suivante de l'addition. Ainsi:
Voilà comment nous procèdons donc pour l'addition de nombres quelconques : nous faisons
une addition par colonne de droite à gauche et si le résultat d'une addition est supérieure à la
dizaine, nous reportons une unité sur la colonne suivante.
99/2001
Sciences.ch 14/03/2005
SOUSTRACTION
Définition : La soustraction du nombre entier par le nombre entier noté par le symbole "-
", c'est trouver le nombre qui, ajouté à , redonne .
Nous écrivons la soustraction sous la forme : qui doit évidemment vérifier que
Axiomes :
A1. La soustraction de plusieurs nombres ne dépend pas de l'ordre des termes. Nious disons
alors que la soustraction est une "opération commutative".
A2. La soustraction de plusieurs nombres ne change pas si l'on remplace deux ou plusieurs
d'entre eux par leur résultat intermédiaire. Nous disons alors que l'addition est "associative".
A3. Le zéro est l'élément neutre de la soustraction car tout nombre à qui on soustrait zéro
donne ce même nombre.
A4. La soustraction peut comporter un terme de telle façon à ce que le total soit nul. Nous
disons alors alors qu'il existe un "inverse pour la soustraction".
Exemples:
La soustraction de deux nombres relativement petits est assez facile dès que nous avons appris
par cœur à compter jusqu'à au moins le nombre résultant de cette opération. Ainsi:
, ,
Pour les beaucoup plus grands nombres il faut adopter un autre méthode qu'il s'agit
d'apprendre par cœur (au même titre que l'addition). Ainsi par exemple:
nous soustraions les colonnes (4 colonnes dans cet exemple) de droite à gauche. Pour la
première colonne nous avons a ce qui fait que nous reportons –1 sur la colonne
suivante et écrivons en bas de la barre d'égalité :
100/2001
Sciences.ch 14/03/2005
et nous continuons ainsi pour la deuxième ce qui fait que nous reportons –1 sur
la colonne suivante et comme nous reportons en bas de la barre
d'égalité:
Pour la dernière colonne nous avons nous reportons donc rien sur la colonne
suivante et comme nous reportons 0 en bas de la barre d'égalité:
Voilà comment nous procèdons donc pour la soustraction de nombres quelconques. Nous
faisons une soustraction par colonne de droite à gauche et si le résultat d'une soustraction est
inférieure à zéro nous faisonst reporter –1 sur la colonne suivante et l'addition du dernier
report sur la soustraction obtenue en bas de la barre d'égalité.
La méthodologie utilisée pour la soustraction se basant sur exactement le même principe que
l'addition nous ne l'expliciterons pas plus. Cette méthode est très simple et nécessite bien sûr
une certaine habitude de travailler avec les chiffres pour être totalement appréhendée.
MULTIPLICATION
Définition: La multiplication des nombres est une opération qui a pour but, étant donné deux
nombres, l'un appelé "multiplicateur", et l'autre "multiplicande", d'en trouver un troisième
appelé "produit" qui soit la somme (donc la multiplication d'écoule de la somme !) d'autant de
nombres égaux au multiplicande qu'il y a d'unités au multiplicateur. Le multiplicande et le
multiplicateur sont appelés les "facteurs du produit".
101/2001
Sciences.ch 14/03/2005
Le signe de croix "x" pour la multiplication se trouve pour la première fois dans l'ouvrage d'Ougtred (1631)
quant au point à mi-hauteur (notation moderne pour la multiplication), nous le devons à Leibniz. Dès 1544,
Stiefel, dans un de ses ouvrages n'employait aucun signe et désignait le produit de deux nombres en les placant
l'un après l'autre.
Remarque: le nombre de chiffres d'un produit de deux facteurs est au plus égal à la somme
des nombres des chiffres de ces deux facteurs et au moins égal à cette somme diminuée d'une
unité.
La puissance est une notation particulière d'un cas précis de multiplications. Lorsque le(s)
multiplicateur(s) et multiplicande(s) sont identique(s) en valeur numérique, on note la
multiplication (par exemple):
Vous pouvez vérifier par vous-même que ses propriétés sont les suivantes (par exemple):
Axiomes :
A1. La multiplication de plusieurs nombres ne dépend pas de l'ordre des termes. Nous disons
alors que la multiplication est une "opération commutative".
A2. La multiplication de plusieurs nombres ne change pas si l'on remplace deux ou plusieurs
d'entre eux par leur résultat intermédaire. Nous disons alors que la multiplication est
"associative".
A3. L'unité est l'élément neutre de la multiplication car tout multiplicande multiplié par la
multiplicateur 1 est égal au multiplicande.
A4. La multiplication peut comporter un terme de telle façon à ce que le produit soit égal à
l'unité (l'élément neutre). Nous disons alors qu'il existe un "inverse pour la multiplication".
Soit des nombres quelconques (non nécessairement égaux) alors nous pouvons
noter le produit ainsi:
102/2001
Sciences.ch 14/03/2005
Exemples :
La multiplication de deux nombres relativement petits est assez facile dès que nous avons
appris par cœur à compter jusqu'à au moins le nombre résultant de cette opération. Ainsi:
, ,
Pour les beaucoup plus grands nombres il faut adopter un autre méthode qu'il s'agit
d'apprendre par cœur. Ainsi par exemple:
nous multiplions colonne par colonne et nous additionnons l'ensemble des résultats décalés
d'un chiffre comme ci-dessous (8x4=32, 8x7=56, 8x5=40, 8x4=32) ainsi nous obtenons :
103/2001
Sciences.ch 14/03/2005
Cette méthodologie est très logique si vous avez bien compris comment nous construisons un
chiffre en base dix. Ainsi, nous avons (nous supposerons pour l'instant la distributivité comme
connue):
Pour ne pas surcharger l'écriture dans la multiplication par la méthode "verticale", nous ne
représentons pas les zéros qui surchargeraient inutilement les calculs (et ce d'autant plus si le
multiplicateur le multiplicande sont de très grands nombres)
DIVISION
Définition: La division des nombres entiers est une opération, qui a pour but, étant donné
deux nombres, l'un appelé "dividende", l'autre appelé "diviseur", d'en trouver un troisième
appelé "quotient" qui soit le plus grand nombre dont le produit par le diviseur puisse se
retrancher (donc la division découle de la soustraction !) du dividende (la différence étant
nommé le "reste" ou la "congruence").
Remarque : dans les cas des nombre réels il n'y a jamais de reste à la fin de l'opération de
division (tel que le quotient multiplié par le diviseur donne exactement le dividende). ! D'une
façon générale dans le cadre des nombres entiers, si nous note la dividende, le diviseur,
le quotient et le reste nous avons la relation:
Nous désignons également souvent par "fraction" (au lieu de "quotient"); le rapport de deux
nombres ou autrement dit, la division du premier par le deuxième (pris dans un ordre
arbitrairement choisi).
Remarque : le signe de la division ":" est dû à Leibniz; la barre de fraction se trouve elle pour
la première fois dans les ouvrages de Fibonacci (1202); elle est probablement due aux
104/2001
Sciences.ch 14/03/2005
Hindous.
Si nous divisons deux entiers et que nous souhaite un entier comme quotient et reste (s'il y en
a un) uniquement, alors nous parlons de "division euclidienne".
Nous indiquons l'opération en plaçant entre les deux nombres, le dividende et le diviseur un
" : " ou une barre de division " / " :
Si nous avons :
on appelle l'inverse du dividende. A tout nombre est associé un inverse qui satisfait cette
condition.
De cette définition il vient la notation (avec étant un nombre quelconque différent de zéro) :
Dans le cas de deux nombres fractionnaires, nous disons qu'ils sont "inverses" ou
"réciproques", lorsque leur produit est égal à l'unité (comme la relation précédente) pour toute
valeur de , positive ou négative.
Remarques :
R1. une division par zéro est ce que l'on nomme une "singularité". C'est-à-dire que le résultat
de la division est indéterminé (ce qui n'est pas le même chose que de dire qu'il n'y a pas de
solution).
R2. lorsque nous multiplions le dividende et le diviseur d'une division par un même nombre,
le quotient ne change pas, mais le reste est multiplié par ce nombre.
R3. diviser un nombre par un produit effectué de plusieurs facteurs revient à diviser ce
nombre successivement par chacun des facteurs du produit et réciproquement.
Les propriétés des divisions avec les puissances sont les suivantes (nous laisserons le soin au
lecteur de le vérifier avec des valeurs numériques):
ou :
Rappelons qu'un nombre premier est un nombre qui n'a d'autres diviseurs que lui-même et
105/2001
Sciences.ch 14/03/2005
l'unité. Donc tout nombre qui n'est pas premier à un nombre premier comme diviseur. Le plus
petit des diviseurs d'un nombre entier est donc un nombre premier.
Quelques propriétés de la division (certaines nous sont déja connues car elles découlent d'un
raisonnement logique des propriétés de la multiplication) :
Axiomes :
A1. La division de plusieurs nombres ne dépend pas de l'ordre des termes. Nous disons alors
que la division est une "opération commutative".
A2. La division de plusieurs nombres ne change pas si l'on remplace deux ou plusieurs d'entre
eux par leur résultat intermédaire. Nous disons alors que la division est "associative".
A3. L'unité est l'élément neutre de la division car tout dividende divisé par le diviseur 1 est
égal au dividende.
A4. La division peut comporter un terme de telle façon à ce que la division soit égal à l'unité
(l'élément neutre). Nous disons alors qu'il existe un "inverse pour la division".
Si et sont deux nombres réels positifs nous avons (nous vous laissons bien sûr observer
la cas où doit être non nul) :
Nous pouvons maintenant définir la racine q-ième principale d'un nombre quelconque :
106/2001
Sciences.ch 14/03/2005
qui est une racine, le nombre est le "radicande" et est l'indice de la racine. Le symbol
est appelé le "radical".
De ce qui a déjà été dit pour les puissances, nous pouvons conclure aisément que:
et :
il en ressort que :
et
si et :
si est pair.
Remarques :
107/2001
Sciences.ch 14/03/2005
R1. "simplifier" une expression contenant des puissances de nombres réels signifie qu'il faut
regrouper les termes ayant des exposants identiques.
R2. si et est impair, alors est le nombre réel négatif tel que .
Si la est impaire alors bien sûr, comme nous l'avons déjà vu, la racine est complexe
(voir les nombres complexes dans le chapitre traitant des nombres).
POLYNÔMES ARITHMÉTIQUES
Les composants enfermés dans le polynôme sont appelés "termes" du polynôme. Lorsque le
polynôme contient un unique terme, nous parlons alors de "monôme", s'il y a deux termes
nous parlons de "binôme", et ainsi de suite....
Démontrons que la valeur d'un polynôme arithmétique est égale à l'excès de la somme des
termes précédés du signe + sur la somme des termes précédés du signe -.
Démonstration:
Mettre en évidence l'unité négative –1 est ce que l'on appelle une "factorisation" ou "mise en
facteurs". L'opération inverse, s'appellant une "distribution".
Le produit de plusieurs polynômes peut toujours être remplacé par un polynôme unique que
nous appellons "le produit effectué". Nous opèrons habituellement comme suit: nous
multiplions successivement tous les termes du premier polynôme, en commençant par la
gauche, par le premier, le second, …, le dernier terme du second polynôme. Nous obtenons
ainsi un premier produit partiel; nous faisons, s'il y a lieu, la réduction des termes semblables.
Nous multiplions ensuite chacun des termes du produit partiel successivement par le premier,
le second, …, le dernier terme du troisième polynôme en commençant par la gauche et ainsi
de suite.
Soit, en général:
108/2001
Sciences.ch 14/03/2005
pour faire la multiplication des polynômes nous multiplions tous les termes
de successivement par tous ceux de pris dans l'ordre de gauche à droite; puis nous
multiplions tous les termes du produit pas ceux de , et ainsi de suite. Un terme quelconque a
une expression de la forme , en désignant par l'un des entiers , et de
même pour et pour . Dans le produit total, les termes pris dans l'ordre successif sont
d'abord ceux qui ne contiennent que en nombre ; puis ceux qui ne contiennent que ou
, pris séparément ou simultanément; ils sont en nombre ; puis les termes du produit par
qui sont en nombre , et ainsi de suite. On voit ainsi que le rang du terme
est fourni par l'expression:
Inversement, lorsque est donné, nous observons que est l'entier de la division de par
, que est l'entier de la division du reste par , et ainsi de suite. En particulier, si
, la détermination du terme qui correspond à un rang donné revient à écrire
dans le système de numération de base .
pour avoir le signe du terme de rang , nous écrivons ce nombre dans le système de
numération binaire; le terme correspondant est positif, ou négatif, suivant que le nombre des
1, et celui des 0 qui terminent sont, ou ne sont pas, de même parité.
VALEUR ABSOLUE
Définition: nous appellons "valeur absolue" d'un nombre réel noté , le nombre réel non
négatif, qui satisfait aux conditions suivantes:
(positif) si
(positif) si
et :
109/2001
Sciences.ch 14/03/2005
Corollaires:
C1. La valeur absolue de la somme algébrique de plusieurs nombres réels n'est pas supérieure
à la somme à la somme des valeurs absolues des composantes de la somme.
C2. La valeur absolue de la différence n'est inférieur à la différence des valeurs absolues des
composantes de la différence.
C3. La valeur absolue du produit (multiplication) est égale au produit des valeurs absolues.
C4. La valeur absolue du rapport est égale au rapport des valeurs absolues.
Remarque : nous emploierons le symbole de valeur absolue pour définir la distance entre deux
points quelconques d'une droite quelconque (si elle est complexe nous en prendrons le module
des points qui la composent). Ainsi, si et sont la norme ou le module (concepts que nous
connaissons que partiellement pour l'instant) de coordonnées de deux points et d'un
droite, alors la distance (ou "longueur") entre les deux points de la droit est défini par :
RÉGLES DE CALCUL
Nous avons déjà vu qu'elles étaient les propriétés des opérations d'addition, soustraction,
multiplication, mise en puissance et division. Nous tenons donc à ce que le lecteur différencie
la notion de "propriété" de celle ce de "priorité" (que nous allons tout de suite voir) qui sont
des choses complètement différentes.
Autrement dit:
1. Les opérations qui sont entre parenthèses ( ) doivent êtres effectuées en premier dans le
polynôme.
2. Les opérations qui sont entre crochets [ ] doivent êtres effectuées en second à partir des
résultats obtenus des opérations qui se trouvaient entre les parenthèses ( ).
110/2001
Sciences.ch 14/03/2005
3. Finalement, à partir des résultats intermédiaires des opérations qui se trouvaient entre
parenthèses ( ) et crochets [ ], nous calculons les opérations qui se situent entre les accolades
{ }.
Selon les règles que nous avons définies tout à l'heure, nous calculons d'abord tous les
éléments qui sont entre parenthèses ( ), c'est-à-dire:
, ,
Toujours selon le règles que nous avons définies tout à l'heure, nous calculons maintenant
tous les éléments entre crochets en commençant toujours à calculer les termes qui sont dans
les crochets [ ] au plus bas niveau des autres crochets [ ]. Ainsi, nous commence par calculer
l'expression qui se trouve dans le crochet de niveau supérieur: .
Nous calculons maintenant l'unique terme entre accolade, ce qui nous donne :
Evidemment il s'agit d'un cas particulier... Mais le principe est toujours le même.
La priorité des opérateurs arithmétiques est une notion spécifique aux langages informatiques
(comme nous en avons déjà fait mention) du fait qu'on ne peut dans ces derniers écrire des
relations mathématiques que sur une ligne unique.
111/2001
Sciences.ch 14/03/2005
ou ou
ce qui vous en conviendrez, est fort dangereux car nous arriverons à des résultats différents à
chaque fois (cas particuliers mis à part…) !
Ainsi, il a logiquement été défini un ordre de priorité des opérandes tel que les opérations
soient effectuées dans l'ordre suivant:
1. – Négation
2. ^ Puissance
3. * / Multiplication et division
6. + - Addition et soustraction
Evidemment les règles des parenthèses ( ), crochets [ ], et accolades { } qui ont été définies en
mathématiques s'appliquent à l'informatique.
Ainsi, nous obtenons dans l'ordre (nous remplacons chaque opération effectuée par un
symbole):
Ensuite les règles de priorité des opérateurs s'appliquent dans l'ordre défini précédemment:
D'abord (1):
ensuite (2) :
112/2001
Sciences.ch 14/03/2005
Finalement (6) :
Ainsi, en suivant ces règles, ni l'ordinateur, ni l'être humain ne peuvent (ne devraient) se
tromper lors de l'interprétation d'une équations écrite sur un ligne unique.
L'opérateur de concaténation " & " est évalué avant les opérateurs de comparaisons.
Les opérateurs de comparaison (=, <, >, …) possèdent tous une priorité identique.
Cependant, les opérateurs les plus à gauche dans une expression, détiennent une priorité plus
élevée.
Maintenant que nous avons vu les priorités des opérateurs, quelles sont les règles des signes
en vigueur en mathématiques?
D'abord, il faut savoir que ces dernières ne s'appliquent que dans le cas de la multiplication et
la division. Soit deux nombres positifs . Nous avons:
Autrement dit, la multiplication de deux nombres positifs est un nombre positifs et ce pour
généralisable à la multiplication de nombres positifs.
Autrement dit, la multiplication d'un nombre positif par un nombre négatif est négatif. Ce qui
113/2001
Sciences.ch 14/03/2005
Autrement dit, la multiplication de deux nombres négatifs est positif. Ce qui est généralisable
à un résultat positif de la multiplication s'il y a un nombre pair de nombre négatifs et à un
résultat négatif pour un nombre impair de nombres négatifs.
et
et
et
Evidemment, si nous avons une soustraction de termes, il est possible de la récrire sous la
forme :
114/2001
Sciences.ch 14/03/2005
La théorie des nombres est un sujet très vaste qui englobe de nombreuses parties des
mathématiques dont les probabilités, la statistique, la théorie des graphes, la théorie des
ensembles, l'algèbre (d'une certaine façon) et encore bien d'autres...
Nous avons choisi de ne présenter dans cet exposé, que les sujets qui sont indispensables à
l'étude de la mathématique et de la physique théorique ainsi que ceux devant faire partie de la
culture générale du scientifique.
Nous pouvons utiliser ce théorème pour démontrer une propriété importante des nombres :
PROPRIÉTÉ ARCHIMÉDIENNE
Démonstration:
Si nous démontrons que cela est absurde pour tout alors on aurons démontré la propriété
archimédienne.
ce qui voudrait dire que , d'où une contradiction évident. Cette contradiction amène
que l'hypothèse initiale comme quoi pour tout alors est fausse et donc que la
propriété archimédienne est démontrée par l'absurde.
PRINCIPE D'INDUCTION
115/2001
Sciences.ch 14/03/2005
Soit un ensemble de nombres naturels qui possède les deux propriétés suivantes :
P1.
P2. Si , alors
Alors :
Démonstration :
Soit (le symbole " \ " signifiant "excluant"). Nous voulons démontrer que .
Supposons le contraire :
Par le principe du bon ordre, puisque alors , doit posséder un plus petit élément .
Mais puisque , nous avons que , c'est-à-dire aussi . En faisant appel
à (P2), nous avons finalement que , c'est-à-dire que , donc une contradiction.
Exemple d'application :
Nous souhaitons montrer à l'aide du principe d'induction, que la somme des premiers carrés
est égale à , c'est-à-dire que pour nous aurions:
Démonstration :
D'abord la relation ci-dessus est facilement vérifiée pour nous allons montrer que
vérifie aussi cette relation. En vertu de l'hypothèse d'induction:
La suite de Fibonacci (voir le chapite des fonctions arithmétiques dans cette section) possède
la propriété suivante : la somme des premiers termes consécutifs de la suite, augmentée de 1,
est égale au terme qui suit de rangs le terme auquel on s'est arrêté.
116/2001
Sciences.ch 14/03/2005
Pour démontrer cette propriété, nous constate que cette dernière est aisément vérifiée pour les
premières valeurs , de . Supposons que la propriété ait été démontrée pour et
pour . Nous avons :
par conséquent, en ajoutant ces deux égalités et tenant compte de la loi de formation nous
obtenons :
Ce procédé de démonstration est d'une très grande importance dans l'étude de l'arithmétique;
souvent l'observation et l'induction ont permis de soupçonner des lois qu'il eût été plus
difficile de trouver par "a priori". Nous nous rendons compte de l'exactitude des formules par
la méthode précédente qui a donné naissance à l'algèbre moderne par les études de Fermat et
de Pascal sur le triangle de Pascal (voir la section d'algèbre)
LA DIVISIBILITÉ
Soit avec . Nous disons que " divise (sans restes)" s'il existe un entier (le
quotient) tel que :
Dans le cas contraire, nous écrivons et nous lisons " ne divise pas ".
Remarque : si , nous dirons aussi que " est divisible par " ou que " est un
multiple de ". Dans le cas où et que , nous dirons que est un "diviseur
propre" de . De plus, il est clair que quel que soit sinon quoi nous avons
une singularité. Enfin, nous écrira pour signifier que mais que .
Démonstration:
117/2001
Sciences.ch 14/03/2005
T2. Si et , alors
Démonstration:
T3. Si et , alors ,
Démonstration:
et ainsi que
T4. Si et , alors
Démonstration:
Démonstration:
DIVISION EUCLIDIENNE
Démonstration :
Considérons l'ensemble:
Il est facile de voir que et donc que , d'où, d'après le principe du bon
ordre, nous concluons que contient un plus petit élément . Soit l'entier satisfaisant
à . Il reste à montrer que . Supposons le contraire à nouveau (démonstration
118/2001
Sciences.ch 14/03/2005
par l'absurde), c'est-à-dire que . Alors, dans ce cas, nous avons , ce qui
est équivalent à ; mais et , ce
qui contredit le fait que est le plus petit élément de . Donc, . Enfin, il est
clair que si , nous avons , d'où la seconde affirmation du théorème.
où
Or, cette relation peut s'écrire , où bien sûr, - est un entier. La conclusion est
que la division euclidienne peut s'énoncer sous la forme plus générale :
Les entiers et sont dans la division euclidienne uniques. En effet, s'il existe deux autres
entiers et tels que avec toujours , alors et ainsi
. En vertu de (T5) nous avons, si , . Or, cette dernière inégalité
est impossible puisque . Donc, et, puisque , alors ; d'où
l'unicité.
Soit tels que . Le "plus grand commun diviseur" (noté "p.g.c.d" par la suite)
de , noté :
P1. et
Remarque: notons que 1 est un diviseur commun de deux entiers arbitraires. Cependant, il
n'est pas évident que le p.g.c.d de deux entiers existe toujours; ce fait est démontré
dans le théorème suivant (cependant, si le p.g.c.d existe, il est de par sa définition unique) :
119/2001
Sciences.ch 14/03/2005
Démonstration:
et donc et , ce qui contredit le fait que est le plus petit élément possible de .
Donc, et, de la même façon, nous démontrons que .
Corollaire:
Démonstration:
Ainsi se termine la démonstration. Les hypothèses peuvent vous sembler compliquées mais
portez plutôt votre attention un certain temps sur la dernière relation. Vous allez tout de suite
comprendre!
Remarque: si au lieu de définir le p.g.c.d de deux entiers non nuls, nous permettons à l'un
d'entre eux d'être égal à 0, disons , ? Dans ce cas, nous avons et , selon notre
définition du p.g.c.d, il est clair que .
120/2001
Sciences.ch 14/03/2005
P1.
P2. où
P3.
Dans certains ouvrages, ces quatre propriétés sont "démontrées" en utilisant intrinsèquement
la propriété elle-même. Personnellement nous nous en abstiendrons car faire cela est plus
ridicule qu'autre chose à notre goût car la propriété est un démonstration en elle-même.
Elaborons maintenant un méthode qui s'avérera très importante pour calculer le plus grand
commun diviseur de deux entiers (utile en informatique parfois).
ALGORITHME D'EUCLIDE
Démonstration:
Or, en utilisant l'équation précédant l'avant dernière équation du système, nous avons :
121/2001
Sciences.ch 14/03/2005
Exemple:
Calculons le plus grand commun diviseur de (966,429) et exprimons ce nombre comme une
combinaison linéaire de 966 et de 429.
est le plus petit entier positif par tous les communs multiples de .
122/2001
Sciences.ch 14/03/2005
Puisque , alors l'ensemble est non vide et, d'après l'axiome du bon ordre,
l'ensemble contient un plus petit élément positif.
Théorèmes :
Démonstration:
T2. Si , alors
T3.
Démonstration:
Pour la démonstration, nous allons utiliser le "lemme d'Euclide" qui s'énonce ainsi :
Si et alors .
Démonstration :
123/2001
Sciences.ch 14/03/2005
Lorsque nous multiplions des deux côtés de l'équation par , le résultat suit et la
démonstration est effectuée
Tout nombre naturel peut s'écrire comme un produit de nombres premiers, et cette
représentation est unique, à part l'ordre dans lequel les facteurs premiers sont disposés.
Si est premier, alors la preuve est terminée. Supposons que n'est pas premier et
considérons l'ensemble:
Alors, et , puisque est composé, nous avons que . D'après le principe du bon
ordre, possède un plus petit élément qui est premier, sans quoi le choix minimal de
serait contredit. Nous pouvons donc écrire . Si est premier, alors la preuve est
terminée. Si est composé, alors nous répètons le même argument que précédemment et
nous en déduisons l'existence d'un nombre premier et d'un entier tels que
. En poursuivant ainsi nous arrivons forcément à la conclusion que sera
premier.
Donc finalement nous avons bien démontré qu'un nombre quelconque est décomposable en
facteurs de nombres premiers à l'aide du principe du bon ordre.
Nous ne connaissons pas à ce jour de loi qui permette de calculer le -ième facteur premier
. Ainsi, pour savoir si un entier est premier, il est pratiquement plus facile à ce jour de
vérifier sa présence dans une table de nombres premiers.
Soit un nombre , si nous voulons déterminer s'il est premier ou non, nous calculons s'il est
divisible par les nombres premiers qui appartiennent à l'ensemble :
Exemple: L'entier 223 n'est divisible par 2, ni par 3, ni par 5, ni par 7, ni par 11, ni par 13. Il
est inutile de continuer avec le prochain nombre premier, car . Nous en
déduisons dès lors que le nombre 223 est premier.
124/2001
Sciences.ch 14/03/2005
NOMBRES CONGRUS
Définition: soit . Nous disons que " est congru à modulo ", et nous
écrivons :
si ; dans le cas contraire, nous disons que " est non congru à modulo ".
D'autre part, nous pouvons étendre la signification du mot "reste" en disant que deux nombres
congrus pour le module sont "résidus" l'un de l'autre pour ce module.
L'égalité entre deux nombres, en supprimant les multiples du module, s'appelle "congruence"
ou "équivalence". La notation de Gauss permet de mettre en évidence l'analogie qui existe
entre les égalités et les congruences, sans introduire de confusion.
P1. Nous pouvons peut ajouter ou retrancher membre à membre des congruences de même
module.
P2. Nous pouvons multiplier les deux membres d'une congruence par un même nombre entier.
P3. Nous pouvons multiplier membre à membre les congruences de même module.
P4. Nous pouvons élever à une même puissance les deux membres d'une congruence.
Des ces propriétés il vient que si nous désignons par un polynôme à coefficient entiers,
positifs ou négatifs:
Si nous remplacons successivement par tous les nombres entiers dans un polynôme
à coefficients entiers, et si nous prenons les résidus pour le module , ces résidus se
reproduisent de en (dans le sens où la congruence se vérifie), puisque nous avons, quel
que soit l'entier et :
en nombres entiers, si désigne l'un quelconque des non-résidus (un résidu qui ne satisfait
pas la congruence).
125/2001
Sciences.ch 14/03/2005
La "preuve par 9" dans le système de numérotation décimale, pour les quatre opérations
fondamentales de l'arithmétique (+, - , x, / ), repose sur les théorèmes que nous venons de voir
sur les congruences, en supposant .
En effet, suivant le module , toutes les puissances de dix sont congrues à l'unité,
puisque , étant un nombre formé exclusivement des chiffres 9999…., est divisible par
9. Par conséquent, si désignent respectivement les chiffres des unités, dizaines,
centaines, … d'un nombre écrit dans le système décimal, nous avons :
En d'autres termes, le reste de la division d'un nombre par 9 est égal au reste de la division par
9, de la somme de ses chiffres.
Par conséquent, si l'on remplace, dans les quatre opérations fondamentales de l'arithmétique,
les nombres donnés par leurs restes suivant le module 9, les nombres obtenus doivent êtres
congrus à ceux qu'on déduirait des résultats; sinon il y aurait erreur dans les calculs.
126/2001
Sciences.ch 14/03/2005
Lors de notre études des nombres, des opérateurs, et de théorie des nombres (voir chapitres du
même nom), nous avons assez souvent utilisé les termes de "groupes, "d'anneaux", de "corps",
"d'homomorphisme", etc. et continuerons par la suite à le faire encore de nombreuses fois.
Outre le fait que ces concepts soient d'une extrême importance, permettant de faire des
démonstrations ou de construire des êtres mathématiques indispensables à l'étude de la
physique théorique contemporaine (physique quantique des champs, théories de cordes,
modèles standard,...), ils permettent de comprendre les composants et les propriétés de base
de la mathématique et de ses opérateurs en rangeant ceux-ci par catégories distinctes. Ainsi,
choisir de mettre la théorie des ensembles en tant que cinquième chapitre de ce site est un
choix tout à fait discutable puisque rigoureusement c'est par là que tout commence...
Cependant, nous avions besoins d'exposer quand même la théorie de la démonstration ne
serait-ce que pour les notations et les méthodes dont il sera fait usage ici.
Nous parlons alors de "diagramme sagittal" (ou de "schéma sagittal" du latin sagitta = flèche).
127/2001
Sciences.ch 14/03/2005
Cependant le choix d'introduire la théorie des ensembles dans les classes d'école a une raison
aussi un peu autre. Au fait, dans un souci de rigueur interne (in extenso : non liées à la
réalité), une très grande partie des mathématiques a été reconstruite à l'intérieur d'un seul
cadre axiomatique, dénommé donc "théorie des ensembles", dans le sens où chaque concept
mathématique (autrefois indépendant des autres) est ramené à une définition dont tous les
constituants logiques proviennent de ce même cadre : elle est considérée comme
fondamentale. Ainsi, la rigueur d'un raisonnement effectué au sein de la théorie de ensembles
est garantie par le fait que le cadre est "non-contradictoire" ou "consistant".
DÉFINITIONS
ou
Nous identifiions également un ensemble soit en listant ses éléments, soit en donnant la
définition de ses éléments. Par exemple:
- par exemple
D3. Un ensemble est dit ordonnée (muni d'une relation d'ordre – voir le chapitre traitant des
opérateurs dans la présente section) si soit une relation d'ordre et deux éléments de
nous avons :
ou
Remarques :
R1. la structure d'ensemble ordonnée a été mise en place dans le cadre de la théorie des
nombre par Canton et Dedekind.
128/2001
Sciences.ch 14/03/2005
R2. il se peut, en effet que nous n'ayons ni , ni : nous parlons alors "d'ordre partiel",
sinon, l'ordre est "total".
est un ordre sur , dit "ordre réciproque" de . L'ordre réciproque de l'ordre usuel est
l'ordre noté ainsi que l'ordre réciproque de l'ordre " divise " dans est l'ordre " est
multiple de ".
L'ensemble est l'être mathématique de base, dont l'existence est posée : il n'est pas défini en
tant que tel, mais par ses propriétés, donées par les axiomes. Il fait appel à une procédure
humaine : une sorte de "fonction de catégorisation", qui permet à la pensée de distinguer
plusieurs éléments qualifiés d'indépendants.
Nous pouvons démontrer à partir des ces concepts, que le nombre de sous-ensembles d'un
ensemble de cardinal (nombre d'éléments) est :
Exemple :
- Les singletons :
- Les "duets" :
- lui-même :
Remarque : l'ordre dans lequel sont différenciés les éléments ne rentrent pas en compte lors
129/2001
Sciences.ch 14/03/2005
AXIOMES
L'axiomatique (dite "ZF") présentée ci-dessous a été formulée par Ernst Zermela (1908) puis
précisée par Adolf Abraham (1922); c'est la plus naturelle. Il en existe bien d'autres, basées
sur le concept plus général de "classe", comme celle développée par von Neumann, Bernays
et Gödel (pour les notations, voir le chapitre traitant de la théorie de la démonstration)
Deux ensembles sont égaux si, et seulement si, ils ont les mêms éléments. C'est ce que nous
notons :
Cette définition exprime seulement le fait qu'un ensemble ne contient rien d'autre que ce qui
est spécifié par la donnée ses éléments.
L'ensemble vide existe, il n'a aucun élément, son cardinal est noté 0; si est un objet, est
un ensemble appelé singleton (single = seul), son cardinal est 1. Si et sont des objets
distincts, est un ensemble appelé "paire", son cardinal est 2.
Soient et deux ensembles. Il existe un ensemble dont les éléments sont exactement
ceux qui appartiennent à et à . Nous notons cela :
Soit un ensemble. Il existe un autre ensemble dont les éléments sont exactement les parties
de . Il est noté :
130/2001
Sciences.ch 14/03/2005
est autosuccesseur :
Cet ensemble permet d'utiliser des ensembles infinis. est ainsi le plus petit ensemble
autosuccesseur, au sens de l'inclusion et par convention nous notons
(ou nous construisons l'ensemble des naturels) :
Pour tout ensemble non vide , il existe un ensemble , élément de tel qu'aucun élément
de ne soit élément de (il faut bien différencien le niveau du langage utilisé, un ensemble
et ses éléments n'ont pas le même statut) ce que nous notons :
En conséquence :
Cet axiome est primordial : le respect de ses conditions très strictes d'application permet
d'éliminer les paradoxes de la "théorie naïve des ensembles", comme le paradoxe de Russel ou
le paradoxe de Cantor qui ont invalidé la théorie naïve des ensembles.
Considérons par exemple l'ensemble de Russell de tous les ensembles qui ne s'auto-
contiennent pas (notez bien que nous donnons une propriété de sans expliciter quel est cet
ensemble) : . Le problème est de savoir si se contient ou non. Si ,
131/2001
Sciences.ch 14/03/2005
alors, s'auto-contient, et, par définition et inversement. Chaque possibilité est donc
contradictoire.
Si maintenant nous désignons par l'ensemble de tous les ensembles (l'Universel de Cantor),
nous avons en particulier : , ce qui est impossible (i.e. par exemple avec la
puissance du continu de l'ensemble de réels), d'après le théorème de Cantor.
Ces "paradoxes" (ou antinomies syntaxiques) proviennent d'un non respect des conditions
d'application de l'axiome de sélection : pour définir (dans l'exemple de Russel), il doit
exister une proposition qui porte sur l'ensemble , qui doit être explicité. La
proposition définissant l'ensemble de Russell ou celui de Cantor n'indique pas quel est
l'ensemble ; elle est donc invalide.
Un exemple fort symphatique et fort connu (c'est la raison pour laquelle nous le présentons)
permet de mieux comprendre (il s'agit du paradoxe de Russel) :
Un jeune étudiant se rendit un jour chez son barbier. Il engagea la conversation et lui demanda
s'il avait de nombreux concurrents dans sa jolie cité. De manière apparemment innocente, le
barbier lui répondit :"Je n'ai aucune concurrence. En effet, de tous les hommes de la cité, je ne
rase évidemment pas ceux qui se rasent eux-mêmes, mais j'ai le bonheur de raser tous ceux
qui ne se rasent pas eux-mêmes."
En quoi donc, une telle affirmation si simple put-elle mettre en défaut la logique de notre
jeune étudiant si malin ?
La réponse est en effet innocente, jusqu'au moment ou nous décidons de l'appliquer au cas du
barbier :
Supposons qu'il se rase lui-même : il entre dans la catégorie de ceux qui se rasent eux-mêmes,
dont le barbier a précisé qu'il ne les rasait évidemment pas. Donc il ne rase pas lui-même.
Très bien ! Supposons alors qu'il ne se rase pas lui-même : il entre alors dans la catégorie de
ceux qui ne se rasent pas eux-mêmes, dont le barbier a précisé qu'il les rasait tous. Donc il se
rase lui-même.
Finalement, ce malheureux barbier est dans une position étrange : s'il se rase lui-même, il ne
se rase pas, et s'il ne se rase pas lui-même, il se rase. Cette logique est autodestructrice,
stupidement contradictoire, rationnellement irrationnelle.
132/2001
Sciences.ch 14/03/2005
- Le produit cartésien (voir plus loin une définition complète) d'une famille infinie
d'ensembles non vides est non vide
- Tout ensemble peut être bien ordonné (un ensemble ordonné par une relation d'ordre est
dit bien ordonné si toute partie non vide de contient un plus petit élément)
La théorie des ensembles basée sur les axiomes 1 à 7 est dite de Zermelo (Z). Complétée par
l'axiome 8, nous parlons de la théorie Zermelo-Fraenkel ou, plus simplement, la théorie ZF. Si
nous lui ajoutons l'axiome du choix, elle est dite ZFC ("C" comme choix - pour l'axiome du
même nom).
CARDINAUX
Définition : des ensembles sont dits "équipotents" s'il existe une bijection (correspondance
biunivoque) entre ces ensembles. Nous disons qu'ils ont alors même "cardinal".
Ainsi, plus rigoureusement, un cardinal (qui quantifie le nombre d'éléments contenus dans
l'ensemble) est une "classe d'équivalence" pour la relation d'équipotence.
Si nous écrivons en tant qu'égalité de cardinaux, nous entendons alors par là qu'il
existe deux ensembles équipotents et tels que :
et .
Les cardinaux peuvent êtres comparés. L'ordre ainsi défini est une relation d'ordre total entre
les cardinaux. Dire que signifie que est équipotent à une partie propre de , mais
n'est équipotent à aucune partie propre de .
Nous avons vu lors de notre étude des nombres, en particulier des nombres transfinis, qu'un
ensemble équipotent (ou en bijection) à était dit "dénombrable".
Soit un ensemble, s'il existe un entier tel qu'il y ait au moins à chaque élément de un
correspondant dans l'ensemble (nous parlons alors de bijection) nous disons alors
que le cardinal de , noté , est de "cardinal fini" et vaut .
Dans le cas contraire, nous disons que l'ensemble est de "cardinal infini" et nous posons :
133/2001
Sciences.ch 14/03/2005
Un ensemble de nombres est donc "dénombrable" s'il existe une bijection entre et .
Un ensemble de nombre est "au plus dénombrable" s'il existe une bijection entre et une
partie . Un ensemble au plus dénombrable est donc soit de cardinal fini, soit dénombrable.
P2. un ensemble contenant un ensemble non-dénombrable n'est lui aussi pas dénombrable
Remarque : nous pouvons restreindre un ensemble de nombres par rapport à l'élément nul et
aux éléments négatifs ou positifs qu'il contient et dès lors nous notons (exemple pour
l'ensemble des réels):
Un résultat important: tout ensemble infini possède donc une partie infinie dénombrable.
Puisque nous avons démontré dans le chapitre traitant des nombres que l'ensemble des réels
avait la "puissance du continu" et que l'ensemble des nombres naturels était de cardinal
transfini , Cantor souleva la question s'il existait un cardinal transfini entre et le
cardinal de ? Autrement dit, existe-il un ensemble infiniment grand qui serait intermédiaire
entre l'ensemble des nombres entiers et l'ensemble des réels?
134/2001
Sciences.ch 14/03/2005
selon la loi combinatoire qui donne le nombre d'éléments de l'ensemble que l'on peut obtenir à
partir de tous les sous-ensembles d'un ensemble (tel que nous l'avons démontré
précedemment).
Le reste de sa vie, Cantor essaya, en vain, de démontrer ce résultat que l'on nomma
"l'hypothèse du continu". Il n'y réussit pas et sombra dans la folie. En 1900, au congrès
international des mathématiciens, Hilbert estima qu'il s'agissait là d'un des 23 problèmes
majeurs qui devraient êtres résolus au XXème siècle.
Ce problème se résout d'une façon assez étonnante. D'abord, en 1938, un des plus grands
logiciens du XXème siècle, Kurt Gödel, démontra que l'hypothèse de Cantor n'était pas
réfutable, c'est-à-dire qu'on ne pourrait jamais démontrer qu'elle était fausse. Puis en 1963, le
mathématicien Paul Cohen boucla la boucle. Il démontra qu'on ne pourrait jamais non plus
démontrer qu'elle était vraie !!! Nous ne pouvons conclure à juste raison que Cantor avait
perdu la raison à chercher à démontrer une problème qui ne pouvait pas l'être.
PRODUIT CARTÉSIEN
Si et sont deux ensembles, nous appelons "produit cartésien de par " l'ensemble
noté (à ne pas confondre avec le produit vectoriel) formé de tous les couples possibles
où est un élément de et un élément de .
Autrement écrit:
Nous remarquons facilement que et ne sont pas les mêmes ensembles (sauf bien
sur si ).
135/2001
Sciences.ch 14/03/2005
De là, nous voyons que si les ensembles sont finis alors le produit cartésien
est aussi fini et nous avons :
Quelques exemples:
1. Si est l'ensemble des nombres réels, est alors l'ensemble des couples de réels. Dans le
plan rapporté à un repère, tout point admet des coordonnées qui sont un élément de .
2. Lorque nous lançons deux dés dont les faces sont numérotées de 1 à 6, chaque dé peut être
symbolisé par l'ensemble . Le résultat d'un lancer est alors un élément de
. Le cardinal de est alors 36. Il y a donc 36 résultats possibles quand nous
lançons 2 dés dont les faces sont numérotées de 1 à 6.
BORNES
D2. Soit . est appelé "plus petite borne supérieure" ou "majorant" noté :
de si est une borne supérieure de et si est une autre borne
supérieure quelconque de façon à ce que .
OPÉRATIONS ENSEMBLISTES
Soit , , des sous-ensembles (ou parties) d'un ensemble donné , appelé "Univers" (de
Cantonr). Nous désignons par l'ensemble des parties de .
Nous pouvons construire à partir d'au moins trois ensembles, l'ensemble des opérations (dont
nous devons les notations à Dedekind) existant dans le théorie des ensembles.
Remarque: certaines des notations présentes ci-dessous se retrouveront fréquemment dans des
théorèmes complexes, il est donc nécessaire de bien comprendre de quoi il en retourne.
136/2001
Sciences.ch 14/03/2005
Ainsi :
INCLUSION
est "inclus" (ou "fait partie", ou encore est un "sous-ensemble") dans alors pour tout
appartenant à chacun des ces appartient aussi à .
INTERSECTION
Plus généralement, si est une suite d'ensembles indexés par , l'intersection des
est notée :
C'est-à-dire que l'intersection de la suite d'ensembles indexés comprend tous les qui se
trouvent dans chaque ensemble de tous les ensemble de la suite.
Soit deux ensembles et , nous disons qu'ils sont "disjoints" si et seulement si:
137/2001
Sciences.ch 14/03/2005
Définition : une collection d'ensembles non vides forment une "partition" d'un
ensemble si les propriétés suivantes sont vérifiées :
P1. et
P2.
Exemple : L'ensemble des nombres pairs et l'ensemble des nombres impairs forment une
partition de .
La loi d'intersection est une loi commutative (voir plus loin la définition du concept de
"loi") telle que:
RÉUNION
la "réunion" des ensembles et consiste en l'ensemble des éléments qui se trouvent dans
et en plus dans
Plus généralement, si est une suite d'ensembles indexés par , l'union des
C'est-à-dire que la réunion de la suite d'ensembles indexés comprend tous les pour lesquels
il existe un ensemble indexé par tel que soit inclus dans cet ensemble .
138/2001
Sciences.ch 14/03/2005
La loi de réunion est une loi commutative (voir plus loin la définition du concept de "loi")
telle que:
Nous appellons par ailleurs "loi d'idempotence" les relations (je précise cela pour la culture
générale):
DIFFÉRENCE
Si nous nous rappellons du concept de "cardinal" (voir plus haut), nous avons avec les
opérations précédemment définies, la relation suivante:
d'où:
DIFFÉRENCE SYMÉTRIQUE
139/2001
Sciences.ch 14/03/2005
P1.
P2.
P3.
PRODUIT
Nous retrouvons ici le concept de "produit scalaire" que nous avions défini avant.
ENSEMBLE VIDE
Nous avons également que l'extérieur de l'Univers est un ensemble vide de tout élément.
De ce qui a été déjà vu jusqu'à maintenant nous pouvons facilement développer les propriétés
suivantes pour des ensembles abstraits:
Une "partition" d'un ensemble est une famille d'ensembles de tels que:
140/2001
Sciences.ch 14/03/2005
COMPLÉMENTARITÉ
Il existe d'autres lois très importantes en logique booléenne (voir le chapitre de systèmes
numériques formels dans la section d'informatique théorique du site pour la démonstraiton)
nommées "loi de De Morgan" et qui sont données par les relations :
FONCTIONS
141/2001
Sciences.ch 14/03/2005
Nous parlons d'une "application" ou "fonction" (Euler et Gauss en ont donné de jolies
définitions) lorsque nous faisons référence à une suite d'opérations mathématiques sur un ou
plusieurs éléments d'un ensemble amenant à un résultat d'éléments compris dans le même
ensemble ou non.
Plus rigoureusement et traditionnellement nous avons pour habitude de définir les concepts
suivants :
D1. Une "fonction" est en général une opération mathématique (souvent notée ) sur une ou
plusieurs variables ( ) d'un ensemble vers un ensemble ( ) noté :
D2. Etant donnés trois ensembles , et (non vides), toute fonction de vers
est appelée "loi de composition de à valeurs dans ".
D3. Une "loi de composition interne" (ou simplement "loi interne") dans est une loi de
composition de à valeurs dans (cas ).
Remarque : la soustraction dans n'est pas une loi de composition interne bien qu'elle fasse
partie des quatre opérations élémentaires apprises à l'école. Par contre l'addition sur en est
biens une.
D4. Une loi de "composition externe" (ou simplement "loi externe") dans est une loi de
composition de à valeurs dans , où est un ensemble distinct de . En général,
est un corps, dit "corps de scalaires"
Exemple : Dans le cas d'un espace vectoriel (voir définition beaucoup plus bas) la
multiplication d'un vecteur (dont les composante se basent sur un ensemble donné) par un
réel.
Remarque : Une loi de composition externe à valeurs dans E est aussi appelée action de F sur
E.
L'ensemble F est alors le domaine d'opérateurs. On dit aussi que F opère sur E (ayez en tête
l'exemple des vecteurs précédemment cité)
Ces deux dernières définitions sont importantes car elles englobent le concept de structures
algébriques que nous verrons un peu plus loin.
D5. Soient deux ensembles. Nous disons que l'application est dite
"application linéaire" si et seulement si :
Remarque : nous referrons cette définition plus rigoureusement lorsque nous présenterons le
concept "d'homomorphisme" plus loin car il nous mansque le concept de K-ev pour l'instant..
142/2001
Sciences.ch 14/03/2005
D6. Soient deux ensembles, . Nous appelons "image de ", et nous notons
, le sous-ensemble défini par :
Selon la figure :
Remarques :
R2.Une "application" est un opérateur mathématique qui agit sur une fonction (ainsi, la
dérivée est une application sur une fonction d'un ensemble vers un ensemble ) il faut
donc prendre garde au langage utilisé.
Cependant, les fonctions peuvent avoir une quantité phénoménale de propriétés dont voici
celles qui font partie des connaissances générales du physicien (pour plus de renseignement
sur ce qu'est une fonction, voir le chapitre traitant de l'analyse fonctionnelle dans la section
d'algèbre).
Soit une fonction d'un ensemble à un ensemble alors nous avons les propriétés
suivantes :
Tout élément de est l'image par d'au moins (nous insistons sur le "au moins") un
élément de , la fonction est alors dite "surjective". Nous disons encore que c'est une
"surjection" de dans . Il découle de cette définition, qu'une fonction est
surjective si et seulement si . En d'autres termes nous écrivons aussi cette définition
143/2001
Sciences.ch 14/03/2005
ainsi :
Tout élément de est l'image par d'au plus (nous insistons sur le "au plus") d'un seul
élément de , l'application est dite "injective". Nous disons encore que est une
injection de dans . Il résulte de cette définition, qu'une fonction est injective
si et seulement si les relations et impliquent autrement dit :
une application pour laquelle deux éléments distincts ont des images distinctes est dite
injective. En d'autres termes, une fonction est injective si l'une des propriétés équivalents
suivantes est vérifiée :
P2.1
P2.2
Une application de dans est à la fois surjective et injective; nous disons aussi que
c'est une "bijection" de dans . Dans ce cas, nous avons que pour tout élément de
de l'équation admet dans une unique (ni "au plus", ni "au moins") pré-image .
Ce que nous écrivons aussi :
Nous sommes ainsi tout naturellement amené à définir une nouvelle application de dans
, appelé "fonction réciproque" de et notée , qui a tout élément de , fait
correspondre l'élément de pré-image unique de l'équation . Autrement dit:
L'existence d'une fonction réciproque implique que graphique d'une fonction bijective et celui
de son application réciproque sont symétriques par rapport à la droite d'équation .
Remarque . il vient des définitions ci-dessus qu'une fonction bijective (ou "biunivoque") si
et seulement si toute droite horizontale coupe la représentation graphique de la fonction en un
seul point. Nous pouvons donc amener à faire la seconde remarque suivante :
144/2001
Sciences.ch 14/03/2005
Une fonction qui vérifie le test de la droite horizontale est continuement croissante ou
décroissante en tout point de son domaine de définition.
Soit une fonction de dans et une fonction de dans . La fonction qui associe
à chaque élément de l'élément de , de s'appelle "fonction composée" de et
de et se note .
Le symoble " " est appelé "rond". Ainsi, la relation précédente ce lit "psi rond phy". Ainsi:
Soit, de plus, une fonction de dans . Nous vérifions aussitôt que l'opération de
composition est associative:
Ce qui est important dans ce que nous venons de voir dans ce chapitre, c'est que toutes les
propriétés définies et énoncées ci-dessus sont applicables aux ensembles de nombres.
THÉORÈME DE CANTOR-BERNSTEIN
Attention. Ce théorème, dont le résultat est évident dans un premier abord, n'est pas simple à
aborder. Nous vous conseillons de lire très lentement et de vous imaginer les diagrammes
sagittaux dans la tête.
Hypothèse à démontrer: soit et deux ensembles. S'il existe une injection (voir la
définition d'une fonction injective ci-dessus) de vers et une autre de vers , alors les
deux ensembles sont en bijection (voir la définition d'une fonction bijective ci-dessus).
Pour la démonstration, nous avons besoin de démontrer au préalable un lemme dont l'énonce
est le suivant:
Démonstration du lemme:
D'abord, au niveau formel, créons une fonction que nous créons telle quelle soit bijective:
145/2001
Sciences.ch 14/03/2005
Nous avons besoin maintenant de définir l'ensemble par les images de l'union des fonctions
des fonctions (du genre ) des pré-images de l'ensemble dont nous excluons
les éléments de (ce que nous notons ). Ce que nous noterons donc:
Nous avons alors bien évidemment (faire un schéma de tête des diagramme sagittaux peut
aider à ce niveau là):
Au fait, il faut y comprendre ceci: toute pré-image se situant dans et donc pas
dans à une image qui n'est pas identique à un quelconque élément de tel que l'image de
soit donné par une fonction mais où il est impossible que (vous suivez
toujours?). Le seconde injection dit simplement que toute pré-image se situant dans à
uniquement pour image lui-même (si la définition de l'application contredisait cette
dernière écriture, nous ne pourrions pas construire ).
146/2001
Sciences.ch 14/03/2005
et
donc:
STRUCTURES ALGÈBRIQUES
L'algèbre dite "moderne" commence avec la théorie des structures algébriques due en partie à
Carl F. Gauss et surtout à Évariste Galois.
Soit pour simplifier les écritures, une loi de composition (comme l'addition, la soustraction,
la multiplication ou encore la division,...). Si est une loi de composition (ou application)
interne dans un ensemble de nombres (comme ) à , nous la notons comme
nous l'avons déjà vu :
Définitions: soit et des symboles de lois (cela pourrait être l'addition et la multiplication
pour prendre le cas le plus connu). Nous définissons que :
D4. est le "symétrique" (dans le sens génénéral de l'opposé par exemple pour l'additon et
l'inverse pour la multiplication) de pour si :
Remarques:
147/2001
Sciences.ch 14/03/2005
R1. Si est son propre symétrique par rapport à la loi , les mathématiciens disent que est
"involutif"
R3. il faut toujours vérifier que les neutres et les symétriques le soient "à gauche" et "à
droite". Ainsi, par exemple, dans , l'élément 0 n'est un neutre qu'à droite car
mais
MAGMA
est un magma si
Remarques :
R3. Si la loi interne possède un élément neutre, nous parlons de "magma unitaire"
Il est donc important de se rappeler que si nous désignons une structure algébrique par le
terme "magma" tout court cela signifie en aucun cas que le loi interne est commutative,
associative ou même qu'elle possède un élémenet neutre !
Ainsi, un élément est dit "régulier" s'il est régulier à droite et à gauche. Si * est commutative
(ce qui est le cas pour un magma commutatif), les notions d'élément réguler à gauche ou à
droite coïncident.
Exemple : dans tout élément est régulier et dans tout élément non nul est
régulier.
Un magma est donc une structure algébrique élémentaire. Il existe des structures plus
subtiles (monïdes, groupes, anneaux, corps, espace vectoriels, etc.) dans lesquelles un
148/2001
Sciences.ch 14/03/2005
ensemble de nombres est muni de plusieurs lois et de différentes propriétés. Nous allons les
voir de suite et les utiliser tout au long de ce site.
MONOÏDE
Définition : si la loi est associative et possède un élément neutre nous disons alors que le
"magma associatif unitaire" est un "monoïde" :
est un monoïde si
Remarquess :
R1. Si la loi interne est en plus commutative alors nous disons alors que la structure forme
un "monoïde abélien" (ou simplement "monoïde commutatif").
R2. Dans certains ouvrage nous trouvons aussi comme définition que le monoïde est un
"demi-groupe" (avec une loi associative) muni d'un élément neutre.
Montrons tout de suite que l'ensemble des entiers naturels est un monoïde abélien
totalement ordonné (comme nous l'avons partiellement vu dans le chapitre des opérateurs) par
rapport aux lois d'addition et de multiplication :
La loi d'addition ( + ) est-elle une opération interne telle que nous ayons :
Nous pouvons démontrer que c'est bien le cas en sachant que 1 appartient à tel que :
Donc et l'addition est bien une loi interne (nous disons également que l'ensemble est
"stable" par rapport à l'addition) et en même temps associative puisque 1 peut être additionné
à lui-même par définition dans n'importe quel ordre sans que le résultat en soit altéré. Si vous
vous rappelez que la multiplication est une loi qui se construit sur l'addition, alors la loi de
multiplication ( x ) est aussi une loi interne et associative !
Nous admettrons à partir d'ici qu'il est trivial que la loi d'addition est également commutative
et que le zéro "0" en est l'élément neutre ( ). Ainsi, la loi de multiplication est elle aussi
commutative et il est trivial que "1" en est l'élément neutre ( ).
- Existe t'il pour la loi d'addition ( + ) un symétrique tel que nous ayons:
avec ?
149/2001
Sciences.ch 14/03/2005
Il est assez trivial que pour que cette égalité soit satisfaite nous ayons:
or les nombres négatifs n'existent pas dans . Ce qui nous amène aussi à la conclusion que la loi
d'addition ( + ) n'a pas de symétrique et que la loi de soustraction ( - ) n'existe pas dans (la
soustraction étant rigoureusement l'addition d'un nombre négatif).
- Existe t'il pour la loi de multiplication ( x ) un symétrique tel que nous ayons :
avec ?
Mais excepté pour , le quotient n'existe pas dans . Donc nous devons conclure qu'il
n'existe pas pour tout élément de de symétriques pour la loi de multiplication et ainsi que la
loi de division n'existe pas dans .
Synthèse :
Remarque : le "-" signifie que cette propriété n'existe pas dans l'ensemble considéré
150/2001
Sciences.ch 14/03/2005
P6. est un monoïde abélien totalement ordonné par rapport aux lois d'addition et de
multiplication :
Remarques:
R1. Il est rare d'utiliser les monoïdes; car souvent, lorsque nous nous trouvons face à une
structure trop pauvre pour pouvoir vraiment discuter, nous la prolongeons vers quelque chose
de plus riche, comme un groupe, ou un anneau (voir plus loin) tel que l'ensemble des entiers
relatifs.
R2. Dire qu'une structure algébrique est totalement ordonnée par rapport à certaines lois
signifie que soit une loi, et une relation d'ordre et quatre éléments de la strucutre
intéressée, alors si et implique . Nous notons alors cette structure
ou simplement et en indiquant la (ou les) loi concernée.
GROUPES
Définition : nous désignons un ensemble de nombres par le terme "groupe", si les composants
le constituant satisfont aux 3 conditions (la quatrième étant que le groupe possède une loi
commutative interne) de ce que l'on nomme la "loi interne de groupe", définie ci-dessous:
est un groupe si
- la loi interne est également commutative. Nous disons alors que le groupe est
"abélien" (ou simplement "commutatif")
- il existe dans un élément tel que tout élément de est une puissance de ou du
symétrique de , nous disons que est un "groupe cyclique" s'il est fini, sinon nous
disons qu'il est "monogène". Plus généralement un groupe d'élément neutre , non
réduit à sera monogène, s'il existe un élément a de distinct de tel que
. Un tel groupe sera cyclique, s'il existe un entier non nul pour lequel
. Le plus petit entier non nul vérifiant cette égalité est alors l'ordre du groupe.
Exemple :
Montrons tout de suite que l'ensemble des entiers relatifs est un groupe abélien totalement
ordonné (comme nous l'avons vu dans le chapitre des opérateurs) par rapport aux lois
d'addition et de multiplication.
D'abord pour raccourcir les développements, il est utile de rappeler que l'ensemble est un
"prolongement" par le fait que nous y avons ajouté tous les nombres symétrique de signe
négatif ( ). Ainsi :
151/2001
Sciences.ch 14/03/2005
Synthèse :
P2. est un monoïde abélien dont zéro "0" est l'élément absorbant
P4. L'ensemble est un groupe abélien totalement ordonné par rapport aux lois d'addition et
de soustraction et de multiplication :
P5. L'ensemble est un monoïde abélien totalement ordonné par rapport à la loi de
multiplication :
Nous voyons de suite que a des propriétés trop restreintes, c'est la raison pour laquelle il
est intéressant de le prolonger par l'ensemble des rationnels défini par (rappel):
Il est dès lors évident (sans démonstration) que est aussi totalement ordonné et aussi
que est un groupe abélien totalement ordonné par rapport aux lois d'addition et de
soustraction .
152/2001
Sciences.ch 14/03/2005
Ce qui devient intéressant avec , c'est que les lois de multiplication et de division
deviennent des lois internes et forment un groupe abélien commutatif par rapport à .
avec
Alors puisque:
- Par définition la division existe dans et est une opération interne. Mais est-elle
associative telle que pour nous ayons:
Au fait, la démonstration est assez triviale si nous nous rappelons que la division se définit à
partir de la loi de multiplication par l'inverse et que cette dernière loi est commutative. Ainsi,
il vient :
- Est-ce que la loi de division ( / ) est cependant commutative tel que la relation:
pour ?
Nous voyons très bien que cela n'est pas le cas puisque nous pouvons écrire cette dernière
relation sous la forme:
153/2001
Sciences.ch 14/03/2005
Synthèse:
P5. L'ensemble est un groupe abélien totalement ordonné par rapport aux lois d'addition,
de soustraction et de multiplication que nous notons :
Les mêmes propriétés sont applicables à et à mais à la différence que ce dernier n'est
pas ordonnable.
Cependant, il peut être compréhensible que pour vous soyez sceptiques. Développons donc
tout cela:
Nous devons nous assurer que la somme, la différence, le produit et le quotient de deux
nombres de la forme donne quelque chose d'encore de cette forme.
Donc l'addition est bien une loi interne commutative et associative pour laquelle il existe un
élément neutre et symétrique dans l'ensemble des complexes.
Donc la soustraction est une opération interne commutative et associative pour laquelle il
existe un élément neutre et symétrique dans l'ensemble des complexes.
154/2001
Sciences.ch 14/03/2005
Donc la loi de multiplication est bien une opération interne commutative, associative et
distributive (!)pour laquelle il existe un élément neutre et symétrique (voir ci-après) dans
l'ensemble des complexes.
Une division est avant tout une multiplication par l'inverse. Prouver qu'il existe un inverse
c'est prouver qu'il existe un symétrique pour la multiplication. Inversons donc le nombre
où et y sont des réels.
Donc l'inverse (et la division) d'un nombre complexe est bien une opération interne non
associative et non commutative pour laquelle il existe un élément neutre et symétrique.
ANNEAUX
est un Anneau
Remarques :
R1. L'élément neutre de la loi interne + est noté "0" et appelé "zéro" de l'anneau.
R2. Nous rencontrons aussi des anneaux non-commutatifs dans lequel la relation de
commutativité n'est pas imposée, il faut alors renforcer la propriété de l'élément neutre en
imposant à 1 d'être un élément neutre à la fois à droite et à gauche : (un exemple
d'anneau non-commutatif est fourni par l'ensemble des matrices à coefficients dans un
anneau , par exemple - voir chapitre d'algèbre linéaire).
155/2001
Sciences.ch 14/03/2005
- la loi interne est également commutative, l'anneau est "commutatif" (c'est important car il
existe des anneaux d'opérateurs non-commutatifs!)
- s'il existe dans un élément neutre pour la loi interne , et que cet élément neutre est
l'unité "1" nous disons alors que l'anneau est "unitaire" et 1 est appelé "unité" de l'anneau.
Nous parlons alors "d'anneau commutatif unitaire"
- lorsque l'anneau est composée d'éléments irréductibles par rapport aux autres éléments
(nombre premiers par exemple) nous parlons "d'anneau factoriel".
Définitions :
D1. Un élément a d'un anneau A est une "unité" s'il existe tel que . Si un tel
b existe il est unique (nous en avons vu un exemple lors de notre étude des classes de
congruence en théorie des nombres).
D2. Soit A un anneau. Nous disons que A possède des diviseurs de zéro s'il existe
avec et . Les éléments a et b sont appelés des "diviseurs de zéro".
Remarques :
R1. Il est clair qu'un anneau est intègre si et seulement si il ne possède aucun diviseur de zéro.
R2. Les notions d'unité et de diviseurs de zéro sont incompatibles mais un élément d'un
anneau peut être ni l'un ni l'autre. Ces le cas, par exemple, de tous les entiers dans
. Ce ne sont ni des unités, ni des diviseurs de zéro.
Nous verrons un exemple important d'anneau lors du cadre de notre étude des polynômes
(voir chapitre de calcul algébrique) mais nous en avons déjà vu de très importants lors de
notre étude des classes de congruences dans le chapitre de théorie des nombres.
Voyons quelques exemples d'anneaux : lors de notre étude des groupes nous avons trouvé que
les structures :
La loi de division n'état en aucun cas associative, nous pouvons nous restreindre à étudier
pour chacun des groupes précités, le couple de lois: (+) et ( x ).
156/2001
Sciences.ch 14/03/2005
Et même mieux:
Remarque : nous considérerons comme évident qu'à ce niveau du discours que le lecteur aura
remarqué que est un "sous-anneau" de (dans le sens où les opérations définies sont
internes à chacun des ensembles et que les éléments neutres et identité sont identiques et qu'il
existe pour chaque élément de ces ensembles un opposé qui est dans le même ensemble).
P1.
P2.
P3.
Démonstrations :
SOUS-ANNEAU
157/2001
Sciences.ch 14/03/2005
P2.
P3.
P4.
CORPS
est un corps si
Donc un corps est un anneau non nul dans lequel tout élément non nul est inversible ou en
d'autre termes : un anneau commutatif dont tous les éléments non nuls sont des unités est
appelé un "corps".
Remarque : si la loi interne est également commutative, le corps est dit "commutatif"
Il nous faut d'abord déterminer lesquels ne constituent pas des groupes par rapport à la loi
interne de multiplication ( x ).
Comme nous l'avons déjà vu dans notre étude des groupes précédemment, il est évident qu'il
nous faut éliminer .
et puisque la loi de multiplication ( x ) est commutative dans ces ensembles, nous pouvons
affirmer que ces corps sont également des corps commutatifs.
ESPACES VECTORIELS
Lorsque nous définissons un "vecteur" (voir chapitre de calcul vectoriel), nous faisons
habituellement référence à un "espace euclidien" (voir aussi chapitre de calcul vectoriel) de n
dimensions de . Cependant, la notion d'espace vectoriel est beaucoup beaucoup plus vaste
que ce dernier qui ne représente qu'un cas particulier.
Définition : un "espace vectoriel (E.V.)" ou "K-espace vectoriel" (abrégé : K-ev) sur le corps
K (nous prendrons fréquemment pour ce corps ou ) est un ensemble possédant
les propriétés :
158/2001
Sciences.ch 14/03/2005
Cette loi externe doit vérifier (nous omettons les flèches sur les symboles x,y représentant les
vecteurs pour l'instant tant que nous n'aurons pas aborder le chapitre de calcul vectoriel) que
les propriétés suivantes :
Remarques :
R1. Nous disons alors que l'espace vectoriel à une "structure algébrique vectorielle" et que ces
éléments sont des "vecteurs", les éléments de des "scalaires".
R3. Dorénavant, pour distinguer les éléments du corps et de l'ensemble , nous noterons
ceux de par des lettres grecques et ceux de par des lettres latines majuscules.
R4. Outre les cinq propriétés énumérées ci-dessus, il ne faut pas oublier d'ajouter les cinq
autres propriétés du groupe abélien (opération interne, commutativité, associativité, élément
neutre, élément inverse). Ce qui nous fait donc au total dix propriétés à respecter.
Il est inutile de démontrer que ces propriétés sont respectées pour et, par conséquent pour
. Nous pouvons cependant nous poser la question à propos de certains sous-ensembles de
. Par exemple, considérons la région rectangulaire illustrée dans la figure (a) (et en
perspective dans la figure (c)) ci-dessous :
159/2001
Sciences.ch 14/03/2005
Un autre exemple d'un espace vectoriel est l'ensemble des polynômes de degré deux ou
moins (voir chapitre de calcul algébrique pour plus de détails). Par exemple, deux éléments de
cet espace sont :
Cet ensemble respecte les 10 propriétés d'un espace vectoriel. En effet, si nous additionnons
deux polynômes de degré deux ou moins, nous obtenons un autre polynôme de degré deux ou
moins. Nous pouvons aussi multiplier un polynôme par un scalaire sans changer l'ordre (ou
degré) de celui-ci, etc. Nous pouvons donc représenter un polynôme par des vecteurs dont les
termes sont les coefficients du polynôme.
Mentionnons que nous pouvons aussi former des espaces vectoriels avec des ensembles de
fonctions plus générales que des polynômes. Il importe seulement de respecter les dix
propriétés fondamentales d'un espace vectoriel !
Ainsi défini, un espace vectoriel sur est une action de sur qui est
compatible avec la loi de groupe (par extension un "automorphisme" - voir la définition plus
loin - sur ).
Définition : Soit E un espace vectoriel, nous appelons "sous-espace vectoriel (abrégé : SEV)"
de E un sous-ensemble de E si et seulement si :
ALGÈBRES
Définition : est une "algèbre" (dit aussi " -algèbre") sur un corps commutatif C si et
seulement si:
est un algèbre si
Remarque : nous allons de suite voir plus bas ce qu'est un homomorphisme d'anneau
160/2001
Sciences.ch 14/03/2005
Exemple : est un -algèbre (un nombre complexe pouvant être vu comme un vecteur à
deux composantes)
HOMOMORPHISMES
Le concept d'homomorphismes (du grec homoios = semblable et morphê = forme)a été défini
par les mathématiciens car permettant de mettre en évidence des propriétés remarquables des
fonctions en particuler avec leurs structures, leur noyau, et de ce que nous appelons les
"idéaux" (voir plus loin). Ils nous permettront ainsi d'identifier une structure algébrique à une
autre ou de découvrir des propriétés nouvelles comme nous le verrons pas la suite.
Remarque : un excellent exemple d'application pratique dans le vie courant sera montré dans
le chapitre de cryptographie où nous utilisons le fait que pour crypter des informations une
fonction appelée "fonction phi d'Euler" est un homomorphisme (et il nous faudra le
démontrer).
Définitions :
D1. Si et sont deux magmas (peu importe la notation utilisé pour les lois
internes), une application f de A dans B est un "homomorphisme" ou "morphisme" (par abus
de langage nous écrivons parfois aussi "homorphisme" par flegme) si :
en d'autres termes, si l'image d'un composé dans A est le composé des images dans B.
P1.
161/2001
Sciences.ch 14/03/2005
P2.
Démonstrations :
Démonstration : la condition est clairement nécessaire. Montrons qu'elle est suffisante. Nous
supposons donc que . Soit tel que . Alors
ceci implique que donc que ce qui montre que
f est injectif.
D5. Soient f une application d'un corps vers un autre. Nous disons que f est un
"homomorphisme de corps" si f est un homomorphisme d'anneaux.
Remarque : Le fait que l'homomorphisme de corps soit le même que celui d'un anneau tient
juste au fait que la différence entre les deux tient est que les éléments du corps sont
inversibles (aucune loi ou propriété de loi ne diffère entre les deux selon leur définition).
162/2001
Sciences.ch 14/03/2005
Démonstration :
D6. Soient A et B deux K-ev et une application de A dans B. Nous disons que f est
une "application linéaire" ou "homomorphisme d'espace vectoriels" si :
Remarque : nous avions déjà défini plus haut le concept d'application linéaire mais n'aviosn
pas précisé que les deux ensembles A et B étaient des K-ev.
D7. Si l'homomorphisme est bijectif nous dirons alors que f est un "isomorphisme". S'il existe
un isomorphisme entre A et B, nous disons que A et B sont "isomorphes" et nous noterons cela
.
Remarque : l'isomorphisme permet au fait d'identifier deux ensembles munies d'une structure
algébrique identique (que ce soit groupe, anneau ou etc.) mais donc les éléments sont
nommées d'une façon.
D8. Si l'homomorphisme f est une application uniquement interne, nous dirons alors que f est
un "endomorphisme" (en d'autres termes, nous avons un endomorphisme si dans la définition
de l'homorphisme de groupe nous avons A=B)
D9. Si l'endomorphisme f est en plus bijectif (donc en d'autres termes si homomorphisme est
un endomorphisme et un isomorphisme), nous dirons alors que f est un "automorphisme"
IDÉAL
En d'autres termes, un "idéal" est un sous-ensemble fermé pour l'addition et "stable" par
multiplication par un élément quelconque de A.
163/2001
Sciences.ch 14/03/2005
Pour savoir si un idéal est égal à tout l'anneau, il est utile d'utiliser le lemme suivant :
Un premier exemple d'idéal est donné par le noyau d'un homomorphisme d'anneaux :
Démonstration :
Soient . Alors :
noté ou aA, est un idéal (nous allons voir un exemple concret après la prochaine
définition).
Définition : un idéal d'un anneau A est dit "principal" s'il existe tel que .
Un anneau dont tous les idéaux sont principaux est dit "anneau principal".
Théorème : L'anneau est principal (car tous ses idéaux sont principaux).
Démonstration :
Soit I un idéal de (il est facile de choisir un). Soit le plus petit entier positif non nul
de I. Nous allons montrer que . Soit a un élément quelconque de I. La division
euclidienne nous permet d'écrire :
164/2001
Sciences.ch 14/03/2005
Démonstration :
Théorème : Un anneau R est un corps si et seulement s'il ne possède que les idéaux triviaux
.
Démonstration :
Montrons que la condition est nécessaire : Soit I un idéal non nul de R et un élément
non nul. Par hypothèse (qu'il s'agit d'un corps), il est inversible, c'est-à-dire qu'il existe
tel que . Ceci implique que et donc, par un résultat obtenu plus haut .
Réciproquement, supposons que tout idéal soit l'idéal nul. Alors si est un
élément non nul de R, l'idéal principal doit être égal à R. Mais ceci implique que
et dont qu'il existe avec ce qui montre que r est inversible. L'anneau R est donc
un corps.
Démonstration :
Nous mettons ensemble ce qui a été vu jusque-là. Nous avons démontré plus haut que le
noyau d'un homomorphisme est un idéal. Mais nous avons également démontré plus
haut que nous avons soit soit (car anneau R est un corps si et
seulement s'il ne possède que les idéaux triviaux). Mais vu que (de par la
définition d'un homomorphisme) il s'ensuit qu'il reste (puisque nous avons
démontre que si A est un anneau et I un idéal de A alors Si alors ). Ceci implique
par un théorème précédent (où nous avons démontré que si l'homomorphisme
est injectif) que… f est injective.
Etudions maintenant les homomorphismes dont l'anneau de départ est . Soit A un anneau et
165/2001
Sciences.ch 14/03/2005
pour tout . Ainsi f est complètement déterminé par la donnée de et est donc
unique. Réciproquement, nous montrons que l'application définie par :
Remarque : moins formellement, la caractéristique d'un anneau est le plus petit entier positif
m tel que . S'il n'y en a pas, alors la caractéristique est nulle.
Proposition : La caractéristique d'un anneau intègre (et en particulier d'un corps) est égale 0
ou à un premier p.
Démonstration :
Remarque : la réciproque du théorème n'est pas vraie comme le montre l'exemple de l'anneau
où l'addition et la multiplication se font composant par composant. C'est un anneau de
caractéristique nulle mais avec des diviseurs de zéro :
166/2001
Sciences.ch 14/03/2005
PROBABILITÉS ET STATISTIQUES
PROBABILITÉS
Le calcul des probabilités s'occupe des phénomènes aléatoires (dits plus esthétiquement:
"processus stochastiques"), c'est-à-dire de phénomènes qui ne mènent pas toujours à la même
issue et qui peuvent êtres étudiés grâce aux nombres et à leurs conséquences et apparitions
(d'où notre choix très personnel des la voirs mis dans la section d'arithmétique). Néanmoins,
même si ces phénomènes ont des issues variées, dépendant du hasard, nous observons
cependant une certaine régularité statistique. Le jet d'un dé, le tirage du Loto pourraient être
analysés par les lois de la mécanique, mais ce serait trop compliqué et même impossible car il
faudrait parfaitement connaître les conditions initiales ce qui comme vous pouvez le voir dans
le chapitre de physique quantique ondulatoire est de toute façon impossible.
La modélisation par le calcul des probabilités a alors été inventée par A.N. Kolmogorov dans
un livre paru en 1933. Cette modélisation est faite à partir de l'espace de probabilités
que nous définirons de manière simpliste un peu plus loin et de manière beaucoup
plus précise dans le chapitre traitant dans la théorie de la mesure (voir section d'algèbre).
Remarque : une grande partie du contenu de ce chapitre est très peu satisfaisante à notre goût.
Nous faisons cependant tous les efforts possibles pour essayer de faire digérer et présenter
cette branche qui pose souvent problème lors des études scolaire de la meilleure manière quoi
soit mais nous rencontrons de grandes difficultés. Effectivement nous aimerions nous passer
d'exemples et d'exercices et de faire que le tout soit cependant parfaitement compréhensible et
clair mais cela est difficile car il nous faut revoir toute la manière d'aborder cette branche des
mathématiques. Nous vous remercions donc pour votre compréhension si certaines choses ne
sont à ce jour pas claires.
Définitions :
D1. L'univers des événements (dit des "observables" aussi) est l'ensemble de toutes les
issues (résultats) possibles qui se présentent au cours d'une épreuve aléatoire déterminée.
D2. Soit un univers et un événement, nous disons que l'événement "à lieu" (ou "se
réalise") si lors du déroulement de l'épreuve se présente l'issue et que dans
le cas contraire, nous disons que "n'a pas lieu".
167/2001
Sciences.ch 14/03/2005
les deux événements ne peuvent pas êtres réalisables pendant la même épreuve (résultat de
lancer d'un dé typiquement), nous disons qu'ils sont "incompatibles".
Sinon, si :
les deux événements peuvent êtres réalisables dans la même épreuve (possibilité de voir un
chat noir au moment où on passe sous une échelle par exemple), nous disons inversement
qu'ils sont "indépendants" (nous y reviendrons plus en détails dans l'étude des axiomes des
probabilités).
AXIOMES
Attention! La théorie des probabilités représente un cadre théorique dans lequel nous allons
pouvoir modéliser le domaine de l'incertain. Comme dans toute formalisation, il existe une
part de schématisation de la réalité, qui implique que les résultats obtenus ne seront valides
que dans la mesure ou cette représentation abstraite et simplifiée de la réalité n'est pas trop
éloignée de cette dernière.
Axiomes:
Soit un univers. Nous disons que nous définissons une probabilité sur les événements de
si à tout événement de nous associons un nombre , appelé "probabilité de
l'événement ", satisfaisant aux quatre axiomes suivants :
Ainsi, la probabilité de tout événement est un nombre positif supérieur ou égal à zéro oiu
inférieur ou égal à 1.
168/2001
Sciences.ch 14/03/2005
A3. Si , alors :
Autrement dit sous forme plus générale : si est une suite d'évènements disjoints deux à
deux ( et ne peuvent pas se produire en même temps si ) alors :
Une conséquence immédiate des axiomes (A2.) et (A3.) est la relation entre les probabilités
d'un événement et de complémentaire, noté :
Autrement dit sous forme plus générale : les événements sont indépendants si la
probabilité de l'intersection est le produit des probabilités :
169/2001
Sciences.ch 14/03/2005
Les événements :
sont appelés "événements élémentaires". Lorsque ces événements ont même probabilité, nous
disons qu'ils sont "équiprobables". Dans ce cas, il est très facile de calculer leur probabilité.
En effet, ces événements étant par définition indépendants entre eux à ce niveau de notre
discours, nous avons en vertu de l'axiome 3 des probabilités :
mais puisque :
et que les probabilités du membre de droite sont par hypothèse équiprobables, nous avons :
et
PROBABILITÉS CONDITIONNELLES
Que pouvons-nous déduire sur la probabilité de l'évènement sachant que l'évènement est
réalisé? Cette probabilité est appelée "probabilité conditionnelle" de sachant et se note
. Dans notre cas, nous avons :
ou
170/2001
Sciences.ch 14/03/2005
La notion de probabilité conditionnelle que nous allons introduire est beaucoup moins simple
qu'elle ne paraît a priori et les problèmes de conditionnement sont un source inépuisable
d'erreurs en tout genre. A titre d'illustration, nous pourrons méditer la petite histoire suivante:
Il est extrêmement improbable que deux personnes ayant chacune une bombe prennent le
même avion. Quelle est alors la meilleure façon d'éviter d'avoir une bombe dans son avion?
Réponse: il faut se munir d'une bombe puisque la probabilité qu'il y ait une deuxième bombe
sachant qu'il y en a déjà une est extrêmement faible…
Supposons que nous ayons deux dès. Imaginons maintenant que nous ayons lancé seulement
le premier dé. Nous voulons savoir quelle est la probabilité qu'en lançant le second dé, la
somme des deux chiffres vaille 12. Ainsi, la probabilité d'obtenir 12 sachant la valeur du
premier dé est totalement différente de la probabilité d'obtenir 12 en lançant les deux dès.
Comment calculer cette nouvelle probabilité? Prenons le problème dans l'autre sens.
Supposons que le résultat du premier dé soit 6. Un argument empirique du type "règle de
trois" (voir mathématiques financières) nous dirait (imagination) que la probabilité que la
somme des chiffres des deux dès vaille 8 ou 9 sera le double de la probabilité que la somme
des chiffres vaille 7. Formalisons la démarche. Après le lancer du premier dé, nous avons une
nouvelle loi qui tient compte de l'information supplémentaire:
Soit maintenant ( est inclus dans le complémentaire de ). Il est assez intuitif que
. Ceci nous mène aux définitions suivantes :
et
Interprétation : La connaissance d'une information sur une expérience peut modifier l'idée que
nous nous faisons de la probabilité d'un évènement. Ainsi, le fait de savoir que est réalisé
réduit l'ensemble des résultats possibles de à . A partir de là, seules les éventualités de
ont une importance. La probabilité de sachant doit donc être proportionnelle à
171/2001
Sciences.ch 14/03/2005
Une loi de probabilité conditionnelle est une loi de probabilité. En particulier, si sont
disjoints (incompatibles) et réalisé parmi les expériences où l'est aussi. Alors :
aussi :
Si est une famille dénombrable d'évènements disjoints deux à deux dont la réunions est
l'événement certaine (sous-ensemble de ) alors :
C'est la "formules des probabilités totales". Mais aussi, pour tout , nous avons :
ANALYSE COMBINATOIRE
Propriétés :
P1. Une suite d'objets (événements, issues,...) est dite "ordonnée" si chaque suite composée
d'un ordre particulier des objets est compatbilisé comme une configuration particulière.
Corollaire : une suite est non ordonnée si et seulement si nous intéresse la fréquence
d'apparition des objets indépendamment de leur ordre.
172/2001
Sciences.ch 14/03/2005
P2. Des objets (d'une suite) sont dits "distincts" si leurs charactéristiques ne permettent pas de
les confondre avec des autres objets.
Remarque : nous avons choisi de mettre l'analyse combinatoire dans ce chapitre car lorsque
nous calculons des probabilités, nous avons également assez souvent besoin de savoir quelle
est la probabilité de tomber sur une combinaison ou un arrangement d'événements donnés
sous certaines contraintes (le Loto par exemple..).
Il existe plusieurs types d'arrangements selons les contraintes et les propriétés des éléments
arrangés. Nous allons présenter et démontrer ci-dessous les 5 cas les plus répandus à partir
desquels nous pouvons trouver (habituellement) tous les autres :
Soient et deux ensembles finis de cardinaux respectifs tels que trivialement il y ait
façons de choisir un objet dans (de type ) et façons de choisir un objet dans (de
type ).
Propriétés :
P1. Si un objet ne peut être à la fois de type et de type et s'il y a façons de choisir un
objet de type et façons de choisir un objet de type , alors il y a façons de choisir
un objet de type ou de type .
P2. Si nous pouvons choisir un objet de type de façons puis un objet de type de
façons, alors il y a (produit cartésien de deux ensembles – voir théorie des ensembles) :
Avec les mêmes notations, choisir une fonction de dans , c'est choisir (dans le cas
général) pour chaque élément de , son unique image parmi les éléments de . Il y a
donc façons de choisir l'image du premier élément de , puis aussi façons de
choisir l'image du deuxième, …, puis façons de choisir l'image du -ième. Le
nombre d'applications totales possibles de dans est donc égal au produit de égaux à
. Ainsi, nous avons :
173/2001
Sciences.ch 14/03/2005
Exemple : Combien de "mots" (ordonnés) de 7 lettres pouvons nous former à partir d'un
alphabet de 24 lettres distinctes ?
Une généralisation simple de ce dernier résultat peut consister dans l'énoncé du problème
suivant :
PERMUTATIONS SIMPLES
Il est dès lors trivial que nous aurons un nombre d'arrangements donné par :
174/2001
Sciences.ch 14/03/2005
arrangements possibles.
Ce résultat nous amène à l'assimiler au résultat ordonné (un arrangement dont l'ordre des
éléments de la suite est pris en compte) du tirage de toutes les boules d'un sac contenant
boules distinguables sans remise.
Définition (ensembliste) : une permutation d'un ensemble est une bijection de l'ensemble
sur lui-même, y compris le cas où est infini. Une permutation de éléments est une
bijection d'un ensemble fini de cardinal sur lui-même. Une permutation de
éléments est aussi un -uplet de éléments distincts. L'ensemble étant fini, il y autant
d'applications bijectives de dans lui-même que d'applications injectives de dans lui-
même, soit .
Remarque : il ne faut pas confondre cette dernière définition avec "l'arrangement avec
répétition" qui est une suite ordonnée de longueur de objets distincts non
nécessairement tous différents la suite.
Lorsque certains éléments éléments ne sont pas distinguables dans une suite d'objets (ils sont
répétitifs dans la suite), alors le nombre d'arrangements (permutations) que nous pouvons
constituer se réduit alors trivialement à un nombre plus petit que si tous les éléments étaient
distinguables.
Si nous notons :
avec
le nombre d'arrangements possibles (pour l'instant inconnu) avec répétition (un ou plusieurs
éléments répétitifs dans une suite d'éléments sont non distinguables par permutation), alors si
chacune des places occupées par des éléments identiques était occupée par des éléments
diffèrents, le nombre de permutations serait alors à multiplier par chacun des (cas
précédent).
175/2001
Sciences.ch 14/03/2005
alors:
Remarque : si les objets sont tous différentes dans la suite, nous avons alors :
et nous nous retrouvons bien avec une permutation simple tel que :
Exemple : combien de "mots" (ordonnés) pouvons-nous former avec les lettres du mot
"mississippi" :
Ce résultat nous amène à l'assimiler au résultat ordonné (un arrangement dont l'ordre des
éléments de la suite est pris en compte) du tirage de boules non tous distinguables d'un sac
contenant boules avec remise limitée pour chaque boule.
Propriété : quelques soient les éléments dans la suite analysée chacun des éléments peut
donc apparaître et nous avons donc (voire le chapitre traitant des suites et
séries dans la section d'algèbre) :
Définition : un "arrangement simple sans répétition" est une suite ordonnée de objets (tous
différents dans la suite) pris parmi objets distincts avec .
176/2001
Sciences.ch 14/03/2005
Dès lors:
alors:
d'où :
Ce résultat nous amène à l'assimiler au résultat ordonné (un arrangement dont l'ordre des
éléments de la suite est pris en compte) du tirage de boules d'un sac contenant boules
différentes sans remise.
Exemple : soit les 24 lettres de l'alphabet, combien de "mots" (ordonnés) de 7 lettres distinctes
pouvons nous former ?
Une permutation simple est donc un arrangement simple sans répétition avec .
COMBINAISONS SIMPLES
Définition : une "combinaison simple" est une suite non-ordonnée de éléments tous
différents choisis parmi objects distincts et est par définition notée et appelée "la
binômiale".
Si nous permutons les éléments de chaque arrangement simple de éléments, nous obtenons
toutes les permutations simples et nous savons qu'il y en a d'où :
Exemple : soit un alphabet de 24 lettres, combien avons nous de choix de prendre 7 lettres
parmi les 24 sans prendre en en compte l'ordre dans lequel sont tirées les lettres :
177/2001
Sciences.ch 14/03/2005
Ce résultat nous amène à l'assimiler au résultat non ordonné (un arrangement dont l'ordre
des éléments de la suite n'est pas pris en compte) du tirage de boules d'un sac contenant
boules différentes sans remise.
STATISTIQUES
Définition : les statistiques sont une science qui a pour objet le groupement méthodique des
faits qui se prêtent à une évaluation numérique d'événements qui peuvent se répéter dans le
temps suivant une loi donnée. Certains s'aiment à dire que la statistique est la première des
sciences inexactes…
Autre définition : Le but principal de la statistique est de déterminer les caractéristiques d'une
population donnée à partir de l'étude d'une partie de cette population, appelée échantillon.
Lorsque nous observe un événement prenant en compte certains facteurs, il peut arriver
qu'une deuxième observation ait lieu dans des conditions qui semblent identiques. En répétant
ces mesures plusieurs fois, nous pouvons constater que les résultats observables sont
distribuées statistiquement autour d'une valeur moyenne qui est, finalement le résultat
possible le plus probable. Dans la pratique, nous n'effectuons cependant qu'une seule mesure
et il s'agit alors de déterminer la valeur de l'erreur que l'on commet en adoptant celle-ci
comme moyenne mesurée. Cette détermination nécessite de connaître le type de distribution
statistique auquel nous avons à faire.
Introduisons avant de continuer quelques définitions qui vont nous être utiles pour la suite:
ÉCHANTILLONS
Définitions :
D1. Un échantillon aléatoire est un échantillon tiré au hasard dans lequel tous les individus
ont la même chance, ou "équiprobabilité" (et nous insistons sur le fait que cette probabilité
doit être égale), de se retrouver dans l'échantillon.
D2. Dans le cas contraire d'un échantillon dont les éléments n'ont pas été pris au hasard, nous
disons alors que l'échantillon est "biaisé" (dans le cas inverse nous disons qu'il est "non-
biaisé")
En fait, lorsque la taille des échantillons utilisés est petite, le hasard peut donner un résultat
moins bon que celui qui est biaisé. Une autre méthode consiste alors à utiliser la technique des
quotas :
178/2001
Sciences.ch 14/03/2005
VARIABLES DISCRÈTES
Soit un variable indépendante (un élément d'un échantillon dont la propriété est
indépendante des autres éléments) qui peut prendre les valeurs aléatoires discrètes
dans avec les probabilités respectives où, de par l'axiomatique des
probabilités:
En d'autres termes, nous savons qu'à chaque événement de l'espace des échantillons est
associé
une probabilité à laquelle nous associons également une valeur (donnée par la variable
aléatoire). La question étant alors de savoir quelle valeur, à long terme, nous pouvons obtenir.
La valeur espérée, (l'espérance mathématique donc...) est alors la moyenne pondérée, par la
probabilité, de toutes les valeurs des événements de l'espace des échantillons.
Si la probabilité est donnée par une fonction de distribution (voir les définitions de fonctions
de distribution plus bas) de la variable aléatoire, nous avons:
Nous en déduisons que pour variables aléatoires , définies sur une même loi de
distribution:
179/2001
Sciences.ch 14/03/2005
Après avoir traduit la tendance par l'espérance, il est intéressant de traduire la dispersion (ou
"déviation standard") autour de l'espérance par une valeur (la variance ou l'écart-type).
et l'on démontre de façon très simple (contactez moi si vous souhaitez que je fasse quand
même la petite démonstration) que:
180/2001
Sciences.ch 14/03/2005
et ce jusqu'à . Nous pouvons dès lors écrire une matrice sous la forme:
Cette matrice à comme propriété remarquable que si l'on prend deux vecteur identiques et que
l'on calcule les composantes de la matrice, alors la diagonale de cette dernière donnera les
variances des composantes de vecteurs!
181/2001
Sciences.ch 14/03/2005
Soit la moyenne d'un serie de termes déterminés chacun par la mesure de plusieurs valeurs::
alors:
et:
Nous pouvons démontrer que (voir la démonstration de cette inégalité en analyse vectorielle
dans la définition du produit scalaire):
Finalement nous obtenons une forme de l'inégalité statistique dite "inégalité de Cauchy-
Schwarz" :
Si les variances de et sont non nulles, la corrélation entre et est définie par:
182/2001
Sciences.ch 14/03/2005
Quels que soient l'unité et les ordres de grandeur, le coefficient de corrélation est un nombre
sans unité, compris entre -1 et 1. Il traduit la plus ou moins grande dépendance linéaire de X et
Y et ou, géométriquement, le plus ou moins grand aplatissement. Un coefficient de corrélation
nul ou proche de 0 signifie qu'il n'y a pas de relation linéaire entre les caractères. Mais il
n'entraîne aucune notion d'indépendance plus générale.
Quand le coefficient de corrélation est proche de 1 ou -1, les caractères sont dits fortement
corrélés. Il faut prendre garde à la confusion fréquente entre corrélation et causalité. Que deux
phénomènes soient corrélés n'implique en aucune façon que l'un soit cause de l'autre.
Ainsi:
1. Déterminer le degré d'association entre les différentes variables: celui-ci est exprimé par le
coefficient de détermination, qui est le carré du coefficient de corrélation. Le coefficient de
détermination mesure la contribution d'une des variables à l'explication de la seconde.
Dans le cas où nous avons à disposition une série de mesures couplées, nous pouvons
grossièrement estimer la valeur moyenne et la variance des mesures par les estimateurs
suivants (il s'agit simplement au fait de l'espérance et l'écart-type d'un échantillon dont les
événement sont tous équiprobables) :
et
Démonstration :
183/2001
Sciences.ch 14/03/2005
De par son approximation, nous disons que ces estimateurs sont biaisés et que l'écart est
moyen.
VARIABLES CONTINUES
Si nous étudions une variable continue (non discrète) pouvant prendre n'importe qu'elle
valeur dans , alors nous définissons la "densité de probabilité" normalisée à 1 comme
étant la fonction qui permet de connaître la probabilité d'obtenir un résultat compris entre
et . Cette densité est donnée par l'intégrale de la fonction exprimant la probabilité
d'apparition de la variable aléatoire suivant :
Dans ce cas :
et
La moyenne ayant été défini par la somme pour une variable discrète, elle devient une
intégrale pour une variable continue:
184/2001
Sciences.ch 14/03/2005
Souvent les statisticiens utilisent les notations suivantes pour l'espérance mathématique:
et pour la variance:
Par la suite, nous calculerons ces différents termes avec développements uniquement dans les
cas les plus usités.
FONCTIONS DE DISTRIBUTION
Lorsque nous observons des phéonomènes stochastiques, et que nous prenons note des valeurs
prises par ces derniers et que les reporte graphiquement, nous observons toujours que les
différentes mesures obtenues suivent une caractéristique courbe ou droite typique
fréquemment reproductible. Dans le domaine des probabilités et statistiques, nous appelons
ces caractéristiques des "fonctions de distribution".
Si nous admettons qu'il est possible d'associer une probabilité à un événement, nous pouvons
concevoir des situations où nous pouvons supposer a priori que tous les événements
élémentaires sont équiprobables (c'est-à-dire qu'ils ont même probabilité). Nous utilisons alors
le rapport entre le nombre de cas favorables et le nombre de cas possibles pour calculer la
probabilité de tous les événements de l'Univers des événements . Plus généralement si
est un ensemble fini d'événements équiprobables et une partie de nous avons :
c'est-à-dire le nombre de cas favorables sur le nombre de cas possibles. Cette relation est
utilisable dans le cas particulier où les événements possibles sont équiprobables et en nombre
185/2001
Sciences.ch 14/03/2005
fini.
Plus communément, nous pouvons écrire : soit un événement pouvant avoir issues
équiprobables possibles. Alors la probabilité d'observer l'issue de l'événement sera:
et pour variance :
FONCTION DE BERNOULLI
Si l'on à affaire à un observation binaire alors la probabilité d'un événement reste constant
d'une observation à l'autre s'il n'y a pas d'effet mémoire (autrement dit: une somme de
variables de Bernoulli, deux à deux indépendante). Nous appelons ce genre d'observations où
la variable aléatoire à valeurs 0 ou 1, avec probabilité , respectivement, des "essais
de Bernoulli".
Ainsi, une variable aléatoire suit une fonction (ou loi) de Bernoulli si elle ne peut prendre
que les valeurs 0 ou 1, associées aux probabilités et de sorte que et:
Si l'on considère événements où l'on obtient fois une des issues possibles et
l'autre suivant un certain ordre (ou arrangement), alors la probabilité d'obtenir à nouveau le
même ordre est donné par:
186/2001
Sciences.ch 14/03/2005
puisque:
et a pour variance:
FONCTION BINOMIALE
Si l'on revient maintenant à notre relation de l'événement binaire dont la probabilité d'un
arrangement particulier est . Alors la densité de probabilité d'avoir fois
l'événement et fois l'événement dans n'importe quel arrangement (ou ordre) sera
donné par les différentes possibilité d'avoir des arrangement avec et fois ces
187/2001
Sciences.ch 14/03/2005
donc:
et parfois notée:
188/2001
Sciences.ch 14/03/2005
FONCTION HYPERGÉOMETRIQUE
Nous considèrons pour l'exemple une urne contenant boules dont sont noires et les
autres blanches. On tire successivement, et sans les remettre dans l'urne, boules. Quelle est
la probabilité que parmi ces boules, il y en ait qui soient noires (c'est que l'on appelle
communément le "tirage sans remise") ?
Les boules peuvent être choisies parmi les boules de façons (représentant le nombre
de tirages différents possibles). Les boules noires peuvent être choisies parmi les noires
de façons. Les boules blanches peuvent être elles choisies de . Il y a donc
tirages qui donnent boules noires et boules blanches. La probabilité
recherche vaut donc:
189/2001
Sciences.ch 14/03/2005
et pour variance :
FONCTION MULTINOMIALE
Nous avons vu en analyse, que si l'on prend un ensemble d'événements ayant plusieurs issues,
alors les différentes combinaisons de suites que l'on peut obtenir en prenant éléments
choisis parmi est:
Il y a donc :
190/2001
Sciences.ch 14/03/2005
Il y a ensuite :
FONCTION DE POISSON
Il existe une très grande quantités de fonctions mathématiques qui décrivent le comportement
d'observations d'événements aléatoires et indépendants et identiquement distribués. Nous
allons parcourir ces fonctions et pour les plus connues, les étudier en détails
Pour certains événements fort rares, la probabilité est très faible et tend vers zéro.
Toutefois la valeur moyenne tend vers une valeur fixe lorsque tend vers l'infini.
Nous partirons donc d'une distribution binomiale de moyenne que nous supposerons
finie lorsque tend vers l'infini.
191/2001
Sciences.ch 14/03/2005
Nous reconnaissons que, lorsque tend vers l'infini, le deuxième facteur du produit a pour
limite .
Quant au troisième facteur, puisque l'on s'intéresse aux petites valeurs de (la probabilité de
réussite est très faible), sa limite pour tendant vers l'infini vaut 1. Nous obtenons ainsi la loi
de distribution dite de Poisson:
Cette distribution est importante car elle décrit beaucoup de processus dont la probabilité est
petite et constante. Elle est souvent utilisée dans la "queing theory" (temps d'attente), test
192/2001
Sciences.ch 14/03/2005
d'acceptabilité et fiabilité, et contrôles statistiques de qualité. Entre autres, elle s'applique aux
processus tels que: l'émission des quanta de lumière par des atomes excités, le nombre de
globules rouges observés au microscope, le nombre d'appels arrivant à une centrale
téléphonique ainsi qu'au cas qui nous concerne, le nombre de désintégrations de noyaux
atomiques. La distribution de Poisson est valable pour presque toutes les observations faites
en physique nucléaire ou corpusculaire.
Les lois de distribution statistiques sont étables en supposant la réalisation d'un nombre infini
de mesures. Il est évident que nous ne pouvons en effectuer qu'un nombre fini . D'où la
nécessité d'établir des correspondances entre les valeurs utiles théoriques et expérimentales.
Pour ces dernières nous n'obtenons évidemment qu'une approximation dont la validité est
toutefois suffisante.
, ,
193/2001
Sciences.ch 14/03/2005
, ,
Donc à chaque fois qu'une mesure est faite, il s'ensuit une incertitude sur le résultat unique
obtenu. Supposons avoir compté (observé) événements en fonction d'une certaine variable;
l'écart entre et la moyenne sera en moyenne . Il est donc naturel d'écrire:
Partons d'une distribution binomiale et faisons tendre le nombre d'épreuves vers l'infini.
Si est fixé au départ, la moyenne tend également vers l'infini; de plus l'écart
tend également vers l'infini.
Remarque : le cas où varie et tend vers 0 tout en laissant fixe la moyenne ayant
été étudié lors de la présentation de la loi de Poisson.
Nous en concluons que est une fonction croissante de , tant que est
positif.
194/2001
Sciences.ch 14/03/2005
Si devient grand il est clair que l'est également! Dès lors, pour autant que soit fixé et
que nous nous intéressions aux valeurs de la fonction proches de la moyenne dès
lors les variations de peuvent s'écrire :
la valeur de la nouvelle variable tende vers zéro lorsque nous effectuons un passage à la limite
pour et dont la moyenne soit nulle (variation négligeables) et telle que son écart-type soit
unitaire. Nous avons :
195/2001
Sciences.ch 14/03/2005
Démonstration :
Nous avons :
puisque est une fonction paire (voir chapitre d'analyse fonctionnelle). Ecrivons
maintenant le carré de l'intégrale de la manière suivante :
et faisons un changement de variable en passant en coordonnées polaires, dès lors nous ferons
aussi du Jacobien dans ses mêmes coordonnées (voir chapitre de calcul différentiel et
intégral) :
196/2001
Sciences.ch 14/03/2005
Nous obtenons donc la fonction (ou loi) de Gauss-Laplace, dite aussi "loi normale" :
Cette loi régit sous des conditions très générales, et souvent rencontrées, beaucoup de
phénomènes aléatoires. Elle est par ailleurs symétrique par rapport à la moyenne .
197/2001
Sciences.ch 14/03/2005
Calculons :
Donc :
Montrons aussi que représente l’écart type de (il convient, en d’autres termes de
montrer que ) et pour cela rappelons que nous avions démontré que :
Or, nous savons (la première intégrale est évidente, la seconde moins mais nous l'avons déjà
calculée un peu plus haut) :
198/2001
Sciences.ch 14/03/2005
Il reste donc à calculer la première intégrale. Pour ce procédons par une intégration par parties
(voir chapitre de calcul différentiel et intégral) :
D'où :
Il vient finalement :
La largeur de l'intervalle a une très grande importance dans l'interprétation des incertitudes
d'une mesure. La présentation d'un résultat comme signifie que la valeur moyenne a
environ 68.3% de chance (probabilité) de se trouver entre les limites de et , ou
qu'elle a 95.5% de se trouver entre et etc.
- "centrée" signifie soustraire la moyenne (la fonction à alors pour axe de symétrie l'axe
des ordonnées)
199/2001
Sciences.ch 14/03/2005
Par ce cfhangement de variable, la variable est remplacée par la variable aléatoire centrée
réduite :
Donc la relation:
FONCTION UNIFORME
Soient . La fonction:
et pour variance :
200/2001
Sciences.ch 14/03/2005
FONCTION EXPONENTIELLE
Soient . La fonction:
201/2001
Sciences.ch 14/03/2005
et pour variance
202/2001
Sciences.ch 14/03/2005
FONCTION DE CAUCHY
La fonction:
203/2001
Sciences.ch 14/03/2005
et pour variance :
FONCTION BÊTA
Nous définissons la fonction gamma d'Euler comme étant la relation (voir le chapitre de
calcul différentiel et intégral dans la section d'algèbre) :
pour . Nous pouvons démontrer que la fonction ainsi définie est bien définie, c'est à dire
204/2001
Sciences.ch 14/03/2005
où :
nous obtenons :
La fonction qui apparaît dans l'expression ci-dessus est appelée "fonction bêta" et nous
avons donc :
où :
205/2001
Sciences.ch 14/03/2005
et pour variance :
et donc :
206/2001
Sciences.ch 14/03/2005
en couleur or :
FONCTION GAMMA
et donc :
et nous vérifions avec un raisonnement similaire en tout point celui de fonction bêta que
est une fonction de distribution :
207/2001
Sciences.ch 14/03/2005
et pour variance :
FONCTION DE KHI-DEUX
208/2001
Sciences.ch 14/03/2005
LOI DE STUDENT
209/2001
Sciences.ch 14/03/2005
et sa variance :
LOI DE BENFORD
En 1938, un mathématicien du nom de Franck Benford fait une constatation curieuse. Dans la
bibliothèque de l'université, il remarque que les premières pages des tables de logarithmes
sont nettement plus usées que les dernières.
Seule explication possible : nous avons plus souvent besoin d'extraire le logarithme de
chiffres commençant par 1 que de chiffres commençant par 9, ce qui implique que les
premiers sont "plus nombreux" que les seconds.
Bien que cette idée lui paraisse tout à fait invraisemblable, Benford entreprend de vérifier son
hypothèse. Rien de plus simple : il se procure des tables de valeurs numériques, et calcule le
pourcentage d'apparition du chiffre le plus à gauche. Les résultats qu'il obtient confirment son
intuition:
210/2001
Sciences.ch 14/03/2005
3 12,5 %
4 9,7 %
5 7,9 %
6 6,7 %
7 5,8 %
8 5,1 %
9 4,6 %
Il convient de préciser que cette loi ne s'applique qu'à des listes de valeurs "naturelles", c'est-
à-dire à des chiffres ayant une signification physique. Elle ne fonctionne évidemment pas sur
une liste de chiffres tirés au hasard.
La loi de Benford a été testée sur toute sorte de table : longueur des fleuves du globe,
superficie des pays, résultat des élections, liste des prix de l'épicerie du coin... Elle se vérifie à
tous les coups.
Elle est évidemment indépendante de l'unité choisie. Si l'on prend par exemple la liste des prix
d'un supermarché, elle fonctionne aussi bien avec les valeurs exprimées en Francs qu'avec les
mêmes prix convertis en Euros.
211/2001
Sciences.ch 14/03/2005
Cet étrange phénomène est resté peu étudié et inexpliqué jusqu'à une époque assez récente.
Puis une démonstration générale en a été donnée en 1996, qui fait appel au théorème de la
limite centrale.
Aussi surprenant que cela puisse paraître, cette loi a trouvé une application : le fisc l'utilise
aux Etats-Unis pour détecter les fausses déclarations. Le principe est basé sur la restriction
vue plus haut : la loi de Benford ne s'applique que sur des valeurs ayant une signification
physique.
S'il existe une distribution de probabilité universelle sur de tels nombres, ils doivent
êtres invariants sous un changement d'échelle tel que:
Si:
alors:
Cette fonction, n'est pas en premier lieu à proprement parler une fonction de distribution de
probabilité (elle diverge) et deuxièment, les lois de la physique et humaine imposent des
limites.
212/2001
Sciences.ch 14/03/2005
Nous devons donc comparer cette distribution par rapport à une référence arbitraire. Ainsi, si
le nombre décimal étudié contient plusieurs puissance de 10 (10 au total: 0,1,2,3,4,5,6,7,9) la
probabilité que le premier chiffre non nul (décimal) soit est donné par la distribution
logarithmique:
De par les propriétés des logarithmes (voir le chapitre d'analyse fonctionelle dans la section
d'algèbre du site) nous avons :
Cependant, la loi de Benford ne s'applique pas uniquement aux données invariantes par
changement d'échelle mais également à des nombres de provenant de sources quelconques.
Expliquer ce cas implique une investigation plus rigoureuse en utilisant le théorème de la
limite centrale. Cette démonstration a été effectuée seulement en 1996 par T. Hill par une
approche utilisant la distribution des distributions.
ESTIMATEURS
213/2001
Sciences.ch 14/03/2005
Nous allons chercher à estimer cette loi de probabilité inconnue à partir des observations
. Nous n'allons pas chercher cette loi dans l'ensemble de toutes les probabilités
possibles sur .
Nous allons au contraire supposer que nous possédons une connaissance a priori sur cette loi
de probabilité. Nous allons supposer qu'il existe une partie telle qu'à chaque ,
nous puissions associer une probabilité sur et telle que la probabilité inconnue puisse
s'écrire avec .
Supposons que l'on procède par tâtonnement pour estimer la loi de probabilité inconnue
. Nous essayons une probabilité arbitraire et l'on veut
savoir si ce choix est raisonnable ou loufoque. Une manière de procéder est de se demander si
les observations avaient une probabilité élevée ou non de sortir avec cette
probabilité arbitraire.
Nous somme donc à chercher le (ou les) paramètre(s) qui maximise(nt) la quantité :
Cette quantité porte le nom de "vraisemblance". C'est une fonction du paramètre et des
observations . La ou les valeurs du paramètre qui maximisent la
vraisemblance sont appelées "estimateurs du maximum de vraisemblance".
Faisons quand même un petit exemple (très classique et utile) avec la fonction de distribution
de Gauss-Laplace :
214/2001
Sciences.ch 14/03/2005
Nous avons donc bien un modèle statistique dominé. La vraisemblance est donnée par:
Ainsi :
Ce qui nous permet d'écrire (nous connaisssons déjà par coincïdence théorique l'expression
d'un tel estimateur) :
Cependant, nous n'avons pas encore défini ce qu'était un bon estimateur. Il nous faut
néanmoins préciser dès à présent qu'un estimateur biaisé peut très bien être un bon estimateur,
alors qu'un estimateur sans biais pourra se révéler être un mauvais estimateur. Ce que nous
entendons par là:
- Si un estimateur , vérifie , nous disons que cet estimateur est "sans biais" (il
correspond au paramètre réel)
215/2001
Sciences.ch 14/03/2005
Dans l'exemple précédent, la moyenne est biaisée mais qu'en est-il de la variance ? Or, nous
avons :
deux relations que nous retrouvons souvent dans les tables et dans les logiciels !
TESTS D'ADÉQUATION
Dans cette partie, nous supposons que la loi de probabilité de la variable aléatoire , dont
nous disposons d'un échantillon, est inconnue. Une première remarque s'impose : les tests
d'adéquation ne permettent pas de trouver la loi d'une variable aléatoire mais seulement
d'accepter ou de rejeter une hypothèse simple émise à priori.
Ainsi, il est nécessaire de faire une étude sommaire préalable de l'échantillon afin de formuler
des hypothèses plausibles quant à la loi de probabilité de :
216/2001
Sciences.ch 14/03/2005
Les réponses à ces différentes questions, de même que la nature de la variable représentée par
permettent dans la plupart des cas d'émettre une hypothèse plausible connaissant les
propriétés et les allures des différentes distributions vues jusque ici.
L'écart entre la réalité issue de l'échantillon et la théorie issue de l'hypothèse est mesurée
par l'indicateur:
Sous l'hypothèse , nous pouvons considérer que l'écart entre distribution théorique
et distribution empirique est distribué normalement.
217/2001
Sciences.ch 14/03/2005
Il n'est guère possible de déterminer l'erreur de deuxième espèce (et donc la puissance du
test), la loi de probabilité de n'étant pas spécifiée sous l'hypothèse . On ne peut donc
pas déterminer la loi de probabilité de l'indicateur sous cette hypothèse.
Pour que la loi (sous l'hypothèse ) de l'indicateur d'écart tende effectivement vers une loi
du , il est nécessaire que l'effectif d'une classe soit en pratique supérieur à 5. Dans le cas
contraire, il faudra procéder à un regroupement des classes jusqu'à ce que cette contrainte soit
satisfaite.
CONTRÔLE DE QUALITÉ
Nous renoncons souvent à un contrôle à 100% à cause du prix. Nous procèdons alors à une
prise d'échantillons. Ceux-ci doivent être présentés, c'est-à-dire quelconque et d'égales
chances. But de la prise d'échantillons : information de la probabilité du taux de défaillances
réel du lot complet sur la base des défaillances constatées sur l'échantillonnage.
Exemple:
Cette probabilité du taux de défaillance réelle se calcule comme suit si, lors d'un
échantillonnage de n pièces parmi un lot total de pièces, on trouve exactement
défectueuses et si p désigne la probabilité d'une pièce défectueuse et le nombre de
pièces défectueuses de lot .
On considère un lot de pièces contenant pièces dont sont défectueuses et les autres
parfaites. On tire successivement, et sans les remettre dans le lot, pièces. Quelle est la
probabilité que parmi ces pièces, il y en ait qui soient défectueuses?
Nous avons déjà vu que la loi qui s'applique dans ce contexte est la loi géométrique donnée
par (nous l'avons démontré) :
218/2001
Sciences.ch 14/03/2005
qui donne donc la probabilité que pièces défectueuses parmi l'échantillon de pièces.
car identiquement au fait que représente le nombre de pièces non défectueuses parmi
les pièces tirées uniquement, dans notre problème représente lui aussi le nombre de
pièces non défectueuses mais dans le lot total car c'est relativement à la totalité que l'on
souhaite faire une comparaison.
Corollaire:
car identiquement au fait que représente le nombre de pièces non défectueuses dans le
lot total , au contraire dans notre problème d'origine comme on inverse l'objectif nous
allons nous intéresser aux pièces non défectueuses sur l'échantillon qui a été pris au hasard
(pour l'instant tout est une question de mis en rapport logique).
Corollaire:
On a donc finalement:
qui donne la probabilité d'avoir pièces défectueuses dans un échantillon de pièces prises à
partir d'un lot total de pièces.
Ce qui nous intéresse est une tolérance maximale, nous n'allons donc non plus calculer la
simple probabilité de tomber sur pièces défectueuses, mais la probabilité cumulée
(maximale!) qui se calcule dans ce cas particulier comme:
219/2001
Sciences.ch 14/03/2005
Exemple:
Le calcul montre que l'on peut tolérer au pire qu'une pièce soit défectueuse.
COURBE D'EFFICACITÉ
220/2001
Sciences.ch 14/03/2005
MOYENNES
La notion de moyenne nous semble très familière et nous en parlons beaucoup sans nous
poser trop de questions. Pourtant il existe divers qualificatifs (nous insistons sur le fait que ce
ne sont que des qualificatifs) pour distinguer la forme de la résolution d'un problème
consistant à calculer la moyenne. Il faut donc être très très prudent quand aux calculs des
moyennes car nous avons une fâcheuse tendance à nous précipiter et à utiliser
systématiquement la moyenne arithmétique sans réfléchir, ce qui peut amener à de graves
erreurs !
Nous verrons ci-dessous différentes moyennes avec des exemples relatifs à l'arithmétique, au
dénombrement, à la physique, à l'économétrie, à la géométrie. Le lecteur trouvera d'autres
exemples en parcourant l'ensemble du site.
221/2001
Sciences.ch 14/03/2005
1. la valeur milieu qui coupe la suite en deux parties de cardinaux égaux si est impair
peu connue et de faible intérêt mais découle souvent de raisonnement simples dont voici un
exemple:
Soit un carré de côté , et un autre carré de côté . La somme des aires des deux carrés est
égale à :
Au fait, cette moyenne à peu d'intérêt et elle peut être généralisée aussi à des formes de
dimensions plus élevées selon la relation donnée dans la définition.
peu connue mais découle souvent de raisonnements simples et pertinents dont voici un
exemple :
Soit une distance parcourue dans un sens à la vitesse et dans l'autre (ou pas) à la vitesse
. La vitesse moyenne s'obtiendra en divisant la distance totale par le temps mis à la
parcourir:
222/2001
Sciences.ch 14/03/2005
Si nous calculons le temps mis lorsqu'on parcourt avec une vitesse c'est tout simplement
le quotient:
peu connue et assez peu rencontrée (mais connue dans le domaine de l'économétrie surtout
quand nous étudierons le rendement géométrique moyen), voyons un exemple de cette
moyenne:
Supposons qu'une banque offre une possibilité de placement et prévoit pour la première année
un intérêt (c'est absurde mais c'est un exemple) de , mais pour la deuxième année
un intérêt de Au même moment une autre banque offre un intérêt constant pour
deux ans: . C'est pareil, dirons-nous un peu rapidement. En fait les deux placements n'ont
pas la même rentabilité.
et la seconde année:
223/2001
Sciences.ch 14/03/2005
etc...
Posons maintenant:
et
Au bout de deux ans le capital est multiplié par . Si la moyenne vaut il sera alors
multiplié par . Nous avons donc la relation:
Une Moyenne Mobile ( ) est une courbe calculée à partir des moyennes des cours d'une
valeur, sur une période donnée: chaque point d'une moyenne mobile sur 100 séances est la
moyenne des 100 derniers cours de la valeur considérée.
Cette courbe, affichée simultanément avec la courbe d'évolution des cours de la valeur,
permet de lisser les variations journalières de la valeur, et de dégager une tendance haussière
224/2001
Sciences.ch 14/03/2005
si la moyenne mobile est croissante avec les cours de la valeur situés au dessus de la Moyenne
Mobile et baissière si la moyenne mobile est décroissante avec les cours de la valeur situés au
dessous de la moyenne mobile
Les moyennes mobiles peuvent être calculées sur différentes périodes, ce qui permet de
dégager des tendances à court terme (20 séances selon les habitudes de la branche), moyen
terme (50-100 séances) ou long terme (plus de 200 séances).
Les croisements des moyennes mobiles par la courbe des cours de la valeur génèrent des
signaux d'achat ou de vente selon les professionnels suivant le cas:
- signal d'achat: lorsque la courbe des cours franchit la MM vers le haut sur de bons volumes
de transactions et que la MM sert de support à la courbe des cours.
- signal de vente: lorsque la courbe des cours franchit la MM vers le bas et que la MM sert de
résistance à la courbe des cours.
La moyenne pondérée est utilisée, en géométrie pour localiser le barycentre d'un polygone, en
225/2001
Sciences.ch 14/03/2005
physique pour déterminer le centre de gravité ou en statistique et probabilité pour calculer une
espérance. Nous la calculons ainsi :
Dans le cas général le poids représente l'influence de l'élément par rapport aux autres.
La valeur moyenne d'une fonction d'une variable réelle intégrable (voir chapitre de
calcul différentiel et intégral) sur un intervalle est :
où nous retrouvons :
Démonstration : tout d’abord, nous prenons 2 nombres réels non nuls et tels que
et nous écrivons :
226/2001
Sciences.ch 14/03/2005
1. La moyenne arithmétique :
2. La moyenne géométrique :
3. La moyenne harmonique :
4. La moyenne quadratique :
Remarque : les comparaisons entre les moyennes précitées et la "médiane" ou encore les
"moyennes glissantes" et "pondérées" n'ont pas de sens c'est pour cela que nous nous
abstenons à les faire.
Mais comme :
et
Il y donc contradiction et :
227/2001
Sciences.ch 14/03/2005
Or le carré d'un nombre est toujours positif ce qui vérifie notre hypothèse initiale :
Or le carré d'un nombre est toujours positif ce qui vérifie notre hypothèse initiale :
Ces inégalités démontrées, nous pouvons alors passer à une figure que nous attribuons à
Archimède pour placer trois de ces moyennes. L'intérêt de cet exemple est de montrer qu'il
228/2001
Sciences.ch 14/03/2005
Nous savons que est sur un cercle de diamètre , donc est rectangle en , donc :
229/2001
Sciences.ch 14/03/2005
CALCULS D'ERREURS
Nous appelons bien évidemment "erreur", la différence entre la valeur mesurée et la valeur
exacte. Cependant, comme nous ignorons la valeur exacte, nous ne pouvons pas connaître
l'erreur commise quand même…. Le résultat est donc toujours incertain. C'est la raison pour
laquelle nous parlons parfois des "incertitudes de mesure".
1. Les "erreurs systématiques" : elles affectent le résultat constamment et dans le même sens
(erreurs des appareils de mesures, limites de précision, etc.). Il faut alors éliminer, ou corriger
le résultat, si possible !
230/2001
Sciences.ch 14/03/2005
2. Les "erreurs accidentelles" (statistiques) : il faut alors répéter les mesures, calculer la
moyenne et évaluer l'incertitude en utilisant les outils de statistique.
Si la vraie valeur d'une grandeur est (connue théoriquement) et la valeur mesurée est ,
est "l'incertitude absolue" (l'incertitude dû aux appareils de mesure) telle que :
ERREURS STATISTIQUES
Dans la plupart des mesures, nous pouvons estimer l'erreur due à des phénomènes aléatoires
par une série de mesures :
Comme nous l'avons vu plus haut, la valeur moyenne arithmétique sera alors :
231/2001
Sciences.ch 14/03/2005
et comme nous l'avons vu, après un grand nombre de mesures indépendantes, la distribution
des erreurs sur une mesure suit une gaussienne tel que nous puissions écrire :
Lorsque est petit, est remplacé au voisinage de par sa tangente (il s'agit
simplement de la dérivée bien sûr) :
alors l'erreur maximale possible est alors la différentielle totale exacte (voir chapitre de calcul
différentiel et intégral) :
Ce qui conduit à :
232/2001
Sciences.ch 14/03/2005
CALCUL ALGÉBRIQUE
Dans la section d'arithmétique de ce site, nous avons beaucoup écrit sur différentes théories
utilisant les nombres abstraits afin de généraliser l'étendue de la validité de ces dernières.
Nous avons cependant peu abordé la façon dont nous devions manipuler avec exactitude ces
nombres abstraits. C'est ce que nous allons voir maintenant.
Comme vous le savez peut-être déjà, le nombre peut être envisagé en faisant abstraction de la
nature des objets qui constituent le groupement qu'il caractérise; et ainsi qu'à la façon de
codifier (chiffre arabe, romain, ou autre système...). Nous disons alors que le nombre est
"abstrait" et lorsque nous manipulons ces types de nombres nous disons que nous faisons du
"calcul algébrique" ou encore du "calcul littéral".
Pour les mathématiciens il n'est pas avantageux de travailler avec des valeurs numériques
(1,2,3…) car ils représentent uniquement des cas particuliers. Ce que cherchent les physiciens
théoriciens ainsi que les mathématiciens, se sont des relations applicables universellement
dans un cadre le plus général possible.
Ces nombres abstraits appelés aujourd'hui communément "variables" sont très souvent
représentés par:
1. L'alphabet latin ( )
2. Par l'alphabet grec, qui est lui particulièrement utilisé pour représenter des opérateurs
mathématiques plus ou moins complexes (comme le sont le + pour l'addition, le - pour la
soustraction par exemple).
Bien que ces symboles puissent représenter n'importe quel nombre, il en existe quelques uns
qui peuvent représenter des constantes dites Universelles (vitesse da la lumière , la constante
gravitationnelle , ...).
Remarque : il semblerait que les lettres pour représenter les nombres ont été employées pour
la première fois par Viète.
Une variable est donc susceptible de prendre des valeurs numériques différentes. L'ensemble
de ces valeurs peut varier suivant le caractère du problème considéré.
Rappels (nous avions déjà défini cela dans le chapitre traitant des nombres dans la section
d'arithmétique) :
D1. nous appelons "domaine de définition" d'une variable, l'ensemble des valeurs numériques
qu'elle est susceptible de prendre.
233/2001
Sciences.ch 14/03/2005
D2. nous appelons "intervalle fermé d'extrémité et ", l'ensemble de tous les nombres
compris entre ces deux valeurs comprises et nous le désignons de la façon suivante :
D3. nous appelons "intervalle ouvert d'extrémité et ", l'ensemble de tous les nombres
compris entre ces deux valeurs non comprises et nous le désignons de la façon suivante:
D4. nous appelons "intervalle fermé à gauche, ouvert à droite" la relation suivante :
D5. nous appelons "intervalle ouvert à gauche, fermer à droite" la relation suivante :
Remarque : si la variable peut prendre toutes les valeurs négatives et positives possibles nous
écrivons dès lors: où le symbole " " signifie une infinité. Evidemment il peut y
avoir des combinaisons d'intervalles ouverts et infinis à droite, fermé et limité gauche et
réciproquement.
ÉQUATIONS ET INÉQUATIONS
Nous allons définir de suite après ce qu'est une équation et une inéquation mais nous
souhaitons d'abord définir certaines de leurs propriétés :
Soit et deux polynômes (ou monômes) quelconques - voir définitions un peu plus loin -
les expressions :
P1. Nous pouvons toujours ajouter ou ôter aux deux membres d'une inéquation ou équation un
même polynôme en obtenant une inéquation ou équations équivalente (c'est à dire avec les
mêmes solutions ou réductions).
P2. Si nous multiplions ou si nous divisons les deux membres d'une inéquation par un même
nombre positif nous obtenons également une inéquation ou équation équivalente (nous avons
234/2001
Sciences.ch 14/03/2005
déjà vu cela).
P3. Si nous multiplions ou si nous divisons les deux membres d'une inéquation par un même
nombre négatif et si nous inversons le sens de l'inégalité, nous obtenons alors une inéquation
ou équation équivalente.
ÉQUATIONS
Définition : une équation est une relation d'égalité entre des valeurs toutes abstraites
(autrement dit : deux expressions algébriques) ou non toutes abstraites (dès lors nous parlons
d'équations à une inconnue, deux inconnues, trois inconnues, ... ) reliées entre elles par des
opérateurs divers.
Comme nous n'aimons pas les exemples pratiques, nous avons tenté, ci-dessous, de faire une
généralisation simpliste des règles de base de l'algèbre élémentaire. Cette générlisation sera
d'autant plus simple à comprendre que le lecteur aura l'habitude de manipuler des quantités
abstraites :
Ainsi, soit des nombres abstraits pouvant prendre n'importe quelle valeur
numérique. Soit la lettre majuscule grecque "Xi" représentant un ou plusieurs nombres
abstraits quelconques opérants entre eux d'une façon quelconque tel que nous ayons des
monômes (un seul nombre abstrait) ou polynômes (poly = plusieurs) algébriques différents
distinguables ou non (nous faisons un abstrait de l'abstraction).
Propriétés :
P2. Sinon:
235/2001
Sciences.ch 14/03/2005
qui vérifie la symbolique de l'équation dans le cas seulement où les éléments sont
identiques entre eux (nous excluons le dénominateur nul)
P4. Nous avons sinon (dans le cas où tous les sont strictement différents) :
dans le cas où une simplification des termes contenus dans les amènent à une identité de la
relation binaire non nécessairement égale à l'unité.
Mais... il est possible que dans l'expression précédente certains différents s'annulent
cependant entre eux dès que leur multiplication mutuelle est égale à l'unité.
qui ne peut s'écrire autrement mais il peut arriver que avec le à droite de
l'égalité identique à aucun, un ou encore plusieurs du membre gauche de l'égalité.
sans que nécessairement les exposants du numérateur ou dénominateur soient égaux (nous
excluons le dénominateur nul)
ou
mais il n'est cependant bien évidemment pas impossible d'avoir quand même ou
(nous excluons exclut le dénominateur nul)
236/2001
Sciences.ch 14/03/2005
Mais... il est également possible que dans l'expression précédente certains différents
s'annulent cependant entre eux dès que leur divisions mutuelle est égale à l'unité (nous
excluons le dénominateur nul)
Si tous les sont identiques entre eux ou si la combinaison d'un nombre indéterminés de
sont égaux au présent à droite de l'égalité.
il peut cependant arriver que le à droite de l'égalité soit identique à aucun, un ou plusieurs
du membre gauche de l'égalité.
Quelque que soient les (égaux ou non) où les puissances (égales ou non) donnés.
A partir de la connaissance des ces 13 règles (peut être en avons nous oubliés quelques unes),
nous pouvons résoudre, simplifier ou montrer qu'une équation possède des solutions ou non
par rapport à un problème ou énoncé donné.
Ainsi, soit une opérande ou une suite d'opérations quelconques sur une ou des abstractions
d'abstrait et parmi tous les , une (ou plusieurs) dont la ou les valeurs numériques est ou
sont inconnues (les autres étant connues). Alors, nous devons pouvoir trouver ou démontrer
qu'une équation du type:
237/2001
Sciences.ch 14/03/2005
avec le deuxième membre strictement positif (sinon la relation précédente serait un non sens)
cela équivaut bien sûr d'après la définition de la valeur absolue à écrire :
et
Remarques :
R1. la présence de la valeur absolue dans une équation algébrique dont nous cherchons les
solutions double souvent le nombre de solutions.
R2. une équation est dite "équation conditionnelle", s'il y a des nombres dans l'ensemble de
définition des expressions qui ne sont pas solutions (ce qui au fait le cas le plus fréquent).
Inversement, si tout nombre de l'ensemble de définition est solution de l'équation alors
l'équation est dit "équation identité".
Nous pouvons parfois avoir à résoudre (et non à simplifier) un "système d'équations". Qu'est-
ce que c'est ? : C'est un ensemble d'au moins 2 équations à résoudre (et non à simplifier). La
particularité du système ? : L'ensemble des solutions du système est l'intersection des
solutions de toutes les équations à résoudre. Quelle est leur utilité ? : Elle est sans fin, ces
systèmes permettent de résoudre des problèmes faisant intervenir des applications des
mathématiques à d'autres domaines. A cause de la variété illimitée des applications, il est
difficiele d'établir des règles précises pour trouver des solutions. La marche à suivre que voici
peut-être utile pour autant bien sûr que le problème puiss être formulé sous forme
d'équations :
1. Si le problème est posé par écrit, le lire plusieurs fois soigneusement, réfléchir aux faits
donnés ainsi qu'à la quantité d'inconnues à trouver (résumer l'énonce sur une feuille de papier
est souvent plus qu'utile pour les gros problèmes).
2. Choisir une lettre qui représente la quantité inconnue. C'est l'un des pas décisifs dans la
recherche de la solution. Des phrases contenant des mots comme : trouver, quoi, combien, où,
quand ; devraient vous renseigner sur la quantité inconnue
3. Faire éventuellement un dessin (de tête ou sur papier) avec des légendes
4. Dresser une liste des faits connus et des relations concernant les quantités inconnues. Une
relation peut être décrite par une équation dans laquelle apparaissent d'un seul ou des deux
côtés du signe égal des énoncés écrits à la place des lettres ou des nombres.
5. Après avoir analyse la liste de l'étape 4, formuler une équation qui décrive précisement ce
qui est énoncé avec des mots.
238/2001
Sciences.ch 14/03/2005
La méthode résolution des systèmes d'équations sont traités en détails dans le chapitre traitant
des algorithmes dans la section d'analyse numérique du site (vous y verrez la méthode) et
également dans le chapitre d'algèbre linéaire de la présente section (vous comprendez pour la
méthode est telle qu'elle est).
INÉQUATIONS
Précédemment nous avons vu q'une équation était une égalité composée de différents calculs
avec différents termes (dont au moins une "inconnue" ou "un chiffre abstrait" ), et que
"résoudre" une équation revenait à calculer la valeur de l'inconnue de l'égalité, alors que la
"simplifier" revenait à minimiser mathématiquement le nombre de termes (en factorisant ou
autre..) et que développer revenait à mettre à plat tous les termes.
Pourquoi avons-nous besoin de rappeler la définition d'une équation ? Tout simplement parce
que pour l'inéquation, c'est la même système. La différence ? Si l'équation est une égalité,
l'inéquation est une inégalité : comme l'équation, l'inéquation est composée de différents
calculs avec différents termes reliés entre eux par des opérateurs quelconques, dont au moins
une inconnue.
- Inégalité : l'inégalité est l'utilisation des symboles de relation d'ordre symbolisée par les
signes .
Lorsque nous résolvons une inéquation, notre inconnue peut-avoir plusieurs valeurs qui
satisfont à l'inéquation. Nous disons alors que la solution de l'inéquation est un "ensemble de
valeurs".C'est la différence fondamentale entre une égalité et une inégalité !
Rappelons les signes que nous pouvons rencontrer dans une inéquation sont :
: se lit "strictement inférieur à "ou "strictement plus petit que". Dans ce cas, la valeur
butoire numérique n'est pas comprise dans le domaine des valeurs solutions de l'inéquation et
nous représentons alors le domaine avec un crochet ouvert : ]....
: se lit "strictement supérieur à" ou "strictement plus grand que". Dans ce cas, la valeur
butoire numérique n'est également pas comprise dans le domaine des valeurs solutions de
l'inéquation et nous représentons alors le domaine avec un crochet fermé : [....
: se lit "inférieur ou égal à "ou "plus petit ou égal à". Dans ce cas, la valeur butoire
numérique est comprise dans le domaine des valeurs solutions de l'inéquation et nous
représentons alors le domaine avec un crochet fermé : [....
: se lit "supérieur ou égal à "ou "plus grand ou égal à" . Dans ce cas, la valeur butoire
numérique est également comprise dans le domaine des valeurs solutions de l'inéquation et
nous représentons alors le domaine avec un crochet fermé : [....
Nous renvoyons le lecteur au début de ce chapitre où nous avions définit la manière d'écrire
des domaines de définition.
239/2001
Sciences.ch 14/03/2005
L'objectif des inéquations est la plupart du temps (excepté le côté esthétique) d'avoir au moins parmi
l'ensemble des termes une valeur numérique qui permet de définir le domaine de solution (des tous
les termes abstraits de l'inéquation) qui satisfont l'inéquation.
Il existe plusieurs façon de représent les domaines de définition des variables qui satisfont à
l'inéquation. Nous allons voir un travers un petit exemples quelles sont ces possibilités :
Soit une inéquation linéaire (du premier degré) en à une seule inconnue à laquelle nous
imposons un contrainte particulière arbitraire pour l'exemple (évidemment l'expression peut
contenir plus de termes...) :
nous avons dans l'inéquation ci-dessus déjà simplifié tous les termes qui étaient superflus.
Résoudre l'inégalité revient à chercher la valeur de inférieure à 2. Bien sûr, il n'existe pas un
seule solution dans mais un ensemble de solutions et c'est cela même le principe des
inéquations.
Pour résoudre l'inéquation, nous observons d'abord le type d'inégalité imposée ("stricte" ou
"ou égal"). Ensuite, dans les petites classes (et pas seulement parfois…) nous représentons
l'ensemble par un tableau tel que :
- 0 +
................... ......|...... ...................
Nous savons intuitivement que la solution de notre inéquation regroupe toutes les valeurs
inférieures à 2 (2 exclu des solutions) et ce jusqu'à - . Nous écrivons alors cet "intervalle" ou
"domaine" :
Ensuite, nous pouvons représenter graphiquement l'ensemble des solutions (cela aide à
comprendre et prépare l'étudiant à la résolution de systèmes d'équations et d'inéquation
et aux variations de fonctions). Pour cela, nous reprenons le modèle de schéma du
système numérique, et y plaçons notre notre valeur butoir (nous n'en avons qu'une
dans cet exemple mais parfois il peut y en avoir plusieurs du au fait qu'il y un
singularité ou des racines pour certaines valeurs du domaine de définition), soit 2 :
- 0 2 +
................... ......|...... ......|...... ...................
et enfin, nous délimitons au stylo de couleur (…) l'ensemble des solutions de - à 2 exclu :
- 0 2 +
................... ......|...... ......[...... ...................
A la valeur 2, nous n'oublions pas de marquer le signe ....[ pour montrer que cette valeur est
exclue des solutions. Et voilà, le tour est joué et le concept est extrapolable a des inéquation
beaucoup plus complexes.
240/2001
Sciences.ch 14/03/2005
Remarques :
R1. parfois au lieu de représenter les tableaux comme nous l'avons fait, certains professeurs
(c'est un choix complétement artistique) demandent à leur élèves d'hachurer les cases du
tableau et d'y dessiner de petits ronds, ou encore se servent de petites flèches, ou encore de
dessinger le graphique des fonctions de l'inéquation (cette dernière méthode est certes
esthétique mais prend du temps..).
R2. dans le cadre d'inéquations de degré supérieur à 1, il faut (voir plus loin ce que cela
signifie exactement) d'abord déterminer les racines de l'inéquation qui permettent de
déterminer les intervalles et ensuite par essais successifs, déterminer quels intervalles sont à
rejeter ou a conserver.
Nous pouvons également (au même titre que les équations) parfois avoir à résoudre un
"système d'inéquations". Qu'est-ce que c'est ? : C'est un ensemble d'au moins 2 inéquations à
résoudre. La particularité du système ? : L'ensemble des solutions du système est
l'intersection des solutions des toutes les inéquations à résoudre.
Autrement dit, la méthode est la même que la précédente, à la différence que notre tableau
(représentant les domaines de solutions) comportera une ligne supplémentaire par inéquation
supplémentaire dans le système plus une ligne de synthèse qui est la projection des domaines
de solutions possibles du système.
Mathématiquement, les domaines (car il peuvent y en avoir plusieurs qui sont disjoints)
peuvent s'écrire comme un ensemble des domaines :
Par exemple, voici une possible représentation du domaine de solutions d'un système
d'inéquations pris du chapitre traitant de l'algorithmique dans la section d'analyse numérique
où nous étudions la "recherche opérationnelle".
241/2001
Sciences.ch 14/03/2005
IDENTITÉS REMARQUABLES
Les identités remarquables sont des "formules magiques", qui nous servent le plus souvent
pour la factorisation ou la résolution d'équations algébriques.
Rappelons certaines notions qui ont déjà été vues dans le chapitre de théorie des ensembles de
la section d'arithmétique (nous supposons le concept d'élément neutre conne puisque déjà
défini) :
Commutativité :
et
Associativité :
et
Distributivité :
Les mêmes observations sont valables avec l'opération de soustraction bien évidemment dans
les domaines de définition adéquats.
Nous pouvons vérifier avec des valeurs numériques (en remplaçant chaque nombre abstrait
par un nombre choisi au hasard), ou par distribution (ce serait mieux, ainsi vous êtes sûr
d'avoir compris ce dont quoi nous parlions), que les identités algébriques suivantes sont
vérifiées (ce sont les plus connues) :
242/2001
Sciences.ch 14/03/2005
Remarque: nous pouvons très bien poser que où nous avons bien
évidemment posé que (nous faisons un "abstrait d'abstraction" ou plus
couramment : un "changement de variable"...)
Nous remarquons : et
P1. Les puissances de décroissent de à0( , donc il n'est pas noté dans le dernier
terme)
P2. Les puissances de croissent de 0 à ( , donc il n'est pas noté dans le dernier
terme)
P4. Les coefficients multiplicateurs devant chaque terme se calculent en faisant la somme des
coefficients multiplicateurs de deux termes du développement obtenu avec la valeur
précédente de (voir la figure ci-dessous).
Dont chaque élément est donné par (voir le chapitre traitants des probabilités et statistiques
dans la section d'arithmétique pour l'origine mathématique de cette relation):
avec .
243/2001
Sciences.ch 14/03/2005
Pour ce qui est des identités remarquables avec des valeurs négatives, il est inutile d'apprendre
par coeur l'emplacement du signe "-". Il suffit de faire un changement de variable et une fois
le développement fait de refaire le changement de variable dans l'autre sens. Exemple :
Nous pouvons bien sûr mélanger les genres tels que (fameux exemple particulier) :
et quelques relations remarquables pratiques supplémentaires qui sont souvent utilisées dans
les petites classes pour les exercices :
et autre cas très fréquent que l'on résout par essais successifs lorsque le professeur donne le
polynôme à décomposer (si quelqu'un connait un méthode directe nous sommes preneurs) :
Bien sûr, il y en a encore un beaucoup plus grand nombre de relations utiles (dont une partie
découlent d'une généralisation de celle présentées ci-dessus) que le lecteur découvrira par ses
propres raisonnements et en fonction de sa pratique.
Remarques :
R1. il est bien sûr possible de multiplier des polynômes entre eux et de distribuer les termes
multiplicatifs. Inversement, il est souvent demané aux élèves des petites classes de faire la
procédure inverse ("factoriser" ou "décomposer" un polynôme) afin qu'ils s'habituent à la
manipulation des identités remarquables. Décomposer en un produit de facteurs est une
opération importante en mathématiques, puisqu'il est ainsi possible de réduire l'étude
d'expressions compliquées à l'étude de plusieurs expressions plus simples.
R2. un polynôme ayant ses coefficients dans un ensemble de nombres est dit "premier" ou
"irréductible" sur , s'il est de degré positif, et s'il ne peut pas être écrit comme un produit de
deux polynômes eux-mêmes irréductibles de degré positif à coefficients aussi dans .
244/2001
Sciences.ch 14/03/2005
POLYNÔMES
Définition (simpliste) : nous appelons "polynôme algébrique " une fonction de degré
qui s'écrit :
Remarque : le en indice du est parfois omis car explicitement défini dans l'énoncé.
où et sont des entiers . Ainsi, un polynôme est une somme d'un nombre
fini de monômes.
Définition : Nous nommons "racine" ou "zéro de polynôme", la ou les valeurs telles que
à la condition qu'au moins un des avec soit non nul.
Si le polynôme admet une ou plusieurs racines nous pouvons alors factoriser ce dernier
sous la forme:
Les identités algébriques sont des exemples de types particuliers de fonctions polynomiales.
Considérons une constante et une variable et :
nous retrouvons :
245/2001
Sciences.ch 14/03/2005
Définition : le "coefficient dominant" d'un polynôme est le coefficient de son monôme de plus
haut degré.
ÉQUATIONS DIOPHANTIENNES
où est un polynôme à coefficients entiers (ou rationnels) dont nous cherchons les radicaux
strictement dans ou . Des exemples classiques d'équations diophantiennes sont :
- le grand théorème de Fermat dont la conjecture dit que si est supérieur à 2, il n'existe pas
d'entiers non nuls pour lesquels:
Pour la démonstration il faudra attendre un peu que les auteurs du site aient le temps de la
comprendre également (...).
POLYNÔMES DE DEGRÉ 1
Soit :
tel que .
Remarques:
R1. il faut toujours prendre l'habitude de vérifier l'existence de la solution dans l'équation
d'origine pour s'assurer de la validation du domaine de définition de la solution.
246/2001
Sciences.ch 14/03/2005
Effectivement, il existe des solutions aux développement de résolution d'une équation qui ne
vérifient pas l'équation d'origine et c'est ce que nous nommons des "solutions étrangères" ou
encore "racines étrangères".
R2. si les coefficients du polynômes de degré 1 sont tous réels alors la racine est réelle.
R3. Si un des coefficients est complexe alors la racine est nécessairement complexe.
R4. Si les deux coefficients sont complexes, alors la racine est soit complexe soit réelle.
POLYNÔMES DE DEGRÉ 2
Soit :
tel que et où nous définissons un nouveau terme appelé "déterminant" qui allège
souvent les écritures :
Si le polynôme du deuxième degré en comporte deux racines, nous pouvons alors factoriser
de manière irréductible :
Nous démontrons, à partir de l'expression des racines, sans trop de peine les relations dites "de
Viète":
et
247/2001
Sciences.ch 14/03/2005
Remarques :
et nous savons que nous pouvons écrire tout nombre complexe sous une forme condensée
(formule d'Euler) et comme les racines complexes d'un polynôme du second degré sont
conjugées (nous connaissons ce terme) nous avons :
où (rappel) est le module des racines complexes (module égal pour les deux racines) et
l'argument des racines complexes (égales en valeur absolue).
R2. si alors le polynôme possède une seule solution qui est bien évidemment :
R3. si alors le polynôme possède deux solution définies par les relations générales que
nous avons déjà données précédemment.
Evidemment de ce qui a été vu jusqu'à maintenant on en tire que si un polynôme admet une
ou plusieurs racines alors ce même polynôme est divisible par .
Il existe un polynôme de degré deux dont la solution est fameuse de par le monde. Ce nombre
est appelé la "divine proportion" et se retrouve en architecture, esthétique ou encore en
phyllotaxie (c'est-à-dire dans la disposition des feuilles autour de la tige des plantes).
Ce nombre vaut:
et appartient à l'ensemble des nombres irrationnels car il ne peut pas s'écrire sous forme de
fraction entière, mais c'est un nombre algébrique puisqu'il est la solution positive de
l'équation:
POLYNÔMES DE DEGRÉ 3
Bien que rare à résoudre en physique théorique ou lors de ses études, la résolution d'un
polynôme du 3ème degré est assez récréative et montre un bon exemple d'un raisonnement
248/2001
Sciences.ch 14/03/2005
mathématique déjà mature (nous devons ces développements à Scipione del Ferro et Jérome
Cardan mathématiciens du XVIème siècle…).
Soit l'équation :
avec les coefficients tous dans (pour commencer…). Dans un premier temps, le lecteur
pourra voir que les raisonnements que nous avons appliqués pour les polynômes de degrés
inférieurs coincent rapidement (excepté pour des cas particuliers simplistes bien sûr…).
Nous allons contourner le problème par des changements de variables subtils mais tout à fait
justifiés.
où (1) est connu si et seulement si est connu et où sont de tout façon connus.
249/2001
Sciences.ch 14/03/2005
Le polynôme :
étant de degré impair, il admet comme permet de le constater tout tracé visuel d'un tel
polynôme à coefficient réels aux moins un racine réelle, appelée "racine certaine" (vérifiez
vous verrez bien par une représentation graphique d'un polynôme de degré impair que cela est
trivial).
Maintenant, nous faisons un autre changement de variable (nous en avons tout à fait le droit)
subtil : en imposant la condition que doivent êtres tels que (rien ne
nous empêche d'imposer une telle contrainte) et nous alors :
Nous pouvons très bien faire une analogie entre les deux relations (1') et (2') et les relations de
Viète que nous avions obtenues pour le polynôme de degré 2 qui rappelons le étaient :
et
à la différence que nous avons maintenant (nous adoptons une autre notation pour ces racines
intermédiaires) et ce qui nous donne pour le polynôme en imposant
(toujours par analogie) une nouvelle équation :
250/2001
Sciences.ch 14/03/2005
voyons que nous avons tous les ingrédients pour trouver la première racine de l'équation
initiale qui sera la racine certaine. Ainsi :
comme et que les racine supérieurs sont cubiques nous avons nécessairement
si tous les coefficient de l'équation originale sont bien dans .
Le polynôme admet donc luis aussi une racine double et de même pour l'équation
d'origine. Nous avons vu par ailleurs que pour un polynôme du second degré si le
discriminant est nul les racines sont :
- Si nous devons à nouveau utiliser les nombres complexes comme nous l'avons fait
lors de notre étude du polynôme de degré 3. Ainsi, nous savons que l'équation en admet
deux solutions complexes telles que :
et à nouveau comme les racines sont conjuguées nous pouvons écrire sous la forme condensé :
et comme :
251/2001
Sciences.ch 14/03/2005
POLYNÔMES CYCLOTOMIQUES
Si est un entier naturel, nous appelons "polynôme cyclotomique" ce que nous notons
traditionnellement et définissons comme étant le produit de tous les monômes en
où est un racine primitive n-ième de l'unité de .
qui est un groupe cyclique (voir la théorie des ensembles dans la section d'arithmétique du
site).
Nous appelons alors "racine primitive n-ième de l'unité" ou "R.P.N." tout élément de ce
groupe l'engendrant.
De plus les éléments de sont du type avec . Nous pouvons même écrire :
Les racines quatrième de l'unité sont 1, -1, et (autrement dit chacun de ces nombres mis
à la puissance 4 donne 1). Elle forment le groupe et celui-ci peut-être engendré que par
et .
Les polynômes ont un grand nombre de propriétés que nous n'aborderons pas ici puisque ce
site ne se veut pas être un ouvrage de mathématiques supérieure.
POLYNÔMES DE LEGENDRE
Définition : les polynômes de Legendre sont définis par (lire de préférence les chapitres de
calcul différentiel et intégral ainsi que d'analyse fonctionnelle avant) :
252/2001
Sciences.ch 14/03/2005
où est donc un polynôme de degré . Nous retrouverons ces polynômes dans la résolution
d'équations différentielles en physique (propagation de la chaleur, physique quantique,
chimique quantique, etc.).
Démontrons que selon la définition du produit scalaire fonctionnel (voir chapitre d'analyse
fonctionnel et de calcul vectoriel) que les polynômes de Legendre sont orthogonaux.
P1.
Démonstration :
et par la formule de Leibniz (voir chapitre de calcul différentiel et intégral) nous avons :
d'où :
253/2001
Sciences.ch 14/03/2005
est paire.
est impaire.
Nous allons à présent démontrer la validité de la relation de récurrence suivante pour les
(relations que nous utiliserons en physique) :
pour .
Démonstration : est un polynôme de degré , il existe dès lors des tel que ce
polynôme peut s'exprimer comme combinaisons linéaire de la famille de polynômes
constituant la base orthonormale engendre :
254/2001
Sciences.ch 14/03/2005
(*)
Par les propriétés des polynômes de Legendre vues précédemment, nous pouvons écrire les
égalités :
et
d'où :
et
255/2001
Sciences.ch 14/03/2005
256/2001
Sciences.ch 14/03/2005
ANALYSE FONCTIONNELLE
Pourquoi ceci dit utilisons nous le terme "analyse" dans le cas particulier des fonctions. La
raison vient pour des raisons historiques à l'étude des divers phénomènes de la nature et la
résolution de divers problèmes techniques et par conséquent de mathématiques, qui nous
amènent souvent à considérer la variation d'une grandeur en corrélation avec la variation
d'une autre ou de plusieurs autres grandeurs. Pour étudier ces variations, de nombreux outils
sont à la disposition de tout à chacun :
Remarque : avant de commencer la lecture de ce qui va suivre, il peut être utile de rappeler au
lecteur que la définition du concept de "fonction" et propriétés élémentaires y relatives est
donné dans le chapitre de théorie des ensembles dans la section d'arithmétique.
REPRÉSENTATIONS
Nous allons voir dans ce qui va suivre, dans un premier temps, comment représenter
différentes grandeurs liées de façon tabulaire et graphique (eh oui! il faut bien car cela aide à
comprendre) et ensuite comment analyser mathématiquement les propriétés de ces
représentations uniquement à l'aide d'outils mathématiques abstraits.
Remarque: quand nous définissons la notion de "fonction", nous admettons parfois qu'à
chaque valeur de prise dans un certain domaine correspond non pas une valeur , mais
plusieurs ou même une infinité. Dans ce cas, la fonction est dite "multivalente", tandis que la
fonction précédemment définie est dite "univalente".
REPRÉSENTATION TABULAIRE
257/2001
Sciences.ch 14/03/2005
Parmi le mode de représentation visuel des fonctions (nous nous restreignons dans un premier
à l'étude d'une fonction bivalente), la plus intuitive et la plus ancienne est celle où nous
disposons dans la colonne ou la ligne d'un tableau de façon ordonnée les valeurs de la variable
indépendante et les valeurs correspondantes, dites "variables transformées" de la
fonction dans une autre colonne ou ligne alignée.
Telles sont par exemple, les tables des fonctions trigonométriques, les tables logarithmiques,
etc. et au cours de l'étude expérimentale de certains phénomènes des tables qui expriment la
dépendance fonctionnelle existant entre des grandeurs physiques mesurées tel que les relevés
de la température de l'air enregistrés dans une station météorologique durant une journée.
Bien évidemment, ce concept est généralisable à toute fonction multivalente quelque soit son
ensemble de définition.
Cependant, cette méthode elle est laborieuse et ne permet pas de voir directement le
comportement de la fonction et donc une analyse visuelle simple et intéressante de ses
propriétés. Elle a pour avantage quand même de ne pas nécessites d'outils spéciaux ou de
connaissances mathématiques poussées.
REPRÉSENTATION GRAPHIQUE
Les nombres naturels, relatifs, réels ou purement complexes peuvent tous êtres représentés le
plus simplement du monde par des points sur un axe numérique (ligne droite) infini.
3. une unité de mesure (représenté habituellement par un petit trait vertical : la "graduation")
Tel que :
Le point représente très fréquemment le nombre zéro mais nous pourrions très bien choisir
de mettre l'origine ailleurs.
Il est évident que le fait que les ensembles de nombres dont nous avons parlé soient ordonnés
implique que tout nombre est représenté par un seul point de l'axe numérique. Ainsi, deux
nombre réels distincts correspondent deux points différents de l'axe numérique.
Ainsi, il existe une correspondance biunivoque entre tous les nombres et tous les points de
l'axe numérique (dans le cas des nombres réels ou complexes, il correspond non pas un
nombre à chaque graduation mais un nombre à chaque point de l'axe). Ainsi, à chaque nombre
258/2001
Sciences.ch 14/03/2005
Dans le cas, toujours, d'une fonction bivalente, nous pouvons à chaque valeur de la variable
reportée sur un axe horizontal (appelé "axe des abscisses" ou "axe des ") faire
correspondre sa valeur au travers de sa fonction :
reportée sur un axe vertical (appelé "axe des ordonnées" ou "axe des ") qui passe par le
croisement défini par l'origine tel que (exemple arbitraire) :
Remarques :
259/2001
Sciences.ch 14/03/2005
R2. pour résoudre les équations polynomiales du second degré, il est fréquent dans les petites
classes que le professeur demande en plus à ses élèves d'une expression algébrique des racines
de :
une résolution graphique où les deux racines (dans le cas où il y en a deux distinctes) sont
données par l'intersection de la parabole avec l'axe des ordoonées (bien sûr si l'équation n'a
pas de solutions, il n'y a pas d'intersection...) :
R3. lorsque nous avons besoin pour une raison quelconque de calculer (restreignons nous
pour l'instant au plan) la distance entre deux points, il convient d'applique le théorème de
pythagore (démontré dans la section de géométrie) tel que soit trois points sur un
plan dans lequel a été défini un repère tel que présenté ci-dessous :
260/2001
Sciences.ch 14/03/2005
et
Si , nous nous retrouvons avec une relation appelée "norme" (ou plus simplement
aussi : distance) dans le cadre de l'étude de l'analyse vectoriel (voir le chapitre qui y est
consacré)..
261/2001
Sciences.ch 14/03/2005
où sont des constantes et où tout point qui satisfait cette relation, qui est en l'occurrence
l'équation d'une droite, se trouve sur la médiatrice.
avec est l'équation analytique d'un droite de pente et d'ordonnée à l'origine (quand
)
Si :
Bien évidemment, dans le cas d'une fonction trivalente (tri-dimensionnelle), le principe reste
le même à la différence que le nombre de quadrants double. Par exemple (c'est toujours joli à
regarder...) :
262/2001
Sciences.ch 14/03/2005
Cette méthode de représentation et d'analyse d'une fonction était longue à mettre en place
mais avec l'aide des ordinateurs ce problème est en ce 21ème siècle assez bien résolu.
Cependant, bien que cette méthode permette visuellement et rapidement de déduire certaines
propriétés de la fonction (et outre le fait qu'elle donne parfois de jolies figures) à pour
désavantage d'être limité a 1, 2 ou 3 dimensions à cause de nos propres limites humaines de
perception (quoique...).
P1. Le graphique est dit "symétrique par rapport à l'axe des ordonnées" si le changement de
en ne modifie pas l'équation tel que :
P2. Le graphique est dit "symétrique par rapport à l'axe des abscisses" si le changement de
en ne modifie pas l'équation tel que :
263/2001
Sciences.ch 14/03/2005
P3. Le graphique est dit "symétrique par rapport à l'origine" si le changement simultané de
en et de en ne modifie pas l'équation tel que :
P4. Soit une fonction , si nous ajoutons une constante à cette fonction tel que
nous écrivions :
Alors le graphique de est déplacé ou "translaté" verticalement vers le haut d'une distance
tel que :
264/2001
Sciences.ch 14/03/2005
Remarque : tranlater, étirer, comprimer un graphique ou lui faire subit une symétrie c'est le
transformer. Le graphique résultant de ces transformations est appelé le "transformé" du
graphique de départ.
REPRÉSENTATION ANALYTIQUE
Le mode de représentation analytique est de loin le plus utilisé et consiste à représenter toute
fonction en une "expression analytique" qui est la notation mathématique symbolique et
abstraite de l'ensemble des opérations mathématiques connues que l'on doit appliquer dans un
certain ordre à des nombres et des lettres exprimant des grandeurs constantes ou variables que
nous cherchons à analyser.
Remarquons que par ensemble des opérations mathématiques connues, nous envisageons non
seulement les opérations mathématiques vues dans la section arithmétique (addition,
soustraction, extraction de la racine, etc.) mais également toutes les opération qui seront
définies au fur et à mesure dans le présent site internet.
, ,
Remarque : lorsque nous avons déterminer l'équation de la médiatrice, nous avons obtenu une
expression analytique de la droite visuelle qui l'a caractérise sous la forme d'une fonction du
type :
qui rappelons-le, est donc l'équation d'une droite (ou plus simplement : une "équation
linéaire") sur un plan dont si deux points sont connus, la pente est donnée
par le rapport de l'accroissement vertical sur l'acroissement horizontal tel que :
265/2001
Sciences.ch 14/03/2005
Une application sympathique et triviale consiste à démontrer que deux droites non verticales
sont parallèles si et seulement si elles ont la même pente. Ainsi, soit deux droites données par
les équations :
Les droites se coupent en un point si et seulement si les valeurs de sont égales pour
un certain , c'est-à-dire :
Dans ces exemples les fonctions sont exprimées analytiquement par une seule formule (nous
appelons "formule" l'égalité entre deux expressions analytiques) qui définit dans un même
temps le "domaine naturel de définition" des fonctions.
Définition : le "domaine naturel de définition" d'une fonction donnée par une expression
analytique est l'ensemble des valeurs pour lesquelles l'expression du membre droit a une
valeur bien déterminée.
est définie pour toutes les valeurs de , excepté la valeur où nous avons une singularité
(division par zéro).
Remarque : il existe une infinité de fonction et nous ne pouvons toutes les exposer ici,
cependant nous en rencontrerons plus d'un milier sur l'ensemble du site et cela devrait
amplement suffire à se faire une idée de leur étude.
FONCTIONS
Définitions :
266/2001
Sciences.ch 14/03/2005
D1. Nous disons que est une fonction de et nous écrirons , etc., si à
chaque valeur de la variable appartenant à un certain domaine de définition (ensemble) ,
correspond une valeur de la variable dans un autre domaine de définition (ensemble) . Ce
que nous notons dans le cas d'une fonction univalente :
Remarque : comme nous l'avons vu lors de notre étude de la théorie des ensembles, une
application (ou fonction) peut-être injective, bijective ou surjective. Il convient donc que le
lecteur dont ces notions ne sont pas connues aille en priorité lire ces définitions.
D2. L'ensemble des valeurs pour lesquelles la valeur de la fonction est donnée par la
fonction est appelé "domaine d'existence" de la fonction (ou domaine de définition de la
fonction).
D3. La fonction est dite "croissante" si à une plus grande valeur de la variable
indépendante correspond une plus grande valeur de la fonction (de l'image). Nous définissons
de manière analogue mais inverse la fonction "décroissante". Une fonction "constante" est une
fonction pour laquelle à toute valeur de la variable indépendante correspond toujours une
même image constante.
D4. La fonction est dit "périodique" s'il existe un nombre constant tel que la
valeur de la fonction ne change pas quand nous ajoutons (ou l'on retranche) le nombre à la
variable indépendante tel que: . La plus petite constante satisfaisant à cette
condition est appelée "période" de la fonction. Elle est fréquemment notée en physique.
avec est d'un intéret particulier. Nous l'appellons un "quotient d'accroissement" (nous
reviendrons beaucoup plus en détail sur ce sujet lors de notre étude du calcul différentiel et
intégral).
D7. Nous utilisons certaines propriétés des fonctions pour faciliter leur représentation
graphique. En particulier, une fonction est dite "paire" si pour tout dans
son domaine de définition. Une fonction est dite "impaire" si pour tout dans
son domaine de définition.
267/2001
Sciences.ch 14/03/2005
Théorème : Toute fonction est la somme d'une fonction paire et d'une fonction
impaire .
Démonstration : Posons :
alors :
et en soustrayant :
Quotient
D9. Soit une fonction de et une fonction de la variable , alors dépend alors de
et nous avons ce que nous appelle une "fonction composée" et que nous notons:
ou
Pour la dernière notation, il faut lire " rond " et ne pas confondre le "rond" avec la
notation du produit scalaire que nous verrons en analyse vectorielle.
268/2001
Sciences.ch 14/03/2005
ILe domaine de définition de la fonction composée est soit identique au domaine tout entier
de définition de la fonction , soit à la partie de ce domaine dans laquelle les valeurs
de sont telles que les valeurs correspondantes appartiennent au domaine de définition
de cette fonction.
Le principe de fonction composée peut être appliquée non seulement une fois, mais un
nombre arbitraire de fois.
Si ne dépend pas d'une autre variable (ou qu'elle n'est pas elle même une fonction
composée), on dit alors que est une "fonction élémentaire".
Les principales fonctions élémentaires sont des fonctions dont l'expression analytique est l'une
des suivantes:
1. La "fonction puissance" :
2. La "fonction exponentielle" :
3. La "fonction logarithmique" :
où la base du logarithme est un nombre positif différent de l'unité (cette fonction sera
définie rigoureusement un peu plus loin)
...
Remarque : nous avons déjà défini rigoureusement ces fonctions dans le chapitre traitant de la
trigonométrie.
où sont des nombres constants appelés coefficients; est un entier positif que
269/2001
Sciences.ch 14/03/2005
nous appelons "degré du polynôme". Il est évident que cette fonction est définie pour toutes
les valeurs de , c'est-à-dire qu'elle est définie dans un intervalle infini.
7. Les "fonctions algébriques" sont définies par le fait que la fonction est le résultat
d'opérations d'addition, de soustraction, de multiplication, de division, de variables élevées à
une puissance rationnelle non entière.
Nous allons considérer maintenant des variables ordonnées d'un type spécial, que nous
définissons par la relation "la variable tend vers une limite". Dans la suite de ce cours, la
notion de limite d'une variable va jouer un rôle fondamental, étant intimement liée aux
notions de base de l'analyse mathématique, la dérivée, l'intégrale, etc.
Définition: Le nombre est appelé la "limite" de la grandeur variable , si, pour tout nombre
arbitrairement petit , nous pouvons indiquer une valeur de la variable telle que toutes
les valeurs conséquentes de la variable vérifient l'inégalité :
Si le nombre est la limite de la variable , nous disons que " tend vers la limite ".
Le nombre constant est la limite de la variable , si pour tout voisinage donné, aussi petit
qu'il soit, de centre et de rayon , nous pouvons trouver un valeur telle que tous les
points correspondant aux valeurs suivantes de la variable appartiennent à ce voisinage
(notions que nous avons défini précédemment). Géométriquement nous représentons cela
ainsi:
Remarque: Il est trivial que la limite d'une grandeur constante est égale à cette constante,
puisque l'inégalité est toujours satisfaite pour arbitraire.
Il découle également de la définition de la limite qu'une grandeur variable ne peut pas avoir
n'importe comment deux limites. En effet, si et avec , doit
satisfaire simultanément aux deux inégalités suivantes :
270/2001
Sciences.ch 14/03/2005
et
pour arbitrairement choisi. Mais si nous faisons une représentation géométrique identique à
la précédente, nous voyons assez aisément que cela est impossible si :
Il ne faut également pas s'imaginer que chaque variable doit nécessairement avoir une limite.
Définition: La variable tend vers l'infini, si pour chaque nombre positif donné nous
indiquons une valeur de à partir de laquelle toutes les valeurs conséquentes (suivantes) de
la variable vérifient l'inégalité .
Nous pouvons vérifier ce genre de cas dans les suites arithmétiques, géométriques, ou
harmoniques où chaque terme de la progression est une valeur que prend la variable .
Si est la limite de la fonction quand , nous écrivons alors sur ce site en tout les
cas:
Pour définir le côté depuis lequel nous venons en appliquant la limite, nous utilisons une
271/2001
Sciences.ch 14/03/2005
notation particulière (rappelons que cela permet de connaître de quel côté de la route vient
notre bus).
Ainsi, si tend vers la limite quand tend vers un nombre en ne prenant que des
valeurs plus petites que , nous écrirons alors:
Exemple:
Il faut démontrer que, quel que soit , l'inégalité sera satisfaite dès que ,
Nous admettons que l'exemple et la méthode sont discutables mais nous verrons plus tard les
outils mathématiques adéquats pour arriver rigoureusement, sans magouilles et hypothèses de
départ, au résultat obtenu précédemment.
" tend vers quand " et " tend vers quand "
272/2001
Sciences.ch 14/03/2005
et
Nous avons étudié le cas où la fonction tend vers une certaine limite quand ou
. Considérons maintenant le cas où la fonction tend vers l'infini quand la
variable varie d'une certaine manière.
Si tend vers l'infini quand , en ne prenant que des valeur positives ou que des
valeurs négatives, on écrit respectivement :
et
, , ,
Il peut arriver que la fonction ne tende ni vers une limite finie, ni vers l'infini quand
(par exemple ), la fonction est alors dite "bornée".
Remarques :
R1. Lorsque la limite d'une fonction tends vers une constante quand , alors
273/2001
Sciences.ch 14/03/2005
la représentation graphique de cette fonction nous amène à dessiner une droite horizontale que
nous appelons "asymptote horizontale" et dont l'équation est :
R3. Lorsque la limite d'une fonction est égale à une valeur ni infinie, ni finie (asymptote
ni horizontale, ni verticale) quand , alors la représentation graphique de cette
fonction nous amène à dessiner une autre asymptote donnée par l'équation d'une droite que
nous appelons "asymptote oblique" et dont l'équation est du type :
Nous n'avons pas étudier ce gendre d'asymptotes pour l'instant car elles nécessitent si nous
désirons nous passer d'une représentationg graphique du calcul différentiel que nous verrons
au chapitre suivante.
LOGARITHMES
Nous avons longuement hésité à mettre la définition des logarithmes dans le chapitre traitant
du calcul algébrique. Après un moment de réflexion, nous avons décidé qu'il valait mieux la
mettre ici car pour bien la comprendre, il faut avoir connaissance des concepts de limite,
domaine de définition et fonction exponentille. Nous espérons que notre choix vous
conviendra au mieux.
Nous savons que pour une telle fonction, que si , alors est croissante et positive
dans , et si , alors est décroissante et positive dans .
Remarques :
R1. si , lorsque décroit par valeurs négatives, le graphique de tend vers l'axe des
. Ainsi, l'axe des tend est une asymptote horizontale. Lorsque croît par valeurs positives,
le graphique montre rapidement. Ce type de variation est caractéristique de la "loi de
croissance exponentielle" et est quelque fois appelée "fonction de croissance". Si
, lorsque croît, le graphique tend asymptotiquement vers l'axe des . Ce type de
274/2001
Sciences.ch 14/03/2005
Puisque la fonction exponentielle est bijective alors il existe une fonction réciproque
et appelée "fonction logarithme" de base notée :
Et donc :
si et seulement si
Propriétés Jusitification
Remarques :
R1. le mot "logarithme" signifie "nombre du logos", "logos" signifiant "raison" ou "rapport".
R2. les fonctions logarithme et exponentielle sont définies par leur base (le nombre ).
Lorsqu'on utilise un base de puissance de 10 (10, 100, 1000,…) on parle alors de "système
vulgaire" car ils ont pour logarithme des nombres entiers successifs.
Il existe deux types de logarithmes que l'on retrouve presque exclusivement en mathématiques
et physique le logarithme en base dix et le logarithme en base (ce dernier est fréquemment
appelé "logarithme naturel" ou plus exactement pour des raisons historiques justifiées
"logarithme népérien"). Historiquement, c'est à John Napier (1550-1617) dont le nom latinisé
est "Neper" que l'on doit l'étude des logarithmes et le nom aux "logarithmes néperien".
En base 10:
abusivement noté .
275/2001
Sciences.ch 14/03/2005
base (eulérienne) :
Pour la fonction logarithmique en base eulérienne (ou dite également "base nepérienne") il
faut pour calculer se poser aussi la question suivante : à quelle puissance
devons nous élever le nombre pour obtenir ?
Mais quel est donc ce nombre "eulérien" ? Pourquoi le retrouve-t-on si souvent en physique et
en mathématiques? D'abord déterminons l'origine de sa valeur :
avec et quand .
L'intérêt que nous avons à poser le problème ainsi c'est que s'il nous faisons tendre la
fonction écrite précédemment tend vers et cette fonction a pour propriété particulière de
pouvoir se calculer plus ou moins facilement pour des raisons historiques à l'aide du binôme
de Newton.
276/2001
Sciences.ch 14/03/2005
Nous voyons de cette dernière égalité que la fonction est croissante quand croît.
En effet, quand nous passons de la valeur à la valeur chaque terme de cette somme
augmente:
, etc.
D'autre part:
277/2001
Sciences.ch 14/03/2005
Le nombre et la fonction qui permet de le déterminer sont très utiles. Nous les retrouvons
dans tous les domaines de la mathémtique et de la physique.
Les logarithmes ont plusieurs propriétés. Les voici (nous nous référons à une base
donnée):
278/2001
Sciences.ch 14/03/2005
La seconde relation:
Nous avons d'abord les équations équivalentes (de la première relation ci-dessus):
et
Si le lecteur n'a pas encore parcouru le chapitre de calcul vectoriel et la partie y traitant du
produit scalaire vectoriel, nous ne serions que trop recommander sa lecteur sans quoi la
lecture de ce qui va suivre risque d'être un peu incompréhensible.
279/2001
Sciences.ch 14/03/2005
Une famille de polynômes orthogonale est une famille comme nous pouvons en faire
l'analogie avec le produit scalaire vu en calcul vectoriel, une famille de
polynômes tels que :
si
Nous rappelons qu'une famille orthogonale est libre (voir chapitre de calcul vectoriel).
et
Démonstration : Montrons par récurrence sur que est une famille orthogonale
qui engendre le même espace que . L'assertion est vérifiée pour .
Supposons l'assertion vérifiée pour , pour nous avons :
280/2001
Sciences.ch 14/03/2005
TOPOLOGIE
La topologie (du grec : discours du lieu) est un domaine extrêment vaste des mathématiques
dont il est difficile de définir avec exactitude l'objet dont elle fait l'étude. Ce que nous
pouvons dire dans un premier temps, c'est que la topologie est très intimement liée à la théorie
des ensembles, à l'analyse fonctionnelle, aux suites et séries, au calcul intégral et différentiel,
au calcul vectoriel, à la géométrie et encore beaucoup d'autres domaines.
L'origine de la topologie semble provenir des problèmes qu'ont posé les progrès de l'analyse
fonctionnelle dans l'étude des fonctions continues, de leur dérivabilité, de leurs limites en un
point (fini ou non), de l'existence d'extremums, etc... dans des espaces de dimensions
supérieures (au fait, implicitement la topologie à pour objectif de créer des outils qui
permettent facilement d'étudier les propriétés des fonctions dans toutes les dimensions). Tout
ces concepts, demandaient pour le mathématicien une définition rigoureuse de l'idée intuitive
de proximité, tout particulièrement lors d'opérations sur ces fonctions. Mais la continuité n'est
pas un concept exclusif de l'analyse fonctionnelle, elle se retrouve en géométrie dans ses
transformations, voire ses déformations - les figures pouvant être considérées comme des
ensembles ouverts ou fermés de points.
Voici cependant un essai de définition de la topologie que nous pourrons toujours compléter :
Remarques :
R1. Nous pensons que la topologie devrait être introduite dans le cursus scolaire dès le
moment où l'étudiant a de solides connaissances en théorie des ensembles, calcul vectoriel,
algèbre linéaire, calcul tensoriel et géométrie différentielle. Ce n'est effectivement qu'à ce
moment que le niveau de l'étudiant permet à celui-ci de comprendre toute la subtilité, l'utilité
et les répercussions majeures des développements et définitions qui vont suivre.
R3. Souvent les personnes qui commencent à étudier la topologie sont frappées par le fait qu'il
y ait autant de définitions dans un seul domaine (ce qui gâche, il est vrai, un peu la beauté
mathématique de la topologie). Ils prennent alors pleinement conscience de la citation
d'Erdös : "les mathématiciens sont des gens qui font des définitions avec du café...".
R4. Certains concepts définis ici deviendront aussi plus clair dès le moment où le lecteur aura
étudié le chapitre de théorie de la mesure (...)
ESPACE TOPOLOGIQUE
281/2001
Sciences.ch 14/03/2005
Soit un ensemble non vide . Une "topologie" sur est une famille de sous-ensembles
ouverts (nous définirons cela un peu plus loin) de telle que les axiomes (triviaux) suivants
soient vérifiés :
A1. et
A2. implique
A3. implique
Définition : étant donné une telle famille , nous appelons , ou plus précisément le couple
un "espace topologique".
Remarques
R1. Un exemple bien connu d'espace topologique est muni de ses intervalles ouverts, c'est-
à-dire les intervalles .
R2. Nous verrons une application très concrètre des espaces de Hausdorff lors de notre études
des fractales en informatique théorique.
Définition : si nous notons un espace topologique, désignant les ouverts (voir plus
loin la définition d'un "ouvert") de , une "base", au sens topologique, de est une
partie de telle que tout ouvert soit réunion d'ouverts de (c'est la même idée que les
espace vectoriels au fait mais appliqué à des ensembles... rien de bien méchant).
A1. (positivité)
A2. (séparation)
282/2001
Sciences.ch 14/03/2005
A5. (symétrie)
Remarques :
R1. Certains lecteurs verront de suite que certaines de ces propriétés ont déjà été vues et
démontrées dans d'autres chapitre de site lors de l'étude des distance entre poins fonctionnels
et lors de l'étude des normes (inégalité triangulaire démontrée dans le chapitre de calcul
vectoriel - la symétrie, la nullité, la positivité, la séparation et la symétrie dans le chapitre
d'analyse fonctionelle).
R2. Un espace métrique sera en général noté ou bien encore . Nous pouvons
également le noter simplement si la distance ne peut être confondue.
La "fonction distance" de est donc notée habituellement dans le plus général qui
soit en mathématique :
Remarques :
R1. Si nous n'imposons pas l'axiome A2, nous disons que est une "semi-distance" sur .
R2. Si nous autorisons une semi-distance à prendre la valeur , nous préférons dire que
est un "écart"
E1. Si nous prenons pour le plan, ou bien l'espace à trois dimensions de la géométrie
euclidienne et une unité de longueur, la "distance" au sens usuel du terme est bien une
distance au sens des 5 axiomes précédemment cités. Dans ces espaces, les trois points
satisfont comme nous l'avons démontré en calcul vectoriel et comme il l'est
intuitivement que :
avec les autres inégalités obtenues par permutation circulaire de . Ces inégalités sont
bien connues par exemple entre les longueurs des côtés d'un triangle.
283/2001
Sciences.ch 14/03/2005
dans
La distance est donnée nous le savons par (nous avons déjà démontré cela en analyse
fonctionnelle et calcul vectoriel) :
qui satisfait aux 5 axiomes de la distance. Nous pouvons prendre (c'est une propriété
intéressante pour la culture générale), que toute relation de la forme :
est aussi une distance dans (sans démonstration). Les mathématiciens font encore plus
fort en généralisant encore plus (la démonstration à peu d'intérêt pour l'instant) cette dernière
relation (en prenant en compte la définition même de la distance) sous la forme :
Au même titre pour l'inégalité triangulaire, donnée alors par (voir chapitre de calcul
vectoriel) :
284/2001
Sciences.ch 14/03/2005
si et si
Il est très facile de vérifier que cette distance vérifie les 5 axiomes et qu'elle est de plus ultra-
métrique. Cette distance est appelée "distance discrète" et le lecteur remarquera que nous
avons par analogie opté pour cette distance le symbole de la fonction Dirac (ce n'est pas
innocent !!) plutôt que la traditionnel .
DISTANCES ÉQUIVALENTES
soit avec :
L'intérêt de cette définition est le suivant : si nous avons convergence pour l'une des
métriques, alors nous aurons la convergence pour l'autre aussi. Plus clairement :
in extenso .
FONCTIONS LIPSCHITZIENNES
285/2001
Sciences.ch 14/03/2005
propriétés supplémentaires aux fonctions telles que nous les avions énoncées dans la théorie
des ensemble :
P2. Nous disons que deux espaces métriques sont "isométriques" s'il existe une isométrie
surjective de l'un sur l'autre
P3. est dite "lipchitzienne" de constante (ou : "de rapport") s'il existe tel
que :
Si , nous disons que est "contractante" (ou : est une "contraction"), et si , nous
disons que est strictement contractante.
P4. Toute fonction lipchitzienne est uniformément continue (voir plus loin voir plus loin le
concept "d'uniforme continue") si elle vérifie :
avec et (la réciproque n'est pas vraie : toute fonction uniformément continue
n'est pas nécessairement continue).
Remarques :
286/2001
Sciences.ch 14/03/2005
ouvert de
Cette définition peut sembler complexe mais en fait, sa signification concrète est plus simple
qu’il n’y paraît. En fait, selon cette définition, un ensemble ouvert dans un espace topologique
n’est rien d’autre qu’un ensemble de points contiguës et sans bords.
Définitions :
D2. Un "voisinage" d'un point de est une partie de contenant un ouvert contenant ce
point.
La définition d’un ensemble ouvert peut être simplifiée en introduisant une notion
supplémentaire, celle de "boule ouverte" :
BOULES
Soit un élément de .
Définition: une "boule ouverte de centre et de rayon " (ou : "boule métrique de
rayon centrée en ") est le sous-ensemble de tous les points de dont la distance à est
inférieure à , ce que nous écrivons :
Un ensemble ouvert peut également être défini comme un ensemble pour lequel il est possible
de définir une boule ouverte en chaque point.
Remarques :
R2. Les ouverts ainsi définis, forment ce que nous appelons une "topologie induite" par la
distance ou aussi "topologie métrique".
Définition : une "boule fermée" est similaire à une boule ouverte mais diffère dans le sens que
nous y incluons les éléments situés à la distance du centre :
287/2001
Sciences.ch 14/03/2005
Remarque : puisque par définition, , les boules ouvertes et fermées ne sont pas vides car
elle contiennet au moins leur centre. Par contre, une sphère peut être vide.
Voyons un exemple intéressant de tout cela : avec nous avons vu dans les exemples
précédents que nous pouvions définir différentes distances. Pour les distinguer, nous les
notons :
Alors, dans les boules fermées de centre et de rayon unité équivalentes aux trois
formuations précédentes, ont la forme suivante (rappel : dans cet exemple) :
PARTIES
Maintenant que nous avons défini les concepts de boules, nous pouvons enfin définir
rigoureusement les concepts d'intervalles ouverts et fermées (qui dans un espace à plus d'une
dimension sont nommées "parties") dont nous avons fait si souvent usage en analyse
fonctionnelle et calcul intégral et différentiel.
Définition : Soit un espace métrique. Nous disons qu'une partie de est "bornée"
s'il existe une boule fermée telle que :
Compte tenu de la remarque précédente sur les inclusions des boules, il est claire que nous
pouvons remplacer l'adjectif "fermée" par "ouverte". De plus l'inégalité triangulaire entraîne
288/2001
Sciences.ch 14/03/2005
Définitions :
D2. Soit un espace métrique, et soit une partie non vide de . Pour tout nous
notons et nous appelons "distance de à ", le nombre réel positif non nul :
Remarque : il convient peut être de rappeler que cette distance satisfait également les 5
axiomes des distances.
D3. Soit un espace métrique, et soit une partie de . Nous appelons "adhérence" de
et notons le sous-ensemble de défini par :
Remarques :
R2. Nous disons qu'une partie de est "fermée" si elle est égale à son adhérence
R3. Nous disons qu'une partie de est "ouverte" si son complémentaire par rapport à :
est fermé.
289/2001
Sciences.ch 14/03/2005
est ouverte
Propriétés :
BOULES GÉNÉRALISÉES
La notion de distance d'un point à un ensemble permet d'étendre les notions de boule et de
sphère.
Définitions :
D1. Soit , une espace métrique et soient deux parties non vides de . Nous
notons et appelons "gap" (qui signifie "écartement" ou "espacement" en français) de
à , le nombre réel supérieur ou égal à zéro :
290/2001
Sciences.ch 14/03/2005
DIAMÈTRE
Définition : Soit un espace métrique et soit une partie non vide de . Nous notons
et nous appelons "diamètre" de , le nombre réel positif non nul :
Tout partie non vide d'un espace métrique vérifiant sera dite "bornée".
Si l'espace métrique tout entier est borné, nous disons que "la distance est bornée".
Par exemple, la distance discrète est bornée, la distance usuelle sur ne l'est pas.
Propriétés :
P1. (triviale) ou
P2. (triviale)
291/2001
Sciences.ch 14/03/2005
finies.
VARIÉTÉS
Nous introduisons maintenant les "variétés". Ce sont des espaces topologiques qui sont
"localement comme " (notre espace par exemple..).
Définitions :
D1. Une "variété topologique de dimension " est un espace de Hausdorff tel que pour
tout il existe un voisinage ouvert avec , un voisinage ouvert et
un homéomorphisme :
D2. Un "homéomorphisme" entre deux espaces est une bijection continue dont l'inverse est
également continu.
D3. Les couples sont appelés des "cartes", étant le "domaine de la carte" et
"l'application de coordonnées". Au lieu de "carte nous disons parfois aussi "système de
coordonnées"
D4. Soit une variété topologique de dimension . Une famille de cartes de est
appelée un "atlas" si pour tout , il existe une carte telle que .
Remarque : notons que si sont deux cartes de telles que (ne vérifiant pas
l'axiome de Hausdorff) , alors l'application de changement de cartes :
292/2001
Sciences.ch 14/03/2005
est un homéomorphisme.
Définitions :
VARIETES DIFFERENTIABLES
Définitions :
P2.
Un atlas de est différentiable si toutes les cartes de sont compatibles entre elles.
D2. Une "variété différentiable" est un couple où est une variété topologique et
un atlas différentiable de .
Remarque : étant donné un atlas différentiable, il est parfois nécessaire de le compléter : nous
disons qu'une carte de est compatible avec un atlas différentiable si elle est compatible
avec chaque carte de . Un atlas de est "maximal" si toute carte compatible avec
appartient déjà à . Un atlas maximal est appelé une "structure différentiable".
293/2001
Sciences.ch 14/03/2005
THÉORIE DE LA MESURE
ESPACES MESURABLES
Définitions :
D1. Soit un ensemble. Une "tribu" ou " "sur est une famille de parties de
vérifiant les axiomes :
A3. Pour toute suite d'éléments de nous avons (nous disons alors que
est "stable" par union dénombrable).
Remarques :
R1. Nous écrivons car nous ne considérons non plus comme un sous-ensemble de
mais comme un élément de !
D2. Le couple est appelé "espace mesurable" et nous disons que les éléments de
sont des "ensembles mesurables". Si dans la troisième condition nous imposons seulement
que soit stable par union finie nous imposons la notion plus générale "d'algèbre". Ainsi,
une tribu est nécesssairement contenu dans une algèbre (mais le contraire n'est pas vrai car
justement l'axiome est plus fort).
294/2001
Sciences.ch 14/03/2005
Exemples :
Il n'y a pas d'autres tribus pour l'ensemble donné que ces deux (la grossière, et la
maximale), car il ne faut pas oublier que l'union de chacun des éléments de la tribu doit aussi
être dans la tribu (A3), ainsi que le complémentaire d'un élément (A2).
Remarque : est aussi stable par intersections dénombrables. En effet si est une suite
d'éléments de nous avons (trivial en prenant comme référence l'exemple E1) :
et
ce qui amène à ce qu'une tribu est stable par unions et par intersections finies. En particulier,
si alors , car (rappel) :
Remarque : si une famille de tribus sur (comme l'exemple E1). Alors est une
tribu (la vérification des trois axiomes est immédiate)
la tribu engendrée par . est la plus petite tribu contenant (et par extension la plus
petit tribu de ).
Voici deux exemples qui permettent de vérifier si ce qui précède à été compris et qui
295/2001
Sciences.ch 14/03/2005
Nous trouvons donc bien dans l'ensemble vide obligatoire ainsi que
(selon l'axiome A1) ainsi que lui-même (par définition de ) et les
complémentaires de (selon l'axiome A2) ainsi que les unions
(selon l'axiome A3).
La notion de "Borélien" est surtout intéressante car elle est nécessaire à la définition de la
"tribu de Lebesgue" et par suite à "la mesure de Lebesgue" qui nous aménera à définir
"l'intégrale de Lebesgue".
Remarques :
R1. La tribu étant stable par passage au complémentaire, elle contient aussi tous les
fermés.
R2. Si est un espace topologique à base dénombrable, est engendrée par les ouverts
de la base.
Exemple (important) : Si désigne l'espace des réels muni de la topologie euclidienne (voir
chapitre de topologie), la famille des intervalles ouverts à extrémités rationnelles est une base
dénombrable (étant donné les extremités) de et donc engendre . Même remarque pour
, , avec comme base dénombrable la famille des pavés ouverts à extrémités
rationnelles (c'est la famille des ensembles du type ).
; ; ;
Démonstration :
296/2001
Sciences.ch 14/03/2005
De plus :
ce qui entraîne au même titre (que ) que . Les autres cas se traitent de
manière analogue.
1.
2. Soit et donc
Exemple : soit alors (un tribu parmi d'autres - ne pas oublier la stabilité par
union !) :
Dès lors :
297/2001
Sciences.ch 14/03/2005
Et vérifions :
Un corollaire trivial de cette égalité est que si nous considérons un espace topologique et
muni de la topologie induite. Alors:
Rappel (voir le chapitre de théorie des ensembles) : Soit un ensemble. Pour tout
nous définissons la différence symétrique entre et par :
P1. Une algèbre est stable par différence symétrique ( nous avons )
P2.
P3.
P3.
298/2001
Sciences.ch 14/03/2005
Si est une algèbre sur , alors est un anneau de Boole (ou algèbre de Boole mais
attention avec le terme "algèbre" qui peut prêter à confusion avec la théorie des ensembles)
avec et comme élément neutre "additif" ( ) respectivement "multiplicatif" ( ).
Rappels : voir le chapitre de théorie des ensembles et le chapitr d'algèbre de Boole (section
analyse numérqiue)
Nous vérifions que vérifie que est bien neutre par rapport la différence symétrique (la
démonstration que est neutre par rapport à l'inclusion est évidente). Il est trivial que :
et que
est donc bien un groupe abélien par rapport à la loi (différence symétrique).
Définition : Soit un ensemble. Une "classe monotone" sur est une famille de parties
de vérifiant :
A1.
A2. et
A3. Si est une suite croissante (attention au terme "croissant") d'éléments de alors
Remarques :
299/2001
Sciences.ch 14/03/2005
R2. Les deux premiers points impliquent que est stable par passage au complémentaire.
R3. L'axiome (2) et (3) (plus le (1)) amène que la classe monotone est stable par intersection
décroissante. Une manière de vérifier c'est de prendre le complémentaire de chaque élément
de la suite croissante pour tomber sur la suite décroissante et inversement.
R4. L'axiome 3 des classes monotones étant un peu plus restrictif (plus "fort") que l'axiome 3
des tribus (puisque nous y imposons une suite croissante). Cela implique que toute tribu est
une classe monotone (tout union dénombrable de la tribu étant dans la tribu ce qui est une
condition plus forte que la suite croissante) !
De la même manière que pour les tribus, si nous considérons une famille de classes
monotones sur . Alors est une classe monotone (la démonstration se vérifie
immédiament par les trois axiomes précédemment cités).
Exemple : Si est un ensemble, est une classe monotone sur . Plus généralement,
une tribu est une classe monotone.
la classe monotone engendrée par . est la plus petite classe monotone contenant (et
satisfaisant bien évidemment aux axiomes).
Le théorème (de la classe monotone) s'énonce ainsi : soit un ensemble. Si est une
famille de parties de que nous imposons stable par intersections finies alors
(nous devons donc prouver que la tribu minimale de est égale à la classe monotone
minimale de ). Si nous imposons pas que soit pas stable par intersections finies nous
aurions pas nécessairement l'égalité.
Démonstration : comme déjà dit (c'est quasiment trivial). Nous allons montrer
dans un premier temps que est donc aussi une tribu sur . Pour ceci il suffit de
montrer que est (aussi) stable par union dénombrable (et non nécessairement par une
suite croissante d'éléments!).
300/2001
Sciences.ch 14/03/2005
Par les définitions précédentes mais étant (imposé) stable par intersections
finies entraîne et donc (c'est le même raisonnement que pour les tribus) :
(1)
et donc (ce qui appuie que les autre éléments satisfont la relation précédente) :
Ainsi est bien une classe monotone et par (1), nous avons donc :
Cette dernière égalité implique . Comme pour , nous montrons montrons que
est une classe monotone et donc , ce qui veut dire par extension que
est est donc stable par intersections finies.
étant stable par passage au complémentaire ceci entraîne que est nous venons
de montrer qu'ell est plus stable par unions finies (alors que nous voulons démontrer que c'est
stable par union dénombrable).
301/2001
Sciences.ch 14/03/2005
mais
Donc :
Ainsi est stable par union dénombrable et enfin est une tribu. Or comme
cela nous amène donc à .
302/2001
Sciences.ch 14/03/2005
Le calcul différentiel est un des domaines les plus passionnants et vastes de la mathématique,
et il existe une littérature considérable (colossale) sur le sujet. Les résultats retrouvent des
implications dans absolument tous les domaines de la physique, de l'informatique, de
l'électronique, de la chimie, biologie et de la mathématique elle-même.
Les mathématiciens ont rédigé une telle quantité de théorèmes sur le sujet que la validation de
certains est délicate car certains à eux-seuls nécessiteraient la vie d'un homme pour être
parcourus (c'est un problème que la communauté des mathématiciens reconnait) et vérifiés (ce
qui fait que personne ne les vérifie...).
Ce constat fait, nous avons choisi de ne présenter ici que les points absolument nécessaires à
la compréhensions des outils fondamentaux du physicien et du mathématicien (niveau licence
à peu près). Les puristes nous excuseront donc pour l'instant de ne pas présenter certains
théorèmes qui peuvent leur sembler indispensables mais que nous rédigerons une fois le
temps venu...
Nous allons principalement étudier dans ce qui va suivre ce que les mathématiciens aiment
bien préciser (et ils ont raison) : les cas généraux des fonctions réelles à une variable réelle.
Les fonctions plus complexes (à plusieurs variables réelles ou complexes, continues ou
discrètes) viendront une fois cette partie terminée.
Remarque : Nous ne nous atterderons pas à démontrer les dérivées et primitives de toutes les
fonctions car comme il y a une infinité de fonctions possibles, il y a également une infinité de
dérivées et de primitives. C'est le rôle des professeurs dans les instituts scolaires d'entraîner
les élèves à appliquer et à comprendre le raisonnement de dérivation et d'intégration par des
applications sur des fonctions connues (l'internet ne remplacera très probablement jamais
l'école à ce niveau).
CALCUL DIFFÉRENTIEL
Soit une fonction réelle à une variable réelle (nous nous limitons à ce cas de figure pour
l'instant et étudierons les dérivées partielles dans des espaces à un nombre de dimensions
quelconques plus loin) continue au moins dans un intervalle où se situe .
Définitions :
D1. Nous appelons "pente moyenne" le rapport de la projection orthogonale de deux points
de la fonction non nécessairement continue sur l'axe des abscisses et des
ordonnées tel que :
Remarque : signifiant "un delta" exprime le fait que nous sous-entendons une différence
d'une même quantité.
D2. Nous appelons "nombre dérivé en " ou "pente instantanée" ou encore "dérivée
303/2001
Sciences.ch 14/03/2005
première", la limite quand tend vers 0 (si elle existe) du rapport de la projection
orthogonale de deux points infiniment proches de la fonction continue (dans
le sens qu'elle ne contient pas de "trous") sur l'axe des abscisses et des ordonnées tel que :
Une interprétation graphique donne que est le coefficient directeur (autrement dit la
"pente instantanée") de la tangente au point d'abscisse .
Remarque : signifiant "un différentiel" exprime le fait que nous sous-entendons une
différence infiniment petite d'une même quantité.
D3. Soit une fonction définie sur une intervalle et dérivable en tout point de , la
fonction qui à tout réel de associe le nombre est appelée "fonction dérivée de
sur " et est notée .
Remarque : au niveau des notations les physiciens adoptent suivant leur humeur différentes
notations possibles pour les dérivées. Ainsi, considérons la fonction réelle à une variable
, vous trouverez dans la littérature ainsi que dans le présent site les notations suivantes
pour la "dérivée première" :
DIFFÉRENTIELLES
Nous avons indiqué précédemment ce qu'était un "différentiel ". Mais il existe au fait
plusieurs types de sortes de différentielles d'une fonction (remarquez que nous distinguons le
genre masculin et féminin du terme) :
1. Les différentiels
Rappelons que nous appelons "différentiel " d'une fonction à une variable la relation
donnée par (voir texte précédent) :
304/2001
Sciences.ch 14/03/2005
Cependant, pour exprimer l'effet d'un changement de toutes les variables d'une fonction de
plusieurs variables, nous devons utiliser un autre type de différentiel que nous appelons la
"différentielle totale" (dérivée en deux sous-familles : différentielle totale exacte et
différentielle totale inexacte).
ou encore:
et
et de même :
305/2001
Sciences.ch 14/03/2005
et
Remarque . de la même manière, pour une fonction de plus de deux variables, par exemple
, la différentielle totale est:
Il existe cependant également des différentielles totales exactes, qu'aucune fonction ne vérifie.
Dans ce cas, nous parlons de "différentielle totale inexacte" et pour déterminer si une
différentielle totale est exacte ou inexacte, nous utilisons les propriétés des dérivées
partielles.
et
306/2001
Sciences.ch 14/03/2005
et
Avant de continuer, nous avons besoin d'un résultat donné par le "théorème de Schwarz".
Démonstration :
sont continues alors (il faut vraiment vraiment vérifier que ce soit le cas) :
pour tout .
Posons :
On avons alors :
307/2001
Sciences.ch 14/03/2005
en appliquant à nouveau le théorème des accroissements finis aux deux membres entre
parenthèses nous trouvons :
Par récurrence sur le nombre de variables nous pouvons démontrer le cas général (c'est long
mais c'est possible, nous le ferons si besoin il y a).
Donc finalement pour en revenir à notre problème initial, nous avons donc :
C'est la condition que doit satisfaire une différentielle total pour être une différentielle totale
exacte et la condition qu'elle ne doit pas satisfaire pour être une différentielle totale inexacte.
Afin de ne pas confondre les deux types de différentielles, nous utilisons le symbole pour
représenter une différentielle totale inexacte et pour une différentielle totale exacte. La
distinction est extrêmement importante car seules les différentielles totale exactes ont une
intégrale qui ne dépend que des bornes d'intégration (puisque toutes les variables changent en
même temps) :
308/2001
Sciences.ch 14/03/2005
mais
Autrement dit, la variation d'une fonction dont la différentielle est totale exacte, ne dépend pas
du chemin suivi, mais uniquement des états initiaux et finaux. Nous appelons une telle
fonction qui satisfait à une différentielle totale exacte, une "fonction d'état", c'est-à-dire une
fonction dont la valeur ne dépend que de l'état présent et futur, et non de son histoire.
DÉRIVÉES USUELLES
Nous allons démontrer ici les dérivées les plus fréquentes (une petite trentaine) que nous
puissions rencontrer en physique théorique et mathématique ainsi que certaines de leurs
propriétés. La liste est pour l'instant non exhaustive mais les démonstrations étant
généralisées, elles peuvent s'appliquer à un grand nombre d'autres cas (que nous
appliquerons/rencontrerons tout au long de ce site).
1. Dérivée de :
Nous pouvons généraliser ce résultat pour tout entier naturel positif ou négatif et nous
allons voir que la fonction définie sur par est dérivable et que sa dérivée
est définie par .
309/2001
Sciences.ch 14/03/2005
Ainsi, nous avons (quelques exemples peuvent êtres utiles pour comprendre la portée de ce
résultat):
Nous voyons donc qu'en ayant déterminé la dérivée d'une fonction de la forme , nous
avons également déterminée toute fonction qui est mise cette forme tel que:
et
ne sont pas dérivables en puisque la fonction n'y est plus définie (division par zéro). De
plus, en ce qui concerne la fonction comportant la racine (puissance non entière), la dérivée
n'est pas définie dans .
Cependant, le résultat précédent donne un résultat intéressant pour les fonctions constantes
telle que:
Donc la dérivée de toute fonction constante est nulle (il est important de se souvenir de ce
résultat que nous étudierons les propriétés des intégrales) !!!
2. Dérivée de la fonction :
310/2001
Sciences.ch 14/03/2005
Soit donc un réel quelconque fixé, alors (attention! il est utile de connaître les relations
trigonométriques remarquables que nous démontrons dans le chapitre de trigonométrie dans la
section de géométrie):
Puisque:
3. Dérivée de la fonction :
Soit donc un réel quelconque fixé, alors (attention! il est utile de connaître les relations
trigonométriques remarquables que nous démontrons dans le chapitre de trigonométrie dans la
section de géométrie):
4. Dérivée de la fonction :
311/2001
Sciences.ch 14/03/2005
alors
Désignons la quantité par . Il est évident que quand tend vers zéro pour un
donné. Par conséquent :
Or, nous retrouvons ici une autre provenance historique de la constante d'Euler (voir le
chapitre d'analyse fonctionnelle) où :
Ainsi :
312/2001
Sciences.ch 14/03/2005
Soient et deux fonctions. La fonction somme est dérivable sur tout intervalle
où et sont dérivables, sa dérivée est la fonction s' somme des fonctions dérivées et
de et .
Ce résultat se généralise pour une somme d'un nombre quelconque fixé de fonctions.
Démonstration :
Soient et deux fonctions. La fonction produit est dérivable sur tout intervalle
où et sont dérivables, sa dérivée première est la fonction telle que .
Démonstration:
Nous rajoutons à cette dernière relation deux termes dont la somme est nulle tel que:
313/2001
Sciences.ch 14/03/2005
statistiques).
Démonstration :
La démonstration se fait par récurrence sur . C'est évidemment vérifié pour et pour
pour lequel nous reconnaissons ce que nous avions démontré plus haut :
.
Si la formule est vraie au rang et que les fonctions sont fois dérivables, nous voyons
que est dérivable et de dérivée :
Démonstration :
Soit un réel fixé et une fonction définie et dérivable en et une fonction définie et
dérivable en :
314/2001
Sciences.ch 14/03/2005
Conclusion: la dérivée d'une fonction composée est donnée par la dérivée de la fonction
multipliée par la "dérivée intérieure".
d'où:
315/2001
Sciences.ch 14/03/2005
La fonction est dérivable sur tout intervalle où les fonctions et sont dérivable et
où la fonction est non nulle et:
Démonstration :
316/2001
Sciences.ch 14/03/2005
ou encore :
ou encore :
Nous verrons lors de notre études des méthodes numérique (voir section d'informatique) que
le "nombre d'Euler" peut être calculé selon la série :
317/2001
Sciences.ch 14/03/2005
Ainsi l'exponentielle est sa propre dérivée. Ainsi, nous pouvons nous permettre d'étudier les
dérivées de quelques fonction trigonométriques hyperboliques (voir chapitre de
trigonométrie).
Rappel :
Donc trivialement :
Rappel :
Donc trivialement :
318/2001
Sciences.ch 14/03/2005
Ou encore :
Rappel :
et donc :
et donc :
Etant donné que ne prend que des valeurs positives, nous avons :
Donc finalement :
319/2001
Sciences.ch 14/03/2005
d'où :
Etant donné que ne prend que des valeurs positives nous avons alors :
Donc :
Avec :
320/2001
Sciences.ch 14/03/2005
CALCUL INTÉGRAL
Nous allons aborder ici les principes élémentaires et de base du calcul intégral. La suite (avec
plus de rigueur) viendra en fonction du temps qui est la disposition des responsables du site.
INTÉGRALE DÉFINIE
Une valeur approchée de l'aire sous une courbe peut être obtenue par un découpage en n
bandes rectangulaires verticales de même largeur. En particulier on peut réaliser un
encadrement de cette aire à l'aide d'une somme majorante et d'une somme minorante
pour un découpage donné.
Supposons que le nombre n de bandes tende vers l'infini. Comme les bandes sont de même
largeur, la largeur de chaque bande tend vers 0.
Si les sommes et ont toutes deux une limite lorsque, le nombre n de bandes, tend
vers l'infini, alors l'aire sous la courbe est comprise entre ces deux limites.
Nous avons :
Si ces deux limites sont égales, leur valeur est celle de l'aire sous la courbe.
Soit un intervalle , divisé en n parties égales, soit f une fonction continue sur l'intervalle
, soit , la somme algébrique minorante et soit , la somme algébrique majorante.
Nous appelons "intégrale définie" de f, depuis a jusqu'à b, notée :
321/2001
Sciences.ch 14/03/2005
Remarques :
R1. Pour calculer l'aire majorante et l'aire minorante, il n'est pas nécessaire que la largeur des
sous-intervalles du découpage soit la même partout.
R2. Si cette limite existe, alors nous disons que f est "intégrable" sur et l'intégrale
définie existe.
R4. Les nombres a et b sont appelés les "bornes d'intégration", a est la "borne inférieure", b
est la "borne supérieure".
R5. D'autres lettres que x peuvent être employées dans la notation de l'intégrale définie. Ainsi
R6. Comme nous le verrons plus loin, il est essentiel de ne pas confondre "intégrale définie"
et "intégrale indéfinie". Ainsi, une intégrale indéfinie, notée est une fonction, ou,
plus précisément, une famille de fonctions appelées aussi "primitives de f" (voir plus bas)
alors qu'une intégrale définie, notée est une constant (c'est-à-dire un nombre réel).
INTÉGRALE INDÉFINIE
Nous avons vu précédemment lors de notre études des dérivées, le problème suivant : étant
donnée une fonction , trouver sa dérivée, c'est-à-dire la fonction .
Définition : nous disons que la fonction est une "primitive" ou "intégrale indéfinie" de
la fonction sur le segment , si en tout point de ce segment nous avons l'égalité
.
Une autre manière de voire le concept d'intégrale indéfinie est de passer par le théorème
fondamental du calcul intégral (et différentiel) appelé aussi parfois "calcul fondamental de
l'analyse" s'énonce ainsi :
322/2001
Sciences.ch 14/03/2005
P1. Si A est la fonction définie par pour tout X dans , alors A est la
Démonstration :
Pour démontrer que A est une primitive de f , nous allons prouver que . Selon la
définition de la dérivée :
323/2001
Sciences.ch 14/03/2005
Comme h est positif, on peut diviser par sans changer le sens des inégalités :
Comme pour tout X, ceci nous montre que la dérivée de la fonction aire est
. Ainsi est une primitive de . Comme , est bien la primitive de f qui
s’annule en a.
pour .
Posons :
Il vient donc de ce que nous avons vu pendant notre étude des dérivées que .
324/2001
Sciences.ch 14/03/2005
si et seulement si .
Comme cette identité est valable pour tout de l'intervalle , elle est vraie en
particulier pour . D'où :
325/2001
Sciences.ch 14/03/2005
Remarque : le théorème fondamental qui montre le lien entre primitive et intégrale a conduit à
utiliser le même symbole pour écrire une primitive, qui est une fonction, et une intégrale,
qui elle, est un nombre.
Voici quelques propriétés triviales de l'intégration qu'il est bon de se rappeler (si cela ne vous
semble pas évident, contactez-nous et nous le détaillerons) :
P2. La différentielle d'une intégrale indéfinie est égale à l'expression sous le signe somme :
P3. L'intégrale indéfinie de la différentielle d'une certaine fonction est égale à la somme de
cette fonction et d'une constante arbitraire :
Démonstration :
Vérifions s'il en est de même avec le membre de droite (nous supposons connues les
propriétés des dérivées que nous avons démontrées au début de ce chapitre) :
P5. Nous pouvons sortir un facteur constant de sous le signe somme, c'est-à-dire :
Nous justifions cette égalité en dérivant les deux membres (et d'après les propriétés des
dérivées) :
326/2001
Sciences.ch 14/03/2005
P6. Nous pouvons sortire un facteur constant de l'argument de la fonction intégrée (plutôt
rarement utilisée) :
En effet, en dérivant les deux membres de l'égalité nous avons d'après les propriétés des
dérivées :
P7. L'intégration d'une fonction dont l'argument est sommé (ou soustrait) algébriquement est
la primitive de l'argument sommé (respectivement soustrait) :
A nouveau, nous ne donnons que la forme générale de la méthode. C'est le rôle des
professeurs dans les écoles d'entraîner les élèves à comprendre et maîtriser ce genre
techniques. De plus, les chapitres traitant des sciences exactes sur le site (physique,
informatique, astrophysique, chimie, …) regorgent d'exemples utilisant cette technique et
servent ainsi implicitement d'exercices de style.
bien que nous ne sachions pas calculer directement la primitive de cette fonction (en
327/2001
Sciences.ch 14/03/2005
tout cas nous imaginons être dans une telle situation) nous savons (d'une manière ou d'une
autre) qu'elle existe (nous ne traitons pas encore des intégrales impropres à ce niveau).
où est une fonction continue ainsi que sa dérivée, et admettant une fonction inverse.
Alors , démontrons que dans ce cas l'égalité :
est satisfaite.
Nous sous-entendons ici que la variable sera remplacée après intégration du membre droit
par son expression en fonction de . Pour justifier l'égalité en ce sens, il suffit de montrer que
les deux quantités considérées dont chacune n'est définie qu'à une constant arbitraire près ont
la même dérivée par rapport à . La dérivée du membre gauche est :
Nous dérivons le membre droit par rapport à en tenant compte que est une fonction de .
Nous savons que :
Les dérivées par rapport à des deux membres de l'égalité de départ sont donc égales
(c.q.f.d).
Bien évidemment, la fonction doit être choisie de manière à ce que nous sachions
calculer l'intégrale indéfinie figurant à droite de l'égalité.
JACOBIEN
Considérons un domaine du plan limité par une courbe . Supposons que les
coordonnées soient des fonctions des nouvelles variables (toujours dans le cadre
328/2001
Sciences.ch 14/03/2005
329/2001
Sciences.ch 14/03/2005
Tel que (c'est là qu'il faut faire le meilleur choix pour que l'expression final soit la plus simple
et la plus esthétique, nous procédons par essais successifs et faisons enfin le choix ci-
dessous) :
330/2001
Sciences.ch 14/03/2005
Par conséquent :
Avec :
qui est la "matrice jacobienne" (alors que son déterminant est appelé le "jacobien" (tout
331/2001
Sciences.ch 14/03/2005
qui n'est finalement qu'approximative étant donné que dans les calculs de l'aire nous avons
négligé les infiniment petits d'ordre supérieur. Toutefois, plus les dimensions des domaines
élémentaires et sont petites, et plus nous nous approchons de l'égalité. L'égalité ayant
finalement lieu quand nous passons à la limite (finalement en maths aussi on fait des
approximation… hein !), les surfaces des domaines élémentaires tendant vers zéro :
Appliquons maintenant l'égalité obtenue au calcul de l'intégral double (nous pouvons faire de
même avec la triple bien sûr). Nous pouvons donc finalement écrire (c'est la seule manière de
poser la chose qui a un sens) :
Telle est la relation de transformation des coordonnées dans une intégrale double. Elle permet
de ramener le calcul d'une intégrale double dans le domaine au domaine , ce qui peut
simplifier le problème.
332/2001
Sciences.ch 14/03/2005
Déterminons maintenant le Jacobien pour les systèmes de coordonnées les plus courants (nous
renvoyons à nouveau le lecteur au chapitre de calcul vectoriel pour plus d'information
concernant ces système) :
1. Coordonnes polaires :
333/2001
Sciences.ch 14/03/2005
avec
Lorsque nous cherchons à effectuer des intégrations, il est fréquent que nous ayons à utiliseer
un outil (ou méthode de calcul) appelé "intégration par parties". Voici la démonstration de la
validité de ce dernier.
Démonstration par récurrence sur : nous supposons la formule vraie pour et nous la
démontrons pour :
334/2001
Sciences.ch 14/03/2005
PRIMITIVES USUELLES
Cependant, nous omettrons les primitives qui découlent déjà des dérivées que nous avons
démontrées dans le sous-chapitre précédent traitant du calcul différentiel.
Sinon voici déjà une liste de quelques intégrales fréquentes (le lecteur en rencontrera de toute
façon bien d'autres – développées dans les détails - lors de son parcours du site) :
1. Primitive de :
Donc :
2. Primitive de :
Donc :
335/2001
Sciences.ch 14/03/2005
3. Primitive de :
Donc :
4. Primitive de :
Donc :
5. Primitive de :
336/2001
Sciences.ch 14/03/2005
Donc :
6. Primitive de :
Donc :
7. Primitive de :
Donc :
Remarque : une autre intégrale très importante avec l'exponentielle en physique est celle que
nous avions démontrée lors de notre étude de la loi de Gauss-Laplace en statistiques et
probabilités (détermination de la moyenne).
8. Primitive de :
337/2001
Sciences.ch 14/03/2005
Donc :
9. Primitive de :
Donc :
11. Primitive de :
Ainsi il vient :
Il vient :
et
d'où :
12. Primitive de :
Pour ( ) sachant que (voir les propriétés des logarithmes dans le chapitre d'analyse
fonctionnelle) :
338/2001
Sciences.ch 14/03/2005
13. Primitive de :
Nous avons :
Donc :
14. Primitive de :
Donc :
15. Primitive de :
339/2001
Sciences.ch 14/03/2005
Donc :
16. Primitive de :
Donc finalement :
17. Primitive de :
Donc finalement :
18. Primitive de :
340/2001
Sciences.ch 14/03/2005
Donc finalement :
19. Primitive de :
et donc :
20. Primitive de :
21. Primitive de :
Donc :
341/2001
Sciences.ch 14/03/2005
22. Intégrale de :
Donc :
24. Primitive de :
25. Primitive de :
En utilisant encore une fois les relations trigonométriques remarquables, nous avons :
26. Primitive de :
342/2001
Sciences.ch 14/03/2005
et
et :
27. Primitive de :
28. Primitive de :
343/2001
Sciences.ch 14/03/2005
et
et :
29. Soit :
Donc:
344/2001
Sciences.ch 14/03/2005
la relation suivante:
Vous pourrez trouver une application de ces deux primitives dans le modèle cosmologique
newtonien de l'univers dans le chapitre d'astrophysique à la section de mécanique analytique.
FONCTION DE DIRAC
La fonction de Dirac ou "fonction delta" joue un rôle pratique très important aussi bien en
électronique et informatique qu'en physique quantique ondulatoire et physique quantique des
champs (cela permet de discrétiser un continuum). Pour l'introduire simplement, considérons
la fonction définie par:
avec:
où est un nombre plus grand que 0 aussi petit que nous le voulons. Pour une fonction
345/2001
Sciences.ch 14/03/2005
continue en on a:
Il est alors assez aisé de définir la fonction de Dirac dans l'espace à 3 dimensions par:
Nous définissons la fonction Gamma d'Euler (intégrale Eulérienne de deuxième espèce) par
l'intégrale suivante:
Remarque : nous avons déjà rencontré cette intégrale et certaines de ses propriétés lors de
notre étude la fonction de distribution bêta en probabilités et statistiques (voir la section
d'arithmétique). Nous utiliserons également cette intégrale en maintenance (gestion de la
production) et dans la théorie des cordes).
Cette fonction est intéressante si nous l'écrivons sous la forme suivante (la variable
supposée appartenant aux entiers naturels) :
346/2001
Sciences.ch 14/03/2005
Comme la fonction exponentielle décroît beaucoup plus vite que nous avons :
Il en découle :
Donc:
CONSTANTE D'EULER-MASCHERONI
Ce petit texte fait juste office de curiosité relativement à la constante d'Euler et à presque
tous les outils de calcul différentiel et intégral que nous avons vu jusqu'à maintenant. C'est un
très joli exemple (presque artistique) de ce que nous pouvons faire avec les mathématiques
dès que nous avons suffisamment d'outils à notre disposition.
De plus, cette constante est utile dans certaines équations différentielles où nous la
retrouverons.
Nous avions vu que le nombre dans la rubrique d'analyse fonctionnelle que la constante
d'euler est défini par la fonction :
Dans un cas plus général nous pouvons très facilement démontrer da la même façon que:
347/2001
Sciences.ch 14/03/2005
Or la quantité:
D'où:
Divisons chacun des termes du produit par l'entier correspondant pris dans ,
nous obtenons donc:
348/2001
Sciences.ch 14/03/2005
SUITES ET SÉRIES
Les suites et séries ont une très grande importante dans les mathématiques pures c'est la raison
pour laquelle nous y consacrons un chapitre entier. Il conviendra cependant de la part du
lecteur de ne pas confondre dans ce qui va suivre le concept de "suite" de celui de "série" qui
tout en étant similaires sur le fond ne s'analysent mathématiquement pas toujours de la même
manière (au fait la différence est même très importante).
Nous avons souhaité dans ce chapitre rester dans des choses simples sans trop partir dans les
concepts topologiques des suites et séries. Cependant, la personne intéressée par des
définitions beaucoup plus rigoureuses pourra se reporter dans le chapitre traitant des fractales
(section d'informatique) et de topologie ou de nombreux concepts sur le suites sont définis
(supremum, infimum, sous-suite, théorème de Bolzano-Weierstrass,...).
SUITES
Définitions :
D1. Des nombres (en suite) sont en "progression arithmétique" si la différence de deux termes
consécutifs est constante.
D2. Des nombres (en suite) sont en "progression géométrique" si le rapport de deux termes
consécutifs est constant.
D3. Des nombres (en suite) sont en "progression harmonique" si les inverses de deux termes
consécutifs sont en progression arithmétique.
Dès lors, une "suite" est arithmétique, géométrique, harmonique si ses termes sont
respectivement en progression arithmétique, géométrique, harmonique et est la moyenne
arithmétique, géométrique, harmonique de et si les nombres sont en progression
arithmétique, géométrique, harmonique.
SUITES ARITHMÉTIQUES
Nous disons que des nombres ou que des "termes" en progression forment une "suite
arithmétique" lorsque leurs valeurs numériques différent d'une valeur appelée la "raison" de
la suite.
Ainsi, la suite:
La suite :
349/2001
Sciences.ch 14/03/2005
Ainsi, si nous notons par un terme quelconque de la suite ( ) de raison , nous avons :
P1. Un terme dont le rang est la moyenne arithmétique des rangs de deux autre termes est la
moyenne arithmétique de ces deux termes.
Démonstration :
et donc :
avec
Corollaire : pour trois termes consécutifs en progression arithmétique, le deuxième terme est
la moyenne arithmétique des deux autres.
Démonstration :
avec
SUITES HARMONIQUES
Nous disons que des nombres forment une "suite harmonique" lorsque leurs inverses sont en
progression arithmétique. Nous représentons cette progression par :
350/2001
Sciences.ch 14/03/2005
et que la somme des termes de chaque groupe est plus grande que 1/2 . La somme des termes
de la série augment donc indéfiniment; nous disons alors que la série est "divergente" (nous
reviendrons plus en détail sur ces concepts de convergence et divergence lors de.
Plus généralement, la somme des termes d'une progression harmonique indéfinie est
divergente. En effet, pour un terme quelconque, nous avons :
en désignant par l'entier plus grand que , les termes de la progression sont
respectivement, à partir de ce terme, plus petits que le quotient par des termes:
de la série harmonique.
SUITES GÉOMETRIQUES
Une "suite géométrique" est une suite de nombres tels que chacun d'eux est égal au précédent
multiplié par un nombre constant que nous appelons la "raison" de la progression. Nous
désignerons par:
Ainsi, si nous notons par un terme quelconque de la suite ( ), nous avons (trivial) :
Nous avons les propriétés suivantes pour un tel type de suite (sans démonstration pour
l'instant... sauf demande car triviales pour la plupart) :
P1. (triviale) Le quotient de deux termes d'une même suite est une puissance de la raison dont
l'exposant égale la différence des rangs des deux termes (simple rapport de termes de
puissance).
P2. (triviale) Si nous multiplions ou divisons terme à terme deux suites géométriques, nous
obtenons une troisième suite géométrique dont la raison égale le produit respectivement le
quotient des raisons des progressions données (simple opération avec les raisons des deux
séries d'origine).
P3. (triviale) Le produit de deux termes équidistants des extrêmes égale le produit compris
dans l'intervalle entre ces termes et les extrêmes (relisez plusieurs fois au besoin).
351/2001
Sciences.ch 14/03/2005
P4. Dans une suite géométrique, un terme dont le rang est la moyenne arithmétique des rangs
de deux autre termes est la moyenne géométrique de ces deux termes (relisez plusieurs fois au
besoin).
Démonstration :
et ainsi :
Démonstration :
avec
Il existe cependant quelques suites particulières qui ont des propriétés particulières que nous
retrouvons très fréquemment en mathématique ou physique théorique. Sans trop entrer dans
les détails, voici une petite liste (non exhaustive de ces dernières) :
SUITE DE CAUCHY
Il est souvent intéressant pour le mathématicien, autant que pour le physicien, de connaître les
propriétés d'une suite ayant une type de progression donnée. La propriété la plus importante
étant la limite vers laquelle elle tend.
Remarque : le lecteur qui n'est pas à l'aise avec la topologie peut sauter le texte qui va suivre
en attendant... et celui qui souhaite en savoir plus sur les suites de Cauchy peut se reporter au
chapitre de topologie et particulièrement dans le chapitre consacré aux fractales (section
d'informatique théorique).
Définition: soit un espace métrique (voir le chapitre de topologie), nous disons que la
suite:
352/2001
Sciences.ch 14/03/2005
En d'autres termes plus nous avancons dans la suite, plus les points sont proches (au sens de la
métrique d ) les uns des autres.
Nous disons également par définition que la suite d'éléments de est une "suite de
Cauchy" si :
Il est clair alors que toute suite convergente est une suite de Cauchy (bon il y a quelques
subtilités auxquelles nous ne ferons pas référence pour l'instant).
Démonstration : soit une suite convergeant vers (qui nous est inconnu donc) et
(choisi au hasard). Il existe alors selon la définition de la suite de Cauchy tel que :
le choix d'écrire est complètement mais au fait nous anticipons juste le résultat de la
démonstration afin que celui-ci soit plus esthétique.
Alors pour (au fait connaître le en question importe peu puisque cela doit
marcher pour n'importe lequel) nous avons selon l'inégalité triangulaire :
et puisque :
C'est peut être un peu abstrait alors voyons un exemple avec le suite harmonique (divergente
comme nous le savons déjà) . D'abord, rien ne nous interdit de prendre (sinon
cela va être dur de faire une différence entre deux termes…).
353/2001
Sciences.ch 14/03/2005
D'abord le lecteur remarquera que dans tous les cas puisque compris entre et
. Ce qui nous amène à pouvoir écrire :
Donc à partir de cette égalité il vient automatique que chaque terme de la somme de gauche
ci-dessous sera plus grand que chaque terme de la somme de droite suivant :
avec
maintenant l'idée est de voir que la somme de gauche est donc plus grande ou égale à
et cela quelque soit . Ainsi, l'idée c'est que nous ayons trouvé un epsilon pour lequel le
critère de Cauchy est mis en défaut. Car dans le cas contraire nous aurions du avoir :
Donc, ce n'est pas parce que des points se rapprochent les uns des autres qu'ils convergent
vers un point, car ce point n'existe peut-être pas.
Exemple :
Remarque : les mathématiciens utilisent ce fait pour définir l'ensemble des irrationnels en
utilisant quelques concepts topologique supplémentaires.
Nous venons de voir qu'une suite de Cauchy n'est pas forcément une suite convergente dans
354/2001
Sciences.ch 14/03/2005
X. La réciproque toutefois est vraie : toute suite convergente est une suite de Cauchy.
SUITE DE FIBONACCI
Si nous calculons une suite de nombres commençant par 0 et 1, de telle sorte que chaque
terme soit égale à la somme des deux précédents, nous pouvons former la suite:
La suite de Fibonacci possède des propriétés nombreuses fort intéressantes, qui seront
développées ultérieurement. Cette suite a été étudiée par Albert Girard (1633) dans la dernière
annotation de sa traduction du 5ème et du 6ème livre de l'Arithmétique de Diophante. Il
démontre que le rapport de deux termes consécutifs de la suite s'approche de plus en plus du
rapport du côté du décagone régulier inscrit dans la circonférence au rayon de cette
circonférence. Dans un mémoire présenté à l'Académie des Sciences de Paris en 1844, Lamé
indique l'application que l'on peut faire de cette suite à la détermination d'une limite
supérieure du nombre des divisions à faire dans la recherche du plus grand commun diviseur
de deux nombres entiers; l'année précédente Binet en avait montré l'emploi pour le
dénombrement des combinaisons discontigües. Cette même suite a encore été étudiée par
Plana en 1859. Il s'agit cependant de la première "suite récurrente" connue (d'où le fait que
nous en parlons aussi).
Nous utilisons également ce genre de suite pour montrer l'utilité du principe d'induction
présenté dans le chapitre de la théorie des nombres se trouvant dans la section d'arithmétique.
SÉRIES
Il existe, une quantité phénomènale de séries et de théories gravitant autour de ces dernières,
mais nous nous citerons en particulier les séries de Taylor (utilisées un peu partout), séries de
Fourier (théorie du signal et en mécanique ondulatoire) et les séries ou fonctions de Bessel
(physique nucléaire) dont nous ferons une étude ici.
L'expression :
355/2001
Sciences.ch 14/03/2005
Définition : La somme partielle des premiers termes de la série est appelée "somme
partielle " :
nous l'appelons la "somme de la série" et nous disons que la "série converge" (elle est donc de
Cauchy). Cependant, si la limite n'existe pas, nous disons que la "série diverge" et n'a pas de
somme (pour plus de détails voir le sous-chapitre plus loin traitant des critères de
convergence).
SÉRIES DE GAUSS
Les séries arithmétiques de Gauss sont l'expression de la somme de premiers entiers non
nuls élevés à une puissance donnée sous une forme condensée. L'application de cette forme
condensée de série à une utilité pratique en physique lorsque l'on souhait simplifier
l'expression de certains résultats.
Gauss avait trouvé une méthode séduisante en 1786 pour déterminer cette expression lorsqu'il
avait 9 ans (...):
pour .
Nous pouvons continuer ainsi pour des ordres supérieurs (nous les présentons non en tant
qu'exercices mais parce que ces relations sont utiles!):
Calculons maintenant la somme des premiers carrés (toujours non nuls). Posons:
356/2001
Sciences.ch 14/03/2005
nous pouvons donc écrire et ajouter membre à membre les égalités suivantes:
d'où:
Finalement:
Terminons avec
la somme des premiers cubes (non nuls). Le principe étant le même que précédemment,
nous posons:
nous obtenons en faisant varier de 1 à , relations que nous pouvons ajouter membre à
357/2001
Sciences.ch 14/03/2005
membre:
Evidemment, nous pouvons continuer ainsi longtemps mais à partir du certaine valeur de
l'élévation de la puissance les choses se compliquent un petit peu (de plus, la méthode est un
peu longue). Ainsi, un des membre de la famille des Bernoulli (c'était une famille de
mathématiciens assez doués...) a montré une relation générale fonctionnant pour n'importe
quelle puissance en définissant ce que l'on appelle le "polynôme de Bernoulli".
Personnellement, bien que cette méthode fonctionne très bien, nous n'avons pas souhaité la
présenter ici, excepté si un lecteur nous en fait la demande.
Soit un polynôme :
donc :
358/2001
Sciences.ch 14/03/2005
Il s'ensuit que :
relation que l'on appelle "série de MacLaurin limitée" ou tout simplement "série de
MacLaurin".
qui n'est d'autre que l'expression générale d'un polynôme exprimé sous une forme dite de
"série de Taylor limitée".
RESTE DE LAGRANGE
359/2001
Sciences.ch 14/03/2005
Théorème : Soit une fonction dérivable sur un intervalle qui contient . Pour
une valeur de l'intervalle, différente de , il existe un nombre situé entre et tel
que :
Démonstration : Soit une fonction définie pour une variable définie dans l'intervalle
considéré et définie par :
Nous voyons que tel que s'annule bien pour les valeurs :
Après simplification :
Selon le théorème de Rolle (voir chapitre de calcul différentiel et intégral), nous devons
trouver une valeur pour lequel la dérivée s'annule. Donc :
360/2001
Sciences.ch 14/03/2005
Nous voyons que plus le polynôme est de degré élevé, plus il approxime la fonction
avec exactitude. Que se passe-t-il lorsque ?
Théorème : Supposons que admette des dérives de tout ordre (ce que l'on note ) pour
toutes les valeur d'un intervalle quelconque contenant et soit le reste de Lagrange de
en . Si, quel que soit dans l'intervalle :
Le polynôme :
SÉRIES DE FOURIER
361/2001
Sciences.ch 14/03/2005
Posons le problème suivant : nous nous donnons une fonction périodique de période
. Nous demandons s'il existe une série trigonométrique convergent vers moyennant
des conditions sur cette série.
Supposons que l’intégrale de la fonction du premier membre de cette égalité soit égale à la
somme des intégrales des termes de la série ci-dessus. Ceci aura lieu, par exemple, si nous
supposons que la série trigonométrique proposée converge absolument, c'est-à-dire que
converge la série numérique suivante (de par la propriété bornée des fonctions
trigonométriques) :
La série :
est alors majorable et peut être intégrée terme à terme de 0 à (où ) ce qui nous
permet de déterminer les différents coefficients de Fourier. Mais avant de commencer
exposons les intégrales suivantes qui nous seront utiles par la suite (si le lecteur souhaite le
développement des ces intégrales, nous le feront) :
Avec et Avec et
362/2001
Sciences.ch 14/03/2005
par :
La série du second membre de l’égalité est majorable, étant donné que ses termes ne sont pas
supérieurs en valeurs absolues aux termes de la série positive convergente. Nous peuvons
donc l’intégrer terme à terme sur tout segment borné de 0 à :
Ainsi, pour déterminer l’ensemble des coefficients nous développons la fonction ci-dessus
en posant :
Pour déterminer les coefficients multiplions les deux membres de l’égalité par :
La série du second membre de l'égalité est majorable, étant donné que ses termes ne sont pas
supérieurs en valeurs absolues aux termes de la série positivie convergente. Nous pouvons
donc l'intégrer terme à terme sur tout segement borné de 0 à :.
Ainsi, pour déterminer l’ensemble des coefficients nous développons la série ci-dessus en
posant encoire une fois :
363/2001
Sciences.ch 14/03/2005
et :
Le théorème de Fourier montre que toute fonction périodique continue peut être approchée
par une somme infinie de fonctions trigonométriques (sinus ou cosinus) consistant en une
fonction fondamentale et ses harmoniques.
SÉRIES DE BESSEL
Les fonctions de Bessel sont très utiles dans de nombreux domaines de pointe de la physique
faisant intervenir des équations différentielles délicates à résoudre. Les domaines dans
lesquelles nous les trouvons le plus souvent sont la calorimétrie (conduction de la chaleur), la
physique nucléaire (physique de réacteurs), et la mécanique des fluides.
Ces séries sont cependant très peu détaillées dans les écoles universitaires et il est souvent du
rôle de l'élève de chercher les compléments d'informations dont il a besoin sur le sujet dans la
bibliothèque de son école. Nous avons voulu présenter ici les développements permettant
d'éviter cette démarche tout en restant chez soi devant son ordinateur (de plus les livres sur le
sujet sont assez rares...).
Remarque préalable : nous parlons habituellement par abus de langage des "fonctions de
Bessel" au lieu des "séries de Bessel"
Il existe une quantité non négligeable de fonctions de Bessel mais nous allons nous restreindre
à l'étude de celles qui sont les plus utilisées en physique.
La fonction connue sous le nom de "fonction de Bessel d'ordre zéro", notée est définie par la
série de puissances:
364/2001
Sciences.ch 14/03/2005
C'est lors de l'étude des propriétés de dérivation et d'intégration que Bessel a trouvé que cette
série de puissance est une solution à une équation différentielle que l'on retrouve assez
fréquemment en physique. C'est pourquoi elle porte son nom.
qui tend vers zéro quand , quelque soit la valeur de . Cela a pour conséquence que la
série converge pour toutes les valeurs de . Comme il s'agit d'une série de puissance positive,
la fonction et toutes ces dérivées sont continues pour toutes valeurs de , réelles ou
complexes.
La fonction , connue sous le nom de "fonction de Bessel d'ordre ", est définie, lorsque
est un entier positif, par la série de puissance:
365/2001
Sciences.ch 14/03/2005
et quand :
Nous pouvons noter que est une fonction paire de quand est paire, et impaire
quand est impaire (voir le chapitre d'analyse fonctionnelle pour voir ce qu'est une fonction
paire ou impaire).
366/2001
Sciences.ch 14/03/2005
ou écrit autrement:
ou écrit autrement :
ou encore :
Une solution à une équation Bessel qui n'est pas un multiple de est appelée "fonction
de Bessel du seconde type". Supposons que est une telle fonction et posons ; alors
d'après la relation:
nous avons:
et
367/2001
Sciences.ch 14/03/2005
368/2001
Sciences.ch 14/03/2005
définition.
Si dans la dernière relation, est remplacé par son expression en termes de série nous
avons:
dès lors :
où est une fonction de Bessel particulière du second type appelée "fonction de Bessel-
Neumann du second type d'ordre nul".
369/2001
Sciences.ch 14/03/2005
Au fait, les fonctions de Bessel viennent des solutions de l'équation différentielle étudiée
précédemment solutionnées par la méthode de Frobenius. Posons:
et faisons la substitution :
370/2001
Sciences.ch 14/03/2005
dès lors:
Posons :
et différentions ainsi :
Par soustraction :
371/2001
Sciences.ch 14/03/2005
Qui est appelé "l'équation différentielle de Bessel d'ordre " ou plus simplement "équation de
Bessel". Au fait, la plupart des écoles ou sites Internet donnent cette équation différentielle
comme une définition et pourtant il est clair qu'il y a raisonnement rigoureux derrière cette
équation.
Il s'ensuite que :
CRITERES DE CONVERGENCE
Lorsque nous étudions une série, l'une des questions fondamentales est celle de la
convergence ou de la divergence de cette série.
Si une série converge, son terme général tend vers zéro lorsque tend vers l'infini :
Ce critère est nécessaire mais non suffisant pour établir la convergence d'une série. Par contre,
si ce critère n'est pas rempli, on est absolument sûr que la série converge.
1. Le test de l'intégrale
2. La règle d'Alembert
3. La règle de Cauchy
Dans les paragraphes suivants, nous admettrons des séries à terme positifs. Le cas de la série
alternée sera vu ultérieurement.
372/2001
Sciences.ch 14/03/2005
TEST DE L'INTEGRALE
c'est-à-dire :
1. Si l'intégrale :
2. Si l'intégrale :
REGLE D'ALEMBERT
le rapport (assimilable à une fonction prise en son entier) a une limite finie lorsque
:
373/2001
Sciences.ch 14/03/2005
1. Si , la série converge
2. Si , la série diverge
RÈGLE DE CAUCHY
1. Si , la série converge
2. Si , la série diverge
THÉOREME DE LEIBNIZ
Nous avons considéré jusqu'à présent des séries à termes positifs. Nous allons considérer dans
cette partie des séries dont les termes sont alternés, c'est-à-dire des séries de la forme :
et si :
alors la série converge, sa somme est positive et n'est pas supérieure au premier terme.
374/2001
Sciences.ch 14/03/2005
Remarque : il est important de vérifier que les valeurs absolues des termes de la série soient
strictement décroissants afin de remplir la condition précédente.
CONVERGENCE ABSOLUE
Définition : une série à termes variables est dite absolument convergent si la série formée avec
la valeur absolue de ses termes converge :
Si une série alternée de termes est absolument convergente, la série absolue qui en découle
converge aussi.
Nous pouvons généraliser la règle d'Alembert au cas des séries à termes quelconques :
toujours avec les mêmes conclusions que pour la règle d'Alembert normale.
Le théorème du point fixe n'est pas vraiment utile en physique (imlicitement il est
indispensable mais les phyisiciens utilisent souvent des outils mathématiques dont les
propriétés ont déjà été validées au préalable par des mathématiciens), cependant nous le
retrouvons en théorie du chaos (les vortex, tourbillons, etc...) ainsi qu'en informatique
théorique (voir le chapitre traitant des fractales en particulier le triangle de Sierpinski). Nous
ne saurions donc que recommander au lecteur de prendre le temps de lire et de comprendre les
explications qui vont suivre.
Soit , un espace métrique complet (voir chapitre de topologie ou des fractales) et soit
une application strictement contractante de constante (voir les fonctions
lipschitziennes chapitre de topologie), alors il existe un unique point tel que
. est alors dit le "point fixe" de . De plus si nous notons par :
375/2001
Sciences.ch 14/03/2005
En appliquant l'inégalité triangulaire (voir le chapitre d'analyse vectorielle) plusieurs fois nous
avons :
Or :
donc :
pour finir :
c'est-à-dire que dans un premier temps est bien une suite de Cauchy.
A présent, nous vérifions que est bien un point fixe de . En effet est uniformément
continue (car lipschitzienne - voir le chapitre de topologie) donc à fortiori continue ainsi:
Il reste à vérifier que est l'unique point fixe (du coup nous aurons démontré que ne
dépend pas du choix de ). Supposons que nous ayons aussi alors :
376/2001
Sciences.ch 14/03/2005
377/2001
Sciences.ch 14/03/2005
CALCUL VECTORIEL
Des notions physiques telles que la force ou la vitesse sont caractérisées par une direction, un
sens et une intensité. Ce triple caractère est mis en évidence par les flèches. Celles-ci sont à
l'origine de la notion de vecteur et en constituent l'exemple le plus suggestif. Bien que leur
nature soit essentiellement géométrique, c'est leur aptitude à se lier les unes aux autres, donc
leur comportement algébrique, qui retiendra principalement notre attention. Partagé en classes
d'équivalence et muni de deux opérations appelées addition et multiplication par un scalaire,
l'ensemble qu'elles forment représente le modèle classique d'un espace vectoriel. Un de nos
premiers objectifs est la description détaillée de ce modèle.
Remarques :
R1. Avant de lire ce qui va suivre, nous conseillons au lecteur d'avoir au moins parcouru en
diagonale le chapitre traitant de la théorie des ensembles dans la section d'arithmétique. Nous
y définissons ce qu'est un "espace vectoriel" en utilisant les outils de la théorie des ensembles.
Ce concept bien que non indispensable vaut la peine quand même de s'y attarder pour voir
comment deux domaines des mathématiques s'intriquent.
R2. L'analyse vectorielle contient beaucoup de termes techniques et de définitions qu'il faut
apprendre par coeur (nous comprenons les raisonnements mais devons apprendre par coeur la
terminologie). Ce travail est pénible mais malheureusement nécessaire (l'auteur de ces pages
connaîte le problème...)
NOTION DE FLÈCHE
La flèche d'origine et d'extrémité sera notée ou abrégé par une lettre unique (latine
ou grecque) choisie arbitrairement tel que par exemple : .
Nous considérerons comme évident que toute flèche est caractérisée par sa direction, son sens,
son intensité ou grandeur et ainsi que son origine.
Définitions :
D1. Nous disons que deux flèches sont "équivalentes" si elles ont la même direction, le même
sens et la même intensité.
D2. Nous disons que deux flèches sont "colinéaires" si elles ont seulement la même direction
Partageons l'ensemble des flèches en classes d'équivalence : deux flèches appartiennent à une
même classe si et seulement si elles sont équivalentes.
378/2001
Sciences.ch 14/03/2005
L'ensemble des vecteurs sera lui désigné par . Il faut souligner que les éléments de sont
des classes de flèches et non pas des flèches individuelles. Il est cependant clair qu'une flèche
quelconque suffit cependant à déterminer la classe à laquelle elle appartient et il est donc
naturel de l'appeler "représentant de la classe" ou du vecteur.
Traçons le représentant d'un vecteur à partir de l'extrémité d'un représentant d'un vecteur
. La flèche dont l'origine est celle du représentant de et l'extrémité celle du représentant
de détermine un vecteur que nous noterons . L'opération qui associe à tout couple de
vecteurs leur somme s'appelle "addition vectorielle".
A l'aide d'une figure, il est facile de montrer que l'opération d'addition vectorielle est
associative et commutative, autrement dit, que:
et
Il est en outre évident que le vecteur nul est l'élément neutre de l'addition vectorielle,
autrement dit, que:
et
Remarques:
R1. l'addition s'étend, par récurrence, au cas d'une famille finie quelconque de vecteurs. En
vertu de l'associativité, ces additions successives peuvent être effectuées dans n'importe quel
ordre, ce qui justifie l'écriture sans parenthèses.
R2. la multiplication entre deux vecteurs est un concept qui n'existe pas. Par contre, comme
nous le verrons un peu plus loin, nous pouvons multiplier les vecteurs par certaines propriétés
d'autres vecteurs que nous appelons la "norme" et encore d'autres petites choses...
PSEUDO-VECTEURS
379/2001
Sciences.ch 14/03/2005
En physique, lors de l'énoncé de ce que nous appelons le "principe de Curie", les physicien
font mention de ce qu'ils appelent des pseudo-vecteurs. Il s'agit du vocabulaire simple pour
parler de quelque de tout aussi trivial mais fondamentalement peu de gens en font vraiment
usage. Mais il être quand même utile donc de présenter de quoi il s'agit.
Voici une figure avec des exemples types (le choix des lettre représentant les vecteurs ne sont
pas du au hasard, elle sont un clin d'œil aux propriétés des champs électriques et magnétique
étudiés en physique) :
Le vecteur appelé "produit du nombre par ", est défini de la manière suivante:
L'opération qui consiste à effectuer le produit d'un nombre par un vecteur est appelé
"multiplication par un scalaire".
Nous vérifions aisément que la multiplication par un scalaire est associative et distributive par
rapport à l'addition numérique vectorielle, autrement dit que:
380/2001
Sciences.ch 14/03/2005
RÈGLE DE TROIS
Revenons un peu sur la"règle de trois" (appelée parfois "règles des rapports et proportions" ou
encore "méthode de réduction à l'unité") souvent définie dans les petites classes de manière
intutive mais sans démonstration digne de ce nom. Cette règle est certainement l'algorithme le
plus usité de par le monde qui sert à identifier un quatrième nombre quand trois sont donnés et
que les quatre nombres sont linéairement dépendants.
Supposons maintenant que puisse prendre les valeurs et prendra les valeurs
linéairement dépendantes alors:
Remarque : si ce rapport n'est pas égal, alors il faut passer à l'utilisation d'autres outils tel que
la régression et in extenso l'extrapolation.
381/2001
Sciences.ch 14/03/2005
Remarque : si ce rapport n'est pas égal, alors il faut passer à la régression linéaire.
En gros, il suffit que nous connaissions trois variables sur les quatre pour résoudre cette
simple équation du premier degré.
Les conversions de monnaies ou d'unités de mesure se font à l'aide de la règle de trois simple
directe ou indirecte. Les calculs de parités (calcul prévisionnel fait par un importateur d'un
certain pays ayant ses propres unités de mesures et de monnaie, qui recherche parmi plusieurs
offres étrangères (dans des systèmes d'unités de mesures et de monnaies qui diffèrent de
l'importateur), laquelle est la plus avantageuse ou inversement) se font également avec la
règle de trois.
Nous appelle également "règle conjointe simple ou inverse", une série de règle de trois
directes ou indirectes.
Dans de tels calculs, les agents du marché d'échange ont remarqué que la plupart du temps, les
rapports étaient des valeurs proche de l'unité. Ils ont été ainsi naturellement amené à définir
"le pourcentage" comme étant la proportion d'une quantité ou d'une grandeur par rapport à
une autre, évaluée à la centaine (en général du moins ... ) :
ESPACE VECTORIEL
Pour plus d'informations sur ce qu'est un espace vectoriel dans le sens "ensembliste" le lecteur
382/2001
Sciences.ch 14/03/2005
devra se reporter au chapitre de théorie des ensembles où ce concept est défini avec plus de
rigueur.
Remarque : muni de ces deux opérations, un espace vectoriel est dit "vectorialisé".
Pour tout entier positif , désignera l'ensemble des n-uplets de nombres disposés en
colonne :
et est à l'évidence muni d'une structure d'espace vectoriel. Les vecteurs de cet espace
seront appelés "vecteur-colonnes". Il seront souvent désignés plus brièvement par :
COMBINAISONS LINÉAIRES
Dorénavant, sauf mention explicite du contraire, les vecteurs seront les éléments d'un espace
vectoriel .
Nous appelons "combinaison convexe", toute combinaison linéaire dont les coefficients sont
non négatifs et de somme égale à 1. L'ensemble des combinaisons convexes de deux points
et d'un espace ponctuel (ayant un origine) est le segment de droite et . Pour s'en
rendre compte, il suffit d'écrire:
383/2001
Sciences.ch 14/03/2005
de faire varier de 0 à 1 et de constater que tous les points du segment sont ainsi obtenu.
Si le vecteur est combinaison linéaire des vecteurs et chacun de ces vecteurs est
combinaison linéaire des vecteurs , alors est combinaison linéaire de
.
SOUS-ESPACES VECTORIELS
Nous appelons "sous-espace vectoriel de " tout sous-ensemble de qui est lui-même un
espace vectoriel pour les opérations d'addition et de multiplication par un scalaire définies
dans .
Un sous-espace vectoriel, en tant qu'espace vectoriel, ne peut être vide puisqu'il comprend au
moins un vecteur, à savoir son vecteur nul, celui-ci étant d'ailleurs forcément le vecteur nul de
. En outre, en même temps que les vecteurs et (s'il en contient d'autres que le vecteur
nul), il comprend également toutes leurs combinaisons linéaires .
Inversement, nous voyons aussitôt que tout sous-ensemble jouissant de ces propriétés est un
sous-espace vectoriel. Nous avons ainsi établi la proposition suivante :
FAMILLES GÉNÉRATRICES
Remarque : le sous-espace vectoriel engendré par un vecteur non nul est formé de tous les
multiples de ce vecteur. Nous appelons un tel sous-espace "droite vectorielle". Un sous-
espace vectoriel engendré par deux vecteurs non multiples l'un de l'autre est appelé "plan
vectoriel".
Ce qui va suivre est très important en physique nous conseillons donc au futur physicien de
prendre vraiment le temps de bien lire les développements qui vont suivre.
Si sont trois vecteurs de dont les représentants ne sont pas parallèles à un même
plan (par convention une flèche d'intensité nulle est parallèle à tout plan), alors tout vecteur
de peut s'écrire de manière unique sous la forme :
384/2001
Sciences.ch 14/03/2005
implique , aucun des vecteurs ne peut être combinaison linéaire des deux
autres, autrement dit, leurs représentants ne sont pas parallèles à un même plan.
Sur la base de ces observations, nous allons étendre la notion d'absence de parallélisme à un
même plan au cas d'un nombre quelconque de vecteurs d'un espace vectoriel .
Si l'attention est fixée sur la famille plutôt que sur les termes dont elle est
constituée, nous disons que celle-ci est "libre" ou "liée" suivant que les vecteurs
sont linéairement indépendants ou dépendants.
Définition : nous disons qu'une famille finie de vecteurs est une base de si et seulement si :
385/2001
Sciences.ch 14/03/2005
2. elle engendre .
D'après cette définition, toute famille libre est une base du sous-espace vectoriel
qu'elle engendre.
Pour qu'une famille de vecteurs soit une base de , il faut et il suffit que tout
vecteur de s'exprime de manière unique sous la forme d'une combinaison linéaire des
vecteurs :
Proposition:
forment un base que nous appelons "base canonique" de (nous travaillerons dans les
espaces complexes dans un autre chapitre).
Remarque : dans le cadre de l'espace à trois dimensions, les bases sont très souvent assimilées
à un trièdre (effectivement si vous reliez les extrémités des trois vecteurs par des traits vous
obtiendrez une trièdre imaginaire)
386/2001
Sciences.ch 14/03/2005
ANGLES DIRECTEURS
Il est clair, qu'un seul angle ne peut décrire la direction d'un vecteur dans l'espace. Nous
utilisons alors la notion "d'angles directeurs". Il s'agit de mesurer l'angle du vecteur par
rapport à chacun des axes positifs de la base :
Si :
alors:
Les valeurs :
Les 3 angles mentionnées ne sont pas complètements indépendants. En effet, 2 suffisent pour
déterminer complètement la direction d'un vecteur dans l'espace, le troisième pouvant se
déduire la relation suivante (obtenue à partir du calcul de la norme du vecteur, concept que
nous verrons un peu plus loin):
De plus, les cosinus directeurs sont les composantes scalaires d'un vecteur de norme unitaire
ayant la même direction que :
387/2001
Sciences.ch 14/03/2005
Nous disons que est de "dimension finie" s'il est engendré par une famille finie de vecteurs.
Dans le cas contraire, nous disons que est de "dimension "infinie" (nous aborderons ce
type d'espaces dans un autre chapitre). Tout espace vectoriel de dimension finie et non réduit
au vecteur nul admet une base. En fait, de tout famille génératrice d'un tel espace nous
pouvons extraire une base.
Tout espace vectoriel de dimension finie non nulle peut être mis en correspondance
biunivoque (c'est-à-dire en bijection) avec . Il suffit de choisir une base de et de faire
correspondre à tout vecteur de le vecteur-colonne dont les termes sont les composantes
de dans la base choisie (c'est du bla bla de mathématicien mais ce sera utile quand nous
aborderons des espaces plus complexes) :
Remarque : nous disons alors que et sont "isomorphes" ou que la correspondance est
un isomorphisme (voir théorie des ensembles).
Remarque : une telle étude à son utilité lors de passage d'espace mathématique ayant des
propriétés données à un autre espace ayant des propriétés mathématiques différentes.
Démonstration:
388/2001
Sciences.ch 14/03/2005
H1. Nous supposons qu'au moins un des vecteurs n'est pas combinaison linéaire des
vecteurs , sinon engendrerait et serait donc une base possible de
. Notons ce vecteur . La famille est alors une famille libre. En effet, la
relation :
implique alors tout d'abord que , autrement serait combinaison linéaire des vecteurs
, et ensuite , puisque les vecteurs sont linéairement
indépendants.
Il en retourne un corollaire:
Tout espace vectoriel de dimension finie et non réduit au vecteur nul admet une base. En fait,
de toute famille génératrice d'un tel espace, nous pouvons donc extraire une base.
SOMMES DIRECTES
Supposons que soit de dimension finie. Pour tout sous-espace vectoriel de , il existe
389/2001
Sciences.ch 14/03/2005
Démonstration:
ESPACE AFFINE
Cet espace est associé à "l'espace vectoriel" géométrique par la correspondance entre
flèches et vecteurs étudiés jusqu'ici ! La définition suivante ne fait que mettre en évidence les
traits dominants de cette correspondance :
Soit un ensemble non vide d'éléments que nous appellerons "points" et désignerons par les
lettres ; soit en outre un espace vectoriel. Supposons qu'à tout couple de points
corresponde un vecteur noté . Nous disons alors que que est un "espace affine"
d'espace directeur (ou dit simplement abusivement de "direction") si les conditions
suivantes sont satisfaites :
C1. Pour tout point fixé, la correspondance entre couples et vecteurs est
biunivoque, autrement dit, pour tout vecteur il existe un point et un seul tel que .
C3. Si est un point et un vecteur, pour exprimer que est l'unique point tel que
, nous écrivons:
Bien qu'un peu abusive, cette écriture est comme à l'usage et suggère bien le sens de
l'opération qu'elle désigne.
P1.
390/2001
Sciences.ch 14/03/2005
si et seulement si :
nous avons :
Précédemment, nous avons vu ce qui faisait qu'un espace pouvait être muni d'une structure
d'espace vectoriel (nous avons vu que nous disons que ce dernier était dès lors "vectorialisé").
Dans le cas général d'un espace affine , le procédé est le même :
Vu la manière dont les opérations ont été définies, il résulte que est isomorphe à l'espace
directeur :
Toutefois, cet isomorphisme dépend du choix de l'origine et en pratique cette origine est
choisie sur la base de données inhérentes aux problèmes posés. Par exemple, si une
transformation affine admet un point invariant (qui ne bouge pas), il y a avantage a choisir ce
point comme origine.
Remarques:
391/2001
Sciences.ch 14/03/2005
R1. Lorsque nous parlons de dimension d'un espace affine, nous parlons de la dimension de
son espace directeur.
R2. L'espace de la géométrie élémentaire est un espace affine. En effet, sa direction est
l'espace géométrique et les conditions de définition d'un espace affine sont satisfaites. Il
faut bien noter qu'au couple de points est associé le vecteur et non pas la flèche
. En fait, la flèche pouvant être identifiée au couple de points, nous voyons que ce que
postule la définition d'un espace affine n'est rien d'autre qu'une forme abstraite de
correspondance entre flèches et vecteurs.
R3. Tout espace vectoriel peut être considéré comme un espace affine de direction lui-
même si au couple de vecteurs est associé le vecteur . En effet, les conditions de
définition d'un espace affine sont dès lors satisfaites.
Avant de définir ce qu'est un espace vectoriel, nous allons au préalable définir quelques outils
mathématiques et quelques concepts.
Nous pouvons, en choisissant une unité de longueur, mesurer l'intensité de chaque flèche,
autrement dit, déterminer sa longueur. Nous pouvons aussi mesurer l'écart angulaire de deux
flèches (ou vecteurs) quelconques d'origine commune (non nécessairement distinctes) en
prenant comme unité de mesure d'angle par exemple le radian. La mesure de cet écart est alors
un nombre compris entre 0 et , appelé "angle" des deux flèches. Si les deux flèches ont
même direction et même sens, leur angle est nul et si elles ont même direction et sens opposé,
ce même angle est .
Les flèches représentatives d'un même vecteur ont toutes la même longueur. Nous
désignerons cette longeur par la notation:
et l'appellerons "norme" de . Il est clair que la longeur d'un vecteur est nulle si et seulement
si sa norme est nulle. Nous dirons qu'un vecteur est unitaire si sa norme est 1.
est un vecteur unitaire colinéaire (nécessairement) à dont la norme est égale à l'unité et que
nous notons .
Nous appelerons "angle des vecteurs non nuls et " l'angle de deux flèches d'origine
commune représentant l'une et l'autre .
PRODUIT SCALAIRE
Définition : l'espace vectoriel euclidien, est un espace vectoriel (réel et de dimension finie
392/2001
Sciences.ch 14/03/2005
pour les puristes) possédant une opération particulière, "le produit scalaire" que nous noterons
(notation spécifique à ce site Internet) en ce qui concerne les vecteurs :
Remarques :
R1. Nous trouvons dans certains ouvrages (pour information) la notation ou encore
que nous ne souhaitons pas utiliser dans le cadre du calcul vectoriel car trop proche du
formalisme de Dirac utilisé en physique quantique et du produit scalaire fonctionnel (voir
chapitre d'analyse fonctionnelle).
R2. Le produit scalaire à une importance énorme dans l'ensemble du domaine des
mathématiques et de la physique, ainsi nous le retrouvons dans le calcul différentiel et intégral
(de par le produit scalaire fonctionnel), en topologie, en physique quantique en analyse du
signale etc... il convient donc de bien comprendre ce qui va suivre.
R3. Le produit scalaire peut être vu comme une projection de la longueur d'un vecteur sur la
longueur d'un autre
Ce produit scalaire possède les propriétés suivantes (dont la plupart découlent de la définition
même du produit scalaire):
P1. Commutativité :
P2. Associativité :
P3. Distributivité :
P4. Si
P5. et si
P6.
Seule cette dernière propriété nécessite une démonstration (de plus un des résultats de la
démonstration nous servira à démontrer une autre propriété très important du produit
scalaire):
Soit :
393/2001
Sciences.ch 14/03/2005
Cette expressions vaut également dans le cas où est nul, à condition d'admettre que la
projection orthogonale de vecteur nul est nul. La norme de s'écrit :
et
Par des considérations géométriques élémentaires, il est facile de se rendre compte que :
et
Nous avons si :
d'où la propriété P6 qui s'ensuit par multiplication des deux membres de l'égalité par .
Définitions :
394/2001
Sciences.ch 14/03/2005
D2. Nous dissons que les vecteurs et sont "orthogonaux" s'ils sont non nuls et que leur
produit scalaire est nul (leur angle est égal à ).
Par le raisonnement géométrique, nous voyons que tout vecteur est la somme de ses
projections orthogonales sur les vecteurs d'une base orthonormale, autrement dit, si
est une base orthonormale:
puisque et de même :
et
d'où la décomposition.
395/2001
Sciences.ch 14/03/2005
qui constitue l'une des relations les plus importante dans le domaine du calcul vectoriel et que
nous appelons "produit scalaire canonique".
INÉGALITÉ DE CAUCHY-SCHWARZ
La relation:
s'écrit également trivialement sous la forme suivante si nous utilisons la notion de norme et la
définition du produit scalaire :
Si les deux vecteurs et sont orthogonaux, nous retrouvons le résultat d'un théorème
fameux: le théorème de Phytagore.
Nous appelons également "inégalité de Cauchy-Schwarz" l'inégalité, valable pour tout choix
des vecteurs et la relation :
396/2001
Sciences.ch 14/03/2005
vérifie l'inégalité puisque le second terme est au carré donc nécessairement positif ou nul.
Lorsque est , l'inégalité de Cauchy-Schwarz s'écrit avec les composantes des vecteurs :
ou encore:
ce qui montre que le carré de la moyenne arithmétique est inférieur ou égal à la moyenne
arithmétique des carrés. Ce résultat est très important pour l'étude des statistiques.
INÉGALITÉ TRIANGULAIRE
Nous obtenons
ce qui entraîne la fameuse "inégalité triangulaire" (très utile dans l'étude des suites et séries
397/2001
Sciences.ch 14/03/2005
Remarque : la généralisation de cette inégalité relativement aux propriétés des normes telles
que nous le verrons en topologie, donne ce que nous appelons "l'inégalité de Minkowski".
PRODUIT VECTORIEL
Le produit vectoriel de deux vecteurs est une opération propre à la dimension 3. Pour
l'introduire, il faut préalablement orienter l'espace destiné à le recevoir. L'orientation étant
définie au moyen de la notion de "déterminant", nous commencerons par une brève
introduction à l'étude de cette notion. Cette étude sera reprise plus tard dans le détail lors de
l'analyse des systèmes linéaires dans le chapitre d'algèbre matricielle.
et nous notons:
398/2001
Sciences.ch 14/03/2005
et nous notons :
le nombre :
Le déterminant a comme propriété d'être multiplié par –1 si l'un de ses vecteurs colonnes est
remplacé par son opposé ou si deux de ses vecteurs-colonnes sont échangés (la vérification
étant simple nous nous abstiendrons de la démonstration, sauf sur demande). En plus, le
déterminant est non nul si et seulement si ses vecteurs-colonnes sont linéairement
indépendants (la démonstration se trouve quelques lignes plus bas et est d'une très grande
importance en mathématiques).
le vecteur :
Remarques :
399/2001
Sciences.ch 14/03/2005
R1. La première notation est la notation internationale due à Gibbs (que nous utiliserons tout
au long de ce site), la deuxième est la notation français due à Burali-Forti (assez embêtant car
ce confond avec l'opérateur ET en logique)
R2. il est assez embêtant de retenir par coeur les relations qui forment le produit vectoriel
habituellement. Mais heureusement il existe au moins trois bons moyens mnémotechniques :
RM1. Le plus rapide consiste à retrouver l'une des expressions des comosantes du produit
vectoriel et ensuite par décrémentation des indices (en recommencent à 3 lorsque qu'on arrive
à 0) de connaître toutes les autres composantes. Encore faut-il trouver un moyen simple de se
souvenir d'une des composantes. Un bon moyen est la propriété mathématique suivante de
deux vecteur colinéaires permettant facilement de retrouver la troisème composante (celle
selon l'axe ) :
RM2. La seconde mais que nous verrons lors de notre étude du calcul tensoriel consiste à
utiliser le symbole d'antisymétrie (également appelé "tenseur de Levi-Civita"). Cette méthode
est certainement la plus esthétique d'entre toutes mais pas nécessairement la plus rapide à
développer. Nous donnons ici juste l'expression sans plus d'explications pour l'instant (elle est
également utile pour l'expression du déterminant par extension) :
RM3. Cette dernière méthode est assez simple et triviale aussi mais elle utilise implicitement
la première : la i-ème composante est le déterminant des deux colonnes:
privées de leur i-ème terme, le deuxième déterminant étant cependant pris avec le signe "-" tel
que :
400/2001
Sciences.ch 14/03/2005
P1. Antisymétrie :
P2. Linéarité :
Démonstrations :
Si nous développons le produit vectoriel des deux vecteurs dépendants à un facteur près,
nous obtenons:
Il va sans dire que le résultat ci-dessus est égal au vecteur nul si effectivement les deux
vecteurs sont linéairement dépendants.
Si nous supposons maintenant que les deux vecteurs et sont linéairement indépendants et
non nuls, nous devons démontrer que le produit vectoriel est:
401/2001
Sciences.ch 14/03/2005
ce qui montre bien que le vecteur est perpendiculaire au vecteur résultant du produit
vectoriel entre et !
Donc finalement:
Nous remarquerons que dans le cas où est l'espace vectoriel géométrique, la norme du
produit vectoriel représente l'aire du parallélogramme construit sur des représentants et
d'origine commune.
Ce déterminant est donc positif, puisqu'au moins un des n'est pas nul, d'après la troisième
propriété d'indépendance linéaire du produit vectoriel.
402/2001
Sciences.ch 14/03/2005
Voici encore quelques propriétés très importantes d'utilité pratique du produit vectoriel (en
physique particulièrement) :
P1.
P2.
P3.
PRODUIT MIXTE
Nous pouvons étendre la définition du produit vectoriel à une autre type d'outil mathématique
que nous appelons le "produit mixte" :
Abrégé :
D'après ce que nous avons vu lors de la définition du produit scalaire et vectoriel , le produit
mixte peut également s'écrire :
Nous remarquerons que dans le cas où est l'espace vectoriel géométrique , le produit
mixte symbole le volume (orienté) du parallélépipède, construit sur des représentants
d'origine commune.
Remarque : il est assez trivial que le produit mixte est un extension à 3 dimension du produit
vectoriel qui représente rappelons-le, la surface du parallélogramme.
et le lecteur vérifier sans aucune peine (nous le ferons s'il y a demande) en développant les
composantes que :
Le produit mixte jouit également des propriétés que le lecteur ne devrait avoir aucun mal à
vérifier en développant les composantes (mis à part P3 qui découle des propriétés du produit
scalaire et vectoriel) :
P1.
403/2001
Sciences.ch 14/03/2005
P2.
P4.
Soit l'ensemble des fonctions réelles -fois dérivables dans l'intervalle fermé .
Nous désignerons les éléments de cet ensemble par les lettres
Ces deux opérations satisfont à toutes les conditions des vecteurs d'un espace vectoriel que
nous avons déjà définies au début de ce chapitre (associativité, commutativité, vecteur nul,
vecteur opposé, distributivité, élément neutre) et munissent donc d'une structure
d'espace vectoriel. Le vecteur nul de cet espace étant bien évidemment la fonction nulle et
l'opposé de étant la fonction .
Il est intéressant de constater que en tant qu'espace vectoriel est une généralisation de
au cas continu. Nous pouvons en effet concevoir tout vecteur de sous la forme
d'une fonction réelle définie dans l'ensemble : la valeur de cette fonction au point
est tout simplement .
Remarque : Les polynômes de degré et à une inconnue forment aussi un exemple d'espace
vectoriel fonctionnel de dimension (à chaque coefficient du polynôme correspond une
composante du vecteur).
Le champ d'application privilégié de la théorie abstraite du produit scalaire est constitué par
les espaces vectoriels fonctionnels. Nous appelons ainsi aussi produit scalaire canonique dans
l'opération définie par la relation :
Cette opération définit bien un produit scalaire, ces les propriétés de ce dernier sont vérifiées
et, en outre, l'intégrale :
404/2001
Sciences.ch 14/03/2005
SYSTÈMES DE COORDONNÉES
Nous allons aborder ici, l'aspect des changements de coordonnées des composantes de
vecteurs. Ce type de transformation à un fort potentiel en physique (ainsi qu'en mathématique)
lorsque nous souhaitons simplifier l'étude de systèmes physiques dont les équations
deviennent plus facilement manipulables dans d'autres système de coordonnées.
Bien que nous soyons dans un chapitre et une section de mathématiques du site, nous nous
permettrons dans ce qui va suivre de faire une liaison directe avec la physique pour ce qui
concerne les expressions de la vitesse et de l'accélération dans différentes systèmes de
coordonnées.
Nous ne souhaitons pas trop nous attarder sur ce système car il est bien connu de tout le
monde habituellement. Rappelons cependant que la plupart du temps, en physique, les
systèmes cartésiens dans lequels nous travaillons sont (deux dimensions spatiales),
(trois dimensions spatiales) voir ou (trois dimensions spatiales et une temporelle)
lorsque nous travaillons en relativité.
Les systèmes cartésiens sont représentés par des vecteurs de base orthonormés (dans le sens
qu'ils sont linéairement indépendant et de norme unité) qui forment une base pré-euclidienne
(base euclidienne dans laquelle nous avons défini le produit scalaire).
Dans ce système, la position d'un point (repérable par un vecteur ) est défini par le triplet
de nombre noté (en calcul tensoriel):
Ce point peut être repéré par un vecteur noté arbitrairement dans la base par la
relation (utilisant la notation tensorielle):
405/2001
Sciences.ch 14/03/2005
En physique, si nous travaillons avec des coordonnées, c'est toujours pour pouvoir déterminer
l'emplacement d'un élément. Or, comme nous le verrons plus rigoureusement en mécanique
analytique, le physicien travaille avec les notions suivantes (chaque élément dépendant
souvent du temps):
- Position:
- Vitesse:
- Accélération:
Maintenant voyons comment s'expriment ces différentes notions dans des systèmes telles que
les coordonnnées sphériques, cylindriques et polaires.
Nous voyons très bien si nous connaissons bien les relations trigonométriques élémentaires
(voir le chapitre du même nom dans la section de géométrie) que nous avons les
transformations:
406/2001
Sciences.ch 14/03/2005
et inversement:
Maintenant il nous faut trouver les expressions qui relient les vecteurs de la base sphérique
que nous choisissons de noter avec les vecteurs de la base cartésienne .
Nous avons, comme nous pouvons le voir sur le schéma ci-dessus:
Explications pour la seconde ligne : en divisant par , nous nous assurons de par les
propriétés de la norme du produit vectoriel que sera bien normalisé à
l'unité.
Pour des besoins ultérieurs, déterminons les différentielles partielles de chacune des ces
coordonnées:
407/2001
Sciences.ch 14/03/2005
Nous allons également utiliser plus tard (pour l'étude des opérateurs vectoriels) la variation
exprimée en coordonnées sphériques:
Pour l'accélération nous obtenons (exactement dans la même démarche que pour déterminer
l'expression de la vitesse):
Le système de coordonnées cylindriques (très utile dans l'étude des système à mouvements
hélicoïdaux) est assez semblable à celui des coordonnées sphériques puisqu'il peut être vu
comme une tranche de la sphère. Soit le schéma:
408/2001
Sciences.ch 14/03/2005
il vient sans peine qu'en coordonnées polaires (à un changement de notation près par rapport
au schéma ci-dessus):
et inversement:
Maintenant il nous faut trouver les expressions qui relient les vecteurs de la base polaire que
nous choisisson de noter (au lieu de comme cela ce fait traditionnellement)
avec les vecteurs de la base cartésienne . Nous avons, identiquement à ce que nous
avons fait pour les coordonnées sphériques:
Explications pour la seconde ligne : en divisant par , nous nous assurons de par les
propriétés de la norme du produit vectoriel que sera bien normalisé à
l'unité. Dans le cas des coordonnées cylindriques l'angle étant de toute façon droit, nous ne
serions pas obligé d'indiquer cette division, mais nous avons fait ce choix par souci
d'homogénéité avec les développements précédents.
Pour des besoins ultérieurs, déterminons les différentielles partielles de chacune des ces
coordonnées:
409/2001
Sciences.ch 14/03/2005
Nous allons également utiliser plus tard (pour l'étude des opérateurs vectoriels) la variation
exprimée en coordonnées cylindriques:
Donc si nous faisons maintenant un peu de physique, nous avons (rappellons que la
composante est indépendante des autres composantes cylindriques):
Pour l'accélération nous obtenons (exactement dans la même démarche que pour déterminer
l'expression de la vitesse):
Le système de coordonnées polaires est très semblable à celui des coordonnées cylindriques
puisqu'il peut être vu comme un retranchement d'une dimension (la hauteur) du système
cylindrique.
410/2001
Sciences.ch 14/03/2005
et inversement:
Maintenant il nous faut trouver les expressions qui relient les vecteurs de la base polaire que
je choisis de noter (au lieu de comme cela ce fait traditionnellement) avec les
vecteurs de la base cartésienne . Nous avons identiquement à ce que nous avions fait
pour les coordonnées sphériques:
Explications pour la seconde ligne : en divisant par , nous nous assurons de par les
propriétés de la norme du produit vectoriel que sera bien normalisé à
l'unité. Dans le cas des coordonnées polaires l'angle étant de toute façon droit, nous ne serions
pas obligé d'indiquer cette division, mais nous avons fait ce choix par souci d'homogénéité
avec les développements précédents.
Pour des besoins ultérieurs, déterminons les différentielles partielles de chacune des ces
coordonnées:
Nous allons également utiliser plus tard (pour l'étude des opérateurs vectoriels) la variation
exprimée en coordonnées cylindriques:
411/2001
Sciences.ch 14/03/2005
Pour l'accélération nous obtenons (exactement dans la même démarche que pour déterminer
l'expression de la vitesse):
Un champ scalaire, vectoriel ou tensoriel, dans un volume , est une application qui, à tout
point de ce volume , associe une grandeur scalaire, vectorielle ou tensorielle. Ainsi,
l'application qui, à tout point de , de coordonnées spatiales associe la valeur
scalaire est un champs scalaire dans .
En chaque point d'un volume traversé par un fluide en mouvement, le vecteur qui coïncide à
chaque instant avec la vitesse de la particule changeante qui passe en ce point à ce même
instant définit un champ vectoriel 3D, éventuellement variable dans le temps. Les champs
ainsi définis constituent un outil mathématique de base dans l'ensemble de la physique.
Lorsque nous représentons graphiquement un champ scalaire, l'ensemble des points continus
de valeur égale constituent ce que l'on appelle des "isolignes" ou plus couramment "courbes
de niveau".
412/2001
Sciences.ch 14/03/2005
A partir de cette relation, nous pouvons définir l'opérateur "gradient" d'un champ scalaire tel
que:
où est un terme vectoriel appelé le "gradient du champ scalaire ". Pour condenser
l'écriture, nous utilisons parfois le symbole nommé le "nabla du champ scalaire ".
Finalement nous voyons que le gradient d'un champ scalaire est le champ vectoriel
dont les composantes en chaque point sont les trois dérivées du champ scalaire par rapport
aux trois coordonnées spatiales, notées ici .
413/2001
Sciences.ch 14/03/2005
Par sa direction, son sens et son module, le vecteur gradient d'un champ en un point comporte
donc des indications sur la manière dont varie le champ autour de ce point.
Remarque : la condition nécessaire et suffisante pour qu'un champ de vecteurs soit le gradient
d'un champ scalaire est que ce champ vectoriel soit irrotationnel (voir plus loin l'opérateur
"rotationnel d'un champ vectoriel").
Après avoir défini le gradient en coordonnées cartésiennes nous devons nous intéresser
à l'expression de cet opérateur dans d'autres systèmes de coordonnées. Il est fréquent en
physique d'avoir à utiliser les coordonnées cylindriques, polaires et sphériques pour simplifier
l'étude formelle de systèmes physiques. Ainsi, si nous faisons référence à notre étude des
systèmes de coordonnées, nous avons (rappel) d'abord en coordonnées polaires:
donc :
414/2001
Sciences.ch 14/03/2005
Rappellons que lors de l'étude des différents systèmes de coordonnées nous avons obtenu
pour les coordonnées cylindriques:
Donc nous savons déjà que l'expression du gradient en coordonnées cylindriques sera
identique à celle en coordonnées polaires à l'exception de l'ajout de la composante verticale
indépendante des autres coordonnées. Ainsi, nous obtenons en coordonnées cylindriques:
Ce qui nous permet d'obtenir la relation (nous utilisons maintenant la notation qui use du
l'opérateur "nabla"):
La relation:
Nous impose:
415/2001
Sciences.ch 14/03/2005
Nous avons donc finalement vu toutes les expressions du gradient dans les systèmes
cartésiens, polaires, cylindriques et sphériques.
Le gradient d'un champ vectoriel est le champ dit "tensoriel" défini par les 9
relations suivantes en coordonnées cartésiennes:
416/2001
Sciences.ch 14/03/2005
Nous avons donc finalement vu toutes les expressions du gradient d'un champ tensoriel dans
les systèmes cartésiens, polaires, cylindriques et sphériques.
Nous définissons l'opérateur divergence par la relation suivante (la notation tensorielle a été
utilisée afin d'abréger l'écriture) dans un espace à dimensions:
Si la divergence d’un champ de vecteurs est identiquement nulle en tous les points d’un repère
Eulérien, l’intégrale triple du flux de ce champs à travers un volume sera:
Il en résulte que le flux de ce champ de vecteurs à travers les bords du volume est nul, c’est-à-
dire que le flux entrant compense le flux sortant. Nous disons qu’un tel champ de vecteurs de
divergence nulle présente un flux conservatif.
Nous avons donc finalement vu toutes les expressions de la divergence d'un champ vectoriel
dans les systèmes cartésiens, polaires, cylindriques et sphériques.
417/2001
Sciences.ch 14/03/2005
d'où le fait que le rotationnel d'un champ de vecteur est perpendiculaire à ce champ.
L'expression de ce rotationnel est très simple à obtenir dans d'autres système de coordonnées
une fois le gradient connu dans tous les systèmes couramments utilisés. Ainsi, en coordonnées
cylindriques (le rotationnel en coordonnées polaires n'est pas définissable), nous avons:
418/2001
Sciences.ch 14/03/2005
et en coordonnées sphériques:
Le Laplacien d’un champ scalaire est le champ scalaire qui mesure la différence
entre la valeur de la fonction en un point et sa moyenne autour de ce point.
Le Laplacien est nul, ou assez petit, lorsque la fonction varie sans à-coup. Les fonctions
vérifiant l’équation de Laplace sont dites "harmoniques".
Le Laplacien d'un champ scalaire en dans d'autres systèmes de coordonnées est un peu plus
long à développer. Il existe plusieurs méthodes et parmi celles existantes j'ai choisi celles dont
le type de raisonnement et les outils utilisés semblaient pertinents. Il est intéressant d'aborder
différentes stratégies mais bien sûr il existe des méthodes plus simples que celle présentée ci-
dessous.
Pour déterminer cette expression en coordonnées polaires, nous allons utiliser la différentielle
totale et la règle de chaîne en coordonnées polaires:
419/2001
Sciences.ch 14/03/2005
et
d'où:
et
et
d'où:
et compte tenu que les dérivées partielles secondes sont continues, alors les dérivées croisées
sont égales:
Donc:
420/2001
Sciences.ch 14/03/2005
Dans le cas d'extension aux coordonnées cylindriques, nous aurons, puisque la troisième
coordonné ne change pas:
Nous allons tout d'abord nous aider de la figure ci-dessus pour savoir de quoi l'on parle:
Les relations entre coordonnées cartésiennes et sphérique sont données par les relations:
Coordonnées cylindriques: et
421/2001
Sciences.ch 14/03/2005
Coordonnées sphériques: et
L'objectif est de jouer avec cette correspondance avec d'abord le Laplacien en coordonnées
cylindriques où l'on a soustrait des deux côtés de l'égalité le terme . Ainsi:
Le deuxième terme de l'égalité de cette dernière relation est l'équivalent sphérique du terme
#1 du Laplacien en coordonnées cylindriques:
nous obtenons:
avec:
et
422/2001
Sciences.ch 14/03/2005
nous divisons cette relation des deux côtés par et ainsi nous obtenons:
Le terme #3 est très simple à déterminer. Nous remplacons par afin d'obtenir:
En rassemblant tous les termes obtenus précédemment, nous obtenons enfin la forme étendue
du Laplacien en coordonnées sphériques si utilisé en physique:
Le Laplacien d'un champ vectoriel est le champ vectoriel défini par (notation
tensorielle):
423/2001
Sciences.ch 14/03/2005
Le Laplacien d'un champ de vecteurs en d'autres systèmes de coordonnées est assez simple à
obtenir à partir de la connaissance du Laplacien d'un champ scalaire dans ces mêmes
coordonnées. Ainsi, en coordonnées polaires, nous avons pour le Laplacien d'un champ
vectoriel la relation suivante:
et en coordonnées cylindriques:
424/2001
Sciences.ch 14/03/2005
RELATIONS REMARQUABLES
Les opérateurs différentiels scalaires et vectoriel ont des propriétés très simples que l'on
retrouve très souvent en physique.
Voyons d'abord les relations qui n'ont aucun sens (au cas où vous tomberiez dessus sans faire
exprès...):
ou
ou
le rotationnel d'un laplacien scalaire n'existe pas puisque l'opérateur rotationnel s'applique à
un champ vectoriel alors que par construction, le laplacien est un scalaire.
Voyons maintenant les propriétés remarquables (sans démonstrations car trop simple -
cependant si vous en avez besoin car vous n'y arrivez pas seul, n'hésitez pas à nous contacter,
nous compléterons):
ou
- Le rotationnel d'un champ vectoriel est égal au gradient de la divergence de ce champ moins
son laplacien vectoriel :
ou
425/2001
Sciences.ch 14/03/2005
- La multiplication de l'opérateur nabla par le produit scalaire de deux vecteurs est égal à...
(voir ci-dessous), qui donne une relation très utile en mécanique des fluides :
- Le produit scalaire du rotationnel d'un vecteur est la différence des opérateurs commutés tel
que :
Dans le cadre de ce site Internet, nous faisons usage des différentes notations présentées et
résumées dans le tableau ci-dessous. Leur usage permet dans le cadre de différentes théories
d'éviter des confusions avec d'autres êtres mathématiques. C'est embêtant certes mais il faudra
faire avec.
- Le gradient signifie "la pente" (exemple : le champ électrique est la pente du potentiel
électrostatique).
- La divergence caractérise un flux de quelque chose qui vient de quelque part, d'une source,
ou qui y va. Si la divergence n'est pas nulle, c'est qu'il y a concentration autour d'un point,
donc la densité augmente (ou diminue, c'est selon le signe). Ca peut être la densité de charges
électriques ou bien la masse volumique. D'où le fameux théorème qui dit que le flux (ce qui
passe dans une surface) est égal à l'intégrale de la divergence (ce qui reste).
- Le rotationnel caractérise l'existence d'un tourbillon, c'est très utilisé en mécanique des
fluides. S'il y a un tourbillon, on peut suivre une ligne de courant sur une courbe fermée sans
qu'elle change de sens : la circulation ne sera pas nulle (elle vaut l'intégrale du rotationnel).
426/2001
Sciences.ch 14/03/2005
ALGÈBRE LINÉAIRE
Nous avons étudié dans le chapitre de calcul algébrique comment déterminer l'intersection (si
elle existe) de l'équation de deux droites (nous pouvons étendre le problème bien évidemment
à plus de deux) dans données par :
et
où .
Cependant, il existe une autre manière de présenter le problème comme nous l'avons vu en
algorithmique. Effectivement, nous pouvons écrire le problème sous la forme d'un "bloc"
d'équations :
Cette écriture s'appelle comme nous l'avons présenté dans le chapitre d'algorithmique (section
analyse numérique) un "système linéaire" que nous pouvons résoudre par en soustrayant ou en
addition les lignes entre elles (l'ensemble des solutions étant toujours égal), ce qui nous
donne :
427/2001
Sciences.ch 14/03/2005
Nous allons nous intéresser dans une partie ce chapitre à la deuxième méthode qui nous
permettre à l'aide des outils vus dans le chapitre de calcul vectoriel de résoudre les
intersection non plus d'une ou plusieurs droites mais d'une ou plusieurs droits, plans,
hyperplans dans respectivement .
Il y a cependant une condition à remplir : comme nous l'avons vu dans l'exemple précédent,
nous ne pourrions pas résoudre un système d'équations à deux inconnues si nous n'avons
qu'une seule équation. C'est la raison pour laquelle il faut et il suffit pour un système
d'équation à inconnues avoir au moins équations. Ainsi, nous parlons de : "systèmes de
équations à inconnues" et comme nous le verrons plus loin, ceci implique trivialement
d'avoir une matrice carrée (le concept de "matrice" sera défini un peu plus loin). Nous verrons
aussi que pour un tel système ait des solutions non toutes nulles, il faut que nous ayons un
déterminant de la matrice qui soit nul (le concept de "déterminant" sera défini plus loin) et
donc que la matrice soit inversible.
SYSTÈMES LINÉAIRES
Nous appelons donc "système linéaire", ou simplement système, toute famille d'équations de
la forme :
où chaque ligne représente l'équation d'une droite, plan ou hyperplan (voir le chapitre de
géométrie chapitre pour la détermination de l'équation d'un hyperplan) et les "coefficients
du système", les "coefficients du second membre" et les les "inconnues du système".
Si les coefficients du second membre sont tous nuls, nous disons que le système est
"homogène". Nous appelons "système homogène associé" au système, ce même système que
nous obtenons en substituant des zéros au coefficient du second membre.
Rappels :
- L'équation d'une droite (voir chapitre d'analyse fonctionnelle) est donnée par :
en posant .
428/2001
Sciences.ch 14/03/2005
- L'équation d'un plan (voir chapitre de géométrie spatiale dans la section de géométrie) est
donnée par :
en posant .
- L'équation d'un hyperplan est très facilement (si vous ne voyez pas comment faites le nous
savoir nous le préciseront) généralisable à partir de la démonstration de celle du plan et nous
obtenons ainsi :
en posant
Résoudre un système signifie trouver l'ensemble des solutions de ce système. Deux systèmes
à inconnues sont dits "équivalents" si toute solution de l'un est solution de l'autre,
autrement dit, s'ils admettent le même ensemble de solutions. Nous disons parfois que les
équations d'un système sont "compatibles" ou "incompatibles", suivant que ce système admet
au moins une solution ou n'en admet aucune.
Nous pouvons également donner bien sûr une interprétation géométrique à ces systèmes.
Supposons que les premiers membres des équations du système soient non nuls. Alors, nous
savons que chacune de ces équations représente un hyperplan d'un espace affine (voir le
chapitre de calcul vectoriel) de dimension . Par conséquent, l'ensemble des solutions du
système, regardé comme ensemble de -uplets de coordonnées, représente une intersection
finie d'hyperplans.
MATRICES
Nous appelons "matrice" à et lignes et colonnes, ou "matrice de type " (le premier
terme correspond toujours aux lignes et le second aux colonnes, pour s'en souvenir il existe un
bon moyen mnémotechnique : le président LinColn – abréviation de Ligne et Colonne…),
429/2001
Sciences.ch 14/03/2005
ou simplement par .
Le nombre est appelé "terme ou coefficients d'indices ". L'indice étant appelé "indice
de ligne" et l'indice "indice de colonne".
Nous notons l'ensemble des matrices dont les coefficients prennent leurs
valeurs dans (pouvant être ou par exemple).
Lorsque , nous disons que est une "matrice carrée" d'ordre . Dans ce cas, les
termes sont appelées "termes diagonaux".
Nous appelons également une matrice à une seule ligne "matrice-ligne" et une matrice à une
seule colonne "matrice-colonne". Il est claire qu'une matrice colonne n'est rient d'autre qu'un
"vecteur-colonne". Par la suite, les lignes d'une matrice seront assimilées à des matrices-lignes
et les colonnes à des matrices-colonnes.
L'intérêt de la notion de matrice apparaître tout au long des textes qui vont suivre mais la
raison d'être immédiate de cette notion est simplement de permettre à certaines familles finies
de nombres d'être conçues sous la forme d'un tableau rectangulaire.
Nous assignerons aux matrices des symboles propres, à savoir les lettre latines majuscules :
et aux matrices-colonnes des symboles à savoir les lettres minuscules vectorielles
; nous les appellerons d'ailleurs indifféremment matrices-colonnes ou vecteurs-
colonnes.
Nous appelons "matrice nulle", et nous la notons , toute matrice dont chaque terme est nul.
Les matrices-colonnes sont également désignées par le symbole vectoriel : .
Nous appelons "matrice unité d'ordre ", et nous notons , ou simplement , la matrice
carrée d'ordre :
430/2001
Sciences.ch 14/03/2005
Nous verrons plus loin que la matrice nulle joue le rôle d'élément neutre de l'addition
matricielle et la matrice unité d'élément neutre de la multiplication matricielle.
Nous allons maintenant revenir brièvement sur la définition de "rang d'une famille finie" que
nous avons vu en calcul vectoriel.
Rappel : nous appelons "rang" d'une famille de vecteurs la dimension du sous-espace vectoriel
de qu'elle engendre.
Ainsi, soit les colonnes d'une matrice , nous appelons "rang de ", et nous
notons , le rang de la famille .
Dans un langage un peu plus familier (…) le rang d'une matrice est donné par le nombre de
matrice-colonnes qui ne peuvent s'exprimer par la combinaison et la multiplication par un
scalaire d'autres matrices-colonnes de la même matrice.
Remarque : s'il a y des difficultés à déterminer le rang d'une matrice il existe un technique
"d'échelonnage" des matrices que nous allons voir plus tard qui permet d'effectuer ce travail
très rapidement.
c'est-à-dire la matrice dont les termes sont les coefficients du système. Nous appelons
"matrice du second membre du système linéaire", ou simplement "second membre du
système", la matrice-colonne dont les termes sont les coefficients du second membre
de ce système. Nous appelons également "matrice augmentée associée au système" la matrice
obtenue de en ajoutant comme -ième colonne.
431/2001
Sciences.ch 14/03/2005
Maintenons rappelons un théorème que nous avons vu en calcul vectoriel : pour que le rang
d'une famille de vecteurs soit égal au rang de la famille augmentée
, il faut et il suffit que le vecteur soit combinaison linéaire des vecteurs
.
Il s'ensuit que notre système linéaire sous forme vectorielle admet au moins une solution
si le rang de la famille est égal au rang de la famille augmentée
et cette solution est unique si et seulement si le rang de la famille
est .
Ainsi, pour qu'un système linéaire de matrice associée et de second membre admette au
moins une solution, il faut et il suffit que le rang de soit égal au rang de la matrice
augmentée . Si cette condition est remplie, le système admet une seule solution si et
seulement le rand de est égal au nombre d'inconnues autrement dit, les colonnes de sont
linéairement indépendantes.
Nous disons qu'une matrice est "échelonnée" si ses lignes satisfont aux deux conditions
suivantes :
C2. L'indice de colonne du premier terme non nul de toute linge non nulle est supérieur à
l'indice de colonne du premier terme non nul de la linge qui la précède.
Remarque : il est évident que les matrices nulles et les matrices unités sont échelonnées.
432/2001
Sciences.ch 14/03/2005
de cet espace vectoriel. En considérant les autres colonnes également comme des vecteurs-
colonnes de , nous en déduisons qu'elles sont nécessairement combinaison linéaire de
celles d'indice et donc que le rang de la matrice échelonnée est .
Nous noterons que est aussi le nombre de lignes non nulles la matrice échelonnée et
également le rang de la famille des lignes de cette matrice, puisque les lignes non nulles sont
dès lors manifestement indépendantes.
Nous pouvons dès lors nous autoriser un certain nombre d'opérations élémentaires
(supplémentaires) sur les lignes des matrices qui nous seront fort utiles et ce, sans changer son
rang :
Remarque : la matrice est juste une représentation graphique esthétique d'un système linéaire.
Ainsi, permuter deux lignes ne change aucunement le système.
Toute matrice peut être transformée en matrice échelonnée par une suite finie d'opérations de
type P1, P2, P3. C'est cette technique que nous utilisons dans le chapitre traitant des
algorithmes pour résoudre les systèmes linéaires.
Il est donc évident que les opérations élémentaires sur les lignes d'une matrice ne modifient
pas le rang de la famille des lignes de cette matrice. Or, nous avons observé que le rang de la
famille des lignes d'une matrice échelonnée est égal au rang de la famille des colonnes, c'est-
à-dire au rang de cette matrice. Nous en concluons que le rang de n'importe quelle matrice de
type est également le rang de la famille des lignes de cette matrice.
Rappelons que nous avons vu lors de notre étude du calcul vectoriel que les opérations de
433/2001
Sciences.ch 14/03/2005
multiplication d'un vecteur par un scalaire, d'addition ou soustraction de vecteurs entre eux et
l'opération de produit scalaire formait dans le sens ensembliste du terme un "espace
vectoriel" (voir le chapitre de théorie des ensembles) possédant ainsi aussi une "structure
algébrique vectorielle". Ceci sous la condition que les vecteurs aient bien sûr les mêmes
dimensions (ce constat n'étant pas valable si au lieu du produit scalaire nous prenions le
produit vectoriel).
Au même titre que les vecteurs, nous pouvons multiplier une matrice par un scalaire et
additionner celles-ci entre elles (tant qu'elles ont les mêmes dimensions…) mais en plus, nous
pouvons aussi multiplier deux matrices entre elles sous certaines conditions que nous
définirons ci-après. Cela fera également de l'ensemble des matrices dans le sens ensembliste
du terme, un espace vectoriel sur le corps et possédant ainsi aussi une "structure algébrique
vectorielle".
Ainsi, un vecteur pourra aussi être vu comme une matrice particulière de dimension
et s'opérer dans l'espace vectoriel des matrices. En gros…, le calcul vectoriel
n'est qu'un cas particulier de l'algèbre linéaire.
Définitions :
De ses deux définitions nous pouvons donc effectivement conclure que l'espace/ensemble des
matrices est bien un espace vectoriel et possède ainsi une "structure algébrique vectorielle".
et
et
434/2001
Sciences.ch 14/03/2005
En notant par des lettres latines majuscules les matrices et par les lettres grecques minuscules
les scalaires, le lecteur vérifiera aisément (nous pouvons rajouter les démonstration sur
demande) les relations :
TYPE DE MATRICES
D1. Soit une matrice carrée (c'est-à-dire ). La matrice est dite "inversible"
ou "régulière" si et seulement s'il est telle que :
où
Cette définition est fondamentale !!!! Elle a des conséquences extrêmement importantes dans
tout l'algèbre linéaire (résolution de système linéaires, déterminant, vecteurs et valeurs
propres, etc.) !!!!
D2. Soit :
435/2001
Sciences.ch 14/03/2005
Remarque :
Quelques relations utiles y relatives (dont nous pouvons rajouter les démonstrations détaillées
sur demande) :
D3. Soit :
Remarques :
R1. Nous appelons "comatrice" de la matrice , la transposée de son adjointe (et nous
pouvons continuer ainsi longtemps...)
R2. Relation triviale (qui sera souvent utilisée en physique quantique des champs) :
436/2001
Sciences.ch 14/03/2005
D4. Par définition, une matrice est dite "matrice hermitique" ou "matrice self-adjoine" si elle
est égale à son adjointe tel que :
D5. Soit une matrice carrée de , la trace de , notée est définie par :
Quelques relations utiles y relatives (dont nous pouvons rajouter les démonstration détaillées
sur demande) :
D6. Une matrice est dite "nilpotent" si en la multipliant successivement par elle-même elle
peut donner zéro. En clair, s'il existe un entier tel que :
Remarque : pour se souvenir de se mot, nous le décomposons en "nil" pour nulle et "potent"
pour potentiel. Ainsi, quelque chose de nilpotent est donc quelquechose qui est
potentiellement nul.
D7. Une matrice est dite "matrice orthogonale" si ses éléments sont réels et si elle obéit à :
Les vecteurs colonnes de la matrices sont donc normés à l'unité et orthogonaux entre eux.
D8. Soit une matrice carrée. La matrice est dite "matrice symétrique" si et
seulement si :
437/2001
Sciences.ch 14/03/2005
D9. Soit une matrice carrée. La matrice est dite "matrice anti-symétrique" si
et seulement si :
D10. Soit Soit une matrice carrée. La matrice est dite "matrice triangulaire
supérieure" si et seulement si :
D11. Soit Soit une matrice carrée. La matrice est dite "matrice triangulaire
inférieure" si et seulement si :
D13. Soit , une matrice carrée. La matrice est dite "matrice diagonale" si et
seulement si :
438/2001
Sciences.ch 14/03/2005
Soit :
Remarques :
R1. Si lorsqu'un vecteur est donné et que sa base n'est pas spécifiée, c'est qu'ils s'agit dès lors
implicitement de la base canonique :
qui laisse invariant la multiplication par un vecteur quelconque et lorsque la base utilisée est
notée et n'est pas spécifiée, c'est qu'il s'agit également de la base canonique.
R2. Si un vecteur est donnée par rapport à la base canonique, ces composantes sont dites
"covariantes", dans le cas contraire, où si elles sont exprimées après suite dans une autre base
non canonique, alors nous disons que les composantes sont contravariantes (pour plus de
précisions sur le sujet voir le chapitre de calcul tensoriel).
DÉTERMINANTS
439/2001
Sciences.ch 14/03/2005
Nous allons nous intéresser aux déterminants dans le point de vue du physicien (celui de
mathématicien étant assez rébarbatif...). Fréquemment, en physique, que ce soit en mécanique
ou physique quantique des champs, nous aurons fréquemment des systèmes linéaires à
résoudre. Or, nous avons vu maintenant qu'un système linéaire :
et nous savons que les seuls systèmes linéaires résolubles sont ceux qui ont autant d'équations
que d'inconnues. Ainsi, la matrice doit être une matrice carrée .
Si une solution existe, il existe alors une matrice-colonne (ou "vecteur") tel que
ce qui implique :
Qu'impose cette relation ? Eh bien c'est simple mais à la fois très important : pour qu'un
système linéaire ait une solution, il faut que le la matrice soit inversible ! Quel rapport avec
le déterminant alors ? C'est simple : les mathématiciens ont cherché comment s'écrivaient les
inverses des matrices de systèmes linéaires dont ils savaient qu'ils y avait une solution et ils
sont arrivés après tâtonnements à déterminer une sorte de formule qui permette de vérifier si
la matrice est inversible ou non. Une fois cette formule trouvée, ils ont formalisé (comme ils
savent si bien le faire…), avec un très bonne rigueur, le concept entourant cette formule qu'ils
ont appelé "détérminant". Ils y sont tellement bien arrivés d'ailleurs qu'on oublie parfois qu'ils
ont procédé ainsi….
Remarque : si une matrice d'un système linéaire n'est pas inversible, cela a pour conséquence
qu'il existe soit aucune solution, soit une infinité de solutions (comme à l'habitude quoi…)
Dans ce qui suit tous les espaces vectoriels considérés sont de dimension finie et sur le corps
des nombres complexes (ceux qui le préfèrent pourront prendre comme corps de base,
de fait nous pourrions prendre un corps quelconque).
440/2001
Sciences.ch 14/03/2005
D'abord nous allons faire un petit peu de mathématique (un peu rébarbative) avant de passer à
du concret.
Définitions :
D1. Une "application multilinéaire" sur un espace est par définition une application
qui est linéaire en chacune de ces composantes. C'est-à-dire :
Remarque : une application multilinéaire non nulle n'est pas une application linéaire de
l'espace dans . Sauf si . Effectivement, cela se vérifie de par la définition de
l'application linéaire versus celle de l'application multilinéaire :
D2. Une "application multilinéaire alternée" sur est par définition une application
multilinéaire qui vérifie la condition suivante:
441/2001
Sciences.ch 14/03/2005
D3. Un "déterminant" est par définition (par imposition) une application multilinéaire alternée
vérifiant de plus :
Remarque : les colonnes d'une matrice carrée forment vecteurs et nous voyons donc qu'un
déterminant sur induit une application de (où est l'espace des
matrices carrées à coefficients dans ) définie par où est la i-
ème colonne de . Par la suite, nous ferons l'abus d'écriture qui consiste à confondre et .
En fait, nous venons de montrer que si un déterminant existe, il est unique et de la forme
indiquée ci-dessus, il faudrait encore vérifier que l'application ainsi définie satisfait les
propriétés d'un déterminant, mais ce dernier point est immédiat.
442/2001
Sciences.ch 14/03/2005
Nous retrouvons donc la forme du déterminant tel que nous en avons fait mention en calcul
vectoriel.
et
Si alors :
et donc :
Ainsi le déterminant représente au signe près l'aire du parallélogramme défini par les vecteurs
lorsque ceux-ci sont linéairement indépendants. Nous pouvons généraliser ce résultat à
une dimension quelconque, en particulier, pour , le déterminant de trois vecteurs
linéairement indépendants représente le volume du parallélépipède défini par ces derniers.
Le cas plus général de l'expression du déterminant est un peu plus délicate à établir. Il faut
pour cela que nous définissions une application bijective particulière mais simple que nous
443/2001
Sciences.ch 14/03/2005
Nous disons que la permutation est pair (impair) si est pair (impair). Nous appelons
"signature de ", le nombre noté défini par , c'est-à-dire :
Nous avons maintenant les outils en place nécessaire à définir de manière générale la formule
du déterminant :
Exemples :
444/2001
Sciences.ch 14/03/2005
Nous calculons les signatures de . Voici le schéma de cette règle (rappel : nous disons
donc… qu'il y a "inversion", si dans une permutation, un entier supérieur précède un entier
inférieur) :
Nombre
0 1
d'inversions
Permutation Paire Impaire
+1 -1
Nous calculons les signatures de . Voici le schéma de cette règle (rappel : nous disons
donc… qu'il y a "inversion", si dans une permutation, un entier supérieur précède un entier
inférieur) :
Nombre
0 1
d'inversions
Permutation Paire Impaire
+1 -1
445/2001
Sciences.ch 14/03/2005
Nous calculons les signatures de . Voici le schéma de cette règle (rappel : nous disons
donc… qu'il y a "inversion", si dans une permutation, un entier supérieur précède un entier
inférieur) :
+1 -1 -1 +1 +1 -1
P1. Soit une matrice carrée d'ordre , nous ne changeons pas la valeur du
déterminant de en :
446/2001
Sciences.ch 14/03/2005
Pour ce qui est des opération élémentaires sur les lignes il suffit de considérer la transposée
(c'est à pleurer tellement c'est simple).
P3. Soit une matrice carrée d'ordre . Nous changeons le signe du déterminant de
si :
447/2001
Sciences.ch 14/03/2005
La démonstration peut se faire de deux manières, la première est assez indigeste et abstraite
nous la laisserons aux mathématiciens (…) même si elle a l'avantage d'être générale, la
seconde plus simple, consiste à vérifier cette assertions pour différentes matrices carrées.
Exemple :
Les calculs donnent donc des résultant qui sont bien identiques. Nous pouvons vérifier ainsi
pour des matrices carrées de dimensions supérieures.
Il s'agit de la propriété la plus importante des matrices dans le cadre de la physique théorique
car si est un système linéaire, le calcul de son déterminant permet de savoir si celui-ci a des
solutions uniques. Dans le cas contraire, comme nous en avons déjà fait mention, soit le
système a aucune solution, soit une infinité !
448/2001
Sciences.ch 14/03/2005
part à ce qui bien évidemment ne nous satisfait pas. La seule solution est alors de se
débrouiller pour que les coefficient de la matrice soient tels que sont déterminant soit
nul et donc la matrice non inversible ! L'intérêt ? Eh, bien d'avoir une infinité de solutions
possibles (de donc !) qui satisfont . Nous aurons besoin de cette méthodologie en
mécanique quantique ondulatoire, lorsque nous déterminerons l'existence des anti-particules
par l'intermédiaire de l'équation de Dirac linéarisée. Il faudra donc s'en rappeler.
P6. Deux matrices "conjuguées" (attention, pas dans le sens complexe du terme) ont le même
déterminant.
Démonstration :
Démonstration : ben… c'est la même chose que pour la propriété précédente mais sans les
valeurs conjuguées… De fait, nous montrons de la même manière, la même propriété pour
.
449/2001
Sciences.ch 14/03/2005
en effaçant la i-ème ligne et la j-ème colonne. appartient donc à . Alors pour tout
:
Il est facile de voir que est multilinéaire (il suffit de considérer comme une
simple constante et ensuite par extension de la définition du déterminant… trop facile…).
Montrons cependant qu'elle est alternée (dans ce cas, c'est un déterminant qui a toutes les
propriétés d'un déterminant) :
Nous avons premièrement (c'est obligatoire de par la définition) si nous n'effaçons aucune des
colonnes étant ou :
si
Donc
C'est donc OK. Elle est alternée et multilinéaire, il s'agit donc bien d'un déterminant.
Nous venons donc de montrer que est un déterminant et par unicité nous a
pour tout .
450/2001
Sciences.ch 14/03/2005
avec
Pour finir nous terminons en donnant une formule qui relie les coefficients de l'inverse d'une
matrice avec ces mineurs d'ordre .
451/2001
Sciences.ch 14/03/2005
Si nous posons :
nous obtenons :
452/2001
Sciences.ch 14/03/2005
et
Ce résultat, finalement assez simple, nous sera utile en calcul tensoriel, pour construire les
outils nécessaires à l'étude de la relativité générale et à la détermination de l'équation
d'Einstein des champs. Il convient donc de s'en rappeler.
CHANGEMENTS DE BASE
Supposons que nous passions d'une base d'un espace à une autre base
de ce même espace.
453/2001
Sciences.ch 14/03/2005
ou
Remarque : la matrice est inversible, car ses colonnes sont linéairement indépendantes (ce
sont les vecteurs décomposés dans la base et les sont linéairement indépendants car
ils forment une base).
Démonstration : prenons pour simplifier le cas (la démonstration étant très facilement
généralisable) avec et .
Nous avons donc et nous cherchons à exprimer dans la base tel que .
Nous allons chercher l'application linéaire qui relie ces deux relations telles que :
d'où :
c'est-à-dire :
454/2001
Sciences.ch 14/03/2005
D'autre part, nous avons (ce que nous avons démontré tout à l'heure) :
Dès lors :
d'où :
et comme nous l'avons vu dans notre étude du déterminant, les déterminants de sont
égaux et donc invariants.
Définition : une valeur propre est par définition (nous retrouvons cette définition dans
l'introduction a l'algèbre quantique dans le cadre du chapitre de physique quantique
ondulatoire) une valeur appartenant à un corps tel que soit une matrice carrée
nous avons :
Ainsi, l'ensemble des valeurs propres d'une matrice est appelé "spectre de "
et satisfait au système homogène :
où est une matrice de diagonale unité aussi notée et qui admet une solution non nulle si
et seulement si (nous verrons de nombreux exemples en physique) :
455/2001
Sciences.ch 14/03/2005
P7. Terminons en donnant une relation qui relie les coefficients de l'inverse d'une matrice
avec ces mineurs d'ordre (nous allons utiliser cette relation un peu plus loin) :
Ainsi :
456/2001
Sciences.ch 14/03/2005
c'est-à-dire :
457/2001
Sciences.ch 14/03/2005
CALCUL TENSORIEL
Le calcul vectoriel classique est une technique simple et efficace qui s'adapte parfaitement à
l'étude des propriétés mécaniques et physiques de la matière dans l'espace euclidien à trois
dimensions. Cependant, dans de nombreux domaines de la physique, il apparaît des grandeurs
expérimentales qui ne peuvent plus être facilement représentées par de simples vecteurs-
colonnes d'espaces vectoriels euclidiens. C'est le cas par exemple en mécanique des milieux
continus, fluides ou solides, en électromagnétisme, relativité générale, etc.
Ainsi, dès la fin du 19ème siècle, l'analyse des forces qui s'exercent à l'intérieur d'un milieu
continu à conduit à mettre en évidence des grandeurs physique caractérisées par neuf
nombres représentant les forces de pression ou de tension internes. La représentation de ces
grandeurs nécessita l'introduction d'un nouvel être mathématique qui fut appelé "tenseur", par
référence à son origine physique (au fait, il s'agit de matrice sur lesquelles nous définissons
des opérations mathématiques propres au domaine de la physique). Par la suite, à partir de
1900, ce furent R. Ricci et T. Lévi-Civita qui développèrent le calcul tensoriel; puis l'étude
des tenseurs permit un approfondissement de la théorie des espaces vectoriels et contribua au
développement de la géométrie différentielle.
Nous conseillons par ailleurs vivement au lecteur de bien maîtriser les bases du calcul
vectoriel et de l'algèbre linéaire comme elles ont été présentées auparavant. Au besoin, nous
avons choisi lors de la rédaction de ce chapitre de revenir sur certains points vus en calcul
vectoriel (composantes covariantes, contravariantes,...). Si le lecteur à déjà parcouru l'étude
des équations de Navier-Stokes (mécanique des milieux continus) ceci constituera un petit
avantage pratique avant de parcourir ce qui va suivre.
Nous ne ferons que très peu d'exemples pratique dans cette section. Effectivement les
exemples concrtets viendront lorsque nous étudierons la mécanique des milieux continus, la
relativité générale, la physique quantique des champs, etc...
Un conseil peut-être : pensez matriciel, écrivez tensoriel ! (vous comprendrez mieux ce petit
adage une fois après avoir parcouru tout ce chapitre).
NOTATION INDICIELLE
458/2001
Sciences.ch 14/03/2005
Nous utilisons également des indices supérieurs, selon les besoins; par exemple, .
Afin d'éviter toute confusion avec l'écriture des puissances, la quantité à la puissance
sera écrite . Lorsque le contexte écarte tout risque d'ambiguïté, l'utilisation des
parenthèses n'est cependant pas fondamentalement nécessaire.
En calcul tensoriel il existe une convention de sommation qui consiste à utiliser le fait que
l'indice répété, ici l'indice , va devenir lui-même l'indication de la sommation. Nous écrivons
alors, avec cette convention :
Nous écrirons (remarquez bien comment s'écrivent les composants de la matrice associée) :
Nous voiyons sur cet exemple, combien la convention de sommation permet une écriture
condensée et donc puissante.
En résumé, tout expression qui comporte un indice deux fois répété représente une somme sur
toutes les valeurs possibles de l'indice répété.
La convention de sommation s'étend au cas où figurent plusieurs indices dits "muets" dans un
même monôme. Soit par exemple, la quantité , celle-ci représente la somme suivante
pour et prenant les valeurs de 1 à 2:
459/2001
Sciences.ch 14/03/2005
Ainsi, nous voyons facilement qu'un expression avec deux indices de sommation qui prennent
respectivement les valeurs comportera termes; s'il y a trois indices, de
sommation etc.
Il faut faire cependant attention aux substitutions avec ce genre de notation car si nous
supposons que nous avons la relation:
avec
car cela ne revient pas à la même expression après développement puisque les indices muets
sont systématiquement sommés de manières identiques et rigides (nous laissons au lecteur le
soin de faire ce petit exercice de style).
SYMBOLE DE KRONECKER
Lors d'une sommation portant sur deux indices muets, le symbole de Kronecker annule tous
les termes où les indices ont des valeurs différentes. Par exemple:
SYMBOLE D'ANTISYMÉTRIE
Une autre symbole fort utile est le "symbole d'antisymétrie" que nous retrouverons
fréquemment en relativité générale. Dans le cas où prennent l'une des valeurs le
symbole d'antisymétrie aura les valeurs définies suivantes:
460/2001
Sciences.ch 14/03/2005
- , si les indices sont dans un ordre qui provient d'un nombre impair de permutations
par rapport à l'ordre initial des indices.
En utilisant ce symbole, un déterminant d'ordre deux (voir algèbre linéaire) s'écrit alors sous
la forme avantageuse :
où bien sûr, et sont sommés et où l'indice muet est le numéro de la ligne du vecteur
résultant (en cas de demande nous ferons les développements). En particulier, le rotationnel
d'un champ vectoriel est alors :
où à nouveau, l'indice muet est le numéro de la ligne du vecteur résultant (en cas de
demande nous ferons les développements).
Comme de par la théorème de Schwarz est symétrique dans les indices et que est
anti-symétrique (par définition) dans les mêmes indices, la somme sur et doit
nécessairement s'annuler. Par exemple, la contribution à la somme du terme est
l'opposée de celle de .
Remarque : le symbole d'antisymétrie est très souvent appelé "tenseur de Levi-Civita" dans la
littérature. Au fait, bien que ce soit bien un tenseur sous la forme de ses notations, il s'agit
plus d'un outil mathématique qu'un "être" mathématique d'où la préférence de certains
physiciens de le nommer "symbole" plutôt que "tenseur". Mais c'est à vous de voir...
461/2001
Sciences.ch 14/03/2005
et
et il est évident qu'îl est fort plus sympathique d'écrire cela sous la forme :
Un vecteur quelconque de peut être décomposé (nous l'avons déjà vu) sur chaque base
de sous la forme:
Si nous cherchons les relations entre les composantes et il suffit de reprendre les
relations de changement de base et nous avons alors (cela revient à faire de l'agèblre linéaire):
De suite par l'unicité de la décomposition d'un vecteur sur une base, nous pouvons égaler les
coefficients des vecteurs de base et nous obtenons (il faut prendre garde a ré-arranger à
nouveau l'ordre des termes que la multiplication matricielle n'est pas commutative comme
nous le savons déjà) :
et
Quant au produit scalaire les résultats obtenus avec la notation indicielle sont forts
intéressants et extrêmement puissants. Nous avons déjà défini le produit scalaire en calcul
vectoriel mais voyons comment l'on manipule ce dernier avec la notation indicielle:
462/2001
Sciences.ch 14/03/2005
avec évidemment:
Remarque: lorsque les vecteurs de base forment un espace vectoriel orthogonal (pas
nécessairement orthonormé) alors les quantités:
ou encore à :
MÉTRIQUE ET SIGNATURE
Comme nous l'avons vu en calcul vectoriel, le produit scalaire d'un vecteur peut permettre
de définir la notion de norme d'un vecteur (et le concept de distance).
Rappellons que nous avons par définition la norme d'un vecteur qui est donnée par:
où les nombres définissent en quelque sorte une "mesure" des vecteurs; nous disons alors
dans le langage du calcul tensoriel qu'ils constituent la "métrique" de l'espace vectoriel choisi.
Dans l'espace de la géométrie classique, la norme est un nombre qui est toujours strictement
positif et qui ne devient nul que si le vecteur mesuré est égal à zéro. Par contre, l'expression
précédente de la norme d'un vecteur, peut être éventuellement négative pour des nombres
quelconques (espaces complexes par exemple). Nous pouvons donc distinguer
deux genres d'espaces vectoriels pré-euclidiens (espace euclidien dans lequel nous avons
463/2001
Sciences.ch 14/03/2005
défini le produit scalaire) selon que la norme est positive ou non. Cependant lorsqu'en
physique théorique nous souhaitons faire l'analogisme avec une structure d'espace vectoriel il
faut que la condition :
soit satisfaite ( peut être écrit comme une matrice, rien ne nos l'empêche).
cela implique (c'est une des propriétés de la norme que nous avons vu en calcul
vectoriel). Nous pouvons alors écrire:
Nous nous retrouve ici simplement avec un système de équations à inconnues (ne
devant admettre par hypothèse que la solution ), il faut et il suffit pour cela que le
déterminant du système, noté , du système soit différent de zéro (voir le chapitre d'algèbre
linaire); nous devons donc avoir:
C'est une des conditions pour qu'une expression assimilable à une norme sous une écriture
tensorielle forme dans le cadre d'une théorie physique un espace vectoriel des états du
système !!
Jusqu'à maintenant nous avons écrit les indices muets arbitrairement en exposant ou en indice
selon notre vouloir. Cependant, cela n'est pas toujours autorisé et parfois le fait qu'un indice
muet soit en exposant ou en indice à une signification bien particulière. Ceci constitue souvent
la difficulté lors de l'étude de certains théorèmes, car si nous n'étudions pas ceux-là depuis le
début, nous ne savons pas vraiment comme interpréter la position des indices muets. Il faut
donc être extrêmement prudent à ce niveau.
Pour un espace vectoriel euclidien rapporté à une base quelconque , le produit scalaire
464/2001
Sciences.ch 14/03/2005
Donc :
Cette relation est de première importance en physique théorique et en calcul tensoriel. Il est
important de s'en souvenir pour lorsque nous étudierons la contraction des indices plus tard
(vous pouvez observer dans la relation précédente que nous avons "abaissé" l'indice des
composantes du membre droit de l'égalité).
Ces produits scalaires notés , s'appellent les composantes "covariantes", dans la base ,
du vecteur . Ces composantes sont donc définies par:
Remarque : cela constitue une projection d'un vecteur sur un des vecteurs de sa propre base
Elles seront notées au moyen d'indices inférieurs !!! Nous verrons par la suite que ces
composantes s'introduisent naturellement pour certains vecteur de la physique, par exemple le
vecteur gradient. D'autre part, la notion de composante covariante est essentielle pour les
tenseurs.
Remarque: les vecteurs de base ont toujours les indices notés en bas car ils sont leurs propres
composantes covariantes (ils se projettent sur eux-mêmes par produit scalaire).
Les relations précédentes montrent que les composantes covariantes sont liées aux
composantes classiques. Pour les distinguer, ces dernières sont appelées les composantes
"contravariantes" du vecteur . Les composantes contravariantes sont donc des nombres
tels que:
Elles seront indiquées au moyen d'indices supérieurs !! L'étude des changements de base
permettra de justifier encore plus l'appellation des différentes composantes.
Dans une base orthonormée canonique (cas très particulier), les composantes covariantes et
contravariantes sont identiques puisque nous avons effectivement :
465/2001
Sciences.ch 14/03/2005
Remarque : nous voyons ci-dessus, que l'écriture incéssante d'indice muets en exposants ou en
indice peut parfois amener à certaines confusiosn et à des maux de tête sérieux (c'est la plus
grande difficulté du calcul tensoriel à notre avis).
L'intérêt du physicien pour le calcul tensoriel, est le passage de paramètres d'une base à une
autre pour des raisons données (souvent dans le but soit de simplifier l'étude de problèmes ou
simplement parce que les états étudiés dépendant - ou peuvent dépendre - de la géométrie de
l'espace dont il est question). Il convient donc d'introduire les principaux outils qui y sont
relatifs.
La paramètre étant déterminé, nous obtenons le vecteur qui est orthogonal à et non
nul puisque le système est linéairement indépendant.
466/2001
Sciences.ch 14/03/2005
Dans le cas où certains vecteurs seraient tels que (leur norme est nulle), nous
remplaçons par , en choisissant un vecteur de telle sorte que nous
obtenions .
Nous en déduisons donc que tout espace vectoriel pré-euclidien admet des bases
orthogonales!
Ce système de calcul des bases est de première importance, il permet par exemple d'étudier
des systèmes physiques à partir d'un référentiel pré-euclidien dont les propriétés changent
dans le temps. Ce qui est par exemple typique de la relativité générale (pour donner l'exemple
le plus impressionnant…).
CHANGEMENTS DE BASE
et
et
467/2001
Sciences.ch 14/03/2005
Nous remarquons que les relations de transformation des composantes contravariantes sont le
contraire des vecteurs de base, les grandeurs et s'échangeant, d'où l'origine de
l'appellation "contra"-"variantes" de ces composantes.
et
Nous remarquons que les composantes covariantes se transforment comme les vecteurs de
bases, d'où l'appellation de ces composantes.
BASES RÉCIPROQUES
Soit une base quelconque d'un espace vectoriel euclidien . Par définition, vecteurs
qui vérifient les relations suivantes:
sont appelés les "vecteurs réciproques" des vecteurs . Ils seront notés avec des indices
supérieurs. Par définition, chaque vecteur réciproque se doit donc d'être orthogonal à tous
les vecteur , sauf pour .
Montrons que les vecteurs réciproques d'une base donnée sont linéairement
indépendants. Pour cela, il faut montrer qu'une combinaison linéaire donne un vecteur
nul, si et seulement si chaque coefficient est nul.
468/2001
Sciences.ch 14/03/2005
Cette dernière égalité devant être vérifiée quels que soient les , il est nécessaire que chaque
soit nul et ainsi les vecteurs sont donc linéairement indépendants (fallait déjà avoir
l'idée de procéder ainsi n'est-ce pas?).
Le système de vecteurs réciproques forme donc une base appelée la "base réciproque" de
l'espace vectoriel .
Exemple (d'habitude nous nous opposons aux exemples mais ici les implications sont
intéressantes):
Soit trois vecteurs formant une base (non nécessairement orthonormée) d'un espace
vectoriel euclidien. Nous décidons de noter :
où, rappelons-le, le symbole représente le produit vectoriel (au cas oùi il y aurait un petit
oubli...). Les vecteurs suivants:
TENSEURS EUCLIDIENS
Pour le physicien théoricien, le calcul tensoriel s'intéresse en premier lieu à la manière dont
les composantes des tenseurs se transforment lors d'un changement de base des espaces
vectoriels dont ils sont issus. Nous commencerons donc à étudier ces propriétés vis-à-vis des
changements de base (car c'est le cas le plus intéressant).
Un tenseur est, en pratique, souvent uniquement défini et utilisé sous la forme de ses
composantes. Ces dernières peuvent être exprimées sous forme covariante ou contravariante
comme pour tout vecteur. Mais un nouveau type de composantes va apparaître pour les
tenseurs, ce sont les "composantes mixtes". Ces trois types de composantes constituent des
décompositions des tenseurs euclidiens sur des bases différentes.
TENSEUR FONDAMENTAL
Au cours de la théorie vu précédemment, nous avons utilisé les quantités , définies à partir
du produit scalaire des vecteurs de base d'un espace vectoriel pré-euclidien à
dimensions, par:
469/2001
Sciences.ch 14/03/2005
Ces quantités constituent les composantes covariantes d'un tenseur appelé le "tenseur
fondamental" ou "tenseur métrique".
Etudions comment varient les quantités lorsque nous effectuons un changement de base :
Soit une autre base liée à la précédente par les relations connues:
et
Dans la nouvelle base , les produits scalaires des vecteurs de base sont donc des quantités
telles que:
Nous avons donc finalement pour l'expression des composantes covariantes lors d'un
changement de base:
De manière générale, une suite de quantités qui se transforment, lors d'un changement
de base de , selon les deux relations précédentes, à savoir:
et
constituent, par définition, les "composantes covariantes d'un tenseur d'ordre deux" (à deux
indices) sur .
Nous pouvons ainsi manipuler des quantités exprimant les propriétés intrinsèques des bases
comme des tenseurs normaux !
et
470/2001
Sciences.ch 14/03/2005
Nous obtenons ainsi quantités qui constituent également les composantes contravariantes
d'un tenseur d'ordre deux appelé "le produit tensoriel du vecteur par le vecteur ".
Remarque : nous pouvons construire des produits tensoriels d'ordre trois (donc avec
termes) tels que :
Etudions les propriétés de changement de base de ces composantes. Utilisons pour cela les
relations de changement de base des composantes contravariantes d'un vecteur, à savoir:
et
Une telle relation de changement de base caractérise les composantes contravariantes d'un
tenseur d'ordre deux. Inversement, nous obtenons :
Les quantités constituent donc les "composantes contravariantes d'un tenseur d'ordre
deux".
Nous pouvons former de même les produits deux à deux des composantes covariantes et
des vecteurs et soit:
Les formules de changement de base des composantes covariantes des vecteurs sont données
471/2001
Sciences.ch 14/03/2005
par les relations suivantes que nous avons déjà démontrées précédemment:
et
C'est la relation de changement de base des composantes covariantes d'un tenseur d'ordre
deux. On vérifie que l'on a:
Les quantités constituent donc les "composantes covariantes d'un tenseur d'ordre deux".
Effectuons un changement de base dans cette dernière relation en tenant compte des
expressions et , on obtient:
Cette relation de changement de base caractérise les "composantes mixtes" d'un tenseur
d'ordre deux. Inversement, on peut vérifier que l'on a:
Ces composantes mixtes constituent également des composantes du produit tensoriel de par
, selon une certaines base.
De manière générale, une suite de quantités qui se transforment, lors d'un changement
de base de , selon les relations établies juste précédemment constituent donc, par
définition, les "composantes mixtes d'un tenseur d'ordre deux".
ESPACES TENSORIELS
Au cours de l'étude précédente, nous avons utilisé des systèmes de nombres, crées à partir
d'un espace vectoriel . Lorsque ces nombres vérifient certaines relations de changement de
base, nous avons appelé ces grandeurs, par définition, les "composantes d'un tenseur".
472/2001
Sciences.ch 14/03/2005
Nous avons vu que toute combinaison linéaire de ces composantes constitue les composantes
d'autres tenseurs. Nous pouvons donc additionner entre elles les composantes des tenseurs
ainsi que les multiplier par des scalaires, pour obtenir d'autres composantes de tenseurs. Ces
propriétés d'addition et de multiplication font que nous allons pouvoir utiliser ces grandeurs
tensorielles comme composantes de vecteurs.
D'un point de vue pratique, nous pourrions nous contenter de définir les tenseurs à partir des
relations de transformation de leurs composantes lors d'un changement de base. C'est ce qui
est souvent fait en physique. Cependant, la définition des tenseurs sous forme de vecteurs
conduit à une meilleure compréhension de leurs propriétés et les rattache à la théorie générale
des vecteurs.
Pour préciser comment nous définissons un tenseur sur une base, étudions le cas particulier
d'un produit tensoriel de deux vecteurs constitués par des triplets de nombres. Considérons
l'espace vectoriel euclidien dont les vecteurs sont des triplets de nombre de la forme:
. La base orthonormée canonique de est formée de trois vecteurs :
Des vecteurs de permettent de former les neuf quantités que nous avons appelées
"les composantes du produit tensoriel" des vecteurs et .
Si nous effectuons tous les produits tensoriels possibles entre vecteurs de , nous obtenons
des suites de neuf nombres qui peuvent servir à définir le vecteur suivant :
Remarque : nous voyons de suite avec la relation précédente que le produit tensoriel n'est dès
lors pas commutatif.
éléments d'un espace vectoriel à neuf dimensions, ayant pour éléments tous les multiplets
formés de neuf nombres.
Ces vecteurs peuvent être décomposés, par exemple, sur une base canonique orthonormée :
avec .
Si nous renumérotons les quantités selon la place qu'elle occupent dans l'expression de
, soit:
473/2001
Sciences.ch 14/03/2005
En quoi ces tenseurs diffèrent-ils des vecteurs ordinaires ? Ils sont certes identiques à
certains vecteurs de mais ils ont été formés à partir des vecteurs de et de . Pour
rappeler ce fait, nous les notons :
et ils sont appelés "produits tensoriels d'ordre deux" des vecteurs et . Le symbole est
donc défini de la manière dont nous avons formé les quantités et l'ordre dans lequel
nous les avons classées pour former le vecteur .
Pour rappeler la dépendance entre une quantité et le vecteur de base auquel il est
affecté, renumérotons ces vecteurs en mettant à la place de l'indice les deux indices et ,
relatifs aux composantes, soit:
Les vecteurs constituent donc une base de qui est appelée la "base associée".
Nous rappelons également que le produit tensoriel est non-commutatif (il est vraiment
important de s'en rappeler)! Autrement dit :
Les relations précédentes nous permettent finalement d'écrire le produit tensoriel des vecteurs
et sous la forme:
L'espace vectoriel est doté d'une structure plus précise que celle de simple espace vectoriel
de dimension neuf lorsque nous définissons les produits tensoriels comme constituant
la base de . Nous disons que est doté d'une "structure de produit tensoriel" ce qui nous
amène à noter cet espace ou encore .
474/2001
Sciences.ch 14/03/2005
et
Lors d'un tel changement, la base associée à devient une autre base
associée à , à savoir:
Soit donc :
475/2001
Sciences.ch 14/03/2005
P3. Lorsque nous choisissons une base dans chacun des espaces vectoriels pour ,
pour , les éléments de que nous notons forment également une base
de .
Démonstration : déjà faite dans l'exemple particuler que nous avons utilisé au début.
Remarque : en pratique, nous avons souvent à utiliser des tenseurs formés à partir de veteurs
appartenant à des espaces vectoriels identiques .
avec .
Nous obtenons construisons ainsi des produits tensoriels d'ordre appartenant à l'espace
vectoriel , espace qui est muni d'une structure de produit tensoriel. Les
éléments de cet espace constituent par définition des tenseurs d'ordre .
Afin d'unifier la classification, les espace vectoriels élémentaires, qui ne peuvent êtres munis
d'une structure de produit tensoriel, peuvent êtres considérés comme ayant pour éléments des
tenseurs d'ordre un. En général, nous appellons ces éléments des "vecteurs", réservant le nom
de "tenseurs" à des éléments d'espaces tensoriels d'ordre égal ou supérieur à deux !
Remarque : il est commode d'appeler "tenseurs d'ordre zéro" les grandeurs scalaires. Il est
également rare de rencontrer des tenseurs d'ordre supérieur à 2.
Il est assez évident et nous ne ferons pas la démonstration (excepté s'il y a une demande) que
nous pouvons redéfinir absolument tous les concepts (base, décomposition sur une base, base
réciproque, produit scalaire, produit tensoriel) que nous avons vu jusqu'à maintenant en
considérant les tenseurs d'ordre deux commes des vecteurs (il faudrait donc que nous re-
écrivions tout ce qui est déjà écrit ci-dessus... ce qui est inutile).
Il est aussi tout à fait possible de réiterer toutes ces définitions pour des tenseurs d'ordre
supérieurs et ainsi généraliser le concept d'espace tensoriel pour toutes les dimensions.
476/2001
Sciences.ch 14/03/2005
Pour qu'une suite de quantités, rapportées à une base d'un espace vectoriel , puisse
être considérée comme les composantes d'un tenseur, il faut et il suffit que ces quantités soit
liées entre elles, dans deux bases différentes de , par les relations de transformation des
composantes.
Nous pouvons former d'autres tenseurs en combinant entre elles les composantes de différents
produits tensoriels définis à l'aide des vecteurs d'un même espace vectoriel. Considérons par
exemple les composantes contravariantes des produits tensoriels des vecteurs et :
Les quantités vérifient également les formules générales de changement de base. Nous
avons en effet, en substituant les relations de transformation des composantes contravariantes
d'un produit tensoriel dans l'expression précédente :
Nous obtenons ainsi l'expression du produit scalaire des vecteurs et ; la quantité est un
scalaire ou tenseur d'ordre zéro. Une telle addition sur des indices de variance différente
constitue, par définition, l'opération de "contraction des indices" du tenseur . Cette
opération a permis de passer d'un tenseur d'ordre deux à un tenseur d'ordre zéro; le tenseur
a été amputé d'une covariance et d'une contravariance.
477/2001
Sciences.ch 14/03/2005
Prenons également l'exemple d'un tenseur dont les composantes mixtes sont (attention...
il ne s'agit pas d'une matrice tridimensionnelle mais simplement de l'indication que les
composantes de ce tenseurs s'expriment à partir de trois autres variables). Considérons
certaines de ses composantes telles que , à savoir les quantités et effectuons
l'addition de ces dernières; nous obtenons:
Ces nouvelles quantités forment les composantes d'un tenseur d'ordre un (donc un
vecteur). Les quantités constituent des "composantes contractées" du tenseur et satisfont
bien évidemment aux relations de changement de base (sur demande nous pouvons faire la
démonstration mais sachez qu'elle est similaire à celle que nous avions faite pour les
vecteurs). Nous sommes ainsi passé d'un tenseur d'ordre trois à un tenseur d'ordre un.
Maintenant que nous avons un tenseur à composantes, mixtes, nous pouvons très bien
contracter les indices. Choisissons par exemple l'indice et effectuons la contraction avec
l'indice , posons (nous nous intéressans alors plus qu'à certains termes
particuliers), il vient:
Remarque : par suite de la symétrie des quantités (produit scalaire est commutatif) ce
dernier tenseur est identique à celui que nous obtiendrons en abaissant à la position covariante
l'indice puis en effectuant la contraction avec l'indice :
478/2001
Sciences.ch 14/03/2005
De manière générale, la contraction d'un tenseur permet donc de former un tenseur d'ordre
à partir d'un tenseur d'ordre . Nous pouvons naturellement répéter l'opération de
contraction. Ainsi, un tenseur pair, , deviendra un scalaire après contractions et un
tenseur d'ordre impair, , deviendra un vecteur.
Nous pouvons étendre après cette définition de la contraction des indices, le critère de
tensorialité. Nous avons vu jusqu'à maintenant, deux manières de reconnaître le caractère
tensoriel d'une suite de quantités :
- la première consiste à démontrer que ces quantités sont formées par le produit tensoriel de
composantes de vecteurs ou par une somme de produits tensoriel
- le deuxième consiste à étudier la manière dont ces quantités se transforment lors d'un
changement de base et à vérifier la conformité des relations de transformation.
TENSEURS PARTICULIERS
Nous pouvons être confrontés en physique théorique à des tenseurs qui ont des propriétés
intéressantes. Afin d'éviter de faire un travail redondant au cas par cas, nous allons énumérer
et démontrer les différentes propriétés existantes et parler de leurs possibles implications.
TENSEUR SYMÉTRIQUE
Considérons un tenseur d'ordre deux contravariantes . Supposons que, suivant une base
, toutes ces composantes satisfassent aux relations:
Sur une autre base , liée à la précédente par les relations de transformation connues, les
nouvelles composantes de vérifient la relation:
Nous voyons que la propriété est donc une caractéristique intrinsèque du tenseur ,
indépendante de la base ! Nous disons alors que le tenseur est "symétrique".
La propriété de symétrie se vérifie également pour les composantes covariantes d'un tenseur
symétrique puisque nous avons:
479/2001
Sciences.ch 14/03/2005
contravariantes.
Pour des tenseurs d'ordre plus élevé, la symétrie peut être partielle, portant sur deux indices
covariants ou deux indices contravariants. Ainsi, un tenseur d'ordre quatre, de composantes
mixtes peut être également symétrique en et , par exemple, soit:
Nous vérifions, de même que ci-dessus, qu'une telle propriété est intrinsèque.
Un tenseur est dit "complètement symétrique" si toute transposition de deux indices de même
variance, change la composante correspondante en elle-même. Par exemple, pour un tenseur
d'ordre trois , complètement symétrique, nous avons les composantes suivantes qui sont
égales entre elles:
Des exemples de tenseurs compléments symétriques sont le tenseur des contraintes que
nous verrons lors de notre étude des équations de Navier-Stokes en mécanique des fluides et
les tenseurs des transformation relativistes de Lorentz que nous verrons en mécanique
relativiste. Ces tenseurs sont alors dits aussi "totalement invariants" (sous-entendu par
changement de base).
Nous pouvons également (curiosité intéressante) obtenir une représentation géométrique des
valeurs des composantes d'un tenseur symétrique d'ordre deux. Pour cela, considérons dans
l'espace géométrique ordinaire des coordonnées , l'équation suivante:
Nous retrouvons ici l'équation d'une surface de second degré ou quadrique similaire à celle du
plan que nous avons vue en géométrie plane. Nous savons que par extension à la troisième
dimension que ces surfaces sont des ellipsoïdes ou hyperboloïdes, selon les valeurs des
quantités .
480/2001
Sciences.ch 14/03/2005
et
Les coefficients se transforment donc comme les composantes covariantes d'un tenseur
d'ordre deux. Réciproquement, si les quantités sont les composantes d'un tenseur
symétrique, ces composantes définissent les coefficients d'une quadrique. Il existe donc une
certaine équivalence entre un tenseur symétrique et les coefficients d'une quadrique. Nous
dirons que l'équation de la quadrique est la "quadrique représentative" du tenseur symétrique.
Nous savons de par notre étude des quadriques en géométrie plane (en étendant cela au cas
tri-dimensionnel) que nous pouvons toujours trouver un système de coordonnées par rapport
auquel l'équation d'une quadrique prend une forme plus simple:
Dans ce cas, les vecteurs de base sont portés par les axes principaux de la quadrique. Dans ce
système de coordonnées, les composantes du tenseur se réduisent à:
et pour les autres composantes. Les quantités sont appelées les "composantes
principales" du tenseur .
Si les quantités sont positives, la surface est une ellipsoïde, si deux quantités sont
strictement positives et la troisième strictement négative, nous avons un hyperboloïde à une
nappe, si deux quantités sont strictement négatives et la troisième positive, nous avons un
hyperboloïde à deux nappes (pour plus d'information voir le chapitre de géométrie spatiale sur
les coniques).
481/2001
Sciences.ch 14/03/2005
TENSEUR ANTI-SYMÉTRIQUE
Lorsque les composantes contravariantes d'un tenseur d'ordre deux, vérifient les relations:
nous disons que le tenseur est "anti-symétrique". C'est une propriété intrinsèque du tenseur
qui se démontre comme pour les tenseurs symétriques, au signe "-" près. Un tenseur anti-
symétrique doit bien évidemment satisfaire au fait que ces composantes diagonales soient
nulles tel que:
Tout tenseurs peut être mis sous la forme d'une somme d'un tenseur symétrique et d'un
tenseur antisymétrique. Nous avons en effet:
où nous voyons immédiatement que les composantes sont celles d'un tenseur
antisymétrique .
482/2001
Sciences.ch 14/03/2005
Le tenseur (noté ainsi en analogie avec le produit vectoriel pour ) est appelé le
"produit extérieur" des vecteurs et . Nous disons encore que ce tenseur est un "bi-
vecteur".
Le produit extérieur est donc un tenseur anti-symétrique qui vérifie les propriétés suivantes:
Echangeant, dans la dernière somme de la relation ci-dessus, le nom des indices et en tenant
compte que , nous obtenons :
Les éléments:
sont linéairement indépendants puisque les vecteurs le sont également. Ces éléments
constituent donc une base sur laquelle les tenseurs anti-symétriques peuvent êtres
décomposés.
483/2001
Sciences.ch 14/03/2005
Ainsi, un produit vectoriel n'existe donc que pour un sous-espace de bi-vecteurs dont le
nombre de dimension est égal à 3 et dont les pré-images sont des tenseurs anti-symétriques.
Si toutes ces conditions sont satisfaites, nous disons que le vecteur constitue le "tenseur
adjoint" du tenseur .
TENSEUR FONDAMENTAL
Nous avons vu au début de notre étude du calcul tensoriel la définition des composantes
covariantes du tenseur fondamental, à savoir :
Ces quantités interviennent, nous le savonse, dans l'expression du produit scalaire de deux
vecteur et , de composantes contravariantes et , donné par la relation:
Utilisons le critère général de tensorialité pour mettre en évidence le caractère tensoriel des
. L'expression précédente est un produit complètement contracté des quantités avec les
composantes contravariantes d'un tenseur arbitraire. Comme le produit scalaire est une
quantité invariante (en l'occurence un scalaire) par rapport aux changements de base, il en
résulte que les quantités sont les composantes covariantes d'un tenseur.
Ce tenseur est de plus symétrique par suite de la propriété symétrie du produit scalaire des
vecteurs de base tel que:
484/2001
Sciences.ch 14/03/2005
COORDONNÉES CURVILIGNES
Les notions classiques de système de coordonnées peuvent être généralisées à des espaces
ponctuels (voir le chapitre traitant des principes de la mécanique classique) à dimensions.
Nous appelons "système de coordonnées" dans (espace ponctuel à dimensions donc),
tout mode de définition d'un point dans le système considéré.
Etudions tout d'abord la généralisation d'un système de coordonnées relatives à un repère fixe
(nous conseillons vivement au lecteur d'avoir lu au préalable la partie traitant des systèmes de
coordonnées dans le chapitre de calcul vectoriel et la partie traitant du formalisme lagrangien
dans le chapitre des principes de la mécanique).
Nous supposerons par la suite que les fonctions satisfont aux trois propriétés suivantes:
P1. Elles sont de classe supérieur ou égal à (dérivables au moins deux fois pour les
besoins de la physique). Cette hypothèse implique, en tout point où elle est satisfaite, que
nous avons la permutabilité des dérivations (par rapport aux deux dérivations):
P2. Ces fonctions sont telles que nous pouvons résoudre le système des équations de
changement de système de coordonnées par rapport aux variables et les exprimer en
fonction des , soit:
485/2001
Sciences.ch 14/03/2005
toujours avec .
P3. Lorsque les variables varient dans un domaine , les variables varient dans un
domaine . Le jacobien des fonctions , défini par:
sera supposé différent de zéro dans le domaine ainsi que le jacobien des fonctions
qui est l'inverse du jacobien . Si les jacobiens
existent, ils sont non nuls comme conséquence en première lieu de la deuxième propriété ci-
dessus et implicitement de la première.
Si nous fixons paramètres en faisant varier un seul paramètre, par exemple, nous
obtenons les coordonnées d'un ensemble de points de qui constituent une "ligne
coordonnée". En général, les lignes coordonnées ne sont pas des droites mais des courbes; ces
coordonnées sont appelées pour cette raison des "coordonnées curvilignes". En un point
de se croisent d'ailleurs lignes coordonnées.
Nous démontrons en mécanique analytique, lors de l'étude des espaces ponctuels, que les
dérivées et les différentielles d'un vecteur de sont indépendantes du point d'un
repère donné. Si est rapporté à un système de coordonnées curvilignes , nous écrivons :
486/2001
Sciences.ch 14/03/2005
qui est précisément le jacobien des fonctions que nous avions défini
précédemment. Puisque ce déterminant est différent de zéro (du moins imposé tel quel), il en
résulte que les vecteurs sont linéairement indépendants.
sont appelées la "base naturelle" au point de l'espace vectoriel . Il sont colinéaires aux
tangentes des lignes coordonnées qui se coupent au point où ils sont définis.
Nous n'insisterons pas sur le fait évident qu'à tout système de coordonnées curvilignes sont
associées des repères naturels dont les bases sont exprimées par ses mêmes coordonnées (voir
le chapitre de calcul vectoriel).
Associons au point de un repère formé par le point et par les vecteurs de la base
naturelle. Ce repère est appelé le "repère naturel" en du système de coordonnées . Il
sera noté:
ou
Nous avons vu en relativité générale que la carré de la distance entre deux points et
infiniment proches est donnée par le relation:
487/2001
Sciences.ch 14/03/2005
espace ponctuel . Lorsque cet espace est rapporté à un système de coordonnées curvilignes
, nous avons vu que la relation:
montre que le vecteur a pour composantes contravariantes les quantités par rapport
au repère naturel . Le carré de la distance s'écrit alors dans le repère naturel:
Les vecteurs du repère naturel varient en général d'un point un autre. C'est le cas, par
exemple, des coordonnées sphériques dont les quantités (nous le démontrerons de suite
après) sont variables !!
Une courbe de peut être définie par la donnée des coordonnées curvilignes du
lieu des points en fonction d'un paramètre . La distance élémentaire sur cette
courbe s'écrit alors:
488/2001
Sciences.ch 14/03/2005
Ces trois vecteurs sont orthogonaux entre eux ainsi que nous le vérifonse aisément en
effectuant les produits scalaires . Lorsqu'il en est ainsi, nous disons que les coordonnées
sont des coordonnées "curvilignes orthogonales".
Ces vecteurs ne sont cependant pas tous normés, puisque nous avons:
Le repère naturel, en coordonnées sphériques, est donc formé par des vecteurs variables en
direction en en module en chaque point de . Les quantités constituent un exemple de
tenseur métrique attaché à chacun des points de l'espace .
L'élément linéaire du plan est donné par (les détails des calculs peuvent êtres trouvés dans le
chapitre traitant de la mécanique relativiste – en particulier la partie concernant la relativité
générale):
Nous avons:
489/2001
Sciences.ch 14/03/2005
Ces deux vecteurs sont orthogonaux entre eux ainsi que nous le vérifions aisément en
effectuant les produits scalaires .
Nous avons:
L'élément linéaire du plan est donné par (les détails des calculs peuvent êtres trouvés dans le
chapitre traitant de la mécanique relativiste – en particulier la partie concernant la relativité
générale):
Nous avons:
et enfin:
490/2001
Sciences.ch 14/03/2005
Ces trois vecteurs sont orthogonaux entre eux ainsi qu'on le vérifie aisément en effectuant les
produits scalaires .
Nous avons:
L'élément linéaire du plan est donné par (les détails des calculs peuvent êtres trouvés dans le
chapitre traitant de la mécanique relativiste – en particulier la partie concernant la relativité
générale):
SYMBOLES DE CHRISTOFFEL
L'étude des champs de tenseurs constitue, pour le physicien, l'essentiel de l'analyse tensorielle.
Le tenseur générique de ce champ est une fonction du point et nous le notons:
Si le tenseur est une fonction seulement de , le champ considéré est appelé un "champ
fixe". Si est, en outre, une fonction d'un ou plusieurs paramètres autres que les
coordonnées de , nous disons alors que ce champ est variable et nous le notons :
Les différentes opérations algébriques sur les tenseurs associés à un même point ne
soulèvent pas de difficulté particulière. La dérivée de par rapport à un paramètre
conduit à utiliser les résultats classiques relatifs à la dérivation des vecteurs.
Cependant, une difficulté apparaît lorsque nous cherchons à calculer la dérivée d'un tenseur
par rapport aux coordonnées curvilignes. En effet, les composantes du tenseur sont
définies en chaque point par rapport à un repère naturel qui varie d'un point à un autre.
lorsque nous passons d'un point à un point infiniment voisin ne peut se faire que si
nous avons recours à une même base. Pour pouvoir comparer l'un à l'autre les tenseur
et , nous sommes amenés à étudier comment varie un repère naturel, pour un
système de coordonnées donné, lorsque nous passons d'un point au point infiniment voisin
.
491/2001
Sciences.ch 14/03/2005
fondamental de l'analyse tensorielle consiste donc à déterminer, par rapport au repère naturel
au point , le repère naturel au point infiniment voisin .
D'une part, le point sera parfaitement défini par rapport à si nous déterminons le
vecteur tel que . Pour des coordonnées curvilignes , la décomposition
d'un vecteur élémentaire est donnée par la relation que nous avons démontré
précédemment:
Les quantités étant les composantes contravariantes du vecteur sur la base naturelle
.
D'autre part, les vecteurs vont pouvoir être déterminés en calculant les variations
élémentaire des vecteurs , par rapport au repère naturel , lorsque nous passons
de en ; nous avons alors:
Le calcul des vecteurs reste alors le problème essentiel à résoudre. Nous allons tout
d'abord étudier un exemple de ce type de calcul en coordonnées sphériques.
Les vecteurs de base du repère fixe cartésien étant constants en module et en direction,
la différentielle du vecteur s'écrit:
Nous remarquons que les termes entre parenthèses représentent respectivement les vecteurs
et , d'où:
492/2001
Sciences.ch 14/03/2005
Avec:
nous avons:
Donc finalement:
Et:
Après quelques opérations algébriques élémentaires et très pertinentes (…), nous arrivons à:
Les différentielles sont ainsi décomposées sur la base naturelle . Si nous notons ,
les composantes contravariantes du vecteur , celui-ci s'écrit (nous changeons les lettres
d'indices):
Les composantes des vecteurs sont des formes différentielles (combinaisons linéaires
493/2001
Sciences.ch 14/03/2005
où les quantités sont des fonctions de qui vont être explicitement obtenues en
identifiant chaque composante . Par exemple, la composante s'écrit avec la notations
de la relation précédente:
En procédant de même avec les neuf composantes , nous obtenons les vingt sept termes
. Pour un système de coordonnées curvilignes quelconques, ces quantités sont
appelées les "symboles de Christoffel de deuxième espèce".
Nous venons de voir, sur l'exemple des coordonnées sphériques, qu'un calcul direct permet,
par identification, d'obtenir explicitement les quantités . Nous allons voir que nous
pouvons également obtenir l'expression de ces quantités en fonction des composantes .
Le calcul des quantités en fonction des va nous amener à introduire d'autres symboles
494/2001
Sciences.ch 14/03/2005
de Christoffel. Pour cela, écrivons les composantes covariantes, notées , des différentielles
, soit:
Les composantes covariantes sont également des combinaisons linéaires des différentielles
que nous pouvons écrire sous la forme:
Nous voyons très bien en parcourant à nouveau la définition du symbole de Christoffel que :
et donc que :
Puisque les composantes covariantes sont liées aux composantes contravariantes par les
relations (contraction des indices) :
Inversement:
Remarque: diverses notations sont utilisées pour représenter les symboles de Christoffel. Les
plus usuelles sont les suivantes:
495/2001
Sciences.ch 14/03/2005
Partant de:
d'où en identifient les coefficients des différentielles dans ces deux dernières
expressions :
496/2001
Sciences.ch 14/03/2005
puis en effectuant une permutation circulaire sur les indices, nous obtenons :
En effectuant la somme :
et en retranchant :
En simplifiant il vient :
d'où :
C'est l'expression des symboles de Christoffel de première espèce en fonction des dérivées
partielles des composantes du tenseur fondamental. Nous obtenons ceux de deuxième
espèce à partir de la relation :
Les deux dernières expressions encadrées permettent le calcul effectif des symboles de
Christoffel pour une métrique donnée (d'où un énorme gain en calculs). Lorsque les quantités
sont données à priori, nous pouvons ainsi étudier les propriétés de l'espace ponctuel défini
par la donne de cette métrique, ce qui est le cas des espaces de Riemann que nous verrons plus
loin.
THÉORÈME DE RICCI
Nous avons vu dans le chapitre de mécanique relativiste que les géodésique sont les distances
les plus courtes entre deux points dans n'importe quel type d'espace. Ce qui va nous intéresser
maintenant, c'est d'étudier les variations d'un vecteur au cours d'un tel déplacement.
497/2001
Sciences.ch 14/03/2005
Rappelons d'abord que l'équation des géodésique pour un système de coordonnées curvilignes
quelconque de l'espace ponctuel (voir le chapitre des principes de la mécanique) est
donnée par (voir chapitre de mécanique relativiste) :
Lors d'un déplacement le long de la géodésique, d'un point à un point infiniment voisin
, le scalaire subit la variation :
et comme :
d'où :
et d'autre part, la dérivée seconde par son expression tirée de l'équation des
géodésiques. Nous obtenons :
498/2001
Sciences.ch 14/03/2005
qui sont par définition les "différentielles absolues" des composantes covariantes du vecteur
. Nous définissons également la "dérivée covariante" (appelée également "connexion") par
la relation :
Remarque : dans les ouvrages anciens ou américains ceci est souvent noté sous la forme (que
nous n'utiliserons aucunement sur ce site :
faisant donc usage du ";" pour noter la dérivée covariante et de la "," pour différentielle
partielle.
Puisque la dérivée du produit de deux fonctions est la somme des dérivées partielles, nous
avons alors aussi :
Si nous posons alors nous avons (résultat que nous utiliserons après avoir
démontré le théorème de Ricci pour déterminer le tenseur d'Einstein nécessaire à la relativité
générale) :
En coordonnées curvilignes, pour que la différentielle d'un vecteur soit un vecteur, il faut que
les deux vecteurs dont nous prenons la différence se trouvent en un même point de l'espace.
En d'autres termes, il faut transporter, d'une manière ou d'une autre, l'un des deux vecteurs
infiniment voisins au point où se trouve le second et , seulement après faire la différence des
deux vecteurs qui se trouvent maintenant en un seul et même point de l'espace. L'opération de
transport parallèle doit être définie de telle sorte que en coordonnées cartésiennes (pour le
petit exemple), la différence des composantes coïncide avec la différence ordinaire .
499/2001
Sciences.ch 14/03/2005
Ainsi, en coordonnées curvilignes la différence des composantes des deux vecteurs après le
transport de l'un d'entre eux au point où se trouve l'autre est noté tel que nous ayons :
Mais aussi à écrire le principe de moindre action (principe variationnel) sous la forme
tensorielle :
Considérons maintenant un tenseur d'ordre deux, produit de deux tenseurs d'ordre un tel que
(nous l'avons vu lors de notre étude des compositions de tenseurs) :
Donc :
d'où :
d'où l'identité :
et
500/2001
Sciences.ch 14/03/2005
Nous avons :
et
Donc finalement :
La différentielle absolue sur une géodésique dans l'approximation d'un transport infinitésimal
du tenseur fondamental est donc (comme nous pouvions nous y attendre) nulle. C'est le
"théorème de Ricci". Certains physicien théoriciens disent dès lors que "la dérivée covariante
tue la métrique" dans le sens où la métrique ne change pas sur un différentiel d'espace.
Finalement, nous voyons aussi que pour un tenseur d'ordre deux (la métrique en particulier)
nous avons :
Nous pouvons donc écrire la différentielle absolue qui dans ce cas particulier est nul :
et donc :
et
et qu'il s'agit d'un autre manière d'exprimer qu'un variation infinitésimale sur une géodésique
selon le principe de moindre action tue la métrique. Nous allons donc travailler à partir de
maintenant (comme avant déjà) avec des équations différentielles non nécessairement
linéaires qu'il faudra intégrer pour trouver le comportement de la matière dans un espace
donné.
Déterminons maintenant une expression qui nous sera très utile en relativité générale lorsque
nous déterminerons l'équation d'Einstein des champs :
501/2001
Sciences.ch 14/03/2005
d'où la relation :
Démonstration :
Soit une variable quelconque que nous choisissons ici être le temps uniquement pour
simplifier les notations des calculs qui vont suivre. Lorsque la partie principale du
développement sera achevée, le résultat peut être adapter à tout autre variable et soit les
colonnes d'éléments de .
Pour les développements qui vont suivre, nous définissons les notations :
(2)
La règle de dérivation d'un déterminant fonctionnel est (voir chapitre d'algèbre linéaire) :
Soit :
502/2001
Sciences.ch 14/03/2005
ou
Or, nous savons que : et sont des tenseurs métriques qui ont comme propriété
remarquable :
et donc :
Nous pouvons adopter une autre variable. Soit cette autre variable :
et donc il s'ensuit le résultat que nous avions écrit avant cette démonstration.
Cette relation ne veut pas dire grand chose tant que nous n'en ferons pas un usage plus
explicite lors de notre travail sur la relativité générale dans le chapitre de mécanique
relativiste.
503/2001
Sciences.ch 14/03/2005
TENSEUR DE RIEMANN-CHRISTOFFEL
Cette relation exprime sauf erreur de la part du rédacteur de ces lignes…. la dérivée
covariante d'un tenseur d'ordre deux - tel que la métrique - sur un chemin géodésique dans
deux directions parallèles (la deuxième dérivée covariantes permettant de créer la
"perpendiculaires géodésique" entre les deux géodésique infiniment proches de la première
dérivée covariante). Nous appelons un tel déplacement : un "transport parallèle".
En y substituant :
Permutons maintenant les indices et dans l'expression précédente pour avoir une
différentielle par rapport à un autre chemin :
Cette relation exprime le fait que, comme la gravité, la courbure de l'espace-temps cause une
accélération mutuelle entre les géodésiques. De plus, il est facile de constater, que
l'accélération mutuelle entre les géodésiques est nulle si les tenseurs de Riemann-Christoffel
sont nuls (typiquement en coordonnées cartésiennes, in extenso cela signifie pour un espace-
temps plat). C'est exactement ce que nous attendons de la gravité : si nous observons aucune
accélération, la courbure (nous allons de suite définir ce que c'est) est nulle et si la courbure
est nulle, nous n'observons aucune accéléréation. Morale de l'histoire : la gravité est courbure
et la courbure est gravité !!
Nous voyons que la quantité entre parenthèse est un tenseur d'ordre quatre que nous notons :
et qui résume à lui seul le transport parallèle et le fait que gravité et géométire de l'espace sont
liés. Le tenseur est appelé "tenseur de Riemann-Christoffel" ou "tenseur de l'espace
504/2001
Sciences.ch 14/03/2005
Riemannien". La courbure d'un espace Riemannien peut aussi être caractérisée à l'aide de ce
tenseur.
Si nous multiplions le tenseur par , nous avons alors les données covariantes de ce
tenseur tel que :
D'où :
et comme :
Nous avons :
505/2001
Sciences.ch 14/03/2005
Il convient de remarquer que (c'est trivial par vérification sur la relation précédente) le tenseur
de Riemann-Christoffl est donc anti-symétrique :
Enfin, la permutation en bloc des indices et nous donne, par suite de la symétrie des
et en invertissant leur ordre de dérivation (trivial) :
Effectuons maintenant une permutation circulaire sur les indices dans l'expression :
il vient :
L'identité précédente est appelée "première identité de Bianchi". Par extension, il est trivial
que nous avons aussi (nous changeons les notations des indices afin d'être plus conforme aux
écritures habituelles en relativité générale) :
506/2001
Sciences.ch 14/03/2005
et par extension :
Rappelons qu'implicitement, cette relation exprime toujours simplement (si l'on peut dire…)
le fait que gravité et géométrie de l'espace sont liés ensembles..
TENSEUR DE RICCI
Avant de voir les conséquences de l'identité de Bianchi, nous avons besoin de définir le
tenseur de Ricci :
qui est donc la contraction des premier et troisième indices. D'autres contractions d'autres
indices pourraient aussi être possible mais parce que est anti-symétrique sur et
alors la contraction sur ces indices reviennent à avoir .
TENSEUR D'EINSTEIN
et donc à obtenir :
507/2001
Sciences.ch 14/03/2005
Cette relation est appelée "identité de Bianchi contractée". Contractons cette relation encore
une fois :
Ce qui équivaut à :
Le tenseur d'Einstein qui est donc une constante dans un espace Riemannien donné est dès
lors défini par :
Le tenseur est donc construit pour une métrique uniquement Riemannienne (ce qui fait
cependant quand même pas mal d'espaces possibles…), et est automatiquement non
divergent :
508/2001
Sciences.ch 14/03/2005
En exprimant le tout dans un espace Riemannien nous obtiendrons alors la non moins
fameuse "équation d'Einstein" des champs (sans plus d'explication dans ce chapitre) :
Remarque : comme nous le voyons, nous pouvons très bien rajouter un terme constant à
l'expression du tenseur d'Einstein, sans que cela ne change la nullité de sa divergence. Ce fait,
utilisé en astrophysique, permet de construire des modèles d'Univers particuliers que nous
traitons dans le chapitre d'astrophysique.
509/2001
Sciences.ch 14/03/2005
CALCUL SPINORIEL
Comme nous le verrons en premier en physique quantique ondulatoire, les spineurs jouent un
rôle majeur dans la théorique quantique et en conséquence dans toute la physique
contemporaine (théorique quantique des champs, modèle standard, théorie des cordes,…).
Ce fut à partir de 1927 que les physicien Pauli, puis Dirac introduisirent les spineurs pour la
représentation des fonctions d'onde. Cependant, sous leur forme mathématique, les spineurs
avaient été découverts par Élie Cartan dès 1913 lors de ses recherches sur les représentation
des groupes en faisant suite à la théorie générale des espaces de Clifford (introduits par le
mathématicien W.K. Clifford en 1876). Il montra, comme nous le verrons, que les spineurs
fournissent au fait une représentation linéaire du groupe des rotations d'un espace à un nombre
quelconque de dimensions. Ainsi, les spineurs sont donc étroitement liés à la géométrie mais
leur présentation est souvent faite de manière abstraite sans signification géométrique
intuitive. Ainsi, nous allons nous efforcer (comme toujours sur ce site) dans ce chapitre
d'introduire de la manière la plus simple et intuitive possible les théorie des spineurs.
La théorie des spineurs est extrêmement vaste mais ce site ayant plus pour objectif de
s'adresser aux physiciens, nous nous limiterons aux spineurs utiles en physique quantique
ainsi que leurs propriétés y relatives.
SPINEUR UNITAIRE
Nous allons donner ici un première définition (ou exemple) particulière des spineurs. Ainsi,
nous allons montrer qu'il est possible à partir d'un tel outil de représenter un vecteur d'un
espace à trois composantes à l'aide d'un spineur à deux composantes. La méthode est
extrêmement simple et celui qui a déjà la partie du chapitre de physique quantique ondulatoire
traitant de l'équation de Dirac et de la conditions de normalisation de Broglie y verra une
analogie grandiose.
510/2001
Sciences.ch 14/03/2005
Remarque : les deux dernières relations s'obtiennent par application du théorème de Thalès
dans le plan équatorial complexe.
en prenant le module au carré (voir les nombres complexes dans le chapitres des nombres) :
511/2001
Sciences.ch 14/03/2005
Rappelons avant de continuer que nous avons démontré lors de notre étude des nombres
complexes que :
d'où finalement :
alors :
Ainsi, à tout point situé sur la sphère de rayon unité, nous pouvons faire correspondre un
512/2001
Sciences.ch 14/03/2005
Remarque : cette représentation n'est pas unique car les arguments de nombres complexes
sont (sous forme trigonométrique) déterminés qu'à une constante près.
Le lecteur qui aura déjà étudié un peu la physique quantique ondulatoire aura certainement
remarqué l'étrange similarité de la condition et des relations :
Voyons maintenant pour les besoins ultérieurs, que nous pouvons trouver deux nouveaux
vecteurs de l'espace euclidien , associés à un spineur unitaire déterminé sur la
sphère unité. Ces vecteurs seront cherchés orthogonaux entre eux et de norme unité, chacun
étant orthogonal au vecteur .
513/2001
Sciences.ch 14/03/2005
Ecrivant l'orthogonalité des vecteurs entre eux nous obtenons bien évidemment six équations
supplémentaires. Cependant l'orientation des vecteurs n'étant pas fixée, il existe une
certaine indéterminée sur les valeurs de leurs composantes. Choisissons des valeurs telles
que :
Prenant les quantités complexes conjuguées des relations précédentes, nous obtenons par
addition les composantes de :
Nous vérifions aisément que ces valeurs redonnent bien les relations du produit vectoriel. A
tout spineur unitaire nous pouvons donc associer trois vecteur . Nous pouvons
vérifier directement que les vecteurs ainsi calculés sont bien orthogonaux entre eux et de
norme unité.
PROPRIÉTÉS GÉOMÉTRIQUES
Nous allons étudier les transformations des vecteurs de associés à un spineur afin d'en
déduire les propriétés correspondantes de transformation du spineur. Les rotations dans
l'espace pouvant toujours s'exprimer sous forme du produit de deux symétries planes (faire
dans la tête l'expérience imaginaire), nous commençons par l'étude de ces dernières.
SYMÉTRIES PLANES
514/2001
Sciences.ch 14/03/2005
(1)
515/2001
Sciences.ch 14/03/2005
Nous en déduisons :
Ainsi, la matrice :
ROTATIONS
516/2001
Sciences.ch 14/03/2005
Comme nous l'avons vu dans le chapitre de géométrie euclidienne, il est possible faire une
rotation d'un vecteur dans le plan ou dans l'espace à l'aide de matrices. De même, par
extension, il est évident que la multiplication de deux rotations est une rotation (c'est de
l'algèbre linéaire élémentaire – du moins nous le considérons tel quel).
Considérons dès lors, deux plans dont l'intersection engendre une droite (ligne) et
notons et des vecteurs unitaires portés par les normales respectives à
ces deux plans sécantes en :
Notons l'angle des vecteurs entre eux (la raison de cette notation provient de notre
étude des quaternions – voir le chapitre traitant des nombres dans la section d'arithmétique).
Soit le vecteur unitaire porté par la droite résultant de l'intersection des plans et tel
que :
517/2001
Sciences.ch 14/03/2005
Remarque : nous allons nous servir des ces deux plans comme plans de symétrie pour nos
rotations
Comme nous l'avons fait remarquer précédemment, une rotation dans peut toujours se
faire avec au plus deux symétries planes. Ainsi, une rotation se noter par l'application
(multiplication) de deux matrices de symétrie selon les résultats obtenus plus haut :
Développant le produit des ces deux matrices et tenant compte de relations découlant du
produit vectoriel et scalaire nous obtenons :
La matrice peut être écrite sous une autre forme si nous faisons un développement
limité pour des rotations infiniment petites (eh voilà la physique qui revient….).
Ainsi, les développement de MacLaurin nous donnent :
En utilisant seuls les termes du premier ordre, la matrice de rotation s'écrit finalement :
518/2001
Sciences.ch 14/03/2005
Les matrices infinitésimales précédentes font donc apparaître de manière habile les matrices
suivantes :
Ces matrices sont appelées "matrices de Pauli" et nous les retrouveront en physique quantique
ondulatoire dans le cadre de notre étude de l'équation de Dirac et de la détermination de ses
solutions explicites (utilisant les spineurs).
519/2001
Sciences.ch 14/03/2005
L'expression peut alors s'écrire sous forme d'une sorte de produit scalaire
qui représente une somme de matrices :
La matrice de rotation :
qui a donc la forme d'un quaternion de rotation d'angle et d'axe . D'où la raison d'avoir
depuis le début choisi la notation de .
Il est clair, pour que l'analogie avec les quaternions soit plus forte, que les matrices de
Pauli forment un ensemble de quatre matrices linéairement indépendantes ! Tel que la base
canonique pour les quaternions !
520/2001
Sciences.ch 14/03/2005
Cette matrice constitue comme nous en avons déjà fait mention, au développement limité de
la matrice de rotation au voisinage de la matrice identité, les composantes de étant
associées à un spineur dont la rotation se fait par la double symétrie définie par deux plans
dont l'intersection est définie par le vecteur .
Le lecteur vérifiera aisément (si ce n'est pas le cas il pourra toujours nous contacter pour que
nous en rédigions les détails) les propriétés suivantes des matrices de Pauli :
P1. Unitarité :
avec
P3. Cyclicité :
P4. Commutation :
521/2001
Sciences.ch 14/03/2005
Ce qui s'écrit :
522/2001
Sciences.ch 14/03/2005
René Descartes avait imaginé un système du monde, où l’Univers était animé par des
tourbillons. À la fin du siècle dernier, Tait et Thomson (plus connu sous le nom de Lord
Kelvin) ont ressuscité cette théorie, et interprété les liaisons chimiques en imaginant des
molécules nouées qui s’enlaceraient. Les développements ultérieurs de la physique et de la
chimie ont amené une autre théorie de la liaison chimique, fondée sur le partage d’électrons
entre les atomes (voir chapitre de chimie quantique). Mais le sujet des noeuds était lancé ;
dans certains domaines, les noeuds seront... le noeud du sujet.
Remarques : le dénommination "théorie des noeuds" qui c'est imposée dans la communauté
scientifique est assez malheureuse. Certains mathématiciens (francophones) ont choisi à juste
raison d'utiliser plutôt la dénommination "théorie des tresses et entrelacs" qui est plus
correcte..
La théorie mathématique des noeuds a été lancée par les travaux de Little et Kirkman, qui
cherchaient donc à donner un fondement aux idées physiques de Tait et Kelvin (voir plus loin
pour le détail de l'histoire). Les premières classifications des noeuds utilisaient une image
filiforme des noeuds, sans épaisseur, et une projection plane, comme l’ombre portée sur un
écran. Un des caractères immédiatement perceptibles concerne les croisements où nous
distinguons le brin au-dessus et le brin au-dessous. Les cannages, ou les tressages de bandes,
reposent ainsi sur la considération des croisements, et le nombre de tels croisements sera le
premier élément de classification.
Une première difficulté apparaît alors : un noeud est un objet géométrique à trois dimensions,
et nous utilisons une représentation plane obtenue en projetant le noeud sur un plan. Il existe
alors de nombreux points de vue possibles, et diverses apparences d’un même noeud. Deux
noeuds de projections différentes sont-ils distincts (non isotopes) ? Dans la première table
publiée (celle de Tait et Little) le nombre minimal de croisements est utilisé comme principe
de classification (jusqu’à dix croisements) et il fallut presque un siècle pour détecter une
duplication : deux noeuds identiques avaient été pris pour différents.
Avec le temps et les efforts des mathématiciens, trois points de vue mathématiques essentiels
pour l’étude des noeuds se sont dégagés :
1. Topologique, où le noeud est conçu comme la réunion d’un nombre fini de courbes
fermées, à déformations près.
2. Algébrique, où l’on dénombre des croisements par exemple, et où l’on associe les groupes
aux nœuds.
523/2001
Sciences.ch 14/03/2005
moléculaire.
L’articulation entre ces points de vue est délicate. Il y a des évidences difficiles à prouver
rigoureusement – qu’on songe au théorème de Jordan qui affirme qu’une courbe fermée
plane, sans croisement, délimite un intérieur et un extérieur ! Il a fallu presque deux siècles
pour définir correctement la notion de courbe, et il y a des nœuds sauvages à écarter avant
toute classification. Il faut du soin pour définir correctement les déformations des noeuds, que
le mathématicien appelle "isotopies".
L’idée mathématique la plus efficace pour l’étude des noeuds est celle "d’invariant". Un
invariant d’un noeud est une caractéristique qui reste inchangée lors d’une déformation. Si
nous disposons d’un invariant, nous pouvons affirmer que deux noeuds sont vraiment
différents quand l’invariant ne prend pas la même valeur pour les deux noeuds. Mais si deux
noeuds ont le même invariant, nous ne pouvons affirmer qu’ils sont du même type
(déformable l’un en l’autre). Il faudrait pour cela disposer d’un système complet d’invariants.
Le mathématicien russe V. Vassiliev a introduit en 1990 une classe nouvelle d’invariants ; il
reste à les rendre explicitement calculables et à prouver qu’ils forment un système complet,
comme on le pense généralement.
Henri Poincaré a introduit vers 1900 la notion de groupe fondamental d’un espace, qui décrit
les possibilités de parcours avec retour au point de départ. Appliqué à l’espace extérieur à un
noeud, cela fournit le "groupe du noeud" et le polynôme d’Alexander qui lui est lié.
Il y a 15 ans, les groupes de tresses étaient une curiosité et leur complexité était rebutante.
Puis, brusquement, ils sont devenus un thème central de la recherche scientifique. Donnons
une idée de la diversité des points de vue qui mènent aux groupes de tresses :
2. En algèbre, plus précisément dans la théorie des groupes, deux avatars des groupes de
tresses (les groupes de Coxeter et les algèbres de Hecke) jouent un rôle central.
5. La théorie quantique des champs est le modèle mathématique des particules élémentaires.
Edward Witten a fait le pont entre cette théorie et les groupes de tresses, via le polynôme de
524/2001
Sciences.ch 14/03/2005
Jones.
La théorie des noeuds constitue ainsi une interface très active entre physique et
mathématiques. Les noeuds et les tresses fournissent aujourd’hui un outil de modélisation
efficace de la physique des polymères aux cristaux liquides, en passant par la biologie
moléculaire. Dans la direction opposée, les idées importées de la physique ont déclenché une
révolution en mathématiques : d’un sujet un peu marginal il y a encore 15 ans, la théorie des
nœuds est devenue aujourd’hui l’un des grands chantiers mathématiques.
NŒUDS DE TAIT
L'objectif principal de la théorie des nœuds est de classifier tous les nœuds et trouve son
origine dans la physique au début du 19ème siècle comme nous en avons déjà fait mention.
Pourquoi ?
Rappelons qu'à cette époque, les atomes étaient un mystère : pourquoi ceux-ci semblaient-ils
indestructibles et pourtant existant en tellement de variétés et capables de se combiner pour
donner d'innombrables autres composants ?
A cette époque, les plus belles équations de la physique (qui sont souvent de bons candidats
pour expliquer des choses que nous ne comprenons pas…) étaient les équations de Maxwell,
il était alors naturel (ou tentant) pour les physiciens d'essayer d'expliquer la mécanique
atomique en terme d'électromagnétisme, même si nous savons aujourd'hui que cette voie était
destinée à l'échec. Plus tard au milieu du 19ème, les ondes électromagnétiques étaient
largement conceptualisées comme des vibrations d'un milieu appelé à l'époque "éther
luminophore". Le référentiel de cet éther était alors défini (ou du moins supposé) comme étant
un référentiel absolu. Mais seulement… plus tard, les expérimentateurs Michelson et Morley,
montrèrent que le mouvement relatif de notre planète dans cet éther était indétectable (et
même pire… ils mesurèrent la constance absolue de la vitesse de lumière!). Leurs expériences
amenèrent par ailleurs Einstein et Poincaré a développer leur fameuse théorie de la relativité
restreinte (voir chapitre de mécanique relativiste)..
Il était alors à l'époque très gênant de travailler avec le concept suivant : il y a avait des ondes
sans rien qui ondulait ! Ceci du au fait, qu'à l'époque, les physiciens avaient fortement
tendance à comprendre l'électrodynamique avec des analogies mécaniques. Maxwell, par
exemple, a passé pas mal de temps à conceptualiser les champs électriques et magnétiques en
terme de "tubes fins, de section variable, transportant un fluide incompressible". Une raison
pour cela était la forme des équations de Maxwell dans le vide (voir le chapitre
d'électrodynamique) :
ce qui est, il est vrai, similaire à la mécanique des fluides (voir chapitre du même nom) où
nous avons pour un fluide incompressible sans viscosité et sans tourbillons :
Plus généralement, dans le cas où la rotationnel est non nul, Helmoltz montra en 1858
que les lignes de champ du vortex – définies par les lignes de - se déplacent dans la
direction de comme si elles avaient une existence propre (alors là c'est la brèche ouverte
525/2001
Sciences.ch 14/03/2005
bien évidemment…!). Ces lignes ne pouvaient avoir de fin mais pouvaient former des
boucles. En 1867 le mathématicien P. G. Tait (assistant de Hamilton et un champion des
quaternions) trouva une méthode ingénieuse pour démontrer cet effet en coupant un trou
circulaire dans une boîte, en remplissant celle-ci avec de la fumée, et en expulsant ensuite la
fumée par compression de l'air dans la boîte formant ainsi des cercles de fumée. Il montra par
ailleurs ceci a son ami Kelvin qui nota l'analogie avec l'électromagnétisme et proposa une
théorie dans laquelle les atomes étaient des vortex (nœuds) dans l'éther ! Il émit l'hypothèse
que les différentes types d'atomes correspondaient a différents types de vortex noués (oui c'est
un peu tiré par les cheveux mais bon…) ! Tait essaya par la suite de classifier les lignes
nouées en accord avec le nombre d'entrelacements quand celles-ci sont projetées sur un plan.
La liste que Tait obtint dans un premier temps fut les nœuds suivants (dans l'espoir d'obtenir
la tableau périodique des éléments version "éther"…) :
526/2001
Sciences.ch 14/03/2005
Remarque : ce tableau est très important nous y ferons très souvent référence lors d'exemples
applicatifs en utilisant la nomenclature qui y est proposée.
La beauté de cette théorie des "atomes vortex" résidait dans le fait qu'il était en accord avec
l'aspect continu du monde merveilleux des fluides, ou aux équations de Maxwell par
extension, pour discrétiser les différentes types d'atomes. Un difficulté cependant avec cette
théorie était la remarquable stabilité des atomes. En 1905 Kelvin admit qu'après de
nombreuses années d'échecs à tenter de prouver que le mouvement des cercles de Helmoltz
était stable, que la conclusion était que ces cercles étaient essentiellement instables et devaient
donc se dissiper. Curieusement c'est cette stabilité extrême des atomes qui fut une des pièces
527/2001
Sciences.ch 14/03/2005
La théorie mathématique des noeuds se développe alors pendant une cinquantaine d’années et
était un peu tombée en désuétude lors du coup de tonnerre de la découverte par Jones en 1984
d’un nouvel invariant des noeuds (le polynôme de Jones). La découverte de Jones est assez
exemplaire du point de vue scientifique et peut donner lieu à méditation sur l’organisation
actuelle de la science. Jones n’était pas du tout un spécialiste des noeuds. Il s’intéressait à la
classification des facteurs dans les algèbres de Von Neumann (analyse fonctionnelle). Il a
obtenu des algèbres de matrices dont les relations de commutation (équations de Yang-
Baxter) étaient proches des relations du groupe de tresses ; des tresses aux noeuds, il n’y a
qu’un pas qu’il a franchi avec l’aide de Joan Birman qui est une spécialiste des noeuds. Nous
assistons ensuite à une explosion de découvertes : version purement combinatoire, nouveaux
polynôme, etc.. En 1989, Witten montre que le polynôme de Jones peut être obtenu à partir de
la théorie quantique des champs au moyen d’une intégrale de Feynman, donnant ainsi la
première définition n’utilisant pas les projections planes du noeud. D’une certaine fa¸con la
théorie de Jones-Witten est une extension non commutative du travail de Gauss. Le groupe de
Lie (voir le chapitre de théorie des ensembles) qui intervient en magnétisme est U(1) , alors
que l’invariant de Witten est une intégrale de Feynman sur un espace de SU(2)-connections.
FORMALISATION MATHÉMATIQUE
Un noeud est modélisé mathématiquement par une application injective, différentiable et dont
la dérivée ne s’annule pas, du cercle dans l’espace orienté de dimension 3. Un problème
central est de pouvoir décider de façon calculable si le noeud est trivial (peut se défaire sans
couper la ficelle...) ou non (ce problème n’est pas résolu). Nous associe au noeud des objets
mathématiques calculables (polynômes, nombres) appelés "invariants du nœud" et qui sont
insensibles à une déformation du noeud ; si l’invariant n’est pas égal à celui du noeud trivial,
on est sûr que le noeud n’est pas trivial. Le problème est donc de trouver des invariants assez
fins. On en décrirons deux :
2. Le polynôme de Jones (introduit dans les années 85 par Vaughan Jones médaille Fields
1990), qui est assez subtil pour distinguer par exemple le noeud de trèfle droit du gauche.
528/2001
Sciences.ch 14/03/2005
Nous décrirons aussi une classe générale d’invariants : les invariants de type fini ou de
Vassiliev. Ces invariants définis de façon assez peu constructive sont peut-être des invariants
complets, mais nous ne le savons pas à ce jour. Nous décrirons le nombre d’entrelacement de
2 noeuds comme un invariant combinatoire calculable à partir d’un diagramme des noeuds.
Nous écrirons ensuite la formule intégrale classique liée au magnétisme (Gauss) pour le
calculer. Nous ferons alors un petit détour par la géométrie différentielle globale des courbes
de R3 pour montrer la formule de White qui relie 3 invariants géométriques associés à un
ruban. Nous décrirons ensuite les nouveaux invariants polynomiaux d’un point de vue
combinatoire. Le point de vue intégrales de Feynman sera évoqué.
Vassiliev a introduit une famille générale d’invariants qui contient la plupart des invariants
connus et dont nous pouvons dire qu’ils sont de type fini ; nous en décrirons le principe.
Définitions :
D1. Un nœud peut-être défini (car il existe plusieurs définitions possibles et certaines ont de
petits aléas assez embêtants...) par l'image du cercle noté par une application continue (la
ficelle étant supposée telle quelle), injective (ceci évitant que la ficelle rentre dans elle-
même) :
autrement dit, c'est une courbe sans point double, tracée dans l'espace euclidien de dimension
trois.
Un nœud est donc représenté par une application injective (imposer des
nœuds de classe permet d'éviter d'avoir des courbes trop… sauvages) vérifiant que
(nœud fermé). L'image de f est parfois appelée "support du nœud f" : c'est la
réalisation "physique" du nœud dans l'espace.
D2. Nous disons qu'un nœud est un "nœud trivial" si l'application f qui le définit se prolonge
en une application du disque continue et toujours injective : un nœud trivial est
donc un nœud qui bord un disque plongé de .
D3. Deux nœuds sont équivalents s'il existe une application continue :
telle que et . Reste donc à trouver F qui est une courbe dans l'espace des
529/2001
Sciences.ch 14/03/2005
courbes.
Pour résumer grossièrement..., un nœud est une ficelle dont nous avons soudé les deux
extrémités.
D3. Le d'un nœud K est le nombre entier naturel représentant le nombre minimum de
croisements pour tout diagramme d'un type de nœud (c'est une mesure naturelle de
complexité).
D4. L'image miroir d'un nœud K est obtenu par réflexion sur un plan dans R3. Le nœud K
peut-être construit par inversion des croisement du diagramme du nœud :
Nous pouvons acilement nous en convaincre en prenant une réflexion en pliant la page de
lecture ou encore mieux… en s'équipant du matériel adéquat et d'un mirroir (...).
D5. Deux nœuds sont dits "isotopes" si nous pouvons passer de l’un à l’autre par des
manipulations continues (le trèfle gauche et le trèfle droit ne sont par exemple pas isotopes !)
et il s'agit du problème numéro 1 de la théorie des noeuds : détecter les noeuds isotopes.
D6 Deux nœuds sont dits "équivalents" s’ils sont isotopes ou si l’un est isotope à l’image de
l’autre dans un miroir. D’après ce qui précède, chaque noeud est donc forcément équivalent à
sa propre image-miroir mais seuls les noeuds réflexifs sont isotopes à leur image dans un
miroir. Le noeud en huit est un bon exemple de ce genre de noeuds, noeuds par ailleurs
assez rares :
530/2001
Sciences.ch 14/03/2005
D7. Un "entrelac" est une sous-variété (voir chapitre de géométrie différentielle) compacte
(voir chapitre de topologie), de classe et de dimension 1. Le "nombre de composantes
connexes" de est noté . Si nous disons que E est un nœud.
La plupart du temps les entrelacs seront orientés ("orientés" dans le même sens que les
graphes orientés – voir chapitre de théorie des graphes), et nous identifierons les entrelacs
isotopes. Nous représentons donc les entrelacs dans le plan en les projetant et en spécifiant le
type de points de croisement.
Les isotopies permettent de "déméler" les entrelacs. Elle donnent dans le plan trois types de
mouvements particuliers appelés "mouvements de Reidemeister" :
531/2001
Sciences.ch 14/03/2005
Théorème : deux entrelacs sont isotopes si et seulement si nous pouvons passer de l'un à
l'autre par une suite finie de mouvements de Reidemeister.
D8. Trois entrelacs sont dits "associés" (ou "en association") s'ils ne diffèrent qu'en
un point de croisement et qu'en ce point ils sont dans une des configurations suivantes :
Nous notons l'ensemble des classes d'entrelacs et nous nous intéressons désormais à des
fonctions où A sera un anneau commutatif (le lecteur n'oubliera pas que nous
avons vu que les coefficients de polynômes sont des éléments d'un anneau).
Remarque : il faut aussi se rappeler qu'un nœud est une courbe et que toute courbe peut être
représentée par un polynôme d'où l'idée !
D9. P est dit "invariant par association" (par association des entrelacs...) si et s'il
existe inversibles (!) tel que pour tout triplet d'entrelacs associées
nous ayons :
Nous pouvons déjà démontrer de façon assez élémentaire que si un tel polynôme existe, alors
il est uniquement déterminé par les coefficients de la relation précédente. Nous résumons cela
dans le théorème suivant
Théorème : si P est invariant par association, alors il est uniquement déterminé par les
coefficients .
Démonstration :
532/2001
Sciences.ch 14/03/2005
donne :
En d'autres termes, la fonction P peut s'exprimer uniquement par ses coefficients !!! Donc
nous pourrions maintenant essayer de voir si un nœud plein d'entrelacs peut être toujours se
ramener à des de manière récursive.
REPRÉSENTATION PLANAIRE
Nous supposons que le nœud est dans l'espace euclidien de dimension trois orienté. Nous
nous intéressons aux projections de ce nœud sur le plan . Il est claire intuitivement que
nous pouvons supposer que nœud n'a aucune tangente verticale et que les points de
croisement sont seulement doubles et transversaux. Une telle projection sera appelée "bonne
projection".
Nous indiquons ensuite à chaque point de croisement quel est le brin qui passe au-dessus de
l'autre. Un tel dessin représente un nœud de façon non ambiguë : nous disons que nous avons
un "diagramme de nœud". Bien sûr, deux nœuds équivalents ont des bonnes projections qui
donnes des diagrammes de nœuds différents en général (c'est là que réside une des difficultés
aussi) Il est donc important de pouvoir lire l'équivalence de deux noeuds directement sur leurs
diagrammes. Un diagramme du nœud du trèfle droit :
533/2001
Sciences.ch 14/03/2005
Remarque : Le noeud de trèfle est le noeud ayant le nombre minimal de croisements, à savoir
3 ; il en existe en fait deux, énantiomorphes (images l'un de l'autre par réflexion). Il s'agit au
fait d'un simple noeud dont on a soudé les extrémités. Le noeud de trèfle est enfin le bord d'un
ruban de Möbius à 3 demi-torsions ainsi que le noeud torique d'ordre (3,2) (3 enroulements
autour du tore, sur deux tours), ainsi que celui d'ordre (2,3).
Comme un dessin n'est pas forcément facile à transmettre, ni à mettre dans un ordinateur,
nous pouvons aussi donner un codage du diagramme du nœud par une matrice à cœfficients
entiers à trois lignes et dont les nombre de colonnes est égal au nombre de points doubles.
Nous numérotons les 2n points de croisement sur la courbe fermée (cercle) dans l'ordre où ils
arrivent. Nous remarquons que les paries sont toutes formées d'un nombre pair et d'un nombre
impair. Nous fabriquons alors les deux premières lignes de la matrice en mettant dans chaque
colonne les deux numéros donnant la même projection : les impaires sur la première ligne, les
pairs sur la seconde. Nous ajoutons alors à chaque colonne, un qui indique l'orientation
des 2 brins (orienté) (+1 si celui de dessous traverse de droite à gauche quand nous
parcourons celui de dessus, -1 sinon). Par exemple, la matrice associée au noeud de trèfle de
la figure précédente est :
534/2001
Sciences.ch 14/03/2005
TRIGONOMÉTRIE
La trigonométrie fait partie intégrante de la science de la géométrie. Cette première ayant pour
racine "mesure de la terre" la trigonométrie a pour racine "mesure des corps a trois angles
(trigone)".
Remarques :
R2. Nous avons eu beaucoup de mal à choisir ou placer les trigonométrie dans l'étude des
mathématiques. Effectivement, certains mathématiciens définissent les fonctions
trigonométriques à partir des nombres complexes et un autre problème vient aussi du fait que
la trigonométrie utilise des concepts de la géométrie plane et spatiale. Il faut donc que le
lecteur jongle un peu avec les différentes sections du site pour avoir une présentation
rigoureuse de tous les concepts. C'est cet état de fait qui nous a amené finalement a consacrer
un chapitre seul à la trigonométrie.
R3. Le lecteur qui chercherait la démonstration des dérivées et intégrales des fonctions
trigonométriques définies ci-après devra se reporter au chapitre de calcul différentiel et
intégral où les dérivées et intégrales des fonctions usuelles que nous pouvons trouver dans les
formulaires sont toutes démontrées.
RADIAN
Quand nous parlons de trigonométrie, la première chose qui devrait venir à l'esprit et
s'imposer comme tel comme standard de mesures d'angles plans (voir le chapitre de géométrie
plane pour la définition du concept d'angle) est la notion de "radians".
Définition : 1 radian (noté [rad]) est l'angle plan décrit par une sécante à un cercle, passant par
son centre, tel que l'arc de cercle ainsi défini par l'axe horizontal passant par le centre du
cercle et la sécante soit d'égale longueur au rayon de ce cercle.
Dès lors il vient que l'angle pour "un tour" du cercle sera de :
L'exemple précédent se généralise à un cercle de rayon quelconque car l'angle pour un tour
535/2001
Sciences.ch 14/03/2005
Malheureusement dans les écoles, les professeurs du primaire apprennent encore aux enfants à
mesurer les angles en degrés. Heureusement la conversion à faire n'est pas trop difficile…
(c'est une simple règle de trois).
Soit la mesure d'un angle en radians, la mesure du même angle en degrés et les
mesure du même angle en grades (vieille unité) nous avons évidemment par définition :
Les astronomes et astrophysiciens aiment bien parler en minutes ou secondes d'arc tel que :
TRIGONOMÉTRIE DU CERCLE
Soit la figure ci-dessous représentant un cercle quelconque centré à l'origine dans une base
directe :
A partir de cette représentation, nous pouvons définir des êtres mathématiques nommés
"fonctions trigonométriques" telles que (pour les plus importantes):
536/2001
Sciences.ch 14/03/2005
Remarque : lisez "cosinus" pour "cos", "sinus" pour "sin", "tangente" pour "tan", "cotangente"
pour "ctg", "sécante" pour "sec", "cosécante" pour "csc".
A partir des ces fonctions, nous pouvons faire des combinaisons et tirer des relations
remarquables très simples mais dont l'utilité profonde est discutable (et qui sont très peu
utilisées) telles que :
Propriétés :
P1. Si nous nous plaçons dans l'étude du cercle dit "cercle trigonométrique", il faut poser pour
les définitions ci-dessus . Ainsi, apparaît plus nettement le sens physique de ces
définitions et il en découlera une nombre de propriétés et d'applications directement
exploitables dans la physique théorique et la mathématique pure.
537/2001
Sciences.ch 14/03/2005
d'où:
idem pour toutes les fonction trigonométrique qui découlent de la définition des fonctions
sinus et cosinus.
P3.
Par définition, sinus et le cosinus de tout nombre réel font partie de l’intervalle . Plus
précisément, la position de nous permet d'en savoir plus sur le cosinus et le sinus de .
Ainsi :
Il existe également une autre représentation des fonction trigonométrique du cercle, un peu
plus technique au sens visuel mais assez important pour bien comprendre, plus tard, la
538/2001
Sciences.ch 14/03/2005
mécanique ondulatoire :
et également:
A partir de ces dernières relations nous tirons sans trop de peine que:
539/2001
Sciences.ch 14/03/2005
et
Voici les schémas qui résument la manière d'analyse de quelques de ces propriétés (pour les
autres relations, la méthode est dentique):
RELATIONS REMARQUABLES
Le dessin ci-dessous va nous permettre d'établir des relations qui permettront de résoudre des
équations impliquant des fonctions trigonométriques (toutes ces relations sont de première
540/2001
Sciences.ch 14/03/2005
Donc:
En résumé:
et d'où:
d'où:
541/2001
Sciences.ch 14/03/2005
et d'où:
qui implique:
et évidemment:
d'où:
Nous obtenons également de manière triviale des relations précédentes (nous faisons un petit
mélange et nous secouons…):
et
542/2001
Sciences.ch 14/03/2005
avec :
d'où :
avec :
d'où :
(1)
(2)
Posons et d'où et .
543/2001
Sciences.ch 14/03/2005
et par différence:
et par différence:
THÉORÈME DU COSINUS
Dans un triangle quelconque, le carré d'un des deux côtés est égal à la somme des autres
diminués du double produit de ces deux côtés par le cosinus de l'angle compris entre eux :
544/2001
Sciences.ch 14/03/2005
Démonstration:
Par permutation circulaire, nous obtenons les deux autres relations connues.
THÉORÈME DU SINUS
Cet ensemble d'égalités est appelé "théorème du sinus". Dans les formulaires, ce théorème est
souvent donné sous la forme :
Evidemment, il n'y a pas ici toutes le relations trigonométriques existantes comme nous
l'avons déjà dit, mais au moins les plus importantes qu'il faut savoir retrouver lors de l'étude
de systèmes physiques.
TRIGONOMÉTRIE HYPERBOLIQUE
Nous avons démontré en analyse fonctionnelle que toute fonction peut se décomposer
545/2001
Sciences.ch 14/03/2005
Rappelons lors de notre étude des nombres complexes que nous avions démontré que :
Nous définissons alors par analogie le sinus et le cosinus hyperbolique (nous démontrerons la
provenance de ce terme plus loin) par :
Remarque : chose intéressante, nous pouvons travailler en trigonométrie avec des angles
complexes. Effectivement, si nous posons , nous avons alors :
Or :
Donc :
Donc la fonction hyperbolique d'un angle complexe existe et l'image en est un nombre
complexe aussi. Nous pouvons ainsi voir abusivement la géométrie hyperbolique comme une
sorte de généralisation de la trigonométrie du cercle aux angles réels et complexes.
546/2001
Sciences.ch 14/03/2005
(auquel cas, nous rajouterons la démonstration) que nous avons par opposition :
Posons maintenant :
Or, comme nous le verrons lors de notre étude des coniques dans le chapitre de géométrie
euclidienne :
1. la première de ces deux relations, constitue pour l'ensemble de définition donné, un cercle
de rayon unité centré à l'origine. Le lecteur remarquera qu'il est assez curieux pour la
trigonométrie du cercle d'obtenir un cercle…
2. la deuxième de ces deux relations, constitue pour l'ensemble de définition donné, une
hyperbole équilatérale orientée selon l'axe dont le sommet est à et de foyer
. Le lecteur remarquer à nouveau qu'il est assez curieux pour la trigonométrie
hyperbolique d'obtenir une hyperbole…
Ces deux dernières constations devraient permettre, nous l'espérons, au lecteur de comprendre
l'origine du nom de la trigonométrie hyperbolique et de constater que l'étude la trigonométrie
hyperbolique sur l'hyperbole est l'analogue de l'étude de la trigonométrie du cercle sur le
cercle.
547/2001
Sciences.ch 14/03/2005
Explications :
Nous voyons apparaitrre sur la figure plusieurs valeurs des fonctions hyperboliques
correspondant à mais aussi etc. Entre autres, le cercle
coupe l'axe Ox en deux points dont les abscisses sont et .
Si le lecteur veut s'assure de cette constat de faits que donne la figure, il pourra contrôler qu'en
tout point de l'hyperbole, nous avons toujours les relations (entre autres) :
Nous obtenons (ça c'est juste pour avoir vu une fois à quoi ressemble ces fonctions) :
548/2001
Sciences.ch 14/03/2005
RELATIONS REMARQUABLES
A partir de ces définitions et à l'aide des opérations élémentaires d'algèbre nous pouvons
déterminer le relations remarquables suivante (c'est beaucoup plus facile que la détermination
de relations remarquables de la trigonométrie du cercle, donc sauf demande nous donnons ces
relations sans démonstration) :
Egalement :
et encore :
549/2001
Sciences.ch 14/03/2005
et encore :
TRIGONOMÉTRIE SPHÉRIQUE
550/2001
Sciences.ch 14/03/2005
L'angle entre les points et , noté , n'a pas pu être représenté sur le schéma ci-dessus
faute de place.
Rappelons que le périmètre d'un cercle de rayon unité sur la sphère de rayon unité vaut bien
évidemment . Le périmètre du cercle en fonction de l'angle d'ouverture de ce dernier
étant donnée par:
Si le cercle à rayon (comme c'est le cas pour notre sphère), le calcul de la longueur d'arc
se simplifie et devient:
Conséquence relativement aux points sur notre sphère; les côtés du triangle sont donnés par:
Considérons maintenant le produit scalaire (voir le chapitre traitant du calcul vectoriel dans la
section d'algèbre) :
551/2001
Sciences.ch 14/03/2005
Si nous décomposons les deux vecteurs et sur les vecteurs tangents unités nous
avons:
et comme:
Nous avons:
relation dit "relation fondamentale" que nous pouvons tout aussi bien écrire:
Cette dernière relation est invariante par permutation circulaire des variables .
Il est que les sinus de tous les angles sont positifs (puisque inférieurs à ), ainsi nous
pouvons écrire:
552/2001
Sciences.ch 14/03/2005
Cette dernière relation est bien évidemment également invariante par permutation circulaire
des variables . Donc nous obtenons une relation remarquable du triangle sphérique,
appelée "relation des sinus":
Comme la trigonométrie sphérique est souvent utilisée pour des repérages terrestres, avec
souvent 2 cercles très particuliers et orthogonaux : l'équateur terrestre et une méridien ou un
parallèle quelconque et un méridien, ce cas revêt un intérêt particulier. Le lecteur pourra
s'exercer à retrouver les relations ci-dessous. Dans le cas d'un triangle rectangle en nous
avons bien évidemment:
Tout les relations que nous avons déterminées jusqu'à maintenant nous permettent dans le cas
où de tirer des relations très intéressantes pour la géophysique:
Evidemment, je nous n'avons pas présenté ici toutes le relations de trigonométrie sphérique
existantes, mais au moins les plus importantes qu'il faut savoir retrouver.
Pendant que nous y somme, profitons-en pour calculer un problème classique qui est celui de
la surface d'un triangle sur une sphère. Soit la figure:
553/2001
Sciences.ch 14/03/2005
nous obtenons alors la moitié de la sphère , mais le triangle géodésique de surface a été
compté trois fois : il faut enlever deux fois sa surface pour obtenir la surface d'une demi-
sphère. Donc:
554/2001
Sciences.ch 14/03/2005
Il est assez simple de généraliser ce concept à d'autres formes du même acabit (en particulier
celles composées de triangles…).
ANGLE SOLIDE
Il se pose le problème dans la géométrie spatiale le concept d'angle d'ouverture d'une portion
de l'espace (en extension à l'angle dit "angle plan"). Nous définissons alors l'angle solide
par la mesure de la portion d'espace limitée par une surface conique de sommet et nous
l'exprimons en stéradian, défini par le rapport :
étant l'aire de la calotte découpée par le cône sur une sphère de rayon .
Si est le demi-angle du cône, nous obtenons pour ce rapport (pour le calcul de la calotte
d'une surface sphérique voir le chapitre traitant des formes géométriques) :
D'où l'on conclut que l'angle solide total vaut par définition :
Nous pouvons également calculer "l'angle solide élémentaire" tel que représenté ci-dessous :
555/2001
Sciences.ch 14/03/2005
Nous considérons une surface quelconque passant par le point . découpe sur cette
surface une portion .
Si nous traçons la sphère de centre et de rayon , cet angle solide découpe sur cette
sphère une calotte d'aire :
d'où :
Ce concept d'angle solide nous sera très utile en partie dans le domaine de la physique
théorique qui traite du rayonnement thermique (voir chapitre d'optique et de
thermodynamique).
Nous pouvons encore calculer à partir des concepts précédents, "l'angle solide élémentaire" de
révolution tel que présenté sur la figure ci-dessous :
556/2001
Sciences.ch 14/03/2005
Il est compris entre deux angles solides de révolution dont les demi-angles au sommet
diffèrent de .
où :
557/2001
Sciences.ch 14/03/2005
GÉOMÉTRIE EUCLIDIENNE
Nous allons procéder dans ce chapitre un peu comme Euclide dans son ouvrage "Eléments".
C'est-à-dire qu'après avoir défini les notions de dimension, de point, de segment, de droite, de
plan, d'angle, de triangle et de cercle, dans lesquelles seront présentées sous forme diluée les 5
axiomes d'Euclide (rappelons qu'un axiome est non-démontrable par définition), nous les
condenserons dans un sous-chapitre qui leur sera exclusivement consacré. Ensuite, nous
présenterons une extension de ses axiomes que nous devons à Hilbert.
Remarques :
R1. Nous avons tenté de préserver au mieux les notations propres à Euclide.
R2. La forme actuelle de l'étude de la géométrie de nous plait guère (y compris le texte que
nous avons rédigé ci-dessous). Par ailleurs, la géométrie est souvent vu comme l'équivalent de
la thermodynamique en physique, c'est-à-dire : rébarbative, trop de termes et de vocabulaire
pour parler de choses semblabes, démonstrations discutables. C'est pourquoi une fois que
nous aurons terminé de rédiger les points les plus importants de la géométrie plane sous forme
traditionnelel nous tenterons de remanier le tout pour le formuler autrement (les axiomes
restant).
D1. La notion expérimentale la plus simple est celle de "volume". Nous disons qu'un corps
occupe un certain volume lorsqu'il occupe dans l'espace à trois dimensions une certaine place
(pour des espace à des dimensions supérieures, nous parlons d'hyper-volumes).
D2. Nous admettrons comme une chose évidente qu'un volume est limité par une "surface";
mais si l'existence du volume est physiquement contrôlable et mesurable, la surface est une
création de l'esprit; c'est quelque chose d'analogue à une baudruche, par exemple, enveloppant
un volume quelconque, mais d'analogue seulement. C'est un être géométrique à deux
dimensions sans épaisseur.
D3. Lorsqu'une surface est limitée, cette limite est une "ligne". Ici encore, la ligne est une
création de l'esprit, une ligne n'a pas d'existence expérimentale; c'est quelque chose
d'analogue à la figure formée par un fil de fer. Etre géométrique encore mais d'une dimension
sans hauteur ni largeur..
558/2001
Sciences.ch 14/03/2005
D4. Quand une ligne est limitée , sa limite est un "point": le point est quelque chose
d'analogue à l'intersection de deux fils tendus. C'est encore une création de l'esprit, un être
géométrique.
Remarque : il est d'usage, en géométrie, de représenter un point par une lettre , ,…; une
ligne, ou une surface par une lettre entre parenthèses (mais cela est rarement respecté car nous
supposons souvent que le lecteur sait de quoi nous parlons). Nous disons aloars, par exemple:
la ligne , la surface .
Remarques :
R1. L'expression "la segment " désigne en général une ligne limitée par les points et
. Nous dirons qu'un point est sur le segment , pour traduire le fait suivant: tout
segment peut être séparé d'une infinité de façons en deux morceaux limités par et
d'une part, par et d'autre part – fait inspiré au géomètre par la possibilité de couper
expérimentalement un bout de fil de fer en deux, et cela d'une infinité de façons (nous y
reviendrons lors de l'axiomatisation)
R2. Lorsqu'un point est sur le segment sans que sa position sur cette ligne soit
précisée, nous disons qu'il "décrit" cette ligne.
R3. L'expression: "la ligne est tracée sur une surface " signifie que la surface
pourrait être divisée en plusieurs morceaux, de manière que la ligne soit la frontière ou
une partie de frontière d'un de ces morceaux. Cette définition est inspirée du fait qu'il est
possible de découper une étoffe, par exemple, en suivant avec des ciseaux un trait quelconque
tracé sur cette étoffe.
R4. Lorsqu'un ligne est tracée sur une surface , tout point qui est situé sur la ligne
est aussi, par définition, situé sur la surface . On dit que c'est un point de cette
surface.
DIMENSIONS
Nous avons parlé de volume, surface et de ligne auxquelles nous pouvons associées des
dimensions. Mais qu'est-ce une dimension. Nous allons tacher d'essayer de définir au mieux
ces dernières. D'abord, il faut savoir qu'il existe en géométrie plusieurs types de dimensions.
La plus connue et commune est celle que nous appelons la "dimension topologique".
559/2001
Sciences.ch 14/03/2005
Pour calculer la dimension de certains objets, nous allons utiliser la méthode de la géométrie
métrique plane qui consiste à un étalon de cet objet, c'est à dire cet objet lui même mais en
plus petit, et nous allons le reporter sur notre objet un certain nombre de fois :
Soit la longueur totale du segment. Nous allons prendre un étalon de longueur que nous
allons reporter sur le segment. Cet étalon sera reporté fois. Nous remarquons que:
Soit la surface totale du carré. Cette fois, nous prenons un autre carré, plus petit, de côté
et de surface . Nous reportons le petit carré sur le grand fois pour obtenir la
surface du grand carré. Nous remarquons que:
Dans ces deux exemples, nous avons fait apparaître le nombre 1 pour le segment, et le nombre
2 pour le carré. Ces nombres sont la "dimension" de l'objet.
560/2001
Sciences.ch 14/03/2005
Généralisons: soit le nombre de fois que nous reportons l'étalon de longueur sur notre
objet de longueur , et soit la dimension de l'objet, nous avons:
Dans le cas des fractales (voir la section d'analyse numérique du site) les dimensions sont
variables et fractionnaires. Considérons la courbe de Von Koch (par exemple) après une
itération de la suite la définissant:
Soit sa taille tel que . Pour calculer sa dimension nous prenons l'élément fondamental
de la courbe (ci-dessous en rouge):
Soit la taille de cet étalon tel que . Nous voyons très bien que nous pouvons le
reporter 4 fois sur la courbe. Donc:
Nous pouvons donc calculer la dimension de n'importe quels objets fractals à la condition de
connaitre leurs mesures.
Ne nous hasardons pas à aller chercher des objets complexes dans quelques galaxies alors que
la fractale la plus connue se trouve dans votre assiette. Eh oui ! Le chou-fleur est bien un
fractal ! Vous avez sûrement déjà remarqué que quand nous découpons le chou-fleur, nous le
cassons au lieu de le couper, et ça donne plein de petits choux-fleurs, qui eux même peuvent
donner d'autres plus petits choux-fleurs. Cette particuarité d'auto-similarité à différentes
échelles fait du chou-fleur un fractal.
561/2001
Sciences.ch 14/03/2005
Il existe également d'autres dimensions. Prenons pour exemple, les dimensions d'homothétie
dont voici quelques exemples simples:
Le cube, de dimension 3 à par homothétie vu son volume doubler et nous remarquons que:
Comme vous pouvez le voir, il s'agit toujours d'une valeur entière mais d'une autre type de
dimension.
LA LIGNE DROITE
La figure géométrique la plus simple (mis à part le point...) est la "ligne droite". C'est celle
dont l'image est donné par un fil tendu d'épaisseur nulle et de longueur infinie. Nous pouvons
également définir la "droite" comme une infinité de points mis à côté les uns des autres dans
une même direction sur un plan
Nous constatons également dans notre environnement le fait suivant (nous reviendrons sur
cette observation lors de notre énumération des 5 axiomes d'Euclide) : deux fils tendus ayant
mêmes extrémités sont confondus.
Le mathématicien devra admettre l'axiome suivant comme étant dans dans un espace plat
562/2001
Sciences.ch 14/03/2005
suffisamment consistant :
AXIOME DE PROLONGEMENT
Enoncé (premier axiome d'Euclide) : par deux points distincts et , il passe une droite et il
n'en passe qu'une seule
Autrement dit:
Deux droites et qui ont deux points communs sont confondues, tout point de l'une
est un point de l'autre et réciproquement.
Il résulte de cette proposition que deux droites et , ou bien n'ont aucun point
commun (nous disdons alors qu'elles ne se coupent pas ou qu'elles ne sont pas "sécantes"), ou
bien ont un seul point commun (elles sont alors sécantes et distinctes) qui s'appelle "point
d'intersection", ou bien ont plus d'un point commun (elles sont alors confondues). Nous
constatons que ces trois hypothèses correspondent à des faites expérimentaux très facilement
réalisable.
DEMI-DROITE
Nous disons que deux demi-droites , sont "opposées" lorsqu'elles constituent la droite
toute entière.
SEGMENT
Nous appelons "segment" une portion de droite limitée par deux points et . Ces
points sont appelés les "extrémités" du segment.
Nous disons que des figures géométriques sont des "grandeurs de même espèce" lorsqu'il est
possible de définir:
1. Dans quel cas une figure ( ) sera dite égale à une figure ( ) et , si elles sont inégales,
laquelle est la plus petite
2. Ce que nous devonst entendre par somme d'une figure ( ) et d'une figure ( )
Les définitions choisies doivent être telles que si ( ) est déclaré plus petit que ( ) et ( )
plus petit que (C), ( ) soit déclaré aussi plus petit que (C); il faut, en outre, que la figure
appelée somme de ( ) et de ( ) soit égale à celle qui est appelée somme de ( ) et de ( ).
Enfin, la substitution dans une comparaison, une égalité ou une somme, d'une figure par une
figure égale ne doit pas modifier le résultat des opérations.
563/2001
Sciences.ch 14/03/2005
Pour faire comprendre ce que sont des grandeurs de même espèce, prenons l'exemple des
segments de droite. Nous admettrons qu'il est possible de décider de l'égalité de deux
segments et lorsque nous pouvons les faire coïncider. Nous admettrons aussi
qu'il est possible de remplacer le segment par un segment égal et porté sur la
demi-droite . Enfin, nous admettrons qu'il est possible de distinguer entre trois points ,
, , pris au hasard sur une droite, lequel est entre les deux autres.
Nous convenons alors de dire que le segment est plus petit que le segment , ce qui
s'écrit en abrégé:
Considérons toujours des grandeurs de même espèce. Ajouter entre elles plusieurs de ces
grandeurs, c'est ajouter l'une d'elles à une autre, la somme obtenue à une troisième, etc. Par
exemple, ajouter les segments , , , c'est ajouter et ce qui donne .
Nous résumons l'opération en écrivant:
Multiplier une grandeur par un nombre entier , c'est ajouter grandeurs égales à celle-là.
Par exemple, si nous avons , la relation précédente s'écrirait:
Nous allons définir ce que nous appelons "comparer deux grandeurs ( ) et ( ) de même
espèce" :
564/2001
Sciences.ch 14/03/2005
et
Prenons alors, par exemple, deux segments , . Pour réaliser l'opération précédente,
utilisons une règle graduée dont l'unités sera la grandeur , ici un segment arbitrairement
choisi. Nous appliquons le zéro de la règle en , et s'intercale entre deux graduations de la
règle numérotée et ; pour , le zéro étant en ', et ' s'intercale entre deux
grandeurs de la règle numérotée et . Nous exprimerons le résultat de ces mesures en
écrivant:
Définition: nous appelons "mesure d'une grandeur" ( ) le nombre positif qui mesure le
rapport de cette grandeur et d'une grandeur ( ) arbitrairement choisie et que nous appelons
"l'unité".
Nous pouvons démontrer que si est la mesure de ( ), celle de ( ) évaluées toutes deux
avec une même unité ( ), le nombre ( )/( ) est égal au rapport / . Ce rapport étant
indépendant de l'unité choisie.
Remarque : nous disons que ( ) est une "partie aliquote" de ( ) si le rapport ( )/( ) est un
nombre entier.
Nous conviendrons une fois pour toute, qu'en géométrie toutes les grandeurs de même espèce
qui interviennent dans une figure donnée sont mesurées avec la même unité.
565/2001
Sciences.ch 14/03/2005
Par conséquent: Le rapport de deux grandeurs ( ) et ( ) est égal au rapport des grandeurs
homologues et .
Si, en particulier, les grandeurs ( ), ( )… sont mesurées avec une unité ( ), et si les
grandeurs , ,… sont mesurées avec une unité , homologue de ( ), les rapport
égaux :
( )/( ) et /
Les mesures de deux grandeurs homologues ( ) et sont égales, à condition que les
unités choisies pour les mesurer soient des grandeurs homologues.
Enoncé (deuxième axiome d'Euclide) : tout segment est prolongeable en une droite
passant par et (compte tenu du premier axiome, elle est unique)
Une conséquence de cette hypothèse est qu'il existe un point, et un seul, qui divise le
segment en parties égales. Ce point est le point de la demi-droite , tel que:
Théorème: Il existe un point et un seul, situé sur le segment tel que le rapport
soit égal à un nombre positif donné .
Pour que ce rapport soit égal à , il faut, et il suffit, que soit solution de l'équation:
566/2001
Sciences.ch 14/03/2005
Démonstration :
Pour que ce rapport soit égal à , il faut, et il suffit que soit solution de l'équation:
qui est bien positive et supérieure à . A cette valeur positive et supérieure à 1de
correspond un point et un seul de la demi-droite . Ce point satisfait, et satisfait
seul aux conditions imposées d'uncitié.
567/2001
Sciences.ch 14/03/2005
PLAN
Considérons une surface finie et deux points et de cette surface. Deux cas peuvent
se présenter:
1. Il y a des points de la droite qui ne sont pas sur la surface . Nous dirons dans ce
cas: la droite coupe la surface; les points communs à la droite et à la surface
sont les points d'intersection de la surface et de la droite . Parmi ces points communs
se trouvent, en particulier les points et .
2.) Tous les points de la droite sont des points de la surface . Nous disons alors que la
droite est sur la surface (S).
Définition : nous appelons "plan" la surface telle que toute droite qui joint deux points
arbitrairement choisis sur la surface, soit sur la surface.
Nous admettrons qu'une pareille surface existe et que par trois points , non alignés, il
passe un plan et un seul. L'étude des plans sera faite ultérieurement: nous nous proposons
actuellement l'étude des figures géométriques tracées dans un plan donné, figures dites
"planes". Leur étude constitue la "géométrie plane". Dans la pratique, les figures sont tracées
soit sur une feuille de papier, soit sur la surface du tableau noir; nous admettrons que ces
surfaces sont des images suffisantes de la surface appelée plan.
DÉPLACEMENT ET RETOURNEMENT
Soit un dessin effectué sur un tableau plan: effectuons sur un papier transparent, dont le
recto est appliqué sur le plan du tableau, un calque du dessin . Effectuons, en
appliquant ce calque en un autre point du tableau, un nouveau dessin identique à .
Définition : si le recto du papier transparent est demeuré appliqué sur le tableau, le dessin
se déduit de par une opération appelée "déplacement"; si, au contraire, le papier a
été retourné, et si c'est le verso qui est appliqué sur le tableau, l'opération s'appelle
"retournement".
A chaque point du dessin , l'une quelconque de ces deux opérations fait correspondre
un point ' du dessin , que nous appelons "l'homologue" de . Un segment de
vient en coïncidence avec un segment homologue de ; ces deux segments sont
par définition égaux et cela quels que soient et .
568/2001
Sciences.ch 14/03/2005
ANGLES
Nous avons déjà (trop) brièvement défini le concept "d'angle" dans le chapitre précédent
traitant de la trigonométrie. Nous allons maintenant y revenir plus en détail et en voir les
concepts sous-jacents :
Définitions :
D1. Nous appelons "angle" (ou "angle plan) ou plus rigoureusement "angle rectiligne" la
portion de plan limitée par deux demi-droites , , par exemple. Le point 0 s'appelle
"sommet" de l'angle, les demi-droites , , s'appellent les "côtés" de l'angle.
D2. Nous appelons "angle formé par deux segment , ", l'angle de sommet dont les
côtés sont les demi-droites , .
D3. Les demi-droites , divisent le plan en deux régions: elles définissent donc deux
angles: l'un constitué par la région couverte de hachures (voir la figure à l'extrémité gauche ci-
dessous) s'appelle "angle saillant"; l'autre, constitué par la région couverte de hachures (voir la
figure au centre ci-dessous) s'appelle "angle rentrant".
La notation ou désigne un de ces deux angles: la lettre qui indique le sommet doit
être écrite au milieu. Lorsque aucune précision n'accompagne cette notation, elle représente
par définition l'angle saillant !!
D4. Nous appelons "angles adjacents" deux angles qui ont le somment et un côté communs et
qui sont placés de part et d'autre de ce côté commun. Sur la figure ci-dessus à l'extrême droite,
les angles saillants , , sont adjacents.
Soit, , deux angles d'un même plan. Nous avons admis précédemment qu'il
existe un déplacement qui amène en et en un point de la demi-droite ; ce
déplacement amène soit en , de manière que les deux angles , ne soient
pas adjacents, soit en , de manière que et soient adjacents. Dans ce dernier
cas, un demi-tour supplémentaire autour de amènera dans la position . Ce
déplacement et ce retournement, s'il y a lieu, remplace par un angle , égal par
définition.
569/2001
Sciences.ch 14/03/2005
Si est confondu avec , il y a des points de l'un des deux angles et qui
sont égaux, tout point de l'un étant un point de l'autre : nous dirons, dans ce cas, que les angles
, sont "égaux", ce qui s'exprime par l'égalité .
Si n'est pas confondu avec , il y a des points de l'un des deux angles , par
exemple, qui ne sont pas des points de . Sur la figure ci-dessus, l'angle est couvert
de hachures, l'angle également; les points dont nous parlons sont ceux de l'angle
couvert une seule fois de hachures. Nous conviendrons de dire que l'angle et,
par conséquent, l'angle égal à sont, dans ce cas, plus grands que l'angle , ce qui
s'exprime par l'inégalité .
1. Soit et les deux angles à additionner (voir figure ci-dessous à gauche). Par
définition, la somme de ces angles est l'angle , ce que l'on exprime par l'égalité :
Dans ce cas, la somme des angles et est égale à augmenté de deux angles
570/2001
Sciences.ch 14/03/2005
plats (voir un peu plus loin pour la définition), ce qui s'exprime en écrivant :
Nous avons défini l'égalité et la somme de deux ou plusieurs angles. Ces définitions satisfont
aux conditions de grandeurs de même espèce que nous avons déjà vues précédemment.
Choisissons donc arbitrairement un angle du plan , qui sera l'unité d'angle pour le plan: la
mesure du rapport , effectuée comme il a été expliqué précédemment lors de notre
discussion sur les grandeurs de même espèce, sera un nombre positif , appelé par
définition : "mesure de l'angle , avec l'unité choisie ".
Nous désignons par la lettre grecque (lire "pi") minuscule la mesure d'un angle
plat. Comme tous les angles du plan sont plus petits que deux angles plats, le nombre (qui
est la mesure de ) doit être inférieur à .
Nous n'insistons pas sur le fait évident que les égalités ou sont
571/2001
Sciences.ch 14/03/2005
Le nombre entier qui s'introduit dans ce calcul a une valeur qui pourrait être précisée, mais
qui n'a pour le géomètre aucune importance, comme nous pourrons le constater
ultérieurement. Nous décidons donc de ne pas écrire en géométrie le inutile (mais sous-
entendu). Egalement, nous décidons par convention d'écrire:
Ainsi, nous avons cette convention d'écriture signifie que est la mesure de
l'angle si nous avons .
Remarques:
R1. Il existe un nombre entier positif et un seul, tel que nous ayons ,
c'est-à-dire:
R2 Dire que est la mesure de l'angle suppose que nous ayons et entraîne
l'égalité . Mais écrire n'entraîne en général, que soit la mesure de
; il faut, en outre, que l'on ait .
SYSTÈMES D'UNITÉS
Tous les calculs anciens sont effectués en degrés; les sous-multiples du degré sont: "la minute
sexagésimale", égale au 60ème du degré, et la "seconde sexagésimale", égale au 60ème de la
minute sexagésimale. La notation se lit: trente degrés, dix-huit minutes, onze
secondes. Nous utilisons encore aujourd'hui couramment le degré dans les écoles mais sans la
notation usant des minutes et secondes (pas commode pour la somme des angles). Nous
572/2001
Sciences.ch 14/03/2005
notons alors l'angle en degrés avec une notation décimale comme par exemple
Le grade est également une ancienne unité d'angle. Ses sous-multiples sont: la "minute
centésimale", égale au 100ème du grade, et la "seconde sexagésimale", égale au 100ème de la
minute centésimale. La notation se lit: quarante grades, dix-huit minutes,
vingt-quatre secondes.
Remarque : aujourd'hui nous devrions utiliser le "radian" comme unité d'angle internationale.
Ainsi un angle plat est égal à et tous les autres angles sont des multiples réels de cette
constante dont nous donnons une des origines dans le calcul du perimètre d'un cercle dans le
chapitre traitant des algorithmes dans la seciton d'analyse numérique. Nous avons également
déjà défini dans le chapitre de trigonométrie ce qu'était un radian, nous ne reviendrons donc
pas dessus.
Définitions :
D1. Nous appelons "angle droit", tout angle égal à la moitié d'un angle plat. La mesure d'un
angle droit est de (90° degrés, ou 100 grades).
D2. Nous appelons angle aigu", tout angle inférieur à un angle droit; "angle obtus" tout angle
supérieur à un angle droit.
D3. Nous disons que deux angles sont "supplémentaires" lorsque leur somme vaut deux
angles droits; si est la mesure de l'un, est trivialement celle de l'autre. La condition
nécessaire et suffisante pour que deux angles adjacents , soient supplémentaires
est que les côtés non adjacents , soient deux demi-droites opposées.
D4. Nous disons que deux angles sont "complémentaires" lorsque leur somme vaut un angle
droit. Si la mesure de l'un est , celle de l'autre est trivialement de . Deux angles
complémentaires sont évidemment aigus par définition.
DROITES PERPENDICULAIRES
Il est évident que deux droites sécantes forment quatre angles plans dont les
mesures sont:
573/2001
Sciences.ch 14/03/2005
parce que chacun d'eux est supplémentaire du précédent. Cela nous amène à la définition
suivante :
Théorème: il existe une demi-droite et une seule qui divise un angle donné en
deux parties égales.
Définition: nous appelons "bissectrice" d'un angle , la droite dont une moitié divise
en partie égales l'angle saillant et la seconde moitié l'angle rentrant .
Deux droites et qui se coupent forment comme nous l'avons déjà vu, quatre angles:
Les angles et , dont les côtés sont opposés, sont dites "opposés par le sommet".
De même, les angles . Si est la mesure de l'angle , la mesure de l'angle
574/2001
Sciences.ch 14/03/2005
4. Les bissectrices des angles formés par deux sécantes sont deux droites rectangulaires, que
nous appelons, par abréviation, "bissectrice de ces deux droites".
TRIANGLES
Nous avions étudié jusqu'à présent le concept de dimensions, de point, de segment, de ligne,
d'angle et de plan ouvert (infini). Cependant un plan peut-être délimité par plusieurs lignes
pour obtenir ainsi des formes géométriques dont les plus simples peuvent être considérées
commes les triangles.
Définitions : nous appelons "triangle" la figure formée par trois segments , les
points n'étant pas alignés. Les segments , sont les "côtés" du triangle.
Les points sont les "sommets" du triangle. L'angle saillant , qui contient toues
les points du côté , s'appelle angle du triangle; nous emploions la notation lorsque
aucune confusion n'est possible; à défaut, nous utilisons la notation avec le même sens.
Définitions :
D1. Le côté d'un triangle compris dans l'angle est dit "côté opposé" à cet angle: nous
575/2001
Sciences.ch 14/03/2005
D2. Nous disons que deux triangles sont égaux lorsque nous pouvons par un déplacement soit
par un retournement ou les deux combinés, superposer tous les somment du premier triangle
au deuxième. Nous disons alors aussi que les triangles sont "homologues".
La somme des angles d'un triangle plan est toujours égale à 180° (ou radians). La
démonstration est assez simple :
1. Les angles bleus ont même mesure car ils sont alternes-internes (les droites ( ) et
étant parallèles).
Remarque : pour la démonstration de l'égalité des angles alternes-internes voir plus loin le
quatrième axiome d'Euclide.
2. De même, les angles verts ont même mesure car ils sont alternes-internes.
3. Nous remarquons que la somme des angles bleu + rouge + vert forme un angle plat en ,
puisque est une droite. Donc angle bleu + angle rouge + angle vert = 180°.
4. D'après les égalités d'angles constatées en (1.) et (2.), nous déduisons que :
Cette démonstration étant valable quel que soit le triangle tracé dans le plan.
TRIANGLES ÉGAUX
Définition: Nous disons que deux triangles sont "égaux" lorsque soit:
576/2001
Sciences.ch 14/03/2005
Démonstrations :
Premier cas d'égalité : deux triangles qui ont un côté égal , compris entre deux
angles égaux , sont égaux.
Deuxième cas d'égalité : deux triangles qui ont un angle égal compris entre deux côtés
égaux sont égaux.
577/2001
Sciences.ch 14/03/2005
TRIANGLE ISOCÈLE
Définition: nous disons qu'un triangle est "isocèle" lorsque deux de ses côtés sont égaux
("iso" signifiant "même") et sont égaux. Le troisième côté est alors appelé la
"base" de ce triangle.
Remarque : nous disons qu'un triangle est "scalène" quand il n'est pas isocèle.
LIEU GÉOMETRIQUE
Définition : nous appelons "lieu géométrique" d'un point , assujetti à des conditions,
578/2001
Sciences.ch 14/03/2005
l'ensemble des positions occupées par le point . Nous bornerons l'étude des lieux en
géométrie plane, au seul cas où les conditions imposées suffisent pour que le point décrive un
arc de courbe noté .
Pour démontrer qu'un arc de courbe est un lieu géométrique défini par un ensemble de
conditions, nous devons établir dans un ordre arbitraire:
1. Que les conditions imposées sont suffisantes, c'est-à-dire que l'hypothèse entraîne la
conclusion: le point est sur la courbe .
2. Que les conditions imposées sont nécessaires, c'est-à-dire que l'hypothèse – le point M est
sur la courbe – entraîne la conclusion: les conditions imposées sont remplies.
L'expression: la condition nécessaire et suffisant pour que le point soit un point du lieu est
qu'il soit sur la courbe , résume les propositions (1.) et (2.).
Théorème: Le lieu géométrique des points équidistants (à même distance) de deux points
et donnés est la médiatrice du segment .
Démonstration :
1. Tout point du lieu est sur la droite . Autrement dit, l'hypothèse entraîne que
est la médiatrice de . En effet, si , le triangle est isocèle et le
sommet est sur la médiatrice de .
2. Tout point de est un point du lieu. Ce qui revient à dire que si est sur la médiatrice
de , nous avons . En effet, si est sur la droite qui rencontre en ,
milieu de , la droite , les triangles sont égaux (deuxième cas d'égalité :
parce que ces angles sont droits, commun; parce que est le
milieu de ) : les côtés sont donc égaux et nous avons bien . Le point
est un point du lieu.
A l'aide de ce théorème nous pouvons en énoncer un second : Par un point pris hors d'une
droite , nous pouvons mener à cette droit une seule et unique perpendiculaire :
Démonstration :
579/2001
Sciences.ch 14/03/2005
Définitions :
D1. nous appelons "projection orthogonale" d'un point sur une droite le point où la
perpendiculaire menée par à cette droite la rencontre. Le point s'appelle aussi "pied" de
cette perpendiculaire.
TRIANGLE ÉQUILATERAL
Définition : nous disons qu'un triangle est "équilatéral" lorsque tous ses côtés sont de
longueur égales ou que tous ses angles sont égaux. Chacun de ces côtés est donc une
base.
580/2001
Sciences.ch 14/03/2005
Remarque : nous prenons prend pour habitude d'annoter les côtés égaux par deux traits
parallèles disposés au milieu de la base.
Comme la somme des trois angles de ce triangle doit faire 180° et que les trois angles ont
même mesure, chacun d'eux mesure donc : 180°/3 soit 60°.
TRIANGLE RECTANGLE
Dire que le triangle est rectangle en signifie c'est en se trouve l'angle droit.
Remarque : dans un triangle rectangle, le côté le plus grand est toujours le côté opposé à
l'angle droit. Nous l'appelons "l'hypoténuse". Nous démontrons cette propriété avec le
théorème de Pythagore (voir plus bas)
TRIANGLE RECTANGLE-ISOCÈLE
THÉORÈME DE PYTHAGORE
581/2001
Sciences.ch 14/03/2005
Maintenant que nous avons vu ce qu'était le triangle et certaines de ses propriétés ainsi que le
concept d'angle, nous pouvons démontrer le fameux et éternel théorème de Pythagore.
Remarque : il existe plusieurs démonstrations de ce théorème dont en voici une parmi tant
d'autres :
Soit un carré (4 angles droit) dans lequel est inscrit un autre carré, nous déterminons la
surface du carré inscrit à partir des triangles rectangles résultants de l'espace vide entre les
deux carrés tel que présenté sur la figure ci-dessous :
Pour avoir la surface du carré gris on peut soustraire au carré blanc la surface des 4 triangles
rectangles (d'un esurface de moitié de celle d'un quadrilatère de même longueur et hauteur),
chacun de surface :
C'est au chinois Tchao Kiung K'ing (2ème siècle) que l'on doit cette démonstration.
THÉORÈME DE THALÈS
Comme nous avons démontré le théorème de Pythagore et que les concepts de parallèles,
segements, angles et autres nous sont connues, nous pouvons enfin démontrer le théorème de
Thalès dont voici une possible démonstration :
582/2001
Sciences.ch 14/03/2005
Soit la figure:
Nous avons:
est un rectangle car ses côtés sont parallèles deux à deux et il a au moins deux angles
droits. Donc ses côtés opposés ont même longueur: .
Conclusion: si deux triangles ont un côté commun et si les troisièmes sommets sont une
parallèle à ce côté comme, alors ils ont la même surface.
alors:
583/2001
Sciences.ch 14/03/2005
Soit la figure:
Avec:
Nous avons montré précédemment que si deux triangles ont un côté commun et si les
troisièmes sommets son sur une parallèle, alors ils ont la même surface. Donc les triangles
et ont la même surface.
En ajoutant à chacune de ces deux surfaces celle du triangle , nous obtenons que les
triangles et ont la même surface.
et
Conclusion:
584/2001
Sciences.ch 14/03/2005
Les triangles et ont la même surface (lemme 1) ainsi que les triangles et
donc :
d'où :
et
alors :
585/2001
Sciences.ch 14/03/2005
Enoncé (quatrième axiome d'Euclide) : Par un point pris en dehors d'une droite, nous ne
pouvons mener à cette droite qu'une seule droite.
Cet axiome est connu sous le nom de "postulatum d'Euclide" et constitue un des axiomes qui
a le plus boulversé et impregné l'histoire des mathématiques (voir l'introduction du chapitre
traitant de la théorie de la démonstration) . La géométrie construite en admettant la postulatum
d'Euclide s'appelle géométrie euclidienne; les géométries construites en le remplaçant par une
autre proposition, en admettant, par exemple, que nous pouvons par un point mener plusieurs
parallèles à une même droite, sont des géométries non-euclidiennes. Ces géométries sont tout
à fait comparables à la notre; les théorèmes peuvent y être rangés dans le même ordre; la suite
des raisonnements et des démonstrations y est aussi solidement et irréprochablement ordonnée
que dans la géométrie euclidienne. Au point de vue de la pure logique, il n'y a aucune raison
de préférer l'une de ces géométries à une autre; mais c'est ici le lieu de se souvenir que si la
géométrie n'est pas une science expérimentale, elle tire de l'expérience ses inspirations : c'est
la comparaison des résultats théoriques aux résultats expérimentaux qui incline le géomètre à
préférer aux autres géométries la géométrie euclidienne.
1. Si deux droites et sont parallèles, toute droite qui coupe l'une coupe
l'autre.
Démonstration :
Démonstration :
Si la droite n'était pas parallèle à la droite , elle la couperait : elle couperait aussi
la droite parallèle à la droite , elle ne serait donc pas parallèle à .
586/2001
Sciences.ch 14/03/2005
Démonstration :
2. Les angles alternes externes et sont égaux, car est opposée par le
sommet à l'angle , qui est alterne interne avec l'angle .
Réciproque : si deux droites sont coupées par une sécante qui forme avec ces droites :
- soit deux angles correspondants égaux, ces deux droites sont parallèles
Remarque : pour démontrer le parallélisme de deux droites, il faut et il suffit que les angles
alternes internes, alternes externes ou correspondants, formés par ces deux droites avec une
sécante, soient égaux.
Définition : nous disons que deux segments ou deux demi-droites sont parallèles
lorsque les droites sont parallèles. Nous disons que deux demi-droites
sont parallèles et de "même sens" lorsqu'elle sont placées d'un même côté par
rapport à la droite qui joint leurs origines.
CERCLES
Définition : nous appelons "cercle" le lieu géométrique des points du plan qui sont à une
distance donnée , appelée "rayon" de ce cercle, d'une point fixe , appelé "centre" de ce
cercle.
587/2001
Sciences.ch 14/03/2005
Nous appelons "diamètre" d'un cercle toute droite qui passe par le centre du cercle. Tout
diamètre rencontre le cercle en deux points et , définis par , que nous
appelons "extrémités du diamètre". Nous réservons la notations "diamètre " pour le
diamètre d'extrémités et . Nous disons que deux points d'un cercle sont "diamétralement
opposés" quand ils sont les deux extrémités d'un même diamètre.
Un cercle divise le plan en deux régions : celle qui contient le centre, que nous appelons
"intérieure", et celle qui ne le contient pas, que nous appelons "extérieur".
Théorème : la condition nécessaire et suffisante pour qu'un point soit strictement intérieur
à un cercle , de centre et de rayon , est .
Démonstration :
1. La condition est nécessaire : Si, par hypothèse, est à l'intérieur du cercle , il est situé
soit en , soit entre les extrémités et du diamètre délimité par le lieu géométrique des
points . S'il est en , la proposition est évidente, s'il n'est pas en , il est entre et par
exemple, et nous avons , c'est-à-dire .
2. La condition est suffisante : Si, par hypothèse , se trouve entre les extrémités
et des lieux géométriques définis par les points , donc à l'intérieur du cercle .
Corollaires : la condition nécessaire et suffisante pour que soit extérieur au cercle est
.
Nous appelons "corde" d'un cercle le segment dont les extrémités et sont sont sur
ce cercle.
Corollaire : la perpendiculaire menée par le centre d'un cercle à une corde passe par le
588/2001
Sciences.ch 14/03/2005
2. Il ne passe qu'un seul cercle : S'il passait par un cercle différent du cercle
de centre et de rayon , son centre se trouverait sur la médiatrice de et de
qui sont deux cordes de ce cercle; il serait donc confondu avec .
BARYCENTRE
Remarques :
R1. La définition du barycentre nécessite certains des outils mathématiques définis dans le
chapitre de calcul vectoriel de la section d'algèbre du site. La lecture de ce chapitre est donc
recommandée si le lecteur souhaite comprendre ce qui va suivre.
R2. Les développements qui vont suivre aussi bien utilisé en géométrie qu'en physique mais
avec une prédominance pour ce premier.
Définition : nous appelons "barycentre" ou encore en physique "centre de gravité" des points
du plan ou de l'espace affectés respectivement des coefficients ( où les
sont des réels tels que ) l'unique point tel que :
589/2001
Sciences.ch 14/03/2005
Le couple noté est appelé "point pondéré" ("point massif" en physique quand
représente une masse).
Remarques :
R1. Sur ce site, nous parlerons toujours de "centre de gravité" pour désigner aussi bien ce
dernier que le "barycentre".
R2. Lorsque pour tout point massif nous avons , nous parlons
alors de "isobarycentre".
Pour un point arbitraire, nous avons bien évidemment par simple addition vectorielle :
Nous pouvons très bien également travailler avec les éléments de surface ou de volumes (pour
ne faire mention que des plus triviaux) pour déterminer le centre de gravité :
et
590/2001
Sciences.ch 14/03/2005
Démonstration :
P3. Le centre de gravité de points pondérés est invariant quand on remplace d'entre
eux, par leur centre de gravité , affecté de la condition de leur coefficient,
591/2001
Sciences.ch 14/03/2005
Démonstration :
Comme l'égalité précédente prouve que bien que est le centre de gravité
Démonstration :
Pour calculons :
592/2001
Sciences.ch 14/03/2005
Remarques : quand un corps a une certaine symétrie, les calculs se simplifient car le centre de
gravité doit coïncider avec l'élément de symétrique. Si un corps, comme une sphère, un
parallélépipède, etc., a un centre de symétrie, le centre de gravité est confondu avec lui. Si le
corps a seulement un axe de symétrie, le centre de gravité est alors sur cet axe.
AXIOMATIQUE D'EUCLIDE-HILBERT
Dans le texte précédent nous avons présenté un par un, de manière diffuse les cinq axiomes
d'Euclide et toutes les définitions élémentaires de la géométrie. En souhaitant faire honneur
aux "Eléments" d'Euclide et à son travail, nous avons souhaité énumerer tous ces derniers de
façon condensée :
AXIOMES D'EUCLIDE
A1. Etant donnés deux points et , il existe une droite passant par et
A3. Pour tout point et tout point distinct de , on peut décrire un cercle de centre
passant par
A5. Par un point extérieur à une droite, nous pouvons mener une parallèle et une seule à cette
droite
DÉFINITIONS D'EUCLIDE
Nous énumérons ici les définitions telles que Euclide les a énoncées :
593/2001
Sciences.ch 14/03/2005
D4 : Une ligne droite est celle qui est également placée entre ses points.
D7 : Une "surface plane" est celle qui est également placée entre ses droites.
D8 : Un "angle plan" est l'inclinaison mutuelle de deux lignes qui se touchent dans un plan et
qui ne sont point placées dans la même direction.
D9 : Et lorsque les lignes qui comprennent cet angle sont des lignes droites, l'angle est appelé
"rectiligne".
D10 : Lorsqu'une droite tombant sur une droite forme deux angles adjacents égaux entre eux,
chacun des angles égaux est droit, et la droite placée au-dessus est dite "perpendiculaire" à
celle sur laquelle elle est placée.
D11 : Un angle "obtus" est celui qui est plus grand qu'un droit.
D12 : Un angle "aigu" est celui qui est plus petit qu'un droit.
D14 : Une "figure" est ce qui est compris par une seule ou par plusieurs limites.
D15 : Un "cercle" est une figure plane, comprise par une seule ligne que nous nommons
"circonférence" telle que toutes les droites qui y sont menées à partir d'un des points placés
dans cette figure sont égales entre elles.
D17 : Un "diamètre" du cercle est une droite menée par le centre et terminée de part et d'autre
par la circonférence du cercle de telle sorte qu'il partage le cercle en deux parties égales.
D19 : Les figures rectilignes sont celles qui sont terminées par des droites : les figures
trilatères sont terminées par trois droites, les quadrilatères par quatre, et les multilatères par
plus de quatre.
D20 : Parmi les figures trilatères, un triangle équilatéral est celle qui a ses trois côtés égaux,
un triangle isocèle, celle qui a seulement deux côtés égaux, et un triangle scalène, celle qui a
ses trois côtés inégaux.
D21 : De plus, parmi les figures trilatères, un triangle rectangle est celle qui a un angle droit,
un triangle obtusangle, celle qui a un angle obtus, un triangle acutangle, celle qui a ses trois
angles aigus.
594/2001
Sciences.ch 14/03/2005
D22 : Parmi les figures quadrilatères, un carré est celle qui est équilatérale et rectangulaire, un
rectangle, celle qui est rectangulaire et non équilatérale, un losange, celle qui est équilatérale
et non rectangulaire, un parallélogramme, celle qui a ses côtés et ses angles opposés égaux
entre eux et qui n'est ni équilatérale ni rectangulaire ; les autres quadrilatères, ceux-là
exceptés, se nomment trapèzes.
D23 : Les parallèles sont des droites qui, étant situées dans un même plan et étant prolongées
à l'infini de part et d'autre, ne se rencontrent ni d'un côté ni de l'autre.
Remarque :
Des imperfections de la construction d’Euclide sont remarquées dès l’Antiquité. Parmi les
axiomes, le cinquième (l'axiome des parallèles) fut le plus critiqué; certains continuateurs et
commentateurs d’Euclide avaient cherché à démontrer d’autres axiomes (par exemple celui de
l’égalité des angles droits et ainsi la non-indépendance) ou avaient reconnu l’insuffisance de
certaines définitions comme celles de la droite et du plan.
Toutefois, malgré les critiques que nous soulignons ci-dessous, jusqu’au 18ème siècle, les
Éléments ont été en général acceptés. C'est au 18ème siècle que sont apparues les géométries
non-euclidiennes et la violation du cinquième axiome. De son côté Leibniz remarque
qu’Euclide utilise l’intuition géométrique sans le mentionner explicitement (par exemple
lorsqu’il admet que deux cercles dont chacun passe par le centre de l’autre ont un point
commun; propriété utilisée pour la construction d’un triangle équilatéral par exemple). Gauss
remarque l’importance de "entre", relation qui n’est pas définie et qui, d’ailleurs, pose
problème sur la sphère.
Le sentiment général était qu’en complétant convenablement ces bases des raisonnements, on
arriverait à un exposé entièrement satisfaisant. C’est ce travail que réalisèrent Pasch et Hilbert
à la fin du 19ème siècle.
AXIOMES D'HILBERT
AA1. Pour tous points distincts et , il existe une unique droite passant par et
595/2001
Sciences.ch 14/03/2005
BA1. Si le point est entre les points et , alors sont distincts et est aussi
entre et .
BA2. Pour tous points et distincts, il existe un point tel que est entre et .
BA3. Pour trois points alignées distincts, il en existe un et un seul situé entre les deux autres.
Pour faciliter l'énoncé de l'axiome suivant, nous allons définir une nouvelle notion.
Définition : nous appelons "segment ouvert " l'ensemble de tous les points situés entre
et . Nous appelons "segment fermé " ce même ensemble auquel nous ajoutons
et (ces concepts sont complètement assimilables aux intervalles ouverts et fermés que
nous avons définis en analyse fonctionnelle).
Autrement dit (BA4.) : une droite qui entre par l'un des trois côtés d'un triangle doit ressortir
par l'un des deux autres côtés)
CA2. Si et alors
CA3. Si alors
Remarques :
R1. Ces axiomes permettent de comparer les segments, et aussi les angles de définir le milieu
d'un segment, les droites orthogonales, de parler de triangles équilatéraux, isocèles, etc...Ils
permettent également de définir rigoureusement les déplacements dont Euclide faisait si
souvent usage sans les avoir définis.
R2. Ces axiomes permettent aussi d'énoncer le fait suivant : Pour toute droite et tout point
sur , partage les points de en trois classes distinctes que nous définissons comme
étant respectivement deux demi-droite d'origine et le point lui-même. Ayant défini les
596/2001
Sciences.ch 14/03/2005
demi-droites, on peut définir les angles : c'est juste un couple de demi-droites de même
origine et grâce à l'axiome de Pasch, nous pouvons parler de droites passant à l'intérieur ou à
l'extérieur d'un angle.
DA2. (axiome de Cantor) Si et sont deux suites infinies de points telles que
et telles que , alors il existe un point
appartenant à tous les segments (en d'autres termes : soit une suite de segments
emboîtés dont la longueur tend vers 0 : alors il y a un point commun à tous les segments).
Remarque : ces axiomes permettent d'établir une correspondance entre les points d'une droite
et l'ensemble des nombres réels. Les axiomes jusqu'à présent énoncés permettent de
démontrer des théorèmes qui sont communs à la géométrie d'Euclide et à celle de
Lobatchevski (géométrie non-euclidienne de type hyperbolique). Nous appelons parfois la
théorie issue de ces axiomes "la géométrie absolue''.
EA1. Nous disons que deux droites sont parallèles lorsqu'il n'existe aucun point appartenant
simultanément aux deux droites
EA2. Soit une droite et un point n'appartenant pas à . Il passe une et une seule droite
par qui soit parallèle à .
Remarque : l'ajout de l'axiome EA1. permet de satisfaire aux particularités des géométries
non-euclidiennes sans être exclusif. L'axiome EA2. sans pouvoir être vérifié dans certaines
géométrie non-euclidienne ne violent pas ce dernier.
Il existe cependant une autre axiomatique beaucoup plus abstraite et générale que nous
appelons les "axiomes de Bachmann" et que nous ne présenterons pas pour l'instant car elle
fait appel à des outils de la théorie des ensembles que nous n'avons pas encore définis sur ce
site.
Les transformations dans le plan (et plus) sont habituellement définies rigoureusement à l'aide
de la théorie des groupes mais nous les outils nécessaires pour cela n'ont pas encore été
présentés sur ce site. Nous ferons donc dans ce chapitre uniquement une très peu formelle
(donc plus intuitive) aux opérations et propriétés de transformations dans le plan.
Cette partie du site est encore pauvre donc le lecteur nous excusera des raccouris que nous
nous sommes parfois permis de prendre mais cela évoluera nous l'espérons dans le bon sens.
597/2001
Sciences.ch 14/03/2005
Remarque : par définition, "l'isométrie" est une transformation qui conserve les distances et
les aires. Comme nous le verrons ci-après, la translation, la rotation et la réflexion sont des
isométries, l'homothétie n'étant elle pas du tout une isométrie dans le plan.
TRANSLATION
Soit une droite dans un plan sur laquelle deux points et définissent un segment de la
droite noté .
Définition : une translation ("déplacement" dans une direction donnée comme disait
Euclide) de ce segment de droite associe à chaque point et de nouveaux points '
tels que . Nous pouvons donc restreindre la notion de translation à un point
uniquement tel que nous puissioins écrire mathématiquement:
Autrement dit, une fonction de transformation de type translation de l'ensemble du plan à lui-
même associe à chaque pré-image au plus une seule et unique image. La translation est donc
une fonction bijective. Nous pouvons donc définir une application de transformation
réciproque notée telle que (rappel de ce qui a été vu en arithmétique) :
Nous disonspar définition qu'un point est "invariant par translation" si et seulement si :
La translation n'étant pas une transformation linéaire (voir chapitre d'algèbre linéaire), nous ne
pouvons nous autoriser à la représenter dans une matrice carrée (2x2 dans le plan ou 3x3 dans
l'espace).
HOMOTHÉTIE
Soit une forme quelconque dans le plan (point, droite, ovale, polygone,...), un nombre , et
un point placé à un endroit prédéfini.
598/2001
Sciences.ch 14/03/2005
Nous pouvons restreindre la notion de translation à un segment de droite tel que nous
puissions écrire mathématiquement:
Autrement dit, une fonction de transformation de type homothétie de l'ensemble du plan à lui-
même associe à chaque pré-image au plus une seule et unique image. L'homothétie est donc
une fonction bijective. On peut donc définir une application de transformation réciproque
notée telle que :
Si , alors est le seul point invariant. Si , alors tous les points sont invariants et
l'homothétie est dite de type "identité". Si , alors nous disons alors que nous avons une
"symétrie centrale".
Nous nous permettons maintenant de faire un petit passage dans la géométrie spatiale (le saut
n'étant pas bien grand et nécessitant juste la connaissance du calcul vectoriel) :
Nous pouvons également peut remplacer ici le scalaire par une matrice 3x3 tel que:
599/2001
Sciences.ch 14/03/2005
Cette matrice est appelée "matrice de transformation par homothétie de centre (origine du
repère) et de rapport ".
Remarque : dans le cas présenté précédemment, l'homothétie conserve les formes dans toutes
les axes (sa géométrie est invariante par transformation) nous utilisons en effet le même
facteur pour tous les axes. Mais nous pourrions également utiliser la matrice suivante:
qui elle déformerait l'objet selon un facteur différent pour chaque axe.
Lorsque le centre d'homothétie ne coincide pas avec l'origine du repère choisi (ce qui arrive
quasiment tout le temps), la procédure de calcul des coordonnées du point image est très
simple. Il faut :
1. Réaliser une translation pour faire correspondre le centre de l'homothétie avec l'origine du
repère et appliquer cette translation à tous les points en jeu.
2. Réaliser l'homothétie proprement dite comme décrit précédemment (le centre est l'origine
du repère).
ROTATION
Soit une forme quelconque dans le plan (point, droite, ovale, polygone), un nombre , et un
point placé à un endroit prédéfini.
600/2001
Sciences.ch 14/03/2005
direction.
La rotation est également une application bijective dans le plan, nous pouvons donc
également définir une application de transformation réciproque notée .
Si , alors est le seul point invariant. Si (avec ), alors tous les points
sont invariants et la rotation est dite de type "identité". Si nous choisissons un système d'axes
perpendiculaires adéquat tel que leur intersection se confonde avec et que alors
est dite une "symétrie centrale".
Dans un autre type de formalisme, la rotation s'exprime de manière beaucoup plus rigoureuse.
Nous allons nous aider du dessin d'un cercle de rayon unité (donc dans le plan) pour étudier
ce type de transformation. Nous allons considérer le premier cas ou l'origine du repère et de la
translation son confondus :
Nous avons dans le plan pour le point (voir le chapitre traitant de la trigonométrie) :
avec .
601/2001
Sciences.ch 14/03/2005
Identiquement (en sa basant sur le fait les relations trigonométriques élémentaires présentées
dans le chapitre de trigonométrie du site sont connues), nous trouvons :
Lorsque nous souhaitons procéder à une rotation autour d'un point quelconque, tout comme
pour l'homothétie, il convient de réaliser une translation de vecteur ( étant l'origine du
repère de l'homothétie ) pour faire confondre et , puis de réaliser la rotation simple
autour de , et enfin de ramener (confondu alors avec ) à son point de départ.
Lors de la rotation d'un objet dans l'espace (nous profitons de la lancée...), la transformation
est assez similaire à la précédente mais définie par rapport à deux angles :
602/2001
Sciences.ch 14/03/2005
Soient et (il est pour nous plus conventionnel d'utiliser que ). Lors
d'une rotation d'angle , la coordonnée ne change pas. Ce qui nous amène à écrire la
matrice de rotation dans l'espace tridimensionnel par rapport au plan comme étant:
Lors d'une rotation d'angle , nous voyons bien que les coordonnées doivent changer à
cause du fait que la projection du vecteur sur le plan est dépendant de cet angle. Ce qui
nous amène à écrire les matrices de rotation dans l'espace tridimensionnel par rapport à l'axe
comme étant:
Nous avons donc finalement trois matrices de rotation correspondant chacune à un des plan
de l'espace tridimensionnel. Si nous cherchons à réaliser la composition d’une
rotation et d'une homothétie d’échelle (dans cet ordre) la matrice de transformation
sera :
RÉFLEXION
Définition : la réfexion notée " " (en géométrie...) par rapport à la droite est l'application
qui associe à chaque point extérieur à le point ' tel que soit la médiatrice de
. Si appartient à , alors . Mathématiquement:
Autrement dit, une fonction de transformation de type réflexion de l'ensemble du plan à lui-
même associe à chaque pré-image au plus une seule et unique image. La réflexion est donc
une fonction bijective. Nous pouvons donc définir une application de transformation
réciproque notée telle que:
603/2001
Sciences.ch 14/03/2005
Remarque : tous les points de sont trivialement invariants par la réflexion dans le plan.
604/2001
Sciences.ch 14/03/2005
GÉOMÉTRIE NON-EUCLIDIENNES
Les géométries non-euclidiennes sont toutes les géométries qui satisfont non nécessairement
tous les axiomes de Hilbert (voir chapitre de géométrie euclidienne) mais sans en contredire
aucune (contrairement aux anciens axiomes d'Euclide et en particulier le cinquième).
Avant d'aborder ce chapitre, nous recommandons vivement au lecteur d'avoir lu et compris les
chapitres traitant du calcul tensoriel, de trigonométrie et de géométrie euclidienne car nous
allons utiliser grand nombre de résultats, non nécessairement triviaux, que nous avons pu y
démontrer
En géométrie euclidienne, nous avons étudié à certain nombre de théorèmes relatifs aux plans.
Insistons maintenant sur le fait que le "plan" et une figure bi-dimensionnelle plongée dans un
espace à 3 dimensions (donc le plan peut dès lors s'orienter) dont la courbure est nulle. Ceci
précisé, il convient peut-être de définir plus rigourseusement ce qu'est le concept intuitif de
"courbure".
Définition : une figure est dite "courbe" s'il existe au moins en un point se situant sur la ou les
droites, surfaces, volumes, ... la délimitant une tangente non confondu au délimitateur et donc
tangent en un seul point.
Nous allons voir dans ce chapitre différentes géométries non-euclidiennes dont les plus
connues sont les géométries riemannienne (à courbure constante) et les géométries de
lobatchevski (de type hyperbolique donc à courbure non-constante).
L'intérêt de l'étude de ces géométries est que nous ne pouvons déterminer si l'Univers dans
lequel nous vivons est fait d'un type de géométrie plutôt que d'un autre car étant donné notre
taille (physique), plongés que nous sommes dans quelque géométrie que ce soit à faible
courbure, toute surface de l'espace nous semble localement euclidienne (deux droites
parallèles ne se coupent pas). Cependant, la relativité générale, qui fait usage à outrance du
calcul tensoriel (généralisation de n'importe quelle géométrie) montre qu'il existe des zones de
l'espace où la géométrie est très fortement courbée et donc localement non-euclidienne et
seulement l'étude de ce genre de géométries nous permet de tirer des théories expliquant des
observations qui ne sont pas exploitables uniquement avec l'intuition humaine.
ESPACES DE RIEMANN
Pour mieux comprendre ce qu'est un espace de Riemann, nous allons de suite passer par un
petit exemple d'une surface à deux dimension (exemple très classique) :
Considérons une sphère de rayon , de surface , située dans l'espace ordinaire à trois
dimensions. Les coordonnées cartésiennes d'un point de la surface peuvent
s'exprimer, par exemple, en fonction des coordonnées sphérique . La sphère est
entièrement décrite pour un rayon donné et et .
Trois tels paramètres, permettent de déterminer un point sur la surface d'une sphère, sont nous
le savons (voir le chapitre traitant du calcul tensoriel) des coordonnées curvilignes sur la
surface ou également dites "coordonnées de Gauss" (Gauss étant un des premier
mathématicien à s'intéresser à l'étude des corps plongés dans les espaces non-euclidiens).
D'autres paramètres quelconques peuvent évidemment être choisis comme
605/2001
Sciences.ch 14/03/2005
L'élément linéaire de la surface , carré de la distance entre deux points infiniment voisins
, s'écrit en fonction des coordonnées sphériques, comme nous l'avons démontré dans le
chapitre traitant de la relativité générale (et en partie dans le chapitre de calcul tensoriel) :
Nous obtenons ainsi une expression de l'élément linéaire en fonction des trois seules
coordonnées de Gauss . Nous pourrions bien sûr imposer le rayon comme étant un
constante ainsi l'élément linéaire ne serait plus fonction que de .
Etant écrire à l'aide des trois paramètres, la surface de la sphère (considérée comme un espace
à deux dimensions) constitue un exemple d'espace de Riemann à deux dimensions:
L'élément linéaire de cet espace est étant de la forme générale (voir le chapitre traitant du
calcul tensoriel) :
Les quantités avec constituent les composantes d'un tenseur qui est le tenseur
fondamental (ou la "métrique riemannienne") de l'espace riemannien formé par la surface
de la sphère.
Les propriétés géométriques des figures tracées sur la surface d'une sphère ne sont plus celles
de la géométrie euclidienne. Ainsi, le plus courte chemin d'un point à un point , sur la
surface sphérique, est constitué par un arc de grand cercle passant par les points et . Les
arcs de grand cercle jouent le même rôle pour la sphère que les droites dans le plan. Ce sont
les "géodésiques" de la sphère.
Remarque : l'étude des figures sur des surfaces riemanniennes fait partie de la géométrie
différentielle à laquelle nous consacrons un chapitre entier dans cette section.
Rappelons également pour souvenir les tenseurs fondamentaux de quelques autres géométries
riemanniennes classiques (elles ont toutes été démontres dans le chapitre de calcul tensoriel et
de relativité générale ) :
- La sphère :
606/2001
Sciences.ch 14/03/2005
- Le cylindre :
Il découle très facilement de calculs que nous avons effectué dans le chapitre de calcul
tensoriel que l'élément linéaire s'écrit alors (si ce n'est pas évident pour vous n'hésitez pas
nous le faire savoir et nous détaillerons alors les calculs), en fonction des variables :
avec :
Remarque : les différents espaces de Riemann constituent ce que nous appelons sous une
forme générale (parce qu'il n'y pas que des espaces de type riemannien à courbure constante)
une "variété" munie d'une métrique riemannienne. Une variété peut être définie (non
formellement), par exemple, par un ensemble de points situés dans un espace préexistant. De
manière générale une surface donne l'idée d'une variété à deux dimensions. La sphère et le
tors sont des variétés à deux dimensions sans frontière. Un cylindre de révolution, un
paraboloïde hyperbolique, sont des variétés à deux dimensions ouvertes, avec frontières à
l'infini. Mais nous pouvons aussi envisager des variétés abstraites. C'est le cas par exemple
d'un espace de configuration. Il s'agit alors d'un espace de points à dimensions représenté
par un ensemble (ou noté )de coordonnées généralisées (voir l'introduction au
formalisme lagrangien dans la section de mécanique analytique), ces dernières pouvant avoir
des valeurs comprises dans un domaine fini ou non.
Définition : un espace de Riemann est une variété à laquelle nous avons attaché une métrique.
Cela signifie que, dans chaque partie de la variété, représentée analytiquement au moyen d'un
607/2001
Sciences.ch 14/03/2005
système de coordonnées , nous nous sommes donnés une forme différentielle quadratique :
Les coefficients ne sont pas entièrement arbitraires et doivent vérifier, nous l'avons
démontré dans le chapitre de calcul tensoriel, les conditions suivantes :
C4. Toutes les dérivées partielles d'ordre deux des existent et sont continues donc de
classe .
Un espace de Riemann est donc un espace de points, chacun étant repéré par un système de
coordonnées , doté d'une métrique quelconque telle que la forme différentielle de
l'élément linéaire vérifiant les conditions précédentes. Cette métrique est dite dès lors
"riemannienne".
Remarques :
R1. Si la métrique est définie positive, c'est-à-dire si pour tout vecteur non nul,
nous disons que l'espace est "proprement riemannien". Dans ce cas, le déterminant de la
matrice est strictement positif et toutes les valeurs propres de la matrice sont
strictement positives.
R2. Par définition, nous disons qu'une métrique d'un espace est euclidienne lorsque tout
tenseur fondamental de cet espace peut être ramené, par un changement approprié de
coordonnées, à une forme telle que (voir chapitre de calcul tensoriel) la base orthonormée
canonique : .
R3. La définition des espaces riemanniens montre que l'espace euclidien est un cas très
particulier de ces espaces. Il n'existe donc qu'un seul espace euclidien alors que nous pouvons
créer une infinité d'espaces riemanniens.
608/2001
Sciences.ch 14/03/2005
GÉOMÉTRIE PROJECTIVE
Depuis Chasles et jusque dans les années 1930, la géométrie projective était souvent
synonyme de "géométrie supérieure". Elle s'opposait à la géométrie euclidienne :
élémentaire... , et analytique. A l'époque de Monge, de Carnot, de von Staudt, on parlait aussi
de "géométrie de position" ou de "situation". Ces géométries étudient les figures au point de
vue de leurs positions respectives et des propriétés invariantes qui les lient dans une
transformation géométrique (rotation, symétrie, homothétie,...), homographique tout
particulièrement. Outre la division harmonique, notion de base, elle fait appel au célèbre
rapport anharmonique (birapport), à l'inversion, l'involution, la transformation par polaires
réciproques, la projection stéréographique, la corrélation, l'homologie, la dualité, les coniques,
etc. (voir plus loin dans ce texte pour les définitions)
La géométrie projective, certes supérieure car assez ardue, permet d'établir de façon élégante
des résultats de la géométrie élémentaire (géométrie descriptive, géométrie spatiale, ...).
Désireuse de théoriser et compléter avec rigueur la géométrie euclidienne, mettant à mal le
5ème postulat et usant elle-même d'un principe assez flou (principe de continuité), elle n'a pas
complètement convaincu malgré les efforts de Klein et son programme d'Erlangen visant à
l'intégration des diverses géométries (euclidiennes et non euclidiennes) dans une même
théorie unificatrice basée sur les groupes de transformation. Ses travaux marqueront un point
final à son extension.
Cette géométrie très abstraite en dehors de quelques généralités et principes de base exposés
ci-dessous, est relativement difficile à appréhender et requiert, avant de s'y plonger, une bonne
connaissance en géométrie élémentaire voire, dans l'espace, une parfaite maîtrise de l'espace
tridimensionnel, dans le cycle observation-représentation-interprétation. Ceci nous amené à
introduire certains concepts qui n'ont normalement pas leur place ici mais qui nous le
pensons, peuvent aider grandement l'intéressé à mieux comprendre cette branche des
mathématiques.
Dans un premier lieu, nous allons étudier les concepts élémentaires de la perspective en
s'attardant particulièrement sur le concept de présentation "projective" (il existe d'autres
méthodes de perspective empiriques : cavalière, isométrique, militaire, … mais ces dernières
n'ont pas de sens mathématique ou réel même si elle représentent assez convenablement des
objets volumiques). Ensuite, nous étudierons les représentations mathématiques de quelques
objets tri-dimensionnel dans le cadre d'applications pour enfin passer à l'étude de la géométrie
projective dure. Enfin, nous étudierons la mathématique utilisé dans la représentation
informatique des formes géométriques (splines, courbes de bézier, etc...)
609/2001
Sciences.ch 14/03/2005
Nous allons nous intéresser à la "perspective conique", aussi appelée "perspective centrale" ou
encore "linéaire".
La perspective conique est par construction la représentation la plus proche de nos perceptions
visuelles, elle permet notamment de voir une sphère comme un cercle (au moins en première
approximation, si la sphère n'est pas placée trop en marge du champ de vision ; pour avoir
toujours des cercles, il faudrait projeter non sur un plan mais une sphère, modélisant mieux la
rétine).
La perspective conique est celle des peintres de la Renaissance. C'est aussi celle qui apparaît
sur une photo.
Une projection conique de l'espace à 3 dimensions usuel est donc transformation projective
qui envoie tous les points de cet espace sur un même plan de cet espace. Elle nécessite la
donnée d'un point O (équivalent à la position de l'oeil de l'observateur) et d'un plan de
projection dit "tableau" (la Vitre de Dürer, l'équivalent de la rétine).
Nous verrons lors des développements théoriques que contrairement aux projections affines
(voir le sous-chapitre suivant), la projection conique ne conserve pas le barycentre (donc les
rapports de longueurs sur une droite donnée) mais elle conserve l'alignement et le birapport.
Lorsqu'on parle de perspective à conique, on utilise quelques plans et droites particuliers dans
l'espace tri-dimensionnel :
- Le plan du tableau (ou vitre de Dürer), noté , est le plan sur lequel on fait le dessin.
- Le point de vue, noté , est un point hors de et de : c’est le point où devra se placer
l’oeil pour que le dessin sur coïncide avec l’image réelle.
610/2001
Sciences.ch 14/03/2005
IMAGES DE POINTS
Tout objet volumique (ce qui ne peut être déterminé qu'au touché ou au niveau de l'abstraction
mathématique) composé par un ensemble de points , est à notre cerveau, l'image d'une
projection plane dont le support est une surface dans l'espace se trouvant entre l'objet
observé et notre œil. En mathématique, cette surface est appelée "tableau" et est délimitée
dans sa vue centrale par la ligne d'horizon (là où se situent les points de fuite) et par un
référentiel physique appelée "ligne de Terre" (voir schéma ci-dessous).
611/2001
Sciences.ch 14/03/2005
La hauteur entre la ligne de Terre et le point de vue est appelée la "hauteur d'horizon".
Nous pouvons du schéma ci-dessus tirer les relations suivantes selon les théorèmes de Thalès
dans les différents triangles:
avec .
et
A partir de ces relations, le problème de la représentation plane d'une forme volumique est
complètement résolu, puisque nous pouvons toujours projeter un point (ou la distance entre
deux points) sur un tableau à partir des coordonnées de l'original.
Le terme est communément appelé la "longueur focale" du point de vue à l'écran et les
spécialistes de l'optique le notent habituellement par la lettre .
Pour mieux comprendre ce dernier résultat, nous pouvons nous mettre dans la contexte d'une
étude bi-dimensionnelle où l'observateur est à la hauteur de la ligne de Terre ( ) et
disposé de façon à représenter une personne regardant le tableau (assimilable à un écran télé,
ordinateur ou tout autre) dans lequel nous posons les axes conventionnels et dans le plan
de l'écran et perpendiculairement (ainsi, relativement au premier schéma, devient et
inversement).
et comme :
Remarque : cette relation est une forme particulière de ce que nous appelons les
"transformations homographiques". Nous reviendrons plus loin sur celles-ci et démontreront
leurs propriétés.
Si le tableau est posé sur l'axe du référentiel, nous avons alors ce qui nous donne :
612/2001
Sciences.ch 14/03/2005
et en procédant de même:
Remarque: ces deux dernières relations sont celles que l'on utilise pour dispenser nos cours de
programmation 3D dans Macromedia Flash.
Dans certains ouvrages, cette profondeur est notée (simple mise en facteur):
puisque .
Il est intéressant d'étudier quelle doit être la valeur de la focale pour afin d'avoir
ou . Ainsi, si nous prenons la limite:
613/2001
Sciences.ch 14/03/2005
Pour que tout distance réelle entre deux points non confondus dans le tableau mais se trouvant
dans un même plan aient une distance de projection égale, il faut que les équations des deux
droites qui déterminent leur intersection avec le tableau soient parallèles. Ce qui implique,
puisque l'observateur est un point convergent, qu'il faut éloigner l'observateur à une distance
infinie du plan pour conserver les grandeurs ainsi projetées sur le tableau.
Un très bon exemple pour visualiser ces résultats est de programmer en pseudo-3D sur un
ordinateur.
IMAGES DE DROITES
Déterminons à partir des résultats précédents, l'image d'une droite parallèle à la ligne de Terre
(donc à l'axe ) du tableau assimilable à un écran. Dans ce cas, nous avons:
et pour
Donc toute droite parallèle à la ligne de Terre devient en perspective une droite se trouvant à
une hauteur dans le plan parallèle à de notre écran (on pouvait le deviner
intuitivement…).
Pour toute droite parallèle à l'axe de l'écran (donc dans sa "profondeur"), nous avons:
et pour
passent toutes par le point qui est le "point de fuite principal" et par le
point telle que représenté sur la projection ci-dessous faite dans Adobe
Photoshop (les lignes horizontales ont été rajoutées pour donner l'effet de perspective):
614/2001
Sciences.ch 14/03/2005
A partir de la figure ci-dessus, nous pouvons définir le concept "d'angle de fuite" donné par la
figure ci-dessous:
Une représentation géométrique peut autre peut aider à mieux comprendre le résultat.
Rappelons donc que le point de fuite d'une droite est le point d'intersection du plan du
tableau avec la droite parallèle à passant par . Deux droites parallèles et ont
donc le même point de fuite. Représenté comme ci-dessous:
Pour toute droite quelconque se situant dans le plan de l'écran (donc dans sa
"profondeur"), nous avons:
615/2001
Sciences.ch 14/03/2005
et pour
Examinons le cas particulier de droites passant par les sommets opposés d'un carrelage, c'est-
à-dire inclinées à donc avec un coefficient directeur (une pente) de .
cela signifiant que toute projection de droites de coefficient directeur se situant dans le
plan pour constitue des points de fuite secondaires situés sur la ligne d'horizon à une
distance égale de part et d'autre du point de fuite principal tel que représenté ci-dessous (dans
le contexte d'un cours sur Adobe Photoshop, nous y avons rajouté un cube dans cette
perspective):
616/2001
Sciences.ch 14/03/2005
Nous voyons bien dans la figure ci-dessus la symétrie par rapport à l'axe vertical et les deux
points de fuites qui sont l'origine du carrelage.
Ces droites images restent donc des droites parallèles à l'axe . Autrement dit, les droites
images restent parallèle aux droites "objet" tel que représenté ci-dessous (pour différentes
positions du point d'observation):
Prenons pour exemple de ce dernier résultat, des segments de même hauteur dont le pied
est sur le plan horizontal:
617/2001
Sciences.ch 14/03/2005
C'est l'équation d'une droite et remarquons que toutes ces droites joignant les sommets passent
par le point de coordonnées qui n'est d'autre que le point de fuite principal .
Le point de fuite principal du plan est le projeté orthogonal du point sur la droite
. C'est le point de fuite des droites de parallèles à , donc orthogonales à .
Il résulte de ces définitions que deux plans parallèles ont les mêmes éléments de référence.
A partir de l'exposé précédente, nous avons une nouvelle méthode pour présenter un objet en
rotation dans un espace tridimensionnel. Au lieu de faire tourner l'objet autour de différents
618/2001
Sciences.ch 14/03/2005
axes, nous pouvons imaginer à l'aide des équations ci-dessus faire tourner l'observateur autour
de l'objet (c'est un point de vue…).
Nous n'avons considéré ici que la perspective projective sur un plan. Au fait, pour travailler
sur des méthodes de projection quelconques (sphère sur plan, plan sur sphère, sphère sur
sphère, n'importe quoi sur n'importe quoi) il suffit d'étendre l'analyse que nous avons faite ci-
dessus dans un système de coordonnées adapté au système étudié (coordonnées polaires,
cylindriques, sphérique, …). C'est probablement ainsi que procèdent les logiciels de
simulation 3D pour projeter une image sur une surface réfléchissante et semi-transparent tel
qu'une verre ondulé.
Remarque: des résultats que nous avons obtenu ci-dessus, nous pouvons tirer un conclusion
intéressante. Pour que l'observateur d'un photo ou d'un tableau voie l'image telle qu'elle était à
l'origine, celui-ci doit se placer à des coordonnées déterminées du tableau (de la photo ou du
tableau).
PERSPECTIVES AFFINES
Par définition:
Une projection affine de l'espace à 3 dimensions usuel est une transformation affine qui
envoie tous les points de cet espace sur un même plan de cet espace. Si le point
n'est pas sur le plan de projection, lui et son image forment une droite
dont la direction est constante: on l'appelle "direction de projection". La Perspective qui en
découle est appelée familièrement Perspective Parallèle ou Perspective Cylindrique. Comme
toutes les transformations affines de l'espace, une Projection Affine conserve:
- le barycentre, donc toutes les proportions existantes sur une droite donnée.
Seule les longueurs et les angles situés dans un plan parallèle au plan de projection sont
conservés.
Sans trop nous attarder sur ces deux techniques, nous les présentons brièvement car elles
doivent faire partie de la culture générale du physicien.
PERSPECTIVE CAVALIERE
Prenons une vue (par exemple la vue de face), et nommons les axes (horizontale) et
(verticale). L'axe étant l'axe perpendiculaire à la vue.
619/2001
Sciences.ch 14/03/2005
Dans la perspective cavalière, nous traçons l'axe avec un certain angle par rapport à l'axe
(par exemple ou ), et l'on y reporte les distances en les multipliant par un
coefficient inférieur à 1 en appliquant les règles trigonométriques de base tel que:
C'est en mathématique, par exemple, que la perspective cavalière est fréquemment choisie
pour représenter sur le tableau des classes d'écoles les figures géométriques
tridimensionnelles dans une base orthonormée canonique de direction .
PROJECTION ORTHOGONALE
La projection orthogonale la plus simple à exprimer est évidemment celle qui envoie l'espace
sur un plan parallèle au tableau, de cote constante égale à . Autrement dit, tel que:
On obtient alors trivialement les coordonnées dans un repère orthonormé 2D propre à ce plan
où et .
Inconvénient de cette méthode: l'effet réel de la profondeur, est entièrement perdu. Pour y
remédier il existe deux solutions équivalentes (généralisables aux autres perspectives): l'une
consiste à tourner l'objet par isométrie de l'espace et l'autre à changer la tableau.
Un cas particulier de la projection orthogonale est la "perspective isométrique". Elle est très
utilisée en dessin industriel, elle projette orthogonalement les points de l'espace sur le plan
isotrope, d'équation:
620/2001
Sciences.ch 14/03/2005
Le perspective isométrique consiste à placer les axes à les uns des autres et y
reporter les distances telles quelles (d'où son nom).
À titre de comparaison, nous avons représenté selon les deux perspectives présentées
précédemment un cube avec un cercle inscrit dans le carré de chaque face.
621/2001
Sciences.ch 14/03/2005
GÉOMÉTRIE ANALYTIQUE
La "géométrie analytique" est la branche de la géométrie qui s'occupe de l'étude des formes
géométriques et de leurs propriétés en utilisant les outils avancés du calcul algébrique tel que
l'analyse fonctionnelle, le calcul vectoriel ou l'algèbre linéaire. Sa frontière se situe au niveau
des outils utilisés. Lorsque nous faisons usage pour ces mêmes études du calcul différentiel et
intégral, alors nous faisons de la "géométrie différentielle" (voir chapitre suivant).
La géométrie analytique est un très vaste domaine (comme tout le reste) mais certains sujets
étudiés dans les petites écoles sortent sont connus tel que ceux que nous abordons ici (cités
dans l'ordre) : les coniques, les équations de la droite, du plan, de la sphère, etc... leurs
intersections, leurs plans tangents et encore bien d'autres.
CONIQUES
Il nous a été très difficile de choisir s'il fallait mettre l'étude des coniques dans la section
d'algèbre ou de géométrie. Nous avons finalement décidé de mettre cette étude dans le présent
chapitre (donc de géométrie...) qui permet de supposer que le lecteur ayant fait une lecteur
linéaire du site a déjà parcouru tous les chapitres présentant les outils mathématiques
nécessaires à l'étude des coniques. Nous espérons que notre choix s'avérera le meilleur pour le
lecteur.
Remarque : l'étude des côniques nous sera très utile en astrophysique ainsi qu'en optique il
convient donc de s'y attarder dans les détails.
Soit un repère orthonormé du plan. Les courbes algébriques les plus simples que
l'on trouve après les droites dont les équations sont sous forme générale (rappel):
avec non tous nuls. Ces courbes de second degré sont appelées "coniques" (appelées
également "quadriques" de par la présence d'un terme quadratique).
Notre première tâche va consister à obtenir, par translation et rotation du repère dans laquelle
cet relation est exprimée, une équation réduite beaucoup plus simple tel qu'en premier lieu
. En effet, choisissons un nouveau repère se déduisant de l'ancien par une rotation
d'angle . Soit et les nouvelles coordonnées des points. Nous avons :
D'où:
622/2001
Sciences.ch 14/03/2005
L'équation devient:
et
nous avons:
1. Si nous posons et . Quitte à diviser par , nous pouvons nous ramener à une
équation du type:
où:
- si , nous nous retrouvons avec une équation décrivant la figure d'une "parabole" d'axe
parallèle à .
623/2001
Sciences.ch 14/03/2005
Par un simple changement de repère de translation, nous arrivons donc à une équation du
type:
- si et posons:
Posons:
Nous obtenons:
624/2001
Sciences.ch 14/03/2005
Deux termes ci-dessus sont impossibles dans , c'est pourquoi nous les avons tracés (la
somme de deux nombres positifs ne peuvent êtres négatifs et inversement).
- Pour:
ou
- Pour:
- Pour:
et , nous avons des hyperboles dont l'axe de symétrie est soit parallèle à soit à
Remarque: pour voir les figures, utilisez la fonction implictitplot(…) dans Maple
Le terme "conique" provient du fait que l'une des premières définitions des conques consistait
en l'intersection d'un cône et d'un plan.
Posons:
Explications: nous avons ainsi un vecteur normal de le plan et un plan qui n'est jamais
625/2001
Sciences.ch 14/03/2005
avec:
Après simplification:
Donc après rotation, nous avons un plan vertical translaté de selon l'axe des .
Identiquement, pour le cône, une rotation correspond selon l'axe des Z (donc il ne se passe pas
grand chose):
Si nous tracons dans Maple la fonction (en s'amusant avec les angles):
626/2001
Sciences.ch 14/03/2005
ce qui comme nous l'avons vu précédemment, est bien l'équation d'une hyperbole.
Soit un point du plan, une droite ne contenant pas et un réel strictement positif.
Nous nous intéressons à:
Nous choisissons comme origine du repère, de façon que ait pour équation:
avec
627/2001
Sciences.ch 14/03/2005
Alors:
Nous nous retrouvons bien avec l'équation d'une conique. Nous pouvons considérer
maintenant plusieurs cas particuliers:
1. Cas où :
Il s'agit d'une parabole d'axe orthogonal à , dont le sommet est le milieu du segment
, où est la projection de sur .
où est appelé "paramètre de la parabole" et relativement à , le foyer sera donné par les
coordonnées et la directrice par l'équation
2. Cas où :
628/2001
Sciences.ch 14/03/2005
629/2001
Sciences.ch 14/03/2005
Etant donné que est sur l'axe , nous pouvons prendre le cas particulier où tel
que :
il existe donc deux foyers à l'ellipse à une distance équivalente mais opposée de .
Nous pouvons dès lors démontrer une relation que nous retrouvons courrament dans les
formulaires :
C'est-à-dire :
630/2001
Sciences.ch 14/03/2005
et
Voilà…
Cependant, il existe une autre forme d'équation de l'ellipse, bien plus importante, que l'on
retrouve aussi bien en physiqu classique, astrophysique et physique quantique corpsuculaire.
Rappellons que:
Donc:
ou
ou
Nous obtenons deux équations différentes, mais il s'agit en fait de la même courbe. Nous
remarquerons en effet que:
Etant donné que est défini comme le paramètre de la conique, l'équation polaire de
l'ellipse s'écrit:
Dans le cas général, peut faire un angle quelconque avec l'axe des angles polaires, et
l'équation générale est alors:
631/2001
Sciences.ch 14/03/2005
2. Cas où :
Posons que :
Mais encore:
et nous avons pour demi-grand axe et demi-petit axe (raisonnement identique à l'ellipse):
et:
632/2001
Sciences.ch 14/03/2005
PARAMÉTRISATIONS
Pour certaines des formes présentées ci-dessous, il est possible de choisir un autre système de
coordonnées que les coordonnées cartésiennes tel que par exemple les coordonnées
cylindriques ou sphériques qui sont dans certains cas beaucoup plus simples à mettre en place.
Nous tacherons dans la mesure du possible de présentes les plus importantes.
ÉQUATION DU PLAN
Soit un plan dont nous connaissons un vecteur normal et unitaire mais pas
l'équation et un point de .
Pour qu'un point de coordonnée appartienne au plan il faut et il suffit que les
vecteurs et soient orthogonaux. Donc soit le point étant de coordonnées:
Si est perpendiculaire à alors le produit scalaire doit être nul tel que:
633/2001
Sciences.ch 14/03/2005
Si nous écrivons l'équation avec les cosinus directeurs de (voir chapitre de calcul vectoriel),
nous avons dès lors aussi :
Remarque : pour obtenir un cube dans l'espace, il suffit d'avoir 6 plans délimités par des
conditions telles que
Comme nous l'avons vu en analyse fonctionnelle, une droite dans le plan peut-être décrite par
la fonction :
Définition : nous appelons "vecteur directeur" d'une droite , tout vecteur non nul de même
direction que la droite.
Théorèmes :
T1. Si une droite à pour équation alors le vecteur est directeur de cette
droite
Démonstrations :
D1. Soit et deux points de cette droite pris tel que . Comme
sont deux points de alors est un vecteur directeur de alors :
634/2001
Sciences.ch 14/03/2005
Souvent, nous recherchons la distance entre une droite et un point externe à celle-ci. Ainsi,
considérons la figure suivante :
car ou . Ainsi :
que est vecteur directeur). Ainsi, en appliquant la relation précédente nous avons :
635/2001
Sciences.ch 14/03/2005
Si nous considérons maintenant deux plans non parallèles de l'espace, leur intersection est une
droite. Soit deux plans d'équations respective:
Remarque: alors que dans le plan une droite est caractérisée par une équation du type
(voir chapitre d'analyse fonctionnelle). Dans l'espace, une seule équation de la
forme caractérise un plan. Pour caractériser une droite en dehors des
plans des axes, il est nécessaire (équation paramétrique mis à part) d'avoir deux équations.
Il est trivial (mais nous allons quand même le démontrer) que l'équation paramétrique d'une
droite est un système d'équations du type :
Ainsi, chaque composante croit linéairement par rapport à la même variable à une constante et
un facteur près. Ceci s'écrit aussi sous forme vectorielle (plus traditionnelle) :
Démonstration :
Nous avons donc le système d'équations (deux équations à trois inconnues, ainsi une inconnue
sera indéterminée) :
636/2001
Sciences.ch 14/03/2005
où donc d'où :
Le vecteur directeur et le vecteur d'ordonnée sont des constantes. Ce qui nous permet d'écrire
de manière plus générale :
Remarques :
R1. l'équation d'une droite est presque ce qu'il y a de plus important en synthèse d'images 3D
car à partir de ces dernières nous pouvons construire des polygones et assembler ces derniers
637/2001
Sciences.ch 14/03/2005
R2. Pour savoir si une droite est perpendiculaire à un plan il faut déterminer au moins deux
droites sécantes dans ce même plan et effectuer le produit vectoriel de leur vecteur directeur et
ensuite calculer le produit scalaire entre le résultat du produit vectoriel et la première droite
dont nous cherchons l'orthogonalité. Effectivement, une seule droite du plan ne permet pas de
déterminer l'orientation de ce dernier il en faut au moins deux.
Or ici, d'où:
donc :
638/2001
Sciences.ch 14/03/2005
Nous retrouvons donc bien l'équation cartésienne d'une sphère à une constante de translation
près.
Nous avons lors de notre étude des coniques que l'équation d'un ellipse dans le plan était
donnée par :
639/2001
Sciences.ch 14/03/2005
avec étant les deux axes deux l'ellipse (le petit et le grand).
Ainsi, sans démonstration rigoureuse, nous pouvons vérifier à la main ou à l'aide des
ordinateurs que l'équation cartésienne :
Cependant, il existe une autre manière de décrire l'ellipoïde en utilisant les coordonnées
curvilignes :
d'où :
Finalement :
Il va sans dire que l'équation d'un cylindre de rayon est donné par l'équation paramétrique :
640/2001
Sciences.ch 14/03/2005
Nous voyons bien que les composantes satisfont l'équation cartésienne d'un cercle
puisque :
Au même titre l'équation paramétrique d'un cylindre à base elliptique est donnée par :
SURFACES DE RÉVOLUTION
De manière plus générale de nombreuses surfaces (dont certaines que nous avons vues
précédemment) peuvent être décrites par révolution d'une forme primaire de dimension
inférieure et ensuite par rotation.
Définition : une "surface de révolution" est une surface obtenue en faisant tourner une courbe
plane (par exemple autour de l'axe . Ainsi, nous passons alors d'un plan de a
un repère de , l'axe engendre dès lors un plan devenu .
E1. Soit la parabole d'équation (rappelons que ) qui tourne autour de l'axe
. Nous avons bien évidemment (en coupant la paraboloïde par un plan ce qui donne un
cercle de rayon ) la relation (dite "équation cylindrique") . Or, nous avons aussi
d'où l'équation du paraboloïde de révolution :
Définition : toute surface engendrée par une droite est une "surface réglée".
641/2001
Sciences.ch 14/03/2005
Prenons l' exemple important (cheminée de centrales nucléaire, engrenages, etc.) qu'est
l'hyperboloïde à une nappe d'équation :
ce qui s'écrit aussi comme le produit de l'équation de deux droites tel que :
Ainsi, ses deux droites (de pente opposées) appartiennent à la nappe et tout point appartenant
à une de ses deux droites y est contenu. Les figures ci-dessous montrent bien qu'au fait, tout
point appartient à ses deux droites.
On pourrait ceci dit très bien décrire par des cercles tel que :
642/2001
Sciences.ch 14/03/2005
où .
643/2001
Sciences.ch 14/03/2005
GÉOMÉTRIE DIFFÉRENTIELLE
Remarque : il existe plusieurs méthodes d'étudier la géométrie différentielle dont une un peu
trop formelle à notre goût que nous laisserons pour l'instant le soin au mathématicien d'étudier
(elle est assez brièvement exposée cependant dans le chapitre de topologie de la section
d'algèbre).
Remarques :
R1. Si est continue, alors est une courbe de l'espace "d'un seul tenant".
R2. Une parabole, une sinusoïde sont des courbes appelées "courbes planes". Une ellipse, un cercle
sont elles appelées des "courbes planes fermées". Pour ces exemples, tous les points des courbes
considérées sont situés dans un même plan. Inversement, une courbe est appelée "courbe
gauche" (gauchir = dévier, tordre) s'il n'en est pas ainsi.
Remarques :
R2. Il est facile de définir d'autres arcs paramétrées admettant aussi comme support. Pour
ce faire, il suffit de se donner une fonction bijective de vers et telle que
.
644/2001
Sciences.ch 14/03/2005
nous savons que dans un espace euclidien canonique dans l'abscisse curviligne s'écrit
alors :
Qui est donc l'élément différentiel linéaire d'un espace euclidien (le plus court chemin ou
encore la "géodésique" ou encore " l'abscisse curviligne différentielle").
Nous pouvons bien évidemment écrire (par multiplication des deux côtés de l'égalité) :
Voyons une application avec une hélice (les exemples sont jolis en géométrie différentielle et
valent donc la peine d'être vus...) qui est un exemple typique de courbe gauche :
Soit et la fonction :
645/2001
Sciences.ch 14/03/2005
Remarque : la fonction est un arc paramétré dont le support est appelé une "hélice", en
est le rayon et le pas. En prenant comme origine, l'abscisse curviligne de cette hélice
(un morceau) est donné par :
Donc :
et donc
TRIEDRE DE FRENET
et donc unitaire.
646/2001
Sciences.ch 14/03/2005
donc :
Ce résultat va nous être utile pour détermine les conséquences de la définition suivante.
Posons:
Etant donné le résultat précédent, est le vecteur perpendiculaire unitaire à (nous disons
que ce couple de vecteur est "orthonormal direct") en et en est par définition la
"courbure". Si , alors :
Quant à la relation :
Le cercle de centre et de rayon est le cercle qui tangente le mieux et . Il est appelé
"cercle osculateur" à en .
647/2001
Sciences.ch 14/03/2005
et donc ce qui implique que n'est plus défini. Nous disons quelque fois dans ce cas
que le rayon de courbure à est infini (une droite présente alors une courbure nul en tout
point).
Nous pouvons déjà dire, étant donné que et sont unitaires que l'est aussi.
Etant donné que est perpendiculaire à , et que est aussi perpendiculaire à nous
Posons :
avec
648/2001
Sciences.ch 14/03/2005
Cherchons le rayon et le centre de courbure en tout à notre hélice définie plus haut.
Rappelons que la fonction paramétrique est donnée par :
et que :
649/2001
Sciences.ch 14/03/2005
Ainsi :
650/2001
Sciences.ch 14/03/2005
NAPPE PARAMETRÉES
Soient :
avec
Appelons . Si est continue, alors est une surface de l'espace "d'un seul tenant".
Par définition, dans ce qui suit, le couple où est une fonction supposée continue
sera appelé "nappe paramétrée", et le "support" de la nappe paramétrée. Nous disons
encore que et sont des paramétrages de .
Remarquons que pour une surface (par exemple un disque), il existe plusieurs nappes
paramétrées associées (par exemple les coordonnées cartésiennes, polaires, sphériques).
tels que
Si nous supposons continue, il est claire que est un arc paramétré. Appelons son
support, nous avons et nous disons que est une "courbe tracée" ou "inscrite" sur .
Soit . Intéressons nous aux deux courbes tracées sur définies par les
arcs paramétrés suivants :
avec
651/2001
Sciences.ch 14/03/2005
avec
Il est bien sûr évident (voir chapitre de calcul différentiel et intégral) que :
Soit :
avec
652/2001
Sciences.ch 14/03/2005
et nous avons démontré au début de ce chapitre que l'abscisse curviligne dans un espace
cartésien était donnée par :
Comme nous l'avons déjà démontré en calcul tensoriel, cette expression est indépendante de
la nappe paramétrée car l'élément de longueur infiniment petit est indépendant du
paramétrage de . Cette forme quadratique est donc un invariant qui représente la métrique
sur .
653/2001
Sciences.ch 14/03/2005
FORMES GÉOMÉTRIQUES
Nous avons déjà défini au début du chapitre de géométrie euclidienne les concepts de
dimensions topologiques, ce qu'était un point de dimension nulle et une courbe de dimension
unité. Nous ne reviendrons pas sur ces dernières et nous intéresserons au formes de
dimensions supérieures.
Les quelques formes que nous avons souhaité présenter permettent assez facilement de
trouver les propriétés remarquables d'un très grand nombre de formes non repertiorées sur
cette page par assemblage ou décomposition.
Remarques :
R1. Les relations trigonométrique remarquables dans les formes géométriques ci-dessous ne
sont pas démontrées dans ce chapitre. Celles-ci se trouvent déjà toutes dans le chapitre traitant
spécifiquement de la trigonométrie.
R2. Nous entendons par "centre de gravité", le "barycentre" tel que vu dans le chapitre de
géométrie euclidienne.
SURFACES CONNUES
Définition (moderne - topologique) : une surface est une variété topologique de dimension 2
Remarque : nous nous intéresserons dans un premier temps uniquement aux propriétés
(périmètre, surface, centre de gravité,...) de surfaces plongées dans des géométries
euclidiennes.
POLYGONES
Définition : un "polygone" est une surface plane fermée par des segments de droites finis dont
les sommets sont confondus.
654/2001
Sciences.ch 14/03/2005
RECTANGLE
Définition : le rectangle est un cas particulier du quadrilatère (forme à quatre côtés délimités
par des segments finis tel que : losange, carré, rectangle, trapèze, etc.) dans le sens où ses
quatre côtés sont égaux et à angle droit.
Remarque : le rectangle peut être vu comme la composition de deux (ou plus) triangles
rectangles (voir plus loin la définition). Pour construire un rectangle, il suffirait d'avoir un seul
et unique triangle rectangle et lui faire subir une double réflexion et une rotation par rapport à
une axe bien choisi (voir le chapitre de géométrie euclidienne).
De par les axiomes d'Euclide (voir chaitre de géométrie euclidienne), le périmètre est donné
par :
655/2001
Sciences.ch 14/03/2005
La position du centre de gravité du rectangle, si nous posons le repère cartésien dans le coin
inférieur gauche de la forme, est trivialement donné par :
CARRÉ
Définition : le "carré" est un cas particulier du rectangle dans le sens où ses quatre côtés sont
égaux tel que .
De par les axiomes d'Euclide (voir chaitre de géométrie euclidienne), le périmètre est donné
par :
Pour la diagonale :
La position du centre de gravité du carré, si nous posons le repère cartésien dans le coin
inférieur gauche de la forme, est trivialement donné par :
TRIANGLE
Définition : le "triangle" est un polygone à trois côtés et englobe dans les cas particuliers, les
triangles : isocèles, équilatéraux et rectangles.
656/2001
Sciences.ch 14/03/2005
De par les axiomes d'Euclide (voir chaitre de géométrie euclidienne), le périmètre est donné
par :
Le triangle quelconque est toujours décomposable en deux triangles rectangles. Ainsi, celui de
la figure ci-dessous peut se décomposer en deux triangles rectangles de base respective et
(définis par la projection orthogonale du sommet opposé au segment ) tels que :
La surface de ces deux triangles rectangles sont commes nous l'avons déjà implicitement dit
dans notre étude du rectangle, la moitié de la surface d'un rectangle de même longueur et
même hauteur. Ainsi :
Nous pouvons de cette dernière relation, que la surface tout triangle quelconque est
assimilable à la moitié de la surface d'un rectangle de longueur et hauteur .
La détermination du centre de gravité est un peu moins intutive. Nous pouvons bien sûr nous
servir d'un repère et des outils du calcul vectoriel pour très facilement déterminer ce dernier.
Malheureusement dans les écoles, les professeurs préférent le principe du dessin des
médianes. Nous allons donc démontrer que le centre de gravité d'un triangle quelconque est à
l'intersection de toutes les médianes :
657/2001
Sciences.ch 14/03/2005
Nous allons démontrer que le seul point vérifiant (voir le chapitre de géométrie
euclidienne) :
est le point de concours des trois médianes du triangle . Cette démonstration s'effectuera
en deux étapes, en deux propositions. Au terme, nous pourrons conclure par le théorème.
Propositions :
P1. Si est un triangle alors il existe un et un seul centre de gravité tel que
P2. Les trois médianes d'un triangles sont concourantes. Leur point d'intersection est ce point
.
Démonstration P1. :
Soit un point du plan tel que . Nous pouvons alors écrire que :
d'où :
Cette relation vectorielle garantit que le point est unique et que nous pouvons même le
placer !
Démonstration P2. :
Pour démontrer que les trois médianes sont concourantes, nous allons prouver que
appartient à chacune des trois médianes.
658/2001
Sciences.ch 14/03/2005
Les vecteurs et sont donc colinéaires! Donc les points sont alignés.
Autrement écrit, le point fait partie de la médiane du triangle . Nous pouvons
même dire qu'il se trouve au deux tiers du segment à partir du sommet .
Ce que nous venons de montrer avec la médiane est bien évidemment aussi vrai pour les
deux autres médianes. Ainsi :
En résumé, le point fait donc partie des trois médianes , et . Ces trois droites
sont donc concourantes et le point en est le point d'intersection.
TRIANGLE ISOCÈLE
Définition : un "triangle isocèle" est un cas particulier du triangle quelconque, dans le sens où
il a deux côtés égaux.
659/2001
Sciences.ch 14/03/2005
Et le centre de gravité reste, comme nous l'avons démontré dans le cas général, à la position :
P1. La médiatrice et la médiane du troisième côté non égal aux deux autres sont confondus
(démonstration : voir le chapitre de géométrie euclidienne).
TRIANGLE ÉQUILATÉRAL
Définition : un "triangle équilatéral" est un cas particulier du triangle, dans le sens où il a trois
côtés égaux.
Et le centre de gravité reste comme nous l'avons démontré dans le cas général, reste à la
position :
660/2001
Sciences.ch 14/03/2005
P1. Toutes les médiatrices et médianes sont confondus (démonstration : voir le chapitre de
géométrie euclidienne).
TRIANGLE RECTANGLE
Définition : un "triangle rectangle" est un cas particulier du triangle, dans le sens sur un de ses
trois angles, il a au moins un angle droit.
La surface comme nous l'avons démontré dans le cas général reste (surface de la moitié d'un
rectangle de même base et de même hauteur):
Et le centre de gravité reste comme nous l'avons démontré dans le cas général, reste à la
position :
P1. Le triangle rectangle à ceci de particulier, que nous pouvons directement lui appliquer le
théorème de Pythagore (voir le chapitre de géométrie euclidienne).
661/2001
Sciences.ch 14/03/2005
TRAPÈZE
Définition : un "trapèze", est un quadrilatère dont deux côtés sont parallèles mais de longueur
inégale.
PARALLÉLOGRAMME
LOSANGE
Définition : le losange est un cas particulier du parallélogramme dans le sens où ses quatre
côtés sont égaux.
CERCLE
Définition 1. : un "cercle" est un cas particulier d'un polyèdre avec une infinité de côtés.
Définition 2. : un "cercle" est une courbe plane dont tous les points sont à égale distance d'un
point fixe appelé centre.
662/2001
Sciences.ch 14/03/2005
Nous démontrons dans la section d'analyse numérique (chapitre traitant des algorithmes), que
le périmètre d'un cercle de rayon et donc de diamètre est donné par :
2. La seconde méthode est plus esthétique et fait appel à l'équation paramétrique du cercle,
trivialement donnée par les projections orthogonales des coordonnées cartésiennes :
Nous savons que l'aire décrite par une fonction est donnée par :
Il nous suffit alors de substituer dans cette intégrale les variables paramétrées :
Ainsi :
663/2001
Sciences.ch 14/03/2005
La longueur d'une tranche d'angle d'ouverture d'un cercle de rayon est bien
évidemment donné par :
Soit connue la relation de calcul de la surface d'un triangle. Nous avons selon la figure ci-
dessous (la démonstration tient seulement dans le résultat lui-même) :
Remarque : par définition du cercle, il est évident que le centre de gravité du cercle se
confond avec le centre de celui-ci.
ELLIPSE
Définition : une "ellipse" est une courbe fermée dont chaque point est tel que la somme de ses
distances à deux points fixes appelés "foyers" est constante.
664/2001
Sciences.ch 14/03/2005
La distance entre le centre du foyer et l'ellipse est alors donné par le théorème de Pythagore :
De longs développements que nous présenterons dans quelques années dans le chapitre de
calcul différentiel et intégral donne pour le périmètre après un calcul en série limitée :
665/2001
Sciences.ch 14/03/2005
La relation de surface de l'ellipse peut être obtenu de manière très similaire à celle du cercle et
les calculs sont curieusement beaucoup plus simple que ceux du périmètre. Rappelons que
l'équation paramétrique l'ellipse est :
Nous savons que l'aire décrite par une fonction est donnée par :
Il nous suffit alors de substituer dans cette intégrale les variables paramétrées :
Ainsi :
Remarques :
R1. Nous supposons comme évident que le centre de gravité de l'ellipse se confond avec le
centre de celle-ci.
R2. Nous renvoyons le lecteur à l'étude des coniques (chapitre de géométrie euclidienne) pour
le caclul de la surface d'une ellipse à partir de son "paramètre d'ellipse" et son
"excentricité" (tout y est démontré).
VOLUMES CONNUS
666/2001
Sciences.ch 14/03/2005
Définition (moderne - topologique) : une volume est une variété topologique de dimension 3
Remarque : nous nous intéresserons dans un premier temps uniquement aux propriétés
(surface, volume, centre de gravité, moment d'inertie...) de volumes plongés dans des
géométries euclidiennes.
POLYÈDRES
Nous définissons (mauvaise définition pour l'instant...) par polyèdre un "solide" à trois
dimensions et donc à plusieurs faces.
PARALLÉLÉPIPÈDE
Quand à sa surface, il s'agit simplement de la somme des surface des rectangles sans rien de
particulier.
et :
667/2001
Sciences.ch 14/03/2005
Nous avons :
Avec :
d'où :
Nous allons montrer qu'il est dès lors possible de calculer le moment d'inertie du triangle
équilatéral et rectangle.
668/2001
Sciences.ch 14/03/2005
Le moment d'inertie toujours par rapport au même axe mais pour la moitié du carré est donnée
par :
Si le centre de gravité est posé sur le tiers de la médiane partant du centre de gravité du carré
et que nous faisons usage du théorème de Steiner (voir chapitre de mécanique classique), il
vient :
Le cube est un polyèdre particulier à 6 faces à six faces carrées égales et perpendiculaires. Il
s'agit d'un cas particulier du parallélépipède à six côtés égaux.
PYRAMIDE
La pyrmaide est un polyèdre qui a pour base un polygone et pour faces latérales des triangles
réunis en un point appelé sommet.
669/2001
Sciences.ch 14/03/2005
Nous parlons d'équation de plan alors qu'il n'y a pas de repères défini pour l'instant. Au fait,
dans l'intégrale, varie entre 0 et . Cela sous-entend que nous prenons un repère centré en
(le pied de la hauteur de la pyramide), d'axe de la droite (la hauteur de la pyramide)
orientée de vers (du pied de la hauteur vers le sommet). Les deux autres axes sont
choisis quelconques dans le plan de la base de la pyramide.
Le fait d'avoir pris le carré de provient du fait que chaque terme intérieur de est le
produit de deux termes (selon le calcul de la surface d'un triangle) chacun de rapport
d'homotétie .
TETRAÈDRE
Définition : le tetraèdre est un polyèdre irrégulier à 4 face égales dont la base est un triangle
670/2001
Sciences.ch 14/03/2005
quelconque.
Il s'agit d'un cas particulier à trois faces de la pyramide dont le volume est aussi trivialement
donné par le même raisonnement et s'exprime donc par :
La surface de celui-ci étant aussi donnée trivialement par la somme des surfaces des triangles
qui le composent.
OCTAÈDRE
Définition : l'octaèdre peut être considéré comme la représentation volumique d'un losange
(dont la base est elle-même un losange (si la base était un carré, alors il s'agirait d'une
pyramide a base carrée).
Il s'agit d'un cas particulier à quatres faces de la pyramide et dont le volume est aussi
trivialement donné par le même raisonnement mais doublé et s'exprime donc par :
La surface de celui-ci étant aussi donnée trivialement par la somme des surfaces des triangles
qui le composent.
PRISME DROIT
Le prisme est un polyèdre dont les bases sont deux polygones égaux à côtés parallèles, les
faces latérales étant des parallélogrammes.
671/2001
Sciences.ch 14/03/2005
Pour calculer le volume d'un prisme droit, nous devons tout simplement multiplier l'aire de
sa base par sa hauteur :
DODÉCAÈDRE
ICOSAÈDRE
CORPS DE RÉVOLUTIONS
CYLINDRE
Définition : un "cylindre" est une surface engendrée par une droite qui se déplace
parallèlement à une direction fixe en rencontrant une courbe plane fixe, dont le plan coupe la
672/2001
Sciences.ch 14/03/2005
direction donnée.
La surface d'un disque étant simplement la somme de la surface des deux disque de base et du
sommet et de la surface du rectangle plié de hauteur et de longueur :
Calculons maintenant le moment d'inertie d'un cylindre plein par rapport à son axe de
symétrie vertical (axe de révolution) :
Nous avons :
Donc :
673/2001
Sciences.ch 14/03/2005
d'où :
d'où :
La première intégrale est en fait le moment d'inertie du cylindre par rapport à l'axe et nous
savons quelle vaut :
Le moment d'inertie d'un cylindre par rapport à un axe perpendiculaire à son axe de révolution
s'écrit donc :
Calculons maintenant le moment d'inertie d'une tube ou d'un cylindre creux d'épaisseur non
nulle (toujours donné dans les formulaires techniques) : le moment d'inertie d'un tube par
rapport à son axe de révolution est un grand classique du traitement du moment d'inertie du
cylindre. Ainsi, considérons un tube de rayon extérieur et de rayon intérieur . Comme
(voir chapitre de mécanique classique) :
Il vient dès lors que le moment d'inertie d'un tube peut-être vu comme le moment d'inertie du
cylindre de rayon égal au rayon externe du tube diminué du moment d'inertie du cylindre de
rayon égal au rayon interne du tube. Ainsi :
674/2001
Sciences.ch 14/03/2005
CÔNE
Définition : un "cône" est une surface engendrée par une droite mobile, passant par un point
fixe et s'appuyant sur une courbe fixe; solide déterminé par cette surface.
La rotation de cette droite par rapport à l’axe des donne le volume du cône :
Calculons maintenant d'inertie d'un cône par rapport à son axe de révolution :
675/2001
Sciences.ch 14/03/2005
Donc :
SPHÈRE
Définition : la "sphère" est le volume engendré par la rotation d'un disque (ou cercle) autour
de son centre de gravité.
Nous pouvons voir une sphère de rayon , comme une surface qui est formée par la rotation
d'un demi-cercle autour de son grand axe. La fonction décrivant un demi-cercle étant :
La sphère peut être disséquée donc comme un somme de disques d'épaisseur . Les demi-
disques étant tangents à l'axe des abscisses et de largueur à la position (voir figure ci-
dessous).
Le volume d'un disque (cylindre) étant donné par (en passant à la limite) :
676/2001
Sciences.ch 14/03/2005
Nous pouvons également prendre les bornes entre cela revenant au même à un
facteur 2 près :
L'expression de la surface étant donnée par dérivant par rapport à l'élément générant la
surface, nous obtenons ainsi :
677/2001
Sciences.ch 14/03/2005
TORE
Afin d'écrire sous la forme d'une fonction de , isolons dans cette équation:
- Demi-cercle supérieur :
- Demi-cercle inférieure :
Le volume demandé est la différence entre les volumes engendrés par la rotation des surfaces
(surfaces définies par l'aire comprise entre la fonction du cercle concerné et l'axe des abscisses
compris entre ) dans l'espace autour de l'axe des abscisses.
678/2001
Sciences.ch 14/03/2005
si :
si :
donc :
Donc le volume d'un tore de rayon mineur et de rayon majeur est donné par :
679/2001
Sciences.ch 14/03/2005
d'où :
1. Les bornes d'intégration deviennent dès lors puisque nous ramenons tous les points
d'intégration à l'origine en posant
680/2001
Sciences.ch 14/03/2005
Comme l'intégrale entre deux bornes égales d'une fonction ou produit de fonction impaires est
nul (voir chapitre de calcul différentiel et intégral), les intégrales de :
sont nulles.
Or, comme :
Donc :
681/2001
Sciences.ch 14/03/2005
Donc finalement :
ELLIPSOÏDE
Définition : "L'ellipsoïde" est un solide engendré par la révolution d'une ellipse autour de l'un
de ses axes.
Pour calculer le volume délimité par l'ellipsoïde, prenons l'équation que nous avons
déterminée lors de notre étude des coniques dans le chapitre de géométrie euclidienne :
ou :
682/2001
Sciences.ch 14/03/2005
Mais comme nous l'avons démontré, la surface d'une ellipse vaut . Par conséquent :
Donc :
PARABOLOÏDE
Le paraboloïde est un solide engendré par la révolution d'une parabole autour de son foyer :
La méthode de calcul du volume du paraboloïde à base elliptique est exactement la même que
683/2001
Sciences.ch 14/03/2005
celle pour la pyramide à la différence que l'équation d'une parable est du type et que
nous avons aussi . Dès lors, nous avons évidemment . Le carré de la fonction
nous amène à écrire :
684/2001
Sciences.ch 14/03/2005
L’histoire de la théorie des graphes (ou des "complexes cellulaires") débute peut-être avec les
travaux d’Euler au 18e siècle et trouve son origine dans l’étude de certains problèmes, tels que
celui des ponts de Königsberg (voir page de couverture, les habitants de Königsberg se
demandaient s’il était possible, en partant d’un quartier quelconque de la ville, de traverser
tous les ponts sans passer deux fois par le même et de revenir à leur point de départ), la
marche du cavalier sur l’échiquier ou le problème de coloriage de cartes.
La théorie des graphes s’est alors développée dans diverses disciplines telles que la chimie
(isomères), la biologie, les sciences sociales (réseaux de transports), gestion de projets
(C.P.M.), informatique (topologie des réseaux, complexité algorithmique), etc.. Depuis le
début du 20e siècle, elle constitue une branche à part entière des mathématiques, grâce aux
travaux de König, Menger, Cayley puis de Berge et d’Erdös.
Les graphes constituent donc une méthode de pensée qui permet de modéliser une grande
variété de problèmes en se ramenant à l’étude de sommets et d’arcs.
Les derniers travaux en théorie des graphes sont souvent effectués par des informaticiens, du
fait de l’importance qu’y revêt l’aspect algorithmique (voir le début du chapitre de méthodes
numériques pour un petit exemple).
La théorie des graphes connaît un assez grand engouement ces 30 dernières, peut-être est-ce
parce qu'elle ne nécessite pas dans ses concepts élémentaires de bagage mathématique
considérable. Effectivement, il suffit d'avoir parcouru les chapitres de probabilités et
statistiques, de théorie des ensembles et d'algèbre linéaire ainsi que de topologie présentés sur
le site pour déjà se sentir à l'aise avec les différentes définitions.
Nous allons introduire le vocabulaire de base de la théorie des graphes. Les termes employés
sont ceux du langage commun de la géométrie euclidienne (et malheureusement ils sont aussi
en grand nombre... foutue langue commune).
Définitions :
Remarque : Un graphe est dit "planaire" quand nous pouvons le représenter dans un plan sans
qu'il y ait intersection d'arêtes
D2. Les éléments de sont les "sommets" du graphe , ceux de sont les "arêtes" du
graphe (effectivement, une arrête est composée de deux sommets, d'où l'allusion aux paires
d'éléments dans la définition précédente).
Remarque : Dans un "multigraphe", les deux sommets d'une arête peuvent être identiques
685/2001
Sciences.ch 14/03/2005
(boucle) et deux arêtes distinctes peuvent avoir leurs deux extrémités communes. Un
multigraphe ne satisfait plus alors la définition D1.
D3. Soit une arête de , nous disons que les sommets qui sont les
"extrémités" de l'arête de , sont "adjacents" ou "voisins" dans le graphe , et que l'arête
est "incidente" aux sommets .
D4. Si deux arêtes et ont une extrémité en commun, nous dirons qu'elle sont
"incidentes", autrement, qu'elles sont indépendantes.
Remarque : soit un graphe d’ordre , l’ensemble doit être par définition choisi comme
sous-ensemble de l’ensemble des paires d’éléments de l’ensemble , donc d’un ensemble
(trivial – puisque un sommet ne peut pas être voisin à lui-même) de cardinal :
choix possibles pour et donc autant de graphes admettant pour ensemble de sommets.
Certains de ces graphes, sont par le fait que nous considérons leurs sommets comme non-
distinguables "automorphes" (voir la définition de ce terme un peu plus loin dans ce
chapitre).
Le résultat obtenu signifie qu'il existe environ 2 millions de graphes à 7 sommets, et quelques
graphes à 27 sommets – chiffre à comparer avec le fait que nous estimons à moins de
le nombre d’atomes dans l’Univers (...).
D7. Nous appelons "degré" d'un sommet, le nombre de ses voisins, qui est également le
nombre d'arêtes qui lui sont incidentes (un sommet de degré zéro étant appelé un "sommet
isolé").
Propriétés (triviales) :
686/2001
Sciences.ch 14/03/2005
P2. Un graph ayant tous ses sommets de degré pair est d'ordre de d'odre impair (excepté pour
le sommet isolé).
Remarque : un graphe "régulier" est un graphe dont tous les sommet ont même degré
D8. Nous dirons qu'un graphe est un "sous-graphe" ou "sous-graphe induit" d'un
graphe lorsque et .
D10. Pour un graphe d'ordre , il existe deux cas extrêmes pour l'ensemble de ses arêtes : soit
le graphe n'a aucune arête, soit toutes les arêtes possibles pouvant relier les sommets deux à
deux sont présentes. Dans ce dernier cas le graphe est dit "complet".
Remarque : Un graphe complet est donc un graphe où chaque sommet est relié à tous les
autres. Le graphe complet d'ordre est noté . Dans ce graphe chaque sommet est de degré
("l'étoile de David" n'est complète que si l'on joint tous les sommets entre eux - ainsi
nous perdons la géométrie de l'étoile mais obtenons un graphe ).
D11. Un "graphe stable" est sous-graphe sans arête et une "clique" un sous-graphe complet.
D12. Dans un graphe il est naturel de vouloir se déplacer de sommet en sommet en suivant les
arêtes. Une telle marche passant par sommets est appelée une "chaîne " ou un "chemin" :
Remarque : un chemin est dit "simple" si chaque arête du chemin est empruntée une seule
fois. Ainsi, nous définissons aussi un "cycle"("cycle" aussi en anglais...) :
comme étant un chemin simple finissant à son point de départ tel que:
D13. Un "cycle simple" est un cycle dont toutes les arêtes sont différentes.
D14. Un "graphe orienté" est un graphe (sous entendu non-orienté jusqu'à présent) dont les
arêtes (dès lors appelés "arcs") ont une direction et un sens (donc à l'opposé du graph non-
orienté qui a lui aussi des arêtes qui ont une direction mais pas de sens).
Remarque : les termes de chemin et de circuit s'emploient en propre pour les graphes orientés.
Pour les graphes non orientés que nous manipulons principalement ici, nous parlons de chaîne
et de cycle. Cependant la définition formelle est exactement la même dans les deux cas, seule
change la structure (graphe orienté ou non) sur laquelle ils sont définis.
687/2001
Sciences.ch 14/03/2005
P2. Le nombre de chemins élémentaires dans le graphe est fini. Effectivement, le nombre de
chemins de longueur est au plus la combinatoire du choix d'une suite de
sommets distinguables parmi . Il y en a donc (voir chapitre de probabilité et
statistiques):
Remarque : les chemins élémentaires sont la restriction naturelle que nous recherchons à la
notion de chemin. La question qui se pose est de savoir si nous "perdons" quelque chose en ne
considérant que les chemins élémentaires dans un graphe : peut on toujours remplacer un
chemin du graphe par un chemin élémentaire?
Le "lemme de König" répond affirmativement à cette question : de tout chemin nous pouvons
extraire un sous-chemin élémentaire.
L1. S'il existe un chemin entre 2 sommet et , alors il existe un élémentaire entre et .
Démonstration :
L'idée de la preuve est de choisir un chemin particulier entre et et de montrer qu'il est
élémentaire. Quel chemin choisir? Si un chemin comporte un circuit, ce circuit est un détour
sur la route menant de et . Un bon candidat à être un chemin élémentaire semble donc
être un plus court chemin.
688/2001
Sciences.ch 14/03/2005
D16. Un graphe est dit "connexe" si et seulement si, il existe un chemin entre chaque paire de
sommets (le chemin n'étant donc implicitement pas nécessairement direct - pouvant passer par
un sommet intermédiaire).
D17. Un "arbre" est un graphe connexe, sans cycle simple et sans boucle. Dans un arbre le
nombre d'arrêtes est égal au nombre de sommets - 1.
D18. Un "arbre valué" est un arbre où les arêtes ont des valeurs (pondérations) positives. La
somme de toutes les valeurs qui sont sur les arêtes parcourues d'un arbre est appelé alors le
"coût d'un arbre valué".
Remarque : Que se passe-t-il si le graphe n'est pas connexe? Il apparaît alors comme un
ensemble de graphes connexes mis les uns à coté des autres. Chacun de ces graphes est un
sous-graphe particulier de , appelé "composante connexe". Il est souvent utile de se placer
sur les composantes connexes d'un graphe pour se ramener au cas d'un graphe connexe.
D20. Un "cycle" est un chemin simple rebouclant sur lui-même. Un graphe dans lequel il
n'existe aucun cycle possible est dit "acyclique". Les graphes acycliques constituent une
classe intéressante de graphes, avec des propriétés remarquables et un nom : "les forêts". Il
existe des relations fortes entre l'existence d'un cycle dans un graphe, le degré des sommets, et
le nombre d'arêtes.
Propriétés :
P1. (triviale) Si dans un graphe tout sommet est de degré supérieur ou égal à 2, alors
possède au moins un cycle.
Remarque : cette propriété simple implique qu'un graphe sans cycle possède au moins un
sommet de degré 0 ou 1. A l'inverse, nous pouvons lier cette fois l'absence de cycle dans un
graphe avec le nombre d'arêtes.
D21. Un "cycle eulérien" est un cycle passant une et une seule fois par chaque arête du graphe
et revenant au point de départ (nous verrons plus loin les propriétés que doit posséder un tel
graphe pour qu'un tel cycle y existe)
689/2001
Sciences.ch 14/03/2005
D22. Un graphe est dit "graphe eulérien" s'il admet une cycle eulérien.
D23. Un "cycle hamiltonien" est un cycle simple passant par tous les sommets du graphe une
et une seule fois. Pour avoir un cycle hamiltonien, le graphe doit être connexe et il ne doit pas
y avoir de sommets pendant.
D24. Un "graphe hamiltonien" est une graphe qui possède un cycle hamiltonien.
Il convient d'ouvrir maintenant une parenthèse (pour les paillettes…) sur le problème le plus
connu en théorie des graphes : les ponts de Königsberg.
Euler (voir page des biographies) , aimait à faire une promenade dans sa bonne ville de
Königsberg. Il affectionnait tout particulièrement de parcourir les 7 ponts qui enjambent la
rivière. L'âge venant (les connaissances mathématiques aussi…), il se demanda si sans
sacrifier à sa promenade, il pouvait en raccourcir la longueur en ne parcourant chaque pont
qu'une seule fois. Ce problème est sans doute l'un des plus anciens en théorie des graphes :
celui de l'existence d'une chaîne passant une et une seule fois par chaque arête.
La rivière sépare la ville de Königsberg en quatre parties, . Un pont relie deux de ces
parties. Nous pouvons alors représenter notre problème par un graphe avec quatre sommets,
où chaque arête représente l'un des sept ponts de Königsberg. Sur cet exemple le graphe n'est
pas un graphe simple :
690/2001
Sciences.ch 14/03/2005
Comment savoir si un graphe est eulérien ou non ? Si pour notre problème le graphe obtenu
est eulérien, il faut exhiber un cycle eulérien, ce qui ne semble pas facile. Mais s'il ne l'est
pas ? Euler a donné une caractérisation très forte des graphes eulériens donnée par l'énoncé
suivant :
Théorème d'Euler : Un graphe est eulérien si et seulement s'il est connexe et tous ses sommets
sont de degré pair sauf au plus deux
- le graphe n'a pas de sommets impair, alors il est eulérien (et la chaîne est donc cyclique)
- le graphe ne peut avoir un seul sommet impair de par la propriété (déjà énoncée plus haut)
que dans une graphe, le nombre de sommets de degré impair est toujours pair.
- si le graphe a deux sommets impairs, ces sommets sont alors les extrémités de le chaîne
eulérienne
Corollaire : une graphe ayant plus de deux sommets impairs ne possède pas de chaîne
eulérienne.
Avec cette caractérisation (que nous allons démontrer de suite après), les sommets
étant de degré impair, on sait immédiatement qu'il est impossible de parcourir tous
les ponts de Königsberg seulement une fois au cours d'une promenade.
Démonstration :
1. Supposons qu'un graphe soit eulérien. Il existe alors une chaîne parcourant une et une
seule fois chaque arête (jusque là c'est facile). Bien évidemment, dans le cas d'une chaîne, les
sommets se situant aux extrémités de la chaîne sont de degré impair et sont au nombre de
deux.
3. Réciproquement considérons un graphe connexe dont tous les sommets sont de degré
pair. Nous allons montrer par induction sur le nombre d'arêtes que est alors eulérien :
- Si se réduit à un unique sommet isolé, il est évidemment eulérien. Sinon tous les
sommets de sont de degré supérieur ou égal à 2. Ceci implique qu'il existe un cycle sur
:
- Considérons le graphe partiel constitué des arêtes en dehors du cycle . Les sommets de
sont également de degré pair, le cycle contenant un nombre pair d'arêtes incidentes pour
chaque sommet. Par induction chaque composante connexe de est un graphe eulérien,
et admet donc un cycle eulérien . Pour reconstruire un cycle eulérien sur , il nous suffit
691/2001
Sciences.ch 14/03/2005
de fusionner le cycle avec les différents cycles . Pour cela nous parcourons le cycle
depuis un sommet arbitraire; lorsque nous rencontrons pour la première fois un sommet
appartenant à , nous lui substituons le cycle . Le cycle obtenu est un cycle eulérien
pour , le cycle et les cycles formant une partition des arêtes.
D26. Un "graphe biparti" est un graphe tel que nous puissions partitionner l’ensemble de ses
sommets en deux classes de sorte que toute arête ait une extrémité dans chacune des deux
classes.
Remarque : le "graphe biparti complet " est un graphe de sommets de sorte que
chacune des deux classes de cardinaux respectifs de sorte que chaque sommet d'une classe
soit adjacent à tous les sommets de l'autre et seulement à ceux-ci.
D27. Deux graphes sont isomorphes s’il existe une bijection de dans telle que, pour
tous sommets et de :
Nous disons alors que est un "automorphisme dans " (par permutation des sommets il
692/2001
Sciences.ch 14/03/2005
Remarques :
R1. Attention ! Parfois nous parlons de graphes équivalents à "un isomorphisme près". Cela
signifie plus clairement, qu'à l'exception d'une et unique violation parmi l'ensemble des arêtes,
les graphes sont isomorphes.
R2. Comme l'isomorphisme dans le cas des graphes vas d'un ensemble à un autre de même
cardinal , le nombre de bijection possible différentes est (voir le chapitre de probabilité et
statistique sur les arrangements) :
Cela signifie qu'il existe au maximum graphes qui peuvent se regrouper dans une même
classe d'équivalence - mais cependant qu'il n'en existe pas une seule (sans que cela en donne
le nombre, nous en connaissons le majorant). En conséquence, il existe au minimum
(minorant) le rapport du nombre total de sommets sur le cardinal majoré de la plus grande
classe d'équivalence possible (mais pas nécessairement existante) :
D'où :
Soit encore :
D28. Une "étoile" d’ordre dont un sommet est voisin à tous les autres dont il est lui-même
l’unique voisin
MATRICE D'ADJACENCE
Au plan formel, un graphe est aussi un ensemble sur lequel nous avons défini une relation
binaire, antiréflexive (aucun élément n’est en relation avec lui-même) et symétrique (si est
693/2001
Sciences.ch 14/03/2005
en relation avec , alors est en relation avec ). La structure de graphe peut alors sembler
particulièrement pauvre.
Mais nous pouvons aussi associer à un graphe de sommets une matrice carrée
de dimensions appelée "matrice d’adjacence" du graphe et dont les éléments valent
0 ou 1. En notant le terme située au croisement de la ligne (représentant le sommet )
et de la colonne (représentant le sommet ), est défini par :
De par cette définition et celle du graphe lui-même, il vient que dans une matrice d’adjacence
que les éléments diagonaux pour lesquels valent tous 0 et que . Rappelons
qu’une telle matrice est dite "symétrique".
CATEGORIES
L'introduction des catégories (théorie des catégories) par Eilenberg et MacLane en 1942 avait
pour but de transformer de difficiles problèmes de Topologie en problèmes plus abordables
d'Algèbre. Plus tard, la Théorie des Catégories s'est beaucoup développée, à la fois pour elle-
même et pour ses applications dans les domaines les plus variés des Mathématiques (e.g. en
Géométrie Différentielle). Même si une partie de son développement autonome a parfois été
critiquée comme "abstract non-sense", les catégories sont maintenant reconnues comme un
langage puissant pour développer une sémantique universelle des structures mathématiques.
On les utilise aussi (via la théorie des topos) en Logique et plus récemment en Physique, et
une collaboration fructueuse semble se développer entre catégoriciens et informaticiens.
Définitions :
D1. Intuitivement une catégorie est juste un graphe orienté sur lequel nous nous sommes
donné une loi pour composer des flèches consécutives, vérifiant certains axiomes.
D2. Un "graphe orienté" est formé d'un ensemble d'objets, appelés sommets du graphe, avec
des liens entre eux, représentés par des flèches d'un sommet vers un sommet , ce que
nous notons . Nous disons que est la "source" de la flèche, et son "but". Il
peut y avoir plusieurs flèches de même source et de même but (nous les disons "parallèles") et
il peut y avoir des flèches "fermées", dont la source et le but sont confondus.
D3. Deux flèches sont dites "consécutives" si le but de la première est en même temps la
source de la seconde:
Nous disons alors qu'elles forment un chemin de longueur 2 de vers . Plus généralement,
un chemin (de longueur ) de vers est une suite de flèches
consécutives :
694/2001
Sciences.ch 14/03/2005
Une catégorie est donc un graphe dans lequel nous définissons une composition de flèches,
associant à tout chemin de longueur 2 de vers une flèche du graphe de vers
, dite composée du chemin, et notée :
A2. Identités : A tout sommet est associée une flèche fermée de vers , dite "identité"
de et notée , dont le composé avec une flèche de source ou de but est égal à cette
autre flèche.
Remarques :
R1. Les sommets du graphe sont aussi appelés "objets" de la catégorie et ses flèches
"morphismes" (ou simplement "liens") dans le cadre de la théorie des catégories
R2. Une flèche est un isomorphisme s'il existe une flèche g (appelée "inverse") telle que
les composés et soient des identités (cet inverse est alors unique).
Ainsi, une catégorie est formée par des objets (les sommets du graphe) et des liens entre eux
(les flèches ou morphismes), mais l'idée essentielle est de privilégier les liens sur les objets.
En fait, le succès des catégories dans les domaines les plus variés est dû à la richesse des
informations sur les objets qui peuvent être déduites de la seule considération des liens et des
opérations sur ceux-ci, quelle que soit la nature et l'anatomie de ces objets.
695/2001
Sciences.ch 14/03/2005
PRINCIPES
En introduisant la mécanique nous faisons enfin, après une longue incursion préalable et
obligatoire dans la mathématique, nos premiers pas dans le domaine de la physique théorique.
Comme nous l'avons déjà dit, la physique est une science fondamentale qui a une profonde
influence sur toutes les autres sciences et sur la société humaine. Les futurs physiciens et les
futurs ingénieurs ne sont ainsi pas les seuls qui doivent avoir parfaitement compris ses idées
fondamentales, mais tous ceux qui envisagent une carrière scientifique (y compris les
étudiants qui se spécialisent en biologie, en chimie et en mathématiques), doivent avoir acquis
la même compréhension.
Le but premier de ce site est comme nous l'avons dit dans l'introduction de ce site, de donner
au scientifique et à l'étudiant une vue unifiée de la physique en présentant ce que nous
pensons être les idées fondamentales constituant l'essentiel de la physique théorique
contemporaine.
Jusqu'à présent, la physique est enseignée comme si elle était une juxtaposition de plusieurs
sciences, plus ou moins bien reliées, mais sans aucun réel souci d'unité. Nous avons rejeté ce
mode de présentation (pour l'avoir subi pendant nos études) et avons opté pour une
présentation logique et unifiée en faisant au besoin à chaque fois référence à un chapitre du
site qui contiendrait les démonstrations des outils mathématiques utilisées ou d'une autre
théorie physique sous-jacente.
Ce site diffère des supports habituels de physique enseignées à l'université non seulement
dans sa conception mais aussi dans son contenu. Nous y avons inclus des sujets fondamentaux
que nous ne trouvons pas dans la plupart des cours de physique générale et les avons (très)
soigneusement développés et démontrés tout en présentant rigoureusement dans la section de
mathématiques du site, les outils nécessaires à leurs développements.
Nous espérons que ce qui va suivre pourra aider les enseignants de physique soucieux de
progresser et qui luttent constamment pour améliorer l'enseignement qu'ils donnent. Nous
espérons aussi qu'il stimulera les nombreux étudiants qui méritent une présentation de la
physique plus complète et plus évoluée que celle des cours traditionnels.
Nous insistons sur le fait que tout étudiant devrait connaître les bases de la logique,
arithmétique, algèbre, analyse vectorielle, calcul tensoriel, calcul différentiel et intégral et de
l'analyse dimensionnelle avant toute étude des phénomènes physiques ceci afin de travailler
avec rigueur et toute la compréhension nécessaires aux raisonnements mathématiques qui
vont être introduits à partir de maintenant (les mathématiques sont les fondations de
l'immense édifice de la physique théorique). Effectivement, pas un des outils ou résultats
mathématiques présentés jusqu'à maintenant ne sera pas utilisé dans notre étude de la
physique théorique.
Rappelons tout de même que la "physique" est donc la "science exacte/déductive" qui
s'occupe de modéliser mathématiquement au mieux les phénomènes naturels, aritificels,
observables ou non-observables. En de plus brefs termes, nous pourrions parler de description
de la "réalité" (quant à savoir s'il s'agit de la réalité sensible ou vraie...).
696/2001
Sciences.ch 14/03/2005
Lorsque nous voulons prédire ou décrire un phénomène physique concret, nous pouvons
généralement passer par un modèle analytique où les différentes grandeurs sont exprimées par
des indéterminées (valeurs abstraites) et les lois de la physique par des fonctions, dans la
mesure où elles sont connues (le cas échéant, nous pouvons faire une hypothèse et la tester).
En mettant en équation un phénomène physique, nous traduisons la réalité en une expérience
mathématique, virtuelle, selon certaines règles. Nous procèdons à une simulation de la réalité
portée sur des grandeurs exprimées.
Les différentes "lois" sont élaborées sur des faits empiriques et ont été vérifiées
expérimentalement (voir la méthode hypotético-déductive dans le chapitre de théorie de la
démonstration). En admettant que ces lois soient valables dans le contexte, nous pouvons
donc nous attendre à ce que l’expérience mathématique soit en adéquation avec les faits
expérimentaux attendus (ou inversement). Bien sûr, une expérience virtuelle n’est pas réelle et
ne saurait exprimer la réalité dans toute sa subtilité. Ce n’est qu’un modèle ! Il est donc clair
que la prédiction d’un phénomène physique peut diverger des faits expérimentaux réels. Ces
questions relèvent cependant plus de la métaphysique et de l’épistémologie.
Il convient aussi de préciser que la plupart des modèles théoriques que nous allons exposer sur
ce site et qui font usage de l'analyse vectorielle peuvent êtres récrits avec les outils de
l'analyse tensorielle et basés sur un raisonnement propre au formalisme Lagrangien (voir
chapitre de mécanique analytique pour ce savoir ce qu'est cela...). Or, ces dernières méthodes
ne peuvent êtres facilement utilisées pour une introduction simple à la physique car elles
demandent des efforts supplémentaires de la part du lecteur et beaucoup plus de papier
(souvent en tout cas) et de temps pour les mêmes résultats. Cependant, et nous y reviendrons,
ces méthodes sont aujourd'hui incontournables et de première importance dans les différents
domaines de la physique moderne comme la mécanique des fluides, la relativité générale, la
physique quantique des champs, l'analyse de systèmes chaotiques et bien d'autres.
Avant de commencer notre étude des phénomènes physiques, il nous faut définir les concepts
sur lesquels se base la physique théorique. Ainsi, nous verrons dans l'ordre que :
- L'être humain a créé un système d'unités de mesures et de dimensions de bases, dont les
grandeurs représentatives sont arbitraires à un coefficient près, propres à identifier chaque
phénomène physique de façon simple
- La physique fondamentale nous amène à considérer les fondements de la nature en tant que
concepts mathématiques abstraits. Ainsi, notre observation commune nous donne une vue
concrète mais abstraite de l'Univers alors que la physique théorique nous en donne une vue
concrète mais abstraite.
SYSTÈMES D'UNITÉS
697/2001
Sciences.ch 14/03/2005
Définition : une "grandeur" est l’expression nomologique quantitative d’une propriété, d’un
effet ou d’une quantité abstraite définie par un modèle que présente l’objet ou le phénomène
étudié. Une grandeur ne s’explique pas, elle se décrit par rapport à une définition.
- Les variables : elles ne possèdent une valeur concrète que dans un état déterminé, mais pas
lorsque nous observons le phénomène physique dans son ensemble. Ce sont des "grandeurs
actives". Les différentes variables décrivant une phénomène physique sont souvent corrélées
entre-elles par le biais de fonctions. Nous disons alors par définition que ces variables ont une
"relation fonctionnelle" entre elles.
Mesurer une grandeur physique revient à la comparer à une grandeur physique connue, de
même nature (nous disons aussi "de même dimension"), pris comme étalon arbitraire. Le
résultat de la mesure s'exprime ainsi à l'aide de deux éléments :
Le "nombre" constitue au fait la valeur mesurée de la grandeur et le "nom" est ce que nous
appelons comunément "unité physique", ou plus simplement "unité" (l'expression quantitative
d'une variable ou d'une fonction). Ces deux éléments sont indissociables, la valeur mesurée
n'a de sens que si nous indiquons en même temps l'unité choisie. Elle change si nous
changeons d'unité.
Remarque : la passage d'une unité à une autre pour exprimer une même grandeur est appelé
"conversion d'unité".
Ainsi, après un longue période de réflexion, et en dernière analyse le monde physique semble
pouvoir se ramener aux concepts d'espace, d'énergie et de temps.
Définition : la physique est la science des propriétés et des relations mutuelles dans le temps
de la matière et de l'énergie à un facteur de charge près.
Notre rôle consiste donc à donner une description de ces propriétés et relations sous forme de
lois ou relations physiques appliquées aux phénomènes observés, dans le cadre d'une théorie
fournissant les éléments de prévision.
698/2001
Sciences.ch 14/03/2005
Les grandeurs physiques ne sont pas toutes indépendantes les unes des autres mais reliées
entre elles par certaines lois ou relations. Il serait alors peu raisonnable, quoique possible, de
choisir une unité particulière pour chacune des grandeurs physiques sans tenir compte de leurs
relations mutuelles.
Les unités fondamentales sont au nombre de quatre (nous le justifierons plus loin): la
longueur (mètres), la masse (kilogrammes), le temps (secondes), la charge électrique
(coulombs). Le système ainsi constitué est le système M.K.S.C. (l'auteur assume le choix
d'ajouter le Coulomb).
1. le mètre , pour la longueur (nous avons déjà défini le concept de longueur dans le
chapitre géométrie mais nous y reviendrons à nouveau plus loin)
2. le kilo , pour la masse (nous reviendrons plus loin sur la définition du concept de
masse)
3. la seconde , pour le temps (le temps n'existe pas en soi mais l'intervalle de temps
est un concept arbitraire tout à fait valable - nous reviendrons également plus loin sur la
définition de ce concept)
Remarques :
R1. Le concept d'angle (en radians, degrés ou stéradian - voir les textes traitant de la
trigonométrie plane, trigonométrie sphérique et géométrie plane dans la section de géométrie)
n'a pas d'unité puisqu'il s'agit par définition d'un rapport de longueurs (pour le radian ou le
degré d'angle) ou de surface (pour le stéradian). Il convient donc de l'assimilier à une unité
dérivée non pas comme unité fondamentale. Cependant, en physique, nous avons pris pour
habitude d'indiquer sa présence dans les équations dimensionnelles afin d'aider à le relecture
de certaines de celles-ci et de savoir que leur résultat est donné par rapport à une unité d'angle
(sinon cela pourrait générer des erreurs d'interprétation hasardeuses pour ceux qui utilisent des
équations sans en avoir vu la démonstration...).
R2. Le lecteur remarquera que toutes les unités du système M.K.S.C. sont "extensives" c'est-
à-dire que dans un système sur lequel nous effectuons une mesure, celles-ci sont additives
(contrairement aux grandeurs intensives). Nous reviendrons plus en détails sur les grandeurs
extensives et intensives en grande partie lors de notre étude de la thermodynamique (voir
chapitre du même nom).
699/2001
Sciences.ch 14/03/2005
R3. C'est une énorme chance d'avoir un système homogène tel que celui que nous avons au
21ème sciècle. Effectivement, pour l'anecdote, en 1522 rien que dans la région de Baden
(Allemagne) il y avir 112 mesures différentes de longueur et 92 de surfaces.... c'est dire....
Ces précisions étant faites, toute grandeur physique connue à ce jour peut être exprimée à
l'aide d'une unité qui s'exprime comme le produit de cinq facteurs dimensionnels et d'un
facteur d'échelle arbitraire :
L'expression précédente s'écrira sous la "forme canonique" définie par les étalons:
l'angle n'ayant pas d'unité, nous ne le notons plus (mais il s'y trouve implicitement).
où est la valeur de la grandeur physique dans le système d'unité associé au facteur d'échelle
. Il existe plusieurs couples possibles, mais nous aurons toujours:
P1. La somme ou la différence d'un nombre quelconque de grandeurs n'a un sens que si ces
grandeurs sont homogènes et le résultat aura donc les mêmes unités que les opérandes.
700/2001
Sciences.ch 14/03/2005
Remarques :
R1. Les unités des différentes grandeurs ont un côté pratique mais pas infaillible en physique
théorique: elles permettent cependant au physicien de vérifier si une relation entre deux
grandeurs qu'il a démontré est au moins correcte au niveau des unités. Nous appelons ce genre
de démarche une "analyse dimensionnelle".(nous vous conseillons d'aller voir la
démonstration de la loi de Stokes dans le chapitre de mécanique des fluides pour un très bon
exemple d'application).
R2. Le développement des sciences a conduit la conférence générale des poids et mesures à
introduire quelques unités supplémentaires pratiques (mais pas nécessaires) telles que: la
température exprimée en "Kelvins" (qui dérive de l'énergie moyenne - mouvemen brownien),
la quantité de matière exprimée en Moles, l'intensité de courant exprimée en Ampères et
l'intensité lumineuse exprimée en Candelas. Ainsi, le systme système international (S.I.)
actuel, composé de sept unités de base (centimètre, gramme, seconde, kelvin, candela, mole et
l'ampère) et de dix-sept unités dérivées suggère-t-il que sept unités sont nécessaire décrire
toute la physique ? En fait non ! Comme l'analyse de Gauss le suggèe, parmi les sept unités de
base, quatre - le Kelvin, le Candela, la Mole et l'Ampère - peuvent être dérivées des trois
autres. L'introduction de sept unités de base représente un équilibre pragmatique des
expérimentateurs qui ont besoin d'unités adaptées à leurs mesures, et l'idéalisme des
théoriciens, dont le but est de réduire l'arbitraire, la redondance, à son minimum.
NOTATIONS SCIENTIFIQUES
Il est fréquent en physique que les grandeurs manipulées soient très grandes et lourdes à
écrire. Par exemple, il est toujours embêtant d'avoir des grandeurs comme 8'000'000'000 ou
0.000'000'000'1.
Alors nous pouvons adopter une convention d'écriture en puissance de dix dite "notation
scientifique" telle que :
Un écriture encore plus simplifiée consiste à utiliser le tableau ci-dessous mais uniquement si
nous avons affaire à des grandeurs physiques :
701/2001
Sciences.ch 14/03/2005
10'000'000 [g]
ou
0.000'000'153 [m]
702/2001
Sciences.ch 14/03/2005
troncation.
TEMPS
Le temps est une variable d'état (et non un "mesurable") et donc une notion impalpable mais
cependant rigoureusement définie. Il s'agit aussi d'un outil mathématique qui permet de mettre
en équation l'observation de phénomènes physiques (observables) et d'en tirer ainsi un certain
nombre d'informations. Cet outil existe car il existe des êtres pour observer (et mesurer) la
nature et ses changements (principe socratique) et de la matière et du mouvement pour qu'il y
ait ces changements.
Remarques :
R1. Le temps (et ses intervalles) étant un concept arbitraire, il est symétrique c'est-à-dire que
tout phénomène observé enregistré peut dans l'imaginaire du temps inversé retrouver ces
conditions initiales. Nous parlons alors de "symétrie du temps" (pour l'instant il n'a jamais été
à notre connaissance démontré ou ne serait-ce observé, que le temps peut subir une "brisure
de symétrie").
R2. Le temps n'est ni une grandeur extensive ou intensive. On ne peut ni additionner le temps
des éléments d'un système physique pour avoir la durée totale de celui-ci (de plus cette
question n'a pas de sens) ni la pondérer. Cependant on peut additioner les intervalles de temps
qui décrivent l'évolution d'un système !
Nous représentons très souvent en physique le temps (compris dans un intervalle) par une
flèche (axe) horizontale représentant le sens du temps. Comme le temps est une notion
purement utilitaire, nous pouvons alors définir chaque instant du temps comme étant le temps
zéro noté . Cette notion est très utilisée en physique car souvent la seule chose qui intéresse
les physiciens est la différence de temps notée (de par l'utilisation du calcul différentiel et
intégral).
où est la base arbitraire (non nécessaire) lorsque nous comparons une différence temporelle.
L'intervalle de temps est donné par une mesure étalon qui ne peut être qu'un mouvement au
mieux parfaitement périodique (qui se répéte dans le temps). Ainsi, les premiers moyens de
mesure du temps ont été le jour et la nuit, les positions du soleil et de la lune dans le ciel, le
mouvement du pendule, la détente de ressorts, la période de dégénrescence du césium 137 ou
encore les système binaires d'étoiles massives. Bref, tant qu'un système observable produit un
phénomène périodique stable et suffisament petit pour que toute mesure physique puisse y
être réduite, celui-ci peut être utilisé comme étalon d'intervalle temporel.
LONGUEUR
Définition : le concept de longueur est donnée par l'information qui donne le chemin
parcouru par un objet dans un intervalle de temps donné.
703/2001
Sciences.ch 14/03/2005
Remarques :
R1. S'il n'y avait pas de matière dans l'Univers il n'y aurait pas de notion de mouvement et
donc de longueur parcourue et aussi comme nous l'avons déjà fait remarquer, de temps (et
encore... c'est sans considérer certains résultats de la physique quantique que nous
démontrerons dans le chapitre qui lui est consacré).
R2. La longueur est une grandeur extensive (additive). Effectivement, la longueur totale d'un
système est la sommes des grandeurs.
Comme pour le temps il n'y a pas d'origine absolue de mesure des longueurs (il n'existe pas de
point zéro dans l'Univers comme le postule la théorie de la relativité) et les physiciens
s'intéressent de toute façon plus particulièrement aux différences de chemin parcouru par
rapport à une origine comme ils le font pour le temps.
Ainsi, de manière identique au temps, nous avons pour un observateur au repos qui observe
un point matériel en mouvement:
où est une base arbitraire mathématiquement inutile lorsque nous comparons une
différence de position dans une différence de temps d'un point matériel.
Si un point matériel se situe dans un espace à trois dimensions spatiales (cas le plus fréquent
en mécanique classique) dont nous avons arbitrairement choisi l'origine , nous notons la
position de ce corps par sa distance en longueur , largeur et hauteur (appelées
"coordonnées cartésiennes") par une flèche imaginaire dit "vecteur" (voir le chapitre traitant
du calcul vectoriel dans la section d'algèbre) reliant le point d'origine arbitraire du référentiel
spatial au point intéressé de la façon suivante (nous en profitons pour introduire également la
notation tensorielle) :
Remarque : la flèche au-dessus du signifie bien évidemment qu'il s'agit donc d'un vecteur.
La notation:
est une notation simplificatrice utilisée fréquemment en physique et qui devrait s'imposer dans
les petites classes (attention le fait que les chiffres soient abaissés en indice ne siginife
absolument pas ce que sont des composantes covariantes - voir chapitre de calcul tensoriel de
la section d'algèbre - il s'agit juste d'un convention simplificatrice d'écriture). Cependant sur le
présent site Internet nous passerons de l'une à l'autre des notations en fonctions des besoins et
des traditions en vigueur (ce sera donc à vous de faire attention à ne pas confondre).
La matrice:
704/2001
Sciences.ch 14/03/2005
est quant à elle le tenseur métrique d'un espace pré-euclidien canonique à signature positive
(voir les chapitres d'analye vectorielle et de calcul tensoriel). Ceci constitue un cas particulier
en physique théorique mais cependant un cas très fréquent d'étude en mécanique classique (il
faut commencer par des espaces simples avant d'aller plus loin...).
Nous reviendrons plus en détails sur ces concepts lors de notre étude des espace ponctuels
plus loin.
MASSE
Définitions:
D1. La masse d'un corps est dans un système fermé une quantité qui se conserve et qui
caractérise l'amplitude avec laquelle ce corps interagit avec d'autres corps par le biais de
différentes forces (attractives).
Remarques :
R1. Dans un système isolé, il ne peut pas y avoir création ou destruction spontanée de masse.
L'apparition de masse ne peut être due qu'à une action extérieure. Une autre façon de dire la
même chose est que la masse totale contenue dans l'Univers est constante.
R2. La masse est un grandeur extensive (additive). Effectivement, la masse totale d'un
système est égale à la somme des masses qui le compose.
D2. La "masse grave" (ou "masse de gravitation") qui est l'amplitude avec laquelle un corps
matériel interagit avec un champ de potentiel (selon la loi de gravitation de newton - voir
chapitre de mécanique classique).
D3. La "masse inerte" (ou "masse inertielle") qui est l'amplitude qui caractérise la résistance
avec laquelle un corps en translation est susceptible de changer de vitesse (c'est-à-dire celle
intervenant dans la deuxième loi de Newton - voir chapitre de mécanique classique)
Remarque : Des expériences ont toutefois prouvé que ces deux masses étaient
proportionnelles au dix-milliardième près. Cette identité expérimentale appelée "principe
d’équivalence galiléen" est à la base d'un des postulats de la relativité générale (voir chapitre
de mécanique relativiste).
Contrairement aux charges électriques (voir plus loin de la définition de la "charge"), qui
caractérisent elles l'amplitude d'interaction par la force électrique, il n'existe que des masses
positives. Ainsi les charges électriques peuvent se repousser aux mêmes titres qu'elles peuvent
s'attirer.
De plus, la masse est étant une propriété additive (donc "extensive" comme nous l'avons déjà
705/2001
Sciences.ch 14/03/2005
De même, pour une distribution continue en volume de la masse d'un système de volume total
:
Remarques :
R1. L'intégrale est une intégrale triple, mais elle pourra être ramenée à une intégrale simple en
exploitant les symétries du système pour choisir judicieusement les volumes élémentaires
d'intégration.
R2. Le calcul de la masse lors d'une distribution non continue (discrète) de matière doit être
faite avec les composantes vectorielles calculées séparément. Une fois ce travail effectué, il
convient d'en prendre la norme.
R3. La masse volume est une grandeur intensive. Effectivement, la densité d'un
système physique n'est pas égal à la somme de ces densités (c'est du bon sens!). Le lecteur
remarquera que cette grandeur intensive qu'est la masse volumique est égale au rapport de
deux grandeurs extensives.
Définitions :
D1. Nous disons qu'un système est "homogène" si sa charge volumique, surfacique, linéique
(voir définition ci-dessous) est constante.
D2. Nous disons qu'un système est "isotrope", si ses propriétés physique sont identiques en
tout point
Nous définissons aussi parfois la "masse surfacique" (ou densité de surface de matière) pour
des systèmes quasiment sans épaisseur et une "masse linéique" (ou densité linéique de masse)
pour des systèmes de section négligeable devant leur longueur. Nous avons alors ( étant une
surface et une abscisse curviligne) :
706/2001
Sciences.ch 14/03/2005
ou
Remarque : souvent, dans la littérature, ainsi que dans le présent site internet, la masse
volumique est notée simplement , la masse surfacique , et la masse linéique .
ÉNERGIE
Nous ne savons pas ce qu'est exactement l'énergie (notée sous sa forme générale par la lettre
) mais nous en connaissons ses effets. Ce que nous savons cependant, c'est qu'il en existe
plusieurs formes dont voici une liste des plus connues :
- "L'énergie travail" qui est l'énergie créée par l'application d'une force sur un corps lui
donnant une certaine énergie cinétique (voir chapitre de mécanique classique pour la
démonstration) ou énergie potentielle (qu'elle soit gravifique, électrostatique comme démontré
en mécanique classique ou électrodynamique).
- "L'énergie chaleur " qui est une forme d'énergie déterminée par le nombre de micro-états
d'un système (voir chapitre de thermodynamique pour la démonstration)
- "L'énergie de masse" qui est l'énergie contenu dans une certaine quantité de masse (voir
chapitre de relativité restreinte pour la démonstration)
Remarques :
R1. La masse et l'énergie sont équivalentes comme nous le verrons lors de notre étude de la
relativité restreinte (voir le chapitre de mécanique relativiste), si nous définissons un système
d'unités telle que la vitesse de la lumière vaille (convention très utilisée par les
physiciens dans la recherche de pointe).
R2. L'énergie au mêmet titre que la masse est une grandeur extensive.
Nous pouvons quand même tenter de nous demander ce qu'est l'énergie exactement?
Définition : l'énergie est l'effet d'une cause d'un changement local des propriétés d'un système.
Cette cause étant non déterministe et en moyenne nulle et conservative dans un système
fermé.
Remarques :
R2. Dans un système isolé, il ne peut pas y avoir création ou destruction spontanée d'énergie.
L'apparition d'énergie ne peut être due qu'à une action extérieure. Une autre façon de dire la
707/2001
Sciences.ch 14/03/2005
même chose est que la l'énergie totale contenue dans l'Univers est constante.
CHARGE
Il est difficile de dire quelque chose sur la charge électrique (vous pouvez chercher une
définition sur l'internet vous verrez...). Cependant si nous nous référons à l'approche de
Yukawa (voir le chapitre de physique quantique des champs) nous pouvons tenter d'en donner
la définition suivante :
Défintion : une charge électrique est une propriété conservative qu'a une particule se situant
dans un champ de potentiel à symétrie sphérique à interagir avec la source de ce champ dans
le cadre de l'échange d'un quantum d'interaction (le photon en l'occurrence créé par les
fluctuations quantique du vide en présence d'une masse) définissant un champ vectoriel de
type Coulombien.
Remarques :
R1. Dans un système isolé, il ne peut pas y avoir création ou destruction spontanée de
charges. L'apparition de charges ne peut être due qu'à une action extérieure. Une autre façon
de dire la même chose est que la charge totale contenue dans l'Univers est constante.
R2. La charge est une grandeur extensive. Effectivement, la charge totale d'un système
physique est égale à la somme algébrique des charges qui la constitute.
Définition : La charge d'un corps est dans un système fermé une quantité qui se conserve et
qui caractérise l'amplitude avec laquelle ce corps interagit avec d'autres corps par le biais des
forces électrostatiques et magnétiques.
De même, pour une distribution continue en volume de la charge d'un système de volume
total (nous notons les densités de charge de manière identique si l'ambiguïté n'est pas
possible de la même manière que pour la masse):
708/2001
Sciences.ch 14/03/2005
Remarques :
R1. L'intégrale est une intégrale triple, mais elle pourra être ramenée à une intégrale simple en
exploitant les symétries du système pour choisir judicieusement les volumes élémentaires
d'intégration.
R2. Le calcul de la masse lors d'une distribution non continue (discrète) de matière doit être
faite avec les composantes vectorielles calculées séparément. Une fois ce travail effectué, il
convient d'en prende la norme.
Définitions :
D1. Nous disons qu'un système est "homogène" si sa charge volumique, surfacique, linéique
(voir définition ci-dessous) est constante.
D2. Nous disons qu'un système est "isotrope", si ses propriétés physique sont identiques en
tout point
Nous définissons aussi parfois la "densité surfacique de charge " (ou densité de surface de
charge) pour des systèmes quasiment sans épaisseur et une "charge linéique" (ou densité
linéique de charge) pour des systèmes de section négligeable devant leur longueur. Nous
avons alors ( étant une surface et une abscisse curviligne) :
ou
avec :
Remarque : souvent, dans la littérature, ainsi que dans le présent site internet, la densité
volumique de charge est notée simplement , la densité surfacique de charge , et la masse
linéique .
DISTRIBUTIONS
Définitions :
709/2001
Sciences.ch 14/03/2005
D1. Une masse ou une charge sont dites "ponctuelles" si elles occupent un volume dont les
dimensions sont très inférieures aux distances d'observations.
Remarque : la charge élémentaire est une excellente approximation d'une charge ponctuelle
étant sa petite taille dont le rayon classique est de l'ordre du femtomètre, ce qui est bien sûr
très grand devant les dimensions d'observation classiques.
D2. Si nous considérons corps de charge ou masse finies dans un volume . Si ce volume
est supposé suffisamment grand pour que la distance moyenne entre les corps soit très
supérieur à la dimension de ceux-ci, nous avons affaire à une "distribution discontinue" ou
"discrète" de ces corps (nous parlons parfois aussi de distribution non-uniforme).
Les calculs sont impossibles à faire en partant d'une distribution discrète car, en général, le
nombre de corps en considération est très élevé lorsque le volume est de dimension
macroscopique. Dans ce cas, il faut introduire une autre type de distribution.
D3. Si nous considérons corps de charge ou masse finies dans un volume . Si ce volume
est supposé suffisamment grand pour que la distance moyenne entre les corps soit très
équivalents à la dimension de ceux-ci, nous avons affaire à une "distribution discontinue" ou
"discrète" de ces corps (nous parlons parfois aussi de distribution non-uniforme).
Remarque : nous pouvons préciser parfois, comme nous en avons déjà fait mention lors des
définitions de la masse ou de la chargem que les distribution définies précédemment peuvent
être de type volumique, surfacique ou linéique. Si cela n'est pas précisé, c'est que
l'information est implicitement triviale.
CONSTANTES
La physique a l'opposé des mathématiques est une science exacte dans le sens que sa
vérification et sa validité se base et est mise constamment à l'épreuve par des faits
expérimentaux.
Il existe de nombreuses constantes en physique (une infinité au fait) mais certaines ont un
statut particulier dans le sens qu'elles ne peuvent se déduire d'autres constantes. Nous en
proposons ici la liste et les valeurs (non exactes) et nous le retrouverons fréquemment lors de
nos développement dans ce site.
Remarque : les constantes sont données pour certaines au temps auquel le lecteur les lit (…).
Donc elles varient (pour certaines) au cours du temps
CONSTANTES UNIVERSELLES
710/2001
Sciences.ch 14/03/2005
Constante gravitationnelle
Température absolue
Nombre d'Avogadro
Charge de l'électron
Constante de Planck
Constante de Boltzmann
Permittivité du vide
Susceptibilité magnétique
Pi
Constante de Coulomb
(utilitaire)
Constante de Stefan
Constante de Stefan-
711/2001
Sciences.ch 14/03/2005
Boltzmann
Rayon classique de l'électron
Impédance du vide
Magnéton de Bohr
Constante de Rydberg
Rayon de Bohr
Electron-Volt
Accélération gravitationnelle
terrestre moyenne
Pression standard
Constante de Faraday
Volume molaire
Constante de Hubble
Rayon Terrestre
Rayon Solaire
Masse Terrestre
Masse Solaire
CONSTANTES DE PLANCK
712/2001
Sciences.ch 14/03/2005
Longueur de Planck
Temps de Planck
Masse de Planck
Température de Planck
Energie de Planck
Densité de Planck
Force de Planck
Puissance de Planck
Pulsation de Planck
Charge de Planck
Courant de Planck
Tension de Planck
Impédance de Planck
Malgré les exemples donnés combien y-a-til de constantes ? Pourquoi jouent-elles un "rôle
central" dans les théories physiques" ? Ont elles toutes la même importance ou certaines sont -
elle plus fondamentales ? Selon quels critères ? Peut-on alors tester si elle sont vraiment
constantes ?
Pour essayer de répondre à certaines de ces questions, remarquons tout d'abord qu'à chaque
étape de nos constructions théoriques il subsiste des paramètres constants qui ne sont pas et ne
peuvent pas être expliquées en termes de quantités plus fondamentales, simplement parce que
ces derniers n'existent pas dans l'état de nos connaissances. Quant les théories s'affinent, il est
en effet possible qu'une constant se trouve expliquée en termes de nouveaux paramètres, plsu
fondamentaux. Ainsi, la masse du proton est une constant fondamentale de la physique
nucléaire, mais doit en principe pouvoir se calculer, dans le cadre de la chromodynamique
quantique, en fonction de la masse des quarks et des énergies des liaisons électromagnétiques
et forte. Ce changement de statut est associé à celui du proton, qui de particule élémentaire
devient corps composite.
Nous définirons modestement les constantes comme tous les paramètres non déterminés dans
un cadre théorique donné. Cette définition revient à accepter que nous soyons incapable
d'écrire une équation d'évolution pour ces constantes qui se révèlent donc comme la limite de
ce que les théories où elles apparaissent sont en mesure d'expliquer. Cependant l'hypothèse de
constance est implicitement contrôlée par la validation expérimentale de ces théories. Les
résultats des expériences doivent être reproductibles à divers moments et dans divers
laboratoires. Si c'est le cas, dans la limite des précisions expérimentales, alors il est légitime
713/2001
Sciences.ch 14/03/2005
de considérer que l'hypothèse de constance est valide. Cette définition implique qu'il n'existe
pas de liste absolue de constantes, car l'appartenance à une telle liste dépend des cadres
théoriques choisis pour décrire la nature et peut donc changer avec les progrès de la
connaissance.
Se pose maintenant la question de savoir s'il est possible de caractériser plus préciséement le
concept de constante et de déterminer si, parmi toutes les constantes, certaines sont plus
fondamentales que d'autres. Pour cela, il faut commencer par révéler uen relation entre
constantes et unités.
Ainsi, Planck découvra en 1900 qu'il était possible d'utiliser les trois constantes physique
fondamentales :
pour définir les trois unités de masse, de temps et de longueur à partir de la masse de Planck,
de la longeur de Planck et du temps de Planck (voir le chapitre de physique quantique
ondulatoire pour la démarche mathématique qui permet de déterminer leur valeur).
Planck baptise ce suntiés "unités naturelles" car "elles sont indépendantes d'un corps ou d'un
matériau et [...] gardent nécessairement leur signification pour tous les temps et toutes les
civilisations, même celles qui sont extra-terrestres et non humaines". La signification de ces
unités met longtemps à émerger. Elles signalent l'échelle où gravitation et mécanique
quantique deviennent de même amplitude; elle sont donc très adaptées à la cosmologie
primordiale et à l'étude des trous noirs.
Le choix des unités de Planck comme unités naturelles est lié aux considérations justifiant que
G, c, h sont les trois constantes dimensionnées les plus fondamentales (connues à ce jour).
Dans ces unités, la valeur numérique de ces trois constantes fondamentales est 1 comme nous
l'avons déjà fait déjà remarquer.
La rôle des constantes dans la structuration des théories physique peut être assez
magnifiquement illustré par le cube magique des théories physique ci-dessous (dont la validité
reste à vérifier bien sûr). L'idée consiste à "allumer" ou "éteindre" une à une les trois
constantes fondamentales afin de voir comment les théories physiques s'articulent les unes par
rapport aux autres.
Remarque : le lecteur comprendre mieux les explications qui vont suivre lorsqu'il aura étudié
la relativité générale, la physique quantique des champs ainsi la physique quantique
ondulatoire donc si jamais il peut sauter ce texte en attendant.
714/2001
Sciences.ch 14/03/2005
Quand G est mis à 0, cela revient à supprimer toutes les forces gravitationnelles et à découpler
la matière de l'espace et du temps. Quand h est mis à , nous supprimons le caractère quantique
de la nature et nous découplons les natures corpusculaires et ondulatoire (de par la relation de
De Broglie), quand 1/c est mis à 0, la vitesse de la lumière est infinie et le temps et l'espace se
découple l'un de l'autre (de par les transformation de Lorentz). Pour visualiser cela, nous
considérons le cube ci-dessus introduit par le physicien soviétique Mikhaïl Bronshtein qui
reprend une idée développée initialement par Lev Landau, Dimitri Ivanenko et Georgi
Gamow.
Remarques :
715/2001
Sciences.ch 14/03/2005
R1. Le lecteur intéressé par les différentes constantes de Planck (longueur de Planck, masse
de Planck, etc.) devra se rendre dans le chapitre de physique quantique ondulatoire du site où
ces constantes sont déterminées avec les détails nécessaires.
R2. Le lecteur intéressé par les propriétés des éléments chimiques peut télécharger le tableau
périodiques des éléments proposé dans la rubrique de téléchargement du site.
PRINCIPES DE LA PHYSIQUE
PRINCIPE DE CAUSALITÉ
Définition : Nous définissons le "principe de causalité" par le fait que dans exactement les
mêmes conditions, les mêmes causes conduisent toujours aux mêmes effets. Autrement dit, si
certaines conditions initiales sont parfaitement connues, le phénomène se déroulera de façon
déterminée, toujours la même.
Au fait, l'expérience n'est pas nécessaire si nous considèrons les principes de premier ordre
qui sont par définition "les principes logiques que nous pouvons déduire par induction et que
nous ne pouvons vérifier expérimentalement avec certitude".
Or, les exigences de la société ont très peu souvent laissé le temps aux grands hommes de
science de penser à ces principes du premier ordre par des expériences imaginaires (méthode
très usitée par Albert Einstein pour la parenthèse…).
C'est dans un trilemne proposé par le sceptique de l'antiquité Agrippa, selon un argument
rapporté par Sextus Empiricus, que la question de la justification de la connaissance a été
posée le plus explicitement :
H1. Ou bien la connaissance est fondée en dernière instance sur des principes premiers mais
arbitraires
H2. Ou bien nous ne trouvons pas de tels principes et nous avons une régression à l'infini
Ce trilemne porte aussi souvent, dans la philosophie contemporaine, notamment chez Karl
Popper, le nom de "trilemne de Fries" ou "trilemne de Münchhausen" et nous ne savons
actuellement pas dans quel cas de figure (H1, H2 ou H3) nous nous situons.
716/2001
Sciences.ch 14/03/2005
L'énergie que l'être humain quantifie avec l'unité "Joules" ne peut être définie avec exactitude.
Répondre à cette question revient à savoir ce qu'est la masse (relation d'équivalence
d'Einstein) et donc à connaître l'élément fondamental de l'Univers (nous en avons déjà fait
mention plus haut dans le présent texte).
Remarques :
R1. L'énergie peut sous trouver sous plusieurs formes (cela ne voulant pas dire qu'il existe
plusieurs énergies différentes !!!) comme la chaleur, l'énergie cinétique, potentielle,
électrique, magnétique, etc...
R2. La violation de ce principe dans un système isolé n'a encore jamais été observé mais sa
valadité ne peut être démontrée (d'où le fait que ce soit un principe premier)
R3. Certains physicient débattent du fait que ce principe premier découle de théorème de
Noether que nous verrons plus. Mais cela est tout à fait discutable étant donné que le
théorème de Noether considère l'énergie potentielle comme constante dans le temps d'où...
Tous les phénomènes naturels s'accordent avec le fait que, la Nature, dans la production de
ses effets, agit toujours par les voies les plus simples et les plus directes.
Avec cet énoncé et le principe de conservation de l'énergie, nous pouvons alors établir des
outils mathématique d'une formidable puissance pour l'étude de la physique théorique. Mais
nous ne pouvons développer à ce niveau du discours le formalisme mathématique de ce
principe car il demande des outils que nous souhaiterions introduire plus loin, dans le chapitre
de mécanique analytique (lors de l'étude du formalisme lagrangien pour être plus précis). En
attendant voici les deux relations qui le résument :
717/2001
Sciences.ch 14/03/2005
Remarque : la violation de ce principe dans un système isolé n'a encore jamais été observé
mais sa validité ne peut être démontrée (d'où le fait que ce soit aussi un principe premier)
Ce résultat établi en 1915 par Emmy Noether juste après son arrivée à Göttingen, fut qualifiée
par Albert Einstein de "Monument de la pensée mathématique". C'est maintenant un des
piliers de la physique théorique.
Aujourd'hui, il est souvent présenté à l'occasion de cours sur la théorie quantique des champs.
Cela le fait paraître plus compliqué et mystérieux qu'il n'est, et c'est oublier qu'il s'applique
aussi à la mécanique classique.
Ainsi, les symétries jouent un rôle majeur en physique. Elles permettent d’une part de
simplifier les problèmes d’une part et de tirer de nouvelles lois d’autre part. Pour illustrer la
première application des symétries il suffit d’évoquer la forme mathématique du potentiel
gravitationnel engendré par une masse ponctuelle située à l’origine du référentiel (voir
chapitre de mécanique classique) . En coordonnées cartésiennes, l’expression du potentiel
gravitationnel est relativement complexe
alors qu’en coordonnées sphériques - système de coordonnées qui tire partie de la symétrie
sphérique du potentiel - il prend une forme très simple :
Les propriétés de symétrie d’un problème sont ici exploitées de façon à simplifier le
traitement mathématique des lois physiques. Même si ces considérations mathématiques nous
renseignent sur les propriétés physiques du système considéré, elles conservent cependant un
caractère purement technique.
718/2001
Sciences.ch 14/03/2005
Les symétries trouvent pourtant une autre application dont la signification physique est
beaucoup plus profonde. Le fait, non fortuit, qu'un système possède des symétries doit
certainement avoir des implications physiques. Intuitivement, nous pouvons saisir que la
présence de symétries dans un système physique se traduit par l'invariance de certaines de ses
propriétés physiques sous l'application de transformations spatio-temporelles ou, plus
généralement, des transformations géométriques. L'invariance de propriétés physiques doit
induire nécessairement des relations d'une nature nouvelle entre les variables du système. De
telles relations doivent à leur tour révéler des lois plus profondes qui associent la géométrie du
système aux lois de la nature. Ce raisonnement, bien qu'intuitif, nous invite à explorer plus en
profondeurs les relations qui pourraient exister entre les lois physiques et les propriétés
géométriques de l'espace-temps.
Le fait que les lois physiques sont indépendantes de la position de l’observateur implique
qu’elles ne varient pas après leur avoir appliqué une rotation et/ou une translation. Nous
disons alors qu’elles sont "invariantes par rotation et par translation" ou encore qu’elles sont
"symétriques par rotation et par translation".
Rappel : En géométrie le terme symétrie prend un sens plus général qui peut se définir comme
suit : transformation qui ne change ni la forme, ni les dimensions d'une figure. Nous pouvons
remarquer que le sens courant du mot symétrie correspond à un cas particulier de symétrie au
sens géométrique du terme, qui consiste à inverser les objets par rapport à un plan.
Soit un système dont l’état évolue au cours du temps. Désignons l’état de à l’instant
par . A l’instant initial , se trouve donc dans l’état . Considérons une
transformation géométrique qui agit en chaque point de l’espace et éventuellement du
temps. En un instant , l’action de sur le système a pour effet de le transformer en un
système tel qu'à l’instant , le transformé par de est .
719/2001
Sciences.ch 14/03/2005
système (ce qui donne ) évolue de la même façon que , c'est-à-dire que si nous
appliquons les lois de la mécanique sur pour connaître son état en un instant
postérieur alors .
où est un vecteur quelconque. Dire que la translation du système est une symétrie signifie
que l’accélération et la force qui agit sur chaque particule sont inchangées après la
transformation.
Ce qui implique :
Cette égalité doit être vraie quelle que soit la position des particules, donc quels que soient
et . Il est clair que la seule manière de vérifier la dernière égalité dans ces conditions est
d’égaler deux à deux les potentiels entre chaque particule j avec la particule , c'est-à-dire :
Les potentiels sont alors nécessairement (et c'est là la puissant du théorème de Noether) des
fonctions de tel que :
720/2001
Sciences.ch 14/03/2005
Ce qui entraîne immédiatement que la résultante de toutes les forces appliquées aux particules
du système est nulle et que donc la quantité de mouvement totale est conservée :
1. Le potentiel entre les particules d’un système isolé est une fonction de leur distance relative
(cela se confirmera en mécanique classique lors de notre étude du champ de potentiel
gravitationnel, ainsi qu'en électromagnétisme en ce qui concerne le potentiel électrostatique et
les potentiel de Yukawa à symétrie sphérique en théorie quantique des champs).
Imposons maintenant que les rotations autour d’un point fixe soient des symétries. Cette
propriété doit être vraie quel que soit le point fixe considéré, notamment, si ce point fixe est
précisément la position de l’une des particule du système. Il s’ensuit que le potentiel présente
nécessairement une symétrie sphérique. Les forces agissant entre les particules sont donc
colinéaires aux vecteurs qui les relient.
Où les sont les forces internes au système des particules agissant sur la particule .
L'avant dernière expression devient alors :
721/2001
Sciences.ch 14/03/2005
L’énergie totale du système est la somme de l’énergie cinétique de toutes les particules et de
l’énergie potentielle résultant de l’interaction mutuelle des particules, soit sous la forme de la
mécanique classique :
Nous supposerons que le potentiel ne varie pas avec le temps. Cette hypothèse se
justifie de manière empirique par le constat que les potentiels observés dans la nature sont
indépendants du temps. Calculons la dérivée de l’énergie par rapport au temps :
Donc nous en concluons que l’énergie totale du système est donc une constante. !
Quelle est la grandeur mécanique invariante par translation revient donc à se demander
quelles sont les grandeurs mathématiques qui sont inchangées lorsque nous leur appliquons
une translation. Il en existe deux : les scalaires et les vecteurs.
Intuitivement, un scalaire est assimilé à un nombre réel (voir chapitre d'arithmétique). Or, en
mécanique, les nombres réels que nous pouvons construire le sont à l’aide de grandeurs
vectorielles comme le vecteur position, la vitesse, etc. Pour qu’un tel nombre réel ait le statut
de scalaire il doit être indépendant de l’espace. Ainsi, une vecteur position ne peut
manifestement être considéré comme un scalaire. L’énergie de la particule est un nombre réel
mais n’est pas un scalaire car elle dépend explicitement, dans sa formulation, de la position de
la particule dans l’espace au travers de l’énergie potentielle.
De la même façon, un vecteur n’est pas seulement un être mathématique possédant des
composantes dans une base. Pour jouir du statut de vecteur, une entité mathématique doit se
transformer de la même manière que les vecteurs de base de l’espace vectoriel. Selon cette
définition, le moment cinétique n’est pas un vrai vecteur car, étant la composition par produit
vectoriel de deux vecteurs, il ne se transforme pas comme les vecteurs de base. D’un point de
vue mathématique il s’agit un pseudo-vecteur (voir chapitre de calcul vectoriel).
Le seul vrai vecteur qui reste est la quantité de mouvement car il est construit à l’aide de la
dérivée du vecteur position qui est, bien évidemment, un vrai vecteur. Nous en déduit que la
seule grandeur susceptible d’être conservée par translation est la quantité de mouvement
totale du système.
722/2001
Sciences.ch 14/03/2005
sont effectivement invariants par rotation, nous en concluons que la seule grandeur
susceptible d’être conservée lors de rotations est le moment cinétique total du système.
Enfin, toujours par le même raisonnement, l’invariance des lois de la mécanique par
déplacement dans le temps, revient à rechercher les grandeurs conservées par une translation
dans le temps. Ces grandeurs sont les vrais scalaires et les vecteurs sur la droite du temps.
Aucune grandeur mécanique ne peut être assimilée à un vecteur sur la droite du temps. En
revanche, l’énergie est bien un scalaire invariant par translation dans le temps puisque
l’énergie potentielle est par hypothèse indépendante du temps. L’invariance des lois de la
mécanique par déplacement dans le temps laisse donc supposer intuitivement la conservation
de l’énergie.
Ces raisonnements ne peuvent évidemment faire office de démonstration mais ils mettent en
évidence une relation étroite entre la géométrie et les propriétés d’invariance d’un système.
THÉORÈME DE NOETHER
Soit le lagrangien (voir chapitre de mécanique analytique) d’un système représenté par les
coordonnées généralisées dans l’espace de configuration. Supposons que ce système
est invariant par la transformation infinitésimale suivante :
Supposons que les fonctions sont solutions des équations de Lagrange (ce que
démontrerons en mécanique analytique). D’après nos hypothèses les fonctions (définies) :
sont dès lors nécessairement également solutions des équations de Lagrange, ce qui se traduit
par (nous omettrons l'indication de la somme par la suite afin d'alléger la lecture!) :
D’autre part, par hypothèse, le lagrangien est invariant pour les transformations du type de
celles décrites par . Il s’ensuit que sa dérivée par rapport au paramètre est
nécessairement nulle :
723/2001
Sciences.ch 14/03/2005
Et nous démontrerons par ailleurs en mécanique analytique (sous forme d'intégrale comme
étant nulle) la relation :
Supposons maintenant que le système soit invariant par translation de longueur le long de
l’axe . La translation le long de cet axe s’écrit comme suit :
724/2001
Sciences.ch 14/03/2005
Nous définirons par ailleurs en mécanique analytique comme étant le moment conjugué
. Nous en déduisons dès lors que la quantité conservée est : , c'est-à-dire la quantité de
mouvement totale du système le long de l’axe !!!
En procédant de même avec les autres axes, nous démontrerions aisément la conservation de
la quantité de mouvement totale le long des axes pour ceux-ci, ce qui nous permet de conclure
que dans le cas général d’une translation infinitésimale la grandeur
conservée est la quantité de mouvement totale du système.
Supposons maintenant que le système soit invariant par rotation d’une angle infinitésimal
autour de l’axe . Cette rotation s’écrit :
En remarquant encore une fois que , la grandeur conservée obtenue par application du
théorème de Noether est alors :
725/2001
Sciences.ch 14/03/2005
On montrerait de la même façon que l’invariance du lagrangien sous les rotations selon les
autres axes ce qui conduit à la conservation des composantes suivant ces axes du moment
cinétique total du système.
En conclusion, nous avons mis en évidence trois lectures différentes des lois de la physique :
Le principe de Curie (que nous devons à Pierre Curie) découle un peu intuitivement du
théorème de Noether et s'énonce ainsi :
Si une cause présente une certaine symétrie ou invariance, alors son effet aura la même
symétrie (ou la même invariance), ou une symétrie supérieure, à condition toutefois que la
solution du problème soit unique.
Remarque : A noter que les éléments de symétrie agissent sur les directions des grandeurs
vectorielles, tandis que les invariances agissent sur les variables dont dépendent ces
grandeurs.
Ainsi, dans un espace homogène et isotrope, si nous faisons subir une transformation
géométrique à un système physique susceptible de créer certains effets (forces, champs), alors
ces effets subissent les mêmes transformations.
Autrement dit, si un système physique possède un certain degré de symétrie, nous pourrons
alors déduire les effets créés par ce système en un point à parti des effet en un autre point.
P1. Invariance par translation : si est invariant dans toute translation parallèle à un axe, les
effets sont indépendants des coordonnées de cet axe (l'intérêt étant alors de travailler en
726/2001
Sciences.ch 14/03/2005
coordonnées cartésiennes).
P2. Symétrie axiale : si est invariant dans toute rotation autour d'un axe donné, alors ses
effets exprimés ne dépendent pas de l'angle qui définit la rotation (l'intérêt étant alors de
travailler en coordonnées cylindriques).
P3. Symétrie cylindrique : si est invariant par translation et rotation, alors ses effets ne
dépendent que de la distance à l'axe de rotation (l'intérêt étant alors aussi de travailler en
coordonnées cylindriques).
P4. Symétrique sphérique : si est invariant dans toute rotation autour d'un point fixe, alors
ses effets ne dépendent que de la distance à ce point fixe (l'intérêt étant alors de travailler en
coordonnées sphériques).
P5. Plan de symétrie : si admet un plan de symétrie, alors en tout point de ce plan :
P6. Plan d'anti-symétrie : si, par symétrie par rapport à un plan, est transformé en alors
en tout point de ce plan :
La symétrie est fondamentale dans les sciences quelles que soient les disciplines. La symétrie
est partout. Elle permet de décrire de manière précise de nombreux systèmes, de clarifier et de
simplifier l'étude de leurs propriétés. Des résultats très importants peuvent ainsi être prédits de
manière rigoureuse sans que l'on ait à faire appel à des théories mathématiques sophistiquées.
ESPACES PONCTUELS
L'étude des phénomènes physiques recourt dans un premier temps à leur représentation dans
l'espace de la géométrie classique euclidienne à une dimension temporelle et à un nombre
quelconque de dimensions spatiales.
Les vecteurs que nous avons étudié dans le chapitre de calcul vectoriel (tenseurs d'ordre 1) et
les tenseurs (d'ordre quelconque) que nous avons aussi étudié dans le chapitre de calcul
tensoriel peuvent comme nous avons en déjà fait mention, êtres utilisés pour relier chacun des
points de l'espace-temps à un référentiel et former ainsi des champs de vecteurs ou/et de
tenseurs. Cet était de fait mathématique, nécessite la définition mathématique d'espaces
formés de points ou également appelés "espaces ponctuels".
La définition précise d'espace vectoriel ponctuel que nous allons faire sera construite à partir
de la notion d'espace vectoriel que nous avons vu dans le chapitre de calcul vectoriel (voir
727/2001
Sciences.ch 14/03/2005
section d'algèbre)
Voyons tout d'abord l'exemple particulier de l'espace ponctuel formé par des triplets de
nombres qui est issu directement de l'espace géométrique classique à trois dimensions.
etc… Appelons l'ensemble de tous les éléments formés par des triplets de
nombres. À tout couple de deux éléments de , pris dans cet ordre, nous pouvons
faire correspondre un vecteur , appartenant à un espace vectoriel espace vectoriel , noté
géométriquement , en définissant celui-ci par un triplet de nombres tel que (nous utilisons
la notation indicielle vue en calcul tensoriel) :
Si nous définissons par rapport à cet élément l'addition et la multiplication par un scalaire,
nous nous retrouvons comme nous l'avons déjà vu en théorie des ensembles avec une
structure d'espace vectoriel.
La correspondance que nous établissons ainsi, entre tout couple de deux éléments de
et un vecteur d'un espace vectoriel , vérifie manifestement les propriétés suivantes :
P1.
Lorsque nous avons muni l'ensemble de cette loi de correspondance avec , vérifiant les
trois propriétés précédentes, nous disons que l'ensemble des triplets de nombres constitue un
espace ponctuel, noté . Les éléments de sont alors appelés des "points".
728/2001
Sciences.ch 14/03/2005
L'espace vectoriel est appelé "l'espace associé à ". Lorsque l'espace vectoriel associé est
un espace pré-euclidien (muni du produit scalaire), nous disons alors que est un "espace
ponctuel pré-euclidien".
Définitions :
D1. Nous appelons "repère de l'espace " l'ensemble constitué par les éléments
(origine) et de la base . Ce genre de repère est noté :
ou encore simplement :
D2. les coordonnées d'un point d'un espace ponctuel pré-euclidien , par rapport au
repère , sont les composantes (contravariantes) du vecteur de l'espace par
rapport à la base .
Nous en déduisons que les composantes du vecteur , par rapport à la base , sont les
quantités , différences des coordonnées des points et .
Soient et deux repères quelconques de liés entre eux par les relations générales
(voir chapitre de calcul tensoriel et d'algèbre linéaire dans la section d'algèbre) :
et
729/2001
Sciences.ch 14/03/2005
Cherchons les relations entre les coordonnées d'un point de par rapport à ces deux
repères. Pour cela, exprimons les vecteurs et sur chacune des bases de :
En de façon analogue:
Ces deux relations sont plus que pratiques en physique où nous avons souvent à considérer un
référentiel dans un repère (ainsi nous pouvons exprimer la position d'un point depuis l'un ou
l'autre repère en usant de ces deux relations).
La norme au carré est donc donnée comme nous l'avons vu lors de notre étude du calcul
tensoriel par la relation:
730/2001
Sciences.ch 14/03/2005
Rappelons également (voir chapitre de calcul tensoriel) que pour un espace ponctuel pré-
euclidien où les vecteurs de base sont donc orthonormés, nous avons:
Les vecteurs de la physique sont généralement des fonctions de une ou plusieurs variables,
celles-ci pouvant être des variables d'espace ou du temps. Lorsque à un point d'un espace
ponctuel , nous attachons un tenseur, défini par ses composantes par rapport à un repère
, nous dirons que nous nous sommes donnés un "champ de tenseurs" (le champs de
tenseur d'ordre 1 étant des champs vectoriels).
Pour des vecteurs à dimensions, la notion de dérivée d'un vecteur à trois dimensions se
généralise et nous obtenons toutes les relations classiques relatives aux dérivées.
Par définition, la dérivée du vecteur par rapport à la composante est un vecteur noté:
731/2001
Sciences.ch 14/03/2005
Dans ce site, nous basculons d'une notation à l'autre sans préavis en fonction de l'envie de
simplifier les écritures (il faudra s'y faire..).
Etant donné que nous faisons actuellement plus de la mathématique que de la physique, nous
noterons:
En rappelant (voir calcul différentiel et intégral) que la différentielle est donnée par:
ou
dont les composantes sont les dérivées partielles des composantes de , soit:
Montrons que le vecteur dérivé ne dépend pas du point origine (statique) mais
seulement du point considéré. En effet, si est un autre point origine, nous avons:
732/2001
Sciences.ch 14/03/2005
d'où:
Afin d'alléger les expressions des dérivées partielles totales des fonctions dépendant de
variables, nous utilisons quand le contexte s'y prête, les notations indicielles suivantes. Si
est une fonction des variables , nous noterons les dérivées partielles
sous la forme:
Lorsque est un vecteur tel que , dont les composantes sont des fonctions de
variables , soit:
733/2001
Sciences.ch 14/03/2005
Le concept d'espace ponctuel étant maintenant introduit, nous pouvons maintenant passe à
l'étude du formalisme lagrangien et la détermination de la formulation mathématique du
principe de moindre action.
734/2001
Sciences.ch 14/03/2005
MÉCANIQUE ANALYTIQUE
Nous devons la forme actuelle de la mécanique analytique (appelée aussi parfois "mécanique
lagrangienne") aux travaux des frères Bernoulli et particulièrement d'Euler et Lagrange. C'est
effectivement en 1696 que commence l'histoire de la vraie physique théorique telle que nous
la connaissons aujourd'hui.
Cet énoncé est appelé "principe de moindre action" ou "principe variationnel" ou encore
"principe d'économie".
Remarques :
R1. Les "moyens" précités peuvent êtres : le chemin le plus court, le chemin le plus rapide
(les trajectoires spatio-temporelles à plus faibles amplitudes en gros...).
R2. Selon le premier principe fondamental de la physique, la grandeur constante est choisie
comme étant l'énergie.
Au fait, bien que cet énoncé puisse paraître comme cohérent, il peut faire douter mais... nous
verrons :
2. En électromagnétisme, nous retrouverons toutes les équations de maxwell (in extenso la loi
de Biot-Savart, Farady, Force de Lorentz, loi de Laplace, etc. ) à partir à nouveau des
propriétés du principe de moindre action et de conservation de l'énergie.
3. En optique, nous démonstrerons que le chemin suivi par la lumière est toujours la plus
courte et nous permettra donc de démontrer le principe de Fermat à la base de toute l'optique
géométrique.
5. Le principe de moindre action permet également de démontrer que tout corps, avec ou sans
masse, est dévié par un champ d'accélération (déterminé par la géométrie de l'espace... tiens !
y'aurait pas du chemin là dedans... ?) et... permet donc de déterminer l'équation d'Einstein des
champs qui est à la base de toute la relativité générale.
Il va donc sans dire par ces cinq petits exemples les applications phénomènales de ce principe.
Au fait, tout peut se résumer en la phrase suivante :
735/2001
Sciences.ch 14/03/2005
moindre action.»
Historiquement, il est intéressant de savoir que c'est Pierre-Louis Moreau de Maupertuis (un
fervant croyant mais personne n'est parfait...) qui a énoncé le premier le principe de moindre
action sous la forme (peu scientifique) suivante :
«Tous les phénomènes naturels s'accordent avec le grand principe que la Nature, dans la
production de ses effets, agit toujours par les voies les plus simples. […] On ne peut douter
que toutes choses ne soient réglées par un Être suprême qui, pendant qu'il a imprimé à la
matière des forces qui dénotent sa puissance, l'a destinée à exécuter des effets qui marquent sa
sagesse…»
L'intervention d'Euler et Lagrange dans ce domaine a été de mettre sous forme mathématique
ce principe et de démontrer (tenez-vous bien...) qu'il découle d'un simple propriété
mathématiques des optima des fonctions continues. Il va sans dire, que sachant que cela a
permis de redémontrer toutes les lois de la physique en a dérangé plus d'un...
Ainsi, le premier à s'attaquer au problème fût donc le Bâlois (Suisse) Léonhard Euler. Mais
nous avons également gardé le nom de Lagrange (d'où l'appelation : "formalisme lagrangien")
pour définir toute la méthode et le formalisme mathématique construite autour du principe de
moindre action.
FORMALISME LAGRANGIEN
Cette technique est assez peu enseignée dans les petites écoles car il faut bien l'avouer le
formalisme lagrangien (contenant donc le principe de moindre action sous forme
mathématique) fait appel à un niveau d'abstraction un peu plus élevé que les méthodes
normales et malgré qu'il soit souvent d'une aide précieuse dans l'élaboratoin de théories
(physique fondamentale, physique quantique, relativité générale, théorique quantique des
champs, théorie des supercordes), il en découle rarement de nouvelles solutions (mais plutôt
une réduction et une méthode de validation utile et très puissante).
COORDONNÉES GENERALISÉES
Un réflexe naturel conduit généralement à référer la position d'un point dans l'espace à la
seule connaissance de ses trois coordonnées cartésiennes , , (voir ci-dessus les espaces
ponctuels). Cette attitude est d'ailleurs le plus souvent justifiée par la simplicité d'un grand
nombre de situations rencontrées dans la pratique, où il n'est pas nécessaire de rechercher de
méthodes plus élaborées ou de passées dans d'autres systèmes de coordonnées (voir le
chapitre de calcul vectoriel).
Pour repérer la position d'un mobile (ou d'un point matériel) en physique il est nécessaire dans
un premier d'associer un repère au référentiel. Ainsi, un"repère" est un système de repérage
736/2001
Sciences.ch 14/03/2005
Remarques:
R1. Comme nous l'avons vu en géométrie différentielle, la distance entre deux points d'une
trajectoire courbe en parcourant la courbe est appelée "abscisse curviligne". Sinon, la distance
entre deux points d'une trajectoire rectiligne est appelée simplement "abscisse".
R2. Un repère, assimilé à un référentiel, est dit "Galiléen" (c'est rare que nous en fassions
explicitement mention en physique par manque de rigeur) si:
ou:
- comme un système où les lois de Newton sont vérifiées (voir le chapitre de mécanique
classique)
Nous renvoyons le lecteur au chapitre de mécanique classique (chapitre suivant) pour une
étude plus approfondie sur le "principe de relativité galiléen".
R3. Un repère, assimilé à un référentiel, est dit "barycentrique" (voir le chapitre de géométrie
euclidienne) s'il a pour origine le centre de masse (voir le concept de "centre de masse au
737/2001
Sciences.ch 14/03/2005
chapitre de mécanique classique) du corps étudié. Cette remarque est important à prendre en
considération lorsque nous verrons le théorème de König en mécanique classique.
R4. Dire qu'un repère orthonormé est "direct" signifie que l'angle orienté a
pour mesure principale (dans le sens horaire). Dire qu'un repère orthonormé est
"indirect" signifie que l'angle orienté a pour mesure principale . Dans tout ce qui suit, si
nous spécifions par l'orientation, cela sous-entend que est direct.
Il est bien exact que les trois paramètres , , suffisent parfaitement à repérer un point
matériel dans l'espace usuel comme nous en avons déjà fait mention dans notre étude des
espaces ponctuels, mais il n'en demeure pas moins qu'il est parfois inévitable, ou même tout
simplement plus avantageux, d'utiliser un nombre de paramètres supérieur à trois. Nous
pouvons évidemment envisager toutes sortes de paramétrages pour atteindre les coordonnées
d'un point dans l'espace, de telle sorte que, d'une façon plus généralisée nous serons amenés à
prendre en considération des relations du type (nous ne gardons plus la même écriture que
celle que nous avions lors de notre étude des espace ponctuels par cohérence avec les
nombreuses références déjà existant sur le sujet):
Il est donc important de retenir que le nombre de paramètres définissant le repérage d'un
point dans l'espace est au moins égal à trois, sans être nécessairement différent de trois. C'est
finalement la nature des situations envisagées qui suggèrent le choix du nombre des
paramètres à utiliser (coordonnées cartésiennes, cylindriques, sphériques,...).
Dans une vision plus générale, la configuration instantanée d'un système, quelle qu'en soit la
nature, sera déterminée par la connaissance, en fonction du temps, de paramètres,
définissant le nombre de "degrés de liberté" du système (voir le début du chapitre de la
mécanique classique pour voir la définition rigoureuse du concept de degré de liberté)..
738/2001
Sciences.ch 14/03/2005
Ce dernier espace de référence revêt un intérêt capital pour un grand nombre de problèmes de
la science moderne et se trouve particulièrement bien adapté aux raisonnements de nature
relativiste. Les variables indépendantes constituant les coordonnées spatiales et temporelle
forment alors ce que nous appelons les "variables d'Euler".
Dans la mesure où les paramètres sont simplement présentés comme des fonctions
explicites du temps, le point décrit une courbe paramétrée, définie par , avec
. Cela revient à exploiter simultanément les équations:
Il arrivera fréquemment que, pour des raisons d'opportunité, nous souhaitions changer de
système de coordonnées généralisées, et utiliser un autre ensemble plus compatible avec les
spécificités du problème envisagé. Nous substituerons alors au jeu des un nouveau jeu de
coordonnées . Il est alors évident que nous devrons, avant toute chose, nous doter des
relations de dépendance existant entre les deux ensembles de coordonnées, à savoir disposer
des relations (voir dans la section algèbre du site au chapitre de calcul vectoriel les relations
de passages pour les systèmes de coordonnées cartésiennes, polaires, cylindriques et
sphériques) :
Dans ces conditions, à chaque point de l'espace des configurations des , noté ,
correspondra un point de l'espace de configuration des , noté . Nous avons ainsi
effectué une transformation ponctuelle, autrement dit une application de l'espace sur lui-
même.
Pour étudier des milieux continus (concept radicalement différent du point matériel), nous
aurons cependant deux approches différentes :
739/2001
Sciences.ch 14/03/2005
1. Soit nous attribuons aux particules du milieu les lois de la mécanique (dynamique des
corps en mouvement) ce qui implique un traitement statistique pour en établir une dynamique
pour l'ensemble des particules (cette méthode est pratiquée en théorie cinétique des fluides ou
encore en mécanique statistique - c'est également une approche dite "réductionniste").
2. Soit nous examinons le mouvement d'ensemble d'un milieu composé par un très grand
nombre de particules et nous le considérons comme un milieu continu. Ce concept de " milieu
continu " est acceptable pour autant que le volume infinitésimal pris autour d'un point
quelconque du fluide soit suffisant pour encore contenir un très grand nombre de particules.
1. Méthode de Lagrange :
Le mouvement du milieu est décrit par une formulation Lagrangienne consistant donc à le
caractériser en se donnant un système d'équations au sens newtonien :
C'est un système d'équations dans lequel sont les coordonnées cartésiennes d'une
particule du milieu continu à l'instant initial . En éliminant le temps, nous obtenons
l'équation de la trajectoire de la particule. Par dérivations, nous avons alors la vitesse et
l'accélération de la particule.
Au lieu de suivre le parcours d'un point , nous portons notre attention sur l'évolution des
caractéristiques physiques en un point donné du fluide. Si (une propriété parmi tant
d'autres) est la vitesse en un point au temps , nous avons:
740/2001
Sciences.ch 14/03/2005
et
Lorsque nous effectuons un modèle basé sur la méthode d'Euler, nous parlons fréquemment
de "système Eulérien". Nous en verrons un premier exemple en mécanique classique lorsque
nous formulerons la première loi de Newton pour un point matériel et pour un milieu continu.
PRINCIPE VARIATIONNEL
Rappelons que selon l'énoncé du principe variationnel nous devons trouver dans tout
phénomène physique, une certaine quantité qui est naturellement optimisée (minimisée ou
maximisée) et qui décrit toutes les variables du système étudié et ainsi son issue.
Remarque : si aucune action extérieure n'intervient dans l'évolution du système, nous parlons
alors de "système libre".
Voici la démarche que nous allons suivre, une fois cette démarche présentée, nous nous
attquerons à sa formalisation mathématique. Les propositions (les idées) sont les suivante :
P2. L'énergie totale d'un système fermé est constante et constituée de la sommation de
l'énergie cinétique et l'énergie potentielle (si nous ne considérons que l'énergie cinétique, alors
le système est dit "libre", si les deux énergies sont considérées, nous disons alors que les
système est "généralisé").
P3. Nous définissons une fonction mathématique (dont les variables sont les coordonnées
généralisées) appelée "Lagrangien" qui est donnée par la différence entre les deux énergies
précitées.
P4. Sur l'évolution d'un système entre deux états, nous cherchons les propriétés de la fonction
(du langrangien) qui donne la minimisation de la variation de la différence des deux énergies
(rappelez-vous que le principe variationnel s'appel aussi principe d'économie et ce n'est pas
pour rien) sur l'évolution temporelle ou métrique du système.
Enfin, une fois la propriété de cette fonction déterminée (propriété mise sous la forme que
nous appelons "équation d'Euler-Lagrange) nous chercherons toutes les propriétés possibles
autres qu'elle a afin d'avoir les outils nécessaires pour la physique théorique et vous allez voir
cela marche terriblement bien...
Donc, pour mettre cela sous forme mathématique, nous commencons par poser qu'il existe
une fonction réelle de variables:
741/2001
Sciences.ch 14/03/2005
que nous appellerons "Lagrangien généralisé" du système, dont l'intégrale satisfait à l'énonce
suivant :
doit être un extrêmum (en fait, "un minimum" ou "un maximum", puisque nous aurions pu
tout aussi bien prendre au lieu de dans le choix de la définition du Lagrangien
généralisé).
ÉQUATION D'EULER-LAGRANGE
Considérons alors une trajectoire très voisine à la précédente, que nous noterons:
Remarque : nous avons omis maintenant l'écriture des arguments des fonctions du temps
afin d'alléger les écritures.
Si est bien l'évolution d'un système évoluant selon le principe de moindre action, alors
l'action donné par la variation :
est nulle pour et tendant vers zéro (sous-entendu que tout système physique revient à
son état initial).
742/2001
Sciences.ch 14/03/2005
Ce principe stipule donc que la trajectoire d'un particule (ou d'un système plus général)
s'obtient en demandant qu'une certaine fonctionnelle appelée "action" soit stationnaire par
rapport à une variation de la trajectoire. En d'autres termes, si nous effectuons une variation
infiniment petite de la trajectoire , la variation doit être nulle. Pour un système mécanique
simple, l'action est alors évidemment par le principe de conservation de l'énergie égale à
l'intégrale sur la trajectoire de (par définition du lagrangien) de la différence entre l'énergie
cinétique et l'énergie potentielle.
Dès lors, dans une théorie àpour laquelle les forces dérivent d'un potentiel , nous sommes
naturellement amenés à définir le "Lagrangien" par la relation (il faudra s'en souvenir !) :
et
Remarque : pour l'étude de la relativité générale, nous ne chercherons pas à ce que la variation
de de la différence des énergies soit minimale tel que c'est le cas pour les systèmes
mécaniques, mais la variation de la longueur d'un arc (non dépendant du temps
contrairement à l'exemple précédent) dans un espace quelconque lors d'une trajectoire d'un
système libre. Ce qui nous aménera à écrire simplement (rappelez-vous en aussi car ce sera
très important) :
Pour revenir à notre application du principe variationnel dans le cas du lagrangien généralisé,
nous pouvons alors écrire la différentielle totale exacte (voir chapitre de calcul différentiel et
intégral) de et nous obtenons alors la relation :
Intégrons par parties (voir chapitre de calcul différentiel et intégral) le deuxième terme de la
somme de l'intégrale précédente :
743/2001
Sciences.ch 14/03/2005
Mais les et tendent vers 0 d'une infinité de manières différentes et nous devons
cependant avoir néanmoins . Cela veut dire alors que chaque terme sommé de
l'intégrale peut être pris indépendamment et doit satisfaire :
Mais comme les fonctions et peuvent toujours tendre vers zéro de multiple façon, et
que cette intégrale doit être quand même nulle, nous en déduisons que ce sont les intégrandes
qui sont nuls :
Remarque : c'est en étudiant la physique (les chapitres suivant du site) que l'on comprend
mieux les applications de cette équation (obtenue quasiment que par des développement
purement mathéamtique !!!) et qu'il devient alors possible de comprendre sa signification. A
notre niveau du discours, il est inutile de dire quoi que ce soit. Il faut faire de la physique, et
744/2001
Sciences.ch 14/03/2005
Donc dans l'approche lagrangienne, nous appronons à raisonner à partir de concepts d'énergie
potentielle et cinétique, au lieu de concepts de force. Les deux approches sont évidemment
équivalentes physiquement, mais les énergies n'étant pas des quantités vectorielles, elles sont
conceptuellement plus faciles à utiliser dans une vaste gamme de problèmes. En physique
quantique par exemple, la notion de force n'a aucune signification mais les notions d'énergie
demeurent valables. C'est une raison de plus pour se familiariser avec leur utilisation. De plus,
la force au sens de Newton est une action instantanée à distance. En relativité, une telle chose
est impossible. La notion de force est donc une création purement classique et macroscopique
contrairement à notre intuition, son intérêt est limité.
Exemple d'application (les autres exemples seront vus pendant notre étude des lois de
Newton, de l'électrodynamique, de la relativité restreinte, de la relativit générale, de la
physique quantique des champs, etc..):
Dans un premier temps, posons sous une forme mathématique conventionnelle l'équation
d'Euler-Lagrange (la notation des coordonnées généralisées n'est pas identique en
mathématiques à celle de la physique...):
L'énoncé du problème est le suivant : déterminer quel est le plus court chemin entre deux
points d'un plan (nous devinons que c'est la droite mais il faut le démontrer!).
Dans cet exemple quelque soit le chemin, nous avons un élément de celui-ci qui est donné par
la relation de Pythagore dans :
d'où la différentielle :
745/2001
Sciences.ch 14/03/2005
se réduit à :
mais comme n'est pas pas non plus de , cela signifie que nous avons :
746/2001
Sciences.ch 14/03/2005
Donc le plus court chemin entre deux points dans un plan est l'équation d'une droite... (simple
mais puissant)
Remarque :
Si est une trajectoire optimale (extrémale), nous devons avoir dans l'espace des fonction la
fonction telle que sa dérivée est nulle en tout point. Ce qui implique que . Dès lors,
nous pouvons écrire :
FORMALISME CANONIQUE
Le formalisme canonique n'introduit pas une nouvelle physique mais propose une nouvelle
gamme d'outils pour étudier les phénomènes physiques. Son élément central, "le
Hamiltonien", joue un grand rôle en physique quantique.
Comme dans le formalisme de Lagrange nous travaillerons avec des quantités comme
l'énergie, et plutôt qu'avec des quantités vectorielles comme la force de Newton.
Chez Lagrange nous comparons principalement des trajectoires et par conséquent les et les
sont tous indépendants. Chez Hamilton nous devrons d'abord apprendre à définir les
"moments généralisés", notés , pour remplacer les coordonnées généralisées et qui
sont aussi tous indépendants.
Remarque : l'origine des moments conjugués sera trivial dès que nous aurons vu un premier
747/2001
Sciences.ch 14/03/2005
exemple concret.
TRANSFORMATION DE LEGENDRE
Cette transformation est souvent utilisée en thermodynamique où elle permet de relier entre
eux les différents potentiels thermodynamiques. En mécanique elle permet de définir le
hamiltonien à partir du lagrangien. Nous en donnons une description simplifiée et suffisante.
Soit une fonction où sont les deux variables indépendantes dont dépend .
Définissons:
HAMILTONIEN
Soit un langrangien que nous traiterons comme la fonction ci-dessus avec les
jouant le rôle de et les le rôle de . A la place de , nous définissons les moments
généralisés également appelés "moments canoniques":
748/2001
Sciences.ch 14/03/2005
avec .
Nous définissons donc, en analogie avec , une fonction des et des que nous noterons
:
est plus que importante (comme tout le reste d'ailleurs). Nous la retrouverons, entre autres, en
physique quantique des champs. Par ailleurs, un très joli exemple de tout ce que nous avons
vu maintenant est donné dans le chapitre de mécanique relativiste ou nous calculons le
lagrangien et hamiltonien d'une particule libre. Les résultats sont assez pertinents et leur utilité
et justesse en électrodynamique plus que étonnante.
Si dépend du temps (ce qui est quand même assez souvent le cas..) nous avons comme
différentielle totale :
749/2001
Sciences.ch 14/03/2005
et comme les et sont indépendants nous identifions, en comparant nos deux expressions
que:
Ces relations sont extrêmement importantes car nous les retrouverons en physique quantique
des champs sous une forme un peu plus barbare (mais magnifique aussi...).
Ces équations sont appelées "équations canoniques du mouvement" et sont des équations
différentielles du premier ordre.
Remarque : l'apparition du signe moins " - " entre les équations pour les et celles pour leurs
moments conjugés, s'appelle une "symétrie symplectique".
De :
nous pouvons, sur une trajectoire qui obéit aux équations canoniques, calculer:
750/2001
Sciences.ch 14/03/2005
Remarque : si ne dépend pas du temps nous avons alors , alors (ainsi que
), sont une "constante du mouvement".
Exemple :
Soit une particule de masse se déplaçant en une dimension (disons ) et soumise à une
force dérivant d'un potentiel tel que:
Nous n'aurons qu'un seul moment (la quantité de mouvement), noté , conjugué à et défini
par:
équation que nous pouvons (que nous devons !) inverser (de la définition de la quantité de
mouvement) :
751/2001
Sciences.ch 14/03/2005
CROCHETS DE POISSON
Le crochet de Poisson est la façon standard de noter une certaine opération qui
implique les quantités et ainsi que l'ensemble des variables canoniques
définie par :
de cette définition nous pouvons déduire certaines propriétés triviales (si ce n'est pas le cas,
n'hésitez pas à nous contacter, nous ajouterons les démonstrations) :
Au delà d'une simple notation, le calcul des crochets de Poisson est assez facile et permet
d'obtenir nombre de résultats intéressants. D'autre part, ils sont intimement reliés aux
"commutateurs" de la physique quantique que nous étudierons dans le détail dans le chapitre
concerné.
Considérons maintenant une fonction quelconque dont la dérivée totale par rapport
au temps le long d'une trajectoire s'écrit (vous y reconnaîtrez quelque chose que vous
connaissez déjà... ) :
Si cette trajectoire est une trajectoire physique, elle obéit aux équations canoniques de
l'hamiltonien du système:
et alors:
752/2001
Sciences.ch 14/03/2005
Il existe une famille de résultats intéressants des crochets de Poisson. Parmi les plus
importants, calculons certains de ces crochets entre des variables canoniques, coordonnées et
moments :
puisque par définition, les coordonnées et moments ne sont pas directement dépendants :
d'où :
et de manière identique :
Mais :
Ce qui implique un résultat assez général que nous retrouverons en physique quantique :
753/2001
Sciences.ch 14/03/2005
TRANSFORMATIONS CANONIQUES
Nous disons des que ce sont des "variables canoniques généralisées". Ce n'est pas un
euphémisme puisqu'il n'y a pratiquement aucune limite à ce qu'elle peuvent représenter
physiquement.
Puisque tel est le cas, il doit exister des transformations entre ces différents choix. Nous
noterons les nouvelles variables canoniques obtenues suite à une telle transformation.
Nous ne sommes pas surpris par contre de constater que ces transformations sont soumises à
des conditions assez sévères. En effet, les sont généralisés et obéissent à :
sont invariantes de forme. Ainsi, à la suite d'une transformation des vers les et
définissant un nouvel hamiltonien que nous noterons nous devrons avoir :
754/2001
Sciences.ch 14/03/2005
755/2001
Sciences.ch 14/03/2005
Avant d'aborder l'étude des corps solides en mouvement, il peut sembler être dans l'ordre
logique des choses de définir et d'étudier les propriétés relativement à leur état statique.
Définitions :
D2. La "statique" est l'étude des conditions d'équilibre d'un point matériel soumis à des forces
en équilibre
D3. Toute cause capable d'accélérer ou de déformer un corps est appelé "force" (concept
introduit rigoureusement par Newton et sur lequel nous reviendrons en détail plus loin lors de
l'énoncé des trois lois de Newton).
POINT MATÉRIEL
Remarque: dans un repère, la position relative des axes est invariante au cours du temps, c'est
pourquoi un repère est équivalent à un solide dont l'origine est alors assimilé un "point
matériel". Par suite, pour la commodité de l'étude de la mécanique classique de par rapport
à un référentiel , nous substituerons généralement le solide à un repère d'espace qui lui
est invariablement lié.
Pour la suite, comme nous travaillerons que très peu en notation tensorielle en mécanique
classique, nous noterons:
756/2001
Sciences.ch 14/03/2005
L'orientation du solide sera quant à elle donnée par l'orientation de la base dans
:
Pour simplifier, les origines et des deux référentiels sont supposées confondues (ce qui
n'enlève rien à la généralité du passage de l'orientation d'une base à une autre).
Trois paramètres angulaires sont nécessaire pour déterminer complétement par rapport à
. Ces paramètres sont appelés les "angles d'Euler" et ils sont associés à 3 rotations
successives qui permettent de superposer la base sur la base . Ces trois
rotations sont détaillées sur les figures ci-dessous :
757/2001
Sciences.ch 14/03/2005
- "nutation" afin d'amener en coïncidence avec . De plus est après dans le plan
horizontal .
Ainsi, dans le cas général, le nombre de paramètres indépendants nécessaires pour préciser la
position et l'orientation du solide dans le référentiel est égal à 6 : 3 paramètres de position
et 3 paramètres d'orientation.
- la position d'un point quelconque du solide ( ) est déterminée par ses coordonnées dans
(3 paramètres)
- soit un second point du solide: lorsque le point est fixé dans , peut encore se
mouvoir autour de : il décrit alors la surface d'un sphère de rayon . Il faut donc trois
paramètres supplémentaires pour déterminer la position de sur cette surface.
Remarque: si le mouvement du solide est retreint par une liaison, le nombre de degrés de
liberté est alors inférieur à 6. Par exemple, un solide en rotation autour assimilé au repère
758/2001
Sciences.ch 14/03/2005
principal et en rotation autour de l'axe fixe ne possède qu'un seul degré de liberté (l'angle de
rotation autour de cet axe).
LOIS DE NEWTON
Les trois lois de Newton (nous devrions plutôt dire "hypothèses Newton") sont à la base de la
mécanique classique. Elles sont à posteriori indémontrables et non formalisables car elles
énoncent des observations et découlent donc de notre expérience quotidienne.
Cependant, les développements de la physique moderne et qui se basent sur les conséquences
de ces trois lois sont en tel accord avec les conditions théoriques qu'impose le principe de
moindre action et les expériences y relatives, que leur validité pourrait ne plus être mise en
doute (...)
Définition : Tout corps ponctuel ou étendu persévère dans sa forme (géométrie) ou son état de
repos ou de mouvement rectiligne uniforme (décrit par le centre de masse), sauf si des forces
"imprimées" le contraignent d'en changer.
Corollaire : tout corps au repos est soit imprimé par un nombre de forces nul, soit la somme
des forces imprimées est nulle (principe fondamental de l'étude de la "statique").
Remarque : nous avons démontré ce corollaire lors de notre étude du théorème de Noether
dans le chapitre traitant des principes de la physique.
Après la virgule de la première phrase, jaillit en pleine lumière le mot "force". Questionnons
donc ce mot : le langage courant regorge de significations différentes: la force du poignet, la
force de l'âme… Aussi, la force peut-elle être aveugle ou majeure, selon le cas… Quoi qu'il en
soit, elle a le pouvoir de changer le cours (le mouvement) et la forme (géométrie) des choses.
Sans ignorer ce halo qui entoure le mot et qui a embarrassé plus d'un physicien avant lui,
Newton donne à la force une signification très précise, qui se démarque de l'idée intuitive d'un
effort physique.
Propriétés :
P2. L'effet d'une force, ne change pas si nous faisons glisser la force sur sa droite d'action.
Une force est donc une grandeur physique qui se manifeste par ses effets :
E1. Effet dynamique : une force est une cause capable de produire ou de modifier le
mouvement ou la forme (géométrie) d'un corps
E2. Effet statique : une force est une cause capable de produire une déformation d'un corps.
Toute force peut être représentée par un vecteur dont les quatre propriétés sont :
759/2001
Sciences.ch 14/03/2005
Il est possible de ranger la plupart des forces par famille telles que :
F1. Les forces de "réaction" : chaque corps exerce une force sur un autre corps qui est en
contact avec lui. Par exemple, si un objet repose sur une table, cette table exerce une force
égale et opposée sur l'objet (afin que ce dernier ne s'enfons pas dans la table - ce sont des
mécanismes quantiques qui sont à l'origine de cette force de réaction). Cette force est toujours
à la verticale du point de contact.
F2. Les forces de frottement : la force de frottement existe lorsque deux corps sont en contact.
Elle s'oppose toujours au mouvement. La force de frottement qui s'oppose au mouvement n'a
pas seulement un effet négatif, elle est indispensable pour assurer le contact entre deux
surfaces (par exemple : contact des pneus sur la route, freinage, …).
F3. Les forces de tension exercée sur un corps : c'est une force qui tire sur un élément d'un
corps comme par exemple, la tension exercée par un fil, par un ressort
F4. Les forces "à distance" : ce sont les forces qui agissent par l'intermédiaire de champs
vectoriels comme par exemple le champ électrique, le champ magnétique, le champ
gravitationnel. Ce dernier a comme particularité s'il est isotrope (nous le démontrerons lors de
notre étude de la statique des forces) de pouvoir se réduire à l'étude du centre de gravité du
corps.
Une force, nous le savons, est dans le langage de Newton ce qui provoque le "changement du
mouvement" et pas autre chose… Mais, supplément au programme, les mots "changement du
mouvement" de cette loi cachent une signification mathématique, différente de l'intuition
"changement de vitesse". Pour Newton, nous avons vu qu'un corps au repos était caractérisé
par sa quantité de matière, sa masse. S'inspirant de certains prédécesseurs, Newton pose qu'un
corps en mouvement "transporte une certaine quantité", appelée sans fioritures : la "quantité
de mouvement". C'est en fait cette quantité qui, sous le simple mot "mouvement" est contenue
dans l'énoncé de la seconde loi. "La quantité d'un mouvement est la mesure que nous tirons à
la fois de sa vitesse (concept que nous définirons plus loin lors de notre étude de la
cinématique) et de sa quantité de matière", autrement dit, par définition, le produit de sa
masse par sa vitesse.
En utilisant les symboles mathématiques modernes, la première partie de cette deuxième loi
peut alors se reformuler :
La force est égale à la variation en fonction du temps de la quantité de mouvement, soit dans
760/2001
Sciences.ch 14/03/2005
Cette relation est donc valable tant que la vitesse est très inférieure à celle de la lumière
comme nous le verrons en lors de notre étude de la mécanique relativiste bien plus tard, car
Newton supposa que la masse ne variait (ou ne semblait varier) en fonction de la vitesse.
Ainsi:
Rappel : la "masse" est une mesure pour la quantité de matière contenue dans le corps (pour
plus de détails voir le chapitre traîtant des principes de la mécanique). La masse est une
constante indépendante de l'endroit où elle se trouve (unité S.I. kilogramme : ). Le "poids",
correspond lui à la force (unité S.I. newton : ) qu'un objet exerce sur une autre par
l'intermédiaire d'un champ gravitationnel. Il dépend de l'endroit où nous nous trouvons (voir
ci-dessous l'équation de la force gravitationnelle de Newton).
Nous verrons (démontrerons) que dans le cadre d'un corps tombant dans un champ
gravitationnel à symétrie sphérique, nous avons :
dans le cadre de notre vieille Terre, nous avons pour habitude de poser:
Dans le système Eulérien et en coordonnées cartésiennes, une grandeur donné d'un milieu
continu aura une distribution en fonction des quatre variables indépendantes . Pour de
petites variations et , la variation totale de s'exprimant par (voir le chapitre
cacul différentiel et intégral dans la section d'algèbre):
En suivant une particule dans son mouvement, nous observons pendant un temps des
déplacements . Nous pouvons donc exprimer à partir de l'expression précédente la
variation totale de pendant le temps . Nous obtenons ainsi l'expression d'une dérivée très
importante en physique théorique dite "dérivée particulaire":
761/2001
Sciences.ch 14/03/2005
Cette formulation de la deuxième loi de Newton est de la plus haute importance en physique.
Elle rend compte explicitement de la force subie par un point matériel dans un champ
vectoriel en fonction de la vitesse et non plus de la position. Nous retrouverons cette
formulation en mécanique des milieux continus dans notre étude des fluides et plasmas, en
électromagnétisme ainsi qu'en Relativité Générale.
Énoncé : la réaction d'un corps étendu ou ponctuel solide est toujours de sens opposée et
d'intensité et de direction égale à la force imprimée.
Cette troisième loi est plus connue sous le nom de : "principe d'action/réaction" et découle de
la première loi de Newton selon la raisonnemen mathématique lors de notre étude du
théorème de Noether dans le chapitre traitant des principes de la physique.
Nous pouvons également dire encore que deux corps solides ponctuels ou étendus en contact
exercent l'un sur l'autre toujours des forces opposées en sens mais égales en intensité et en
direction
CONDITIONS D'ÉQUILIBRE
Pour qu'un point matériel, soumis à des forces soit en équilibre statique, il faut
que la résultante de ces forces soit nulle. Soit :
Définitions:
D2. Si les lignes d'action de toutes les forces agissant sur un corps sont dans un même plan, le
système de forces est dit "coplanaire".
762/2001
Sciences.ch 14/03/2005
Une observation plus approfondie fait apparaître la force comme le résultat macroscopique de
phénomènes microscopiques complexes, à savoir des interactions à distance entre particules.
Ces interactions sont au nombre de quatre et je désire nullement en parler maintenant car elles
font appel à des outils mathématiques qui sont hors contexte dans cette section du site.
Remarque : la relation précédente, qui définit donc tout corps à l'équilibre, ouvre l'étude a de
très nombreux cas pratiques et constitue à elle seule un immense chapitre d'application
pratiques que nous appelons la "statique des forces" et que nous développerons après avoir
introduit le concept de moment de force.
Il s'agit du cas particulier du barycentre avec toutes ses propriétés que nous avons déjà
largement développé dans le chapitre de géométrie euclidienne (donc nous vous conseillons
fortement de vous y référer) mais rapporté à la physique :
Définition : nous appelons "centre de masse" (ou "centre d'inertie" s'il y a égalité stricte entre
masse grave et masse inerte comme nous en avons fait mention dans le chapitre traitant des
principes de la mécanique) un point auquel nous pouvons rattacher tout la masse du
système (et donc son analyse!!) et tel que, l'origine étant arbitrairement choisie il soit donné
par (nous démontrerons cette relation lors de l'étude de la statique des forces) :
763/2001
Sciences.ch 14/03/2005
étant l'élément de volume. L'équation peur alors s'écrire (la notation de la triple intégrale
est réduite à une seule par souci de condensation d'écriture):
Soit en composantes :
Remarques:
- il ne faut pas confondre centre masse et centre de gravité (dit également "barycentre" - voir
le chapitre traint de la géométrie euclidienne) qui se confondent seulement si et seulement si
la masse du corps étudié est homogène.
Il n'est pas évident de calculer le centre de masse d'un corps donné relativement simple. Ce
n'est pas que les outils mathématiques à manipuler soient complexes loin de là (simple
intégrale, Pythagore et quelques multiplications et intégrations par parties) mais il faut
aborder le problème d'une façon élégante et si nous n'avons pas tout de suite la bonne
approche nous nous casserons très vide les dents. Nous conseillons donc aux professeurs qui
abordent ce sujet et les exercices y relatifs, de les faire avec les élèves (donc en classe) mais
en laissant ces derniers débattre de la façon dont le professeur doit attaquer le problème au
tableau noir (cela marche très bien).
Sous l'action des forces extérieures , agissant en chaque point du solide, chacun
de ces points prend l'accélération correspondant à la force appliquée . En utilisant la loi de
Newton (voir la définition de cette loi plus loin) pour chaque point et en sommant les effets
nous aurons (dans un cas non relativiste) :
764/2001
Sciences.ch 14/03/2005
où
soit:
Le centre de masse d'un solide se meut comme un point matériel de masse égale à celle du
solide et auquel serait appliqué la somme des forces extérieures. Un exemple simple est celui
d'une projectile explosif décrivant en absence de pesanteur une trajectoire courbe. Si le
projectile explose et se fragmente, le centre de masse des éclats continue à décrire la
trajectoire courbe qu'il avait entamée.
Reprenons l'équation :
en posant :
765/2001
Sciences.ch 14/03/2005
Cette relation montre que si la somme des forces extérieures est nulle alors:
Dans l'étude des interactions entre particules, il est souvent commode d'utiliser un système de
référence lié au centre de masse de l'ensemble des particules. Ce centre de masse étant au
repos dans ce référentiel sa vitesse y est nulle ainsi que la quantité de mouvement totale,
comme le montrent les équations ci-dessus. Cette propriété constitue le puissant avantage de
cette description.
THÉORÈME DE GULDIN
Le théorème de Guldin permet dans certains cas, de simplifier le calcul du centre de masse de
certains corps (voir la section de géométrie pour leur calcul).
Premier théorème : soit une plaque plane, homogène, d'épaisseur constante , de masse
volumique placé dans un plan cartésien . Nous avons alors par rapport à l'axe :
Envisageons une rotation autour de l'axe . Le volume décrit par un élément de surface
766/2001
Sciences.ch 14/03/2005
et, par conséquent, le volume total décrit par la surface complète est :
Deuxième théorème :soit une tige courbe, homogène, de longueur , de section constante, de
masse linéique . Nous avons :
Envisageons une rotation autour de l'axe . La surface décrite par un élément de longueur
lors de cette rotations vaut :
et, par conséquent, la surface totale décrit par la tige de longueur est :
CINÉMATIQUE
767/2001
Sciences.ch 14/03/2005
La relation fonctionnelle entre grandeurs pour un état donné peut être décrite par une
équation. Pour un phénomène évolutif, il peut y avoir une infinité d’états que nous pouvons
décrire par autant d’équations. Sous cette forme, cela n’a pas d’intérêt. Nous cherchons alors à
trouver une équation unique qui met en relation les différentes grandeurs vérifiant tous les
états que le phénomène évolutif considéré peut admettre.Par cette équation, nous pouvons
ensuite calculer n’importe quel état du phénomène évolutif étudié : c’est "l’équation
d’état" (notion tirée de la thermodynamique).
POSITION
Définition : la position d'un objet est défini par son vecteur position dans le cas particulier
d'un espace tri-dimensionnel :
or chaque coordonnée d'un objet en mouvement peut varie fonction du temps comme:
Plutôt que cette notation un peu lourde en parenthèses… les physiciens notent fréquemment le
vecteur position (ou vecteur d'espace) sous la forme d'un vecteur de 4 dimensions:
- 3 dimensions spatiales
- 1 dimension temporelle
VITESSE
Définition : la vitesse, notée , est par définition la distance parcourue par un objet pendant
une certaine quantité de temps :
Lorsqu'un corps est en mouvement uniforme rectiligne, c'est-à-dire qu'il parcourt une distance
768/2001
Sciences.ch 14/03/2005
donnée selon une dimension avec en un temps toujours égal, le rapport précédent
est constant dans le temps:
La vitesse moyenne arithmétique est définie comme étant le rapport de la distance parcourue
entre un point de départ donné à un instant et un point d'arrivée à un instant :
Remarque : il faut prendre garde lors des calculs de la vitesse moyenne (voir le chapitre de
probabilités et statistiques dans lequel nous présentons la moyenne harmonique)
Ceci représente donc une moyenne (car nous ne nous intéressons pas comment le chemin
entre et a été parcouru) mais nullement la vitesse instantanée du véhicule à un
moment donné.
Ainsi, pendant une différence de temps infiniment petite, la distance parcourue sera également
infiniment petite. Nous aurons donc :
et finalement :
Si le corps étudié n'est pas en mouvement rectiligne dans un repère cartésien à trois
dimensions alors sa position sera donnée par le vecteur et nous noterons sa vitesse dès
lors par:
769/2001
Sciences.ch 14/03/2005
Remarque : si toutes les parties d'un corps se déplacent à la même vitesse et dans la même
direction, nous avons alors un "mouvement de translation". Par contre, dans un "mouvement
de rotation", les vitesses des diverses parties du corps ne sont pas les mêmes, en module et en
direction (nous le démontrerons plus loin) et peuvent varier avec le temps.
ACCÉLÉRATION
Définition : l'accélération, notée , est par définition, la variation de la vitesse pendant un une
certaine quantité de temps tel que (nous passons directement à la limite) :
ce qui nous donne la distance parcourue par un corps pendant un laps de temps donné.
770/2001
Sciences.ch 14/03/2005
ou
que nous retrouvons dans les écoles le plus fréquemment sous la forme :
Le premier cas que nous considèrons comme le plus connu, est la vitesse de chute à
accélération constante d'un corps dans un milieu exempt de tout frottement.
et
Nous pouvons tirer de cette relation la vitesse de libération d'un astre (relatio pratique quand
nous étudierons le chapitre d'astrophysique):
Supposons que vous savez déjà que deux corps s'attirent mutuellement avec une accélération
selon le modèle classique de Newton (que nous démontrerons plus loin):
771/2001
Sciences.ch 14/03/2005
Nous pouvons répondre à partir de cette équation, pourquoi certaines planètes du système
solaire ont un atmoshère et d'autres pas (il faut prendre en compte l'agitation moléculaire).
Ce qui est aussi intéressant dans cette relation c'est que nous pouvons calculer quelle doit être
le rayon d'un corps de masse pour que sa vitesse de libération soit égale à celle de la
lumière (allusion aux Trous Noirs).
PLAN OSCULATEUR
Il est souvent utile de décomposer le vecteur accélération dans le plan osculateur suivant
respectivement la tangente et la normale à la trajectoire :
Exprimons ces deux vecteurs (un exemple plus général est donné dans le chapitre de
géométrie différentielle) :
772/2001
Sciences.ch 14/03/2005
Le premier terme à droite de l'égalité est l'accélération tangentielle quand au second terme,
même si la vitesse est constante ce dernier apparaît dans l'expression de l'accélération pour
exprimer le changement de direction de la vitesse.
En comparant avec l'expression initiale du vecteur , nous voyons que les termes entre
crochets ci-dessus sont les composantes d'un nouveau vecteur unité perpendiculaire au
vecteur , donc perpendiculaire à la trajectoire et dirigé vers le centre de courbure.
773/2001
Sciences.ch 14/03/2005
est un terme qui exprime la modification de l'intensité de la vitesse sur la trajectoire du point
et où "l'accélération normale" :
est un terme qui exprime le changement de direction du point sans que nécessairement ce
dernier change donc de vitesse!
Définition : il est impossible pour un observateur animé d'un mouvement uniforme de savoir
s'il se meut par rapport à son environnement ou bien à l'inverse si l'environnement se déplace
par raport à lui. Dès lors, il ne peut exister de référentiel absolu qui puisse être considéré
comme fixe vis-à-vis de toutes les autres repères galiléens ce qui signifie clairement que tous
les repères galiléens doivent jouir du même statut en mécanique puisqu'ils ne peuvent être
distingués les uns des autres. Ce principe est nommé le "principe de relativité galiléen".
Ce principe, (à ne pas confondre avec le principe de relativité restreinte car les hypothèses de
départ diffèrent un tant soit peu…) découle directement de l'étude de ce que nous nommons
"la transformation de Galilée".
Définition : une "transformation de Galilée" est une suite d'opérations mathématiques sur une
loi physique qui permet de déterminer les propriétés d'un ou plusieurs "observable" (vitesse,
force quantité de mouvement, etc.) lorsque nous passons lors de l'étude d'un phénomène
physique d'un référentiel à un autre référentiel : l'un supposé au repos, et l'autre en
mouvement uniforme.
La question à l'origine historique était de répondre s'il est plus légitime d'étudier un
phénomène dans un référentiel ou un autre. Plus exactement, nous souhaitons déterminer si la
forme des lois physiques gardent les mêmes formes algébrique quelque soient les référentiels
dans lequel nous les étudions.
Soient deux référentiels en mouvements l'un par rapport à l'autre à une vitesse constante
. Pour un certain référentiel cartésien au repos (ou supposé tel quel)
774/2001
Sciences.ch 14/03/2005
nous allons poser le deuxième référentiel de façon à ce qu'il soit aligné avec l'axe
des afin de simplifier les calculs avec :
Nous allons également mettre dans le deuxième référentiel en mouvement, un point matériel
de cordonnées .
d'où et donc (nous supposons connu le concept de "force" défini plus loin avec
rigueur) :
Le résultat obtenu est donc fort intéressant puisque la deuxième loi de Newton garde
exactement la même forme, et la même valeur dans les deux référentiels. Le fait que nous
nous déplacions ou pas à vitesse constante ou pas n'a donc aucune influence sur notre vision
du monde qui reste exactement la même.
775/2001
Sciences.ch 14/03/2005
c'est-à-dire que nous imposons que la vitesse relative est uniforme (constante) et la masse
constante et surtout, que .
Mais au fait, cette transformation est fondamentalement fausse comme nous le verrons plus en
détail lors de notre étude de la relativité restreinte. Effectivement, soit un objet se déplacent le
long de l'axe avec une vitesse mesurée dans le repère primé :
quel sera alors sa vitesse dans le repère non primé? Si la transformation de Galilée est
fondamentalement vraie, il suffit de remplacer dans la relation précédente et par leurs
expressions en fonction de :
ou
soit :
Seul petit hic… une expérience simple impliquant des rayons de lumière fut réalisée au début
du siècle, et montra que cette loi était fausse. Cette expérience dite de "Michelson-Morley"
bouleversa à tout jamais notre vision du monde... et amena Albert Einstein à développer la
théorie de la relativité restreinte en imposant que la vitesse de la lumière quelque soit le
référentiel est toujours constante : (voir le chapitre de mécanique relativiste pour de
plus amples informations sur le sujet)
MOMENT CINÉTIQUE
avec étant la quantité de mouvement (voir la définition plus loin) donnée par :
Par sa définition, le moment cinétique est un vecteur perpendiculaire au plan contenant les
vecteurs et et si la particule se déplace dans un plan, la direction de est constante mais
pas nécessairement de même direction.
Un cas particulier du calcul du moment cinétique est le mouvement circulaire (plan) de rayon
, le "rayon-vecteur" est alors toujours perpendiculaire à la direction du vecteur-vitesse
et donc:
776/2001
Sciences.ch 14/03/2005
Nous voyons apparaître ici la définition du "vecteur rotation" également noté parfois (à
tort) .
Pour un mouvement plan mais non circulaire (comme une conique par exemple), nous
introduisons les composantes normale et tangentielle de la vitesse:
et d'autre part:
La dérivée par rapport au temps du moment cinétique d'un mobile ponctuel est donc égal à ce
que nous définissons par "le moment de force" sur lequel nous reviendrons plus loin.
Remarques :
R1. Cette dernière relation fait que nous appelons parfois le moment cinétique "moment de la
777/2001
Sciences.ch 14/03/2005
R2. Il faut bien sûr prendre garde au fait que (voir chapitre de calcul vectoire) que :
R3. Ce qui est fortement impressionant dans ce résultat (variation instantanée du moment
cinétique), c'est que tout corps ayant un moment cinétique non nul et soumis à aucun moment
de force, conserve l'orientation de dans l'espace et le temps. Ce résultat nous permet de
comprendre la dynamique du du gyroscope et tous les autres corps ayant des propriétés
similaires. Nous étudierons plus loin le gyroscope et ses propriétés, car son comportement est
fascinant et les résultats théoriques en découlant trouvent des applications en astrophysique et
physique atomique.
La quantité :
L'impulsion de rotation fournie par un moment de force entre les instant et est égale à la
variation du moment cinétique durant cet intervalle de temps.
L'utilisation du moment cinétique permet de montrer facilement la loi des aires (deuxième loi
de Kepler), qui joue un rôle important dans le mouvement des planètes (comme nous le
verrons plus loin lors de l'étude des Lois de Kepler). Voyons cela:
Imaginons une particule en mouvement sous l'action d'une force constamment parallèle à
. Nous dirons que cette force est "centrale" si sa direction passe constamment par un même
point fixe, appelé le "centre de force". La grandeur de la force ne peut donc plus dépendre que
de la distance au centre de la force (dans le cas d'un champ de force).
Dès lors:
778/2001
Sciences.ch 14/03/2005
Donc le moment cinétique par rapport au centre de force est constant si la force est centrale.
La réciproque est aussi vraie: si le moment cinétique est constant, sa dérivée par rapport au
temps est nulle et la direction de la force est toujours colinéaire à donc la force est centrale.
Par exemple, dans le cadre du mouvement d'une planète autour du Soleil ou d'un électron
autour du noyau de l'atome (dans le cadre du modèle de Bohr) le moment de cette force par
rapport au centre est évidemment nul, c'est-à-dire :
donc:
D'autre part, l'élément de surface décrit par le mouvement du rayon vaut (selon la
figure ci-dessus et la propriété du produit vectoriel):
donc:
Conséquences:
1. La vitesse aréolaire est constante, c'est-à-dire que les aires balayées en des temps égaux
sont égales. C'est la loi des aires de Kepler!
2. Le plan est fixe car . Donc la trajectoire, d'une planète dans une cadre
idéal par exemple, est plane.
MOMENT DE FORCE
779/2001
Sciences.ch 14/03/2005
Nous venons de voir voir que le "Moment de force" se définissait par la relation (variation
temporelle du moment cinétique) :
Il apparaît un grandeur :
qui est par définition le "bras de levier" de la force et dont l'emplacement est donné par
l'axe de rotation du corps du au moment de forc résultant.
Exemples:
Pour qu'un point matériel, soumis à des forces soit en équilibre, il faut ainsi que
la résultante de ces forces soit nulle (pas de translation) et que la résultante des moments soit
nul aussi (pas de rotation). Soit :
et
Remarque : par définition, un "couple" est défini comme un ensemble de deux forces de grandeur
égale mais de direction opposée, agissant suivant deux droites parallèles sur un même corps étendu.
La résultante des forces est bien évidemmet nulle, indique que le couple ne produit aucun effet de
translation. Mais la somme des moment étant non nulle, le corps subit une rotation tel que :
Maintenant que nous avons convaneblement défini ce qu'était une force et un moment de force, nous
pouvons aborder l'étude de la statique des forces de suite :
780/2001
Sciences.ch 14/03/2005
La statique des forces est un domaine difficile à généraliser. La plupart des ouvrages se
servent de nombreux exemples (comme les systèmes de poulies, les leviers, les équilibres, les
frottements, etc.) afin d'amener le lecteur à assimilier la méthode d'analyse qu'il faut pour
résoudre les problèmes relatifs à ce domaine de la mécanique classique. Loin d'être contre
cette méthode, nous n'avons pas souhaité nous restreindre ou nous étendre (suivant les points
de vue) à des exemples particuliers, mais à proposer une méthode d'analyse qui fonctionnerait
à coup sûr.
Définitions :
D1. La "statique des forces" est le domaine de la physique qui étudie l'effet de la résultante de
forces (ou moments de force) constantes au cours du temps, appliquées sur un corps ponctuel
ou étendu.
D2. Quand la somme vectorielle de toutes les forces et moments de force est nul, il n’y a
aucun mouvement. Nous parlons alors d’un "équilibre statique" (mais les forces existent tout
de même à l’intérieur du système) tel que les forces et moments de forces se compensent
mutuellement :
ou/et
Remarque : les relations précédentes, nous montrent bien que ce n'est pas parce qu'un système
est à l'équilibre statique qu'il n'est soumis à aucune force (la somme vectorielle des forces peut
s'annuler mais les forces sont non nulles).
Corollaires :
C1. Lors de l'analyse d'un système de statique des forces, il faut toujours (!!!) travailler avec
les composantes vectorielles des forces et moments de forces (de par la première loi de
Newton).
C2. Il faut donc s'imposer un repère par rapport auquel seront exprimé toutes les composantes
de forces :
- Dans le cas d'un corps ponctuel sur lequel est appliqué des forces, il faut assimiler l'origine
du repère à la position du point.
- Si la ligne de prolongement de toutes les forces sur un corps étendu sont toutes concurrentes
en un point donné, le système peut être considéré comme un corps ponctuel ramené à ce point
Démonstration : nous avons vu lors de l'étude du calcul vectoriel (voir le chapitre du même
nom dans la section d'algèbre) que la somme des vecteurs d'un même ensemble, mis bout à
bout (au niveau de la représentation imagée) ou additionnés algébriquement constitue ce que
nous appelons la "résultante" du système de forces ou de moments de force :
781/2001
Sciences.ch 14/03/2005
ou/et
Il est clair qu'un point matériel est donc par définition à l'état statique si la résultante des
forces concourants est nul. Ainsi, un corps ponctuel est au repos (vitesse constante nulle) si la
grandeur est nulle (voir les lois de Newton plus loin).
Cet condition ne suffit cependant pas pour un corps étendu (non ponctuel) : celui-ci peut ne
pas se déplacer (pas de mouvement par translation), mais tourner sur lui même par application
de forces en dehors de son centre de gravité (les forces sont alors des moments de forces
agissant sur des points du corps en question).
Recherchons maintenant, la position d'un point fictif , appelé le "centre des forces" tel
que le moment de la résultante appliquée au point soit égal au moment total . En
d'autres termes, doit être la solution de l'équation vectorielle :
S'il est possible de trouver un tel point , nous ne devons donc plus, en principe, calculer le
moment individuel de chaque force et en faire la somme vectorielle. Il suffit plutôt, de
déterminer la résultant et d'évaluer son moment résultant appliqué au point fictif .
782/2001
Sciences.ch 14/03/2005
C3. De par la troisième loi de Newton, tout corps solide rigide en équilibre stable, en contact
avec un ensemble de corps solides rigides en équilibre stable eux aussi, subissent tous une
force égale identique en chaque point de contact (identiquement répartie) mais opposée par
ces derniers (assimilable et passant par leur centre de gravité lorsque c'est un champ de
vecteurs isotrope et constant qui est à l'origine du contact). Ainsi :
- les repères des forces d'action/réaction doivent être placés sur les différents
point de contact lorsque ce sont une quantité dénombrable de forces qui en sont à
l'origine.
- les repères des forces d'action/réaction doivent être placés le centre de masse ou
de gravité si les forces à l'origine du contact (in extenso : de l'accélération) sont à
l'origine d'un champ vectoriel gravifique, respectivement
électrostique/magnétique.
BALISTIQUE
783/2001
Sciences.ch 14/03/2005
combinaison d'un déplacement régulier selon et d'un mouvement de chute avec vitesse
initiale selon . Ce qui correspond aux équations suivantes:
et
784/2001
Sciences.ch 14/03/2005
Nous remarquons pour la portée maximale que pour une vitesse initiale donnée, nous obtient
pour :
La courbe enveloppant toutes les paraboles, tracée pour une vitesse donnée dans toutes les
directions possibles, est encore une parabole, appelée "parabole sûreté". Sa rotation autour de
l'axe y engendre un paraboloïde qui circonscrit (contient) la région de l'espace seule
accessible aux projectiles.
Ainsi, il n'est pas trop difficile de trouver l'équation de cette parabole de sûreté:
MOUVEMENTS CIRCULAIRES
785/2001
Sciences.ch 14/03/2005
De tels mouvements décrivent la rotation d'un objet autour d'un axe. L'usage veut qu'on le
définisse par les données suivantes:
- la vitesse de rotation
Nous résumons ces trois indication par la donnée d'un vecteur "vitesse angulaire" instantaée:
Le sens de rotation est dit positif lorsque, le pouce dressé dans la direction de , nous
saisissons l'axe de la main droit et voit tourner l'objet dans le sens des quatre autres doigts.
La norme de la vitesse angulaire instantanée, représente l'angle parcouru par unité de temps,
par l'objet qui se déplace dans le plan perpendiculaire à :
Remarques:
1. L'usage veut que l'on note la vitesse angulaire par le même symbole que la pulsation des
mouvement périodiques. Il ne faut pas en conclure qu'une vitesse angulaire est une pulsation!
2. Dans le cas général du mouvement circulaire, la vitesse angulaire de l'objet étudié varie au
cours du temps:
En tournant d'un angle , un point de l'objet situé à une distance R de l'axe de rotation décrit
un arc de cercle de longueur:
786/2001
Sciences.ch 14/03/2005
Nous voyons alors que nous avons affaire à un produit vectoriel et tel que:
L'accélération du mouvement circulaire est formée dans le cas général, de deux termes, le
premier étant "l'accélération tangentielle" exprimant toujours la variation de la vitesse sur la
trajectoire et le deuxième l'accélération perpendiculaire le long du rayon appelée également
"accélération centripète" (centripète signifiant: "qui tend à rapprocher du centre").
Remarque: si nous exprimons le mouvement circulaire du point P à partir d'un système d'axes
situés dans le plan de la trajectoire, pour simplifier, alors, la position du point P est donnée
par:
Ce qui montre que le mouvement circulaire peut être considéré comme la superposition de
deux mouvements sinusoïdaux déphasés de .
787/2001
Sciences.ch 14/03/2005
Si l'on écrit:
ce qui est tout à fait envisageable pour une trajectoire imparfaitement circulaire et que l'on
regarde les différentes caractéristiques paramétriques:
en faisant varier le déphasage et le rapport nous obtienons des courbes que nous
appelons des "figures de Lissajous" :
LOIS DE KEPLER
Au début du 15ème siècle les savants de l'époque étaient partagés à propos du mouvement des
planètes (pour plus de précisions, voir le chapitre d'astrophysique). Tournent-elles autour du
Soleil ou non? Tycho Brahe (1546-1601), un astronome danois, décida de résoudre la
question en mesurant avec soin les positions successives des planètes connues à l'époque. En
se détournant ainsi de querelles philosophiques stériles pour se livrer à une observation, une
expérimentation soigneuse, il fit exemple d'un esprit résolument moderne. Son travail, d'une
importance considérable, s'étendit sur plusieurs années. Après sa mort, Kepler
788/2001
Sciences.ch 14/03/2005
(historiquement avant Newton), reprenant ses résultats, mit en évidence 3 lois simples
caractérisant le mouvement des planètes, à savoir:
PREMIÈRE LOI
Les orbites sont des coniques (ellipses) dont le Soleil occupe l'un des foyers. Au fait, ce n'est
pas vraiment un "loi" puisque dans le chapitre traitant de l'astrophique (sur le site) vous en
trouverez la démonstration tel que:
DEUXIÈME LOI
Le segment qui joint une planète au Soleil balaie des aires égales en des temps égaux (Loi des
aires):
Nous constatons alors que la vitesse de la planète est variable; elle est plus grande à la
périhélie qu'à l'aphélie. Ceci se vérifie pour la Terre par exemple. En effet cette dernière est
plus proche du Soleil en hiver (pour l'hémisphère Nord) et elle a alors une vitesse sur
trajectoire un peu plus élevée qu'en été; le temps de parcours est donc plus faible (l'hiver
compte moins de jours que les autres saisons).
TROISIÈME LOI
Les carrés des périodes de révolution sont proportionnels aux cubes des demi-grands
axes des orbites:
Kepler n'a pas d'emblée publié ses trois lois dans cette provocante simplicité. Leur ordre
actuel n'est d'ailleurs pas celui de leur énonciation… Elles sont en réalité à dénicher au milieu
d'un foisonnement de spéculations physiques et de réflexions sur l'harmonie du monde.
Cependant, comme nous l'avons vu lors de la définition du moment cinétique, cette loi est
aussi démontrable !!
Pour vérifier l'exactitude de son hypothèse, Newton (longtemps après) retrouva les lois de
Kepler à partir de la loi de la gravitation, donnant ainsi l'explication du mouvement général
des planètes.
789/2001
Sciences.ch 14/03/2005
Newton considéra pour déterminer la loi de gravitation une planète théorique, gravitant autour
du Soleil sur une orbite circulaire à vitesse constante . Pendant une orbite complète, la
planète parcourt une distance égale à la circonférence du cercle de rayon , soit , en un
temps (sa période) égal à cette distance divisée par sa vitesse, soit:
Newton s'appuie ensuite sur la troisième loi de Kepler avec toujours l'hypothèse d'une orbite
circulaire.
mais puisque :
alors
en enchaînant :
et
il vient:
Par un autre calcul nous avons déjà établi l'expression de la force centrifuge:
Il existerait donc une force opposée à la force centrifuge qui maintient la cohésion orbitale et
790/2001
Sciences.ch 14/03/2005
qui s'écrit:
Il est trivial que la masse centrale du système orbital doit intervenir d'une façon ou d'une
autre dans cette constante. Si la masse du corps secondaire intervient de façon proportionnelle
dans la force centrifuge, l'envie est grande de faire de même avec la masse du corps central.
Donc:
maintenant a priori il n'y aurait plus de paramètres à prendre en compte. La constante restante
est là pour satisfaire à l'analyse dimensionnelle de telle façon que l'on ait des "Newtons" (nom
donné à l'unité de force) des deux côtés de l'égalité.
Les scientifiques ont déterminé avec grande précision cette constante notée qui a priori
semble universelle (ce que j'essaierai une fois que j'aurai connaissance des outils nécessaire de
démontrer) et qui a comme valeur:
Evidemment il ne s'agit nullement d'une démonstration car nous nous sommes basés sur les
observations expérimentales de Kepler. Mais j'aurai ma revanche là-dessus.
nous pouvons retrouver toutes les lois de Newton. D'ailleurs nous l'avons déjà fait pour la
deuxième et troisième puisque ce sont ces dernières que nous avons utilisé pour obtenir la
relation de la force gravitationnelle.
791/2001
Sciences.ch 14/03/2005
où est le potentiel gravitationnel et qui varie en raison inverse de la distance relative des
corps (ceci confirmant ce que nous avions démontré lors de notre étude du théorème de
Noether dans le chapitre traitant des principes de la physique). Ecriture qui implique bien
évidemment la relation suivante:
Si nous exprimons cette équation en fonction d'un potentiel gravitationnel , nous obtenons :
il vient :
792/2001
Sciences.ch 14/03/2005
à l'intérieur de la Terre en notant la distance par rapport au centre par la lettre et la masse
centrale par ' , nous avons :
TRAVAIL ET ÉNERGIE
Si un point de masse subit un déplacement élémentaire sous l'effet d'une force , cette
force effectue un travail élémentaire valant par définition:
793/2001
Sciences.ch 14/03/2005
Si cette masse est déplacée d'un endroit à un endroi , le travail total est:
Remarques:
R1. Si est positif le travail est dit "moteur". Dans le cas contraire il est dit
"résistant" (exemple: le freinage).
Ce résultat montre que le travail ne dépend alors que des positions initiale et finale et pas du
chemin parcouru. Le travail de la pesanteur est un cas particulier de ce type.
ÉNERGIE CINÉTIQUE
Lorsqu'un corps se déplace sous l'action d'une force résultante quelconque, le travail de
cette force d'accélération sur un chemin quelconque , est égal à la variation d'énergie
cinétique du corps:
est appelée "l'énergie cinétique" et elle se mesure en Joules (ou d'autres unités dérivées
exotiques dont les phyisiciens théoriciens abusent parfois un petit peu trop...)
794/2001
Sciences.ch 14/03/2005
L'équation :
MOMENT D'INERTIE
Pour un solide rigide tournant autour d'un axe à la vitesse angulaire . L'énergie cinétique
élémentaire d'un point quelconque de masse , situé hors de l'axe, vaut:
Remarque: Dans un solide, la répartition de la matière autour d'un axe sera évidemment
différente selon l'axe choisi. Le moment d'inertie correspondant sera aussi différent. Il est
donc indispensable de préciser l'axe par rapport auquel nous souhaitons déterminer ce
moment d'inerte. Nous observons dans la pratique ques les ingénieurs placent souvent l'axe de
façon à ce qu'il passe par le centre de masse. Dans les tables, nous trouvons fréquemment les
expressions des moments d'inerties de formes courantes (selon un axe donné) telles que le
cylindre, le cône, la sphère, la barre, le tube (voir les chapitre traitant des formes géométriques
dans la section de géométrie).
795/2001
Sciences.ch 14/03/2005
d'où:
c'est l'expression donnant le moment cinétique d'un corps tournant sur lui-même (sur un de
ses axes possibles de rotation).
Etant donné que nous avons démontré lors de notre étude du moment cinétique que:
Il vient (dans l'hypothèse que la masse et la géométrie du solide reste constante) que:
Si nous étudions un système dans lequel le moment cinétique est conservatif, il va de soi que:
Une autre expérience curieuse (mais mathématiquement correcte) consiste à se poser sur un
plateau tournant avec une roue en rotation tenue à l'horizontale (le moment cinétique vertical
est donc nul) et de mettre celle-ci ensuite à la verticale. Comme le moment cinétique vertical
doit rester nul, pour contrecarrer cela, le plateau sur lequel est posé l'expérimentateur se
mettra à tourner dans le sens inverse de rotation de la roue.
Les déplacement de masses importantes à la surface de la Terre (icebergs, crues des fleuves,
plaques tectoniques, etc.) provoquement des variations du moment d'inertie de la Terre. Il
s'ensuit des fluctuations de la vitesse angulaire donc une imperfection de l'étalon
796/2001
Sciences.ch 14/03/2005
Revenons maintenant au méthodes de calcul des moments d'inertie. L'énergie cinétique d'un
corps étant la somme de l'énergie cinétique de chaque élément de ce corps, nous avons :
Dans le cadre d'un corps solide rigide en rotation autour d'un axe, nous avons :
Ainsi, pour un corps composé d'un ensemble de corps de géométrie différentes, le moment
d'inertie total est la somme des moments d'inertie par rapport à l'axe de rotation tel que :
Lorsque nous calculons le moment d'inertie d'un corps par rapport à un axe donné, il peut
être intéressant de savoir qu'elle est la distance à l'axe où nous pouvons placer fictivement
toute la masse de ce corps pour avoir le même moment d'inertie. Par définition, cette distance
notée et appelée le "rayon de giration" est trivialement donnée par :
où est le moment d'inertie connu du corps de masse par rapport à une axe .
Par définition, le "moment d'inertie polaire" (ou également "moment d'inertie quadratique")
est le moment d'inertie défini par rapport à un point (le pôle) et non plus par rapport à un axe
et noté :
Cette grandeur n'intervient en fait que pour les rotations libres et n'a d'intérêt, pour les
rotations autour d'un axe fixe, que parce qu'elle facilite quelquefois le calcul des moments
d'inertie axiaux en vertu de la relation suivante (en coordonnées cartésiennes) :
Démonstration :
Lemme 1 : Le moment d'inertie par rapport à un plan est donné trivialement par :
797/2001
Sciences.ch 14/03/2005
798/2001
Sciences.ch 14/03/2005
Un exemple est donné avec le boule (sphère pleine) dans le chapitre traitant des formes
géométriques dans la section de géométrie.
Supposons maintenant connaître le moment d'inertie d'un corps solide rigide quelconque
par rapport à un axe (cet axe n'étant pas nécessairement uniquement assimilé à l'axe
commun) passant par le centre de masse . Calculons ensuite le moment d'inertie , par
rapport à un autre axe , parallèle à et distant de , et faisons apparaître la liaison existant
entre ces deux moment d'inertie différents :
et
Le terme :
est nul car si le moment d'inertie est calculé par rapport au centre de masse comme nous
l'avons imposé dès le début, alors :
Comme nous le verrons dans le chapitre des formes géométriques dans la section de
géométrie du site, il devient alors facile de pouvoir calculer le moment d'inertie d'un triangle
799/2001
Sciences.ch 14/03/2005
équilatéral en connaissant celui d'un plaque carrée et en déplaçant l'axe d'inertie au point où se
situe le centre de gravité du triangle (soit au tiers de la médiane située entre le centre du
rectangle et un des sommets du rectangle).
Comme il existe autant de moment d'inertie que d'axe de rotation et que ces derniers sont
souvent dans les cas d'études assimilés aux axes principaux d'inertie (axe assimilés aux axes
de révolutions ou aux plans de symétrie – voir plus loin), il peut être utile d'introduire un être
mathématique utile dans le cadre de représentation des moments d'inertie qui n'est autre que la
"matrice d'inertie" ou appelé encore (formulation plus moderne) "tenseur d'inertie".
Dès lors :
D'après les propriétés du produit mixte (voir chapitre de calcul vectoriel) et du produit
scalaire :
et
nous avons :
et donc :
Comme est un vecteur de direction constante quelque soit le point d'intégration, nous
pouvons le sortir de l'intégrale tel que :
Nous pouvons vérifier que si nous remplaçons par , nous obtiendrons un résultat
de par la propriété de linéarité du produit vectoriel (voir le chapitre de calcul
vectoriel). Ainsi, l'application qui à associe est donc une application linéaire qui peut
être représentée, dans une base donne, par une matrice :
800/2001
Sciences.ch 14/03/2005
La matrice est le "tenseur d'inertie" du système par rapport au point , dans la base
.
Le moment d'inertie d'un système par rapport à un axe quelconque de vecteur unitaire
est donné par :
Le problème est donc maintenant de pouvoir calculer les éléments du tenseur , pour une
base donnée. Soit un repère tel que . Nous posons :
et
En utilisant le fait qu'un produit vectoriel puisse être représente par une matrice anti-
symétrique (vérifiez c'est facile) :
nous avons :
et donc :
801/2001
Sciences.ch 14/03/2005
puisque .
Or, si coïncide avec le centre de masse , alors selon la définition du centre de masse :
et de même :
802/2001
Sciences.ch 14/03/2005
ainsi que
avec .
Nous retombons sur le théorème d'Huyghens classique puisque n'est d'autre que la
distance au carré entre l'axe et et de même pour qui est la distance au carré
entre et et qui est la distance entre et .
Le tenseur d'inertie étant réel et symétrique, nous avons dans le chapitre d'algèbre linéaire
(théorème spectral) qu'il est toujours possible de trouver trois directions perpendiculaires de
vecteurs telles que le tenseur (matrice) symétrique soit diagonalisable :
Le trièdre formée par les vecteurs est appelé "trièdre principal d'inertie" et ses axes
sont appelés "axes principaux d'inertie". Dans ce repère prend le nom de "tenseur
principal d'inertie". Si de plus est assimilé à , nous parlons de "tenseur central d'inertie".
En fait, pour trouver les moments d'inertie relativement aux axes principaux il n'est
pratiquement jamais nécessaire de diagonaliser le tenseur d'inertie, car il suffit souvent de se
laisser guider par la symétrie du système. Nous allons voir avec les théorèmes suivants que s'il
existe des axes ou des plans de symétrie pour la distribution de masse, les axes d'inertie sont
faciles à trouver. De plus, le système est en général suffisamment simple (ou décomposable
en éléments suffisamment simples…) pour que ces axes soient évident.
803/2001
Sciences.ch 14/03/2005
Démonstration : choisissons un repère dans le plan par rapport auquel le système a une
distribution de masse symétrique et un axe perpendiculaire à ce plan. Pour calculer
ou , groupons les points par deux, symétriques par rapport à . c'est-à-dire
tels que . Nous aurons alors et de même , c'est-
à-dire, puis (symétrie matérielle!) que toutes les contributions de paires de
points symétriques sont nulles, ce qui implique : , c'est-à-dire que l'axe des est
direction principale d'inertie.
Deuxième théorème : choisissons comme axe l'axe de symétrie. De même que ci-dessous,
nous avons car si nous groups les points par paire et symétrique
par rapport à , nous avons : mais donc toujours
et de même
Remarque : lorsque nous avons déterminé deux axes principaux d'inertie grâce aux symétries
précédentes, les troisième est tout simplement celui qu'il faut pour compléter un trièdre
orthogonal.
Troisième théorème :
Si un système admet un axe de révolution pour sa distribution de masse, alors tout trièdre
orthogonal incluant l'axe de révolution, est trièdre principal d'inertie. Le système matériel est
alors dit "cylindrique" et dans la trièdre principal d'inertie son tenseur prend la forme (en
supposant que l'axe de révolution est le 3ème axe du trièdre) :
Démonstration : si est un axe de révolution, tout plan comprenant est plan de symétrie
et tout droite perpendiculaire à est donc axe principal d'inertie (premier théorème). De
plus, toutes ces droites perpendiculaires à sont équivalentes.
et nous disons alors que le système est "sphérique" (ou à "symétrie sphérique").
Remarque : le choix systématique d'un trièdre principal d'inertie permet de ramener le tenseur
d'inertie de 6 à 3 composantes, calculées une fois pour tout. Cependant, ce choix implique
l'utilisation d'une base qui sera le plus souvent en mouvement par rapport au référentiel
utilisé, ce qui pourra poser des problèmes de dérivations par rapport au temps des vecteurs de
la base. Nous pouvons alors, si c'est plus faciles, obtenir les composantes du tenseur de
symétrie dans une base quelconque à l'aide d'une matrice de passage entre la base principale
804/2001
Sciences.ch 14/03/2005
Lorsque les moments d'inertie d'un solide sont connus dans les directions des axes principaux
d'inertie, nous pouvons facilement déterminer le moment d'inertie par rapport à n'importe
quel autre axe passant par le centre de gravité en utilisant que ce nous nommes un "ellipsoïde
d'inertie".
Démonstration :
Soient trois axes, centrés sur , parallèles aux axes principaux. Dans leurs directions, portons
des longueurs proportionnelles à :
Dans cet espace des phases des moments d'inertie, tout point désigne un moment
d'inertie tel que :
Pour déterminer en fonction des , sans devoir calculer , nous identifions les
cosinus directeurs (voir chapitre de calcul vectoriel) de l'axe de rotation à ceux de la droite
.
805/2001
Sciences.ch 14/03/2005
Soit :
Nous pouvons maintenant calculer les conditions de normalisation de cette relation. Ainsi, si
et , nous avons :
Puisque :
et
Donc finalement :
Ainsi, en connaissant les moment d'inertie d'un corps par rapport à ses axes principaux
nous pouvons connaître son moment d'inertie par rapport à n'importe quel axe ayant
un angle par rapport aux axes principaux.
806/2001
Sciences.ch 14/03/2005
Si le travail de la force entre les points et ne dépend pas du chemin suivi, nous
disons que cette force dérive d'une énergie potentielle ou bien que le champ de force est
"conservatif" (contre-exemple: dans un mouvement avec frottement le travail dépend
nécessairement de la voie choisie). Cette indépendance par rapport au chemin suivi implique
que:
Soit deux points et de l'espace. Il y a plusieurs chemins possibles pour joindre ces deux
points. Si l'on en choisit deux au hasard et que la champ est conservatif nous avons :
ou encre que le travail total sur un chemin fermé (aller et retour) est nul. Nous notons cela
(voir chapitre de calcul différentiel et intégral dans la section d'algèbre du site) :
Le travail en jeu est donc une fonction du lieu seul ( ) c'est-à-dire dépendant uniquement du
point de départ et du point d'arrivée. En effet, si le travail dépendait du chemin, il serait
possible de choisir la voie la plus généreuse quand le système fournit du travail et la voie la
plus économique quand nous la ramenons à l'état initial. Ce serait donc un mouvement
perpétuel et le principe de conservation de l'énergie l'interdit (pour plus de détails à ce sujet
voir la section de mécanique thermique).
Attachons alors à chaque point du champ de force une valeur de la fonction (un
nombre réel) correspondant au travail effectué par le champ de force lorsque le mobile passe
d'un point à 0, 0 étant un point de référence choisi arbitrairement. Donc par définition:
avec
807/2001
Sciences.ch 14/03/2005
En généralisant cette définition, nous dirons que le travail effectué par une force conservative
lorsque le mobile passe de à est égal à la diminution d'énergie potentielle entre et
:
Remarque : il existe aussi rappelons-le une relation entre l'énergie est le gradient de la force
donnée qui découle simplement de la définition du travail :
808/2001
Sciences.ch 14/03/2005
, ,
ce qui montre bien que le travail total sur un chemin fermé est nul:
qui est l'énergie potentielle gravifique, étant l'altitude de la masse . Nous notons plus
simplement la plupart du temps cette relation sous la forme :
809/2001
Sciences.ch 14/03/2005
Remarque : Le choix de zéro de l'énergie potentielle est souvent arbitraire; nous le fixons par
commodité. Seules les différences d'énergie potentielle sont généralement intéressantes
comme nous allons le voir de suite.
La relation précédent est au fait une expression utile à proximité de la surface terrestre. A
distance où est le rayon de la terre, la force de gravitation faiblit et l'approximation
n'est plus valable (si aussi, d'ailleurs…).
Alors :
810/2001
Sciences.ch 14/03/2005
Nous allons calculer ici l'énergie potentielle d'une sphère de matière. Cet exercice de style va
nous être très utile en astrophysique pour déterminer la température interne des étoiles
L'expression d'une énergie potentielle d'un système de deux masses mises en présence est
donnée par:
Soit une sphère de masse , de densité massique et de rayon et entourée d'un anneau
sphérique de rayon intérieur , de même densité massique et d'épaisseur
811/2001
Sciences.ch 14/03/2005
Soit finalement:
Ce qui entraîne:
somme des deux formes d'énergie en chaque point ou encore, les lieux et . étant
quelconques, en écrivant l'équation sous une forme générale:
Remarque : nous nommons souvent l'énergie totale d'un système : "l'hamiltonien du système".
En l'absence de frottement s'il s'agit d'énergie mécanique, nous écrivons aussi la variation tel
que :
Une augmentation d'énergie cinétique entraîne donc une diminution d'énergie potentielle (et
réciproquement) puisque la somme des deux reste constante.
812/2001
Sciences.ch 14/03/2005
D'autre part, étant une fonction scalaire dépendant des coordonnées d'espace formons sa
différentielle totale:
d'où l'expression affirmant que la force dérive d'une énergie potentielle si le travail en jeu est
indépendant du chemin suivi. Si nous exprimons la force en termes de vecteurs-unités,
nous obtenons :
En définitive, l'affirmation que la force dérive d'une énergie potentielle peut se résumer
ainsi:
Un mobile, lors d'une interaction avec un autre point matériel, peut transmettre tout ou partie
de son mouvement (énergie cinétique ou/et potentielle). C'est le cas lors d'un choc, par
exemple. La grandeur ainsi échangée est la quantité de mouvement . Elle vaut par
définition (nous l'avons déjà vu lorsque nous avons parlé de la deuxième loi de Newton):
813/2001
Sciences.ch 14/03/2005
La quantité est parfois appelée "impulsion, et l'équation précédente porte quelque fois
L'impulsion fournie par une force entre les instants et est égale à la variation de la
quantité de mouvement durant cet intervalle de temps.
car
et donc:
Revenons maintenant un petit peu à notre principe de moindre action dont nous avons parlé au
tout début de cette section:
Prenons le cas d’un objet lancé en l’air et repérons deux points de sa trajectoire en deux
instants quelconques. Une infinité de courbes passent entre ces deux points et pourtant la
nature n’en choisit qu’une seule. Qu’est-ce qui distingue cette courbe - la trajectoire physique
- de toutes les autres? A cette question nous pourrions, très justement, répondre que cette
courbe se distingue des autres par le fait qu’elle est solution de l’équation différentielle de la
trajectoire ... avec les conditions initiales appropriées. Mais dans le cas où nous ignorons les
conditions initiales ou lorsque le problème ne peut être ramené à une équation différentielle,
par quel moyen pouvons-nous alors distinguer la trajectoire physique de tous les chemins
814/2001
Sciences.ch 14/03/2005
possibles?
Le principe de moindre action s'exprime dans ce contexte par un minimum de vitesse pour un
minimum de chemin parcouru.
La trajectoire physique entre deux points et aux instants et est celle pour laquelle
l’action est minimale.
Nous le voyons, l’action prend une forme étonnamment simple et s’exprime directement en
fonction de l’énergie cinétique. Quelques années plus tard, à partir d’une intuition semblable à
celle de Maupertuis, Euler parvint à un énoncé très similaire de l’action mais en partant du
constat que les corps tendent à adopter un état où l’énergie potentielle est minimale. L’action
d’Euler s’exprimait en fonction de l’énergie potentielle au lieu de l’énergie cinétique. Qui de
Maupertuis ou d’Euler avait tort et raison?
En fait, leurs énoncés respectifs de l’action étaient équivalents. Nous savons que dans un
champ conservatif, si nous appelons l’énergie potentielle alors l’énergie totale vaut
+ et cette énergie est une constante. Nous en tirons que = – et que donc
815/2001
Sciences.ch 14/03/2005
. D’où:
Cette relation est vraie quel que soit le chemin d’énergie totale initiale . Nous en concluons
que la valeur de la constante ne permet pas de discriminer les différentes trajectoires et
peut donc être éliminée de la formulation de l’action. L’action de Maupertuis peut alors se
réduire à une nouvelle grandeur notée :
Cette nouvelle formulation de l’action fut donnée par Lagrange en 1788. s’appelle
"l’action lagrangienne" ou "hamiltonienne" et la fonction :
porte le nom de "Lagrangien mécanique". Ainsi formulé, le principe de moindre action devint
l’un des outils les plus puissants de la mécanique.
Considérons le cas très simple d’un corps de masse m se mouvant sur une seule dimension
(que nous représenterons par un axe ) d’un point d’abscisse à l’instant à un point de
coordonnée à l’instant . Supposons qu’il est soumis à un potentiel qui ne varie pas
avec le temps c'est-à-dire . L’action de ce corps sur un chemin quelconque
menant de à est alors:
Soit le chemin physique et l’action sur ce chemin. Notons par les valeurs de la
position sur le chemin physique. Considérons maintenant un chemin très proche de
tel que les positions le long de aient les valeurs que nous écrirons, pour
alléger les écritures .
816/2001
Sciences.ch 14/03/2005
Comme nous ne considérons que les variations du premier ordre, le dernier terme peut être
négligé, ce qui donne pour l’action sur le chemin :
et ainsi:
Le premier terme dans l’intégrale peut s’intégrer par parties comme suit:
Or, tous les chemins partent de à l’instant et arrivent à à l’instant . Ceci implique
qu’en et la variation est nulle ce que nous écrivons . Donc le
premier terme de l’intégration par parties est nul. La variation de l’action prend alors la
forme:
817/2001
Sciences.ch 14/03/2005
Cette intégrale doit être nulle pour tous les chemins très proches du chemin physique ,
donc quelle que soit la valeur de . Pour qu’une telle condition soit remplie il faut que le
terme devant soit nul, c'est-à-dire:
Or nous connaissons au fait cette équation: le premier terme n’est rien d’autre que où
est l’accélération du corps, et le second - l’opposé du gradient du potentiel - est l'intensité
de la force en un point donné. Celle-ci se réduit donc à l’équation:
qui n’est autre que la seconde loi de Newton généralisée! Le principe de moindre action
contient donc implicitement la mécanique newtonienne. Ainsi, il est possible de reconstruire
toute la mécanique de Newton avec le seul principe de moindre action!!!
Cet échafaudage de calculs peut paraître bien compliqué pour aboutir à un résultat que nous
connaissions déjà mais tout l’intérêt du principe de moindre action réside dans le fait qu’il
permet de tirer des lois fondamentales à partir de la seule connaissance du lagrangien d’un
système.
Les théories les plus récentes comme la théorie quantique des champs, les théories de jauge
ou la théorie des supercordes ont toutes pour point de départ l’expression de l’action du
système. Les physiciens en dégagent ensuite des lois fondamentales qui régissent le
comportement des particules élémentaires.
PUISSANCE
Définition : la puissance est le taux instantané de variation du travail (énergie sous forme
quelconque). Nous avons donc la "puissance instantanée" donnée par :
Si le travail est fourni de façon régulière, constant, nous avons alors la "puissance moyenne",
constante :
Remarques :
R1. L'unité de la puissance est le "Watt" et se note mais en technique, certains utilisent
encore souvent le "cheval" défini comme suite :
818/2001
Sciences.ch 14/03/2005
Le travail élémentaire effectué par la force faisant tourner le solide (un cylindre dans
la cea présenté de suite) autour de son axe d'une angle vaut :
RENDEMENT
A cause des frottements, la puissance restituée par une machine (dit "puissance utile") est
toujours inférieure à la puissance absorbée. Nous tenons compte de cet effet au moyen du
rendement défini par :
819/2001
Sciences.ch 14/03/2005
Le dernier terme est la contribution due à la rotation du référentiel mobile. Il s'agit maintenant
d'exprimer la valeur de cette contribution en envisageant des rotations d'angle
autour de chacun des axes, successivement:
820/2001
Sciences.ch 14/03/2005
Nous obtenons ainsi les vecteurs élémentaires figurant les déplacements des
extrémités des vecteurs-unités . Nous les introduisons dans l'expression ci-dessous qui
devient, après réarrangement des termes:
par définition du produit vectoriel. La vitesse absolue du point s'exprime donc ainsi:
nous constatons que dans le cas particulier où le référentiel mobile ne subit qu'une translation
, nous trouvons l'équation caractéristique de la transformation de Galilée.
821/2001
Sciences.ch 14/03/2005
et nous avons :
Donc:
Finalement:
ainsi:
822/2001
Sciences.ch 14/03/2005
Le terme:
La loi de Newton doit comporter tous les termes contenus dans l'équation générale
ci-dessus. Pour un observateur situé dans le système mobile, cette loi s'écrit:
Exemple :
Etant donné que pratiquement toutes nos observations sont faites sur Terre, c'est-à-dire dans
un référentiel mobile dans l'Univers, la force de Coriolis peut y être mise en évidence.
L'étude du mouvement d'un corps par rapport à la Terre est l'une des applications les plus
intéressantes de l'équation démontrée précédemment. La Terre a une vitesse angulaire
(supposée constante!) dont la direction est celle de l'axe de rotation de la Terre. Appelons
l'accélération de la pesanteur mesurée en un point à la surface de la Terre si celle-ci ne
tournait pas. correspond alors à . En tirant l'accélération d'entraînement et relative nous
obtenons l'accélération mesurée par un observateur en mouvement avec la Terre:
823/2001
Sciences.ch 14/03/2005
Nous considérons d'abord le cas d'un corps initialement au repos, ou se déplaçant très
lentement de sorte que le terme de Coriolis est nul ou négligeable comparé au dernier terme.
L'accélération que nous mesurons dans ce cas est appelée "accélération effective" de la
pesanteur, et nous la désigne par .
Par suite:
En supposant que la Terre est une sphère (en fait sa forme s'en écarte légèrement) et qu'il n'y a
pas d'anomalies locales, nous pouvons estimer que est dirigé vers le centre de la Terre. Le
deuxième terme étant l'accélération centrifuge elle est dirigée vers l'extérieur.
où r est le rayon de la Terre. L'accélération centrifuge décroît de l'équateur aux pôles car le
rayon de la Terre n'est pas constante (la Terre est aplatie au pôles). Cette variation de
l'accélération est toujours très petite quand nous la comparons avec la pesanteur
mais elle explique cependant la plupart des variations observées de la
valeur de la pesanteur avec la latitude.
Considérons ensuite le terme de Coriolis. Dans le cas de la chute d'un corps, la vitesse est
dirigée vers le bas. D'autre part, comme se trouve le long de l'axe de la Terre , est
dirigé vers l'Ouest. Le terme de Coriolis est donc dirigé vers l'Est; le corps qui
tombe sera dévié dans cette direction.
Pour un corps tombant dans un plan parallèle et tangent à la surface de la Terre, nous avons :
824/2001
Sciences.ch 14/03/2005
C'est exactement ce phénomène que l'on observe dans le cas des cyclones (nous y reviendrons
plus en détail dans notre étude de la météorologie dans le chapitre de mécanique des fluides).
Une zone atmosphérique dépressionnaire (de faible pression relative) donnerait des courants
atmosphériques (vents) convergents vers la dépression si la Terre ne tournait pas autour de
son axe.
La force de Coriolis dure à la rotation de la Terre dévie donc les vents Nord-Sud en direction
de l'Ouest et les vents Sud-Nord vers l'Est pour un observateur se situant au Pôle Nord. Nous
observons dès lors la formation de cyclones tournants de le sens contraires des aiguilles d'une
montre dans l'hémisphère Nord et inversement dans l'hémisphère Sud (à cause de la direction
du vecteur dans cette partie de l'hémisphère).
Comme second exemple, considérons les oscillations d'un pendule. Pour des oscillation de
faible amplitude, nous pouvons supposer que le mouvement du pendule se fait selon une
trajectoire horizontale. Si l'on fait osciller le pendule initialement dans la direction Nord-Sud,
le force de Coriolis va dévier le mouvement du pendule vers la droite pour un observateur
situé au Pôle Nord. En d'autres termes, le pendule tourne dans le sens des aiguilles d'une
montre dans l'hémisphère Nord et dans le sens contraire dans l'hémisphère Sud. Cet effet
observable est nul dans à l'équateur (parallélisme parfait entre et ) et maximale aux
Pôles.
825/2001
Sciences.ch 14/03/2005
Cet effet fut démontré de façon spectaculaire par le physicien français Jean Léon Foucault,
quand en 1851 il suspendit un pendule de 67 mètres de long à l'intérieur du Dôme des
Invalides. A chaque oscillation, le pendule faisait tomber du sable sur un cercle, ce qui
démontrait expérimentalement que son plan d'oscillation de par heure. L'expérience de
Foucault est une preuve frappante de la rotation de la Terre. Même si la Terre était toujours
couverte de nuages, cette expérience aurait montré aux physiciens que la Terre tournait.
Comme troisième exemple parlons des tourbillons que l'on peut observer dans la baignoire ou
le lavabo. Ce n'est qu'une légende que ce dernier tourne différemment en fonction des
hémisphères. Car la vitesse et la masse mises en jeu sont beaucoup trop faible pour êtres
observables. Au fait, le sens de rotation est dû aux imperfections (aspérités) du siphon. Tant
pis pour la légende :-P
THÉORÈMES DE KÖNIG
Les théorèmes de König donnent eux les moments cinétiques et l'énergie cinétique totale d'un
système dynamique par rapport à un référentiel galiléen et barycentrique
Exprimons le moment cinétique d'un élément du corps solide par rapport à l'origine du
référentiel galiléen (noté : par la suite) :
Exprimons le moment cinétique dans par rapport à son centre de masse (noté :
):
826/2001
Sciences.ch 14/03/2005
Étudions maintenant la valeur que prend chacun des quatre termes de la relation précédente.
Nous savons que par la définition du centre de masse que (dans un cadre non relativiste) :
d'où :
et également :
Finalement, il vient :
Donc finalement :
Ce théorème qui se rapporte à un point fixe permet l’application plus aisée du théorème du
moment cinétique.
Utilisons pour démontrer ce théorème l'énergie cinétique d’un corps de masse (l'exemple
étant toujours facilement extensible un système dynamique discret ou continu de matière).
Exprimons le moment cinétique d'un élément du corps solide par rapport à l'origine du
référentiel galiléen (noté : par la suite) :
827/2001
Sciences.ch 14/03/2005
Exprimons l'énergie cinétique dans par rapport à son centre de masse (noté :
):
et donc :
et comme pour le moment cinétique, de par la définition du centre de masse, nous avons :
MOUVEMENTS OSCILLATOIRES
Le mouvement oscillatoire est le mouvement d'un corps qui va et vient de part et d'autre de sa
position d'équilibre. Il existe un quantité incroyable de phénomènes physique de ce genre.
Nous allons traiter dans cette section les grands classiques à partir desquels les
développements sur des phénomènes plus complexes s'inspirent.
Nous étudierons dans l'ordre les pendules des plus simples aux plus complexes et utiliserons
souvent des résultats antérieurs pour en déterminer de nouveaux.
Nous retreindrons notre étude des mouvements oscillatoires aux pendules. Les autres
viendront au fur et à mesure dans leurs chapitres respectifs.
Il existe neufs pendules très connus qui sont les suivants (ordre dans lequel nous les
étudierons): pendule de Newton, pendule simple, pendule physique, pendule élastique,
828/2001
Sciences.ch 14/03/2005
PENDULE DE NEWTON
Nous n'allons pas trop nous étendre à décrire le pendule de newton. Une photo suffira:
Si vous lancez une bille, à l'extrémité une seule et unique bille se déplacera. Cela semble
logique et cohérent d'après la conservation de la quantité de mouvement qui découle de la
conservation de l'énergie comme nous l'avons déjà vu.
Un peu plus curieux, lorsque vous lancez initialement deux billes, ce sont deux billes qui se
déplacement à l'autre extrémité!
La démonstration est simple et le fonctionnement se base sur une condition très simple que
nous allons déterminer pour le cas particulier de deux billes (c'est toujours le même principe
pour un nombre de billes supérieur).
Soit les quantités de mouvement des deux billes initiales et les deux billes se
situant à l'autre extrémité. Nous avons donc:
Ensuite après division de la deuxième relation ci-dessus par la première, nous déduisons
l'expression des vitesses après le choc:
829/2001
Sciences.ch 14/03/2005
Hypothèse: supposons maintenant qu'en prenant une seule des billes ( ), il y en ait deux
qui partent à l'autre extrémité tel que::
Prenons le cas où toutes les billes du pendule de Newton ont la même masse (cas
correspondant à celui que l'on trouve dans le commerce). Alors:
Nous voyons que notre hypothèse initiale impossible: si à masses égales, une seule bille est
lancée alors, à l'autre extrémité, une seule bille partira.
Par contre, si nous lançons deux billes dans un pendule de Newton composé de masses
identiques nous avons après simplification des équations:
PENDULE SIMPLE
Soit, la période de temps nécessaire pour qu'un pendule simple (voir figure ci-dessous)
parcoure un cycle complet et que l'on peut écrire:
830/2001
Sciences.ch 14/03/2005
Si nous dérivons cette expression par rapport au temps... Nous obtenons alors:
Si nous revenons à:
Si l'angle est petit, nous pouvons remplacer avec l'aide de la série de Taylor et sans erreur
trop grave, par le premier terme de son développement en série:
831/2001
Sciences.ch 14/03/2005
d'où:
Si:
PENDULE PHYSIQUE
Nous appelons "pendule physique" un solide quelconque pouvant osciller librement dans la
pesanteur, autour d'un axe , avec une petite amplitude ( ).
où est le moment de rappel et le moment d'inertie du pendule par rapport à son axe
d'appui .
En faisant une analyse des forces sur notre pendule nous obtenons une autre relation pour :
832/2001
Sciences.ch 14/03/2005
Nous avons vu dans les mouvements harmoniques oscillants que nous obtenions la position
angulaire d'une masse par la relation:
d'où:
833/2001
Sciences.ch 14/03/2005
d'où:
Soit la position de l'axe de rotation mesurée par rapport à une origine quelconque et la
position du centre de gravité par rapport à la même origine nous avons:
d'où:
comme la racine nous gêne nous élèvoéns le tout au carré, ce qui nous donne finalement
834/2001
Sciences.ch 14/03/2005
En dérivant par rapport à et en annulant les dérivées, nous trouvons la position des
minima :
PENDULE ÉLASTIQUE
Étudions maintenant les oscillations propres d’un solide suspendu à un ressort élastique tel
qu'il oscille. Après l’écart du solide de la position d’équilibre, il accomplira des oscillations
harmoniques dans le sens vertical, si le ressort élastique subit des déformations
proportionnelles à l’allongement du ressort.
Nous aurons souvent dans ce site à faire avec de petits mouvements autour d'une position
d'équilibre. Ce type de mouvement caractéristique de ce que nous appelons un "oscillateur
harmonique" est très fréquent. Il se généralise à toutes sortes de situations physique, telles que
les circuits RLC, le modèle quantique corpusculaire et ondulatoire de l'atome, les résonateurs
à quartz ou toute autre structure vibrante faiblement autour de son point d'équilibre.
Nous supposerons que la force de rappel est proportionnelle et opposée à la déformation tel
que:
Nous prendrons la démarche très simple qui consiste à essayer une solution, en l’occurrence:
835/2001
Sciences.ch 14/03/2005
comme solution.
Pour trouver et , il faut spécifier les conditions initiales. Prenons par exemple:
à .
Ainsi, l'énergie potentielle élastique dans un ressort de constante , ayant subi une
déformation est donc donnée par :
Pour une description plus réaliste, une meilleure modélisation, nous allons supposer que
836/2001
Sciences.ch 14/03/2005
l'oscillateur est soumis à une force supplémentaire représentant les frottements. Il arrive
souvent que l'approximation par laquelle la force de frottement est proportionnelle à la
vitesse, et opposée à la vitesse, soit une bonne approximation. Ce n'est pas la seule possible, et
ce n'est pas toujours la meilleure. Nous parlerons des forces de frottement plus tard.
Ainsi nous considérons une force de friction de la forme (ne pas confondre avec la notation du
moment cinétique qui n'a absolument aucun rapport):
Pour se conformer à une notation usuelle dans le cadre de l'oscillateur, nous notons:
d'où:
837/2001
Sciences.ch 14/03/2005
Nous verrons qu'il correspond à un amortissement faible. En effet, nous pouvons écrire avec
des racines carrées réelles:
En utilisant les propriétés complexe des exponentielles (formule d'Euler – voir le chapitre
traitant des nombres) :
838/2001
Sciences.ch 14/03/2005
PENDULE CONIQUE
La masse étant écartée d'un angle de la verticale, l'objectif de ce pendue est fréquemment
(car c'est le cas le plus simple) de déterminer la dépendance entre l'angle et la vitesse si l'on
considère que les trajectoires sont circulaires.
839/2001
Sciences.ch 14/03/2005
ou, comme:
alors:
L'angle est donc d'autant plus grand que la vitesse angulaire est élevée, ce que confirme
l'expérience. Pour cette raison, le pendule conique fut longtemps utilisé comme régulateur de
vitesse sur les machines à vapeur (il ferme l'arrivée de vapeur quand la vitesse dépasse une
limite fixée à l'avance et l'ouvre quand elle tombe au-dessous de cette valeur).
PENDULE DE TORSION
Le pendule de torsion est un système qui fut utilisé par Coulomb pour mesure de la charge
électrique élémentaire et par Cavendish pour la mesure de la constante gravitationnelle .
Le pendule de torsions consiste en un solide rigide suspendu à fil de torsion vertical. Lors des
oscillations le fil exerce un moment de rappel que l'on supposera proportionnel à l'angle de
torsion :
840/2001
Sciences.ch 14/03/2005
Par analogie avec le pendule physique où nous avions une équation différentielle identique à
un facteur près, il vient:
PENDULE DE FOUCAULT
Le pendule de Foucault est une expérience formidable pour rendre compte de la rotation de la
Terre. Il existe plusieurs méthodes mathématiques pour analyser le comportement du pendule
de Foucaul j'ai choisi de présenter le plus simple qui ne nécessite pas des pages de calcul (3
pages).
Nous considérons que c'est la vue d'un référentiel géocentrique (la Terre) vu en coupe selon
un plan qui contient l'axe de rotation.
La taille du pendule est bien évidemment exagérée sur la figure. Il oscille cependant quand
même dans un plan méridien, entre et (un observateur terrestre voit la droite AB tourner
841/2001
Sciences.ch 14/03/2005
par rapport au sol terrestre selon le cercle vert, vu en perspective, dans le sens rétrograde).
La vitesse de ( ) , sur ce cercle, est due au fait que, dans le référentiel géocentrique, le
point , à la verticale du point de suspension, et le point du sol Terrestre coïncidant avec
à un instant donné, n'ont pas la même vitesse dans le référentiel géocentrique: le point
étant plus éloigné de l'axe de rotation Terrestre: la distance étant plus grande que
(de même la vitesse de étant supérieure à la vitesse de ).
La différence de ces vitesses se calcule aisément en supposant que la rotation terrestre est
uniforme en raisonnant sur une période d'une journée (sidérale) .
alors:
Donc:
PENDULE DE HUYGENS
842/2001
Sciences.ch 14/03/2005
Pour cela nous disposons deux lamelles de forme cycloïdale à des positions symétriques et
déterminées telles que représentées sur la figure ci-dessous:
Le choix de la cycloïde est du au fait qu'il s'agit d'une courbe "brachistochrone" (voir la
définition plsu bas) et depuis les travaux de Huygens en 1659, nous savons aussi qu'il s'agit
d'une courbe "tautochrone" (les balanciers dans les montres modernes ont par tradition cette
forme). C'est-à-dire que les corps qui tombent dans une cycloïde renversée arrivent au point le
plus bas dans le même temps, de quelque hauteur qu’ils commencent à tomber.
Donc contrairement à une idée reçue, le chemin le plus rapide pour un corps en mouvement
non horizontal tombant sur un support solide n'est pas la ligne droite.
En effet, l’un des problèmes les plus connus de l’histoire des mathématiques est le problème
du brachistochrone qui consiste donc à trouver la courbe le long de laquelle une particule
glisserait d’un point à un autre en un minimum de temps en étant soumis à un champ
uniforme de pesanteur. Ce problème a été posé par Jean Bernoulli en 1696 comme un
challenge pour les mathématiciens de son époque (et s'en fut un !!!). La solution fut trouvée
par Jean Bernoulli lui-même ainsi que par son frère Jacques Bernoulli, Newton, Leibniz et le
marquis de l’Hospital. Le problème brachistochrone est important dans le développement des
mathématiques et s'avère être une des applications principales de la méthode du calcul des
variations.
843/2001
Sciences.ch 14/03/2005
l’énergie cinétique acquise par le point matériel depuis le départ telle que:
La vitesse est mesurée le long de la courbe si bien que nous devons réécrire l’expression en
composantes horizontales et verticales:
Ainsi:
- et sont données par le théorème de Pythagore exactement de la même façon que nous
l'avions fait dans notre cadre d'étude du formalisme lagrangine.
Nous nous retrouvons avec une fonction similaire à celle que nous avions lors de notre étude
d'un cas pratique du formalisme lagrangien.
Il s’agit maintenant de trouver le minimum atteint par t parmi toutes les fonctions
satisfaisant:
844/2001
Sciences.ch 14/03/2005
Le problème fondamental dit du "calcul des variations" consiste à chercher, parmi les
fonctions continûment dérivables sur un intervalle donné et pour lesquelles
les fonctions et sont des valeurs données, celles qui rendent maximum ou
minimum l’intégrale précédente.
Pour appliquer cette méthode, nous partons de l’équation d’Euler-Lagrange (voir chapitre de
mécanique analytique) :
Identiquement à ce que nous avons vu dans notre exemple dans le cadre de notre étude du
formalisme lagrangien (voir chapitre de mécanique analytique) nous avons dans notre cas:
Donc:
ou autrement écrit:
Il faut donc résoudre cette équation différentielle pour trouver le fonction qui donne le chemin
le plus rapide.
Il existe une fonction paramétrique qui satisfait cette équation différentielle. C'est l'équation
paramétrique du cycloïde justement ! Donnée par:
845/2001
Sciences.ch 14/03/2005
Ainsi:
La conservation d’énergie:
s’écrit donc:
d'où:
Donc le temps requis pour aller du haut au bas de la cycloïde que décrit le pendule de
Huygens est :
L'énoncé en 1696 du problème brachistochrone peut être considéré comme l'authentique acte
de naissance du calcul des variations, car c'est ce problème qui suscite la recherche de
méthodes générales progressivement élaborées au cours d'une véritable compétition.
Remarque : Une ligne brachistochrone d'une surface est une courbe sur laquelle doit glisser
sans frottement un point matériel pesant placé dans un champ de pesanteur uniforme de sorte
que le temps de parcours soit minimal parmi toutes les courbes joignant deux points fixés.
Autrement dit, ce sont les lignes les plus courtes en temps, alors que les géodésiques (voir
chapite de mécanique relativiste) sont les lignes les plus courtes en distance.
846/2001
Sciences.ch 14/03/2005
MÉCANIQUE ONDULATOIRE
Nous nous intéresserons ici à l'étude des propriétés mathématiques des cordes vibrantes que
l'on peut également par extension dans un souci de généralisation à des cas immatériels
assimilier au concept des "ondes". Cette étude est très importante car nous aurons besoin de
certains des résultats obtenus ici en thermodynamique, physique quantique, astrophysique et
électrodynamique (pour ne citer que les plus importants).
Définitions :
D1. Une onde est un transport d'énergie sans transport de matière. Elle est concrétisée par la
propagation d'une perturbation d'un milieu. La vitesse avec laquelle l'onde progresse (d'où
l'appellation de "ondes progressives") dépend des propriétés physique du milieu (c'est la
raison pour laquelle il est difficile de savoir si la mécanique ondulatoire doit être étudiée dans
le chapitre de mécanique des milieux continus).
FONCTION D'ONDE
Soit une perturbation définie dans une région donnée de l'espace. Si nous
remplaçons par , nous définissons dans cette même région, une perturbation
identique à mais translatée d'un distance dans la direction des positifs (à
droite donc si l'on adopte le système de représentation conventionnel vu en analyse
fonctionnelle).
est par définition appelée "vitesse de phase de l'onde". Elle est constante un milieu
homogène. "L'amplitude de l'onde" est la valeur maximale de la perturbation :
847/2001
Sciences.ch 14/03/2005
En l'absence d'amortissement, elle conserver la même valeur en chacun des points où l'onde
passe.
EQUATION D'ONDE
Démonstration :
Cependant, en dérivant une seconde fois, nous obtenons une autre forme de l'équation d'onde
que nous retrouverons aussi fréquemment :
Ce qui nous amène à écrire l'une des relations les plus importantes en physique :
Remarque : lorsque deux ou plusieurs ondes se propagent dans un milieu, la fonction d'onde
qui en résulte est la somme algébrique des fonctions d'onde de chaque onde. Nous disons
alors que les ondes "interfèrent" et nommons cette considération le "principe de superposition
des ondes".
Considérons maintenant une corde de longueur attaché l'une de ses extrémités à une
terminaison fixe. Supposons maintenant qu'une perturbation se propage sur cette corde.
Lorsque la perturbation arrive à la terminaison, nous observons que celle-ci change de signe
en même temps que sa vitesse de propagation s'inverse : l'onde subit ainsi une réflexion avec
inversion.
Une fonction d'onde quelconque, qui progresse vers la terminaison, ne peut pas
vérifier la condition :
848/2001
Sciences.ch 14/03/2005
L'astuce consiste à la remplacer par une autre fonction d'onde dont la forme est
semblable à à grande distance de l'origine de la perturbation, et qui s'annule au point de
terminaison pour toutes les valeurs du temps. Pour cela, nous pouvons imaginer au point de la
terminaison, un miroir qui donne de la corde une image de même longueur dans laquelle nous
inventons une onde virtuelle , symétrique de ,
mais de signe opposé.
- que les deux ondes progressent l'une vers l'autre pour s'annuler au point de terminaison
- toute partie de l'onde réelle qui dépasse le point de terminaison devient virtuelle
- toute partie de l'onde virtuelle qui pénètre dans le corde devient réelle
A leur intersection, les deux ondes réalisent une interférence destructive au point de
terminaison. La somme algébrique de ces deux fonctions d'onde est aussi une fonction
d'onde :
Si nous considérons maintenant une terminaison libre, sans frottements avec son support
d'attache, nous nous retrouvons dans un cas similaire au précédent à la différence que
l'interférence est constructive au point de terminaison plutôt que destructive telle que la
fonction d'onde s'écrive :
Remarques :
- lorsque l'onde arrive sur une terminaison libre ou fixe, l'énergie transportée est intégralement
renvoyée en arrière.
- lorsqu'une terminaison n'est pas exactement adaptée, seule une partie de l'énergie est
absorbée par le point , le reste est réfléchi.
TYPE D'ONDES
En physique théorique (et dans la pratique), nous restreignons fréquemment l'étude de certains
phénomènes à des cas particuliers d'ondes. Principalement, nous en distinguons trois que nous
allons brièvement mais soigneusement développer :
ONDES PÉRIODIQUES
849/2001
Sciences.ch 14/03/2005
Si un événement produit une onde qui ne transporte qu'une seule perturbation produite en un
point donné, il existe de nombreuses qui sont capables d'exciter un milieu de manière
répétitive.
Le point spatial de la source subit alors périodiquement la même perturbation. La durée d'un
cycle complet est appelé identiquement à l'étude des pendules : "la période ".
Si la perturbation peut se propager sous forme d'onde, à vitesse , elle est décrite par la
fonction d'onde que nous connaissons :
En chaque point du milieu perturbé, l'onde périodique impose une "périodicité temporelle" de
la perturbation qui nous impose d'écrire :
Après plusieurs cycles d'excitations de la source, plusieurs perturbations sont distribuées dans
l'espace. La distance entre deux perturbations successives est appelée "longueur d'onde ".
Si une fonction d'onde est périodique dans le temps, elle l'est aussi dans l'espace, pour autant
que l'impulsion ne se déforme pas lors de la progression.
Démonstration :
ONDES HARMONIQUES
Pour ces ondes, la fonction d'onde est un fonction trigonométrique de type sinus ou cosinus :
ou
850/2001
Sciences.ch 14/03/2005
ce qui implique :
Introduisons :
dans l'expression de :
ou progressive selon
ou progressive selon
ONDES STATIONNAIRES
Imaginons une corde excitée de manière harmonique. Au lieu d'adapter sa terminaison pour
extraire de l'énergie de la corde, imposons que cette terminaison soit fixe. L'onde est alors
réfléchie.
Une nouvelle fonction d'onde doit être définie pour décrire la superposition de l'onde
incidente :
851/2001
Sciences.ch 14/03/2005
et de l'onde réfléchie :
en analogie avec le résultat que nous avions trouvé lors de notre étude des terminaisons :
La relation trigonométrique :
nous donne :
Ce n'est plus une onde progressive car et ne se combinent plus comme . Certains
points de la corde ne bougent jamais . Ils satisfont :
et sont situés en :
Pour des raisons évidents, nous ne conservons que les valeurs de pour lesquelles .
Nous observons dans un tel système, des fuseaux de vibration, de longueur , dans
lesquels la corde vibre transversalement dans une zone de hauteur (deux vers le haut,
deux vers le bas).
Les points où l'amplitude de vibration est maximale sont des "ventres de la vibration".
Si nous imposons maintenant une terminaison fixe aux deux extrémités d'une corde en
vibration, nous nous retrouvons avec une "mise en résonance".
Le plus souvent, nous n'observons pas grand chose jusqu'à ce que nous trouvions la fréquence
d'excitation qui place les nœuds de vibrations sur les deux points de terminaison fixe.
852/2001
Sciences.ch 14/03/2005
implique :
La corde est alors le siège d'une onde stationnaire dont l'amplitude de vibration est
considérablement plus grande que l'amplitude d'excitation (quatre fois).
Nous disons alors que la corde est rentrée en "résonance" avec l'excitateur.
La relation :
montre qu'il y a plusieurs longueurs d'onde possible dont la plus grande correspondant à
est appelée "fondamentale" et vaut bien évidemment .
Nous avons vu comment une onde peut progresser dans une corde. Montrons maintenant
pourquoi c'est possible et établissons la relation , donnant la forme de la corde en
fonction du temps.
Soit un fil de diamètre , longueur et masse , la masse linéique du fil est alors :
Par un léger choc, créons une petite perturbation (afin de ne pas déformer le câble et maintenir
constant sa masse linéique) transversale. Isolons, dans la zone perturbée, un élément de fil, de
longueur .
Approximations :
A1. Chaque élément de la corde peut être découpé de façon infinitésimale de façon a être
presque parallèle à l'axe . Les angles sont donc considérés comme petits
A2. La corde est considérée comme déformable mais non allongeable donc la norme des
forces dans la corde est constante en tout point quelque soit la déformation.
853/2001
Sciences.ch 14/03/2005
Si les angles sont vraiment petits, nous avons le premier terme du développement qui donne :
Donc :
: accélération selon
La loi de Newton appliquée à la masse donne (nous considérons que chaque point
de masse se déplace seulement selon car il n'y a pas allongement) :
et donc :
854/2001
Sciences.ch 14/03/2005
Si , les deux tangentes tendent vers la même valeur, mais la fraction du membre de
droite tend vers une valeur finie :
Si nous vérifions les unités de sont celles du carré d'une vitesse , comme
l'exige l'analyse dimensionnelle. Pour simplifier l'écriture, nous posons :
Nous allons maintenant considérer un cas particulier très intéressant dans le cadre de la
musicologie qui est celui de la corde tendue (la plupart des instruments à corde fonctionnant
ainsi).
Pour résoudre cette équation différentielle linéaire, nous allons faire usage de la méthode de
séparation de variables en posant :
855/2001
Sciences.ch 14/03/2005
et
Ces deux équations étant similaires, résolvons-les de manière générale (voir la chapitre de
calcul différentiel et intégral pour plus de précisions) :
avec
d'où :
Nous savons que la solution générale si les racines de l'équation caractéristique est complexe,
est de la forme :
Pour nos deux équations différentielles, nous avons donc par similitude :
et
856/2001
Sciences.ch 14/03/2005
Il ne reste que :
Posons :
Pour tenir compte de la vitesse initiale nulle, dérivons par rapport au temps :
Il ne reste :
Le principe de superposition des solutions des équations différentielles linéaires (voir chapitre
de calcul différentiel et intégral) permet d'écrire que la combinaison linéaire de toutes les
solutions pour la corde est finalement :
857/2001
Sciences.ch 14/03/2005
Les doivent être choisis de manière à satisfaire la condition initiale qui donne la forme de
la perturbation :
Imaginons maintenant une corde de longueur fixée en ses extrémités et tendue. Choisissons
la perturbation la plus simple possible : nous grattons la corde en son milieu, pour l'écarter
d'une petite distance de sa positions d'équilibre.
pour et pour
À cause du , les termes pour lesquels est pair sont tous nuls. Il reste :
858/2001
Sciences.ch 14/03/2005
Nous avons :
et :
Ainsi, pour une valeur quelconque, il est facile de démontrer que la -ième harmonique est
donnée par :
avec
Ainsi, après avoir été gratté au milieu de sa longueur , un fil maintenu rigidement à ses deux
extrémités peut osciller suivant plusieurs modes. Le mode fondamental (harmonique
fondamentale) correspond à la plus petite fréquence possible. Il lui correspond la longueur
d'onde .
Remarques :
R1. La théorie prédit que la vibration peut être une combinaison linéaire de plusieurs modes.
Ce phénomène porte le nom de vibration simultanée. Il se produit abondamment dans un
piano.
R2. Les instruments de musique sont conçus pour émettre des sons à des fréquences
conventionnelles, étant admis que la hauteur d'une note perçue par l'oreille est définie par la
859/2001
Sciences.ch 14/03/2005
De plus, nous remplaçons la force de tension unidirectionnelle du fil par une force de
tension appliquée sur le pourtour de la membrane. Cette force s'exerce dans toutes les
directions du plan et se décrit par unité de longueur :
et comme :
860/2001
Sciences.ch 14/03/2005
Donc finalement nous obtenons pour équation d'onde en coordonnées cartésiennes (exprimé
avec la laplacien) :
Nous cherchons la solution particulière de cette équation qui vérifie les conditions suivantes :
C.I.1. La membrane est fixée sur son pourtour (conditions aux limites)
(conditions initiales)
Á nouveau, pour chercher la solution, nous allons utiliser la méthode de séparation des
variables tel que :
et identiquement que pour la corde, nous obtenons pour une solution du type :
861/2001
Sciences.ch 14/03/2005
Pour la méthode change car nous avons maintenant une équation différentielle à deux
variables tel que :
La fonction est périodique de période , il existe donc un entier naturel tel que
et donc manière identique à la corde, nous obtenons :
862/2001
Sciences.ch 14/03/2005
Nous reconnaissons ici l'équation différentielle de Bessel d'ordre telle que nous l'avons
avec sa solution présentée dans le chapitre des suites et séries. Dès lors, la solution générale
est du type :
Parmi les solutions à cette équation, cherchons celles qui vérifient les conditions aux limites
en posant :
À moins que ou soit la fonction nulle, ce qui donne pour solution la position
d'équilibre… (qui ne vérifie sans doute pas les conditions initiales), nous devons avoir
, c'est-à-dire :
La fonction Bessel d'ordre a une infinité de zéros positifs (il suffit de tracer cette
fonction avec un ordinateur pour le voir tel qu'avec Maple en mettant la commande : plot
(BesselJ(2,x),x=0...100) où vous pouvez changer la valeur 2 par une autre valeure) qui
fournissent une infinité de valeurs convenables de telle que :
En ayant modifié le nom des constantes d'intégration en ayant posé (ce qui vérifie
l'analyse dimensionnelle). Maintenant que cette solution satisfait les conditions aux limites,
nous devons nous attaquer aux conditions initiales.
D'abord pour les mêmes raisons que la corde, la solution finale est la superposition linéaire
des solutions telle que :
863/2001
Sciences.ch 14/03/2005
Ces deux relations sont similaires, étudions la première. Elle peut s'écrire :
qui est le développement en série de Fourier de la fonction . Nous avons donc (voir le
chapitre des suites et séries) :
En utilisant l'orthogonalité des fonctions de Bessel, que nous allons démontrer, nous
déduirons de ces relations les coefficients (et de même pour les autres).
Démonstration :
864/2001
Sciences.ch 14/03/2005
et
Nous obtenons :
La relation :
PHASEURS
Il existe plusieurs façons d'exprimer les fonctions d'ondes que nous avons vues
précédemment. Les physiciens (ainsi que les électrotechniciens) utilisent une formulation,
appelée "phaseur", permettant d'économiser avantageusement le poids des écritures et ainsi de
simplifier considéralement l'étude des problèmes complexes (ou simples). Les phaseurs font
865/2001
Sciences.ch 14/03/2005
usage des propriétés des nombres complexes pour exprimer les fonctions d'onde
trigonométriques sous une forme simplifiée.
Ce que nous appellons phaseur, est une fonction dont la valeur est complexe et qui, dans
un espace à 1 dimension, s'écrit:
Comme cette fonction est complexe, elle a une partie réelle que nous appelons ici et une
partie imaginaire que nous appelons . Leur identification est facile puisque comme nous
l'avons déjà démontré lors de notre étude des nombres complexes (voir le chapitre des
nombres dans la section d'arithmétique) :
Les parties réelles et imaginaires varient lorsque la position ou le temps varient. Le module ne
change donc pas, il est toujours égal à 1. Le changement se manifeste simplement par la
simple variation d'angle que fait le vecteur représentant dans son plan complexe. C'est là
une raison suffisante pour parler de phaseur, puisque la variation de peut être visualisée
comme un simple changement d'angle ou de phase.
Si nous sommes dans un espace physique à plus d'une dimension, disons 3, alors l'expression
pour devient:
La situation est un peu plus difficile à visualiser (…). Elle est la même qu'en une dimension,
mais là tout se passe le long d'une direction définie dans l'espace 3D par le vecteur . Plus
précisément, nous aurons:
La variation dans le temps reste la même qu'en une dimension spatiale mais un déplacement
dans l'espace est un peu plus compliqué qu'en une dimension. Ici tout déplacement spatial
866/2001
Sciences.ch 14/03/2005
dans une direction qui n'est pas orthonormale à fera que le produit scalaire changera de
telle sorte que l'argument variera. Ici ce n'est pas seulement la grandeur ou la norme du
vecteur qui donne le taux de variation de sous un déplacement spatial mais aussi l'angle
que fait ce déplacement par rapport à la direction de puisque nous avune un argument qui
varie comme et donc qui dépend de cet angle noté ici . En effet, nous avons:
La quantité est souvent appelée le "vecteur d'onde". Physiquement il est relié le plus
souvent à l'équivalent du moment (linéaire) de l'onde pour laquelle il est évident que la
définition usuelle de la quantité de mouvement ( ) n'a plus de sens.
Un partie importante des systèmes étudiés en physique ne peuvent êtres caractérisés par un
point et donc décrits par une trajectoire. Une vague, une onde, une bande élastique qui
oscillent n'ont pas une unique position définie, ce sont des "milieux continus" sur un certain
intervalle. La question que nous nous posons dans notre tentative de les décrire est plutôt la
suivante: comment décrire le déplacement de ce milieu dans l'espace et dans le temps. Par
exemple, pour une vague, si nous figeons le temps, comment l'amplitude , de cette vague
varie-t-elle d'un endroit à l'autre de l'espace? Nous pouvons aussi figer l'espace en regardant
un seul endroit et demander comment l'amplitude varie avec le temps?
ou
Le point important est que nous cherchons à exprimer , dont le nom correct est un "champ",
comme une fonction des coordonnées du temps. Par exemple, si la vague est très régulière
peut-être est-elle décrite adéquatement par si je regarde à un seul endroit et par
lors d'une fixation imaginaire du temps ?
Le nom de "fréquence angulaire" est facile à comprendre puisque la fonction cosinus ou sinus
fait un cycle si son argument change de sur une de temps d'un période .
Rappelons que :
Dans la description des systèmes harmoniques, la notation phaseur peut être très utile comme
nous l'avons déjà dit. L'équation la plus souvent rencontrée est est l'équation d'onde (que nous
avons démontré au début de ce chapitre). En une dimension, elle s'écrit :
867/2001
Sciences.ch 14/03/2005
ou
Un manière rapide et efficace d'écrire toutes ces relations de façon condensée et utilement
imagée, est d'écrire:
Dans les trois cas, la substitution permet de le vérifier. Prenons, par exemple, la solution
sinus. Alors:
En effet, cette expression qui donne s'appelle une relation de dispersion. Elle est
évidemment caractéristique de l'équation qui la génère. Celle qui apparaît ci-dessus est
particulièrement simple et caractérise une onde libre dans un milieu non-dispersif, tel que
décrit par l'équation d'onde que nous avons écrit.
868/2001
Sciences.ch 14/03/2005
Une onde physique n'est évidemment pas complexe. La solution phaseur est complexe et a
donc une partie réelle et une partie imaginaire. Nous montrons ici que chacune des deux
parties peut représenter une onde réelle générale. Utilisons même un point de départ un peu
plus général. Imaginons que l'amplitude est elle-même complexe. Nous pouvons donc
l'écrire:
Cette partie réellle est donc de la forme la plus générale (et réelle) de la solution
monochromatique pour l'équation d'onde, soit:
qui relient deux paramètres à deux autres. La partie réelle du phaseur est donc suffisante pour
décrire entièrement l'onde monochromatique.
Nous pouvons refaire exactement la même chose avec la partie imaginaire du phaseur et
démontrer de façon identique qu'elle est suffisante pour décrire entièrement l'onde
monochromatique.
Conclusion: il est donc possible d'utiliser le phaseur pour faire toutes les manipulations
mathématiques demandées apr le problème physique et à la fin, ne garder que la partie réelle
ou imaginaire, selon ce qui a été convenu dès le début.
Comme nous l'avons déjà dit, la forme réelle la plus générale de la solution est:
Cette fonction a le comportement d'un sinus (ou d'un cosinus) dont l'amplitude est donnée par:
869/2001
Sciences.ch 14/03/2005
Ici l'amplitude connu est est et les conditions initales sont telles qu'à et , le
champ a la valeur . Encore une fois, deux conditions fixent deux
paramètres.
L'amplitude est une chose évidente, la phase un peu moins. Pour qu'une fonction du type
ait n'importe quelle valeur que l'on veut lorsque son arg (argument)
est, disons nul, il suffit d'ajuster la valeur de la phase . C'est comme faire glisser la fonction
sinusoïdale le long de l'axe, de façon à satisfaire des conditions initiales physiques imposées
par le système étudié.
De deux fonctions de typs sinus ou cosinus qui ne commencent par au même point de leur
cycle, nous disons qu'elles sont "déphasées". Ceci dvient vital lorsqu'il y a plus d'une onde en
présence. Imaginons le cas le plus simple de deux ondes de même amplitude:
Ici l'argument est une variable et les phases des paramètres constants. Nous considérons le
résultat physique de l'onde résultant de l'addition de ces deux ondes.
Dans le phaseur, soit la partie réelle, soit la partie imaginaire, est suffisante pour donner une
description générale de l'onde (toujours monochromatique jusqu'à maintenant). Elles sont
respectivement composées d'un cosinus et d'un sinus et donc déphasées de l'une par
rapport à l'autre !
Il est souhaitable de revenir la "relation de dispersion" que nous avions obtenu. Nous avons
vu que, pour l'onde monochromatique libre, celle qui est solution de l'équation homogène,
cette relation s'écrit pour que la phase de la solution corresponde à cette réalité (attention il
s'agit de ne pas confondre le symbole de la vitesse et de la fréquence!):
Toujours dans le cas libre, nous pouvons avoir une situation physique qui correspond à
l'addition de plusieurs ondes monchromatiques libres. Le résultat n'est pas monochromatique
et s'écrit évidemment comme une somme:
870/2001
Sciences.ch 14/03/2005
Nous lui donnons souvent le nom de "paquet d'onde" pour des raison évidentes. Puisque tout
est libre, chaque composantes satisfera:
- D'abord, même pour des ondes libres, elle est quadratique, nous pouvons donc changer le
signe du vecteur d'onde et/ou de la pulsations sans affecter l'équation. Nous observons
trivialement que pour une ou plusieurs composantes du vecteur d'onde positives l'onde se
propage vers les croissants pour ces composantes positives et qu'inversement, pour une ou
plusieurs composantes négatives l'onde se propage vers les décroissants. De même, pour
une pulsation négative ou positive signifie que le temps varie vers le passé, respectivement le
futur.
- D'autres part, certains types d'ondes n'obéissent pas à une équation aussi simple que
l'équation homogène. C'est le cas des vagues, par exemple, tant du fait de la nature du liquide
dans lequel elles se propagent que de la force de rappel gravitationnel. Parfois aussi, une onde
qui serait totalement libre, ou à peu près, cherche à se propager dans un milieu où les
conditions de propagation sont sérieusement affectées. Par exemple une onde sonore qui tente
de se propager dans le mastic ou une onde électromagnétique qui cherche à se propager dans
un conducteur (un métal). Dans ce cas, une partie importante de la différence entre onde libre
et onde modifiée par le mileu peut se décrire par un changement de la dispersion.
871/2001
Sciences.ch 14/03/2005
MÉCANIQUE STATISTIQUE
La démarche présentée ici est d'aborder la mécanique statistique élémentaire pour en déduire
ensuite la thermodynamique. La mécaniqe statistique constitue en effet, avec la physique
quantique et la relativité, l'un des piliers de la phyisque moderne; il est important de la
percevoir d'emblée comme une théorie fondamentale, et non pas comme une simple tentative
pour justifier à posteriori la thermodynamique. La thermodynamique elle-même y gagne en
retour compréhension plus juste et plus profonde de ses principes et de ses méthodes.
Le mot "information" est utilisé dans des contextes très variés, dans des sens totalement
différents suivants les disciplines scientifiques : nous pouvons à titre d'exemple citer la
thermodynamique avec le concept d'entropie, la physique appliquée avec la théorie du signal,
la biologie avec la théorie du génome et la physique quantique avec la probabilité d'obtenir de
l'information.
Se pose alors la question, s'il est possible de construire une théorie de l'information et si elle
est unique ? Notre démarche ici, ne vise non pas l'information en tant que telle, mais la
quantité d'information. Lorsque nous parlons de quantité et de mesure, nous pensons à la
notion de contenu ou de valeur de l'information. La science de l'information de par son objet
doit se sentir concernée par ce questionnement. Si nous définissons "l'infométrie" comme
l'ensemble des techniques de mesures mathématiques et statistiques de l'information, nous
souhaiterions avoir une définition suffisamment claire du concept de quantité d'informations
qui puisse nous amener à définir une mesure, c'est-à-dire un ensemble d'opérations
parfaitement définies, nous amenant à des axiomes clairs et dont le résultat est un nombre. La
synthèse que nous développons ici n'est pas ambitieuse.
Nous nous intéressons donc ici aux fondements la théorie statistique de l'information connue
également sous le nom de "théorie de Shannon". La formule de Shannon qui en ressort est
certainement un des concepts fondamentaux de toute la physique puisqu'elle touche la brique
irréductible de la physique : l'information !! Par ailleurs, certains physiciens tentent de
reformuler mathématiquement les postulats de la physique quantique à l'aide de la théorie de
Shannon (et cela semblerait être en bonne voie). Nous y reviendrons plus en détail lors de
l'étude de la physique quantique ondulatoire.
En mécanique statistique, nous montrerons (plus loin) qu'un système phyisque isolé à pour
état le plus probable, celui qui contient le plus d'états et qui est donc à fortiori le plus
imprévisible. Or, un l'état le plus improbable est donc celui qui est le plus prévisible. Dès lors,
puisque l’imprévisibilité apparaît comme un attribut essentiel de l’information, nous
identifions la mesure quantitative de l’information à son improbabilité.
872/2001
Sciences.ch 14/03/2005
La fonction logarithme est donc par ses propriétés une candidate naturelle pour telle que:
Ainsi, la "quantité d'information intrinsèque" d’un événement est donc de par les propriétés
du logarithme:
Elle peut être considérée, comme nous l’avons fait, comme une mesure d’incertitude sur
l’événement, ou comme celle de l’information nécessaire pour résoudre cette incertitude.
Définitions :
873/2001
Sciences.ch 14/03/2005
Nous souhaitons aussi mesurer la quantité d’information que la donnée d'une variables, par
exemple , apporte sur l'autre, . C'est le cas en particulier lorsque nous identifions au
choix d'un signal appliqué à l'entrée d'un canal et au signal correspondant observé en sa
sortie. est alors la probabilité à fortiori que soit émis et la probabilité à
fortiori que ait été émis, sachant que a été reçu.
cette dernière égalité justifiant le terme "mutuelle". Alors que les informations intrinsèques
étaient positives, l’information mutuelle peut être négative. Nous verrons que sa moyenne,
beaucoup plus importante dans la pratique, ne peut l’être.
Les événements individuels étant généralement moins importants que les moyennes, nous
considérerons par la suite une source aléatoire, discrète, finie, stationnaire, et blanche (i.e. de
réalisations successives indépendantes). Les événements sont donc interprétés comme le
choix d’un symbole dans l’alphabet de la source. Soit la taille de cet alphabet, et
ses symboles. La source est donc décrite par la variable aléatoire , qui prend ses
valeurs dans l’alphabet, avec des probabilités respectives , telles que:
874/2001
Sciences.ch 14/03/2005
Les "entropies conjointes et conditionnelles" sont définies de manières similaires avec les
notations idoines :
et:
Il faut noter dans la dernière expression que l’espérance est effectuée dans l’espace produit, et
que donc le coefficient est la probabilité conjointe.
Remarque: Il est à noter que la définition de la quantité d’information, par une mesure
logarithmique peut paraître arbitraire, quoique raisonnable, compte tenu des propriétés
attendues d’une telle mesure. Shannon, et plus tard Khintchine ont montré que compte tenues
de certaines propriétés posées en axiomes, la fonction logarithmique est la seule à convenir.
Soit une variable aléatoire binaire, valant 1 avec une probabilité (et donc 0 avec une
probabilité ). Son entropie vaut :
875/2001
Sciences.ch 14/03/2005
avec et avec un logarithme en base 2 tel que pour un événements à deux états
équiprobables, l'entropie d'obtention d'un des deux états soit égale à l'unité. Ceci dit, il vient
naturellement que .
LOI DE BOLTZMANN
Nous allons d'abord démontrer par l'intermédiaire d'un cas simple, que pour tout système,
l'état le plus probable est l'état d'équilibre !
Considérons un système isolé (un système est dit "isolé" lorsqu'il est imperméable à tout flux
– chaleur (adiabatique), matière, champs, …) peuplé de particules discernables. Ce
système est partagé en deux compartiments (ou niveaux) identiques et séparés d'une paroi
imperméable. Chaque compartiment est supposé contenir un nombre de particules.
Pour une configuration donnée du système, nous parlons de "macro-état" dans le sens où il est
possible de par la quantité de particules de mesurer une grandeur dite macroscopique tel que
l'énergie, la masse, la pression, etc.
Si nous fixons ce système particulier, il est bien sûr possible pour un nombre de particules
de concevoir un nombre donné de macro-états. Tel que :
876/2001
Sciences.ch 14/03/2005
etc.
Ceci nous donne tous les arrangements possibles des particules "gauches" avec les particules
"droites" (de la frontière) pour un macro-état donné (le nombre de manières dont les particules
peuvent se partager entre les deux compartiments). Mais nous avons aussi dans ce cas
particulier :
et donc :
Nous avons finalement pour tous les macro-états d'un système de particules, un total de :
micro-états (configurations) possibles. Or, nous avons bien vu dans l'exemple initial que :
877/2001
Sciences.ch 14/03/2005
Ainsi, la probabilité d'existence d'un micro-état donné est de et elle est équiprobable !!
Pour savoir pourquoi l'équilibre est l'état le plus probable, il nous suffit de chercher quel est le
couple qui maximise :
puisque tous les micro-états sont de toute façon équiprobables. Il est facile de contrôler que ce
maximum est donné pour :
Nous pouvons dès lors énoncer le deuxième postulat de la mécanique statistique : l'état
d'équilibre est l'état qui correspond au plus grand nombre de configurations (micro-états) et
est l'état le plus probable.
878/2001
Sciences.ch 14/03/2005
La fonction de distribution qui décrit la position des particules selon l'axe à l'équilibre
va évoluer vers une autre fonction de distribution correspondant au nouvel équilibre
. À l'équilibre est constante. Mais entre les deux équilibres, elle évolue, et devient de
plus en plus large. Nous perdons donc de l'information sur la position des particules. Nous
pouvons donc ré-énoncer le deuxième postulat en disant qu'un système hors d'équilibre évolue
toujours dans le sens d'une perte d'informations (d'un élargissement de la fonction de
distribution caractéristique).
Le cas que nous venons de décrire montre clairement que les paramètres ou concepts : nombre
de configurations, désordre, équilibre, quantité d'information et entropie d'un système isolé
servent à représenter l'état d'un système. Ces paramètres jouent le même rôle. Des relations
mathématiques doivent donc les relies les unes aux autres.
Rappelons que nous avons démontré que l'entropie statistique infométrique d'un système est
donnée par :
Si nous appliquons cette relation au cas d'un système physique en équilibre pour lequel nous
souhaitons calculer l'entropie, nous avons démontré :
879/2001
Sciences.ch 14/03/2005
Il nous faut encore savoir à quoi correspond cette probabilité constante. Nous avons démontré
précédemment qu'à l'équilibre, nous avions :
qui est donc le nombre de micro-états à l'équilibre. Ainsi, la probabilité de tirer un micro-état
parmi tous est de :
Comme les probabilités des micro-états sont équiprobables et que nous sommons sur
l'ensemble de ces derniers, il vient :
et donc :
Puisque l'équilibre est liée au désordre maximum, que le désordre est lié à l'information
manquant, il paraît raisonnable de relier l'entropie statistique de l'information à l'entropie
statistique thermodynamique. Pour cela, il faut que la constante nous permette d'obtenir les
bonnes unités et il vient naturellement de choisir cette constante telle qu'elle soit égale à la
constante de Boltzmann qui a les mêmes unités que l'entropie thermodynamique. Ainsi :
Il nous faut encore choisir la base du logarithme. L'expérience montre qu'il faut choisir le
logarithme néperien qui permet de retrouver des résultats de la mécanique classique après
développements.
880/2001
Sciences.ch 14/03/2005
De par les propriétés mathématiques de l'écart-type, nous avons pour un ensemble de sous-
systèmes :
Nous distinguerons quatre différentes statistiques qui proviennent ou non d'effets quantiques
et qui conduiront à quatre distribution distinctes connues. Ce sont les distributions de
Maxwell, Maxwell-Boltzmann, Fermi-Dirac et de Bose-Einstein. Elles trouvent de
nombreuses applications en physique comme le rayonnement du corps noir qui sera démontré
dans le chapitre de thermodynamique.
Pour un gaz en état d’équilibre, posons la question suivante. Quelle probabilité existe qu’une
molécule ait ses composantes de vitesse comprise entre et , et , et
dans un repère cartésien habituel ?
Nous postulons dans un premier temps que est proportionnelle à chacun des intervalles
tel que :
et qu'il n’y a pas de directions privilégiées. Nous pouvons faire une rotation circulaire des
axes cartésiens, la probabilité sera inchangée (isotropie de l’espace).
L'isotrope amène que la fonction ne dépend pas du vecteur , au mieux elle dépend de
la norme de cette vitesse, tel que :
881/2001
Sciences.ch 14/03/2005
Soit la probabilité pour une molécule d’avoir sa composante suivant l’axe comprise
entre et alors :
de même :
Puisque :
En intégrant :
882/2001
Sciences.ch 14/03/2005
Donc :
Donc identique :
Remarquons que est nécessairement négatif sinon la probabilité pour une molécule d’avoir
une composante de vitesse infinie serait infinie ce qui voudrait dire que toutes les molécules
seraient à vitesse infinie et que l’énergie serait infinie !!!
Nous posons :
avec
Il nous reste à normaliser . La probabilité pour une molécule d'avoir une composante de
vitesse comprise entre ou une intensité de vitesse comprise entre est égale
à (100% de chances).
Ainsi :
883/2001
Sciences.ch 14/03/2005
Plus généralement :
Pour obtenir nous nous plaçons dans l’espace des vitesses c’est-à-dire un repère cartésien
de coordonnées . Les composantes ne sont pas indépendantes puisque
liées par la relation : .
L’extrémité des vecteurs vitesse ayant une intensité de vitesse , c’est à dire des
composantes de vitesse liée par la relation ci-dessus, se trouve dans l’espace des vitesses sur
la sphère de rayon . Il en sera de même pour l’extrémité des vecteurs vitesse ayant une
intensité .
Dans l’espace des vitesses, nous délimitons une portion d’espace comprise entre la sphère de
rayon et la sphère de rayon , de volume égale à .
884/2001
Sciences.ch 14/03/2005
Donc :
ou
La thermodynamique, ou la mécanique des fluides (voir théorème du Viriel) nous donne pour
un gaz parfait monoatomique, de capacité calorifique et volume constant :
Si nous formulons l’hypothèse que la partie de l’énergie liée à la température est due à
l’agitation cinétique des molécules, nous pouvons écrire :
et donc :
En physique quantique corpusculaire, nous apprenons que l’énergie d’une particule est
quantifiée, c’est à dire que les valeurs possibles pour l’énergie forment un spectre discret.
Même si, dans un certain nombre de situations courantes, pour une particule et encore plus
pour un système constitué d’un grand nombre de particules, les niveaux d’énergie sont si
serrés que nous pouvons traiter, sur le plan mathématique, ce spectre comme continu, il
n’empêche qu’en toute rigueur ils sont quantifiés.
Une particule, ayant un niveau d’énergie , peut être dans différents sous-états.
Nous savons (nous n’avons pas utilisé l’équation de Schrödinger en physique quantique
corpusculaire pour le montrer strictement) que, pour décrire un atome, nous introduisons
885/2001
Sciences.ch 14/03/2005
Ainsi pour une même énergie (pour une valeur particulière du nombre quantique principal),
un atome peut posséder différentes valeurs des nombres quantiques secondaire, magnétique
ou de spin.
Pour qualifier la possibilité de sous-états correspondant à une même énergie, nous employons
l’expression "dégénérescence" et nous traduisons par la variable le nombre de
dégénérescences correspondant à un même niveau d’énergie .
Nous allons considérer un système composé de particules qui se placent sur différents
niveaux d'énergie . Nous trouvons particules sur le niveau d'énergie . Nous avons les
relations suivantes pour l'énergie totale (que nous notons par la même lettre que celle utilisée
en thermodynamique) et pour le nombre de particules (même remarque que pour l'énergie
totale) :
Nous supposerons (c'est important) ces quantités constantes. Le système est entièrement
déterminé par la distribution des particules sur les niveaux.
Mis nous avons négligé la dégénérescence possible des niveaux . S'il existe sous-niveaux
dont l'énergie est , nous avons alors trivialement :
886/2001
Sciences.ch 14/03/2005
et en utilisant la formule de Stirling (voir le chapitre des algorithmes dans la section d'analyse
numérique) :
Nous avons :
Nous recherchons maintenant la distribution la plus probable, c'est-à-dire celle qui maximise
. Pour trouver l'extremum, nous allons différencier cette expression tel que :
Or, comme :
Il est donc équivalent et nécessaire d'écrire pour prendre en compte également ses paramètres
intrinsèques (le fait d'ajouter ainsi des termes nuls est nommé "méthode des multiplicateurs de
Lagrange"):
Donc :
ce qui donne après une première simplification (élimination simple de la dérivée des
constantes):
887/2001
Sciences.ch 14/03/2005
d'où :
et donc :
et comme :
888/2001
Sciences.ch 14/03/2005
et donc :
et
889/2001
Sciences.ch 14/03/2005
Nous appelons le terme au dénominateur, la "fonction de partition canonique". Elle est le plus
souvent notée tel que :
DISTRIBUTION DE FERMI-DIRAC
Le principe d'indiscernabilité peut avoir des conséquences très importantes sur la statistique.
Nous distinguons deux types de particules indiscernables : les bosons et les fermions.
Rappels :
R1. Les premiers correspondent à des particules dont la fonction d'onde représentative est
toujours symétrique alors que celles des fermions est antisymétrique.
R1. Le principe d'exclusion de Pauli impose que 2 fermions ne peuvent pas se trouver dans le
même état quantique. Les bosons, eux le peuvent !
Leurs propriétés respectives ont pour conséquence importante que l'énergie minimale d'un
ensemble de bosons est égale à fois l'énergie minimale de chaque boson. Alors que pour
un ensemble de ferions, l'énergie minimale est égale à la somme des énergies les plus
faibles.
Ces deux types de particules entraînent deux types de statistiques : la statistique de Fermi-
Dirac (que nous allons démontrer en premier) et la statistique de Bose-Einstein (qui suivra).
Il n'existe donc qu'une seule manière de répartir fermions sur les états d'énergies
accessibles (au lieu des pour les particules discernables). Il ne peut pas y avoir plus de
particules dans un niveau d'énergie qu'il existe de dégénérescence . Donc
. Le nombre de combinaisons possible pour un niveau , dégénéré fois et
comportant particules est donc la combinatoire . Le nombre total de configurations est
donc :
890/2001
Sciences.ch 14/03/2005
Terme à terme :
Donc finalement :
Pour respecter les contraintes sur l'énergie et le nombre de particules, nous utilisons encore
une fois la méthode des multiplicateurs de Lagrange :
891/2001
Sciences.ch 14/03/2005
et
La principale application aux solides de cette statistique est la modélisation des phénomènes
de transport électronique (gaz d'électrons) : théorie des métaux, des semi-conducteurs
(population des niveaux d'énergie et propriétés de conduction).
DISTRIBUTION DE BOSE-EINSTEIN
Les bosons sont d'autres particules quantiques qui peuvent indistinctement se placer sur tous
les niveaux d'énergie. Le principe de Pauli ne s'applique pas. Dans ce cas, le nombre d'objet à
permuter est (les particules et les intervalles entre les niveaux). Parce que
les particules sont indiscernables et les niveaux et sous niveaux permutables, il faut diviser par
puis aussi par Le nombre de configurations sur un niveau , fois dégénéré
qui contient particules indiscernables est ainsi égal à :
Son logarithme avec usage de la formule de Stirling et après simplification est donné par :
Pour respecter les contraintes sur l'énergie et le nombre de particules, nous utilisons encore
une fois la méthode des multiplicateurs de Lagrange :
et donc :
892/2001
Sciences.ch 14/03/2005
et
893/2001
Sciences.ch 14/03/2005
THERMODYNAMIQUE
La mécanique thermique (ou "thermodynamique") est la partie de la physique qui traite des
relations entre la mécanique, la chaleur et les transformations chimiques (d'où parfois une
distinction claire avec la thermodynamqique chimique) et la chaleur. À l'origine cette science
vient de l'étude des échanges thermiques des machines à vapeur du début du 19ème siècle.
Encore aujourd'hui, et cela en est fort regrettable, l'origine de la thermodynamique se fait
toujours ressentir de par la référence dans les écoles à ses affreux exemples (pistons,
détentes,...) qui ne sont d'aucune aide pratique (pour les étudiants) de par leur ancienneté et
rébarbatifs aux bon élèves théoriciens de peur leur particularié. Cette science a également
pour désavantage d'avoir un total manque de cohérence encore à ce jour dans la rigueur des
définitions, de la structure de présentation (ainsi, il nous semble indispensable de devoir
d'abord étudier la mécanique statistique avant la thermodynamique) et des outils
mathématiques dont il est fait usage.
- La thermodynamique classique
Rappels :
R1. Nous ne reviendrons pas sur la définition de la température notée qui est comme nous
l'avons vu en mécanique des milieux continus (théorème du Viriel) et en mécanique
statistique (rayonnement du corps noir, distributions d'états), est un paramètre qui permet de
relier avantageusement le mouvement moyen de différents corps avec leur énergie cinétique
(sous-entendu leur "excitation" ou "désordre") ou le rayonnement de certains corps avec leur
énergie d'émission.
R2. Nous ne reviendrons également pas sur la définition du concept "d'énergie" et de ses
différentes formes (mis à part la "l'énergie chaleur" que dont nous devons encore démontrer
l'existence dans ce chapitre) et la conservation de cette dernière qui a été largement exposée
dans le chapitre traitant des principes fondamentaux (premiers) de la physique.
894/2001
Sciences.ch 14/03/2005
Remarque : il est très fortement conseillé (voire obligatoire) avant de parcourir ce qui va
suivre, de lire la partie du site (chapitre de calcul différentiel et intégral) traitant des formes
différentielles. Ceci au risque de ne pas comprendre les calculs que nous allons faire et la
provenance des notations dont nous allons faire usage.
Postulats :
P1. Nous postulons que tout système fermé peut au point de vue énergétique être décrit (dans
le repère de son centre de masse) entièrement par son volume , sa pression , sa
température (qui implique la connaissance de l'entropie dans les systèmes régis par la
mécanique statistique), sa masse et les propriétés (chimiques et physiques) de ses
constituants (ce qui implique la connaissance du nombre de ceux-ci).
P2. Nous postulons que tout système ouvert (dans un repère quelconque) peut au point de vue
énergétique être décrit par les paramètres du premier postulat plus par la connaissances de
tous les facteurs agissant depuis l'extérieur du système pour modifier l'état de celui-ci (champ
gravifique, champ électrostatique/magnétique, forces mécaniques, ...)
Définitions :
D2. Nous définissons "l'énergie interne" d'un système, par la somme de tous les types
d'énergie pertinents qui le distinguent tel que : le travail (voir la défintion D3 plus loin), la
chaleur (voir la définition D4 plus loin), l'énergie de masse (quand elle est spécifiée... ce
qui est rarement le cas en thermodynamique classique) et tout autant d'autres que nous
pourrions choisir étant donné les paramètres sous-jacents à ceux énoncés (entropie, pression,
volume, température, potentiel chimique, etc.).
895/2001
Sciences.ch 14/03/2005
D5. "L'entropie", notée est donnée par les développements que nous avons fait dans le
chapitre de mécanique statistique (ce n'est donc pas une définition mais un rappel !!!) . Elle
mesure le désordre d'un système à l'équilibre (ou entre deux équilibres) et est dépendante
comme nous l'avons vu en mécanique statistique dans le cadre d'un système composé de corps
microscopiques, de la température. Ce dernier constat nous amène naturellement à devoir à
l'avenir rechercher une relation entre chaleur, température et entropie (voir plus loin).
D6. Le "potentiel chimique" est un paramètre d'un système thermodynamique régit par les
règles probabilistes de la mécanique statistique qui exprime une variation interne d'énergie
d'un système dû uniquement au nombre des composants qui le constitue.
D8. "L'énergie libre de Gibbs", notée est un concept pratique (dans le sens où ce n'est pas
une entité à part mais juste une façon de décrire un cas particulier de système) introduit par les
thermodynamiciens pour exprimer une variation d'énergie interne d'un système régi par la
mécanique statistique dû aux variations de sa température , de sa pression , et du nombre
de ses constituants à entropie , volume et potentiel chimique constants.
D9. "L'enthalpie libre", notée est un concept pratique (dans le sens où ce n'est pas une
entité à part mais juste une façon de décrire un cas particulier de système) introduit par les
thermodynamiciens pour exprimer une variation d'énergie interne d'un système régi par la
mécanique statistique dû aux variations de sa température , de son volume , et du nombre
de ses constituants à entropie , pression et potentiel chimique constants.
SYSTÈMES THERMODYNAMIQUES
D'une manière générale, un système thermodynamique est l'ensemble des corps situés à
l'intérieur d'une surface fermée que nous appelons "frontière" et que nous notons . La
frontière est en général une surface géométrique imaginaire. Toutefois, rien ne s'oppose à ce
qu'elle coïncide avec une surface réelle, matérialisée par exemple par une paroi solide. La
frontière peut être "indéformable" ou "déformable". Quand elle est indéformable, nous
pouvons distinguer si elle est fixe ou mobile par rapport à un repère déterminé. Quand elle est
déformable, cette distinction n'a plus de sens. Enfin, signalons que la frontière peut se limiter
à une surface élémentaire enveloppant une particule fluide. Nous l'appelons dans ce cas
"frontière particulaire".
Il est souvent intéressant en thermodynamique, de faire le bilan des énergies qui sont
transférées entre le système thermodynamique et le milieu extérieur, c'est-à-dire de considérer
tout ce qui traverse la frontière . Les principaux transferts susceptibles d'être opérés sont les
suivants:
896/2001
Sciences.ch 14/03/2005
3. Transfert de masse
Définitions :
D1. Quand aucun transfert-travail n'est opéré, le système est dit "sans travail". Dans le cas
contraire, il est dit "avec travail".
D2. Quand aucun transfert-chaleur n'est opéré, le système est dit "adiabate". Dans le cas
contraire, il est dit "non adiabate".
D3. Quand aucun transfert de masse n'est opéré, le système est dit "fermé". Dans le cas
contraire, il est dit "ouvert".
Remarques :
R1. Il n'empêche que certains systèmes voient le bilan des actions extérieures qui leurs sont
appliquées nul. Ils sont alors dit "pseudo-isolés".
R2. Pour ce qui est de ses constituants, un système est "homogène" si la nature de des
constituants est égale en tout point, alors qu'il est "uniforme" ou "isotrope" si ses
caractéristiques sont égales en tout point.
- Les différentes types d'énergie échangées avec le milieu extérieur seront affublées quand il
peut y avoir confusion, d'un signe positif lorsqu'elles seront reçues par le système
et négatif, dans le cas contraire.
VARIABLES D'ÉTAT
L'état thermodynamique d'un système est l'ensemble des propriétés qui le caractérisent,
indépendamment de la forme de sa frontière. Les variables qui décrivent l'état du système sont
appelées "variables d'état" ou "grandeurs d'état".
La définition précédente suppose implicitement l'existence d'un état et des variables d'état,
c'est-à-dire que les grandeurs caractéristiques du système sont définies (ou théoriquement
accessibles dans le sens de la mesure) à tout instant et en tout point du système. Ceci est loin
d'être évident si nous considérons des évolutions rapides telles que chose ou explosions. Cette
difficulté peut être éludée en se retranchant sur "l'hypothèse de l'état local".
Énoncé : nous supposons qu'à tout instant, les grandeurs caractéristiques ont localement les
897/2001
Sciences.ch 14/03/2005
mêmes expressions que dans une configuration stationnaire, ce qui sous entend que les temps
nécessaires aux changements d'état sont négligeables devant les durées caractéristiques de
l'évolution.
Le choix des variables d'état dépend de la nature du problème traité. Nous pouvons
néanmoins séparer l'ensemble de ces variables d'état en :
D'une manière générale, une variable intensive dépend du point envisagé dans le système
étudié (température, concentrations, peuvent varier d'une point à l'autre) alors que la grandeur
extensive est définie sur la globalité du système.
Par l'exemple, montrons que le rapport de deux variables extensives est un grandeur intensive.
Rappelons la loi de Boyle-Mariotte (approximation de l'équation de Van der Waals démontrée
en mécanique statistique) :
Définition : un système dans lequel les différentes grandeurs intensives varient de façon
continue constitue une seule "phase".
Nous pouvons donc considérer que toute grandeur intensive dépend des coordonnées du
point envisagé soit : le système est constitué par une seule phase si est
continue quand décrit tout le système. C'est le cas des gaz, des liquides et de certains
solides constituant des solutions solides.
Pour un système homogène, il peut être commode de ramener les variables extensives à l'unité
de masse. Nous parlons alors de "grandeurs massiques" (ou "spécifiques"), généralement
notées en minuscules.
898/2001
Sciences.ch 14/03/2005
- toute grandeur non massique est représentée par une lettre latine majuscule romaine
- toute grandeur massique est représentée par une lettre latine minuscule
LOIS D'ÉTAT
Une "loi d'état" (ou "relation de comportement" ou encore "fonction d'état") est une relation
entre les variables d'état du type :
L'ensemble des variables d'état peut comporter des variables utiles mais non nécessaires à la
description de l'état du système. Nous définissons alors un jeu de variables indépendantes,
nécessaires, auxquelles sont adjointes les variables complémentaires, fonctions des variables
indépendantes.
Par exemple, pour le cas d'un système particulier dont la loi d'état est de la forme :
le système est dit bivariant et nous pouvons indifféremment choisir l'un des couples de
variables indépendantes :
TRANSFORMATION THERMODYNAMIQUE
Il est possible que certaines variables d'état restent constantes lors d'une transformation
thermodynamique, dans ce cas nous distinguons les cas suivants :
- Quand le système a un volume constant pendant la transformation, nous disons qu'il s'agit
d'une transformation "isochore"
- Quand le système a une pression constante pendant la transformation, nous disons qu'il s'agit
d'une transformation "isobare"
- Quand le système a une température constante pendant la transformation, nous disons qu'il
s'agit d'une transformation "isotherme"
899/2001
Sciences.ch 14/03/2005
- Quand le système a une énergie constante pendant la transformation, nous disons qu'il s'agit
d'une transformation "isoénergétique".
- Quand le système a une enthalpie constante, nous disons que la transformation est
"isenthalpique".
- Quand le système a une entropie constante, nous disons que la transformation est
"isentropique"
1. Le cycle thermodynamique fermé : le système décrit une suite de transformations telle que
l'état final et l'état initial de la transformation est identique et que la quantité et les propriétés
des éléments participants au cycle sont toujours les mêmes.
2. Le cycle thermodynamique ouvert : le système décrit une suite de transformations telle que
l'état final et l'état initial de la transformation est identique et que la quantité et les propriétés
des éléments participants au cycle ne sont pas toujours les mêmes.
PRINCIPES DE LA THERMODYNAMIQUE
Remarque : nous aborderons la forme mathématique des principes énconcés ci-après un peu
plus loin dans le texte.
PRINCIPE ZÉRO
Remarque : nous avons démontré en mécanique statistique que l'état d'équilibre est l'état le
plus probable d'un système fermé
Énoncé : pour faire passer un système thermodynamique, adiabate (sans échange de chaleur )
et fermé (sans échange de masse), d'un état déterminé 1 à un autre état déterminé 2, il faut
900/2001
Sciences.ch 14/03/2005
mettre en jeu avec le milieu extérieur (dès lors le système n'est plus fermé ni adiabate) une
certaine énergie.
Cette énergie peut suivant les cas (et il faut alors le déterminer et le démontrer!), être
dépendante ou indépendante des états intermédiaires compris entre l'état 1 et 2.
PRINCIPE DEUXIÈME
Énoncé :
PRINCIPE TROISIÈME
P3. Le "troisième principe" ou "principe de Nernst", qui concerne les propriétés de la matière
dans le voisinage du zéro absolu.
Énoncé :
LES FLUIDES
Remarque : nous pourrions préciser également l'existence des "super-fluides" mais qui font
plutôt l'objet de la thermodynamique quantique.
Une fluide étant essentiellement caractérisé par les trois propriétés suivantes :
P3. Sa masse
Avant de voir les propriétés des trois fluides énoncés précédemment, il convient de définir le
mieux possible les différentes capacités d'une fluide à échanger de la chaleur.
Dans une transformation donnée, un apport de chaleur se traduit en général par une
élévation de la température du système. Nous appelons "capacité calorifique " du
901/2001
Sciences.ch 14/03/2005
système, la quantité :
Remarque : cette capacité n'est pas constante elle dépend bien évidemment de la température.
Mais la thermodynamique considère parfois certains fluides pour lesquels ce n'est pas le cas
(voir plus loin).
Si au lieu de considérer le système entier, nous rapportons les mesure à une unité de masse,
nous définirons la "chaleur spécifique massique" à volume constant (isochore) :
Si au lieu de considérer le système entier, nous rapportons les mesures à une mole du corps
considéré nous définissons les chaleurs spécifiques molaire ( étant le nombre de moles du
système), nous définissons le "chaleur molaire" à volume constant (isochore) :
Dans certaines transformations, nous avons un apport ou un retrait de chaleur alors que la
température du système reste constante (par exemple dans les transformations de changement
de phase d'un corps). Nous parlerons alors de "chaleur latente de transformation " (nous y
902/2001
Sciences.ch 14/03/2005
reviendrons).
M1. Convection : fluide venant alternativement au contact d'un corps chaud et d'un corps
froid
M3. Conduction : le transfert d'énergie se produit des zones chaudes vers les zones froides par
collision des particules les plus excités (zone chaude) avec les particules voisines moins
excitées et ainsi de suite de proche en proche.
Remarque anecdotique : comment construire un système qui minimise les flux d'énergie
thermique ? Réponse : le vase Dewar ou plus simplement... la bouteille "thermos" qui permet
de minimiser la convection, le rayonnement et la conduction.
FLUIDE PARFAIT
Remarque : toutefois, en réalité, aucun fluide ne peut être considéré comme étant parfait :
l'application des relations établies pour les fluides parfaits à des cas réels doit donc être faite
avec circonspection et en tenant compte d'une marge d'erreur appréciable.
D1. Il est constitué par des molécules ponctuelles sans interactions mutuelles (cette hypothèse
provient de la mécanique statistique)
D2. Il obéit aux lois de Boyle-Mariotte (approximation de l'équation de Van der Waals
démontrée en mécanique statistique) :
et d'Avogadro (idem).
D3. Il obéit à la loi de joule et son énergie interne n'est dépendante que linéairement de la
température comme nous l'avons démontré dans le chapitre de mécanique des milieux
continus.
903/2001
Sciences.ch 14/03/2005
D4. Sa chaleur spécifique isobare massique et sa chaleur spécifique isochore massique sont
constantes.
FLUIDE SEMI-PARFAIT
La notion de fluide semi-parfait est intermédiaire entre celle du fluide parfait et celle du fluide
réel. Elle permet l'établissement de relations plus proches de la réalité bien qu'encore
simplifiées.
D1. Il est aussi constitué par des molécules ponctuelles sans interactions mutuelles.
D3. Il obéit à la loi de joule et son énergie interne n'est plus linéairement dépendante de la
température.
D4. Sa chaleur spécifique isobare massique et sa chaleur spécifique isochore massique ne sont
plus constantes, elles sont fonction de la température.
Toutes les relations établies pour le fluide parfait peuvent être utilisées pour le fluide semi-
parfait sous réserve de tenire compte des variations des différentes chaleurs spécifiques.
FLUIDE RÉEL
Les fluides réels sont ceux qui ne satisfont pas aux conditions de définition des fluides parfaits
et semi-parfait. Ce sont les fluides "industriels" qui doivent être bien connus afin de pouvoir
étudier et calculer convenablement les installations et équipements thermiques.
D'une manière générale, nous pouvons dire que les fluides réels sont "plus compressibles" que
les fluides parfaits et semi-parfaits, ce qui est mis en évidence par le facteur de
compressibilité dans la loi l'équation d'état des fluides parfaits :
Les différentes chaleurs spécifiques des fluides réels sont fonction de plusieurs paramètres,
tels que la pression, la température, la proximité de l'état liquide, etc.
Il est du rôle de la mécanique statistique d'établir une forme plus élaborée de l'équation d'état
des gaz perfait de manière à rendre celle-ci apte à représenter valablement les phénomènes
réels. Ce résultat s'obtient, d'ailleurs partiellement, grâche à l'introduction d'expressions de
plus en plus complexes à démontrer comportant de nombreux coefficients correcteurs
(équation de Van der Waals, de Berthelot, de Clausius, de Véron, etc.).
En pratique industrielle, les études et calculs sur les fluides réels sont condutis à l'aide de la
simulation numérique sur ordinateur.
904/2001
Sciences.ch 14/03/2005
ÉNERGIE INTERNE
En mécanique classique, nous avons vu (deuxième théorème de König) que l'énergie totale
d'un corps par rapport à un référentiel galiléen extérieur au centre de masse était donnée
par la somme de l'énergie cinétique et potentielle par rapport à ce même référentiel,
additionné de l'énergie cinétique et potentielle de ce même corps par rapport au référentiel
assimilé à son centre de masse (référentiel barycentrique).
où est la grandeur énergétique propre au centre de masse du corps concerné. Sous une
forme plus simplifiée, la relation précédent s'écrit en thermodynamique :
Remarque : l'énergie interne n'est souvent donnée qu'à une constante additive près, c'est la
raison pour laquelle certains l'appelle à juste titre "surénergie interne". Comme nous l'avons
démontré en mécanique classique, l'énergie totale d'un système, est la somme des énergies
élémentaire de celui-ci. Ainsi, l'énergie interne est une grandeur extensive.
905/2001
Sciences.ch 14/03/2005
Dans la même transformation, la quantité de chaleur se met sous une forme similaire :
Ce qui implique que quelque soit la transformation les variations de travail et de chaleur sont
données par :
Donc quelque soient les façons dont les transformations se font, l'état final et initial sont
identiques ce qui nous impose que la transformation thermodynamique est indépendante de la
manière dont les phénomènes ont lieu à l'intérieur de celui-ci. est alors une différentielle
totale exacte que nous écrirons .
Or, rappelons que nous avons vu en mécanique classique par définition que le travail est
donné par une force sur une distance (quelque soit l'origine de cette force : mécanique,
rayonnante, nucléaire, etc.) :
906/2001
Sciences.ch 14/03/2005
Or, le chemin intervient dans cette expression classique du travail et donc le travail est
grandeur qui dépend du chemin parcouru et comme nous l'avons vu en calcul différentiel et
intégral, ceci implique que nous devons écrire au lieu de . Il existe bien sûr quantité
d'autres manières d'exprimer le travail mais par la définition de celui-ci même, il s'agira
toujours d'une différentielle inexacte.
Ce résultat à une implication directe sur l'expression de la variation de chaleur pour laquelle le
théorème du Viriel nous montre bien dans le cas d'un fluide, que celle-ci n'est donnée que par
l'agitation thermique de celui-ci. Il convient de rappeler que celle-ci est donnée par l'énergie
cinétique moyenne et que l'énergie cinétique existe de par l'application d'une force sur une
distance pour chaque particule du fluide. Ainsi, la chaleur est elle aussi une différentielle
inexacte .
Au cours de son évolution, le volume du système peut donc varier. Si nous considérons
une évolution infiniment petite au cours de laquelle le volume varie de et si nous notons
la pression extérieure subie par le système, nous écrirons dans un cadre plus général :
Sauf systèmes particuliers (piles, accumulateurs,…) la seule énergie échangée (autre que
l'énergie thermique ou de chaleur ) est le travail de refoulement du milieu extérieur, de
sorte que et dès lors nous avons .
Par ailleurs la plupart des système chimiques étudiés sont à la même pression que la pression
extérieur, soit , étant la pression dans le système. Dès lors, nous avons :
La quantité de chaleur mise en jeu dans une transformation isochore (à volume constant)
est bien évidemment égale dès lors à la variation de l'énergie interne tel que :
907/2001
Sciences.ch 14/03/2005
Si nous considérons un système évoluant d'un état 1 vers un état 2 de façon isobare (à
pression constante) :
tel que :
Nous pouvons alors définir une nouvelle fonction d'état commode, "l'enthalpie " (grandeur
extenvise) définie par :
Ainsi, la quantité de chaleur mise en jeu dans une transformation isobare (l'indice est
indiqué dans ce sens) est égale à la variation de la fonction enthalpie :
CHALEUR
Avant de continuer, il va à tout prix nous falloir éliminer une deux des plus grandes difficultés
dans la bonne compréhension de la thermodynamique (mis à part celle de la différenciation
entre les différentielles totales exactes et inexactes qui a déjà été réglée dans le chapitre de
calcul différentiel et intégral) :
Comme nous l'avons vu en mécanique des milieux continus, la température caractérise un état
d'équilibre thermodynamique et traduit l'existence d'une agitation thermique (théorème du
Viriel) et elle peut varier lorsque l'extérieur fournit un travail . Cependant, l'expérience
nous montre que c'est en "chauffant" un système que nous augmentons le plus aisément sa
température. Mais qu'est-ce donc la chaleur ? :
l'énergie étant identifiée avec sa valeur moyenne puisque les fluctuations sont négligeables.
Sa variation au cours d'une transformation infinitésimale (que nous supposons à nombre de
908/2001
Sciences.ch 14/03/2005
Nous pouvons maintenant comparons cette dernière relation (exprimant le premier principe de
la thermodynamique) avec celle qui la précède (découlant de la mécanique statistique).
Examinons d'abord le cas d'une transformation dans laquelle le système reçoit seulement de
lachaleur :
Dans ce cas, aucun des paramètres extérieurs au système ne varie en général dans la
transformation de sorte que . Nous en déduisons :
Ainsi, lorsqu'un système reçoit seulement de la chaleur, son énergie varie par modification
des populations de ses états microscopiques : si la quantité de chaleur reçue est positive, la
probabilité des états d'énergie élevée augmente, au détriment de celle des états de plus basse
énergie. Enfin, si nous tenons compte que le système doit être à l'équilibre (l'état le plus
probable comme nous l'avons démontré en mécanique statistique) dans les états initial et final
de la transformation, nous constatons, comme nous pouvions nous y attendre, que la
température du système varie : elle a augmenté si la quantité de chaleur reçu est positive (cela
se démontre en choisissant une distribution canonique pour décrire les états d'équilibre
macroscopique du système).
Cela explique la confusion fréquente entre ces deux concepts très différents que sont
température et chaleur. Cette confusion est accentuée par le décalage entre le langage
quotidien et la terminologie scientifique. Dans le langage quotidien, lorsque nous parlons de
chaleur d'un corps, nous affirmons en réalité que sa température est élevée. La confusion
regrettable parce que la notion de chaleur est bien présente en physique, mais que sa
signification est autre.
Ainsi, chauffer un système, c'est lui fournir de la chaleur, c'est augmenter son énergie interne
(le nombre de micro-états de haute énergie) par des moyens qui ne sont pas purement
mécaniques. La chaleur est donc une forme d'énergie particulière !
ÉQUATION DE CONTINUITÉ
909/2001
Sciences.ch 14/03/2005
Considérons de manière générale un système ouvert, limité par une frontière quelconque
(déformable ou non) et animé d'un mouvement quelconque (en déplacement ou immobile) par
rapport à un référentiel considéré comme fixe.
Ce système, qui est représenté sur la figure ci-dessous est susceptible de transférer de l'énergie
(ou de la masse) entre lui-même et l'extérieur. Ce système peut être inertiel ou non.
Soit une grandeur extensive . La grandeur quantitative correspondante est (elle peut
exprimer par exemple l'isotropie ou l'anisotropie du système).
Le taux de variation spatial de est donné par la dérivée . Les causes de variations de
peuvent être liées à deux phénomènes différents: les flux et les sources ou puits.
- comme l'élément de frontière, exprimé par un vecteur normal à la surface et dirigé vers
l'extérieur
910/2001
Sciences.ch 14/03/2005
Le terme est un flux par déplacement absolu, caractérisant un flux lié à un écoulement
fluide. Nous avons la relation:
où est la vitesse absolue d'une particule fluide par rapport au référentiel fixe.
Le terme est un flux par déplacement apparent, mis en jeu seulement lorsque la frontière
se déplace (par exemple si le volume est en révolution). Nous avons la relation:
Le terme est le flux total par conduction, caractérisant un flux lié à un phénomène de
transfert de proche en proche, sans déplacement fluide (pex: conduction thermique,
conduction électrique, travail mécanique).
Le terme est un flux par déplacement relatif, résultant à la fois du déplacement du fluide
et de celui de la frontière . Nous avons la relation:
où est la vitesse relative d'une particule fluide par rapport à un point bien défini de la
frontière . En vertu du principe de composition des vitesses (vitesse absolue est la somme
la vitesse relative et de sa vitesse apparente), nous avons:
Lorsque la frontière est traversée par un fluide, le débit-masse élémentaire (c'est la masse
qui nous intéresse en physique donc sera une densité massique) est:
911/2001
Sciences.ch 14/03/2005
Si nous comptons positivement l'effet d'une source, le taux d'augmentation de est donné
par:
En tenant compte à la fois des flux et des sources, nous avons le taux de variation spatial de
:
Dans le cas particulier d'un système en régime permanent (par exemple dans le cas d'un fluide
qui s'écoule ou d'un solide qui est le siège de conduction thermique, de conduction électrique,
de réaction nucléaire,…), toutes les grandeurs locales sont constantes en tout point du
système. Si, de plus, nous choisissons une frontière indéformable, il est possible de
raisonner par rapport à un référentiel lié au système. Nous avons alors, en tout point fixe du
système par rapport à ce référentiel:
; ;
Donc dans le cas particulier d'un système en régime permanent, avec une frontière
indéformable , liée au système, le taux de variation spatial de toute grandeur extensive
scalaire est nul.
912/2001
Sciences.ch 14/03/2005
En prenant en compte les flux des sources et des puits nous avons:
Comme les limites d'intégration (frontière ) sont arbitraires, l'expression entre crochets est
identiquement nulle.
Considérons maintenant que la grandeur extensive scalaire soit la masse , nous avons
alors:
avec .
Comme la masse n'est pas susceptible d'être transférée par un phénomène de conduction (dans
913/2001
Sciences.ch 14/03/2005
un cas classique (non quantique)), nous avons qui est nul. Comme la masse est
conservative, il n'y a ni source, ni puits de masse de sorte que est également nul.
Le relation:
Le signe "-" est ici car nous avons défini le flux entrant comme étant positif. Il est possible
que dans la littérature ainsi que sur ce sit vous trouviez un "+" à la place de ce signe.
Il y a une autre forme beaucoup plus fréquente sous laquelle nous trouvons l'équation de
continuité. Le lecteur aura remarqué que le terme à les unités d'une densité de surface
de courant massique ce qui nous amène en analogie avec l'électronique à noter :
Comme pour l'équation de conservation de la masse nous pouvons écrire pour la chaleur dans
le cas d'absence de sources:
où est la quantité de chaleur par unité de volume et le flux de chaleur dont la quantité
entrante a été définie comme négative.
Une variation de température entraînant une variation de la quantité de chaleur est défini en
première approximation par la loi physique suivante:
914/2001
Sciences.ch 14/03/2005
Le flux de chaleur étant trivialement induit par une différence spatiale de température nous
obtenons alors la "Loi de Fourier" qui exprime le flux de chaleur proportionnellement au
gradient spatial de température:
Le signe "-" étant simplement dû au fait que le flux de chaleur va du plus chaud au plus froid
et exprimant la conductivité thermique du matériau dépendant des propriétés atomiques de
la matière.
En insérant les deux précédentes relations dans l'équation de conservation de la chaleur nous
avons :
D est appelé le coefficient de diffusion thermique. Son explication atomique est donnée par
qui est le produit de la vitesse moyenne des particules transportant la chaleur par
leur libre parcours moyen entre 2 collisions.
RAYONNEMENT THERMIQUE
L'étude du corps noir ou "récepteur intégral" est à la base de la célèbre théorie de la physique
quantique ondulatoire, un des piliers de la physique moderne. En effet, certains résultats
expérimentaux ne pouvaient pas être expliquées sans l'introduction d'une nouvelle constante
universelle : la fameuse constante de Planck.
Définition: un corps noir est défini comme un corps ayant un coefficient d'absorption
énergétique et un coefficient d'émissivité égaux à l'unité (voir la photométrie dans le
chapitre d'optique de la section traitant de l'électrodynamique).
- par conduction: c'est un transfert de chaleur dans ensemble de points matériels en contacts
qui se fait sans mouvements macroscopiques, sous l'influence d'un gradient de température.
915/2001
Sciences.ch 14/03/2005
- par convection: la convection implique le transport de la chaleur par une partie d'un fluide
qui se mélange avec une autre particule. Elle prend sa source dans un transport macroscopique
de matière et ne concerne donc pas les solides.
Le rayonnement thermique émis par un corps porté à une certaine température résulte d'une
conversion de l'énergie interne du corps en rayonnement. Inversement, l'absorption est la
transformation de l'énergie incident en énergie interne.
Lorsqu'un surface est soumise à un rayonnement absorbée, nous effectuons le bilan d'énergie
selon la loi de Kirchhoff vue en photométrie :
Nous allons maintenant nous pencher sur les mécanismes d'absorption et d'émission et établir
un lien entre chaleur et énergie rayonnante avant de nous intéresser directement au corps
noir :
LOI DE STEFAN-BOLTZMANN
Nous avions défini lors de notre étude de la photométrie (voir le chapitre d'optique dans la
section d'électrodynamique) le concept d'émittance (énergie irradiée par un corps non
ponctuel par unité de surface) pour l'ensemble du spectre.
Ce que nous avions omis de préciser cependant, c'est que pour qu'un corps rayonne (outre le
fait qu'il puisse être lui-même éclairé par un autre corps) il faut qu'il soit chauffé (que l'on
fournisse un énergie d'excitation aux constituants au corps en question – sous-entendu aux
électrons).
Donc nous devrions pouvoir établir une relation entre la température d'un corps et son
émittance.
916/2001
Sciences.ch 14/03/2005
où est l'intégration sur toutes les longueurs d'onde (ou les fréquences... peu importe) de
:
avec donné par la loi de Planck que nous déterminerons plus tard.
Rappelons également que (ceci sera démontré lors de notre démonstration de la loi de
Planck) :
Rappelons l'expression de la "relation d'Einstein" que nous avons démontrée lors de notre
étude de la relativité restreinte :
Considérons maintenant une enceinte de volume dont les parois sont réfléchissantes pour
les photons (cas du corps noir). Nous étudions la variation de la quantité de mouvement avant
et après la collision sur une surface infiniment petite (ce qui permet de considérer les
trajectoires avant et après le choc comme rectilignes et symétriques par rapport à l'axe orienté
perpendiculaire à la surface du corps noir et coïncidant avec la surface ).
et après collision :
917/2001
Sciences.ch 14/03/2005
et
Comme :
Remarque importante (très) : nous supposons qu'après son rebond, le photon conserve sa
fréquence (ce qui nous amène à supposer que le corps noir comporte des ondes stationnaires à
l'équilibre thermodynamique).
Jusqu'à présent, nous avons raisonné sur un photon mais l'enceinte contient un gaz de photons.
L'énergie interne volumique du rayonnement contient une densité volumique de
photons de fréquence identique égale à :
Remarque : nous précisons les unités car nous avons remarqué que la suite posait parfois
quelques problèmes de compréhension.
918/2001
Sciences.ch 14/03/2005
Dans cette dernière expression, nous avons supposé que tous les photons de avaient une
quantité de mouvement dans la direction sous tendue par . En réalité, les photons arrivant
réellement sur sont contenus dans un angle solide entre deux cônes de demi-angle au
sommet et (pour des raisons de géométrie de l'expérience du corps noir qui était,
sauf erreur, sphérique et par ailleurs cette symétrique sphérique facilite les calculs…).
Le nombre compris dans l'angle solide élémentaire qui parvient sur la surface
sous un angle d'incidence compris entre et est alors :
919/2001
Sciences.ch 14/03/2005
Ce qui est équivalent à écrire (à l'équilibre thermodynamique pour une température donnée) :
Supposons que ce volume puisse varier. Le travail de la pression de radiation lors d'une
dilatation du volume est :
d'où :
Nous avons :
920/2001
Sciences.ch 14/03/2005
En simplifiant :
Soit :
Finalement :
Nous voyons ci-dessus la correspondance qu'il y a entre la relation que nous avons posé au
921/2001
Sciences.ch 14/03/2005
et
Comme nous n'avons pas encore, à ce point, démontré la loi de Planck, nous pouvons faire un
raisonnement osé mais que nous justifierons par la suite avec démonstration à l'appui.
Remarque importante : les deux dernières relations nous donnent une information
fondamentale comme quoi tous les corps qui ne sont pas à zéro kelvin (au zéro absolu)
rayonnent.
et sont différenciées au niveau des unités par les dimensions d'une vitesse. Or,
intuitivement et grossièrement (…), la vitesse qui peut tout de suite nous apparaître comme
triviale dans ce cas d'étude est la vitesse de la lumière . Ainsi, nous remarquons que :
Curieux n'est-ce pas… mais nous le démontrerons plus loin car notre philosophie sur ce site
est de ne jamais (ou le moins possible) laisser place à l'intuition.
Remarque : lorsque nous étudierons la loi de planck, sera noté afin de ne pas
confondre la radiance avec une densité d'énergie (car la notation peu malheureusement porter
à confusion)
Considérons maintenant une chambre ou cavité isolée (comme une fournaise) en équilibre
thermique à une certaine température . Cette cavité sera sûrement remplie de rayonnement
électromagnétique de différentes longueurs d'onde. Supposons qu'il existe une fonction de
distribution dépendant uniquement de la température.
Nous voyons ainsi que est une fonction universelle, la même pour toutes les cavités
sans égard à leur composition, leur géométrie ou la couleur de leur paroi. Kirchhoff ne donna
pas cette fonction mais il fit remarquer qu'un corps parfaitement absorbant, c'est-à-dire un
corps pour lequel apparaîtra (façon de dire…) noir.
Il vient alors que le rayonnement emmagasiné en équilibre dans une cavité isolée en équilibre
thermodynamique (comme le sont les étoiles) est à tous égards la même que celle émise par
922/2001
Sciences.ch 14/03/2005
Evidemment, si la cavité est fermée, nous ne pouvons pas mesurer le courant d'énergie qui
s'en échappe. Mais pratiquons un tout petit trou dans cette cavité (suffisamment petit pour ne
pas perturber l'équilibre du rayonnement électromagnétique à l'intérieur), alors l'énergie
électromagnétique s'échappant de ce petit trou est la même que celle émise par un corps
parfaitement noir.
Cependant, aucun objet n'est réellement un corps noir. Le noir de charbon a un coefficient
d'absorption très près de 1 mais seulement pour certaines fréquences (incluant, bien sûr, le
visible). Son coefficient d'absorption est beaucoup plus petit dans l'infrarouge lointain. Tout
de même, la plupart des objets s'approchent dans certaines gammes de fréquence. Le corps
humain, par exemple, est presque un corps noir dans l'infrarouge (d'où les lunettes de nuit
militaires…). Pour traiter les différents corps (appelés "corps gris"), nous introduisons un
facteur appelé émissivité totale, , qui relie l'émittance émise par le corps à celle émise par
un corps noir parfait pour lequel . Nous avons donc :
Remarque : la relation de Stefan-Boltzmann nous donne la puissance émise par un corps par
unité de surface en l'exprimant de façon proportionnelle à la quatrième puissance de la
température. Cet exposant nous donne la raison pour laquelle il devient de plus en plus
difficile d'augmenter la température d'un corps en le chauffant, celui-ci perdant de plus en
plus rapidement l'énergie que nous fournissons pour son échauffement.
LOI DE PLANCK
Définition : nous considérons le corps noir comme un système isolé à l'équilibre thermique.
Dans lequel le rayonnement est à l'état stationnaire et réfléchi totalement par les parois. Les
photons peuvent être dès lors considérés comme des particules n'interagissant pas entre elles
dans un puits de potentiel à parois rectiligne
Les conditions que nous avions imposées lors de notre étude de ce cas en physique quantique
ondulatoire étaient trop restrictives (c'est la raison pour laquelle elles sont appelées
"conditions aux limites strictes"). Effectivement, les atomes de la paroi absorbent et émettent
le rayonnement quel que soit la manière dont le rayonnement est incident. Mais l'équilibre
impose au moins qu'elles soient que les conditions aux limites soient périodiques de par la
définition même de l'équilibre. C'est la raison pour laquelle nous imposons ce que nous
appelons les "conditions au limites périodiques" :
923/2001
Sciences.ch 14/03/2005
L'énergie totale de la particule présente donc une suite discrète de valeurs, les seules permises.
La valeur de est quant à elle déterminée à l'aide du modèle de Bohr ou de Sommerfeld en
fonction des cas.
Puisque les fonctions d'onde correspondantes dans le puits sont , nous avons
donc:
Ainsi, étant donné que la fonction d'onde est une probabilité conditionnelle, nous avons sous
forme de phaseur :
924/2001
Sciences.ch 14/03/2005
Remarque : nous constatons facilement que les écarts d'énergie entre niveaux consécutifs sont
d'autant plus faibles que les dimensions du corps noir (assimilé à une boîte) sont
plus grandes; pour des dimensions macroscopiques, ces écarts sont alors totalement
inappréciables. Ce constat nous permettra un peu plus loin de faire une petite approximation.
donc environ …
Les vecteurs qui nous intéressent (puisqu'ils représentent respectivement chacun un micro-
état possibles), plongé dans l'espace des phases des nombre d'onde, ont leur extrémité situées
en l'un des nœuds d'un réseau tridimensionnel constitué de mailles élémentaires dont les
arêtes sont parallèles aux axes et qui mesurent respectivement . Nous
voulons évaluer le nombre de vecteurs pour lesquels cette extrémité tombe dans l'intervalle
entre les deux sphères centrées à l'origine et de rayons de norme et . Le volume de
la coquille sphérique comprise entre les deux sphères est donc trivialement donnée par :
Le nombre de mailles élémentaires (de micro-états) incluses dans cette région de l'espace des
est, à peu de chose près, égal au nombre de fois que son volume contient celui de la maille
élémentaire, qui vaut :
Nous obtenons ainsi le nombre de micro-états dans le volume (donc la densité de micro-
états) :
925/2001
Sciences.ch 14/03/2005
Or, il ne faut pas oublier les relations suivantes (voir chapitre de mécanique ondulatoire,
physique quantique corpusculaire et relativité restreinte) :
Donc :
Il vient :
Dans un corps noir à l'équilibre thermodynamique, les photons forment un gaz dont les
constituant n'interagissent pas entre eux chimiquement. Ce type de situation est typiquement
décrite par la distribution de Bose-Einstein que nous avons vu en mécanique statistique. Ainsi,
puisque , nous avons dans le cas d'un spectre discret d'états :
926/2001
Sciences.ch 14/03/2005
et puisque :
et
donc :
Planck a proposé cette loi en 1900 sans connaître la distribution statistique de Bose-Einstein !
927/2001
Sciences.ch 14/03/2005
Nous pouvons également redémontrer la loi de Stefan (nous l'avons déjà fait en
thermodynamique mais avec une autre démarche) mais en plus démontrer la provenance de la
constante de Stefan-Boltzmann .
Rappelons que d'abord que le flux énergétique (voir chapitre d'optique géométrique) est entre
autres donné par :
L'énergie rayonnée à travers une surface élémentaire donnée est donc dès lors :
928/2001
Sciences.ch 14/03/2005
Enfin, il est utile de considérer la puissance totale émise par unité de surface (donc
l'émittance) :
Si nous intégrons sur la demi-surface d'une sphère (par rapport au point de surface de
l'émetteur) :
Donc :
929/2001
Sciences.ch 14/03/2005
Déterminons pour quelle longueur fréquence, nous avons le maximum de densité d'énergie.
En d'autres termes cela revient à chercher où la dérivée :
s'annule. Donc :
Divisons par :
La dernière relation peut admet une seule racine positive que nous pouvons déterminer avec
Maple (evalf(solve(exp(-x)-1+1/3*x=0,x));) :
Insistons sur le fait que la loi de Planck n'est valable que dans les cas où le rayonnement est à
l'équilibre thermique. Cette restriction est important dans la pratique, car la phénomènes
d'émission ou d'absorption de rayonnement par la matière se produisent le plus souvent dans
des conditions hors de l'équilibre : dans le cas par exemple de l'éclairage par une lampe
électrique ou du chauffage électrique par rayonnement infrarouge, il y a transformation
irréversible (et donc hors d'équilibre) d'énergie électrique en énergie de rayonnement; de
même, le rayonnement solaire est produit par les réactions nucléaires qui ont lieur à l'intérieur
du soleil et qui consument peu à peu sa substance; au niveau microscopique également,
l'émission d'un photon par un atome excité est très souvent un retour irréversible de l'atome à
son état fondamental (émission spontanée hors d'équilibre). Dans le cas du corps noir, au
930/2001
Sciences.ch 14/03/2005
contraire, le rayonnement est confiné à l'intérieur d'une enceint fermée (nous laissons
éventuellement une fraction négligeable de ce rayonnement s'échapper à l'extérieur pour y être
soumise aux mesures) et nous pouvons ainsi parvenir à l'équilibre thermique avec les parois.
La loi de Planck que nous avons démontrée précédemment est parfaitement vérifiée par
l'expérience dans tout le domaine de températures accessibles à ce jour :
931/2001
Sciences.ch 14/03/2005
Au sens strict du terme, la mécanique des milieux continus (abrégée "M.M.C." parfois) est la
branche de la mécanique qui se propose d'étudier l'étude des mouvements, des déformations,
des champs de contraintes au sein de milieux continus.
Définition : nous désignons par "milieu continu" tout fluide (solide, liquide, gaz ou plasma
selon ce que nous avons vu en thermodynamique), déformable ou non, quand nous le
considérons d'un point de vue macroscopique, par opposition à une description corpusculaire.
Cette branche apparaît souvent comme la science de l'ingénieur qui permet de comprendre et
de décrire le monde matériel qui nous entoure et les phénomènes courants qui s'y déroulent:
mouvements de liquides, de gaz, vol des avions, hélicoptères, fusées, satellites, navigation des
bateaux, déformations des corps solides, structure interne des étoiles, etc. Par ses attaches à la
mécanique thermique (thermodynamique), elle s'étend jusqu'à la thermique, l'énergétique,
l'acoustique.
Prenant en compte les comportements des milieux continus, elle englobe l'hydrodynamique,
la dynamique des gaz, l'élasticité, la plasticité et d'autres comportements. Elle est la clé de ce
que nous appelons aujourd'hui la "modélisation", qui n'est autre que l'art d'analyser un
phénomène physique et de le décrire en termes mathématiques, ce qui permet de l'étudier avec
la rigueur propre à cette discipline.
Cette section du site est séparée en 4 parties principales: solides, liquides, gaz et plasmas.
Dans chaque partie, nous introduirons les outils mathématiques spécifiques à l'étude de tel ou
tel milieu continu avec une complexité (toute relative) croissante. Cependant, par choix il a
été décidé d'exposer les théorèmes avec les outils mathématiques les plus simples possibles
mais tout en arrivant aux mêmes résultats. Ainsi, par exemple, l'équation de Navier-Stokes qui
prendrait 150 pages de développements mathématiques rigoureux n'en prend plus que 27. Il y
a donc un avantage non négligeable aussi bien pour l'auteur que pour le lecteur à procéder
ainsi.
SOLIDES
Des atomes d'un même élément ou d'éléments différents s'assemblent en des édifices
spécifiques. Cela conditionne la force de leurs interactions électriques, qui définissent la
structure finale de la substance. Dans les conditions normales sur notre planète, la matière
existe à l'état solide, liquide, gaz ou plasma. Si les forces interatomiques sont assez intenses ,
la collection de particules conserve sa forme et son volume.
Cette propriété de conserver la forme et le volume, ainsi que des propriétés élastiques
distinguent les solides.
PRESSIONS
Les notions de "compression" et "contrainte" (que nous pouvons englober dans le terme de
"pression") sont de première importance en mécanique des fluides. Il convient donc de définir
932/2001
Sciences.ch 14/03/2005
Si une force agit sur une surface finie, nous parlons alors de "force répartie".
D2. Nous appelons "pression de contrainte" et nous notons le rapport entre la force qui tire
sur un élément de surface . Ainsi, sous forme vectorielle:
Nous pourrions très bien englober les deux définitions ci-dessus en une seule et travailler avec
les signes des forces. Mais par souci de cohérence avec ce qui est enseigné dans les écoles,
nous garderons ces deux définitions qui s'identifient par définition par le fait que leurs forces
sont opposées par rapport à un élément de surface .
D'une manière ou d'une autre, une contrainte de compression ou de traction peut déformer le
triplet hauteur, largeur, épaisseur d'un corps. S'attaquer directement à l'étude d'un cas qui
déforme ces trois paramètres est une peu long et sera abordée dans le chapitre traitant de la
détermination de l'expression du module de Young de cisaillement.
Mais il est utile, ne serait-ce que du point de vue du vocabulaire de donner un exemple à partir
du cas le plus simpliste qui puisse être. Si nous imaginons un corps élastique d'une dimension
(ayant ni hauteur, ni largeur mais juste une longueur) sous l'application de deux forces de
contraintes parfaitement colinéaires mais antagonistes, nous pouvons imager que le corps en
considération s'allonge d'un certain facteur.
Définition: la déformation normale sous des forces axiales et antagonistes est donnée par le
933/2001
Sciences.ch 14/03/2005
rapport entre la variation de longueur du corps sur sa longueur initiale tel que:
Cette relation est une forme extrêmement simplifiée de tous les types de déformations qu'il
peut exister et que nous verrons plus loin en détails.
Dans un cas plus général, les ingénieurs ont pour habitude de définir les points représentés ci-
dessous dans leurs mesures d'essais de traction:
934/2001
Sciences.ch 14/03/2005
La caractéristique ci-dessus comporte une partie linéaire comme c'est le cas d'une certaine
classe de matériaux. Cela signifie que la pente de la caractéristique est une constante, qui
reflète la déformation élastique du matériau sous l'effet de la contrainte croissante. Cette
contrainte élastique par unité de déformation définit le "module de Young" (il n'y a pas de
composante tangentielle dans ce cas d'étude !):
cette relation étant valable aussi bien en contraintes de compression qu'en traction.
LOI DE HOOK
Il est assez intuitif de supposer que plus la force de liaison des atomes constituant le matériau
étudié est grande, plus grande est la force à appliquer pour éloigner les atomes, donc pour
étirer le corps. Les solides qui ont des grandes forces de liaisons, ont une haute température de
fusion (cela est approfondi dans le chapitre traitant de la chimie quantique).
Si nous notons :
935/2001
Sciences.ch 14/03/2005
Mais il existe plusieurs types de contraintes avec leurs modules respectifs. Ainsi voici la
définition des plus importantes dans la partie linéaire de leur caractéristique:
Nous pourrions encore définir beaucoup de modules tels que le module de flexion, de flexion
pure, de flexion composée, de torsion… Nous étudierons certains d'entre eux plus loin.
Pour chacune des différentes définitions de modules que nous pouvons envisager, nous
pouvons définir une loi de Hook qui lui est adapté. Cependant, tout cela peut vous paraître
assez arbitraire mais au fait il n'en est rien car toutes les définitions de modules que nous
avons vues précédemment sont un cas particulier d'un relation mathématique généralisée
donnée par (nous le démontrerons plus loin) la relation tensorielle:
936/2001
Sciences.ch 14/03/2005
Nous espérons pouvoir un jour dans ce site présenter le développement qui nous permet
d'arriver à cette relation. En attendant, les développements qui vont suivre et qui n'utilisent par
choix personnel en aucun cas le calcul tensoriel, doivent suffire aux étudiants des hautes
écoles relativement aux objectifs qui doivent êtres atteints dans leur programme scolaire.
MODULE DE GLISSEMENT
La condition nécessaire pur qu'un solide rigide soit en équilibre statique est comme nous
l'avons vu en mécanique classique, que la résultante des forces que l'extérieur exerce sur le
corps soit nul:
Cependant, quand un solide subit des contraintes et qu'il peut en subir, il peut y avoir
déformation qui peut être suivie d'une rupture ou d'une modification similaire. Plus,
précisément, il y a "déformation" d'un corps (non nécessairement solide) quand les distances
entre certains points du corps ont changé.
Lorsque dans l'étude théorique de l'élasticité, nous excluons les modifications du corps étudié
telles que les ruptures: nous disons que nous nous restreignons aux "déformations élastiques".
Le géométrie et la physique des déformations peut être complexe. Leur description se déduit
de celle d'un certain nombre de déformations élémentaires dont nous préciserons plus loin les
caractéristiques.
Les forces scalaires de contraintes de traction engendrent sur leurs faces respectives
des tensions "normales" (perpendiculaire donc):
937/2001
Sciences.ch 14/03/2005
En admettant que la force agit seule, la déformation unitaire est par définition :
où le signe "-" indique une contraction et où est une coefficient appelé "coefficient de
poisson".
Si agit seule:
En acceptant le principe de superposition des forces, l'effet produit par plusieurs forces
agissant simultanément est égal à la somme des effets produits par chacune des forces
superposées agissant séparément.
Ceci est admissible, étant donné la linéarité des équations unissant la déformation unitaire et
la tension normale. Nous obtenons alors:
A partir des relations précédentes, il est aisé de trouver les équations unissant à :
938/2001
Sciences.ch 14/03/2005
Soit un matériau soumis à des contraintes diverses. A l'intérieur de celui-ci, nous opérons, par
la pensée, l'extraction d'un parallélépipède rectangle. Les faces de celui-ci sont sollicitées par
des contraintes normales et tangentielles (sur le schéma ci-dessous le solide est en
équilibre statique).
Il est intéressant (dans le sens que cela facilite l'analyse) de rechercher les contraintes qui
existent dans un plan faisant un angle avec l’axe des . Pour ce faire, nous imaginons un
triangle de matière ayant un angle au sommet enlevé hors de la matière mentalement. Nous
négligerons l'effet de la pesanteur.
Soit :
939/2001
Sciences.ch 14/03/2005
Posons:
- Les contraintes exerçant une traction sont positives alors que les tensions exerçant une
compression sont négatives.
- Les contraintes ayant tendance à faire tourner le parallélépipède dans le sens des aiguilles
d’une montre, sont positives. Dans le sens anti-horaire, elles seront négatives.
Rappelons que:
940/2001
Sciences.ch 14/03/2005
comme :
et
alors :
Finalement :
comme:
Finalement :
941/2001
Sciences.ch 14/03/2005
Il s'agit d'un bloc de matière dont l'on extrait virtuellement un plan de forme carré que l'on va
étudier en prenant en première partie qu'un des triangles rectangle le composant pour ensuite
étudier l'ensemble.
Avant la sollicitation, nous considérons donc le losange qui est en fait un carré à
suivant la direction .
Remarque : l’angle est appelé "angle de glissement" et nous le considérerons comme faible.
Nous pouvons nous rendre compte de l’effet de la déformation en isolant le losange et en lui
faisant subir une rotation de . Après déformation, nous avons la forme indiquée par les
lignes en pointillées (Fig. B).
Donc représente le glissement du coté par rapport à divisé par la distance entre les
deux plans et . L'analyse qui vient d'être effectuée reste valable quel que soit le corps
solide ou liquide considéré.
Soit, à présent, le cas d'un solide élastique obéissant à la loi de Hook. Le problème va
consister à établir la relation entre l'angle de glissement et les contraintes tangentielles
942/2001
Sciences.ch 14/03/2005
Comme:
Nous avons :
et
Donc :
Or:
943/2001
Sciences.ch 14/03/2005
Soit:
MODULE DE COMPRESSIBILITÉ
Nous reste encore à voir la provenance mathématique de l'expression d'un autre module tout
aussi important que le module en cisaillement: le module de compressibilité .
Si les forces appliquées sur le cube sont égales en intensité nous avons:
944/2001
Sciences.ch 14/03/2005
Or:
Finalement:
ou encore:
MODULE DE FLEXION
945/2001
Sciences.ch 14/03/2005
Comme la matériau subit à sa surface à la fois une compression et à l'opposé une tension, il
doit donc exister une frontière (un ligne ou un plan) ou aucune contrainte n'existe. Cette ligne
ou ce plan (c'est rare que nous ayons affaire à un matériau ayant uniquement deux
dimensions…) est appelé "plan neutre" (ou Neutral Plan en anglais, abrégé NP). Ce plan
neutre va nous servir de référence pour définir la contrainte de flexion.
et la longueur par:
946/2001
Sciences.ch 14/03/2005
Si nous multiplions l'intégrale par alors la relation doit être égale au moment de force
appliqué tel que:
947/2001
Sciences.ch 14/03/2005
comme ce que les ingénieur nomment "le moment d'inertie de la barre par rapport au plan
neutral". Ce terme représente une mesure de la rigidité de la section transversale de la barre
d'un point de vue géométrique, sans considérations des propriétés matérielles.
Substituant cette relation dans l'équation de contrainte de flexion, nous obtenons le "module
de flexion":
LIQUIDES
Les fluides usuels sont de deux types: les liquides et le gaz (les solides sont aussi parfois
considérés comme des fluides...ce n'est qu'une question d'opinion..). Etymologiquement, un
fluide est susceptible de s'écouler. Le liquide adopte la forme du récipient qui le contient tout
en conservant un volume propre à peu près invariable. Le gaz n'a pas de volume propre: il
envahit uniformément (mécanique statistique de Boltzmann) le récipient dans lequel il est
maintenu. Une atmosphère en constitue un cas spécial, du fait qu'elle est maintenue par la
gravité à la périphérie d'un astre, ce qui exclut l'uniformité de la densité ou pression.
La distinction entre liquide et gaz est subtile. Nous pouvons cependant dire que le volume
propre des liquides manifeste l'existence d'une cohésion liée à une densité assez grande
(liaisons de Van der Waals); cette cohésion disparaît avec le volume propre chez les gaz.
Si l'on compare les fluides avec les solides, la première remarque qui s'impose concerne
l'isotropie (les propriétés sont les mêmes dans toutes les directions spatiales) des fluides
usuels qui est toujours réalisée (si l'on agit pas sur le fluide en tout cas!).
Nous allons aborder la théorie de la mécanique des fluides en difficulté croissante et par
redondance. D'abord il va être démontré que les propriétés d'un fluide statique sont isotropes
(théorème de Pascal). A l'aide de ce résultat, il va être plus simple de comprendre le théorème
de Bernoulli qui va nous permettre, entre autres, de définir la concept de "pression
hydrostatique". Ensuite, nous construirons un modèle très important de la dynamique des
fluides, connus sous le nom de "équations de Navier-Stokes", que l'on dans tous les domaines
possibles (astrophysique, mécanique quantique, météorologie,..). Ce modèle de dynamique
des fluides est conséquent en développements théoriques et résultats expérimentaux et peut
être considéré comme un terrain difficile. Cependant, pour faciliter la lecture, nous avons
choisi de ne pas aborder celui-ci directement par usage du calcul tensoriel. Nous avons ainsi
948/2001
Sciences.ch 14/03/2005
fait en sorte que les variables tensorielles apparaissent d'elles-mêmes d'écoulant des résultats
simples de l'analyse vectorielle que nous obtiendrons. Une fois les équations de Navier-Stokes
déterminées et démontrées, nous verrons que nous pouvons retrouver l'expression du
théorème de Bernoulli à partir de ces mêmes équations.
THÉOREME DE PASCAL
Le résultat qui va suivre est de la plus haute importance pour comprendre l'ensemble de la
mécanique des fluides. Il faut prendre le temps de comprendre !
Le système étant en équilibre, la résultantes des forces de réaction du système est nulle.
Nous avons donc les équations suivantes résultant de la projections suivant les trois axes de
coordonnées:
949/2001
Sciences.ch 14/03/2005
Les fluides incompressibles transmettent intégralement et dans toutes les directions, les
pressions qui leur sont appliquées.
Ce théorème est fondamental aussi bien en mécanique des fluides qu'en mécanique des gaz et
les implications pratiques sont énormes (ce théorème explique entre autres, que la pression est
indépendant de la géométrie du contenant du liquide) !
VISCOSITÉ
En mécanique des fluides, il est utile de considérer plusieurs types fluides ayant des
caractéristiques qui les différent. Ceci s'avère particulièrement pratique pour les simulations
tout en restant conforme à l'observation expérimentale.
Nous définissons la "viscosité " par les forces internes s'opposant au déplacement des
diverses couches composant le fluide. Nous distinguons la "viscosité dynamique" et la
"viscosité cinématique" .
1. La viscosité dynamique:
Conclusion: le Poiseuil est la viscosité d'un fluide nécessitant 1 Newton pour faire glisser à la
vitesse de 1 mètre pas seconde, deux couches fluides de 1 mètre carré distantes de 1 mètre.
950/2001
Sciences.ch 14/03/2005
Soit:
Il existe encore un 3 autres types de fluide non représenté sur le schéma et dont la viscosité est
supposée nulle (voir chapitre de thermodynamique) :
LOI DE POISEUILLE
951/2001
Sciences.ch 14/03/2005
En 1835 un médecin français, Jean Léonard Marie Poiseulle fit une série d'expériences
soignées, pour déterminer comment un fluide visqueux s'écoule dans un tuyau étroit. Son but
était de comprendre la dynamique de la circulation sanguine chez l'homme. Le plasma du
sang se comporte comme un fluide newtonien, tandis que le sang entier ne l'est pas. Presque la
moitié du volume normal du sang est faite de cellules assez grandes pour pérturber
l'écoulement laminaire, surtout quand elles entrent en contact avec les parois des vaisseaux,
un phénomène qui prend de l'importance dans le capillaires très étroits. Néanmoins, l'analyse
de Poiseuille s'applique à l'écoulement dans les veines et les plus grosses artères et elle a une
grande valeur, bien qu'elle soit un peu simpliste.
Le résultat de Poiseuille peut être établi en considérant le fluide dans un tuyau comme formé
de couches cylindriques orienté selon un axe de rayon concentriques qui se déplacent à
des vitesses qui vont en décroissant à parti du centre (symétrique circulaire supposée).
Ce qui nous donne la force de viscosité sur le cylindre. La surface de contact de chaque
couche cylindrique de longueur est donnée par et donc :
L'origine de l'accélération (in extenso de la force) ne peut se faire que par une différence de
pression telle que ce qui nous amène à écrire :
Soit :
952/2001
Sciences.ch 14/03/2005
Nous trouvons donc le résultat logique que le débit augment avec le gradient de pression
et le rayon du tube, et diminue avec la viscosité.
THÉORÈME DE BERNOULLI
Quand nous discutons du mouvement d'un fluide, l'équation de continuité (voir le chapitre
thermodynamique), qui exprime la conservation de la masse du fluide est une notion
importante.
Considérons cette équation dans le cas particulier qui nous intéresse ici un fluide non
visqueux en écoulement laminaire se déplaçant à l'intérieur d'un tube de lignes de courants
parallèles (le mouvement du fluide est de type irrotationnel - voir le chapitre d'analyse
vectorielle du site), délimité par la surface :
De même:
953/2001
Sciences.ch 14/03/2005
pendant le même intervalle de temps. Avec les hypothèses faites, la conservation de la masse
exige que les deux masses soient les mêmes, ou que exprimé autrement:
D'où:
Ceci est la forme de l'équation de continuité dans le contexte qui nous intéresse. De plus, si le
fluide est incompressible, la densité est partout la même et l'équation précédente se réduit à:
Ces deux volumes sont égaux car le fluide est incompressible et l'équation de continuité est
valable. Soient et les forces exercées sur les surfaces et en raison de la pression
existant dans le fluide. A cause de ces forces, le fluide produit ou reçoit du travail en
déplaçant les deux volumes. En , la surface est poussée par le fluide et le travail exercé sur
le fluide alors qu'en le fluide pousse la surface et le travail effectué par le fluide est
. Le travail total exercé sur le volume de fluide situé entre et est donc:
954/2001
Sciences.ch 14/03/2005
Le travail extérieur exercé sur le système change son énergie propre comme l'établit la
thermodynamique ( ). Pour le volume de fluide considéré, l'énergie propre des
volumes mis en évidence comprend l'énergie cinétique et l'énergie potentielle de gravitation.
Le fluide entre et gagne de l'énergie dans le volume . Supposons que les deux
volumes aient une masse égale , de nouveau à cause de l'équation de continuité. Alors le
gain net d'énergie est:
Puisque nous avons déjà supposé le fluide incompressible, la densité est la même partout et
peut être remplacé par aux deux extrémités. D'où:
ou:
Comme l'équation ci-dessus concerne des grandeurs prises en deux points arbitraires le long
d'une ligne de courant, nous pouvons généraliser et écrire:
955/2001
Sciences.ch 14/03/2005
Donc, dans un tuyau horizontal, la vitesse est d'autant plus grande que la pression est plus
faible et réciproquement. Nous utilisons cet effet pour créer la poussée d'un avion.
Le profil d'une aile est construit de telle sorte que l'air a une vitesse plus grande au-dessus de
la surface de l'aile qu'au dessous qu'au dessus, ce qui produit une pression plus forte au-
dessous qu'au dessus. Il en résulte donc une force résultant vers le haut.
- à l'extrados : Par effet de courbure, les particules d'air sont contraintes de parcourir une
distance plus grande ;leur vitesse va donc d'abord s'accroître fortement pour diminuer ensuite
afin de retrouver au bord de fuite la vitesse initiale de l'écoulement. Tout l'extrados est donc le
siège d'une dépression locale généralisée. La couche limite, d'abord laminaire, devient peu à
peu turbulente, voire tourbillonnaire lorsqu'on approche du bord de fuite.
THÉORÈME DE TORICELLI
956/2001
Sciences.ch 14/03/2005
vitesse d'écoulement du liquide de cet orifice. Le volume est supposé être assez grand pour
que ni le niveau du liquide, ni la pression au-dessus de sa surface ne varient de façon
appréciable pendant l'écoulement. Comme le tube d'échappement de liquide va de la région de
la surface du liquide à l'orifice ouvert à l'air libre, nous avons . Un liquide coulant à
l'air libre est à la pression atmosphérique , , car le liquide est entouré d'air libre et rien
ne peut maintenir une différence de pression. D'après l'équation de Bernoulli, avec
, nous trouvons :
d'où :
Cette relation constitue le "théorème de Toricelli". Chose curieuse, nous avons déjà vu cette
relation en mécanique classique pour la vitesse de chute libre d'un corps. Il en retourne
l'observation faite par Toricelli : si le jet est dirigé directement vers le haut, il atteint presque
le niveau de la surface du liquide dans le volume. La raison pour laquelle le jet n'atteint pas
effectivement ce niveau est une certaine perte d'énergie à cause du frottement.
EFFET VENTURI
qui veut dire, comme nous l'avons vu, qu'une diminution de la section traversée par le fluide
se traduit par une augmentation de sa vitesse.
Dans toute situation où le flux entrant est environ au même niveau que le rétrécissement
, l'équation de Bernoulli s'emploie pour exprimer la différence de pression :
957/2001
Sciences.ch 14/03/2005
devient :
ÉQUATIONS DE NAVIER-STOKES
958/2001
Sciences.ch 14/03/2005
Nous pouvons, comme nous l'avons représenté ci-dessus, décomposer et translater l'ensemble
des forces auxquelles est soumis le parallélépipède aux centre des faces de ce dernier. Nous
représentons bien évidemment chacune des contraintes sur chacune des faces comme la
somme des contraintes normales et tangentielles telles que nous l'avions fait pour l'étude des
solides sous contrainte (selon les trois axes toujours, d'où la somme de trois composantes!).
Donc trois composantes suffisent pour connaître les forces de contraintes normales aux
surfaces selon chaque axe.
Si nous effectuons la somme des moments de forces par rapport aux centres de gravité pour
chaque axe de symétrie du parallélépipède il est évident que sur les 12
composantes tangentielles, 6 suffisent pour décrire l'ensemble du système.
959/2001
Sciences.ch 14/03/2005
Pour le plan :
Pour le plan :
Donc pour chaque plan , une composante suffit pour décrire l'ensemble de
moments de forces.
Ainsi, par souci de simplification d'écriture, nous poserons (il est plus conforme de faire les
développements avec des indices en minuscules):
et
Au total, cela nous fait donc 3 composant tangentielle plus 3 composantes normales qui sont
suffisantes et nécessaires pour décrire les contraintes sur le parallélépipède selon chaque axe
du plan de symétrie de ce dernier:
Nous pouvons obtenir les mêmes composantes d’équilibre en considérant cette fois un
tétraèdre régulier élémentaire (extrait du cube ci-dessus) statique. Le but étant de démontrer
que nous retrouvons bien les 6 composantes déterminées précédemment.
960/2001
Sciences.ch 14/03/2005
Pour connaître l’aire des faces , nous multiplions la surface (notée ci-
après: ) par le cosinus de l'angle que forment les vecteurs et .
et
et donc:
Finalement:
961/2001
Sciences.ch 14/03/2005
Le rapport:
d'où:
Le principe d'analyse étant le même pour toutes les autres surfaces telles que:
tel que:
Remarque: nous pouvons facilement connaître les valeurs des à l'aide de l'analyse
vectorielle. Effectivement, le plan étant d'équation:
en simplifiant par :
pour connaître les cosinus de l'angle du vecteur normal avec les , il suffit d'assimiler ces
derniers au vecteurs de base tel que (trigonométrie élémentaire):
962/2001
Sciences.ch 14/03/2005
Après simplification:
Soit en résumé:
avec ( , si )
Nous voyons apparaître une grandeur mathématique ayant 9 composantes, alors qu’un
vecteur dans le même espace en possède 3. Nous connaissons ce genre d'être
mathématique que nous avons déjà étudié en algèbre dans le chapitre de calcul tensoriel. La
grandeur est appelée "tenseur des contraintes du second ordre". En outre, certaines
composantes peuvent êtres égales ( , si ) , ce qui le rendrait symétrique. Il ne
possède alors plus que les 6 composantes distinctes, relativement aux nombres de
composantes suffisantes pour d'écrire totalement un système à l'équilibre.
Pour étudier les déformations d’un milieu continu tel qu'un fluide, nous considèrerons d'abord
le cas de très faibles déformations. Les petits déplacements d’un point seront représentés
par parallèles aux axes d’un référentiel . Nous admettons que ces composantes
963/2001
Sciences.ch 14/03/2005
sont des quantités très faibles variant d’une façon continue dans le volume du corps considéré.
Soit un segment linéaire situé dans un solide avant déformation. Dans un référentiel
, nous noterons et les coordonnées de et .
et
964/2001
Sciences.ch 14/03/2005
En développant:
Soit:
Or, la géométrie analytique (trigonométrie élémentaire; rapport des côtés opposés et adjacents
à l'hypoténuse) donne les relations suivantes :
965/2001
Sciences.ch 14/03/2005
La différence donne:
Finalement:
966/2001
Sciences.ch 14/03/2005
avec
967/2001
Sciences.ch 14/03/2005
Comme avant déformation, l’angle est de , après déformation, l’angle droit est
réduit de . Cette réduction est appelée "déformation de cisaillement" ou
"déformation tangentielle" et est notée par .
968/2001
Sciences.ch 14/03/2005
Généralement, nous posons pour simplifier les notations (il faut cependant pas croire que la
déformation en cisaillement devient une déformation normale ! ce n'est qu'une convention
d'écriture dont le physicien doit se rappeler !):
Soit finalement:
969/2001
Sciences.ch 14/03/2005
(avec )
(avec )
avec:
970/2001
Sciences.ch 14/03/2005
nous pouvons dire alors que initialement valable dans un milieu élastique solide considéré
par ses déplacements est l'analogue de dans le cas d’un fluide visqueux considéré par les
déplacement par unité de temps. Ainsi, nous voyons que les unités sont conservées.
En considérant également les déformations par unité de temps pour les contraintes normales
(nous y reviendrons en détail un peu plus loin), nous avons alors le système d'équations:
Le tenseur décrit ainsi en partie l'ensemble de contraintes d'un fluide visqueux dans lequel
nous avons supposé dans le cadre de l'hypothèse d'une fluide newtonien qu'il y a des relations
linéaires entre les tensions et les déformations normales.
Nous posons maintenant la somme des contraintes dynamiques sous une forme générale que
nous allons justifier:
971/2001
Sciences.ch 14/03/2005
où le terme se justifie par le fait que dans le cas statique, une pression dynamique
constante existe toujours en un point d’un fluide que l'on a pas dans le cas d'un solide. Pour
justifier le signe négatif, nous observerons que dans l’expression de , les deux premiers
termes du membre de droite correspondent, dans l’étude précédente ,à des contraintes
d’extension, alors que la pression correspond à une compression du fluide
Cette expression doit répondre à un fluide qui est également dans une situation statique tel
que:
Puisque:
Présentement, nous allons introduire les opérateurs de l’analyse vectorielle afin de disposer
d’une expression plus générale. De cette façon, nous pourrons adapter la formulation à
n’importe quel système de coordonnées (cartésiennes, cylindriques, sphériques,...) ce qui
facilitera la résolution de problèmes pratiques.
972/2001
Sciences.ch 14/03/2005
Nous allons déterminer les équations sous la forme indicielle en considérant toujours les
déplacements par unité de temps (vitesses).
ou
ou
L'équation dynamiques des contraintes générale s'écrira alors sous la forme suivante :
973/2001
Sciences.ch 14/03/2005
Il est, à présent, utile de repasser sous une forme développée pour l'équation précédente, en se
rappelant que:
où:
- est la somme des forces internes par unité de masse volumique (il est intéressant de noter
cela ainsi, car ce facteur change en fonction de la température)
Nous avons:
974/2001
Sciences.ch 14/03/2005
Comme:
et que:
Nous obtenons:
En opérant de la même manière pour les deux autres composantes, nous pouvons réduire le
système d'équations de Navier-Stokes à une seule équation vectorielle :
975/2001
Sciences.ch 14/03/2005
Nous avons:
Soit en final:
Remarque: nous trouvons également parfois dans la littérature, une équation contenant une
seconde viscosité , alors que se manifeste rigoureusement que lors du cisaillement pur
selon nos hypothèses, apparaît lors d'une compression omnidirectionnelle
s'accompagnant d'une variation de densité.
FLUIDE INCOMPRESSIBLE
s'écrit alors:
soit:
L'équation de Navier-Stokes:
s'écrit alors:
976/2001
Sciences.ch 14/03/2005
ou autrement:
Il existe une deuxième forme de l'équation d'Euler dans le cadre d'un fluide incompressible et
à viscosité négligeable que nous allons de suite déterminer:
Soit:
977/2001
Sciences.ch 14/03/2005
ou encore:
Soit:
Finalement, nous obtenons une nouvelle équation appelée "équation d'Euler de 2ème forme" et
qui s'écrit:
Bien que les deux équations d'Euler soient très importantes, il en existe une forme variée très
utile en météorologie que nous allons de suite déterminer.
Nous nous basons toujours sur l'écoulement d'un fluide incompressible et non visqueux, mais
dont les forces de volume dérivent cette fois-ci d'un potentiel ( étant un
potentiel).
978/2001
Sciences.ch 14/03/2005
donc:
En reprenant la relation:
L'équation:
devient:
Donc:
et puisque:
979/2001
Sciences.ch 14/03/2005
Ce qui donne:
Supposons que soit est un vecteur vitesse angulaire constant, nous avons alors:
L'équation:
s'écrit alors:
Nous retrouvons dans cette équation, utilisée en météorologie, l'accélération de Coriolis que
nous avions déterminé en mécanique classique du point matériel rigide.
En dynamique classique du point matériel rigide, nous avons montré que dans le cas d'un
potentiel gravitationnel Terrestre:
980/2001
Sciences.ch 14/03/2005
étant l'altitude d'un point du fluide par rapport à un niveau de référence . Si nous prenons
pour le niveau du sol, l'avant dernière relation devient :
Le terme entre crochet pour satisfaire cette relation doit être tel que:
Nous retrouvons donc bien le théorème de Bernoulli ce qui conforte notre modèle des fluides
FLUIDE COMPRESSIBLE
Dans ce cas est une fonction de la pression (cas des fluides barotropes). Nous
considérons également que la viscosité est négligeable. Il vient alors:
L'équation:
s'écrit alors:
FLUIDE STATIQUE
devient simplement:
981/2001
Sciences.ch 14/03/2005
NOMBRE DE REYNOLDS
s'écrit alors:
Nous choisissons maintenant plusieurs grandeurs de références notées par un indice tel que:
et
Alors:
982/2001
Sciences.ch 14/03/2005
Les termes ou apparaissent les coefficients de viscosité peuvent être réécrits tels que:
d'où:
ou encore:
983/2001
Sciences.ch 14/03/2005
et
Finalement:
Cette équation différentielle exprimée en variables relatives et sans dimensions est appelé
"équation de Navier-Stokes-Reynolds adimensionnelle"
APPROXIMATION DE BOUSSINESQ
sans oublier qu'au niveau des notations (nous savons… c'est un peu embêtant):
984/2001
Sciences.ch 14/03/2005
Donc:
Si l'on peut considérer le contexte de l'expérience tel que la densité volumique est inférieure
ou égale à celle de l'eau et que les vitesses sont petites, alors nous pouvons éliminer les termes
de second degré, tel que la relation précédente s'écrive:
Nous nous plaçons dans le cadre d'un fluide faiblement turbulent, dans lequel la pression et la
densité s'écrivent:
Nous négligeons également les frottements sur les bords et donc la viscosité en supposant que
l'effet des turbulences devient vite prépondérant sur la valeur du frottement.
et encore:
985/2001
Sciences.ch 14/03/2005
LOI DE STOKES
Nous envisageons un solide de forme quelconque plongé dans un fluide incompressible animé
d'une vitesse uniforme à grande distance (le problème est équivalent à celui d'un solide qui se
déplace à vitesse constante dans un fluide au repos). Nous cherchons à exprimer la force
qu'exerce le fluide sur l'obstacle, supposée immobile (et notamment dépourvu de tout
mouvement de rotation).
La solution analytique est trop complexe pour perdre son temps à résoudre ce genre de
problème pratiques. Il convient de recourir à l'analyse dimensionnelle.
986/2001
Sciences.ch 14/03/2005
- la masse du fluide
Comme il se doit, tous ces paramètres sont des constantes, bien que la vitesse varie en
direction et en norme au voisinage de l'obstacle: à grande distance, elle es uniforme et sa
valeur est bien un paramètre pertinent.
Nous pourrions nous demander si la pression ne devrait pas compter au nombre de ces
paramètres. Ce n'est pas le cas. La pression est conditionné par la valeur de la vitesse et par
celles des paramètres constants comme nous l'avons voyons dans le théorème de Bernoulli.
Inutile donc de rajouter un terme redondant.
Sans chercher l'unique combinaison sans dimension des quatre premières, nous appliquons la
démarche systèmatique. Nous voulons déterminer tels que:
Comme:
Il vient:
Ainsi:
Dès lors:
et curieusement nous retrouvons ici ce que nous avions vu dans notre développement de
l'approximation de Boussinesq:
987/2001
Sciences.ch 14/03/2005
où dépend de .
Les limites de la méthode analytique dimensionnelle (et même analytique tout court…)
apparaît lorsque l'on confronte ce modèle à l'expérience (évidemment nous pourrions faire des
modèles numériques de l'équation de Navier-Stokes-Reynolds pour l'ordinateur et ainsi
l'honneur serait sauf):
1. Elle a été obtenue en modifiant de manière indépendante les valeurs des quatre paramètres.
Nous constatons que ne dépend que du seul nombre sans dimension : c'est un succès de
l'analyse dimensionnelle.
2. Il est vain d'espérer trouver une fonction analytique simple qui reproduise la courbe
expérimentale. Il faut donc aller voir de plus près les divers régimes correspondants à cette
courbe complexe.
La figure ci-dessous schématise l'écoulement d'un fluide visqueux autour d'un cylindre pour
différentes valeurs du nombre de Reynolds:
988/2001
Sciences.ch 14/03/2005
Le régime correspondant à la figure (a) est dit "stationnaire". Nous pouvons parler d'un
déplacement "quasi-statique" de la part du fluide où en chaque point l'accélération est
négligeable. Nous devons donc nous attendre à ce que l'inertie du fluide n'intervienne pas
dans l'expression de la force. Pour cela, il faut et il suffit que:
où est indépendant de .
Dans le régime décrit par (b), deux tourbillons s'installent symétriquement derrière le
cylindre. Quand augmente au-delà de 40, nous distinguons l'allé de tourbillons de von
Kármán.
PRESSION HYDROSTATIQUE
989/2001
Sciences.ch 14/03/2005
d'où:
Si nous nous trouvons dans le cas d'un récipient remplis d'un fluide en contacte avec
l'atmosphère, pour calculer la pression dans ce fluide à un hauteur donné, il faudrait prendre
en considération la pression atmosphérique qui "s'appuie" également sur le fluide. Ainsi:
POUSSÉE D'ARCHIMÈDE
Si l'on isole une portion arbitraire d'un fluide en équilibre statique, les conditions de cet
équilibre s'écrivent nécessairement (sinon quoi le volume "explose" ou se dissocie) :
990/2001
Sciences.ch 14/03/2005
où p est la pression qui s'exerce localement sur . Quant à , il s'agit d'un vecteur unité
dirigé normalement (à la perpendiculaire) à et vers l'intérieur de . La résultant de
toutes ces forces se note historiquement de la façon suivante:
qui exprime donc, comme vous le devinez, la fameuse "poussée d'Archimède" que le reste du
fluide exerce sur l'élément. L'intégrale porte sur toute la surface (cette surface est fermée, d'où
l'intégrale correspondante) de l'élément .
La condition d'équilibre montre que . Nous comprenons que soit dirigé vers le
haut: sous l'effet du champ gravitationnel, augmente avec la profondeur.
Si l'on remplace le fluide contenu dans le volume par un objet fluide ou solide quelconque
mais qui occupe le même volume, la poussée d'Archimède n'est pas modifiée. A cause de la
relation nous avons coutume de dire "qu'elle est équivalent au poids du fluide
déplacé".
Dans le cas où la direction et l'intensité dans le temps de est uniforme et constant nous
pouvons écrire:
Il existe un autre possibilité pour arriver à cette démonstration qui demande moins d'outils
mathématiques et qui est plus abordable. Elle consiste en la suivante: considérons un cylindre
de volume V plongé dans un liquide à la vertical. Les composant horizontales des forces de
pression s'annulent mais la composante verticale au somment du cylindre (proche de la
surface) est inférieur en intensité (sauf cause extérieure) à celle se trouvant à sa base .
Nous pouvons donc écrire:
991/2001
Sciences.ch 14/03/2005
GAZ
Les solides ont une forme bien définie et sont difficiles à comprimer. Les liquides peuvent
s'écouler librement et leur écoulement est limité par des surfaces autoformées. Les gaz se
dilatent librement pour occuper le volume du récipient qui les contient, et ont une densité
environ mille fois inférieure à celle des liquides et des solides. Ils conduisent peu la chaleur et
l'électricité, sauf si nous les ionisons (formation d'un plasma). Les molécules d'un gaz neutre
se déplacent suivant des trajectoires rectilignes qui changent de direction à chaque collision
avec une autre molécule. Contrairement aux solides et aux liquides, les interactions entre
molécules restent faibles. Les propriétés macroscopiques d'un gaz se déduisent donc
directement des propriétés des molécules qui le composent (ou des atomes dans le cas d'un
gaz monoatomique).
TYPES DE GAZ
En théorie des gaz (nous parlons souvent de "théorie cinétique des gaz") nous considérons
toujours deux types de gaz neutres:
GAZ PARFAIT
Il s'agit d'un modèle dans lequel nous négligeons les interactions moléculaires du gaz, à
l'exception des collisions, et dont le volume propre est négligeable devant le volume du
récipient.
Lorsqu'un gaz est à faible pression, les interactions entre ses molécules sont faibles. Ainsi, les
propriétés d'un gaz réel à basse pression se rapprochent de celles d'un gaz parfait. Nous
pouvons alors décrire le comportement du gaz par l'équation d'état des gaz parfaits que l'on
démontre à l'aide des outils de la physique statistique:
avec le nombre de moles de gaz, la pression du gaz, le volume occupé par les moles
et la température absolue du gaz. La constante R étant la constante des gaz parfaits.
- à température constante, le volume d'un gaz est inversement proportionnel à sa pression (loi
de Boyle-Mariotte)
GAZ RÉEL
L'équation d'état des gaz parfaits est approximative. Par exemple, un gaz parfait ne pourrait ni
992/2001
Sciences.ch 14/03/2005
pour une mole, a et b étant des paramètres adaptables déterminés par des mesures
expérimentales effectuées sur le gaz concerné. Ce sont des paramètres qui varient d'un gaz à
un autre.
L'équation de Van der Waals peut également être interprétée au niveau microscopique. Les
molécules interagissent les unes avec les autres. Cette interaction est fortement répulsive pour
les molécules proches les unes des autres, devient légèrement attractive pour un éloignement
moyen et disparaît lorsque l'éloignement est important. À pression élevée, la loi des gaz
parfaits doit être rectifiée pour prendre en compte les forces attractives ou répulsives.
THÉORÈME DU VIRIEL
Soumis à une force centrale, le viriel s'écrit (par les propriétés du produit scalaire):
Théorème du viriel:
Pour un système en équilibre (!), l'énergie interne est égale à l'opposé de son demi viriel total
lorsque toutes es particules sont repérées par rapport é son centre de masse.
Démonstration:
Sa dérivée seconde:
993/2001
Sciences.ch 14/03/2005
Or:
et:
Donc:
Cette dernière expression est valable quelle que soit la position d'un système de coordonnées
adopté. Cependant, il est intéressant de placer son origine au centre de masse du système car
nous ne sommes plus dépendant de son mouvement.
Si le système est en équilibre, les quantités macroscopiques qui la caractérisent ne sont pas
dépendantes du temps. Nous en concluons alors que la somme de n'importe quelle quantité
attachée à n'importe quel point matériel du système est en fait une quantité dudit système.
Ainsi, est une quantité macroscopique indépendante du temps. Cela implique que:
Cette expression de l'énergie cinétique est connue sous le nom de "théorème de Viriel": le
membre de droite est aussi appelé "le viriel du système".
994/2001
Sciences.ch 14/03/2005
où est l'énergie cinétique totale associée à l'ensemble des points matériels du système.
Nous l'appelons "l'énergie interne du système". est l'énergie d'un point matériel
quelconque du système.
Il est possible de retrouver l'expression du viriel à partir d'un système de particules (nuage en
accrétion). Strictement, l'équilibre n'existe pas dans un tel cas. Néanmoins, nous pouvons
admettre que si la contraction gravitationnelle est suffisamment lente alors ses différentes
phases peuvent êtres considérées comme une succession d'états d'équilibre.
Dans le cas d'une force centrale et dérivant d'un potentiel, nous pouvons écrire:
et donc
Si l'énergie potentielle est de la forme (ce qui est le cas pour le potentiel électrique et
gravitationnel) alors il vient:
et il reste:
En résumé, le théorème de viriel nous donne une relation entre les énergies cinétique et
potentielle totales. Pour être valable, le mobile doit décrire une trajectoire autour du centre de
force central et rester indéfiniment dans un volume fini (état lié). Ce type de raisonnement est
applicable à un très grand nombre de phénomène, depuis la structure de certaines galaxies
jusqu'au dégagement d'énergie dans les explosions nucléaires en passant par l'étude du Soleil
et le comportement des gaz réels.
Dans un système gazeux, l'énergie potentielle peut s'écrire comme la somme de l'énergie des
forces agissant de l'extérieur plus celle qui sont interne même au gaz. Tel que:
Il ne faut pas dans cette somme prendre la force qu'exerce chacune des particules sur elle-
même. Tel que:
995/2001
Sciences.ch 14/03/2005
Dans la double somme, nous pouvons regrouper les termes deux à deux et utiliser le principe
d'action-réaction tel que:
Pour obtenir:
Et:
Le premier terme de droite fait intervenir les forces intérieures (interactions) entre les (paires
de) particules et le deuxième terme de droite fait intervenir les forces extérieures.
Considérons maintenant un gaz contenu dans un récipient. Ses molécules ne sont sujettes à
des forces extérieures que lorsqu'elles heurtent une paroi et nous imaginons qu'en moyenne
cette force est perpendiculaire à la paroi (chocs élastiques).
Pour toutes les faces contenues dans les plans définis par les axes, nous avons toujours:
996/2001
Sciences.ch 14/03/2005
Pour les autres faces (BCFE par exemple) nous avons et donc:
où nous appelons la coordonnée selon Oy de l'extrémité de . Dès lors pour chaque face:
Par le théorème du viriel, en ajoutant les contributions non nulles des faces , et
, il vient:
Dès lors:
C'est l'équation générale d'état d'un gaz réel, c'est-à-dire l'équation d'état qui tient compte des
interactions entre molécules.
Si le gaz est parfait, il n'y a pas d'interactions entre les molécules (par hypothèse) et alors:
Nous retrouvons la loi de Boyle-Mariotte. En d'autres termes, les écarts par rapport à cette loi
nous renseignent directement sur les interactions entre les molécules.
997/2001
Sciences.ch 14/03/2005
Il vient ainsi:
nous avons:
et dès lors:
Au fait, il faut bien prendre garde au fait que nous n'avons pas démontré l'équation des gaz
parfaits. Effectivement, lorsquenous avions posé:
Cela supposait implicitement que l'équation des gaz parfaits était déjà connue (…). Cependant
nous avons montré en mécanique statistique qu'il est possible de démonter la l'équation des
gaz parfaits.
PLASMAS
Nous définissons le plasma comme un état de la matière dans lequel certaines liaisons
électroniques ont été rompues, provoquant l’apparition d’électrons libres, chargés
négativement et d’ions, chargés positivement. Les gaz faiblement ionisés appelés "plasmas"
par abus de langage, possèdent les mêmes propriétés mécaniques (écoulements, ondes
acoustiques, etc.) que les gaz neutres, en revanche leurs propriétés électromagnétiques
(conductivité électrique, indice de réfraction) en diffèrent par suite de la présence d'électrons
libres en leur sein.
Dans leur état normal, les gaz sont des isolants électriques. Cela tient au fait qu'ils ne
contiennent pas de particules chargées libres, mais seulement des molécules neutres.
Cependant, si nous leur appliquons des champs électriques assez intenses, ils deviennent
998/2001
Sciences.ch 14/03/2005
conducteurs. Les phénomènes complexes qui se produisent alors portent le nom de décharges
dans les gaz et sont dus à l'apparition d'électrons et d'ions libres.
Le résultat d'une décharge dans un gaz est donc la production d'un gaz ionisé contenant par
exemple électrons, ions positifs et neutres (atomes ou molécules) par unité de
volume. En général, le gaz est macroscopiquement neutre. Nous avons alors alors:
Cette neutralité est la conséquence des forces électrostatiques très intenses qui apparaissent
dès que l'on a . La densité de particules est donc la première grandeur fondamentale.
où est la densité (nombre de particules par unité de volume) des neutres et celle des
électrons (ou des ions positifs). La valeur du degré d'ionisation dans les divers types de gaz
ionisés varie en pratique depuis des valeurs très faibles, de l'ordre de , par exemple,
jusqu'à 1.
de translation de ses molécules peut devenir du même ordre que leur énergie d'ionisation Ei.
Dans ces conditions, lorsque deux molécules entrent en collision, il peut y avoir ionisation de
l'une d'entre elles.
Si le gaz est en équilibre thermodynamique, l'ionisation par collision est contrebalancée par
des processus de recombinaison entre électrons et ions et il en résulte que les trois variables
ne sont pas indépendantes : l'ionisation est déterminée par la pression et la
température, nous disons alors que le gaz est en "état d'équilibre d'ionisation thermique".
A des températures plus élevées, les atomes du gaz peuvent d'ailleurs s'ioniser plusieurs fois.
Dans de nombreux cas, l'ionisation est due à un champ électrique extérieur, et le gaz n'est pas
en équilibre thermodynamique. Il atteindra souvent un état stationnaire qu'on pourra
caractériser par les paramètres (température des électrons), (température des
ions) et (température des molécules).
Les trois températures ainsi introduites sont définies par la condition que représente
l'énergie cinétique moyenne des particules d'espèce a, dans un repère où elles ont une vitesse
moyenne nulle. L'écart entre , et peut être important : par exemple, dans un tube à
999/2001
Sciences.ch 14/03/2005
Si dans un plasma initialement neutre, nous produisons une perturbation locale sous la forme
d'un excès de charge électrique positive ou négative, celui-ci va tendre à revenir vers l'état
d'équilibre de neutralité. Cependant, nous pouvons voir facilement que la perturbation initiale
engendre en général une oscillation pendulaire non amortie du plasma autour de son état
d'équilibre. Considérons par exemple la situation représentée sur la figure ci-dessous.
À l'instant initial la région au centre contient un déficit d'électrons et la région tout autour un
excès d'électrons. Cela produit un champ électrique tendant à créer un mouvement des
électrons dans le sens des flèches. Dans ce mouvement, ceux-ci acquerront une certaine
énergie cinétique et ils pourront, au bout d'un certain temps, dépasser la position d'équilibre.
Un trop grand nombre d'électrons ayant quitté la région externe, il y aura un défaut d'électrons
dans cette région et un champ électrique tendant à les ramener vers elle (figure 1.3'). Au bout
d'un certain temps, la situation initiale est reconstituée et le cycle recommence. Les vibrations
ainsi produites sont appelées oscillations de plasma électroniques.
Nous pouvons étudier quantitativement ce problème en posant les équations générales d'une
oscillation de charge d'espace électronique et moyennant les hypothèses suivantes :
1. Les ions sont supposés immobiles étant donné qu'il sont beaucoup plus lourds que les
électrons, et leur densité uniforme égale à
5. Il n'y a pas de champ électrique ou magnétique imposé par des sources extérieures
1000/2001
Sciences.ch 14/03/2005
Soit l'équation de conservation des particules (ou de continuité selon démonstration dans le
chapitre de thermodynamique):
Dans la deuxième, nous avons négligé le terme de pression cinétique et le terme de collision
(hypothèses 2 et 3) et négligé le champ magnétique lié à l'oscillation. Nous pouvons simplifier
ces équations en utilisant l'hypothèse 4 sous la forme:
où est une petite perturbation. Supposons de plus que les quantités variables varient à
la pulsation , nous pouvons donc écrire:
(1)
(2)
Mais nous avons d'autre part la loi de Gauss (voir chapitre traitant des équations de
Maxwell) :
en effet compte tenu de la condition de neutralité du plasma non perturbé nous avons :
1001/2001
Sciences.ch 14/03/2005
Finalement en remplaçant cette dernière expression dans la loi de Gauss, nous tirons :
Mais dans les oscillations de charges d'espace nous avons par définition . La
relation ci-dessus conduit donc à l'expression de la "fréquence plasma":
1002/2001
Sciences.ch 14/03/2005
ASTROPHYSIQUE
L'observation (outil principal du physicien) semble montrer qu'à première vue, les trajectoires
suivies par les corps célestes en orbite autour d'astres est de type côniques (voir géométrie
analytique). Sachant cela, nous pouvons afin de faciliter les calculs, anticiper la
complexification des calculs et exprimer directement la dynamique d'un point matériel en des
coordonnées polaires.
Comme nous l'avons vu dans la section d'algèbre au chapitre d'analyse vectorielle, la vitesse
en coordonnées polaires s'exprime par la relation (nous avons changé la lettre grec de notation
de l'angle pour nous adapter à la tradition):
Pour l'accélération:
Maitenant que nous avons les outils nécessaires, attaquons nous au cas des orbites
képleriennes dans le cas d'un champ Newtonien.
Cependant, il est peu probable que le corps principal soit un sphère parfait et homogène. Les
astrophysiciens ont donc l'habitude de noter le potentiel Newtonien U sous la forme:
S'il est un endroit de l'univers où les lois de la mécanique sont parfaitement vérifiables, c'est
bien l'espace, parce que le frottement ou les causes de dissipation y sont extrêmement faibles.
Dans le champ d'une seule force dérivant d'un potentiel, le mouvement vérifie la conservation
1003/2001
Sciences.ch 14/03/2005
de l'énergie mécanique.
Nous aboutissons ainsi à l'équation dite de l'énergie, dans laquelle désigne "l'énergie
spécifique" par unité de masse (kilgramme) envoyé.
donc
La force de gravitation newtonienne est centrale, donc de moment nul au centre du corps
principal. Il en résulte la conservation du moment cinétique, soit:
Nous rappelons que la norme de la vitesse exprimée en coordonnées polaires plane est donné
par la relation (n'oubliez pas que les deux vecteurs de la base polaire sont orthogonaux et que
l'on peut donc appliquer le théorème de pythagore pour calculer la norme comme il l'a été
démontré dans le chapitre d'analyse vectorielle du site):
Plaçons nous dans le plan orbital, en coordonnées polaires. Nous possédons deux intégrales
premières dépendant des deux constantes essentielles et .
1004/2001
Sciences.ch 14/03/2005
Et là nous nous demandons comment nous pouvons faire pour nous en sortir. Après quelques
heures de réflexions… nous nous rendons compte qu'il faut faire une substitution. Après une
autre heure de chaos neuronal cela finit par aboutir. Nous décidons de poser (nous en avons
tout à fait le droit ), sachant que est une fonction de :
1005/2001
Sciences.ch 14/03/2005
Nous avons deux solutions suivant le signe que nous choisissons. Cependant à la fin de la
résolution, nous remarquons que le seul choix physiquement intéressant est le signe négatif.
Ainsi:
Nous laissons, par approximation, de côté la constante d'intégration qui impliquerait des très
faibles oscillations sur la trajectoire de l'orbite (si vous faites une étude ou un TP sur le sujet,
communiquez-moi les graphiques que vous obtenez avec ou sans la constante, cela
m'intéresserait).
Or, nous voyons que notre choix du signe pour l'intégration se justifie pleinement puisque
maintenant, si nous faisons un petit rappel sur les coniques, nous voyons que nous avons:
et
La loi des aires permet de calculer la période orbitale képlérienne . En effet, l'aire de
l'ellipse valant et ayant déjà déterminé lors de la définition du moment cinétique la
relation:
1006/2001
Sciences.ch 14/03/2005
Il vient naturellement:
PRÉCESSION DU PÉRIHÈLIE
Avant d'étudier la précession des orbites, nous souhaiterions rappeller que le champ
gravitationnel et un champ conservatif et central. Ceci implique donc que le moment cinétique
(voir mécanique classique du point matériel rigide) est constant et que la trajectoire a lieu
dans un plan dont le vecteur normal à la surface conserve toujours la même direction (le
vecteur moment cinétique est constant en grandeur et en direction).
Evidemment, le résultat que nous obtiendrons ne sera pas complet, puisque comme nous le
savons, il a fallu attendre le développement de la relativité générale pour donner avec
exactitude la précession du périhélie de Mercure. Il n'y avait effectivement que la relativité
générale qui pouvait prendre en compte la déformation de l'espace aux environs de Mercure
du aux aplatissements du Soleil à ses pôles (à cause de la force centrifuge).
Pour calculer cet effet de précession, nous allons rechercher l'équivalent d'une formule dite
"Formule de Binet" sous forme relativiste. Nous procèdons comme suit :
Avec:
1007/2001
Sciences.ch 14/03/2005
En prenant la norme, nous avons sans oublier que dans note étude et donc
:
et rappelons que nous avons adopté l'écriture . Ce qui nous donne finalement:
- nous recherchons une relation du type (puisque la trajectoire est une conique):
Effectivement car rappelons qu'en coordonnées polaires la vitesse est donnée par l'expression
suivante:
Soit:
1008/2001
Sciences.ch 14/03/2005
D'autre part:
En posant et comme:
1009/2001
Sciences.ch 14/03/2005
Effectivement, le lagrangien étant constant au cours du temps (le système est conservatif !),
nous avons donc:
et également:
En se référant à:
1010/2001
Sciences.ch 14/03/2005
Pour rechercher une solution à cette équation différentielle, nous allons grouper la variable u
dans le membre de gauche:
Nous posons :
et
Nous posons :
Nous trouvons alors une simple équation différentielle dont la solution est bien connue:
1011/2001
Sciences.ch 14/03/2005
avec
Pour déterminer les constantes nous nous placons d'abord dans la situation pours
laquelle , où est minimal et donc par définition maximal.
devient:
Nous posons :
et
La trajectoire est toujours une ellipse mais l'angle qui était nul au départ est devenu
.
Alors:
1012/2001
Sciences.ch 14/03/2005
En se limitant à l'ordre 2:
Conclusion :
par demi-période.
Nous prendrons pour un couple d'astre la distance moyenne pour calculer le moment cinétique
et dans le cas de l'atome nous prendrons (voir le chapitre du site traitant de la physique
quantique corpusculaire et relativiste):
1013/2001
Sciences.ch 14/03/2005
Si les positions du périhélie (et donc de l'aphélie) du barycentre Terre-Lune étaient constantes
dans le temps, la durée des différentes saisons serait, elle aussi constante. Mais l'orbite du
barycentre Terre-Lune tourne lui aussi dans son plan dans le sens direct à raison d'environ 12''
par an (soit une révolution en environ 100'000 ans). La précession des équinoxes s'effectue
dans le sens contraire (sens rétrograde) à raison d'environ 50'' par an (soit une révolution en
environ 26'000 ans). La combinaison de ces deux mouvements permet de calculer la période
du passage du périhélie de la Terre par la direction de l'équinoxe de printemps, cette période
d'environ 21'000 ans est appelée précession climatique. En effet, tous les 10'500 ans (demi-
période de la précession climatique) l'aphélie par de l'été à l'hiver. Or même si la distance
Terre-Soleil n'est pas le facteur prédominant dans la nature des saisons, la combinaison du
passe de la Terre à l'aphélie en hiver donne des hivers plus rudes. La distance Terre-Soleil
dépend également de la variation de l'excentricité de l'orbite terrestre (due aux planètes
extérieures et intérieures). Ainsi, les périodes glacières sont corrélées avec les minima de
l'excentricité de l'orbite terrestre.
Les travaux de l'institut de mécanique céleste (France), depuis les années 1970, ont permis de
confirmer définitivement les prédictions théoriques comme quoi la l'excentricité de l'orbite
terrestre subit de larges variations formées de nombreux termes périodiques dont les plus
importants ont des périodes voisines de 100'00 ans, et pour l'un d'eux, une période de 400'000
ans. Ces résultats confirment les variations climatiques de la Terre au cours de l'ère
quaternaire. Les paléoclimatologies montrent en effet la corrélation entre les variations des
éléments de l'orbite terrestre et les grandes glaciations du quaternaire.
L'EFFET DOPPLER
L'effet Doppler des ondes électromagnétiques doit être discuté indépendamment de l'effet
Doppler acoustique. Premièrement parce que les ondes électromagnétiques ne consistent pas
1014/2001
Sciences.ch 14/03/2005
Par suite:
Si l'on tient compte que dans le cas d'ondes électromagnétiques, nous pouvons écrire
chacune de ces équations sous la forme:
Le rapport:
donne le décalage spectral noté pour un mouvement de l'observateur par rapport à la source
suivant la direction de propagation. Si le mouvement relatif des deux observateurs n'a pas lieu
suivant la direction de propagation, la projection de la quantité de mouvement de l'onde
lumineuse sur l'axe de mouvement relatif des observateurs sur un analyse purement
énergétique donne:
1015/2001
Sciences.ch 14/03/2005
ÉQUATION DE DRAKE
L'équation de Drake a été développée par Frank Drake en 1961 dans le but de définir quelle
serait le nombre de planètes dans notre galaxie uniquement avec lesquelles le Terrien pourrait
prendre contacte en fonction de facteurs déterminants:
Les termes de cette formule (car s'en est une!) se définissent ainsi:
est le nombre de planètes par étoile qui remplissent les conditions au développement de la
vie
est la fraction de planètes dont la vie s'est effectivement développée (compris entre 0 et 1)
est la fraction de celles ou une vie "intelligente" s'est développée (compris entre 0 et 1)
est la fraction qui a mis en oeuvre des moyens de communication radio (compris entre 0
et 1)
est la fraction de temps pendant laquelle les civilisation vivront (compris entre 0 et 1)
ÉTOILES
Avant d'aborder la formalisme mathématique relatif à la dynamique des étoiles, nous avons
souhaité suite à une demande des lecteurs, écrire une introduction vulgarisée afin de
compléter la culture générale relatif à ce domaine.
Les étoiles sont donc des corps célestes gazeux dont la masse va de 0.05 masses solaires à 100
masses solaires. La luminosité d’une étoile (sa puissance) va de 10-6 à 106 fois celle du
soleil ; grossièrement, lorsque la masse double, la luminosité décuple. Bien que la plupart des
1016/2001
Sciences.ch 14/03/2005
étoiles visibles à l’oeil nu dans notre ciel sont des géantes bleues de 104 à 105 fois plus
lumineuse que le soleil, les 90% des étoiles qui peuplent notre galaxie sont moins lumineuses
que le soleil.
Les astronomes ont mis plance une méthode de classification des étoiles basée sur la position
dans leur spectre, des raies spectrales d'absorption. Autrefois classées de A à Q, l'évolution de
la spectrométrie a permis leur regroupement et leur réorganisation. Les classes sont
aujourd'hui définies par les lettres OBAFGKM, et chacune est divisée en 10 sous-classes,
notées de 0 à 9. La classification spectrale (tirée d'un spectre continu dont il ne résulte
seulement certaines raies du spectre après le passage de la lumière dans un milieu donné) peut
être croisée avec les classes de luminosité dont nous tirons la température à la surface de
l'étoile (nous démontrerons comment obtenir mathématiquement cette information):
La grande courbe au centre indique l'évolution d'une étoile de même masse que le soleil.
Après un passage sur la séquence principale, elle devient une géante rouge, éventuellement
une nébuleuse planétaire (éjection du combustible de l'étoile à de grandes distances), puis elle
termine sa vie sous la forme d'une naine blanche. Par comparaison nous avons indiqué
l'évolution d'étoiles 10 ou 30 fois plus massives que le Soleil : elles quittent la séquence
principale pour devenir des supergéantes puis elle finissent en supernovae qui ne peuvent être
représentées sur ce diagramme !
Une étoile est dans un premier temps en équilibre hydrostatique. Les forces gravitationnelles
dues à sa masse sont compensées par les forces de pression interne due à la température
élevée entretenue par des réactions thermonucléaires à basse densité et à la pression de
dégénérescence des électrons à densité élevée. Une étoile passe 90% de sa vie à fusionner de
l’hydrogène en hélium qui s’accumule en son centre. Durant cette phase, elle évolue dans ce
que nous appelons "la séquence principale" du diagramme de Hertzprung-Russel représenté
ci-dessous. Ce diagramme met en relation la température de surface (abscisse logarithmique
présenté en ordre opposé) à la luminosité (ordonnée logarithmique) de populations d’étoiles.
La séquence principale apparaît comme une diagonale. La température de surface et la
luminosité étant directement fonction de la masse:
1017/2001
Sciences.ch 14/03/2005
Chacune des étoiles du ciel trouve sa place sur le diagramme introduit par Hertzsprung et
Russell (diagramme H-R ci-dessous) dont les diverses régions permettent d'en repérer le stade
d'évolution. Il est alors possible d'y tracer une courbe représentative de l'évolution d'une étoile
donnée à partir de la connaissance de son état au moment de l'observation.
Ainsi les étoiles massives évoluent plus vite que les étoiles de faible masse, mais ce résultat
est déduit d'autres considérations que celles permettant de construire le diagramme. Le
diagramme sert notamment à évaluer l'âge moyen d'un amas d'étoiles à partir de celui de ses
composants. De même, il permet de caractériser les étoiles variables et leurs composantes
telles les géantes rouges qui deviennent instables et pulsantes en viellissant. Cette famille
d'objets instables définit une bande d'instabilité sur le diagramme. Ce diagramme traduit la
classification spectrale des étoiles ou leur température de sur face en fonction de leur
magnitude absolue ou de leur luminosité.
Ce diagramme, sur lequel toutes les étoiles trouvent leur place dès que nous connaissons leurs
caractéristiques, fut développé indépendamment en Europe par Ejnar Hertzsprung et aux
Etats-Unis par Henry Norris Russell. L’axe horizontal indique la classification spectrale en
partant, à gauche, des étoiles les plus chaudes, les bleues, pour atteindre les moins chaudes,
les rouges, à droite. Les étoiles se positionnent en groupes spécifiques sur le diagramme :
celles qui évoluent sur leur séquence principale se situent sur une courbe incurvée qui
commence en haut, à gauche, et se termine en bas, à droite. C’est sur cette courbe que se
regroupent les étoiles stables qui brûlent leur hydrogène et, parmi elles, le Soleil qui se
positionne au centre du diagramme. Les géantes et les supergéantes apparaissent dans la partie
supérieure droite, tandis que les naines blanches se regroupent dans la partie inférieure
gauche. Au fur et à mesure qu’elle évolue, chaque étoile décrit une courbe particulière : elle
commence par suivre la trajectoire de Hayashi jusqu’à ce qu’elle atteigne sa séquence
principale sur laquelle elle évolue tant que son noyau brûle de l’hydrogène. Lorsque
1018/2001
Sciences.ch 14/03/2005
commence la combustion de l’hélium, elle remonte vers le haut où se concentrent les géantes
rouges et y reste jusqu’à ce que la fusion nucléaire s’arrête : elle s’effondre alors sur elle-
même pour rejoindre les naines blanches ou dans le cas d'une certaine valeur de masses
solaire, les étoiles à neutrons, Trou Noirs ou encore, si sa masse est très élevée, explose en
supernovae.
Lorsque la masse d’hélium d'une étoile devient suffisante, l’augmentation de pression induit
une augmentation de la température amorçant ainsi la fusion de l’hélium ("flash de l’hélium")
en carbone, oxygène et néon créant un second front de combustion à l’intérieur du premier.
Pour une étoile de masse solaire, les réactions s’arrêtent à ce stade. L’étoile grossit et se
refroidit en surface. Elle devient une géante rouge 104 fois plus lumineuse qu’auparavant. Elle
passe par des phases d’instabilité et finit par expulser progressivement ses couches externes
en formant une "nébuleuse planétaire". Son noyau, dont la densité est de plusieurs tonnes par
centimètre cube, se refroidit lentement : c’est la naine blanche (nous aborderons ce processus
sous forme mathématique plus loin). L’équilibre y est maintenu par la pression de
dégénérescence des électrons.
Pour une étoile plus massive, la température interne devient assez importante pour que le
carbone et l’oxygène puissent fusionner en silicium. A son tour, si il est en masse suffisante,
le silicium fusionnera en fer. Les fronts de combustion se développent dans un schéma dit "en
pelures d’oignon". Le fer est le nucléotide le plus stable : il se trouve au fond de la vallée de
stabilité (voir section de physique atomique). Il ne peut ni fusionner, ni fissionner. Lorsque la
densité atteint une valeur critique (cela correspond à une masse totale de l’étoile de plus de 8
masses solaires), la pression de dégénérescence des électrons n’arrive plus à maintenir
l’équilibre contre la gravitation. En un dixième de seconde, le noyau de fer s’effondre. Les
autres couches du coeur se précipitent vers le noyau effondré sous forme d’une onde dont le
maximum de vitesse correspond au rayon sonique.
La densité du noyau devient alors énorme. Il se produit des réactions inverse où les
protons capturent les électrons en formant des neutrons et libérant un flot de neutrinos.
Lorsque le noyau de l'étoile atteint la densité nucléaire de , la compaction
s’arrête brutalement (rayon d’environ 10km !). Les couches externes du noyau rebondissent
par un choc superélastique et entrent en expansion. Lorsque cette onde de choc réfléchie
rejoint le rayon sonique, la température monte tellement haut que la chiffrer n’a plus de sens.
La matière subit une photodésintégration complète (tous les nucléotides sont désagrégés en
gaz de nucléons). Finalement par un mécanisme pas clairement établis, toutes les couches
externes de l’étoile sont éjectées dans l’espace : c’est une "supernovae de type II".
Les étoiles très massives (plus de 50 masses solaires), la masse totale du coeur qui s’effondre
pourrait dépasser 3 masses solaires. Dans ce cas, la gravité devient telle que sa masse
s’effondre au delà des dernières forces répulsives et se compacte en une singularité. La
courbure de l’espace devient telle qu’aucune matière, rayonnement ou information ne peut
plus s’échapper au delà d’un volume appelé horizon ou sphère de Schwarzschild . C’est un
"Trou noir". Tout ce qui y tombe perd son identité. Un trou noir ne présente plus que trois
propriétés : sa masse, son moment cinétique et sa charge électrique. Nous disons qu’un trou
1019/2001
Sciences.ch 14/03/2005
noir n’a pas de chevelure. De plus, une telle singularité devrait toujours être cachée par un
horizon, être habillée.
Les étoiles sont supposées être des amas sphériques d'hydrogène gazeux où les interactions
entre molécules sont régies par l'attraction gravitationnelle.
Une étoile n'a pas de paroi qui la délimite, c'est-à-dire qu'il n'y a pas de forces extérieures
donc (voir théorème de viriel):
et
Pour le calcul de l'énergie potentielle nous nous reportons au chapitre de mécanique classique
du site. Donc:
Avec pour une étoile donnée N étant le rapport de la masse totale de l'étoile sur la masse
moyenne d'une molécule.
C'est la température centrale du Soleil. Les mesures optiques mesurées depuis la Terre ne
donnent que la température en surface (chromosphère), soit 6'000 °K. La température interne
calculée est donc environ 1'600 fois plus élevée qu'à la surface. Des méthodes indépendantes
basées sur les réactions nucléaires au centre du Soleil (mesure du flux de neutrinos solaires)
donnent le même ordre de grandeur, mais les valeurs précises diffèrent d'un facteur 2 à 3.
1020/2001
Sciences.ch 14/03/2005
avec :
L'émittance moyenne (dit aussi "émittance moyenne bolométrique") reçu par la Terre hors
atmosphère appelé "constante solaire" est directement mesurable en orbite et vaut
.
et
et
1021/2001
Sciences.ch 14/03/2005
La luminosité bolométrique intrinsèque d'une étoile est donc proportionnelle au carré de son
rayon et à la quatrième puissance de sa température de surface. En prenant le soleil comme
référence, les constantes s'annulent. Nous pouvons alors écrire :
avec et d'où
L'éclat d'une étoile est sa "luminosité apparente". L'éclat d'une étoile correspond à la
densité de rayonnement reçu par l'observateur c'est-à-dire au flux et vaut le rapport entre la
puissance de l'étoile et la surface de la sphère dont le rayon est égal à la distance qui sépare
l'observateur de l'étoile :
L'éclat diminue ainsi avec le carré de la distance. En astrophysique, nous utilisons également
une autre échelle où la luminosité apparente est donnée par une autre grandeur d'origine
empirique : la magnitude apparente, qui sera expliquée de suite ci-dessous.
MAGNITUDE APPARENTE
Ptolémée en 137 après J.-C. avait défini une échelle de six grandeurs pour exprimer l'éclat des
étoiles, la première pour les plus brillantes et la sixième pour les étoiles tout juste visibles à
l'œil nu (6 grandeurs et donc 5 écarts).
1022/2001
Sciences.ch 14/03/2005
remplacée par celle de magnitude apparente qui a été définie de telle sorte à ce que cette
nouvelle échelle soit proche de l'ancienne. La définition est la suivante :
A l'aide de ces définitions, nous pouvons construire une règle liant de façon relative les éclats
de deux étoiles à leur magnitude apparente .
Pour une étoile 2, cent fois plus "brillante" ou "éclatante" qu'une étoile 1, l'étoile 1 est 5 unités
de magnitude au-dessus de l'étoile 2 (n'oublions par que l'échelle est inverse). Donc :
correspond à
et
En simplifiant, nous trouvons la "loi de Pogson" qui exprime la relation entre magnitudes
visuelles et éclats de deux étoiles :
Ainsi définie, l'échelle de magnitudes visuelles n'est que relative. La référence est
photométrique est similaire à l'éclat de Véga .
Pous se faire une idée des magnitudes visuelle voici quelques exemples : Soleil –26.5, Pleine
Lune –15, Vénus au maximum –4.8, Sirius la plus brillante des étoiles –1.5 (type spectral A1
et distante de 8.6 années lumière), limite de la perception à l'œil nu 6, limite de perception à
travers un télescope amateur de 15 cm à ce jour (2003) 13, limite de perception du télescope
spatial Hubble 30.
1023/2001
Sciences.ch 14/03/2005
ne le sont en réalité car une partie du rayonnement se trouve dans les ultraviolets,
respectivement dans l'infrarouge.
Il convient donc de préciser qu'il s'agit d'une magnitude apparente visuelle ou bolométrique.
En général, les astrophysicien utilisent les grandeurs bolométriques dans leurs communiqués.
LA MAGNITUDE ABSOLUE
La magnitude absolue (ne pas confondre avec la notation de l'émittance) d'une étoile est
une grandeur logarithmique aussi, qui exprime cette fois la luminosité . C'est la grandeur
présentée en ordonnée du diagramme de Hertzprung-Russel. L'échelle de cette grandeur est
basée sur la magnitude visuelle.
La magnitude apparent et la magnitude absolue sont liées par la distance qui nous sépare de
l'étoile. A luminosité intrinsèque constante, la luminosité apparent décroît donc évidemment
avec le carré de la distance comme nous l'avons déjà vu. Afin d'établir une relation, nous
avons dû choisir une distance de référence par une nouvelle définition :
La magnitude absolue d'une étoile est égale à sa magnitude apparente si elle est à une distance
de 10 parsecs ( ).
Soit une étoile placée à une distance quelconque . Son éclat est fonction de la distance et
de son éclat si elle était située à selon :
1024/2001
Sciences.ch 14/03/2005
Ainsi, Déneb étant 300'000 fois plus lumineux que le Soleil, la magnitude absolue est de –9.
Remarque :
La distance d'étoiles proches a pu être déterminée grâce au satellite Hipparcos. Par mesure du
parallaxe (mesure de la position de l'étoile à six mois d'intervalles et pas application des règles
trigonométriques élémentaires). Mais, au delà de quelque dizaines de parsec, la mesure de la
distance d'étoiles par parallaxe devient très imprécise. En étudiant le spectre de l'étoile, nous
pouvons déterminer sa classe spectrale, sa température de surface et la placer dans le
diagramme de Hertzprung-Russel. Il est donc possible d'estimer sa magnitude absolue et de
calculer approximativement sa distance.
Cet artifice de mesure est fondamental pour la cosmologie. C'est ainsi que l'on détermine la
1025/2001
Sciences.ch 14/03/2005
distance des galaxies proches en mesurant la période de certaines étoiles variables (nous y
consacrons un petit chapitre ci-dessous).
ÉTOILES VARIABLES
Les étoiles de la séquence principale du diagramme de Hertzprung-Russel sont des objets très
stables. La force de gravitation, qui tend à contracter l'astre, est exactement compensée par les
forces de pression interne, qui tendent à le dilater. C'est au moment où l'étoile devient une
géante rouge que parfois l'équilibre est rompu. Commence alors une phase d'instabilité qui se
traduit par de fortes variations de la luminosité de l'étoile.
La rupture de l'équilibre est provoquée par un phénomène complexe qui met en jeu des
variations de transparence des couches d'hélium près de la surface de l'étoile. A partir de là,
l'astre se met à connaître une succession de dilatations et de contractions contrôlées par les
forces qui assuraient auparavant l'équilibre. Lorsque la force de pression l'emporte, le volume
de l'astre augmente. Mais la gravité freine le mouvement et finit par provoquer la contraction.
Le volume de l'étoile passe alors sous sa valeur moyenne, jusqu'à ce que la pression interne
s'oppose à la contraction et réussit à provoquer une nouvelle dilatation.
Ce ne sont pas les changements de taille qui provoquent les variations de luminosité, mais
ceux de la température. Effectivement, comme nous l'avons vu précédemment, la luminosité
d'un étoile varie avec la quatrième puissance de la température, alors qu'elle ne varie qu'avec
le carré du rayon. Lorsque le volume de l'étoile est cependant plus faible qu'en moyenne, sa
température est légèrement plus forte et la luminosité maximale. Dans le cas contraire, la
température est légèrement plus basse qu'en moyenne et la luminosité minimale. L'éclat de
l'étoile change donc de façon périodique, d'où le nom d'étoile variable.
Les deux principaux types de variables pulsantes sont les céphéides et les étoiles RR Lyrae.
Ces astres jouent un rôle central en astrophysique. Les céphéides sont des étoiles de quelque
masses solaires. Elles sont dans la phase de combustion de l'hélium après avoir atteint le stade
de géante rouge. Les étoiles de masse solaire arrivées à ce stade deviennent des RR-Lyrae.
Leur luminosité varie avec une période comprise entre un jour et plusieurs semaines. La
propriété remarquable des céphéides est l'existence d'une relation entre leur luminosité
moyenne et la période de leurs oscillations. Par exemple, leur luminosité moyenne est de 1000
fois celle du Soleil pour une période de quelques jours et de 10000 fois cette valeur pour une
période de plusieurs semaines. C'est cette relation qui fait des céphéides l'un des outils de base
de l'astrophysique.
Si nous connaissons cette relation pour une étoile variable, il est relativement aisé, par la
détermination de sa période d'en tirer la magnitude absolue . En mesurant alors sa
magnitude apparente nous pouvons ensuite calculer sa distance en parsec à l'aide de la
relation (démontrée précédemment):
1026/2001
Sciences.ch 14/03/2005
L'étalonnage de cette courbe ne peut se faire que par des mesures de parallaxe sur des
Céphéides proches. Il n'en existe malheureusement pas d'assez rapprochées pour qu'il soit
possible d'utiliser la parallaxe annuelle. Il faut avoir recours à la parallaxe secondaire qui est
basée sur le mouvement du Soleil dans la galaxie.
Exemple :
Nous repèrons une Céphéides grâce à son type de classe spectrale. Sa période est de 50 jours
et sa magnitude apparente . La figure précédente donne, pour cette étoile, une
magnitude absolue .
Grâce aux propriétés des Céphéides, nous disposons d'un instrument de mesure qui porte
jusqu'à quelques dizaines de millions d'années-lumière. Il est donc applicable au delà de notre
Voie lactée jusqu'aux galaxies proches comme les membres du groupe local. Au-delà, il
devient difficile de détecter des Céphéides aux caractéristiques connues.
Les étoiles RR Lyrae sont quant à elles des étoiles peu massives et vieilles. Leur période
d'oscillation est inférieure à un jour. Contrairement aux céphéides, elles ont toutes la même
luminosité moyenne (magnitude absolue de 0.5), environ 100 fois celle du Soleil.
Il existe encore une certainte quantité d'étoiles variables différentes (variables à éclipses, des
variables explosives, variables binaires,...) dont nous peuvons trouver un source abondante
d'information sur l'Internet.
Il existe d'autres méthodes plus connues de mesure des distantes que celle des céphéides :
PARALLAXE TRIGONOMÉTRIQUE
La méthode de parallaxe trigonométrique est très simple (mais délicate à mettre en œuvre à la
1027/2001
Sciences.ch 14/03/2005
surface de notre planète pour les étoiles très distantes). Tout astronome amateur constate la
fuite de l'étoile qu'il observe dans son oculaire. Ce mouvement se nomme "mouvement
diurne". Il est dû à la rotation de la Terre sur elle même. L'étoile est également animée d'un
mouvement elliptique beaucoup mois facilement détectable : le "mouvement parallactique".
Il est dû, comme le suggère le schéma ci-contre, à la rotation de la Terre autour du Soleil.
Nous mesurons dont l'angle :
si l'angle est faible (ce qui est très fréquemment le cas étant donné la distance des étoiles),
nous pouvons prendre le premier terme du développement de Taylor de la fonction tangente :
où est la distance du Soleil à l'étoile et a celle de la Terre au Soleil comme représenté ci-
dessous :
LIMITE DE CHANDRASEKHAR
1028/2001
Sciences.ch 14/03/2005
Dans ce cas particulier l'astre est ce que nous avions appellé un "Trou Noir". Cependant, avant
le trou noir, une étoile passe comme nous en avons parlé par plusieurs étapes intermédiaires
par lesquelles elle peut d'ailleurs se stabiliser. Ainsi, vous avez du souvent lire dans la
littérature que pour une naine blanche s'effondre en étoile à neutrons, que sa masse devait être
supérieur à 1.4 masses solaire. C'est ce que nous allons démontrer maintenant.
Nous allons introduire le sujet sur l'étude de l'influence du principe d'incertitude sur la taille
d'un système atomique (il en limite la dimension minimale). Cet exemple est fort puissant car
il montre que le principe d'incertitude ne régit pas seulement le processus de la mesure mais
aussi le comportement global des systèmes quantiques.
Le premier exemple que nous pouvons donner est celui de l'atome d'hydrogène, non que nous
attendions un résultat nouveau de cette méthode d'analyse, mais plutôt parce que nous
pouvons exposer l'usage du principe d'incertitude et insister sur sa signification.
Nous admettons que le proton, dont la masse l'emporte de beaucoup sur celle de l'électron,
peut être considérée comme fixe. L'énergie de l'électron s'écrit :
En physique classique, un système dont l'énergie est donnée par la relation précédente ne
possède pas de minimum : si nous faisons tendre vers zéro en conservant la forme circulaire
de l'orbite, il est facile de voir que tend vers . En revanche, en physique quantique,
cette limite n'a pas de sens : le principe d'incertitude s'y oppose.
Dans ce cas, la recherche du minimum de prend un sens, car une contrainte apparaît
qui maintient ce minimum à une valeur finie. Elle se détermine en physique quantique (voir le
modèle de Bohr de l'atome dans le chapitre de physique quantique corpusculaire) et impose:
ou
Cependant, cette relation mis à part, si le rayon de l'atome devient trop faible sous des
contraintes extérieures (attention! nous nous affranchissons des orbites quantifiées du modèle
de Bohr de l'atome qui impose une contrainte à ) la quantité de mouvement de l'électron
ne peut être inférieure à l'incertitude qu'impose le principe d'incertitude de Heisenberg,
dès lors que est de l'ordre du rayon de l'atome. La forme même de la relation
précédente limite la portée de la méthode : nous ne pouvons espérer déterminer mieux qu'un
ordre de grandeur du minimum de .
Afin d'évaluer le minimum de l'énergie totale, que nous interprètons comme l'état
fondamental de l'atome d'hydrogène, nous calculons le minimum de en éliminant de
l'expression:
1029/2001
Sciences.ch 14/03/2005
par
Nous obtenons :
Le rayon de l'atome dans l'état fondamental est la valeur de qui donne à sa valeur
minimale:
si bien que:
qui est l'expression bien connue du rayon de Bohr vue en physique quantique corpusculaire
lors de l'étude du modèle de Bohr de l'atome. L'énergie de l'état fondamental est donc
maintenant facilement calculable.
Le but de cet exemple est de montrer qu'avec le principe d'incertitude de Heisenberg nous
pouvons par un raisonnement très simple retrouver l'état fondamental d'un système. C'est
exactement de cette façon que nous allons procéder pour déterminer les conditions qui font
qu'un astre se retrouve dans son état fondamental.
Au cours de la vie de l'étoile, de nombreux processus de fusion ont eu lieu. Ils ont accru à
chaque fois la taille et la masse des noyaux; FE (le fer) qui est abondant à la fin de la vie d'une
étoile, contient en moyenne 56 nucléons (voir la partie physique atomique du site).
Ces noyaux sont de nature chimique ou isotopique variée. Comme ils sont peu nombreux en
comparaison des électrons, leur pression est celle d'un gaz classique chargé, neutralisé par la
présence des électrons: elle peut être ignorée, et ce d'autant plus que la température est nulle.
En première approximation, les électrons exercent donc l'un sur l'autre une répulsion
apparente qui n'est pas d'origine coulombienne (principe d'exclusion de Pauli). En première
approximation, ils obéissent à une relation analogue à celle de l'électron atomique et qui
1030/2001
Sciences.ch 14/03/2005
A température , l'équilibre est atteint quand l'énergie (la matière de l'astre) totale du
système est minimale.
L'énergie potentielle gravifique d'une étoile est donnée en bonne approximation par (voir
chapitre de mécanique classique) :
La seconde contribution à l'énergie est essentiellement celle du gaz électronique dégénéré (la
dégénérescence correspond à l'existence de plusieurs états ayant la même énergie), d'origine
cinétique. Nous pourrions être tenté d'écrire simplement:
Cette manière de faire conduit à une impasse. Si nous exigons que la somme
atteigne une valeur minimale, nous aboutissons à une valeur du rayon de l'étoile
tellement faible que, par application de la relation la vitesse moyenne des électrons
dépasserait celle de la lumière!
Pour éviter cette contradiction, nous devons recourir à la mécanique relativiste qui nous a
montré que, dans ce cas (voir chapite de mécanique relativiste), nous pouvons exprimer
l'énergie cinétique comme:
1031/2001
Sciences.ch 14/03/2005
nous avons :
La distance moyenne entre électrons s'évalue en supposant que l'étoile est homogène,
approximation suffisante dès lors que nous cherchons l'ordre de grandeur d'une moyenne.
Nous simplifions encore la géométrie en admettant que chaque électron est entouré d'un
domaine sphérique de rayon dans lequel il n'y a pas d'autre électron de même spin et où
nous ne pouvons compter qu'un électron de spin opposé. Dès lors:
puis
1032/2001
Sciences.ch 14/03/2005
Si la Naine Blanche dépasse cette masse alors nous ne pouvons plus traiter le problème avec
les équations précédentes. Elle satisfait alors aux équations régissant un astre composé de
neutrons uniquement (étoile à neutrons) et ceci constitue alors un autre problème que nous
n'aborderons pas ici pour l'instant.
Elle constitue la masse au-delà de laquelle une naine blanche s'effondre en étoile à neutrons.
Avant de commencer, nous devons définir le "principe cosmologique" formé des deux
assertions suivantes; en gros, il assure que nous ne sommes pas des observateurs privilégiés,
et que ce que nous observons est bien représentatif de l'ensemble de l'Univers:
- L'espace est homogène, c'est à dire qu'il présente les mêmes propriétés dans toutes ses
régions. Ceci doit s'entendre à très grande échelle, au-delà du millier de Mpc (Mégaparsecs).
Il est clair qu'à petite échelle existent des inhomogénéités, nous par exemple.
- L'espace est isotrope, c'est à dire qu'il n'existe pas de direction particulière de l'espace,
comme une direction d'aplatissement, ou un mouvement d'ensemble à l'échelle Universelle
par exemple.
1033/2001
Sciences.ch 14/03/2005
H1. Nous admettons que l'Univers est un milieu gazeux dont les particules sont des galaxies .
H3. Ce milieu est homogène (ses propriétés sont les mêmes partout) et isotrope (ses propriétés
sont les mêmes dans toutes les directions). Ces propriétés sont le résultat d' observations.
H7. Il y a conservation de la masse (et donc de l'énergie- nous rejetons la suggestion de Hoyle
d'une création continue).
En écrivant cette relation, nous considérons que les points et sont sur un plan à
courbure nulle. Effectivement, si nous imaginons deux points sur une surface courbe cercle
(par exemple la surface d'une sphère) voyons ce qui ce passe:
La distance entre deux points du cercle (in extenso de l'espace sphérique) est donné par:
Nous voyons très bien dans cette relation que si le rayon (de l'Univers sphérique) change d'un
facteur , alors la variation de distance entre les deux points n'est pas proportionnelle à ce
facteur !! Ce qui n'est pas le cas dans un plan à courbure nulle.
1034/2001
Sciences.ch 14/03/2005
Conséquence: notre modèle Newtonien n'est valable que dans un Univers plat alors que la
relativité générale peut prendre en compte n'importe quelle type de courbure !
Remarques :
R2. La loi s'applique donc à un segment quelconque dans l'Univers c'est pourquoi
l'Univers ne comporte pas de centre géométrique et que nous pouvons nous donner une image
suggestive pour se donner une idée de l'expansion de la "trame" de l'Univers : soit un ballon
mi-gonflé sur la surface de laquelle nous traçons deux repères (par exemple : deux croix
tracées à l'encre). En le gonflant davantage, nous constaterons que ces deux croix s'écartent
l'une de l'autre et donc la distance qui les séparent s'accroître. C'est ce que nous constatons
avec les galaxies (hors mis, leur mouvement propre, il y a en plus un mouvement dû à
l'expansion de l'Univers).
Le premier membre donne alors la vitesse des particules (ou de tout autre objet) au point
:
Soit en éliminant :
1035/2001
Sciences.ch 14/03/2005
Avant d'aller plus loin, il convient de s'arrêter sur cette équation pour l'instant présent :
Cette équation dit que les objets de l'Univers s'éloignent avec une vitesse proportionnelle à
leur éloignement dans tous les points de l'Univers sans référentiel privilégié (aucune galaxie
ne semble être fixe !). La constante étant bien sûr identifiable à la constante de Hubble
telle qu'elle est mesurée actuellement et valant environ .
Ainsi, une estimation actuelle de l'âge de l'Univers pourrait être interprétée comme l'inverse
de la constante de Hubble ce qui nous donnerait :
Inversement, nous pouvons nous amuser à calculer la distance à partir de laquelle nous
pouvons atteindre la vitesse de la lumière soit environ 13
milliards d'années-lumière. Telle est la distance de "l'horizon cosmologique". C'est-à-dire la
distance à partir de laquelle le redshift des galaxies devient infini. C'est donc là que se situe le
Big Bang, à environ 13 ou 15 milliards d'années d'ici.
1036/2001
Sciences.ch 14/03/2005
où est une constante. En divisant par chaque membre et en remplaçant par son
expression en fonction de la densité, nous obtenons :
et :
Nous obtenons:
Or, sont des constantes. Nous introduisons une nouvelle constante définie par (afin
de simplifier les écritures) :
Remarque :
Einstein rajouta à cette équation pour des raisons de conviction personnelles et quasi
religieuses une fameuse constante cosmologique qui lui permettait de rendre statique le
facteur d'échelle de l'Univers. Nous (les auteurs du site) rejetons cette constante arbitraire,
même si dans la physique contemporaine elle est revenue à la mode (sa valeur a été cependant
définie mathématiquement plutôt que religieusement) car elle permettrait d'expliquer la
provenance de la matière sombre, les lois actuelle de notre Univers, la période inflationniste
de notre Univers ainsi que sa géométrie. Ainsi, l'équation de Friedmann avec cette constante,
qui est un total artifice de travail, moderne s'écrit :
1037/2001
Sciences.ch 14/03/2005
avec :
C'est Andreï Sakharov qui a défini la valeur de cette constante cosmologique qui
s'apparenterait soit disant à l'énergie quantique du vide (fonction des champs de Higgs).
Information : deux idées guident les chercheurs de ce début de 21ème siècle : en physique
quantique les équations du champ associées aux particules élémentaires servent à définir la
théorie du Big Bang. La célèbre équation d'équivalence d'Einstein nous dit que l'énergie crée
un champ gravitationnel comme l'électron en mouvement provoque un champ
électromagnétique. Il découle de ces deux observations qu'en mesurant le champ
gravitationnel nous avons un moyen de déterminer l'énergie du vide. Le champ gravitationnel
ne concerne plus la matière mais bien la densité d'énergie du vide. Or la constante
cosmologique est directement proportionnelle à la constante de la gravitation, . Sa mesure
est un jeu très dangereux car de sa valeur dépend plusieurs lois fondamentales de physique et
des propriétés non négligeables quant à la dynamique de notre Univers. Le débat reste donc
complètement ouvert et si nous (les auteurs du site) trouvons une démonstration valable et
rigoureuse de cette constante, nous mettrons à disposition du lecteur les conséquence de cette
constante sur les modèles que nous allons voir ci-après.
Nous obtenons :
en :
L'exposant du terme de gauche impose que le terme de droite soit positif ou nul tel que :
1038/2001
Sciences.ch 14/03/2005
Rappelons que les conditions initiales nous imposent qu'au temps nous ayons :
et
Effectivement :
Il vient alors :
Ce terme devrait être accessible à l'observation, hélas est très mal connu et encore
plus. Autrement dit, compte tenu du signe "-" dans l'expression de , nous ne connaissons
aujourd'hui même pas le signe de cette constante.
Cependant, il peut-être important de noter qu'il existe une valeur critique qui annule
telle que :
Les physiciens ont défini une constante notée par la lettre grecque et donnée par :
- :
Nous avons :
ce qui en remplaçant dans l'équation de Friedmann donne : (un Univers plat comme
nous le verrons dans notre étude du modèle relativiste).
- :
1039/2001
Sciences.ch 14/03/2005
- :
En effectuant le même raisonnement, mais en inégalités, nous avons alors: (un Univers
à courbure négative (fermé) comme nous le verrons dans notre étude du modèle relativiste).
Remarque : toutes les mesures qui ont pu être faites jusqu'à présent n'ont pas permis de mettre
en évidence une courbure de l'univers. Les mesures du rayonnement fossile par le ballon
Boomerang et le satellite COBE tendent cependant à accréditer l'hypothèse d'un univers plat
relativement aux simulations numériques :
Revenons à l'équation :
1040/2001
Sciences.ch 14/03/2005
En adoptant la notation :
D'où :
Remarque: nous ne pouvons poser car dans nos hypothèses initiales se trouvait le
principe de conservation de l'énergie.
MODÈLE DE FRIEDMANN-LEMAITRE
et en intégrant, il vient :
1041/2001
Sciences.ch 14/03/2005
Qui se simplifie en (nous élevons au carré d'où la suppression du double signe ±):
à laquelle il nous faut rajouter une constante pour avoir la condition qui reste
satisfaite :
Ce qui nous donne sur un tracé (nous avons représenté une échelle arbitraire du temps sur
l'axe vertical) une fonction à l'allure suivante (ne pas se fier aux valeurs indiquées elles sont
arbitraires) :
Nous avons mise la zone où en évidence pour bien rappeler que cette partie de la
solution est à rejeter.
Nous avons donc un modèle d'Univers dont le facteur d'échelle croit de façon exponentielle et
et ce indéfiniment.
Remarque : plus est grand, plus la croissance du facteur d'échelle est grand (sous-entendu
que la pente est bien évidemment plus grande).
MODÈLE HYPERBOLIQUE
1042/2001
Sciences.ch 14/03/2005
nous avons :
Dans le chapitre de calcul différentiel et intégral nous avons vu que cette forme de primitive
se résout par la relation (nous rajoutons la constante d'intégration à la fin car nous faisons de
la physique et il faut satisfaire des conditions initiales auxquelles nous ne nous intéressions
1043/2001
Sciences.ch 14/03/2005
avec :
d'où :
Enfin :
Entre les deux bornes d'intégration nous avons donc (la constante d'intégration
s'annule et nous reprenons le ± qui se trouvait initialement dans l'intégrale) :
Si nous traçons cette fonction pour une valeur fixe. Nous avons le tracé suivant dans
Maple (nous ne considérerons que le cas avec le signe "-" ci-dessous pour l'instant car le signe
"+" nous donnerait un tracé dans les différentiels de temps négatifs : ):
1044/2001
Sciences.ch 14/03/2005
Remarque : le temps est toujours représenté sur l'axe vertical ainsi que pour tous les
diagrammes suivants (il vous faut tourner un peu la tête si habituellement vous mettez le
temps sur l'axe des abscisses…).
Nous voyons que plus la constante est petite, plus l'Univers arrive rapidement à un valeur
finale. De plus pour une valeur de fixée, certaines valeurs de sont interdites (c'est à
cause de la condition d'intégration).
1045/2001
Sciences.ch 14/03/2005
Remarque : comme nous l'avons déjà précisé, toutes les valeurs de inférieures à 1 sont à
rejeter !
Une condition limite (condition d'intégration) pour que le terme de droite de l'égalité soit
positif est que :
ou
Donc, si est plus petit que , nous ne somme plus dans un domaine valable (réel) du
modèle.
ou
Cette limite a été présentée par une ligne verticale bleue sur l'avant-dernier diagramme. Nous
y avons également représenté par une ligne horizontale verte la limite temporelle temps
correspondante .
Au fait, au-delà de cette limite temporelle, ce que ne sait pas l'ordinateur qui a tracé notre
fonction qu'il devrait basculer sur la fonction d'échelle avec le signe "+". Ainsi, lorsque nous
exécutons le tracé des deux fonctions avec les bornes adéquations :
1046/2001
Sciences.ch 14/03/2005
nous obtenons alors (le temps est représenté sur l'axe vertical) :
Nous voyons que alors que pour l'Univers entre dans un phase de contraction que nous
appelons communément "Big Crunch". Après cette phase de rétraction, il est possible soit que
l'Univers disparaisse totalement, soit qu'il entre à nouveau dans un phase dynamique cyclique
(mathématique les deux possibilités sont possibles).
MODÈLE SPHÉRIQUE
1047/2001
Sciences.ch 14/03/2005
nous avons :
Dans le chapitre de calcul différentiel et intégral nous avons vu que cette forme de primitive
se résout par la relation (nous rajoutons la constante d'intégration à la fin car nous faisons de
la physique et il faut satisfaire des conditions initiales auxquelles nous ne nous intéressions
pas nécessairement en mathématique) :
avec :
d'où :
1048/2001
Sciences.ch 14/03/2005
Enfin :
Entre les deux bornes d'intégration nous avons donc (la constante d'intégration
s'annule) :
Nous devons évidemment avoir (nous reprenons le ± qui se trouvait initialement dans
l'intégrale) :
Si nous traçons cette fonction pour une valeur fixe. Nous avons le tracé suivant dans
Maple (nous ne considérerons que le cas avec le signe "-" car celui avec le signe "+" n'a pas
de sens physique même translaté) :
1049/2001
Sciences.ch 14/03/2005
Nous voyons que plus la constante est petite, plus l'Univers arrive rapidement croit
indéfiniment rapidement. De plus pour une valeur de fixée, certaines valeurs de sont
interdites (il s'agit au toujours fait de la condition d'intégration).
Nous avons donc ce modèle sphérique un Univers qui croit indéfiniment de façon
exponentielle (comme le modèle plat de Friedmann-Lemaître) car étant donné que , il
n'y a plus de condition limite d'intégration (contrairement au modèle hyperbolique précédent).
UNIVERS OBSERVABLE
Nous avons déterminé plus haute une estimation actuelle de l'âge de l'Univers comme pouvant
être interprétée comme l'inverse de la constante de Hubble ce qui nous a donné :
Cependant il est difficile de s'imaginer ce que cela représente. A ce titre, nous avons trouvé
sur Internet une magnifique série d'illustrations (si l'auteur reconnaît ses créations qu'il se
manifeste afin que nous puissions en donner la source) que nous vous proposons :
1050/2001
Sciences.ch 14/03/2005
Cette carte essaye de montrer l'ensemble de l'Univers visible. Les galaxies dans l'univers ont
tendance à se rassembler en vastes feuilles et superamas de galaxies, entourant de grands
vides, ce qui confère à l'univers une apparence cellulaire. Parce que la lumière dans l'univers
ne voyage qu'à une vitesse finie, nous voyons les objets sur le bord de l'univers quand celui-ci
était très jeune, il y a 13 milliards d'années.
1051/2001
Sciences.ch 14/03/2005
Les Galaxies et les amas de galaxies ne sont pas distribués régulièrement dans l'Univers. Au
lieu de cela, ils sont rassemblés en de larges amas, feuillets et murs de galaxies séparés par de
larges vides dans lesquels peu de galaxies semblent se trouver. La carte ci-dessus montre un
certain nombre de ces superamas, y compris celui de la Vierge - un superamas plutot petit
dont notre galaxie fait partie. La carte entière représente à peu près 7% du damètre de
l'Univers visible. Les galaxies sont trop petites pour apparaitre individuellement sur cette
carte, chaque point y représente un groupe de galaxies.
1052/2001
Sciences.ch 14/03/2005
Notre galaxie n'est qu'une parmi des milliers d'autres qui se trouvent à moins de 100 millions
d'années lumière. La carte ci-dessus montre comment les galaxies tendent à s'amasser par
groupes, le plus important des amas proches étant l'amas de la Vierge (Virgo), une
concentration de plusieurs centaines de galaxies qui domine les groupes de galaxies
environnants. Collectivement, l'ensemble de ces groupes est connu sous le nom de Superamas
de la Vierge. Le second amas le plus riche de ce volume est l'amas du Fourneau (Fornax),
mais il est bien moins riche que celui de la Vierge. Seules les galaxies brillantes sont
dessinées ici, notre galaxie est le point tout au centre.
1053/2001
Sciences.ch 14/03/2005
La Voie Lactée est une des trois grandes galaxies du groupe appelé Groupe Local qui contient
aussi plusieurs dizaines de galaxies naines. La plupart de ces galaxies sont portées sur cette
carte, mais il faut noter que beaucoup de ces galaxies naines sont très peu brillantes, et qu'il y
en a donc certainement d'autres à découvrir.
1054/2001
Sciences.ch 14/03/2005
La Voie Lactée est entourée par plusieurs galaxies naines, qui contiennent chacune quelques
dizaines de millions d'étoiles, ce qui est insignifiant comparé à la population de la Voie Lactée
elle-même. La carte ci-dessus montre l'ensemble des galaxies naines les plus proches, elles
sont liées gravitationnellement à la Voie Lactée, et gravitent autour d'elle en quelques
milliards d'années.
1055/2001
Sciences.ch 14/03/2005
Cette carte montre la Voie Lactée dans son ensemble - une galaxie spirale d'au moins deux
cent milliards d'étoiles. Notre Soleil est profondément enfoui dans le Bras d'Orion à environ
26 000 années lumière du centre. Vers le centre de la Galaxie, les étoiles sont beaucoup plus
proches les unes des autres qu'à la périphérie où nous vivons. Notez également la présence de
petits amas globulaires bien en dehors du plan galactique, et la présence d'une galaxie naine
voisine - dite du Sagittaire - qui est en train d'être lentement avalée par notre propre Galaxie.
1056/2001
Sciences.ch 14/03/2005
Ceci est une carte de notre coin de la Voie Lactée. Le Soleil est situé dans le Bras d'Orion - un
bras assez petit comparé au Bras du Sagittaire, qui se situe plus près du centre galactique. La
carte montre plusieurs étoiles visibles à l'oeil nu, situées loin dans le bras d'Orion. Le groupe
d'étoiles le plus marquant est composé des étoiles principales de la constellation d'Orion - de
laquelle le bras spiral tire son nom. Toutes ces étoiles sont des géantes et supergéantes
lumineuses, des milliers de fois plus lumineuses que le Soleil. L'étoile la plus brillante de la
carte est Rho Cassiopeia - à 4'000 années lumière de nous, c'est juste une étoile à peine visible
à l'oeil nu, mais en realité c'est une supergéante 100'000 fois plus lumineuse que le Soleil.
1057/2001
Sciences.ch 14/03/2005
Cette carte indique les 1500 étoiles les plus lumineuses situées à moins de 250 années
lumière. Toutes ces étoiles sont bien plus lumineuses que le Soleil, et la plupart sont visibles à
l'oeil nu. Environ un tiers des étoiles visibles à l'oeil nu sont situées à moins de 250 années
lumière, même si cette zone ne représente qu'une toute petite partie de notre galaxie.
9. L'univers jusqu'à 12.5 Années Lumière (les étoiles les plus proches) :
1058/2001
Sciences.ch 14/03/2005
Cette carte montre toutes les étoiles jusqu'à une distance de 12.5 années lumière de notre
Soleil. La plupart de ces étoiles sont des naines rouges - des étoiles avec une masse du
dizième de celle du Soleil et une luminosité cent fois moins grande. Environ quatre vingt pour
cent des étoiles de l'univers sont des naines rouges, et l'étoile la plus proche - Proxima du
Centaure- en est un exemple typique.
Cette carte montre toutes les étoiles connues situées à moins de 20 années lumière. On y
trouve un total de 77 systèmes contenant 110 étoiles.
1059/2001
Sciences.ch 14/03/2005
Les distances entre les étoiles sont énormes. La distance du Soleil à Proxima Centauri est de
4.22 années lumière, soit quarante trillions de kilomètres. Marcher sur cette distance prendrait
un milliard d'années. Même les sondes spatiales les plus rapides mettraient soixante mille ans
pour faire le voyage. Il y a actuellement quatre sondes qui quittent le système solaire - Pioneer
10 et 11, et Voyager 1 et 2 mais nous perdrons vraisemblablement le contact avec elles d'ici
une vingtaine d'annéees. Le schéma ci-dessous essaye de montrer ces distances en élargissant
le champ depuis le système solaire intérieur jusqu'à Alpha du Centaure.
1060/2001
Sciences.ch 14/03/2005
RAYONNEMENT FOSSILE
L'expansion de l'Univers a pour conséquence son refroidissement graduel. A partir des valeurs
fantastiquement élevées qui ont dû régner aussitôt après le Big Bang qui a engendré l'Univers,
sa température a progressivement décrû. Lorsqu'elle atteint environ se produit le
premier des deux phénomènes cruciaux qui nous intéressent ici : la rayonnement, qui jusque-
là était en équilibre thermique avec les particules matérielles, cesse pratiquement d'interagir
avec elles et en devient indépendant. Dans le "modèle standard" d'évolution de l'Univers, nous
calculons que ce moment crucial se situe ans après le Big Bang.
1061/2001
Sciences.ch 14/03/2005
Considérons les photons situées, à cet instant dans le volume , et dont la pulsation est
à près. Leur nombre est donc égal à :
1062/2001
Sciences.ch 14/03/2005
Donc, l'énergie contenue à cet instant dans le volume et dans la bande de pulsations
, que nous écrirons est donne par :
Il s'ensuite que la distribution spectrale de l'énergie est encore à l'instant celle du corps
noir :
Ainsi, après son découplage d'avec la matière, la rayonnement cosmique évolue en conservant
la distribution d'un corps noir dont la température décroît régulièrement, dans la même
proportion que s'accroissent les distances au cours de l'expansion de l'Univers (depuis le
moment du découplage, le facteur d'échelle est très voisin de 1000 puisque pour passer de
aux actuels il y a un facteur 1000…). Cette valeur de 1000 nous permet à
partir du modèle de Friedmann-Lemaître que nous avons démontré en partie ci-dessus de
facilement calculer à quel moment de l'âge de l'Univers ce découplage a eu lieu. C'est ainsi
que nous trouvons une valeur d'a peu près années.
1063/2001
Sciences.ch 14/03/2005
C'est en se fondant sur ce raisonnement que divers auteurs furent amenés à prédire l'existence
dans l'Univers actuel, d'un rayonnement fossile de quelques kelvins. La découverte de Penzias
et Wilson, qui confirme parfaitement le plus solide en faveur du "modèle cosmologique
standard", qui reconstitue l'histoire de l'Univers à partir de la "grande explosion" initiale.
1064/2001
Sciences.ch 14/03/2005
MÉCANIQUE RELATIVISTE
Nous avons toujours considéré jusqu'à maintenant lors de tous nos développements que les
interactions (relations de cause à effet) entre les corps se faisaient instantanément, ainsi que
l'observation d'un phénomène avait lieu instantanément après que celui-ci, soit. Or, deux
physiciens (Michelson et Morley) au cours d'une expérience découvrirent quelque chose qui
allait changer radicalement toute la physique classique : la vitesse de la lumière était
invariante (constante) quelque soit le mouvement que l'on avait par rapport à elle. Cette
observation est d'autant plus importante que nous savons que c'est la lumière qui nous permet
de percevoir, ressentir les choses. Il convient également de prendre en compte que le champ
électrostatique, magnéatique sont comme nous l'avons vu en physique quantique ondulatoire,
des champs dont le "vecteur d'interactions" sont les photons qui se déplacement à la vitesse la
lumière. Cette constation nous permet aussi de supposer que le champ gravitationel
finalement a aussi un "vecteur d'interaction" (qui seraient les "gravitons" dont l'existence
semble prouvée indirectement) qui se propage à la vitesse de la lumière. Il convient dès lors
de prendre en compte cette "non-instantanéité" des et les conséquences que cela entraîne dans
les phénomènes observés pour déterminer finalement ce qui est réellement que ce qui semble
être.
Avant de nous attaquer aux calculs, il convient de définir un petit peu ce qui va être étudié
dans ce chapitre :
1. La "relativité restreinte" : elle est confinée aux référentiels inertiels (galiléens), c'est-à-dire
à l'étude de corps animés d'un mouvement rectiligne uniforme ou accéléré mais depuis un
référentiel galiléen.
2. La "relativité générale" : elle a pour rôle de prendre en compte des référentiels non inertiels
et dans n'importe quel système de coordonnées en faisant usage de la puissance du calcul
tensoriel pour être applicable dans n'importe quel type d'espace.
Ces deux théories se basent principalement sur cinq concepts très importants :
3. Le principe de cosmologique (que nous définissons plus loin lorsque nous commencerons à
étudier la relativité restreinte)
5. Le principe d'équivalence (qui est tout aussi puissant que le principe variationnel et qui est
au la vraie idée géniale d'Einstein pour développer la relativité générale).
- la relativité restreinte sous forme algébrique classique dans un premier temps et ensuite avec
une petite correspondance à la notation tensorielle et à l'aspect géométrique de cette théorie
1065/2001
Sciences.ch 14/03/2005
RELATIVITÉ RESTREINTE
Les lois physiques expriment des relations entre des grandeurs physiques fondamentales. Si
les lois physiques sont invariantes par changement de référentiel galiléen comme nous l'avons
vu en mécanique classique, il n'en est pas forcément de même des grandeurs physiques. Ces
dernières peuvent se transformer d'un référentiel galiléen à un autre selon une loi de
transformation simple comme nous l'avons vu au chapitre de mécanique classique. Il en est de
même en relativité restreinte mais nous devons maintenant prendre en compte ce que nous
avions négligé lors de notre des transformations de galilée : l'intervalle de temps entre deux
événements n'est pas le même pour deux observateurs si la vitesse de la lumière est finie !
(trivial)
Nous allons donc voir maintenant l'invariance de la vitesse de la lumière, implique de
nouvelles règles mathématiques afin d'assurer l'invariance des lois de la physique lors d'un
changement de référentiel. Ces règles sont ce que nous appelons les "transformations de
Lorentz" et c'est ce que nous allons maintenant par une développement mathématique
extremement simple (beaucoup beaucoup plus simple que la relativité générale) démontrer
maintenant.
POSTULAT D'INVARIANCE
Remarque : il est important de noter que nous considèrons que la lumière est dans le cadre
actuel de la relativité restreinte, le messager de l'information d'un corps sur un autre !!!
PRINCIPE COSMOLOGIQUE
1066/2001
Sciences.ch 14/03/2005
Définition : nous supposons que notre position dans l’Univers est typique, non seulement dans
l’espace comme l’affirme le modèle standard de l'Univers (voir chapitre d'astrophysique),
mais aussi dans le temps. Ainsi, un astronome situé dans une galaxie éloignée doit observer
les mêmes propriétés générales de l’Univers que nous, qu’il ait vécu un milliard d’années plus
tôt, ou qu’il l’observe dans un milliard d’années.
En fait, il est relativement naturel d’aller plus loin et d’énoncer que : l’Univers présente le
même aspect en chacun de ses points, c’est-à-dire qu’il est homogène. Cette homogénéité
s’énonce sous la forme du "principe cosmologique". Ce principe ne repose pas sur les
observations, si fragmentaires par rapport à la démesure du cosmos qu’elles ne sauraient
permettre d’établir sa validité. Il constitue bien un présupposé à toute étude physique de
l’Univers. Sa raison d’être tient à son caractère, indispensable à toute cosmologie scientifique,
et peut-être à une certaine réaction par rapport à l’ancienne vision géocentrique ou
héliocentrique : il est supposé désormais évident qu’aucun lieu n’est privilégié dans le
cosmos !
Rappelons (voir chapitre de mécanique classique) que les transformations galiléennes nous
disent qu’aucun référentiels ne peut être considéré comme un référentiel absolu puisque les
relations entre les grandeurs physiques sont identiques dans tous les référentiels galiléens
("principe de relativité galiléen"). Le mouvement galiléen est donc relatif.
1067/2001
Sciences.ch 14/03/2005
relativité restreinte (cette relativité est en effet restreinte aux cas des référentiels galiléens
exclusivement).
Énoncé du principe de relativité restreinte : les lois physiques sont inchangées après un
changement de référentiel galiléen ou encore, les lois physiques sont identiques dans tous les
référentiels galiléens.
TRANSFORMATIONS DE LORENTZ
Pour que soit possible l'invariance de , nous devons admettre que le temps ne s'écoule pas de
la même manière pour l'observateur immobile que pour l'observateur dans un
référentiel en translation uniforme en (ce cas particulier de dispositions des référentiels dans
lesquels les axes d'espaces sont parallèles amènent à ce que nous appelons les "transorfmations de
Lorentz pures" ou "transformations de Lorentz spéciales") à vitesse relative (le terme "relative" est
important!) .
Pour étudier le comportement des lois physique, nous devons alors nous munir de deux
horloges qui donnent et (le référentiel qui contient son horloge/instrument de mesure est
appelé "référentiel propre")
1068/2001
Sciences.ch 14/03/2005
Étant donne que le déplacement de ne se fait qu'en , nous avons pour les deux
observateurs :
et
Ce deux relations sont donc égales (nulles) en tout entre les deux observateurs. Ce
sont les premiers "invariants relativistes" (valeurs égales quelque soit le référentiel). Nous
retrouverons ces deux relations sous une forme plus généralisée lors de la fin de notre étude
de la relativité restreinte il convient donc de s'en souvenir.
Dans le modèle relativiste, nous devons par contre admettre que le temps qui est en relation
avec n'est pas le même que qui est en relation avec parce que le principe de relativité
oblige (sinon quoi il serait donc impossible d'expliquer l'invariance de la vitesse de la
lumière) !
Nous sommes alors ammenés à poser la relation précédente sous la forme suivante :
Démonstration :
à déterminer :
1069/2001
Sciences.ch 14/03/2005
à déterminer :
et
Remarque : ces deux relations nous permette d'écire une relation que nous ré-utiliserons bien
plus loin :
Distribuons :
Il faut que :
(1)
(2)
(3)
(1')
1070/2001
Sciences.ch 14/03/2005
(3')
En introduisant également :
dans
nous obtenons :
1071/2001
Sciences.ch 14/03/2005
Si nous posons :
avec
Nous pouvons alors écrire (le lecteur remarquera que les unités de tous les termes à gauche de
l'égalité sont toutes identiques – il s'agit à chaque fois d'une distance) :
Nous pouvons alors mettre les transformation de Lorentz des coordonnées et du temps sous la
forme matricielle suivante :
1072/2001
Sciences.ch 14/03/2005
Remarques :
R1. La transformation inverse étant effectuée bien évidemment avec la matrice inverse
Nous pouvons de même déterminer les transformations de Lorentz des vitesses. Considérons
une particule en mouvement dans un référentiel inertiel tel qu'au temps , ses
coordonnées sont . Dès lors, les composantes de la vitesse sont :
Quelles sont alors les composantes dans la vitesse dans . A nouveau, nous écrivons :
Nous pouvons différentier les équations de transformation des composantes que nous avons
obtenu avant et ainsi pouvons écrire :
et de même :
1073/2001
Sciences.ch 14/03/2005
et :
Et comme la vitesse constante du référentiel est donné par , nous avons alors :
et inversement :
qui sont les transformations de Galilée telles que nous les avons vues en mécanique classique.
De même, nous pouvons déterminer les transformations relativistes des accélérations entre
référentiels inertiels. Cependant ces relations sont relations sont très rarement démontrées
dans les livres ou instituts scolaires et chacun présente des résultats différents. Il convient de
prendre avec extrême précaution les développements qui vont suivre tant qu'ils n'auront pas ét
confirmés ou corrigés par d'autres. Ainsi :
et donc :
et donc :
1074/2001
Sciences.ch 14/03/2005
et de même :
et :
Et inversement :
Comme la vitesse de la lumière est une vitesse indépassable nous venons maintenant à nous
demander quelle sera alors finalement la vitesse d'un objet lancé à un vitesse proche de celle
de la lumière (par exemple...) à partir d'un référentiel se déplaçant lui aussi à une vitesse
proche de la lumière (pourquoi pas non plus...).
Il nous faut alors trouver une relation qui donne la vitesse réelle à partir de la vitesse de
lancement et de la vitesse de référentiel .
1075/2001
Sciences.ch 14/03/2005
Comme celui qui est intéressé ne connaît pas la vitesse réelle , il se doit d'utiliser les
transformations de Lorentz. Ainsi, nous savons que :
d'où :
Nous savons que d'où finalement la "loi d'addition relativiste des vitesses" :
Considérons maintenant que longueur d'un objet est donnée par la distance entre ses deux
extrémités et . Considérons cet objet immobile dans le référentiel et orienté
selon l'axe . Sa longeur est donc la distance entre ses deux extrémités :
Pour l'observateur , l'objet est en mouvement. Les positions de et devraient donc être
mesurées simultanément :
1076/2001
Sciences.ch 14/03/2005
Ainsi, la longueur d'une règle observée dans un référentiel mobile par rapport au référentiel
propre de la règle est inférieure à sa longueur propre. Ce phénomène porte le nom de
"contraction des longueurs".
Pour mesurer cet intervalle, l'observateur dans le référentiel fixe, doit aussi imposer que
est commun aux 2 événements :
Toutes les expériences de physique fondamentales sur des particules à hautes énergies ont
conduit à l'observation que leur masse augmente, lorsqu'elle se déplacent à vitesse par
rapport à l'observateur selon :
1077/2001
Sciences.ch 14/03/2005
ÉQUIVALENCE MASSE-ÉNERGIE
Sous l'action d'une force , la vitesse d'une masse augmente ou diminue sur chaque
portion de la trajectoire. Le travail de la composante peut s'interpréter alors en énergie
cinétique ..
Le gain d'énergie cinétique d'une particule peut donc être considérée comme gain de sa masse.
Puisque est la masse au repos, la quantité est appelée "énergie au repos" de la
particule.
La somme :
LAGRANGIEN RELATIVISTE
1078/2001
Sciences.ch 14/03/2005
En relativité, nous voulons donc que les équations du mouvement aient la même forme dans
tous les référentiels inertiels. Pour cela, il faut que l'action (voir chapitre de mécanique
analytique) soit donc invariante par rapport aux transformations de Lorentz. Guidés par ce
principe, essayons d'obtenir l'action d'une particule libre. Supposons que l'action soit dans le
référentiel :
Remarques :
R1. Le choix du signe moins deviendra évident lors de notre étude de l'électrodynamique.
Et rappelons que :
Donc selon notre hypothèse initiale, nous avons pour le lagrangien relativiste (en l'absence de
champ de potentiel donc… puisque le système est "libre") :
Nous retrouvons donc le lagrangien habituel d'un système libre en mouvement mais plus un
constante qui n'affecte cependant pas les équations du mouvement que nous obtenons
en mécanique classique mais qui nous sera absolument nécessaire en électrodynamique.
1079/2001
Sciences.ch 14/03/2005
Rappelons maintenant que le moment généralisé (voir chapitre de mécanique analytique) est
défini par :
Nous allons voir maintenant que cette définition n'est pas fortuite. Effectivement :
ce qui donne :
L'hamiltonien est dans ce cas égal à l'énergie totale de la particule. Son expression nous
amène à finalement à changer un peu notre hypothèse initiale et finalement à écire au lieu
de dans l'expression de l'action .
et
Nous reconnaissons l'énergie cinétique usuelle, plus une constante : l'énergie au repos. Ce qui
correspond bien aux calculs que nous avions fait avant où nous avons obtenu :
1080/2001
Sciences.ch 14/03/2005
introduit dans :
nous avons :
d'où :
Nous n'avons pas gardé la partie négative de l'égalité précédente car elle n'a aucun sens en
physique classique. Cependant, lorsque nous étudierons la physique quantique, il s'avérera
indispensable de la préserver sinon quoi nous arriverons à des absurdités (voir le chapitre de
physique quantique ondulatoire)
Nous devons donc chercher les relations entre et ainsi qu'entre et , pour qu'il soit
possible à d'écrire :
Si écrit :
1081/2001
Sciences.ch 14/03/2005
Si nous comparons :
, , et
nous obtenons des expressions exactement semblables à celles utilisées pour les
transformations de Lorentz des composantes spatiales et temporelles. Nous pouvons alors
écrire, par similitude, que les transformations pour la quantité de mouvement et l'énergie sont
dès lors données par :
avec
Nous avons dès lors en exprimant toutes les relations précédentes de transformation dans les
mêmes en se souvent que :
1082/2001
Sciences.ch 14/03/2005
qui se note aussi en spécifiant que nous effectuons une transformation de Lorentz des
quantités de mouvement et de l'énergie.
Remarques :
R1. La transformation inverse étant effectuée bien évidemment avec la matrice inverse
FORCE RELATIVISTE
Suivant le principe de la relativité, nous voulons que la relation entre la force et la quantité de
mouvement s'écrive de la même manière par deux observateurs d'inertie en translation l'un par
rapport à l'autre:
Ainsi, si écrit :
La relation entre est assez compliquée dans le cas général. Nous nous limiterons ici
au cas particulier où un corps est momentanément immobile dans et où donc l'observateur
ne tiendra compte que de la force qu'il applique. Il l'appellera par ailleurs "force
propre", car il n'a pas à se préoccuper d'autres forces (comme une force centrifuge, par
exemple).
1083/2001
Sciences.ch 14/03/2005
Puisque :
nous aurons :
Il reste donc :
et
En résumé:
La matrice de transformation est triviale et nous ne l'avons jamais trouvée dans la littérature.
Nous n'en ferons donc pas mention.
1084/2001
Sciences.ch 14/03/2005
La charge d'une particule est donc indépendante de sa vitesse comme nous l'avons démontré
dans la section d'électromagnétisme (chapitre d'électrodynamique) lors de la détermination de
l'équation de conservation de la charge.
La charge est placée en et elle est donc immobile pour . L'observateur conclut
qu'une force électrostatique :
1085/2001
Sciences.ch 14/03/2005
Mais :
Donc :
Pour obtenir les transformations du champ magnétique nous procèdons comme ci-dessous:
1086/2001
Sciences.ch 14/03/2005
Après encore une fois quelques petites manipulations d'algèbre très élémentaire, nous
obtenons :
1087/2001
Sciences.ch 14/03/2005
où une charge immobile est placée en . Il est clair alors que l'observateur mesure
partout et qu'au point du plan , en il mesure le champ
électrostatique :
Si l'observateur est informé des valeurs de et de , il peut les introduire dans les
transformées relativistes donnant le champ électrique qu'il observe:
Le coordonnées du point et de la charge qu'il voit dans le plan sont donnés par les
tranformations de Lorentz habituelles :
et
Une autre méthode, plus simple, est que étant donné que la composante est une longueur,
elle subit donc les transformation de Lorentz et :
Car rappelons le :
et
1088/2001
Sciences.ch 14/03/2005
et :
L'écriture se simplifie si nous utilisons l'angle formé par le vecteur champ électrique et l'axe
. Nous notons alors dans et dans les angles données par :
et
Le facteur contenant montre que le champ électrique d'une charge en mouvement n'a
plus la symétrie sphérique. Il dépend de la direction du vecteur :
A distance égales, le champ électrique est plus intense dans la direction verticale à celle du
déplacement ( ) que dans la direction du déplacement de la charge ( ).
1089/2001
Sciences.ch 14/03/2005
Remarque imortante : rappelons que nous avons effectué (et continuons dans ce sens) ici une
étude d'une charge en mouvement rectiligne uniforme, c'est-à-dire à vitesse constante.
et
et
dans:
Remarque: dans la cas où la vitesse est faible, le terme relativiste tend vers 1 et le champ
d'une charge se déplaçant à la vitesse devient:
Remarques:
1090/2001
Sciences.ch 14/03/2005
R1. En chaque endroit, les lignes du champ sont contenues dans un plan perpendiculaire à
la direction de déplacement de la charge (produit vectoriel oblige)
R2. Si la charge en mouvement est vue comme un attaché au point , nous peuvons
interpréter son déplacement à vitesse comme un courant en un point du référentiel où
se trouve . Ainsi :
Cette dernière relation est connue sous le nom de la "loi de Biot et Savart" et nous la
retrouverons au début de la section traitant de l'éléctromagnétisme. Cet état de fait, valide
encore le modèle relativiste.
RELATION D'EINSTEIN
Si écrit:
et
Reprenons la première relation ci-dessus et mettons-la au carré sans oublier que le photon à
une masse nulle . Alors :
et comme :
nous sommes amenés à écrire la fameuse "relation d'Einstein" que nous retrouverons en
physique quantique et aussi en thermodynamique :
1091/2001
Sciences.ch 14/03/2005
ESPACE-TEMPS DE MINKOWSKI
Ce résultat traduit, que les dimensions d'espace et de temps sont comme arrêtées dans le
référentiel relativiste, car la vitesse de l'objet est égale à celle de la lumière!
Imaginons maintenant qu'un faisceau lumineux soit émis à l'instant et se propage sur
l'axe à la vitesse constante de la lumière, . Nous savons que et que dans l'espace-
temps de Minkowski (application du théorème de Pythagore dans l'espace euclidien à trois
dimensions), cette relation s'écrit:
1092/2001
Sciences.ch 14/03/2005
Remarque : nous pouvons assimiler cette équation à la représentation d'un front d'onde
sphérique d'une onde lumineuse se propageant à la vitesse de la lumière.
Qui à la même forme et même valeur quelque soit le référentiel considéré. est donc un
invariant relativiste que l'on appelle "l'abscisse curviligne d'espace-temps", c'est l'intervalle
d'espace-temps où, comme le dit simplement Einstein, le "carré de la distance"…. Le fait que
cette grandeur puisse être positive, négative (!) ou nulle est liée au caractère absolu de la
vitesse de la lumière (nous y reviendrons juste après).
et
La corrélation entre ces deux relations nous donne lorsque que les deux événements
sont reliés à la vitesse de la lumière.
Ceci n'est rien d'autre que l'équation d'un cône d'axe d'ordonnée … le fameux "cône
d'Univers" (sur lequel nous consacrons tout une étude plus loin). Tout événement est donc par
extension dans ce cône et l'évolution de tout système peut donc y être décrit (par sa positition
spatiale et temporelle), par ce que nous appelons sa "ligne d'Univers". La ligne d'Univers
d'une particule est donc la séquence d'événements qu'elle occupe durant sa vie.
Revenons maintenant à nos transformation de Lorentz. Rappelons que nous nous sommes
restreints au cas particulier où les axes d'espaces étaient parallèles (ce qui nous avait amener à
définir le terme "transformations de Lorentz pures"). Cette configuration spéciale a une
propriété géométrique intéressant dont parfois certains ouvrages font usage. Voyons de quoi il
s'agit.
Nous avons vu dans le cadre des transformation de Lorentz des longueurs que nous avions
une transformation spéciale que selon l'axe , ayant pour les autres composantes
. Ce qui nous permet tout à fait de réduire la matrice de transformation que nous
avions à une matrice plutôt que comme nous l'avions obtenu plus haut :
1093/2001
Sciences.ch 14/03/2005
La première relation peut être mise en relation avec une des relations remarquables de la
trigonométrie hyperbolique (voir le chapitre trigonométrie de la section de géométrie du site)
tel que et , la deuxième qu'il existe tel que et
. La troisième donne alors la relation remarquable :
ce qui nous impose comme propriétés remarquables de par les relations remarquables de la
trigonométrie hyperbolique :
et
La quantité (sans dimensions) est appelée "rapidité" par ceux qui l'utilisent en physique des
hautes énergies. Nous nous arrêterons ici en ce qui concerne l'étude géométrique de la
relativité restreinte trouvant que cela à de moins en moins d'intérêt de procéder ainsi (bien que
ce soit fort sympathique).
CÔNE D'UNIVERS
Remarque : si nous posons que la vitesse de lumière est égale à l'unité, l'axe des ordonnées
devient alors par abus de langage "purement temporel". Nous ne ferons pas ce choix sur ce
site.
1094/2001
Sciences.ch 14/03/2005
Définitions :
D1. Nous dirons par définition que deux événements ponctuels occupent le même point
d'espace-temps s'ils apparaissent simultanés à tout observateur capable des les voir.
D3. La frontière définie par le cône d'Univers est appelée "horizon cosmologique"
Rappel : Si aucune force n'agit sur une particule ponctuelle, nous la qualifions "d'inertielle";
nous disons également qu'elle est en "mouvement inertiel".
La ligne d'univers de tout observateur qui occupe instantanément (dont la ligne d'univers
passe par ) est contenue à l'intérieur de définit par un point unique sur sa sphère
céleste (pour un observateur donné, son temps propre pouvant être normalisé à l'unité, nous
avons alors une sphère). Cela veut dire qu'il peut y avoir autant de rayons nuls (foyers des
cônes) passant par que de points sur une sphère.
L'exemple suivant paraîtra plus évident (il faut comprendre par soi-même implicitement que
l'Univers a son propre cône d'Univers - si l'espace est de type Minkowskien bien sûr...) :
1095/2001
Sciences.ch 14/03/2005
Remarque : la représentationd des lignes d'Univers dans la partie inférieur (cône renversé)
vient du fait qu'un événement peut également avoir un passé... donc le schéma généralise
l'exemple particulier
Les physiciens disent alors, en analogie avec la mathématique, qu'en considérant donnée une
ligne d'univers inertielle, nous avons une classe d'équivalence (voir le chapitre de théorie des
1096/2001
Sciences.ch 14/03/2005
ensembles) de lignes d'univers parallèles et, par extension étant donné un point sur une
ligne d'univers, nous avons une classe d'équivalence de points synchrones avec . Cette classe
d'équivalence de points forme bien évidemment un plan tri-dimensionnel passant par (à
priori c'est sympathique de se l'imaginer mais je ne suis pas convaincu de l'utilité de la chose).
Si se trouve à l'intérieur de , le cône nul de , nous dirons que sa ligne d'Univers est
de "genre temps". Dans ce cas, et sont situés sur la ligne d'univers d'un observateur ou
d'une particule massive. Il existe bien évidemment deux types de déplacements de genre
temps: si est dans le futur de (selon un observateur dont la ligne d'univers passe par
et ), nous dirons que "pointe vers le futur" dans le cas contraire, nous dirons bien
entendu qu'il "pointe vers le passé".
Si se situe sur , nous dirons alors qu'il est "nul" et n'est ni nul ni de genre temps,
alors se situe à l'extérieur de . Nous disons alors que qu'il est de "genre espace" :
D1. : la ligne d'univers est donc de "type lumière" (selon ce que nous avons démontré
précédemment)
D2. : nous disons alors que la ligne d'univers est de "type espace". Effectivement, la
différence ne peut être négative de par l'élévation à une puissance paire de (à
moins que le temps soit de type complexe). Donc la ligne d'Univers est nécessairement à
l'extérieur du cône.
D3. : Nous disons alors que l'intervalle ou la ligne d'univers sont de "type temps".
1097/2001
Sciences.ch 14/03/2005
Revenons à nos équations après ce petit interlude... les équations conduisent donc à faire
plusieurs observations. Ainsi, dans l'Univers euclidien à quatre dimensions de Minkowski, les
trajectoires des objets dans l'espace-temps sont toujours des droites. Effectivement, l'exemple
trivial consiste à considéréer que l'objet reste au repos, seul le temps continue alors à
s'écouler. Nous avons dès lors:
donc :
et aussi :
qui est bien une droite et reprèsente donc la ligne d'Univers de l'objet considéré dans le cône
d'Univers. Nous pouvons aussi observer aussi que dans ce cas, l'évolution du phénomène est
purement temporelle quand l'intervalle est postif (ce qui appuie ce que nous avions dit tout à
l'heure).
Remarque : si la vitesse de la lumière est infinie nous retrouvons le cas particulier de l'univers
newtonien, où un phénomène peut instantanément se produire en dehors de tout lien de
causalité (nous disons alors que l'effet à lieu avant la cause). Le temps y est absolu et il
n'existe pas d'horizon cosmologique.
RELATIVITÉ GÉNÉRALE
Le relativité restreinte est une réussite remarquable sur le point de vue théorique aussi bien
que sur lpoint de vue pratique. Cependant, celle-ci s'applique aux repères euclidiens
seulement et aux référentiels inertiels/galiléens (à vitesse constante pour rappel...)… Il
convient donc de généraliser l'ensemble de la mécanique d'abord en exprimant ses principes et
ses résultats fondamentaux sous une forme généralisée indépendante du type de systèmes de
coordonnées choisi (in extenso : du type d'espace) en faisant usage du calcul tensoriel et de
prendre en compte les systèmes non inertiels.
Il convien de prendre en compte aussi que le fait que la relativité restreinte ne s’applique
qu’aux référentiels galiléens est restrictif car toute masse crée un champ gravitationnel dont la
portée est infinie. Pour pouvoir trouver un vrai référentiel galiléen il est donc nécessaire de se
situer infiniment loin de toute masse. La mécanique relativiste bâtie à partir de la relativité
restreinte ne constitue donc qu’une approximation des lois de la nature, dans le cas où les
1098/2001
Sciences.ch 14/03/2005
D'abord il faut s'avoir que si nous prenons en compte l'accélération dans les premiers
développements que nous avons fait pour la relativité restreinte, nous n'arrivons à aucune
simplification permettant d'obtenir des relations explicites des transformations relativistes
entre différents référentiels (essayez pour voir...). Il fallait donc trouver une autre approche
permet de se soustraire à ce problème. C'est ici qu'encore une fois 'intervient le génie d'Albert
Einstein .
Effectivement, Einstein croyait à une physique ne devant privilégier aucun référentiel puisque
telle était à ses yeux la réalité de l'Univers. Mais comment se soustraire alors au phénomène
d'accélération. L'idée géniale fut d'énoncer le postulat d'équivalence suivant (qui encore
aujourd'hui au début du 21ème siècle n'est toujours pas mis en défaut par les expériences
récentes) en plus du postulat d'invariance et du principe cosmologique que nous avons énoncé
au début :
POSTULAT D'ÉQUIVALENCE
Dans un premier temps, Albert Einstein (avec une idée derrière la tête que nous exposerons
plus loin) postule donc l'équivalence suivante :
Postulat : l'accélération d'une masse (hors champ gravitationnel) due à l'application d'une
force mécanique et l'accélération de cette même masse soumis à un champ gravitationnel sont
supposées parfaitement équivalentes. Ainsi, les résultats des analyses mathématiques dans un
cas, peut s'appliquer dans l'autre (déjà là c'est fort mais cohérent... l'idée est très très bonne
encore fallait-il l'avoir...!)
Corollaire : la masse au repos d'un corps doit alors être la même dans un champ gravitationnel
ou hors champ gravitationnel (nous parlons alors de masse inertielle et de masse pesante
comme nous l'avons vu au tout début de notre étude de la mécanique classique). Il faut bien
prendre en garde et vérifier que le corollaire du postulat d'équivalence est vrai sinon toute la
relativité générale s'écroulerait (en ce début de 21ème siècles des expériences sont toujours en
cours pour essayer de mettre à défaut cette équivalence) !
En quoi ce postulat permet-t-il de résoudre toutes les difficultés alors ? C'est simple ! L'idée
absolument géniale est la suivante :
Lorsque nous allons considérer un corps en accélération, nous allons d'abord toujours
assimiler celle-ci à l'accélération due à la chute dans un champ gravitationnel (de par
l'application du principe d'équivalence). Ensuite, nous allons supposer, et devrons le vérifier
en retrouvant la loi de Newton, que l'accélération due à ce champ gravitationnel n'est pas due
au champ lui même mais à la géométrie de l'espace déformée par la présence de la masse (in
extenso l'énergie) qui crée le champ gravitationnel. Ainsi, l'objet n'est plus en "chute libre"
mais sera vu comme 'glissant' sur la trame spatiale et acquérir ainsi son accélération.
1099/2001
Sciences.ch 14/03/2005
2. Si l'expression tensorielle naturelle des lois de la mécanique fait apparaître le glissement (in
extenso l'accélération) sur la trame spatiale suivant la métrique (locale) considérée, alors le
pari est gagné et alors l'accélération peut être vue comme un effet dont la cause est purement
géométrique.
Ainsi, l'extension de la relativité restreinte ne se fait plus en prenant en compte les systèmes
non inertiels mais la géométrie du système !! Nous pouvons (et arrivons!) ainsi à contourner
le problème initial et le pire... c'est que cela marche !!!!
Exemple de la fusée :
Supposons que deux fusées, que nous nommerons et , se trouvent dans une région de
l’espace éloignée de toute masse. Leurs moteurs sont arrêtés ce qui se traduit physiquement
par un mouvement rectiligne uniforme. Dans chaque fusée, des physiciens réalisent des
expériences de mécanique avec des objets dont ils connaissent la masse inerte. Soudain, le
moteur de la fusée démarre et lui communique une accélération dont l’effet ressenti à
l’intérieur du vaisseau spatial est une force d’inertie qui plaque les objets vers le plancher.
Pour les physiciens de la fusée les lois de la mécanique sont alors les mêmes que celles que
l’on observe dans un champ gravitationnel. Ils sont donc logiquement amenés à interpréter la
force d’inertie comme la manifestation d’un champ gravitationnel. A l’aide d’une balance, ils
peuvent alors peser leurs objets et leur attribuer une masse gravitationnelle.
Supposons que les physiciens de la fusée puissent observer ce qui se passe dans la fusée
. Ils savent que ce que leurs collègues interprètent comme le poids des objets n’est en fait
qu’une force d’inertie. La force d’inertie est proportionnelle à l’accélération et à la masse
inerte. Si la masse gravitationnelle était différente de la masse inerte les physiciens de la fusée
pourraient distinguer les effets des forces d’inertie de ceux d’un champ de gravitation car
les masses mesurées seraient distinctes. Or, nous savons que la masse inerte et la masse
gravitationnelle sont équivalentes (principe d’équivalence galiléen). Il s’ensuit que les
physiciens de la fusée n’ont aucun moyen de faire la différence entre des forces d’inertie
résultant d’un mouvement accéléré de leur vaisseau spatial et les forces d’attraction
gravitationnelles.
Il faut toutefois tempérer les conclusions de cette expérience : les vrais champs de gravitation
se distinguent d’un référentiel accéléré dans la mesure où l’accélération gravitationnelle varie
avec la distance qui sépare les corps alors que dans un référentiel accéléré, l’accélération est
identique en tout point de l’espace. Cependant, localement, un champ gravitationnel et un
référentiel accéléré ne peuvent être différenciés.
PRINCIPE DE MACH
La nature profonde de la masse inerte devrait nous renseigner sur celle de l’inertie elle-même.
L’inertie se manifeste sous une forme passive - le principe d’inertie - et une forme active - la
seconde loi de Newton. D’une manière générale, elle exprime un comportement universel des
1100/2001
Sciences.ch 14/03/2005
corps à résister au changement du mouvement. Or nous savons que le mouvement inertiel est
relatif c'est-à-dire qu’il n’existe aucun référentiel absolu. En est-il de même du mouvement
accéléré ? Considérons, pour illustrer cette interrogation, une fusée dans laquelle se trouve un
physicien et réalisons deux expériences.
Première expérience. La fusée accélère : le physicien est soumis à une force d’inertie orientée
dans la direction opposée à celle de l’accélération.
Si le mouvement accéléré est relatif alors, pour un observateur, il n’est pas possible de
distinguer les deux expériences. Notamment, le physicien situé à l’intérieur de la fusée doit
observer l’apparition d’une force d’inertie absolument identique à celle qu’il a notée lors de la
première expérience. La masse inerte trouverait alors son origine dans les interactions de la
masse gravitationnelle des corps avec l’ensemble des masses gravitationnelles de l’Univers !
Selon Ernst Mach, un physicien et philosophe du XIXe siècle, le mouvement quel qu’il soit,
inertiel ou accéléré, serait relatif.
Cette théorie fut baptisée par Einstein "principe de Mach". Jusqu’à ce jour, le principe de
Mach n’a pas été confirmé, mais pas davantage infirmé. Il est vrai que sa vérification
expérimentale dépasse de beaucoup les capacités humaines !
Tout se passe comme si en déplaçant toutes les masses de l’Univers, celles-ci entraînaient
avec elles les objets se trouvant dans la fusée, dont le physicien qui ressent alors une force qui
le tire dans le même sens que l’accélération appliquée aux étoiles.
GRAVITATION ET GÉOMÉTRIE
Poursuivons l’analogie : le pas de la crémaillère joue le rôle d’étalon de mesure local dans
notre espace à une dimension que constitue la crémaillère. En géométrie, il porte le nom de
"métrique". La métrique est ce qui permet de déterminer la distance entre deux points, elle
représente en quelque sorte l’étalon infinitésimal d’un espace. En géométrie euclidienne la
métrique est une constante ce qui nous permet de créer des étalons de mesure universels.
Bernhard Riemann, inventa une géométrie où la métrique peut varier d’un point à un autre de
l’espace, ce qui lui permit de décrire des espaces courbes comme la surface d’une sphère par
exemple.
1101/2001
Sciences.ch 14/03/2005
mesure de la distance entre deux points positionnés dans un espace à deux dimensions
peut s'effectuer au moyen d'un grand nombre de système de coordonnées par lesquels:
Si la distance au carré satisfait à cette relation alors nous sommes dans un espace plat.
d'où:
d'où:
Si la distance au carré satisfait à cette relation alors nous sommes dans un espace plat.
Si la distance au carré satisfait à cette relation alors nous sommes dans un espace plat.
1102/2001
Sciences.ch 14/03/2005
Donc:
Si la distance au carré satisfait à cette relation alors nous sommes dans un espace courbe (de
type sphérique).
Jusque là, vous vous demandez peut-être où nous voulons en venir. Au fait, nous cherchons à
définir à partir des ces relations, un être mathématique qui en concordance avec l'hypothèse
d'Einstein, exprime les propriétés géométriques d'espaces donnés.
Comment allons nous faire? Nous allons d'abord changer d'écriture tout simplement. Au lieu
d'utiliser les symboles nous allons écrire . Attention! Les chiffres en
suffixes ne sont pas des puissances. Ce sont des valeurs muettes qui sont là uniquement pour
symboliser la -ième coordonnée d'un repère donné.
Coordonnées rectangulaires:
1103/2001
Sciences.ch 14/03/2005
Coordonnées polaires:
Coordonnées cylindriques:
Coordonnées sphériques:
Cet être mathématique qui est un tenseur contient donc les paramètres de la courbure (vous
pouvez également dire de contraintes ou tensions) dans lequel un espace se trouve. Mais alors
que contient le tenseur métrique d'espace-temps pour un espace euclidien plat?:
Donc si nous revenons à notre tenseur pour l'espace euclidien plat nous savons déjà
et nous avons dans notre tenseur pour et pour
(tenseur symétrique). Donc:
Ce résultat est remarquable car le tenseur métrique va nous permettre donc de définir les
propriétés d'un espace à partir d'un simple être mathématique facilement manipulable
formellement.
1104/2001
Sciences.ch 14/03/2005
Vérification:
En relativité restreinte, nous avons vu que la notion d'espace de temps étaient implicitement
liées. Ainsi, pour étudier la physique (cela intéresse peu le mathématicien), nous avons besoin
d'ajouter à notre tenseur métrique la composante du temps pour obtenir ce que nous appelons
le "tenseur métrique d'espace-temps". Pour déterminer l'écriture de ce tenseur, nous allons
nous placer dans un premier temps nous placer dans un espace de Minkowski où nous avions
rappellons-le :
Ainsi, en posant:
Nous avons:
1105/2001
Sciences.ch 14/03/2005
Dans un espace sans champ de potentiel, nous avons vu en mécanique analytique que le
lagrangien se réduit à la simple expression de l'énergie cinétique tel que:
si nous souhaitons généraliser cette relation pour qu'elle soit valable dans n'import que type
d'espace (courbe ou plat), il nous faut introduire les coordonnées curvilignes telles que nous
les avons étudiées en calcul tensoriel (voir le chapitre du même nom dans le section d'algèbre
du site).
Ce qui nous permet d'écrire (attention il faut bien se rappeler des différentes relations que
nous avions déterminées lors de notre étude de formalisme lagrangien dans le chapitre traitant
des principes de mécanique analytique):
1106/2001
Sciences.ch 14/03/2005
puisque nous considérons être dans un espace sans champ de potentiel. Le carré de la vitesse
étant dès lors constant sur toute la trajectoire, nous avons:
et
et donc:
puisque:
et comme:
en mettant en commun :
que nous pouvons écrire identiquement pour les en procédant de façon identique à ci-
dessus.
La relation précédente donne donc la trajectoire d'un corps en mouvement, dans un espace
sans champ de potentiel, en fonction de ses coordonnées curvilignes et de la métrique de
l'espace considéré.
Remarque : ce qui est particulièrement intéressant dans ce résultat, c'est que la masse
s'élimine identiquement.
Nous pouvons maintenant étudier le principe de moindre action dans le but de rechercher le
1107/2001
Sciences.ch 14/03/2005
plus court chemin (aussi bien au niveau spatial que temporel) entre deux points dans un
espace de géométrie donnée avant de s'attaquer au cas beaucoup plus complexe du lagrangien
qui prend en compte le tenseur des champs...
En partant de:
avec une paramétrisation telle que et sont fonction d'une paramètre temporel ou spatial.
Pour une surface donnée paramétriquement, nous cherchons donc à minimiser la longueur
d'un arc en appliquant le principe variationnel (non dépendant du temps car les photons
ne peuvent avoir un chemin plus rapide (au sens temporel du terme entre deux points mais
uniquement un chemin plus court (au sens métrique du terme)):
Or:
d'où:
et
Donc par l'intégration par partie (voir chapitre traitant du calcul différentiel et intégral):
1108/2001
Sciences.ch 14/03/2005
il vient:
Soit finalement:
Comme et sont différents de zéro, c'est l'intégrant qui doit être nul:
1109/2001
Sciences.ch 14/03/2005
Nous obtenons le système d'équations qui définissent les géodésiques, c'est-à-dire les droites
de . Ces dernières constituent donc les extrémales de l'intégrale qui mesure la longueur d'un
arc de courbe joignant deux points donnés dans .
Cette dernière équation, est celle qui nous intéresse dans le cas du lagrangien libre.
Effectivement, si nous prenons le cas extrême de la lumière (ou des photons si vous préférez),
cette dernière ne va pas chercher le chemin le plus rapide (le plus vite) au niveau temporel. Ce
serait totalement en contradiction avec le postulat d'invariance de voir la lumière accélérer en
fonction du chemin!!! Dans ce contexte, cela signifie que sur la trame spatio-temporelle, la
seule chose qui à un sens est le plus court chemin spatial et non le plus court chemin
temporel! C'est la raison pour laquelle cette dernière équation est appelée "équation des
géodésiques" ou encore "équation d'Euler-Lagrange généralisée".
Cependant, nous pouvons écrire cette dernière équation de façon plus condensée en
introduisant les symboles de Christoffel si la métrique est un tenseur symétrique tel que
. Effectivement:
et comme:
1110/2001
Sciences.ch 14/03/2005
Cette relation est de la plus haute importance car elle va nous permettre de déterminer (plus
loin) comment un corps en mouvement va naturellement se déplacer dans un espace courbe et
peut-être... ceci indépendamment de la masse. De plus, cette expression va aussi nous
permettre de savoir comment dans un chemin parcouru (géodésique) la métrique varie d'un
point infiniment voisin à un autre. En gros nous nous rapprochons du gâteau et percevons que
gentillement la voie semble être la bonne...
1111/2001
Sciences.ch 14/03/2005
ÉLECTROSTATIQUE
L'expérience a montré aussi que bien que la charge ait comme la masse une propriété additive,
elle comporte cependant aussi des valeurs négatives (et non exclusivement positive comme
l'est à priori la masse). Ainsi, dans le langage actuel et comme l'expérience le confirme, deux
charges identiques se repoussent et deux charges différentes s'attirent.
FORCE ÉLECTRIQUE
Il a expérimentalement été établi par Coulomb (et démontré théoriquement bien plus tard par
Yukawa - voir chapitre de mécanique quantique des champs) qu'une particule témoin subit
une force d'une intensité proportionnelle à sa charge , lorsqu'elle est placée au voisinage
d'une ou plusieurs charges électriques , dans un milieu de permittivité (permittivité au
champ électrique bien sûr...) donnée par (sous forme vectorielle et non relativiste) :
Dans le cas d'un système à deux particules séparées d'une distance , nous avons la même
relation simplifiée et nous retrouvons la forme plus commune de la force électrique telle
qu'elle est donnée dans la plupart des ouvrages (sous forme scalaire et non relativiste) :
1112/2001
Sciences.ch 14/03/2005
Remarques :
R1. Fréquemment, cette dernière relation est définie sous le nom de "loi de Coulomb" dans la
plupart des écoles car supposée non démontrable. Au fait, il n'en est rien ! Cette relation peut
se démontrer comme nous le verrons lors de l'étude de la physique quantique des champs
(voir section de physique atomique) en utilisant l'équation de Klein-Gordon dans le contexte
d'une champ de potentiel à symétrie sphérique.
R2. Pour la forme relativiste de la loi de Coulomb, le lecteur se reportera au chapitre traitant
de la mécanique relativiste où il est démontré que (forme vectorielle) :
et relativement au milieux considéré, nous définissons une permittivité relative qui permet
plus facilement de déterminer les propriétés d'un matériau par rapport au champ électrique tel
que :
Le facteur entre parenthèses ne dépend que de la distribution des charges dans l'espace et
de la permittivité du milieu considéré. Puisque sa valeur varie d'un endroit à l'autre et
dépend du vecteur position de la charge témoin, il forme un ensemble de vecteurs, dont la
propriété est celle d'une multitude de lignes de champs électriques d'où l'utilisation du terme
"champ électrique".
Chacun des éléments de cet ensemble porte le nom de "champ électrique" , au point ,
dans la distribution de charges :
1113/2001
Sciences.ch 14/03/2005
POTENTIEL ÉLECTRIQUE
Soient deux point et dans une région de l’espace où il existe un champ électrique
et soit un chemin reliant ces deux points, alors dans le cas particulier où la source
d'un champ est une sphère ou un corps ponctuel et que nous posons une charge à son
voisinage nous avons pour le travail effectué par la force pour déplacer la charge du point
au point :
et donc :
Remarque : le potentiel est souvent appelé "tension" par les électriciens, électrotechniciens ou
autres ingénieurs. Parfois par abus de la langue anglophone le terme "voltage" est ensuite
utilisé par référence à l'unité de mesure du potentiel qui est le "Volt" noté .
Démontrons maintenant dans le cadre le plus général qui soit que le champ vectoriel
stationnaire "dérive" d'un champ de potentiel :
Soit une charge repérée par rapport à un référentiel par le vecteur . Alors en chaque
point de l’espace il existe un champ tel que:
1114/2001
Sciences.ch 14/03/2005
; ;
d’où:
est appelé dans le cas d'un champ de Coulomb "le potentiel de " ou "potentiel
coulombien" et est noté . Comme nous pouvons le constater par l’expression de
, est une constante arbitraire, qui impose dans le cas d'absence de charges que:
1115/2001
Sciences.ch 14/03/2005
Remarque : les mêmes développements et résultats (et ceux qui vont suivre) sont applicables en ce qui concerne
le champ de potentiel gravitationnel. Cependant il est rare qu'il soient effectués dans la littérature ou les écoles
car l'être humain ne contrôle pas le champ gravitationel avec une facilité et une intensité équivalente à celle du
champ électrique.
INDÉPENDANCE DU CHEMIN
Cette dernière expression montre bien que est indépendant du chemin quelle que soit la
manière dont nous paramétrisons celui-ci.
Nous pouvons maintenant à partir de ce que nous avons établit, définir les "équipotentielles"
et les "lignes de champ".
Soit un champ de Coulomb défini par rapport à un référentiel. Alors à chaque point
de l’espace, nous pouvons associer un vecteur champ électrique ainsi qu’un
potentiel électrique .
Défintion : nous définissons les "lignes de champ" comme étant une famille de courbes pour
lesquelles le vecteur est tangent et constant en chaque point et les "équipotentielles"
comme étant des lignes pour lesquelles le potentiel est aussi constant.
Dans ce cas, et c'est ce que nous allons démontrer, toutes les lignes de champ sont
perpendiculaires à toutes les équipotentielles.
1116/2001
Sciences.ch 14/03/2005
Démonstration:
Comme nous sommes en présence d'un champ électrique, celui-ci dérive donc d'un potentiel
comme nous le savons. Ceci implique que si le champ n'est pas nul le potentiel ne l'est
également pas. Donc, dans l'intégrale curviligne:
un des termes est nul ! Ce n'est pas le champ électrique puisqu'on est présence d'un, ce qui
discrédite le potentiel et comme la charge se déplace n'est pas nul non plus. Écrivons
alors l'intégrale curviligne d'une autre manière:
d'où:
nous pouvons donc conclure que les équipotentielles sont bien perpendiculaires aux lignes de
champ électrique et inversement. C'est ce qu'il fallait démontrer.
1117/2001
Sciences.ch 14/03/2005
A gauche : deux charges de signes égaux - A droite : quatre charges de signes opposés
Remarque : mis à part avec les charges opposées, nous rappelons que les mêmes résultats sont
appliquables pour les masses avec le champ gravitationnel.
Deux applications de ces résultats sont très importants (pour lesquels nous nous limiterons à
l'études des propriétés les plus importantes) :
1. La détermination des lignes de champs et équipotentielles pour un fil rectiligne infini tel
que nous pouvons en approximation en considérer dans les circuits électriques ou les lignes
hautes tensions aériennes (afin de déterminer l'influences des champs des fils avec leur
environnement - cette étude fait partie du domaine de l'électrodynamique de l'ingénieur que
nous appelons la CEM pour "Compatibilité Électromagnétique"). Les résultats pourrant aussi
être utilisés pour déterminer la "tension de pas" pour certains systèmes rectilignes qui
détermine pour une distance donnée, le potentiel par mètre pour lequel un mammifère peut
être tué par électrochoc proche d'un tel fil. Une extensions (sur laquelle je ne souhait pas trop
m'attarder bien que le sujet soit passionnant mais très chaud) est aussi l'influence d'un tel type
de potentiel sur le fonctionnement du cerveau humain dans le cas de l'usage des téléphones
portables (atennes émittrices d'un potentiel) ou d'habitations proche de lignes hautes
tensions....
1118/2001
Sciences.ch 14/03/2005
en faisant usage du concept de densité linéique de charges tel que nous l'avons défini dans le
chapitre traitant des principes de la physique dans la section de mécanique, nous avons :
Considérons une ligne infinie de section négligeable, et portant une charge linéique continue
. Le but est donc de calcul le champ électrique et le potentiel en tout point de l'espace
extérieur à cette ligne afin de connaître les influences des charges de cette ligne sur son
environnement en ne considérant que l'influence du champ électrique (si les charges étaient en
mouvement il faudrait également prendre en compte l'influence du champ magnétique ce que
nous ferons dans le chapitre consacré à ce champ).
Pour cela, la méthode consiste à découper la ligne en de petits éléments de ligne , chacun
de ces éléments portant une charge . Le champ créé par la charge en au point à
distance et de projection orthogonale sur la ligne est :
Donc :
Comme nous pouvons nous en douter, cette dernière relation montre bien que le champ est
orthogonal à la ligne (au fil…).
1119/2001
Sciences.ch 14/03/2005
La norme de est :
et :
d'où :
L'intégration est facile, mais il faut faire attention aux bornes. Nous devons intégrer sur une
moitié de ligne, donc entre et :
et donc :
1120/2001
Sciences.ch 14/03/2005
La constante est indéterminée puisque lorsque tend vers l'infini, tendant vers zéro
conduit à une constant infinie. Cette indétermination est due essentiellement à l'approximation
de la ligne infinie.
Une disposition très intéressant de charges est celle constituant un dipôle électrique. Elle
consiste en deux charges égales et opposées séparées par une très petite distance.
Nous allons chercher à déterminer le potentiel et le champ électrique en un point de
l'environnement du dipôle.
Le potentiel devient :
ou encore :
1121/2001
Sciences.ch 14/03/2005
donc :
Le potentiel devient :
Nous avons gardé dans l'expression du potentiel trois termes. Le terme est le potentiel
créé par une charge qui se trouverait en . Autrement dit, à l'ordre zéro, le potentiel crée par
une charge située en un point proche de est identique au potentiel créé par une charge qui
se trouverait en . Les termes sont des termes correctifs, à l'ordre un et à l'ordre deux
respectivement. Nous remarquons que ces deux termes varient en , donc décroissant
plus vite que le premier. Ces deux termes sont donc plus efficaces à plus petite distance.
Nous voyons que les termes font intervenir la quantité . Cette quantité est ce que
nous définissons comme étant le "moment dipolaire" :
1122/2001
Sciences.ch 14/03/2005
Le potentiel créé à grande distance par une distribution discrète de charges s'obtient en
sommant toutes les contributions individuelles :
Revenons au dipôle. Le terme monopolaire est nul, puisque la somme des charges est nulle. Si
nous négligeons les termes d'ordre supérieurs à deux, il reste la contribution dipolaire. Les
angles et sont complémentaires, donc . Mais, comme , le
produit est constant. Le potentiel s'écrit alors :
ou encore :
où .
1123/2001
Sciences.ch 14/03/2005
d'où :
Pour déterminer l'équation des équipotentielles, rappelons que ces lignes (ou "surfaces" dans
l'espace) s'obtiennent par la contrainte :
d'où :
avec .
Le champ électrique doit être par définition tangent aux lignes de champ, donc parallèle au
déplacement élémentaire.
La tracé des lignes de champs et des équipotentielles donnent alors en coordonnées sphériques
(ne pas oublier que la composant verticale est nulle par symétrie) :
1124/2001
Sciences.ch 14/03/2005
Bien que dans un dipôle électrique les deux charges soient égales et opposées, donnant une
charge résultante nulle, le fait qu'elles soient légèrement déplacées est suffisant pour produire
un champ électrique non identiquement nul. Dans les atomes, le centre de masse des électrons
coïncide avec le noyau, et par conséquent le moment électrique dipolaire moyen de l'atome
est nul. Mais si un champ extérieur est appliqué, le mouvement des électrons est distordu et le
centre de masse des électrons est déplacé d'une distance par rapport au noyau. L'atome est
alors polarisé et devient un dipôle électrique de moment . Ce moment étant proportionnel
au champ extérieur .
Remarque : les molécules par ailleurs peuvent avoir un moment électrique permanent. De
telles molécules sont dites "polaires". Par exemple, dans la molécule l'électron de
l'atome d'hydrogène passe plus de temps à se déplacer autour de l'atome de chlore qu'autour
de l'atome d'hydrogène. Aussi, le centre des charges négatives ne coïncide-t-il pas avec le
centre des charges positives et la molécule possède un moment dipolaire. Par contre, dans la
molécule , tous les atomes sont alignés, et le moment électrique dipolaire résultant est nul
par raison de symétrie.
Quand un dipôle électrique est placé dans un champ électrique, une force s'exerce sur chacune
des charges du dipôle. La force résultante est :
Considérons le cas particulier où le champ électrique est dirigé le long de l'axe des et où le
dipôle est orient parallèlement à ce champ. Si nous considérons seulement les grandeurs :
1125/2001
Sciences.ch 14/03/2005
Ce résultat montre qu'un dipôle électrique orienté parallèlement au champ tend à se déplacer
dans la direction dans laquelle le champ s'accroît (selon le gradient de celui-ci). Nous
remarquons que si un le champ électrique est uniforme, la force résultant sur le dipôle est
nulle.
pour décrire le champ électrique uniforme et si est l'angle entre le dipôle et le champ
électrique, le dernier facteur est juste la composante du champ
parallèle à . Donc :
ou
L'énergie potentielle est minimale pour , ce qui montre que le dipôle est en équilibre
quand il est orienté parallèlement au champ.
Ces applications d'un dipôle placé dans un champ électrique ont des application très
importantes. Par exemple, le champ électrique d'un ion en solution polarise les molécules du
solvant qui entoure les ions et elles s'orientent comme sur la figure ci-dessous :
Dans un solvant à molécules polaires tel que l'eau, les ions d'un électrolyte en solution
s'entourent d'un certain nombre de ces molécules en raison de l'interaction charge-dipôle. Ce
phénomène est appelé la "solvation" de l'ion, précisément "hydratation" si le solvant est de
l'eau.
Ces molécules orientées deviennent plus ou moins solidaires de l'ion, augmentant sa masse
effective et diminuant sa charge effective, qui est partiellement masquée par les molécules.
L'effet net est que la mobilité de l'ion dans un champ extérieur est réduite. De même,
lorsqu'un gaz ou un liquide, dont les molécules sont des dipôles permanents est placé dans un
champ électrique, les molécules à la suite des couples dus au champ électrique, tendent à
1126/2001
Sciences.ch 14/03/2005
s'aligner avec leurs dipôles parallèles. Nous disons alors que la substance a été "polarisée".
Il peut donc être intéressant de déterminer le champ électrique vectoriel produit par un dipôle
plutôt que le potentiel. Le champ électrostatique crée en un point par le doublet s'obtient
en effectuant la somme vectorielle des champs créés en ce point des charges positive et
négative , d'où :
La distribution des charges étant invariantes par rotation autour de l'axe du doublet, la
topographie est indépendante de l'angle azimutal des coordonnées sphériques. Nous
pouvons la représenter dans un plan méridien quelconque passant par l'axe . Le champ
est donc donné par :
Ayant :
Le produit scalaire étant la multiplication des composantes une à une, nous avons :
d'où :
Finalement :
1127/2001
Sciences.ch 14/03/2005
Donc par un développement limité en série de MacLaurin comme nous l'avons fait au début :
soit en introduisant :
Il peut être pertinent aussi de calculer l'énergie d'interaction entre deux dipôles électriques. Si
nous appelons le moment dipolaire, nous pouvons écrire :
nous trouvons que l'énergie d'interaction entre les deux dipôles est :
Un atome, une molécule ou un ion, dont le moment dipolaire est nul à l'état fondamental,
acquièrent un moment dipolaire sous l'action du champ électrique appliqué comme nous
l'avons vu puisque les charges de signes opposées sont sollicitées dans des sens opposés. Les
barycentres des charges positives et négatives ne coïncidant plus, il apparaît un "moment
dipolaire induit". Dans une approximation expérimentale linéaire valable pour des champs
excitateurs faibles, ce moment dipolaire induit est proportionnel au champ appliqué , ce que
1128/2001
Sciences.ch 14/03/2005
nous traduisons par (il s'agit au fait d'une approximation de la relation de Langevin-Debye que
nous démontrerons plus tard) :
La quantité , dont la dimension physique est celle d'un volume, est la "polarisabilité" de
l'édifice. L'interaction électrostatique dipôle-dipôle a été introduite par J.D. Van der Waal en
1873, dans le cas des molécules, afin d'interpréter les écarts réels par rapport au gaz parfaits.
Les forces de Van der Waals sont répulsives lorsque la distance entre les molécules est très
faibles car elles s'opposent à l'interpénétration des nuages électroniques, ce que nous
exprimons en introduisant leur volume (covolume).
En revanche, elles sont attractives lorsque cette distance est suffisante. Nous attribuons cette
attraction à trois types d'interaction mettant en cause des dipôles rigides ou induits :
2. Les forces entre une molécule polaire (dipôle rigide), et une molécule polarisable (dipôle
induit) dites de Debye.
3. Les forces moyennes entre les dipôles induits instantanés qui apparaissent même lorsque
les molécules ne sont pas polaires, dites de F. London.
Dans ces trois cas, l'énergie électrostatique est négative (attraction) et varie comme . Pour
le montrer, calculons l'énergie d'interaction entre deux dipôles rigides, de moments dipolaires
et :
avec et
Par conséquent :
d'où :
Ainsi, la dépendance radiale de la force est en . Cette décroissance très rapide de la force
de Van der Waals avec la distance permet d'expliquer sa très courte portée et par conséquent
sont influence lorsque le milieu est suffisamment dense.
Remarque : l'interaction entre molécules polaires, de type Keesom, est rendue très importante
par la présence l'atome d'hydrogène, car ce dernier, en raison de sa petite taille, interagit aussi
avec les atomes des autres molécules. C'est elle qui est là l'origine de la "liaison hydrogène".
1129/2001
Sciences.ch 14/03/2005
Soit un champ vectoriel et une surface (dite "surface de Gauss") dans l'espace. Si nous
divisons cette surface en un nombre de petites surfaces chacune traversée par un
champ et ayant un vecteur unitaire perpendiculaire (cas particulier) à leur surface, nous
pouvons alors former la somme:
Lorsque tends vers l'infini et tous les vers zéro, nous obtenons pour cette somme:
La valeur de cette intégrale est appelée "flux d’un champ à travers une surface
" délimitée par un domaine et où .
Cette expression définit le "flux électrique". La question inévitable qui se pose alors est :
quelle est sa signification physique ?. Le flux d'un fluide est la quantité de fluide (notamment
le volume) qui traverse une surface par seconde; il y alors écoulement de quelque chose.
Quant au flux électrique, du point de vue classique, rien ne s'écoule, le champ électrique est
déjà établi et il est statique, mais il "traverse la surface". La valeur du champ électrique en
tout point de l'espace est l'intensité du champ en ce point, tandis que le flux peut être
considéré comme la quantité de champ qui traverse la surface . Il y a une centaine d'années,
les physiciens identifiaient le flux avec le nombre des lignes de champ traversant la surface.
Mais le moins que nous puissions dire est que la vision simpliste que les lignes de champ ont
une une réalité distincte et que nous pouvons les compter est trompeuse. Nous verrons en
mécanique quantique des champs que celle-ci soutient qu'un courant de photons virtuels est la
nature même des interactions électromagnétiques. Malgré cela, les phyisciens ne se sont pas
pressés d'associer le flux des photons virtuels du 20ème siècle à l'image des ligens de champs
continus du 19ème siècle. Quelle que soit sa nature, la notion de lfux est puissante et de
grande utilité pratique, aussi bien en électricité qu'en magnétisme.
Comme nous le démontrons dans le cadre des équations de Maxwell (voir chapitre du même
nom), la résolution de cette intégrale est (c'est la "loi de Gauss" ou également dit "théorème
de Gauss") :
CAPACITÉS
1130/2001
Sciences.ch 14/03/2005
Comme application directe du théorème de Gauss, très utile en électronique et pour les
ingénieurs, considérons une grande feuille mince et plane, portant une charge surfacique
homogène et baignant dans un milieu de permittivité . Dans la région proche de son
centre, le champ résultant de tous les champs des charges est normal, uniforme, constant et
s'éloigne de la feuille. Considérons une surface de Gauss en forme d'un cylindre limité par les
bases et sa surface tubulaire et symétrique par rapport la feuille. Elle enferme
donc une charge . Il en résulte que :
Finalement, le champ électrique d'un grande feuille chargée plane et mince est :
Si nous mettons face à face deux plaques identiques mais avec des charges opposées, la
somme algébrique donnera bien évidemment :
A l'exception des extrémités, où l'effet de bord est important, le champ global est partout la
somme vectorielle des champs uniformes produits par les deux couches minces opposées.
Nous appelons un tel système un "condensateur plan et parallèle".
Le résultat est aussi remarquable car il est indépendant de la distance entre les plans. Le
calcul du potentiel électrique y est donc simplifié. Soit :
LA RIGIDITÉ DIÉLECTRIQUE
La "rigidité diélectrique " d’un milieu isolant représente la valeur maximum du champ en
que le milieu peut supporter avant le déclenchement d’un arc électrique (donc d’un
1131/2001
Sciences.ch 14/03/2005
Lorsque nous parlons de rigidité diélectrique nous parlons aussi du diélectrique qui est un
isolant ou une substance qui ne conduit pas l'électricité et qui est polarisable par un champ
électrique. Dans la plupart des cas, les propriétés du diélectrique sont dues à la polarisation de
la substance. Lorsque le diélectrique (dans notre cas, l'air est le diélectrique) est placé dans un
champ électrique, les électrons et les protons de ses atomes se réorientent et, dans certains cas,
à l'échelle moléculaire, une polarisation est induite (comme nous l'avons vu lors de notre
étude des dipôles). Cette polarisation engendre une différence de potentiel, ou tension, entre
les deux bornes du diélectrique; celui-ci emmagasine alors de l'énergie qui devient disponible
lorsque le champ électrique est supprimé. L'efficacité d'un diélectrique est sa capacité relative
à emmagasiner de l'énergie comparée à celle du vide. Elle s'exprime par la permittivité
relative, déterminée par rapport à celle du vide. La force diélectrique est la capacité d'un
diélectrique à résister aux champs électriques sans perdre ses propriétés isolantes. Un
diélectrique efficace libère une grande partie de l'énergie qu'il a emmagasinée lorsque le
champ électrique est inversé.
Considérons deux charges . La première est supposée au repos et fixe la deuxième est
amenée de l'infinie à une distance de (le même raisonnement a été applicé pour le
champ gravitationnel dans le chapitre de mécanique classique). Supposons que les deux
charges soient de même signe. Comme ont tendance à se repousser mutuellement, il
faut fournir une énergie potentielle pour approcher (infiniment lentement) de . Le
travail la force électrostatique en un point quelconque est par définition :
1132/2001
Sciences.ch 14/03/2005
Remarque : il existe aussi rappelons-le une relation entre l'énergie est le gradient de la force
donnée qui découle simplement de la définition du travail :
1133/2001
Sciences.ch 14/03/2005
MAGNÉTOSTATIQUE
Les aimants sont connus depuis l’Antiquité (sans pour autant qu'on savait qu'elle était l'origine
de leurs propriétés) sous le nom de "magnétite", pierre trouvée à proximité de la ville de
Magnesia (Turquie). C’est de cette pierre par ailleurs que provient le nom actuel de champ
magnétique. Les chinois furent les premiers à utiliser les propriétés des aimants différentes de
celles des particules chargées, il y a plus de 1000 ans, pour faire des boussoles. Elles étaient
constituées d’une aiguille de magnétite posée sur de la paille flottant sur de l’eau contenue
dans une récipient gradué.
Nous allons commencer l'étude du magnétisme dans l'ordre de l'aspect historique de ses
découvertes mais en introduisant ensuite des concepts plus contemporains tel que le potentiel
vecteur (théorie de jauges) ou le facteur gyromagnétique (physique quantique).
L’étude quantitative des interactions entre aimants et courants fut faite par les physiciens Biot
et Savart seulement en à partir de 1820. Ils mesurèrent l'amplitude des oscillations d’une
aiguille aimantée en fonction de sa distance à un courant rectiligne. Ils trouvèrent que la force
agissant sur un pôle est dirigée perpendiculairement à la direction reliant ce pôle au
conducteur et qu’elle varie en raison inverse de la distance. C'est la premier cas que nous
allons étudier :
Soit un déplacement de charges électriques produisant dans l'espace un champ vectoriel dont
les effets sont mesurables et dont les propriétés diffèrent de celles du champ électrostatique.
Nous en déduisons l'existence d'un nouveau champ vectoriel que nous appelons "champ
magnétique" et que nous noterons .
Le cas d'étude le plus simple consiste en un fil rectiligne indéfini (exemple que nous pouvons
auss assimiler à un simple déplacement de charges sans nécessairement avoir un fil comme
support) parcouru par un courant (voir chapitre traitant de l'électricité pour le concept de
courant) montre que les lignes de champ magnétique sont des cercles ayant le fil pour axe.
1134/2001
Sciences.ch 14/03/2005
aille de ses pieds vers sa tête et qui regarderait le point où nous évaluons le champ ma.
est dirigé de la droite vers la gauche de cet observateur.
Ce résultat a été obtenu expérimentalement par les physiciens Biot et Savart et consitute
traditionnellement la base de l'étude théorique du champ magnétique.
et obtenons ainsi :
où est une nouvelle constante que nous appelons "susceptibilité magnétique" (à nouveau
au meme titre que le permittivité électrique il existe une "susceptibilité relative")
THÉORÈME D'AMPÈRE
Il est intéressant de calculer la "circulation" de le long d'un contour qui tourne une fois
dans le sens positif autour du fil orienté dans le sens du courant (observateur d'Ampère) :
Remarque : le long du contour, le champ est colinéaire au contour comme nous l'avons vu
précédemment d'où le fait que le produit scalaire puisse s'écrire comme simple produite de
normes.
Nous obtenons ainsi par définition "Loi d'Ampère" (ou "théorème d'Ampère") :
L'expression que nous avons obtenue peut encore être simplifiée si nous introduisons un
nouvel être physique appelé "intensité du champ magnétique" ou encore plus couramment
1135/2001
Sciences.ch 14/03/2005
"excitation magnétique" qui est noté . Si nous considèrons que nous sommes dans le vide
où il n'y a aucun dipôle magnétique alors nous le définissons par :
L'intérêt de la loi d'Ampère ainsi que du concept de circulation du champ magnétique paraît
(peut paraître) ainsi plus évident.
Cette dernière relation à bien évidemment une grande utilité en physique théorique car elle
nous permettra de déterminer d'autres résultats forts importants. Sinon, au niveau de la
pratique, le physicien de laboratoire ou l'électricien/électrotechnicien sera souvent confronté à
utiliser pour de petites et moyennes expériences des électro-aimants dont il pourrait souhaiter
re-calibrer les valeurs nominales ou encore de solénoïdes.
ÉLECTRO-AIMANT
Déterminons donc par exemple (important et intéressant) le champ magnétique dans l'entrefe
de longueur et de section d'un électro-aimant d'un de longueur et de section .
dans le cas de l'électro-aimant nous pouvons écrire que la circulation du champ est la somme
de la circulation du champ de l'entrefer et de l'aimant lui-même:
et
d'où :
1136/2001
Sciences.ch 14/03/2005
d'où :
Un solénoïde est une bobine formée par un fil conducteur enroulé en hélice et parcouru par un
courant d'intensité . Dans ce qui suit, nous supposons que le champ d'induction d'un
solénoïde est nul entre les spires et parallèle à l'axe du solénoïde.
1137/2001
Sciences.ch 14/03/2005
La deuxième et la quatrième intégrale sont nulles car, pour ces deux segments. et sont
partout perpendiculaires : étant donné que est nul partout, les deux intégrales sont
nulles. La troisième intégrale est également nulle puisque le segment calculé se trouve à
l'extérieur du solénoïde où nous avons supposé que le champ magnétique de la bobine était
idéale.
mais le courant est la somme des courants passant dans chacune des contenues dans
le chemin d'intégration. Mais en électronique nous avons l'habitude de travailler avec la valeur
(nous choisissons la lettre minuscule par analogie avec le thermodynamique ou les
minuscules représentent des densités) qui est le nombre de spire par unité de longueur :
Bien que cette relation ait été établie pour un solénoïde idéal infini, elle donne une grandeur
assez précise du champ d'induction magnétique pour les points d'intérieur situés près du
centre d'un solénoïde réel. Cette relation révèle par ailleurs que le champ magnétique est en
approximation indépendant du diamètre du solénoïde et qu'il est uniforme à travers la section
de celui-ci. En laboratoire, un solénoïde est un dispositif pratique pour produire un champ
d'induction uniforme de la même façon que le condensateur plan est utilisé pour produire un
champ électrique uniforme.
BOBINE TOROÏDALE
1138/2001
Sciences.ch 14/03/2005
Pour des raisons de symétrie il est claire que les lignes d'induction magnétique forment des
cercles concentriques à l'intérieur de la bobine. Appliquons la loi d'Ampère au trajet
d'intégration circulaire de rayon :
C'est-à-dire :
Il s'ensuit que :
RELATION DE MAXWELL-AMPÈRE
Soit la densité de courant en un point quelconque de l'espace dans le cas d'une distribution
à trois dimensions et soit une surface fermée qui s'appuie sur un contour quelconque. Le
courant qui traverse est bien évidemment donné par :
D'après la loi d'Ampère, la circulation du champ magnétique le long de est égale à cette
intégrale. Elle peut donc prendre ici, selon le choix du contour , une infinité de valeurs
variables de façon continue. D'autre part, le théorème de Stokes (voir chapitre de calcul
différentiel et intégral) fournit que :
1139/2001
Sciences.ch 14/03/2005
d'où :
Nous pouvons faire une similitude osée de ce résultat avec la relation ci-dessous (démontrée
dans le chapitre d'électrodynamique), par extension de la charge statique et de la charge
dynamique :
qui n'est d'autre que la première équation de Maxwell (voir chapitre d'électrodynamique). Dès
lors, comme nous avons vu en électrostatique, nous avons :
Par analogie, l'idée est de poser (cette hypothèse se vérifie un peu plus bas par les résultats
remarquables obtenus) :
relation que nous pouvons écrire de manière plus élégante en supposant le courant non
dépendant de la position de l'observateur dans l'espace et colinéaire au vecteur perpendiculaire
de la surface traversée :
LOI DE BIOT-SAVART
Rappelez-vous qu'à la dernière étape de notre développement précédent (nous l'avons précisé
1140/2001
Sciences.ch 14/03/2005
Le relation ci-dessus nous permet donc, par extension, d'écrire sous une forme plus générale :
qui n'est d'autre que la "loi de Biot-Savart" souvent présentée en premier dans les classes
scolaire comme début d'étude du magnétisme.
Cette dernière forme peut tout aussi bien s'écrire (forme très importante) :
Donc :
Nous retrouvons ici l'approximation non relativiste du champ magnétique tel que nous l'avons
déterminé lors de notre étude de la mécanique relativiste, où nous avons démontré que :
Donc :
1141/2001
Sciences.ch 14/03/2005
Une remarque important s'impose à notre niveau du discours : dans le cadre des études
scolaires pré-universitaires, les formulations mathématiques des champs magnétique et
électrique sont considérées comme des lois indémontrables d'où l'on tire plus tard les
équations de Maxwell (de plus les développements ne sont pas des plus esthétiques et
rigoureux). L'aspect totalement expérimental de relations aussi importantes peut avoir une
image néfaste de la physique théorique sur les étudiants. Il convient dès lors de préciser que
lors des études universitaire, nous avons une approche juste un peu moins pragmatique.