Free Sciences
Free Sciences
Christophe Roland
26 février 2017
Table des matières
1 La science 7
1.1 Qu’est ce que la science ? . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.2 La science : l’aspect «ensemble de connaissances» . . . . . . . . . . 8
1.1.3 La science : aspect «ensemble de méthodes» . . . . . . . . . . . . . 9
1.2 La notion de théorie scientifique . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.2 Remarque sur le terme «scientifique» . . . . . . . . . . . . . . . . . 10
1.3 L’inductivisme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.1 Idée générale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.2 Critique de l’inductivisme . . . . . . . . . . . . . . . . . . . . . . . 12
1.4 Le réfutationnisme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4.1 Introduction : critique de l’inductivisme . . . . . . . . . . . . . . . 13
1.4.2 La réfutabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4.3 Le critère de démarcation vue comme une définition . . . . . . . . 14
1.4.4 Notion de confiance dans une théorie . . . . . . . . . . . . . . . . . 14
1.4.5 Exemple : théories freudiennes et relativité . . . . . . . . . . . . . 15
1.4.6 Exemple : la théorie de l’atome . . . . . . . . . . . . . . . . . . . . 15
1.5 Le rasoir d’Occam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.5.1 Énoncé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.5.2 Exemple célèbre : l’éther . . . . . . . . . . . . . . . . . . . . . . . . 16
1.6 La notion de «science exacte» . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.6.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.6.2 Science exacte ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.6.3 Le problème . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.7 La mathématisation des sciences . . . . . . . . . . . . . . . . . . . . . . . 18
1.7.1 L’attrait pour la rigueur mathématique . . . . . . . . . . . . . . . 18
2 Logique 19
2.1 Qu’est ce que la logique ? . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1.2 La notion de vérité . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1.3 Le paradoxe du menteur . . . . . . . . . . . . . . . . . . . . . . . . 20
1
2.2 Notion naïve d’ensemble . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.2 Concepts et notations . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3 Le langage formel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.1 Langage formel et langage naturel . . . . . . . . . . . . . . . . . . 22
2.3.2 Définir la notion de langage . . . . . . . . . . . . . . . . . . . . . . 22
2.3.3 Construisons un exemple . . . . . . . . . . . . . . . . . . . . . . . 23
2.4 Introduction au calcul des propositions . . . . . . . . . . . . . . . . . . . . 23
2.4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4.2 Connecteurs logiques . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4.3 Langages propositionnelles . . . . . . . . . . . . . . . . . . . . . . 27
2.4.4 Valuation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.5 Tautologies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.5.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.5.2 Tautologies remarquables . . . . . . . . . . . . . . . . . . . . . . . 29
2.6 Calcul des prédicats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.6.1 Motivations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.6.2 Quantificateurs existentiels et universels . . . . . . . . . . . . . . . 32
2.6.3 Alphabet et syntaxe . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.6.4 Énoncés des langages prédicatifs . . . . . . . . . . . . . . . . . . . 33
2.7 Introduction à la théorie des modèles . . . . . . . . . . . . . . . . . . . . . 34
2.7.1 Motivations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.7.2 Notion de modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2
3.5.1 Idée générale de l’axiome . . . . . . . . . . . . . . . . . . . . . . . 44
3.5.2 Les relations fonctionnelles . . . . . . . . . . . . . . . . . . . . . . 44
3.5.3 Énoncé de l’axiome . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.5.4 Écriture formelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.5.5 Conséquences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.6 Axiome de l’infini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.6.1 Idée générale de l’axiome . . . . . . . . . . . . . . . . . . . . . . . 48
3.6.2 Union de deux ensembles . . . . . . . . . . . . . . . . . . . . . . . 48
3.6.3 Ensemble ayant un élément quelconque . . . . . . . . . . . . . . . 48
3.6.4 Énoncé de l’axiome . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.6.5 Écriture formelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.6.6 Conséquences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.7 Axiome de fondation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.7.1 Idée générale de l’axiome . . . . . . . . . . . . . . . . . . . . . . . 49
3.7.2 Intersection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.7.3 Énoncé de l’axiome . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.7.4 Écriture formelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.8 Éléments, sous-ensembles . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.8.1 Élément d’un ensemble . . . . . . . . . . . . . . . . . . . . . . . . 50
3.8.2 Inclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.8.3 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.9 Définir un ensemble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.9.1 Définition en extension . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.9.2 Définition en compréhension . . . . . . . . . . . . . . . . . . . . . . 52
3.10 Union et intersection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.10.1 Union . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.10.2 Intersection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.10.3 Distributivité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.11 Relations binaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.11.1 Notion de couple . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.11.2 Produit cartésien . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.11.3 Relations binaires . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.12 Différents types de relations . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.12.1 Fonction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.12.2 Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.12.3 Injection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.12.4 Surjection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.12.5 Bijection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.12.6 Loi de composition interne . . . . . . . . . . . . . . . . . . . . . . 57
3
4 Nombres 58
4.1 L’ensemble des naturels . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.1.2 Définir l’ensemble des naturels . . . . . . . . . . . . . . . . . . . . 59
4.1.3 Notion de successeur . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.2 Relation d’ordre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.2.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.2.2 Ordre totale et partiel . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.3 Principe de récurrence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.3.1 Idée générale du principe de récurrence . . . . . . . . . . . . . . . 61
4.3.2 Écriture formelle du principe . . . . . . . . . . . . . . . . . . . . . 61
4.3.3 Démonstration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.4 L’addition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.4.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.5 La multiplication . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.5.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5 Algèbre linéaire 66
5.1 Espaces vectoriels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.1.1 Notion intuitive de vecteur . . . . . . . . . . . . . . . . . . . . . . 66
5.1.2 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.2 Bases et dimension d’un espace vectoriel . . . . . . . . . . . . . . . . . . . 70
5.2.1 Combinaisons linéaires . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.2.2 Sous-espace vectoriel . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.2.3 Base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
5.3 Produit scalaire et espace dual . . . . . . . . . . . . . . . . . . . . . . . . 74
5.3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.3.2 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.3.3 Espace dual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
6 Trigonométrie 79
6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
6.1.1 Le sinus d’un angle . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
6.1.2 Introduction au concept de radian . . . . . . . . . . . . . . . . . . 80
6.2 Fonctions trigonométriques . . . . . . . . . . . . . . . . . . . . . . . . . . 81
6.2.1 Fonction sinus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
6.2.2 Fonction cosinus . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
6.2.3 Fonction tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
7 Analyse 86
7.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
7.1.1 Les paradoxes de Zénon d’Elée . . . . . . . . . . . . . . . . . . . . 86
7.1.2 Qu’est ce que l’analyse ? . . . . . . . . . . . . . . . . . . . . . . . . 87
7.2 Intervalles dans l’ensemble des réels . . . . . . . . . . . . . . . . . . . . . 87
4
7.2.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
7.2.2 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
7.3 Achille et la tortue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
7.3.1 Énoncé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
7.3.2 Résolution du paradoxe : première approche . . . . . . . . . . . . . 89
7.4 Suites numériques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
7.4.1 Définissons la notion de suite . . . . . . . . . . . . . . . . . . . . . 90
7.4.2 Introduction au concept de limite . . . . . . . . . . . . . . . . . . . 91
7.5 Fonctions numériques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
7.5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
7.5.2 Fonctions continues . . . . . . . . . . . . . . . . . . . . . . . . . . 94
7.5.3 Limites de fonction . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7.6 Fonctions dérivées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
7.6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
7.6.2 Le nombre dérivé . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
7.6.3 Fonction dérivée . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
7.7 Formules de dérivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
7.7.1 Dérivée d’une somme . . . . . . . . . . . . . . . . . . . . . . . . . . 103
7.7.2 Dérivée d’un produit . . . . . . . . . . . . . . . . . . . . . . . . . . 103
7.7.3 Dérivée d’un quotient . . . . . . . . . . . . . . . . . . . . . . . . . 104
7.7.4 Dérivée d’une fonction composée . . . . . . . . . . . . . . . . . . . 105
7.8 Dérivées usuelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
7.9 Théorème des valeurs intermédiaires . . . . . . . . . . . . . . . . . . . . . 108
7.9.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
7.9.2 Énoncé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
7.9.3 Démonstration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
7.9.4 Analyse et conséquences . . . . . . . . . . . . . . . . . . . . . . . . 109
7.10 Théorème de Rolle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
7.10.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
7.10.2 Énoncé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
7.10.3 Démonstration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
7.11 Théorème des accroissements finis . . . . . . . . . . . . . . . . . . . . . . 111
7.11.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
7.11.2 Énoncé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
7.11.3 Démonstration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
7.12 Théorème du sandwich . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
7.12.1 Énoncé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
7.12.2 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
7.12.3 Démonstration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
7.13 Calcul intégral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
7.13.1 Comment calculer la surface d’un disque ? . . . . . . . . . . . . . . 114
7.13.2 Somme de Riemann . . . . . . . . . . . . . . . . . . . . . . . . . . 116
7.14 Théorème des accroissements finis (forme intégrale) . . . . . . . . . . . . . 117
5
7.14.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
7.14.2 Énoncé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
7.14.3 Démonstration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
7.14.4 Cas particuliers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
7.15 Théorèmes fondamentaux de l’analyse . . . . . . . . . . . . . . . . . . . . 119
7.15.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
7.15.2 Premier théorème fondamental de l’analyse . . . . . . . . . . . . . 120
7.15.3 Deuxième théorème fondamental de l’analyse . . . . . . . . . . . . 121
9 Electromagnétisme 137
9.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
9.2 Notions de bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
9.2.1 Les phénomènes électrostatiques . . . . . . . . . . . . . . . . . . . 137
9.2.2 Loi de Coulomb . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
9.2.3 Structure de la matière . . . . . . . . . . . . . . . . . . . . . . . . 140
9.2.4 Le champs électrique . . . . . . . . . . . . . . . . . . . . . . . . . . 141
6
Chapitre 1
La science
7
et quels sont ses principes fondamentaux. Nous allons nous interroger sur la nature
même de la science, c’est à dire que nous allons faire de la philosophie des sciences. Elle
nous permettra de fournir une définition relativement précise de ce qu’est la science, de
distinguer ce qui est scientifique de ce qui ne l’est pas. Comme on analyse ce qu’est la
science, on se situe en quelque sorte sur un autre plan : ce chapitre n’est pas un chapitre
scientifique (on ne fait pas de science) mais en quelque sorte «méta-scientifique»
Mais bien sûr, il faut définir (au moins intuitivement) ces différentes disciplines :
Bien sûr, il s’agit là d’une définition quelque peu vague et non-rigoureuse, l’essentiel
étant d’en avoir une intuition. L’idée est que ces sciences n’étudient que des constructions
purement théoriques, dans lesquels on construit uniquement des objets abstraits. Bien
que parfois très abstraites, ces constructions théoriques sont souvent motivées par des
applications concrètes. Ainsi, beaucoup de développement en mathématiques sont motivés
8
par des problèmes en physique. Mais il faut bien se rendre compte que ce n’est pas
systématiquement le cas : il est d’ailleurs tout à fait possible que des recherches en
mathématiques ne trouvent jamais d’applications concrètes. Mais ce n’est pas un problème
car ce n’est pas là notre motivation principale, ce que nous voulons avant tout c’est
satisfaire notre curiosité naturelle.
Définition 3. Les sciences naturelles étudient le monde naturel, c’est-à-dire à la fois
les objets qui le compose et les lois qui le gouverne.
L’exemple le plus direct est bien sûr la physique. C’est elle qui fournit la base aux
autre sciences naturelles car elle étudient les lois fondamentales de la nature. C’est à
partir des lois de la physiques que l’on peut déduire toutes les principes de la chimie, et
par la chimie toutes les connaissances de la biologie.
Définition 4. Les sciences humaines et sociales étudient différents de l’humain, comme
son comportement et ses interactions sociales.
Les sciences humaines et sociales forment un ensemble extrêmement vaste de connais-
sance. Elle concerne tout ce qui touche au comportement humain tant au niveau individuel
(comme la psychologie) qu’au niveau collectif (comme l’anthropologie et la sociologie).
Certaines de ces sciences sont directement motivées pour des applications concrètes
comme par exemple l’économie.
9
Le grand public ne comprend souvent pas très bien cette notion, et n’en a en fait qu’une
idée très vague. L’illustration la plus flagrante est donnée par la théorie de synthétique
de l’évolution, en effet ses détracteurs l’accusent souvent de «n’être qu’une théorie».
Ceci montre une confusion (souvent volontaire) entre la notion de théorie scientifique
et la notion de théorie telle qu’on la conçoit dans le langage courant. En effet, dans le
langage courant, on parle de théorie pour indiquer une explication dont la véracité est
très hypothétique, et donc non confirmée. Ce n’est pas cela une théorie scientifique.
Une théorie scientifique doit se baser sur un certaine nombre d’hypothèses. C’est une
chose absolument incontournable pour pouvoir produire quelque de solide et cohérent :
on doit se reposer sur un certain nombre de principes fondamentaux, que ne remet jamais
en cause au sein de la théorie. Si l’un de ces principes est remis en cause de façon certaine,
par exemple par l’expérience, alors il faut rejeter ce principe, et par suite toute la théorie.
En physique principalement, on appelle ces principes des postulats.
Une fois que l’on a posé ces postulats, une série de déductions peuvent être faites.
On utilise assez souvent le terme de «théorème» pour désigner ces résultats de manière
générale. Ces théorèmes demandent donc une démonstration : on doit démontrer que si
les postulats sont vrais, les théorèmes sont vrais également. D’une certaine manière, on
peut dire que la vérité des théorèmes n’est pas établie malgré leur démonstration, en effet
ils ne sont vrais que sous l’hypothèse que les postulats sont bons.
On comprend donc qu’il est judicieux de parler de vérification pour une théorie :
c’est très intéressant d’établir une théorie, mais tant qu’aucune autre expérience ne vient
confirmer la validité de cette théorie, rien ne nous permet d’être véritablement confiant
envers notre théorie, elle reste hypothétique. La notion de vérification d’une théorie sera
développée en détail plus loin.
Nous somme donc près à définir la notion de théorie :
10
Il est intéressant de noter un paradoxe dans la perception de la science dans le grand
public. Alors qu’à la fois la science est élevé au rang de juge suprême (qui n’a jamais
entendu comme argument que telle chose est prouvée scientifiquement ?) elle est parfois
considérée comme dogmatique (exemple du GIEC) ou essentiellement impuissante (le
fameux «la science ne peut pas tout expliquer» appliqué à tord et à travers). Ainsi, la
science est à la fois reçue avec enthousiasme et avec méfiance. C’est probablement le
meilleurs argument pour dire qu’il est important d’expliquer ce qu’est la science.
1.3 L’inductivisme
1.3.1 Idée générale
La méthode la plus élémentaire de recherche scientifique (et d’une certaine manière la
plus primitive) repose sur l’induction. Il s’agit de savoir comment trouver une loi générale
à partir d’un nombre limité d’observations.
L’idée centrale repose sur deux concepts essentiels : l’expérience précède la théorie, et
il faut faire une généralisation à partir d’un ensemble fini d’observations. La science se
compose en effet de lois générales, mais une expérience n’est jamais qu’un cas particuliers.
Extraire une loi générale à partir d’un ensemble de cas particuliers est un problème
délicat, aussi on s’impose les contraintes suivantes :
— Faire un grand nombre d’expériences. Si une expérience réussit trois fois, on peut
penser qu’on a eu de la chance d’être dans des conditions particulières. Si elle
réussit cent fois, c’est déjà moins probable et la confiance en l’expérience est
accrue.
— Varier les conditions expérimentale. Ceci permet d’éliminer les facteurs qui
n’entrent pas en jeu. Si on fait une expérience dans lequel on utilise un cer-
tain matériaux, et que l’on pense que sa nature n’influence pas le résultat, il
convient d’essayer avec un autre matériaux pour le vérifier.
— Aucune observation ne doit contredire la loi : c’est une évidence, un seul contre-
exemple suffit à invalider une loi générale.
Par exemple, Galilée a effectué plusieurs expériences sur la chute des corps. Plusieurs
fois, il laissa rouler des objets sur un plan incliné et repéra le temps écoulé à intervalles
réguliers. Il répéta ces expériences, avec différents objets de différentes masses, et en
tira une loi générale : la distance parcourue par un objet en chute libre, sans vitesse
initiale, est proportionnelle au carré du temps écoulé depuis le lâcher. En particulier, elle
ne dépend pas de la masse de l’objet.
Ce procédé s’appelle induction et il est important de ne pas la confondre avec la
notion de déduction. En effet, dans une déduction, la conclusion est vraie de manière
certaine si les prémisses sont vraies, ce n’est pas le cas dans le cadre de l’induction, où la
conclusion est seulement probablement vraie mais ce n’est pas assurée.
C’est le problème que nous allons aborder tout de suite.
11
1.3.2 Critique de l’inductivisme
Le mathématicien et philosophe Bertrand Russell dit à propos de ce problème :
« Une dinde arrive dans une ferme, est nourrie tous les jours à 9h. En bonne inductiviste
elle recueille un grand nombre de données (jour, climat,...) pour établir une conclusion
quant à l’heure des repas des dindes. Elle finit par conclure qu’elle est toujours nourrie à
9h du matin,... jusqu’à la veille de Noël où on lui tranche le cou. »
C’est le problème fondamental : l’induction ne permet pas de tirer une conclusion
certaine. Le même problème se pose pour la chute des corps, par exemple on pourrait
imaginer qu’au delà d’une certaine masse, la loi énoncée par Galilée n’est plus vraie. Ou
peut-être n’est-elle vraie en moyenne qu’une fois sur un million. On peut ainsi imaginer
des tas de choses, éventuellement très farfelues, le point principal étant que la loi n’est
absolument pas prouvée : on peut en effet en imaginer d’autres, pourtant tout aussi
compatibles avec l’observation.
Paradoxe de Goodman
Un exemple intéressant est donnée par le philosophe et logicien Nelson Goodman en
1946. On introduit un nouvel adjectif : «vleu» qui veut dire :
Observer des émeraudes vertes donne par induction : «toutes les émeraudes sont
vertes», mais peut très aussi donner : «toutes les émeraudes sont vleues». Le paradoxe
est dans le fait qu’on considère toujours comme vraie la première affirmation mais jamais
la seconde, alors qu’il n’y a pas de raison logique formelle pour cela.
La raison, d’après Goodman et Hume, se trouve dans «l’habitude». Nous voyons
toujours des émeraudes verte, et nous n’observons jamais de changement, alors que la
couleur «vleu» suppose une transformation brutale. Ainsi, on fait l’hypothèse implicite
de la régularité : les lois de la physique ne changent pas au cours du temps, et on ne peut
donc pas présupposer une propriété avec ce genre de référence temporelle. De même, on
pourrait s’interdire d’avoir une référence spatiale (c’est à dire : les lois de la physiques
sont les mêmes partout).
Il est toutefois important de remarquer que ce genre de supposition trouvent elles
mêmes leur origine dans un raisonnement inductif. En fait, Hume considère que cette
notion d’habitude trouve sa source dans la psychologie humaine, bien que Hume ne
s’interdise pas de l’utiliser dans un cadre scientifique.
12
principe, c’est à dire que l’on suppose (au moins implicitement) ce que l’on veut prouver
et c’est bien évidemment un raisonnement fallacieux.
Inductivisme sophistiqué
Pour répondre à toutes ces objections, les inductivistes ont tentés d’améliorer la situa-
tion en s’écartant d’une idée trop naïve de l’induction. Ainsi on peut parler d’«inductivisme
sophistiqué», mais ce terme peut s’appliquer à différents systèmes de pensée inductiviste ;
il ne faut donc pas voir derrière ce terme un courant de pensée homogène et objectivement
identifiable.
En effet, l’histoire des sciences montre que de nouvelles idées ne viennent pas tou-
jours d’un raisonnement purement inductif. Elles peuvent venir d’arguments purement
théoriques ou d’une bonne intuition. Elles peuvent aussi être motivées par des données
empiriques, mais les raisonnements entre les données et la conclusion ne sont pas forcément
de nature inductive.
Claude Bernard, un médecin du dix-neuvième siècle, était un partisan de l’inducti-
visme. Il a créé la méthode OHERIC : Observation, Hypothèse, Expérience, Résultats,
Interprétation, Conclusion ; qui modélise la démarche scientifique. Il s’agit déjà d’un
inductivisme sophistiqué, mais l’observation reste la source première du raisonnement.
Ainsi, Claude Bernard refusait l’idée que l’on puisse un jour déterminer la composition
des étoiles, car il rejetait tout ce qui était inaccessible à l’observation directe.
Nous savons cependant de nos jours beaucoup de choses sur la composition des étoiles.
Il faut donc accepter que l’idée de départ ne soit pas forcément issue d’un raisonnement
inductif. Toutefois, puisque l’on se place dans le cadre d’un inductivisme sophistiqué,
l’induction n’est pas supprimée mais simplement déplacée. Elle n’est plus forcément la
méthode utilisée pour trouver la loi, mais pour la confirmer.
Même si l’induction est déplacée au rang de méthode de vérification et non plus de
méthode de recherche, il reste que comme nous l’avons vu, cette vérification est incertaine.
Ceci ne répond donc pas totalement aux critiques.
1.4 Le réfutationnisme
1.4.1 Introduction : critique de l’inductivisme
Karl Raimund Popper était un philosophe des sciences qui a vécu pendant le vingtième
siècle. Il pensait qu’un problème majeur de la philosophie des sciences est de pouvoir
distinguer ce qui est scientifique de ce qui ne l’est pas. Il va ainsi sévèrement critiquer
l’inductivisme.
Pour Popper, on peut faire autant d’expérience que l’on veut qui vont dans le sens de
la théorie, ce n’est pas suffisant pour avoir vraiment confiance en elle. Au lieu de parler
de vérification, Popper parle de «corroboration» pour les observations qui vont dans le
sens de la théorie.
Il propose donc d’abandonner l’induction comme méthode scientifique. Et il va
moins s’interesser aux méthodes de recherches scientifiques qu’à trouver un critère de
13
démarcation discriminant les théories scientifiques des théories non-scientifiques.
1.4.2 La réfutabilité
Popper considère alors que pour qu’une théorie soit scientifique, elle doit être réfutable.
Qu’est ce que cela veut dire ?
Imaginons une théorie non-réfutable c’est à dire qu’on ne peut jamais prouver qu’elle
est fausse. Par exemple, je vais dire : il existe autour de nous des tas de lutins invisibles
qui nous observent. Cette théorie est irréfutable, en effet vous ne pourrez jamais prouvez
que cette théorie est fausse.
Prenons maintenant une théorie réfutable : la relativité générale. Elle a fait un grand
nombre de prédictions qui ont été mis à l’épreuve. Par exemple, elle prévoyait que la
trajectoire des rayons lumineux soit courbée dans un champs de gravitation (comme a
proximité du Soleil) suivant un angle deux fois plus grand que celui prédit par la théorie
newtonienne. Cette prédiction a été mise à l’épreuve dès 1919 à l’occasion d’une éclipse
totale.
Pour qu’une théorie soit réfutable, elle doit donc faire des prédictions pour pouvoir
la mettre à l’épreuve. Si la théorie prédit quelque chose qui a déjà été observé ce n’est
suffisant (ce n’est qu’une «postdiction») car aucune expérience ne permet de réfuter cette
théorie.
Ainsi, on sort quelque peut du débat de savoir si le critère de démarcation est juste :
il l’est pas définition. Bien sûr, c’est un peu facile car il faut encore être en accord avec
l’acceptation généralement admise du terme «scientifique» ainsi qu’avec l’histoire des
sciences.
Cela marche assez bien mais il faut ici attirer l’attention sur une faute à ne pas
faire. Il ne faut pas voir la réfutabilité comme ayant quelque rapport avec la démarche
scientifique. Ainsi, quand on confronte l’histoire des sciences avec cette définition, il ne
faut pas chercher à savoir si le chercheur avait ce genre d’idée en tête ou pas ; c’est une fois
la théorie faite que l’on peut dire : cette théorie est scientifique (ou ne l’est pas). En effet,
les expériences ne sont pratiquement jamais faites pour réfuter mais confirmer ou collecter
des données afin de construire une nouvelle théorie. C’est pourquoi le réfutationnisme
n’est en rien une base pour comprendre la méthode scientifique.
14
sens de Popper) et qu’elle décrive correctement la réalité ?
Il est parfaitement possible d’avoir une théorie scientifique fausse, tout comme il est
possible d’avoir une théorie non-scientifique correcte. Le critère de Popper n’est pas une
garantie absolue de la véracité d’une théorie. Elle permet cependant d’augmenter notre
confiance en elle.
Ainsi, si je dis qu’un petit nounours vert est quelque part caché sous la surface
de Pluton, comme personne n’a les moyens d’aller vérifier, personne ne pourra jamais
me prouver que j’ai tord, la théorie est donc non-scientifique au sens de Popper. Il est
raisonnable d’être sceptique par rapport à cette affirmation, des théories de ce genre on
peut en imaginer des centaines, étant hors de portée de toute réfutation, on est obligé de
rester dans le doute.
Mais si je dis que les horloges vont tourner plus vite dans un champs de gravitation
plus faible et que je peut même chiffrer la différence, je prend beaucoup de risque en disant
cela car on peut vérifier cela autant de fois que l’on veut avec différentes expériences
éventuellement très précises. Si malgré cela personne n’aura prouvé que j’avais tord, ma
théorie est passée à l’épreuve du feu : elle s’en sort renforcée, car même en laissant la
possibilité de la critiquer, elle est restée indemne.
15
La théorie de l’atome redevient d’actualité avec John Dalton au début du XIXe siècle.
Cette théorie devient scientifique et l’existence des atomes fut confirmé expérimentalement.
En conclusion, une théorie peut être scientifique ou non selon les moyens d’expéri-
mentation dont on dispose. Il est toutefois hasardeux d’émettre des théories en espérant
que l’on puisse un jour les confirmer car on a dû attendre plus de deux mille ans avant
que la théorie atomique passe de simple spéculation à théorie scientifique.
1.5.1 Énoncé
L’idée est de toujours choisir la théorie la plus simple et celle qui introduit le moins
d’hypothèses entre deux théories concurrentes. Il suffit de faire attention au fait de ne
mettre en concurrence que des théories réfutables. Par exemple si on a une théorie qui
dit que les orages sont produits par le dieu Thor lorsqu’il est en colère, c’est assurément
une théorie plus simple qu’une théorie météorologique complexe sur la formation des
orages, mais étant une théorie non réfutable, c’est une théorie non scientifique.
16
assez connue : le classement des sciences en sciences exactes et inexactes (on dit aussi
sciences «dures» et sciences «molles»).
Nous allons d’abord donner une définition du terme «science exacte» pour ensuite
l’analyser.
1.6.1 Définition
Définition 6. Les sciences exactes regroupent :
1. les sciences de la nature : chimie, physique, biologie, astronomie, ...
2. les sciences formelles : mathématique, informatique, géométrie, logique, ...
Le terme de «science exacte» s’oppose aux sciences humaines et aux sciences sociales.
Mais il reste une question : quelle est la raison de cette distinction entre sciences exactes
et «inexactes» ?
1.6.3 Le problème
Cette classification peut poser problème. Dire que l’on travaille dans une science
inexacte semble peu gratifiant. Ce terme est un peu péjoratif.
17
Il est d’ailleurs assez intéressant de constater l’énorme attrait pour les mathématiques
de la part de scientifiques travaillant dans les sciences humaines et sociales. L’idée de
mathématiser la sociologie peut sembler étrange mais pourtant une partie de la sociologie
est mathématisée à outrance (parfois avec des relations mathématiques relativement
compliquées). Il semble clair que le but est d’atteindre une plus grande précision, qui
pourrait ( ?) être offerte par la mathématisation. Cela est-il vraiment une bonne façon
de raisonner ? Je pense que la question se pose et je pense que la réponse est non. Afin
de mieux cerner les efforts de mathématisation des sciences inexactes, nous allons nous
intéresser à cet étrange attrait pour les mathématiques.
La première lettre de l’alphabet hébreux est aussi parfois utilisée. C’est aleph : ℵ.
Tout comme pour le langage habituel, il existe un certain nombre de règles (tout
agencement de symboles mathématiques n’a pas de sens) et c’est précisément la rigidité
de ces règles qui offre aux mathématiques toute leur rigueur. La question est donc de
savoir comment, face à un phénomène naturel, on peut retranscrire ce problème en terme
mathématique. Une fois le problème posé en équation, on peut profiter de toute la rigueur
offerte.
18
Chapitre 2
Logique
19
ici de faire de la «métaphysique quantique» !), ou de tout autre influence extérieure, alors
on peut toujours parler de vérités portant sur le système plus large :
On voit tout de suite l’impossibilité de décider si cette phrase est vrai ou fausse : si
elle vraie, c’est qu’elle est fausse, et inversement ! Ce problème très connus est appelé
paradoxe du menteur. Il existe un certain nombre de solutions proposées pour résoudre ce
paradoxe, nous allons nous contenter d’exposer la solution donnée par le logicien Alfred
Tarski.
L’énoncé «Cette phrase est fausse» est écrite dans un langage (ici le français) qui
est sémantiquement clos. Un langage sémantiquement clos est un langage dans lequel on
peut exprimer la vérité d’un énoncé écrit dans cette même langue. C’est cette «capacité»
de ces langages qui permettent l’apparition de paradoxes comme le paradoxe du menteur,
les pourquoi les langages sémantiquement clos sont dit inconsistants.
On peut donc éviter ce type de paradoxe par l’utilisation de langages sémantiquement
ouvert (qui sont simplement les langages qui ne sont pas sémantiquement clos). Mais
alors, si on ne peut exprimer la vérité d’un énoncé dans un langage sémantiquement
ouvert, comment parler de la vérité d’un énoncé dans un tel langage ?
Pour cela, il faut utiliser un autre langage, précisément un méta-langage. Si on veut
exprimer (définir) la notion de vérité dans un langage L, on peut le faire dans un méta-
langage M L. Ce langage est lui-même sémantiquement ouvert (puisque c’est requis pour
20
ne pas avoir un langage inconsistant), on ne peut donc pas dans M L exprimer la vérité
d’un énoncé de M L. Pour cela, il faut un autre (méta)-langage, M M L, et ainsi de suite. Il
apparaît donc une hiérarchie dans les langages, c’est ainsi que cette solution du paradoxe
du menteur est appelée la solution hiérarchique.
E = {a1 , a2 , ..., an }
x∈E
x∈
/E
21
2.3.1 Langage formel et langage naturel
Un langage naturel est tout simplement définit comme étant un langage utilisé
dans la vie de tout les jours, comme par exemple, le français. Comme nous l’avons
vu, les langages naturels sont sémantiquement clos, donc inconsistants. En plus de cet
inconvénient majeur, les langages naturels ont deux inconvénients pratiques quand on les
utilise en mathématique :
1. la complexité des phrases qui rend les choses plus compliquées, il faut parfois
plusieurs lignes et une phrase complètement incompréhensible, pour dire quelque
chose qui peut se résumer par une expression mathématique bien plus simple et
courte,
2. le fait que les ambiguïtés du langage courant peuvent conduire à des erreurs de
raisonnement.
Ces inconvénients nous poussent à définir des langages ayant des règles très strictes
tout en étant le plus facile à lire possible, ce sont des langages formels. Bien on demandera
à ces langages formels d’être des langages sémantiquement ouverts.
Définition 8. Un mot d’un alphabet est une suite ordonnée et finie de symboles de
l’alphabet.
Ainsi, un langage formel est un sous ensemble de l’ensemble des mots de l’alphabet.
Si on se donne une série de règles auxquelles obéissent les mots du langages et seulement
ceux-ci, ces règles sont appelé la syntaxe du langage.
22
2.3.3 Construisons un exemple
On peut donner un exemple pour y voir plus clair et définir un langage formel simple :
on va prendre un alphabet et une syntaxe quelconque, ne voyez aucune logique particulière
dans le choix que l’on va faire.
L’alphabet du langage est l’ensemble contenant les éléments suivants : A, B, C, +, =.
Et la syntaxe sera composés des règles suivantes :
1. aucun mot du langage ne peut commencer ou terminer par =,
2. aucun mot du langage ne peut commencer ou terminer par +,
3. dans un mot du langage, on a un et un seul symbole «=»,
4. dans un mot du langage, un symbole sur deux est une lettre.
On a donc définit un langage formel simple. Les mots de ce langage ressemblent à des
équations mathématiques, par exemple, A + B + C = A + C est un mot possible. En
effet, le premier et le dernier symbole ne sont ni «=» ni «+», on a un seul symbole «=»,
et un symbole sur deux est bien une lettre.
On se rend compte aussi que certains agencement de symboles ne sont pas des mots
du langage : par exemple, = +A + +BC ne l’est pas.
23
définir, que l’on appellera des connecteurs logiques. Comme leur nom l’indique, il vont
«connecter» les formules atomiques de façon à construire des formules composées, qui
seront donc des formules avec plus d’un symbole. On peut s’attendre à ce que l’on puisse
les utiliser de la même façon pour «connecter» des formules atomiques et des formules
composées. Ainsi, on pourra définir, étant donné un certain connecteur logique et un
certain nombre d’énoncés (de formules), comment on peut construire une formule qui les
combine, sans se préoccuper de savoir si les formules que l’on combine sont atomiques ou
non.
Pour représenter symboliquement cette construction, un problème se pose. On vou-
drait disposer de symboles qui puissent représenter n’importe quel énoncé, pour définir
proprement la syntaxe des langages propositionnels. On conviendra alors de noter les
énoncés par des lettres majuscules A, B, C, ..., mais ici il faut bien comprendre que
ces symboles ne font pas partie des langages propositionnels ! ! Il servent à définir plus
facilement la syntaxe de tels langages, on peut dire que ces symboles font partie d’un
méta-langage.
Il faudra aussi définir proprement la sémantique de ces langages, c’est à dire se poser
la question de la signification des énoncés. On peut déjà dire qu’à chaque proposition
correspond une valeur de vérité : soit vrai soit faux. Anticipant un peu sur la suite, on
peut déjà donner des principes qui seront valable pour n’importe quel énoncé :
1. principe de bivalence : les deux seules valeurs de vérité possible sont le vrai et le
faux,
2. principe du tiers-exclu : à tout énoncé on associe soit le vrai, soit le faux, aucun
énoncé est dépourvu de valeur de vérité,
3. principe de non-contradiction : aucun énoncé ne avoir plus d’une valeur de vérité,
un énoncé ne peut donc être à la fois vrai et faux.
On a alors la définition suivante :
Définition 10. Soit L un langage propositionnel. Une L-assignation est une relation qui
à chaque formule atomique de L associe une et une seule valeur de vérité, soit V (vrai),
soit F (faux).
24
Les mots «si» et «alors» sont des connecteurs logiques (en fait il n’en forment qu’un
puisqu’on les utilisent ensembles). Nous allons maintenant en voir d’autres et représenter
chaque connecteur par un symbole différent.
25
Le connecteur «si... alors» (conditionnel matériel ou implication)
Il est représenté par le symbole : ⇒.
A B A⇒B
V V V
V F F
F V V
F F V
«si A alors B» veut dire tout simplement que si A est vrai, B l’est nécessairement aussi.
Mais la table de vérité peut surprendre. Pourquoi les deux «V» au bas de la colonne
de droite ? Ici pour comprendre, considérons chaque cas un à un.
Premier cas : le vrai implique le vrai. C’est assez logique : par définition de l’implication,
si A est vrai, B est vrai aussi. Deuxième cas : le vrai n’implique pas le faux ! ! Logique
encore une fois : à partir d’une proposition vraie, on ne pourra jamais en déduire une
proposition fausse.
Donnez une valeur de vérité à A ⇒ B quand A est faux est plus délicat. Commençons
par le cas où B est vrai. On voit dans la table de vérité que A ⇒ B est vrai. Cela veut
dire qu’à partir d’une proposition fausse, on peut très bien aboutir à une conclusion vraie.
Cela peut paraître étrange mais nous allons donner un exemple.
Supposons donc que A veuille dire : « 2 + 2 = 5» (proposition fausse donc). On
peut en déduire facilement une proposition vraie : il suffit de multiplier chaque cotés
de l’égalité par zéro. On a donc 0 · (2 + 2) = 0 · 5 ce qui donne 0 = 0 c’est à dire une
proposition vraie ! Le faux implique donc le vrai.
Enfin, montrer que le faux implique le faux est très facile. en effet de «2 + 2 = 5» on
peut déduire directment que... «2 + 2 = 5» ! !
A B A⇔B
V V V
V F F
F V F
F F V
D’autres connecteurs
Ces connecteurs ne sont pas ou peu utilisés en mathématique, mais plutôt en électro-
nique et en informatique. Comme on les utilise surtout en informatique, on utilise le «1»
à la place du «V» et le «0» à la place du «F».
26
Ces connecteurs sont aussi appelés des «portes logiques». La porte NOT est le
«non»logique, la porte AND est le «et» et la porte OR est le «ou». On trouve aussi la
porte NOR (NOT OR) :
A B A NOR B
1 1 0
1 0 0
0 1 0
0 0 1
A B A XOR B
1 1 0
1 0 1
0 1 1
0 0 0
A B A NAND B
1 1 0
1 0 1
0 1 1
0 0 1
27
— si A et B sont des formules, alors (A ⇒ B) est une formule,
— si A et B sont des formules, alors (A ⇔ B) est une formule.
Petite remarque : pourquoi dit-on dans la définition : «le plus petit ensemble» ?
L’explication est simple. Si on avait la même définition mais sans préciser cela, on ne
saurait pas par exemple, si la formule A ∨ ∧B est valide ou pas. En effet, la définition
n’implique pas que cette formule existe, mais ne l’interdit pas non plus. C’est pour cela
que l’on précise «le plus petit ensemble», sinon la définition ne serait pas correcte.
2.4.4 Valuation
Étant donné un langage propositionnel L et une L-assignation, on peut attribuer une
valeur de vérité à chaque formule atomique. Mais alors, on peut assigner une valeur de
vérité aux formules composées grâces aux tables de vérité, à la L-assignation correspond
donc une L-valuation qui fait fait à tout les énoncés une valeur de vérité. On va maintenant
énoncer un théorème qui dit simplement qu’étant donnée une L-assignation, il existe une
et une seule L-valuation associée. On verra alors que les tables de vérités ne sont que des
conséquences de ce théorème, qui définit comment on associe une valeur de vérité à toute
formule.
Théorème 1. Soit L un langage propositionnel, à chaque L-assignation possible M
correspond une et une seule relation appelée L-valuation et notée VM , qui à chaque
énoncé A fait correspondre une et une seule valeur de vérité qui ne peut être que V ou F ,
tel que, en notant M (A) la valeur de vérité associée à la proposition A par M , et vM (A)
la valeur de vérité associée à la proposition A par VM :
— Si A est une proposition, vM (A) = M (A).
— Si A est une formule, vM (¬A) = V si et seulement si vM (A) = F .
— Si A et B sont des formules, vM (A ∨ B) = V si et seulement si vM (A) = V et/ou
vM (B) = V .
— Si A et B sont des formules, vM (A ∧ B) = V si et seulement si vM (A) = V et
vM (B) = V .
— Si A et B sont des formules, vM (A ⇒ B) = V si et seulement si vM (A) = F
et/ou vM (B) = V .
— Si A et B sont des formules, vM (A ⇔ B) = V si et seulement si vM (A) = vM (B).
Démonstration. Montrons d’abord que pour toute formule X, on a au moins une
valuation. Si X est une proposition, on a tout simplement vM (X) = M (X). Sinon, par la
syntaxe du langage, on sait que X peut s’écrire sous au moins l’une des forme suivantes :
¬A, (A ∨ B), (A ∧ B), (A ⇒ B) et (A ⇔ B), où A et B sont des formules. Les règles
données dans le théorème nous donne alors une valeur de vérité, connaissant la valeur de
vérité de A et B. Mais eux-mêmes peuvent se mettre sous au moins l’une des formes ¬A0 ,
(A0 ∨ B 0 ), (A0 ∧ B 0 ), (A0 ⇒ B 0 ) et (A0 ⇔ B 0 ), donc on peut obtenir leur valeur de vérité
en fonction d’autre énoncés et ainsi de suite jusqu’à arriver à la valuation de propositions.
Montrons maintenant qu’il n’y a qu’une valuation pour chaque formule. Pour les
propositions, c’est trivialement vrai. Sinon, supposons deux valuations vM et vM 0 diffé-
rentes sur certaines formules. Si pour deux formules A et B on a vM (A) = vM 0 (A) et
28
vM (B) = vM 0 (B) (et il est toujours possible d’en trouver puisque l’on peut choisir des
propositions), alors on a vM (¬A) = vM 0 (¬A), vM (A ∨ B) = vM 0 (A ∨ B), ..., et on peut
refaire le même raisonnement avec ces formules composées, et ainsi de suite. De proche
en proche, on a vM (X) = vM 0 (X) pour toute formule X.
Notons que les tables de vérités sont une conséquence de ce théorème, une façon
schématique simple de représenter les règles qui définissent les L-valuations.
2.5 Tautologies
2.5.1 Définition
Définition 11. Une tautologie est un énoncé qui est vrai pour toute L-valuation.
Exemples :
Un énoncé de la forme A ⇒ A est une tautologie : que A soit vrai ou faux, cette
formule est toujours vrai. On peut le démontrer avec une table de vérité.
A A⇒A
V V
F V
A ¬A A ∨ ¬A
V F V
F V V
On voit donc ici la méthode de démonstration avec une table de vérité : la dernière
colonne ne contient que des «V», c’est donc que l’énoncé est forcément vrai.
Identité
A⇔A
Double négation
A ⇔ ¬¬A
Idempotence
29
A ⇔ (A ∨ A)
A ⇔ (A ∧ A)
Commutativité
A∨B ⇔B∨A
A∧B ⇔B∧A
Associativité
(A ∨ (B ∨ C)) ⇔ ((A ∨ B) ∨ C)
(A ∧ (B ∧ C)) ⇔ ((A ∧ B) ∧ C)
Distributivité
(A ∨ (B ∧ C)) ⇔ ((A ∨ B) ∧ (A ∨ C))
(A ∧ (B ∨ C)) ⇔ ((A ∧ B) ∨ (A ∧ C))
Absorption
(A ∨ (A ∧ B)) ⇔ A
(A ∧ (A ∨ B)) ⇔ A
Loi de De Morgan
¬(A ∨ B) ⇔ (¬A ∧ ¬B)
¬(A ∧ B) ⇔ (¬A ∨ ¬B)
Conditionnel matériel
(A ⇒ B) ⇔ (¬A ∨ B)
(A ⇒ B) ⇔ ¬(A ∧ ¬B)
Contraposition
(A ⇒ B) ⇔ (¬B ⇒ ¬A)
Équivalence matérielle
(A ⇔ B) ⇔ (A ⇒ B) ∧ (B ⇒ A)
(A ⇔ B) ⇔ (A ∧ B) ∨ (¬A ∧ ¬B)
Exportation-importation
((A ∧ B) ⇒ C) ⇔ (A ⇒ (B ⇒ C))
Pour compléter, on peut lister une série de tautologie qui ne sont pas des équivalences
(c’est à dire sans le symbole ⇔) :
Identité
A⇒A
Tiers exclu
30
A ∨ ¬A
Loi de Peirce
((A ⇒ B) ⇒ A) ⇒ A
Modus Ponens
(A ⇒ B) ∧ A ⇒ B
Modus Tollens
(A ⇒ B) ∧ ¬B ⇒ ¬A
Modus Barbara
(A ⇒ B) ∧ (B ⇒ C) ⇒ (A ⇒ C)
31
2.6.2 Quantificateurs existentiels et universels
Les différents connecteurs vu en logique propositionnelle restent tout à fait d’actualité.
Mais pour le calcul des prédicats, nous devons introduire deux nouveaux symboles
logiques : ce sont des quantificateurs.
Le quantificateur existentiel
Ce quantificateur signifie : «il existe» ou plus précisément : «il existe au moins un»
et est noté ∃. On peut écrire :
∃xA
Et on doit comprendre : «il existe au moins un x tel que A soit vrai».
On rencontre parfois en mathématique des expressions du type :
∃!A
Et on doit comprendre : «il existe un et un seul x tel que A soit vrai». On ne va cependant
pas utiliser cette écriture en logique.
Le quantificateur universel
Ce quantificateur signifie «quelque soit» et est noté ∀. On peut écrire :
∀xA
32
1. toute variable est un terme,
2. toute constante est un terme,
3. si T1 , T2 , ..., Tn sont des termes, alors si F est un symbole fonctionnel d’arité n,
F T1 T2 ...Tn est un terme.
L’ensemble des formules est le plus petit ensemble de mots construits sur l’alphabet
de la logique des prédicats tel que :
1. toute proposition est une formule,
2. si T1 , T2 , ..., Tn sont des termes, alors si P n est un prédicat d’arité n, P n T1 T2 ...Tn
est une formule,
3. si A est une formule, alors ¬A est une formule,
4. si A et B sont des formules, alors (A ∨ B) est une formule,
5. si A et B sont des formules, alors (A ∧ B) est une formule,
6. si A et B sont des formules, alors (A ⇒ B) est une formule,
7. si A et B sont des formules, alors (A ⇔ B) est une formule,
8. Si A est une formule et X est une variable, ∀XA est une formule,
9. Si A est une formule et X est une variable, ∃XA est une formule.
Définition 12. Soit A une formule, l’ensemble S(A) des sous-formule de A, est le plus
petit ensemble de formules tel que :
1. A ∈ S(A),
2. si ¬B ∈ S(A), alors B ∈ S(A),
3. si B ∨ C ∈ S(A), alors B ∈ S(A) et C ∈ S(A),
4. si B ∧ C ∈ S(A), alors B ∈ S(A) et C ∈ S(A),
5. si B ⇒ C ∈ S(A), alors B ∈ S(A) et C ∈ S(A),
6. si B ⇔ C ∈ S(A), alors B ∈ S(A) et C ∈ S(A),
7. si ∀XB ∈ S(A), alors B ∈ S(A),
8. si ∃XB ∈ S(A), alors B ∈ S(A).
Définition 13. Une occurrence d’une variable X dans une formule A est liée si il existe
une sous-formule de A de la forme ∃XB ou ∀XB, B étant une formule. Dans le cas
contraire, elle est dite libre.
Définition 14. Un énoncé est une formule sans occurrence libre de variable.
33
L’interêt de cette définition est que la valeur de vérité d’un énoncé est ainsi indé-
pendante de toute variable. Si on remplace donc, dans un énoncé, une variable par une
constante, cela n’a de sens que si il y a une occurrence libre de cette variable dans
l’énoncé. On peut exprimer cette idée de façon plus générale, en remplaçant une variable
par un terme dans lequel ne figure aucune variable, un tel terme sera appelé terme clos.
Intuitivement, un terme clos est un «terme constant». On va écrire, si A est une formule
(pas forcément un énoncé) et T un terme clos :
A[X := T ]
|= A
Et il faut comprendre par cette notation que tout modèle M est modèle de A. De même
que l’on a définit la notion de loi logique, il est naturel de définir la notion de contradiction,
une contradiction est simplement un énoncé faux dans tout les modèles, et l’on peut
noter :
2A
Il reste à définir de façon précise la notion de modèle.
34
2.7.2 Notion de modèle
Nous allons énoncer une série de définitions qui va nous amener à définir rigoureuse-
ment la notion de modèle.
Définition 15. Soit U un ensemble, un n-uple de U est une suite ordonnée de n éléments
de U .
Notation : si les éléments de U sont notés u1 , u2 , u3 , ..., alors (u1 , u2 , ..., un ) est un
n-uple de U . Un élément de U peut être vu comme un 1-uple, et un 2-uple est aussi
appelé un couple. On va aussi convenir que l’on a :
Définition 16. Soit U un ensemble, une relation n-aire sur U est un sous-ensemble de
U n.
Définition 17. Soit E et F des ensembles, une fonction n-aire définie sur E et à valeur
dans F , est un ensemble de couples (a, b) tel que a appartienne à E n et b appartienne à
F , et tel que pour un élément donné x de E n , il existe au plus un élément y de F , tel
quel le couple (x, y) soit élément de la fonction.
Définition 18. Soit E et F des ensembles, une application n-aire définie sur E et à
valeur dans F , est une fonction définie sur E et à valeur dans F tel que pour tout élément
x de E n , il existe un élement y de F , tel que le couple couple (x, y) soit élément de la
fonction.
Définition 19. Soit L un langage prédicatif, une L-structure est la donnée d’un ensemble
non vide U appelé univers, d’un ensemble de relations sur U appelé prédicats, et d’un
ensemble d’appplications définies sur U et à valeur dans U . De plus, pour tout n, si L
possède des symboles prédicatifs n-aires, il doit y avoir dans la L-structure au moins un
prédicat n-aire ; de même, pour tout n, si L possède des symboles fonctionnels n-aires, il
doit y avoir dans la L-structure au moins une application n-aire.
Définition 20. Soit L un langage prédicatif, U l’univers d’une L-structure, une inter-
prétation de L associe :
35
1. à chaque symbole propositionnel de l’alphabet de L une et une seule valeur de
vérité : T ou F ,
2. à chaque constante de l’alphabet de L un élément de U ,
3. à chaque symbole prédicatif n-aire de l’alphabet de L un prédicat n-aire de la
L-structure,
4. à chaque symbole fonctionnel n-aire de l’alphabet de L une application n-aire de
la L-structure.
Nous arrivons enfin à la définition d’un modèle :
Définition 21. Soit L un langage prédicatif, un modèle pour L est la donnée d’une
L-structure et d’une interprétation de L.
Exemple. Considérons un langage prédicatif très simple : aucun symbole propositionnel,
seulement deux symboles prédicatifs, p1 et q 1 (d’arité 1), et aucun symbole fonctionnel.
Définissons maintenant une L-structure. Comme Univers, prenons l’ensemble :
et :
Q = {chat, chien}
P correspond intuitivement à «est un animal», tandis que Q correspond intuitivement à
«est un mammifère». On va bien sûr choisir comme interprétation de L celle qui associe au
prédicat P le symbole prédicatif p1 , et au prédicat Q le symbole prédicatif q 1 . Toujours
intuitivement, la phrase (ou énoncé) suivante :
va s’écrire :
∀x(q 1 x ⇒ p1 x)
Si de plus, on convient que (par exemple) l’interprétation associe la constante a à l’élément
«ordinateur», alors la phrase :
correspond à :
¬p1 a
Autre exemple. Choisissons un langage prédicatif sans symbole propositionnel, un symbole
prédicatif binaire p2 , et un symbole fonctionnel binaire f 2 . On choisit comme Univers :
U = {0, 1, 2}
36
Et on définit un prédicat binaire :
F = {(0, 0, 0), (0, 1, 1), (0, 2, 2), (1, 0, 1), (1, 1, 2), (1, 2, 0), (2, 0, 2), (2, 1, 0), (2, 2, 1)}
devient :
∀xp2 xx
Et la phrase :
∀xp2 xf 2 xa
La phrase :
«Tout nombre peut s’exprimer comme la somme (modulo trois) de deux autres nombres.»
s’écrit :
∀x∃yzp2 xf 2 yz
37
Chapitre 3
38
que les segment soient superposées. Si on choisit un point quelconque sur le petit segment,
il est a une certaine distance de O (distance comprise entre zéro et un centimètre). À
ce point on va faire correspondre un point deux fois plus éloigné de O, on aura que cet
autre point est sur le grand segment. On peut faire correspondre à chaque point sur le
petit segment un point sur le grand segment et inversement. On a donc réussi à faire ce
groupement par deux et la conclusion est là : il y a autant de points sur le grand que sur
le petit segment !
De ce genre de considérations va naître la théorie des ensembles. Parler d’ensemble
infini mène parfois à des paradoxes si on n’y prend pas garde. Cela ne veut pas dire
que ces ensembles n’existent pas (dans le sens qu’ils seraient impossibles à définir
mathématiquement) mais qu’il faudra faire bien attention.
39
On ajoute à cette axiomatique un axiome supplémentaire : l’axiome du choix, et on parle
donc souvent de l’axiomatique ZFC.
40
Ceci peut s’écrire en utilisant le langage de la logique (voir section précédente) :
(X ∈ A ⇒ X ∈ B) ∧ (X ∈ B ⇒ X ∈ A)
qui n’est jamais que la traduction en langage mathématique de ce que nous avons écrit
en français.
Or nous avons vu dans le cours de logique ce que nous avions appelé une tautologie
remarquable :
(A ⇔ B) ⇔ ((A ⇒ B) ∧ (B ⇒ A))
qui dit que si A implique B et B implique A, alors A est équivalent à B. On peut
appliquer cela à l’expression que nous venons d’écrire et on obtient :
X∈A⇔X∈B
Si cette condition est remplie quel que soit l’ensemble X (c’est à dire dans le langage de
la logique : ∀X, X ∈ A ⇔ X ∈ B) alors on a que A = B et on peut écrire l’axiome en
langage formel :
41
Sur ce dessin, on a représenté un ensemble A quelconque ainsi que deux de ses
éléments. Ici il faut faire attention car le dessin est trompeur : on pourrait croire que les
deux «patates» en rouges sont des sous-ensembles alors que ce sont des éléments de A.
L’un des éléments de A est un ensemble noté D dont l’un des éléments est C. L’axiome
nous dit qu’il existe un ensemble B qui est l’ensemble des éléments des éléments de A.
Cet ensemble B est représenté sur ce dessin en pointillés bleu, on a en particulier C ∈ B.
À partir de ce dessin, on peut essayer de trouver la formulation formelle de l’axiome.
Soit donc un ensemble A quelconque. On doit exprimer qu’il existe un ensemble B qui
soit l’ensemble des éléments des éléments de A. Pour cela, considérons un ensemble
quelconque C. On a, si C appartient à B, que C appartient à un élément de A. Appelons
D cet élément. On a :
D ∈A∧C ∈D
Cet ensemble D n’existe que si il existe un ensemble C appartenant à B. On peut intégrer
tout cela en une expression logique qui est donc :
C ∈ B ⇒ ∃D, D ∈ A ∧ C ∈ D
Cela marche aussi dans l’autre sens, c’est à dire que si D est un ensemble appartenant à
A alors il existe un ensemble B tel que C appartient à B et à D (voir encore schéma).
On peut donc écrire :
∃D, D ∈ A ∧ C ∈ D ⇒ C ∈ B
42
Comme pour l’axiome précédent, on peut invoquer la tautologie :
(A ⇔ B) ⇔ ((A ⇒ B) ∧ (B ⇒ A))
qui permet comme nous l’avons vu de remplacer deux implications par une équivalence.
On peut écrire l’axiome de manière formelle :
On verra un peu plus tard comment on définit l’union de deux ensembles (et surtout
montrer que l’union de deux ensembles est un ensemble) et on se servira de cet axiome.
A⊂B
On introduit donc un nouveau symbole : «⊂». Il est possible de le définir avec les notations
vues en logique. En regardant la définition de la notion de sous-ensemble, on peut se
rendre compte que la formule :
∀X, X ∈ A ⇒ X ∈ B
43
3.4.4 Écriture formelle
En langage formel, l’axiome s’écrit :
44
On dit par exemple que l’élément «Christophe Roland» est envoyé sur les élément
«Windows» et «Linux» par cette relation. On dit que les éléments «Windows» et «Linux»
sont les images de «Christophe Roland», et que «Christophe Roland» est un antécédent
de «Windows» et «Linux» Pour donner d’autres exemples, «OSX» est l’image de «Steve
Jobs» et «Hurd» n’a pas antécédents.
Une relation fonctionnelle est un type particuliers de relation : une relation fonction-
nelle est une relation où chaque élément a au plus une image (on dit bien «au plus» car
on peut avoir des éléments qui n’ont pas d’image). On voit bien que l’exemple donné
n’est pas une relation fonctionnelle car «Christophe Roland» a deux images.
45
plus une image. On écrit alors :
∀A1 , ..., An , ∀X, ∀Y, ∀Y 0 , ((P (X, Y, A1 , ..., An ) ∧ P (X, Y 0 , A1 , ..., An )) ⇒ Y = Y 0 )
Une fois ceci établi, il reste à dire que l’image d’un ensemble A par une fonction est un
ensemble (on va le noter B), c’est à dire que quel que soit X appartenant à A, son image
par la relation fonctionnelle appartient à B et que tout élément de B a un antécédent
dans A. Pour cela, considérons un élément Y ∈ B. Il a un antécédent X c’est à dire :
Y ∈ B ⇔ ∃X(X ∈ A ∧ P (X, Y, A1 , ..., An ))
On remet tout cela ensemble pour écrire l’axiome :
Pourquoi dit-on que nous avons un schéma d’axiomes ? C’est simple : il y a autant
d’axiomes que de prédicats P , on a en réalité un nombre infini d’axiomes.
3.5.5 Conséquences
Parlons maintenant des conséquences de cet axiome.
Schéma de compréhension
On peut tout d’abord trouver un cas particuliers de cet axiome : le cas où X = Y = Y 0 .
On a que le début de l’axiome :
P (X, Y, A1 , ..., An ) ∧ P (X, Y 0 , A1 , ..., An ) ⇒ Y = Y 0
devient toujours vrai car A ⇒ B est toujours vrai quand B est vrai. On peut donc tout
simplement supprimer cette partie. De même, la lettre Y peut être remplacée par X
(pour la simplicité) et P (X, Y, A1 , ..., An ) devient : P (X, X, A1 , ..., An ). On peut ensuite
remplacer ce prédicat par un autre prédicat P 0 ayant un argument en moins en posant :
P (X, X, A1 , ..., An ) ⇔ P 0 (X, A1 , ..., An )
On a donc (le prédicat P 0 est renommé P car il n’y a plus de confusion possible) :
∀A1 , ..., An , ∀A, ∃B, ∀X, (X ∈ B ⇔ (X ∈ A ∧ P (X, A1 , ..., An )))
Ce résultat est souvent appelé «schéma d’axiome de compréhension» mais comme
on peut le démontrer, il est préférable de ne pas le considérer comme un axiome. On
l’appellera tout simplement schéma de compréhension (et on le considère comme un
théorème).
On va maintenant parler des conséquences du schéma de compréhension.
46
Définition en compréhension
Si vous le relisez bien, vous pouvez remarquer que l’on peut l’énoncer ainsi : soit
un ensemble A et une propriété P , il existe un ensemble B d’éléments de A vérifiant la
propriété P . C’est à dire qu’on peut définir un ensemble B comme ceci :
Il est possible à partir de cet axiome de démontrer ce que l’on appelle parfois le
«schéma d’axiome de compréhension». Il peut s’énoncer ainsi : soit un ensemble A et une
propriété P , il existe un ensemble B d’éléments de A vérifiant la propriété P . C’est à
dire qu’on peut définir un ensemble B comme ceci :
1. on donne un ensemble A dont B sera un sous-ensemble,
2. on donne une propriété P pour définir quels seront les éléments de B parmi les
éléments de A.
Imaginons par exemple que l’on ait un ensemble A qui contienne les éléments suivants :
1, 2, 3, 4, 5. Si on a une propriété P qui veut dire : «strictement plus grand que 3», on
peut alors définir l’ensemble B en utilisant le schéma de compréhension qui contiendra
les éléments 4 et 5.
Ensemble vide
On peut à partir de cela trouver un autre résultat. Si on a un ensemble A quelconque,
on peut définir un ensemble (que l’on va noter ∅) avec la propriété P : «X 6= X» avec le
schéma de compréhension. Comme il n’existe aucun élément qui puisse satisfaire à P ,
l’ensemble B est vide, il n’a aucun éléments. L’ensemble vide est donc bien un ensemble
au sens des axiomes ZFC.
Remarque : il faut pour cela que A existe dans le modèle de la théorie des ensembles,
mais cela est assuré car en logique des prédicats on ne considère que des modèles non
vide : il existe donc au moins un ensemble à partir duquel on peut définir l’ensemble vide.
Théorème de la paire
À partir du schéma d’axiomes de remplacement, on peut faire une autre déduction :
ce que l’on nomme souvent «l’axiome de la paire» mais que nous n’allons pas considérer
comme un axiome car on va le démontrer, et nous allons appeler ce résultat «théorème
de la paire». Attention, vous ne rencontrerez cette expression pratiquement que sur ce
site internet, car c’est historiquement un axiome.
Le théorème de la paire peut s’énoncer ainsi : soit deux ensembles A et B, il existe
un ensemble C qui admet A et B comme élément - et seulement ceux ci. Démonstration :
on sait que l’ensemble vide existe. Si nous appliquons l’axiome de l’ensemble des parties
sur cet ensemble, on a que l’ensemble qui contient comme seul élément l’ensemble vide
existe. En effet, le seul sous-ensemble de l’ensemble vide est l’ensemble vide.
On a donc un ensemble qui a ∅ comme seul élément, et on va noter cet ensemble E.
On applique une deuxième fois l’axiome de l’ensemble des parties sur E cette fois. On a
donc comme résultat qu’il existe un ensemble qui contient deux éléments : l’ensemble
vide et l’ensemble E et on va noter cet ensemble E 0 .
47
C’est là qu’on doit appliquer le schéma d’axiome de remplacement. Soit deux ensemble
A et B. On utilise une relation fonctionnelle P (X, Y ) définit comme ceci :
P (X, Y ) ⇔ ((X = ∅ ∧ Y = A) ∨ (X = E ∧ Y = B))
On peut facilement voir que cette relation est bien fonctionnelle. Pour ceux qui ont du
mal avec cette expression logique, il faut juste se dire que A est l’image de ∅ et que B est
l’image de E. On applique donc cette relation sur l’ensemble E 0 :
1. comme ∅ ∈ E 0 , par la relation P son image est A,
2. comme E ∈ E 0 , par la relation P son image est B.
Et on obtient l’ensemble qui contient A et B comme seuls éléments et c’est bien un
ensemble à cause du schéma d’axiome de remplacement.
48
3.6.5 Écriture formelle
En langage formel, l’axiome s’écrit :
3.6.6 Conséquences
Il reste à discuter des conséquences de cet axiome.
Nous savons que l’ensemble vide appartient à ω. L’axiome nous dit encore que puisque
∅ ∈ ω, ∅∪ {∅} ∈ ω mais on a (par définition de l’union et de l’ensemble vide) ∅ ∪ {∅} = {∅}
et donc {∅} ∈ ω (rappelons que l’on note {X} l’ensemble qui contient X comme unique
élément).
Pour pousser le raisonnement plus loin on doit avoir des notations plus simples. On
va donc noter 0 = ∅. On a aussi l’ensemble 0 ∪ {0} dans ω, ensemble que nous allons
noter 1. On va dire que le successeur de 0 est 1, et on peut définir le successeur de 1 qui
est 1 ∪ {1} et qu’on note 2 et ainsi de suite. On a donc :
— 0 = ∅,
— 1 = 0 ∪ {0} = {0},
— 2 = 1 ∪ {1} = {0} ∪ {1},
— 3 = 2 ∪ {2} = {0} ∪ {1} ∪ {2},
— 4 = 3 ∪ {3} = {0} ∪ {1} ∪ {2} ∪ {3},
— ... ainsi de suite.
On peut donc considérer les nombres entiers comme des ensembles : chaque nombre
est l’ensemble de tous les nombres entiers qui le précèdent. Par exemple l’ensemble
3 = {0} ∪ {1} ∪ {2} contient comme éléments les nombres 0, 1 et 2 (définition de l’union).
On sait donc qu’il existe un ensemble ω qui contient les éléments 0, 1, 2, 3, ... mais
il est hâtif de dire qu’il ne contient que des nombres. Rien dans l’axiome ne permet
d’affirmer cela. Pourtant, le fait qu’un tel ensemble existe ne fait pas de doute car cet
ensemble est un sous-ensemble de ω. Cette remarque ne suffit cependant pas à définir cet
ensemble de manière formelle. On verra cependant dans la partie «Nombres naturels»
que l’on peut définir cet ensemble en compréhension.
49
3.7.2 Intersection
On considère deux ensembles A et B. L’intersection de A et B est l’ensemble qui
contient tout les éléments qui appartiennent à la fois à A et à B et on le note A ∩ B.
Pour définir cet ensemble de manière rigoureuse, on utilise le schéma de compréhension.
On a vu que pour définir un ensemble en compréhension, il faut un ensemble et une
propriété. Dans le cas de l’intersection, il suffit d’utiliser l’ensemble A ∪ B et la propriété
P (X) ⇔ (X ∈ A ∧ X ∈ B) pour que X appartienne à la fois à A et à B.
∀A, A 6= ∅ ⇒ ∃B(B ∈ A ∧ A ∩ B = ∅)
3.8.2 Inclusion
Rappelons que si tout les éléments de A sont aussi élément de B, on dit que A est
inclus dans B et qu’il est un sous-ensemble de B et on note :
A⊂B
On peut écrire aussi :
B⊃A
On dit aussi que B est un sur-ensemble de A. On rappelle aussi que l’on peut formaliser
cette notion :
A ⊂ B ⇔ (∀X, X ∈ A ⇒ X ∈ B)
50
3.8.3 Propriétés
Deux propriétés faciles à démontrer : Première propriété :
(A ⊂ B ∧ B ⊂ C) ⇒ A ⊂ C
Démonstration :
On utilise la définition de l’inclusion, on peut réécrire :
(A ⇒ B) ∧ (B ⇒ C) ⇒ (A ⇒ C)
Et en comparant les deux expressions on voit qu’elle sont équivalentes ce qui achève la
démonstration. Deuxième propriété :
(A ∈ B ∧ B ⊂ C) ⇒ A ∈ C
∀X, (A ∈ B ∧ (X ∈ B ⇒ X ∈ C)) ⇒ A ∈ C
E = {a1 , a2 , ..., an }
On peut donc définir un ensemble en listant tout ses éléments entre des accolades (on dit
alors que l’on défini l’ensemble en extension).
Il faut maintenant prouver que l’on a vraiment le droit de faire cela c’est à dire que
c’est compatible avec les axiomes vus précédemment.
Tout d’abord, nous avons montré que l’on pouvais avoir un ensemble du type {a1 }.
Nous avons montré aussi que nous pouvions avoir des ensembles ayant deux éléments :
51
{a1 , a2 } grâce au théorème de la paire. Cependant, il faut que cette définition soit valide
pour un nombre quelconque d’éléments.
Pour cela, il suffit simplement de faire appel à l’union de deux ensembles. Et il suffit
d’écrire, pour définir formellement cette notation :
Gràce à l’axiome d’extensionnalité, on sait qu’un ensemble ne dépend que de ses éléments
ce qui montre qu’on définit bien un ensemble unique et ce qui valide la définition en
extension.
Idempotence
A∪A=A
Commutativité
A∪B =B∪A
Associativité
A ∪ (B ∪ C) = (A ∪ B) ∪ C
Définition
On a déjà définit l’union de deux ensembles, rappelons que si on a deux ensembles
A et B, on forme l’ensemble {A, B} gràce à l’axiome de la paire, et on applique à cet
ensemble l’axiome de la réunion : on obtient l’ensemble A ∪ B noté par la lettre D dans
l’axiome de la réunion.
52
Propriétés
On peut déjà lister quelques propriétés de l’union. On peut toutes les prouver avec
les axiomes vues précédemment.
Idempotence
A∪A=A
Commutativité
A∪B =B∪A
Associativité
A ∪ (B ∪ C) = (A ∪ B) ∪ C
3.10.2 Intersection
Définition
Si on a deux ensembles A et B, on forme l’ensemble A ∩ B qui est l’ensemble des
éléments qui appartiennent à la fois à A et à B. On le définit en compréhension :
A ∩ B = {X ∈ A ∪ B|X ∈ A ∧ X ∈ B}
Propriétés
Elles sont similaires à celle de l’union.
Idempotence
A∩A=A
Commutativité
A∩B =B∩A
Associativité
A ∩ (B ∩ C) = (A ∩ B) ∩ C
3.10.3 Distributivité
On peut énoncer encore deux propriétés de l’union et de l’intersection :
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
Et :
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
53
3.11 Relations binaires
On peut maintenant voir de manière formelle la notion de relation déjà abordée de
manière naïve.
Avec cette définition on a bien (a, b) 6= (b, a) car {{a}, {a, b}} =
6 {{b}, {b, a}}.
A × B = {(1, 0), (1, 2), (1, 4), (2, 0), (2, 2), (2, 4)}
A × B = {(a, b) ∈ P (P (A ∪ B))|a ∈ A ∧ b ∈ B}
54
3.11.3 Relations binaires
Définition
On a déjà vu cette notion de manière naïve, il est temps d’en donner une définition
formelle dans le cadre de la théorie des ensembles. On va dire (sans surprise encore une
fois) qu’une relation binaire est un ensemble.
On sait déjà qu’une relation binaire met en relation deux ensembles. On va donc
considérer une relation comme un ensemble de couples. Par exemple si la relation est
notée R, et si a et b sont en relation, alors on a (a, b) ∈ R.
Supposons donc qu’on ait deux ensembles A et B. On a une relation R entre ces
deux ensembles. Il s’agit d’un ensemble de couple (a, b) avec a ∈ A et b ∈ B, donc un
sous-ensemble de A × B.
On peut alors considérer que tout sous-ensemble de A × B est une relation binaire.
L’ensemble des relations binaires entre A et B sera noté A B. On a évidemment :
A B = P (A × B)
Inverse
On a une relation R entre A et B. On peut définir l’inverse de R, que l’on note R−1 ,
qui est la même relation en échangeant les ensembles A et B, c’est à dire que si le couple
(a, b) appartient à R alors (b, a) appartient à R−1 . On a donc :
Composée
Si on a une relation R de A vers B et une relation R0 de B vers C, alors on peut
définir la composée de R et R0 que l’on note R ◦ R0 qui est une relation de A vers C. Si
55
par exemple on a un élément a ∈ A en relation par R avec un élément b ∈ B et que cet
élément est en relation par R0 avec un élément c ∈ C, alors a et c sont en relation par
R ◦ R0 .
On définit cet ensemble en compréhension :
R ◦ R0 = {(x, z) ∈ A × C|∃y, ((x, y) ∈ R ∧ (y, z) ∈ R0 )}
3.12.2 Application
Une application est un type particuliers de fonction : il s’agit d’une fonction où tous
les éléments de l’ensemble de départ on une image. Si A est l’ensemble de départ, on a :
Dom(f ) = A
3.12.3 Injection
Une injection est un type particuliers d’application : tous les éléments de l’ensemble
d’arrivée on au plus un antécédent. C’est à dire que :
y ∈ Im(f ) ⇒ ∃!x, (x, y) ∈ f
3.12.4 Surjection
Une surjection est un type particuliers d’application : tous les éléments de l’ensemble
d’arrivée on au moins un antécédent. C’est à dire que si B est l’ensemble d’arrivée :
Im(f ) = B
3.12.5 Bijection
Une bijection est une application à la fois injective et surjective. Dans le cas d’une
bijection, chaque élément de l’ensemble de départ a une et une seule image et chaque
élément de l’ensemble d’arrivée a un et un seul antécédent. On peut donc conclure que si
il existe une bijection entre A et B, alors ils ont le même nombre d’éléments.
56
3.12.6 Loi de composition interne
Définition 22. Soit E un ensemble, une loi de composition interne sur E est une
application de E × E dans E dans E.
Une loi de composition interne est souvent noté avec un simple symbole comme ◦.
On note, si l’image de (a, b) ∈ E est c ∈ E :
a◦b=c
Définition 23. Soit E un ensemble, ◦ une loi de composition interne sur cet ensemble,
on dit que cette loi est commutative si :
∀a, b ∈ E, a ◦ b = b ◦ a
Définition 24. Soit E un ensemble, ◦ une loi de composition interne sur cet ensemble,
on dit que cette loi est associative si :
∀a, b, c ∈ E, a ◦ (b ◦ c) = (a ◦ b) ◦ c
Définition 25. Soit E un ensemble, ◦ une loi de composition interne sur cet ensemble,
on dit qu’il existe un élément neutre pour ◦ si :
∃n ∈ E : ∀a ∈ E, a ◦ n = a
Définition 26. Soit E un ensemble, ◦ une loi de composition interne sur cet ensemble,
on dit qu’il existe un élément neutre pour ◦ si :
∃n ∈ E : ∀a ∈ E, a ◦ n = a
Définition 27. Soit E un ensemble, ◦ une loi de composition interne sur cet ensemble
qui admet un élément neutre n, on dit qu’il existe un élément symétrique pour chaque
élément de E si :
∀a ∈ E, ∃a∗ ∈ E : a ◦ a∗ = n
Définition 28. Soit E un ensemble, ◦ et • deux lois de composition interne sur cet
ensemble, on dit qu’on a distributivité de ◦ par rapport à • si :
∀a, b, c ∈ E, a ◦ (b • c) = (a ◦ b) • (a ◦ c)
57
Chapitre 4
Nombres
58
définir le raisonnement par récurrence, technique de démonstration très puissante.
Nous avons déjà introduit le concept de nombre naturel en terme d’ensemble. On
arrivait à construire à partir de l’axiome de l’infini un ensemble qui contenait des nombres
entiers avec des propriétés étranges comme 1 ∈ 2 car on avait considéré les nombres
comme des ensembles. On avait dit alors que l’on pouvait prouver qu’il existe un ensemble
qui ne contient que des nombres puisqu’on n’était pas sûr que c’était le cas de l’ensemble
ω. Ce ce que nous allons faire maintenant.
N = {n ∈ ω|∀E, P (E) ⇒ n ∈ E}
On a donc l’ensemble :
N = {0, 1, 2, 3, 4, ...}
On dit que c’est l’ensemble des nombres naturels.
59
Nous avons vu en théorie des ensemble, que l’on peut définir la notion de successeur
dans l’ensemble des naturels (voir l’axiome de l’infini). Ainsi, à chaque nombre x ∈ N, on
peut associer «l’élément suivant» que l’on note s(x).
On a donc tout simplement : s(0) = 1, s(1) = 2, ...
∀a, b ∈ N, a < b ⇔ a ∈ b
∀a, b ∈ N, a 6 b ⇔ (a ∈ b ∨ a = b)
On va dire que nous définissons ainsi une relation d’ordre sur N car on introduit l’idée
d’«ordre» entre les éléments.
Il reste à définir ce qu’est vraiment une relation d’ordre de manière générale, car on
rencontrera ce type de relation dans d’autres ensembles que dans N. On va voir qu’en
fait «6» est une relation d’ordre et que «<» est une relation d’ordre strict.
4.2.1 Définition
Sans surprise, on va définir la relation d’ordre comme une relation binaire.
Définition 30. On dit que la relation binaire R est une relation d’ordre sur un ensemble
E, si elle est réflexive, antisymétrique et transitive (si x et y sont en relation, on écrit
xRy) :
1. réflexive : ∀x ∈ E, xRx,
2. antisymétrique : ∀(x, y) ∈ E 2 , (xRy) ∧ (yRx) ⇒ x = y,
3. transitive : ∀(x, y, z) ∈ E 3 , (xRy) ∧ (yRz) ⇒ xRz.
On peut facilement se rendre compte que «6» est une relation d’ordre.
On définit aussi la notion de relation d’ordre strict : une relation d’ordre strict est
une relation binaire irréflexive et transitive. On dit qu’une relation est irréflexive si aucun
élément n’est en relation avec lui-même :
∀x ∈ E, ¬(xRx)
On peut facilement se rendre compte que «<» est une relation d’ordre strict.
60
4.2.2 Ordre totale et partiel
Définition 31. Si R est une relation d’ordre sur l’ensemble E et qu’elle vérifie :
61
4.3.3 Démonstration
Il reste à démontrer cette formule. On suppose donc que P (0) et ∀n ∈ N, P (n) ⇒
P (s(n)) sont vrais et on démontre ∀n ∈ N, P (n). On va le faire par l’absurde. Supposons
qu’il existe n ∈ N tel que P (n) soit faux. On considère le plus petit n tel que P (n) soit
faux, et on le note m. m 6= 0 car on sait que P (0) est vrai. m est donc le successeur d’un
entier p. p est donc plus petit que m et donc P (p) est vrai. On a donc par hypothèse que
P (s(p)) = P (m) est vrai et on a une contradiction.
4.4 L’addition
4.4.1 Définition
Tout le monde connaît ce qu’est l’addition de deux nombres naturels depuis l’école
primaire. On va essayer donc d’aller plus loin et de définir cette notion de manière
formelle. On va donc définir l’addition comme une fonction.
Imaginons que nous voulons additionner deux nombres a et b. On va dire que b est
l’argument de la fonction «addition», c’est à dire que la fonction s’applique sur b et non
sur a. En fait pour chaque a différents, on a une fonction différente.
C’est à dire que pour tout a ∈ N, on a une fonction fa de N vers N, que nous devons
définir uniquement à partir des seules notions que nous avons déjà définies dans N, on va
donc définir cette notion à partie de la notion de successeur.
On définit donc l’addition comme ceci :
(
fa (0) = a
∀n ∈ N, fa (s(n)) = s(fa (n))
Et on note : fa (n) = a + n. Les deux propriétés qui définissent l’addition peuvent donc
s’écrire :
a+0=a
et :
∀n ∈ N, a + s(n) = s(a + n)
Ces deux seuls propriétés suffisent à définir l’addition.
On remarque que l’on peut facilement démontrer quelque chose d’intuitif : ∀n ∈
N, s(n) = n + 1. On sait que :
∀n ∈ N, a + s(n) = s(a + n)
donc pour n = 0 on a :
a + s(0) = s(a + 0)
donc :
a + 1 = s(a)
On peut donc aussi réécrire la deuxième propriété comme ceci : a + (n + 1) = (a + n) + 1.
On va maintenant énoncer une série de propriétés de l’addition.
62
Théorème 2. L’addition est associative, c’est à dire que :
∀a, b, c ∈ N, (a + b) + c = a + (b + c)
On faire cette démonstration par récurrence sur c. On doit donc tout d’abord prouver
que c’est vrai pour c = 0 :
(a + b) + 0 = a + (b + 0) ⇒ a + b = a + b
ce qui est vrai car on sait que a+0 = a. Il reste à montrer que si on a : (a+b)+c = a+(b+c)
pour un certain c, alors on a : (a + b) + (c + 1) = a + [b + (c + 1)].
On a :
(a + b) + (c + 1) = [(a + b) + c] + 1
= [a + (b + c)] + 1
= a + [(b + c) + 1]
= a + [b + (c + 1)]
On utilise la propriété : a + (n + 1) = (a + n) + 1 à la première, troisième et quatrième
ligne. On utilise l’hypothèse de récurrence à la deuxième ligne.
Théorème 3. L’addition admet un élément neutre, qui n’est autre que zéro :
∀a ∈ N, a + 0 = 0 + a = a
On sait déjà que a + 0 = a, il reste à montrer que 0 + a = a. On va le faire par
récurrence.
On a déjà que 0 + 0 = 0. On a comme hypothèse de récurrence : 0 + a = a et on doit
montrer : 0 + (a + 1) = a + 1.
0 + (a + 1) = (0 + a) + 1 = a + 1
∀a, b ∈ N, a + b = b + a
Pour démontrer cela, on doit démontrer au préalable que a + 1 = 1 + a. On va le faire
par récurrence. On a pour a = 0 : 0 + 1 = 1 + 0 ce qui est vrai car 0 est l’élément neutre.
Donc, l’hypothèse de récurrence étant a+1 = 1+a, on montre (a+1)+1 = 1+(a+1) :
(a + 1) + 1 = (1 + a) + 1 = 1 + (a + 1)
a + (b + 1) = (a + b) + 1
= (b + a) + 1
= b + (a + 1)
= b + (1 + a)
= (b + 1) + a
63
4.5 La multiplication
On utilise le même type de définition que pour l’addition.
4.5.1 Définition
Pour tout a ∈ N on a une fonction ga de N vers N définie par :
(
ga (0) = 0
∀n ∈ N, ga (n + 1) = ga (n) + a
a·0=0
∀n ∈ N, a · (n + 1) = a · n + a
∀a, b, c ∈ N, a(b + c) = ab + ac
a(b + 0) = ab = ab + a · 0
On démontre donc que a[b+(c+1)] = ab+a(c+1) sous l’hypothèse que a(b+c) = ab+ac :
Théorème 6. Associativité
(ab) · 0 = 0 = a(b · 0)
(ab)(c + 1) = (ab)c + ab
= a(bc) + ab
= a(bc + b)
= a[b(c + 1)]
64
Théorème 7. Élément neutre :
∀a ∈ N, a · 1 = a = 1 · a
∀a ∈ N, a · 0 = 0 = 0 · a
0 · (a + 1) = 0 · a + 0 · 1 = 0 + 0 = 0
Théorème 9. Commutativité :
∀a, b ∈ N, ab = ba
a(b + 1) = ab + a = ba + a = (b + 1)a
65
Chapitre 5
Algèbre linéaire
66
On a trois représentations d’une seul et unique vecteur. Ainsi, il suffit par exemple de
choisir le vecteur partant de l’origine. Les coordonnées de la pointe de la flèche suffisent
alors à spécifier un unique vecteur. Il existe donc une correspondance biunivoque (c’est à
dire une bijection) entre l’espace des points (Rn ). Ainsi, on peut même considérer les
points de Rn comme des vecteurs !
Pour des raisons évidentes, on va convenir de noter un vecteur avec une flèche au
dessus : ~v , certains auteurs choisissent plutôt de mettre en gras : v. Comme on a supposé
que l’on peut considérer les éléments de Rn , il est tentant d’écrire :
~v = (x1 , x2 , x3 , ..., xn )
Cette écriture suggère le sens que l’on pourrait donner à l’addition de deux vecteurs. Si
~v = (x1 , x2 , x3 , ..., xn ) et ~u = (y1 , y2 , y3 , ..., yn ), il est tenant d’écrire :
~v + ~u = (x1 + y1 , x2 + y2 , x3 + y3 , ..., xn + yn )
67
~ B
par A+ ~ = (6+3, 1+4) = (9, 5). Géométriquement, on voit que l’on peut soit transporter
~ de façon à le ramener sur l’extrémité de
parallèlement la flèche représentant le vecteur B
~ soit faire le contraire :
la flèche représentant le vecteur A,
C’est à dire que l’addition de deux scalaires doit avoir un sens. Bien sûr, dans notre
cas particuliers où les scalaires sont simplement des nombres réels, c’est quelque chose
d’évident, mais nous voulons pouvoir donner une définition générale plus tard.
68
De même que pour l’addition, on peut raisonnablement s’attendre à ce qu’il ait un
sens à écrire :
α(β~v ) = (αβ)~v
C’est à dire que la mutiplication de deux scalaires doit avoir un sens. Nous avons
maintenant réuni assez d’informations pour définir la notion de vecteur de façon générale.
5.1.2 Définition
Définition 32. Un corps est la donnée d’un ensemble K et de deux lois de composition
interne sur K appelées addition et soustraction notés respectivement + et ·, tel que :
1. L’addition et la mutiplication sont commutatives.
2. L’addition et la mutiplication sont associatives.
3. Existence d’un élément neutre pour l’addition, noté 0, et d’un élément neutre pour
la mutiplication noté 1.
4. Existence de l’élément symétrique pour l’addition et la multiplication. Soit α ∈ K,
son élément symétrique pour l’addition est noté (−α) et est appelé son opposé,
et son élément symétrique pour la mutiplication est noté α−1 et est appelé son
inverse.
5. La multiplication est distributive par rapport à l’addition.
Définition 33. Soit K un corps, un K-espace vectoriel est la donnée d’un ensemble
V dont les éléments sont appelés des vecteurs, et d’une loi de composition interne sur
V appelé addition vectorielle et notée + et d’une loi de composition externe appelée
multiplication scalaire et notée ·, tel que :
1. L’addition vectorielle est commutative.
2. L’addition vectorielle est associative.
3. Existence d’un élément neutre pour l’addition vectorielle, noté ~0.
4. Existence de l’élément symétrique pour l’addition vectorielle (le symétrique du
vecteur ~v étant noté(−~v )).
5. Distribution scalaire :
et :
∀~v ∈ V, ∀λ, µ ∈ K, ~v (λ + µ) = λ~v + µ~v
69
7. La multiplication scalaire est associative :
Exemple. Comme nous l’avons vu, Rn peut être vu comme un R-espace vectoriel.
L’addition vectoriel et la multiplication scalaire sont très simplement définies comme
nous l’avons vu dans notre approche intuitive.
Exemple. L’ensemble des fonctions définies sur un intervalle [a, b] de R et à valeur
dans R forme un R-espace vectoriel, la multiplication scalaire et l’addition vectorielle
étant simplement définies à partir de la multiplication et de l’addition dans R.
où les λi sont n éléments de K, est appelée une combinaison linéaire des vecteurs ~vi . Il
faut faire attention qu’il n’y a pas d’exponentiation dans la notation λi , le i ne sert qu’à
distinguer les différents λ.
Note : pour ceux qui ne sont pas familier avec ce genre de notation pour une somme,
une petite explication s’impose. Le symbole Σ est utilisé pour écrire une somme de façon
abrégée. L’écriture :
n
X
(...)
i=1
indique que l’on somme sur n termes, indicés par i, en faisant varier i entre 1 et n.
Définition 34. Soit V un K-espace vectoriel, n vecteurs ~v1 , ~v2 , ..., ~vn ∈ V sont dit
linéairement indépendants si :
70
5.2.2 Sous-espace vectoriel
Définition 35. Soit W un sous-ensemble d’un K-espace vectoriel V , W est un sous-
espace vectoriel de V si et seulement si les conditions suivantes sont satisfaites :
1. ~0 ∈ W
2. ∀~v , ~u ∈ W, ∀λ, µ ∈ K, λ~v + µ~u ∈ W
Autrement dit, un sous-ensemble W est un sous-espace vectoriel si et seulement
si le vecteur nul appartient à W , et que toute combinaison linéaire de vecteurs de W
appartient encore à W .
Théorème 10. Soit V un K-espace vectoriel, W un sous-espace vectoriel de V , alors
W est un K-espace vectoriel.
Il n’y a pas besoin de démonstration, il suffit de regarder la définition d’espace vectoriel
pour voir que ce résultat est trivial. Il y a toutefois une légère subtilité. Un espace vectoriel
n’est pas que la donnée d’un ensemble et d’un corps, mais aussi d’une loi de composition
interne et d’une loi de composition externe. Il nous faut une loi de composition interne sur
W , donc une application de W × W dans W (l’addition vectorielle). Dans le théorème,
on admet implicitement que l’on «réutilise» la loi de composition interne dans V , mais
ce n’est clairement pas la même puisque c’est une application de V × V dans V . Il faut
donc restreindre cette application à W c’est-à-dire que si G est le graphe de la loi de
composition interne sur V , alors la restriction à W a pour graphe G ∩ ((W × W ) × W ).
Un raisonnement analogue s’applique à la multiplication scalaire.
Théorème 11. Soit V un K-espace vectoriel, ~v1 , ~v2 , ..., ~vn ∈ V , l’ensemble W des
combinaisons linéaires de ces vecteurs est un sous-espace vectoriel de V .
Démonstration. Il suffit de vérifier les critères donnés au théorème précédent. Vérifions
d’abord le deuxième critère. On a par hypothèse :
n
X
n
∀w 1 2
~ ∈ W, ∃λ , λ , ..., λ ∈ K : w
~= λi~vi
i=1
et donc :
n
X n
X n
X
αw
~ 1 + βw
~2 = α λi1~vi + β λi2~vi = (αλi1 + βλi2 )~vi ∈ W
i=1 i=1 i=1
où w ~ 2 ∈ W et α, β ∈ K. On voit que αw
~ 1, w ~ 1 + βw
~ 2 est bien une combinaison linéaire
i i
des ~vi (avec les cœfficients αλ1 + βλ2 ) et donc appartient à W .
Vérifions maintenant le deuxième critère. Il suffit de montrer que pour tout ~v , on
a 0~v = ~0 (rappelons que nous avons noté 0 l’élément neutre de l’addition dans K, et ~0
l’élément neutre de l’addition dans V ). Il faut d’abord vérifier que l’on a bien un seul
élément neutre, notons ~e un éventuel élément neutre différent de ~0, on aurait alors :
~e = ~e + ~0 = ~0
71
L’élément neutre est donc unique. On a donc :
~v + 0~v = (1 + 0)~v = ~v
la démonstration.
On dit (dans le cas du théorème) que les vecteurs ~vi engendrent V si W = V , sinon
on dit que le sous-espace W est engendré par les vecteurs ~vi .
5.2.3 Base
Définition 36. Soit V un K-espace vectoriel, on dit que les vecteurs ~v1 , ~v2 , ..., ~vn ∈ V
forment une base de V si et seulement si ils sont linéairement indépendants et s’ils
engendrent V .
Théorème 12. Soit V un K-espace vectoriel, {~e1 , ~e2 , ..., ~en } une base de V , et ~v ∈ V
un vecteur, alors il existe un et un seul ensemble de n scalaires {λ1 , λ2 , ..., λn } tel que :
n
X
~v = λi~ei
i=1
Démonstration. Tout d’abord, comme {~ei } est une base, alors par définition n’importe
quel vecteur de V peut s’écrire comme une combinaison linéaire des vecteurs ~ei , il existe
donc au moins un ensemble de scalaires {λi }. Montrons qu’il n’en existe pas d’autre.
Supposons en effet le contraire. On aurait un ensemble {µi } différent de l’ensemble {λi },
tel que :
n
X n
X
i
~v = λ ~ei = µi~ei
i=1 i=1
Mais alors les vecteurs ~ei ne seraient pas linéairement indépendants ce qui contredirait
notre hypothèse qu’ils constituent une base.
Puisque cet ensemble de scalaires est unique, on va convenir d’appeler les λi les
composantes de ~v dans la base {~ei }. L’écriture :
n
X
~v = λi~ei
i=1
72
est appelé le développement de ~v sur la base {~ei }. On écrit alors parfois :
λ1
2
λ
~v =
..
.
λn
Écriture bien sûr un peu abusive puisqu’elle n’a de sens que dans une base précise de V .
Théorème 13. Soit V un K-espace vectoriel, {~ei } une base de V comportant n vecteur,
et {f~j } un ensemble de m vecteurs linéairement indépendants. Alors m ≤ n.
Démonstration. Comme {~ei } est une base de V , on peut développez l’un des f~j (disons
par exemple f~1 ) sur cette base :
n
f~1 =
X
λi~ei
i=1
λi
Comme les ne sont pas tous nuls, on peut supposer (quitte à ré-indexer) que λ1 6= 0, et
donc on peut exprimer ~e1 comme un combinaison linéaire des autres vecteurs ~ei et de f~1 :
n
1 ~ X λi
~e1 = f1 − ~ei
λ1 i=2
λ1
Ce qui montre qu’un vecteur quelconque de V peut toujours s’exprimer comme une
combinaison linéaire des vecteurs f~1 , ~e2 , ..., ~en . Ces vecteurs engendrent donc V .
On peut continuer de la même manière, et remplacer ~e2 par f~2 et obtenir encore un
ensemble de vecteurs qui engendrent V , puis de même en remplaçant ~e3 par f~3 ..., et ainsi
de suite. Raisonnons par récurrence en supposant m > n, et montrons que l’on arrive à
une contradiction. Supposons que nous ayons formé l’ensemble {f~1 , ..., f~k , ~ek+1 , ..., ~en },
qui engendre V . Comme il engendre V , on doit pouvoir écrire :
k n
f~k+1 = µi f~i
X X
+ ν i~ei
i=1 i=k+1
On ne peut pas avoir tout les ν i nuls, sinon on aurait exprimé f~k+1 comme une combinaison
linéaire des autres vecteurs f~i , ce qui contredirait notre hypothèse. On peut donc supposer
ν k+1 6= 0 quitte à ré-indexer. On peut alors exprimer ~ek+1 comme une combinaison linéaire
des vecteurs f~1 , ..., f~k , f~k+1 , ~ek+2 , ...~en :
k n
1 µi ~ νi
f~
X X
~ek+1 = k+1 k+1
− k+1
fi − ~ei
ν i=1
ν i=k+2
ν k+1
73
Comme {f~1 , ..., f~k , ~ek+1 , ..., ~en } engendre V , on doit pouvoir écrire pour ~v ∈ V quelconque :
k n k n k n
1 µi ~ νi
v i f~i + v i f~i + v i~ei +v k+1 k+1 f~k+1 −
X X X X X X
~v = v i~ei = k+1
fi − ~e
k+1 i
i=1 i=k+1 i=1 i=k+2
ν i=1
ν i=k+2
ν
Soit :
k n
! !
v k+1 µi v k+1 v k+1 ν i
f~i + k+1 f~k+1 +
X X
~v = v i − k+1 v i − k+1 ~ei
i=1
ν ν i=k+2
ν
Ce qui montre bien que l’ensemble {f~1 , ..., f~k+1 , ~ek+2 , ..., ~en } engendre V . Comme on
a supposé (par l’absurde) que m > n, on en arrive à former l’ensemble {f~1 , ..., f~n }
qui engendre V . Mais alors on doit avoir que f~n+1 doit pouvoir s’écrire comme une
combinaison linéaire des vecteurs f~1 , ..., f~n , ce qui contredit notre hypothèse. On a donc
bien m ≤ n ce qui achève la démonstration.
Théorème 14. Soit V un K-espace vectoriel, {~ei } une base de V comportant n vecteur,
et {f~j } une autre de base de V comportant m vecteurs, alors n = m.
Démonstration. Par le théorème précédent, appliqué à chacune des base, on doit avoir
à la fois n ≤ m et n ≥ m, donc on a m = n.
On a donc, pour un espace vectoriel donné, un nombre particuliers (le nombre de
vecteurs dans une de cet espace vectoriel), que l’on va appeler la dimension de cet espace.
Si l’espace vectoriel V a pour dimension n, on va noter :
n = dim(V )
Exemple. R2 est un R-espace vectoriel de dimension deux. En effet, il est facile de voir que
~e1 = (1, 0) et ~e2 = (0, 1) forment une base. En effet, un élément quelconque de R2 s’écrit
(a, b), qui peut être développée sur cette base : (a, b) = a~e1 + b~e2 . Par un raisonnement
similaire, on peut facilement voir que Rn est un R-espace vectoriel de dimension n.
Considérons maintenant le R-espace vectoriel des fonctions de [a, b] ⊂ R dans R.
On peut voir intuitivement qu’aucun ensemble fini de ces fonctions ne peut engendrer
l’espace vectoriel. En effet, dans une base hypothétique de cet espace, avec un nombre
fini d’éléments, si certains vecteurs de base sont des fonctions polynomiales, alors il y a
une de ces fonctions polynômes dont le degré p est supérieur ou égale à celui de toutes
les autres. On voit mal alors comment on pourrait développez une fonction polynôme de
degré q > p sur cette base.
De tels espaces vectoriels seront alors dit de dimension infinie. Sauf mention contraire,
nous travaillerons toujours avec des espaces vectoriels de dimension finie.
74
est un indice de sommation. Par exemple, le développement d’un vecteur ~v sur une base
{~ei } va s’écrire :
n
X
~v = v i~ei = v i~ei
i=1
Et on conviendra d’utiliser la même lettre pour la notation d’un vecteur et de ses
composantes (par exemple les composantes de ~v seront toujours, sauf mention contraire,
notée v i ).
Nous allons définir une nouvelle opérations, valable sur les R-espaces vectoriels (en
fait pas seulement mais nous allons ici nous restreindre à ce cas). Cette opération, appelée
produit scalaire, va faire correspondre à tout couple de vecteur un nombre réel.
5.3.2 Définition
Définition 37. Soit V un R-espace vectoriel, un produit scalaire sur V , est une fonction
de V × V dans R, que l’on note h~v , ~ui ou ~v · ~u, telle que :
1. ∀~v , ~u ∈ V, ~v · ~u = ~u · ~v (commutativité)
2. ∀~v , ~u, w
~ ∈ V, ∀λ, µ ∈ R, (λ~v + µ~u) · w
~ = λ~v · w
~ + µ~u · w
~ (linéarité)
Choisissons une base de V , qu’on va noter {~ei }, et définissons sur V un produit
scalaire. Supposons que nous connaissions tout les produits scalaires entre les différents
vecteurs de la base, notons alors gij le produit scalaire du vecteur ~ei par le vecteur ~ej :
Notez que le produit scalaire est commutatif, on doit avoir gij = gji .
Soit alors deux vecteurs, ~v = v i~ei et ~u = ui~ei , leur produit scalaire peut s’écrire :
Ce qui montre que la connaissances des nombres gij suffit pour calculer le produit
scalaire entre deux vecteurs quelconques. Il faut faire attention aussi que dans la formule
~v · ~u = gij v i uj , il y a une sommation sur deux indices : i et j. Prenons un exemple à deux
dimensions :
Définition 38. Soit V un R-espace vectoriel muni d’un produit scalaire, ce produit
scalaire est dit non-dégénéré si on a :
∀~v ∈ V, (∀~u ∈ V, ~v · ~u = 0) ⇒ ~v = ~0
Ce n’est pas toujours le cas. Supposons, en utilisant encore les produits scalaires des
vecteurs de base gij , que l’on ait (on se met en dimension deux) g11 = −1, g22 = 1, g12 =
g21 = 0, alors, le produit scalaire d’un vecteur avec lui-même donne :
~v · ~v = gij v i v j = −1v 1 v 1 + 1v 1 v 1 = 0
75
Définition 39. Soit V un R-espace vectoriel muni d’un produit scalaire, le produit
scalaire est dit défini positif si :
∀~v ∈ V, ~v · ~v > 0
Dans le cas où le produit scalaire est défini positif, on appelle la norme d’un vecteur
~v la quantité : √
||~v || = ~v · ~v
Soient deux vecteurs ~v et ~u, ils sont dit orthogonaux si leur produit scalaire est nul :
~v · ~u = 0.
Ceci nous amène alors à la définition de base orthonormée. Une base orthonormée est
une base constituée de vecteurs normés (i.e. de norme un) et telles que deux vecteurs de
bases différents soient toujours orthogonaux. Autrement dit, les nombres gij sont donnés
par : gij = 1 pour i = j, et gij = 0 pour i 6= j. Dans cette base, le produit scalaire de
deux vecteurs quelconques ~v = v i~ei et ~u = ui~ei se calcule très facilement :
X
~v · ~u = gij v i uj = v i ui
i
Par exemple, dans une base orthonormée de R3 , notons cette fois (xv , yv , zv ) les compo-
santes de ~v et (xu , yu , zu ) les composantes de ~u, alors on a :
~v · ~u = xv xu + yv yu + zv zu
La linéarité des éléments de l’espace dual nous permet de calculer son action sur un
vecteur quelconque, connaissant son action sur les vecteurs de base. En effet, on a :
en posant ωi = ω(~ei ).
Théorème 15. Soit V un K-espace vectoriel, l’espace dual de V est aussi un K-espace
vectoriel, si l’addition et la multiplication scalaire sont définies par :
1. ∀~v ∈ V, ∀ω, η ∈ V ∗ , (ω + η)(~v ) = ω(~v ) + η(~v )
2. ∀λ ∈ K, ∀~v ∈ V, ∀ω ∈ V ∗ , (λω)(~v ) = λ(ω(~v ))
76
Il suffit de vérifier les critères pour avoir un espace vectoriel pour voir que c’est
évident. Par exemple, il est clair que la combinaison linéaire de deux éléments de V ∗ est
encore un élément de V ∗ . Comme V ∗ est un espace vectoriel, ses éléments seront appelés
vecteurs duaux.
On a écrit précédemment l’action d’un vecteur dual sur un vecteur : ω(~v ) = v i ωi avec
ωi = ω(~ei ). Définissons alors la base duale {θi } de la base {~ei } en demandant que l’on
ait :
θi (~ej ) = δji
où δji est le symbole de Kronecker qui vaut 1 si i = j et 0 si i 6= j. On a alors :
On a donc :
ω = ωi θi
Ce qui justifie l’appellation de base duale, puisque tout vecteur dual peut s’exprimer
comme combinaison linéaire des vecteurs duaux {θi } et que les vecteurs duaux sont
linéairement indépendants. Pour montrer ce dernier point, notons d’abord que le vecteur
nul de V ∗ est l’application qui à tout ~v ∈ V associe le nombre zéro. Construisons alors
une combinaison linéaire des vecteurs de la base duale, faisons là agir sur un vecteur
~v ∈ V quelconque, et demandons que cette combinaison linéaire soit le vecteur nul :
λi θi (v j ~ej ) = λi v j δij = λi v i = 0
Comme ceci doit être vrai pour tout ~v ∈ V , on doit avoir tout les λi nuls. {θi } est donc
bien une base de V ∗ , et on voit immédiatement qu’il y a autant de vecteurs (duaux) dans
la base duale qu’il y en a dans la base de départ {~ei }. On a donc déjà prouvé le théorème
suivant :
dim(V ) = dim(V ∗ )
77
Lien avec le produit scalaire
Supposons que sur V on ait défini un produit scalaire. Alors, à chaque vecteur ~v on
peut faire correspondre un et seul vecteur dual v définit par :
∀~u ∈ V, v(~u) = ~v · ~u
On peut donc établir dans ce cas une bijection entre V et V ∗ . Soit alors vi les composantes
du vecteur dual correspondant au vecteur ~v = v i~ei , alors on peut écrire :
78
Chapitre 6
Trigonométrie
6.1 Introduction
La trigonométrie vient du grec «trigonos» : «triangulaire» et du grec «métron» :
«mesure», la trigonométrie se base sur des relations entre les angles et les mesures des cotés
dans les triangles. C’est une science mathématique très ancienne qui date de l’antiquité.
79
Si on prend plusieurs triangles rectangles différents mais qui ont tous un angle
identique (hors l’angle droit) on peut remarquer quelque chose d’intéressant. Lorsque
l’on divise le côté opposé par l’hypoténuse, on obtient toujours la même valeur. Cette
propriété découle du fait que tout les triangles rectangle ayant un angle identique sont
des triangles semblables.
Imaginons que nous ayons un angle α dans un triangle rectangle disons par exemple
de 30 degrés. On divise le côté opposé par l’hypoténuse et on trouve comme valeur 0,5.
On est alors assuré, à cause de la remarque précédente, que si on a n’importe quel triangle
rectangle avec un angle de 30 degrés, alors la division du côté opposé par l’hypoténuse
donne 0,5.
On peut donc dire que puisque le résultat de cette division ne dépend que de l’angle
et non du triangle, on peut associer à chaque valeur valeur possible d’un angle le nombre
qui est le résultat de cette division. Par exemple, on a dit que pour un angle de 30 degrés
ce nombre vaut 0,5. On va noter ce fait de manière mathématique comme ceci :
sin(60◦ ) = 0, 5
80
La circonférence d’un cercle de rayon R vaut 2πR. Un angle d’un radian intercepte
donc un arc de cercle d’une longueur de 1/(2π) fois la circonférence, qui correspond à un
angle de 360 degrés, donc un radian vaut :
360◦ 180◦
1c = = ≈ 57, 3◦
2π π
Le symbole «c» en exposant est l’analogue du symbole «degré» pour les radians.
Le radian est très utilisé en trigonométrie.
81
Nous avons un cercle de rayon 1, dans lequel se trouve le triangle OAB dont l’un des
angles est α. Le sinus de cet angle est comme nous l’avons vu, le côté opposé divisé par
l’hypoténuse, c’est à dire :
|AB|
sin α = = |AB| = |OS|
|OA|
Car |OA| = 1 (cercle de rayon 1), il en résulte que si on construit (de la bonne manière !)
l’angle dans un cercle unité, il suffit de faire une projection sur l’axe y pour avoir la
valeur du sinus de l’angle.
Considérons maintenant un angle β > π/2. On ne peut pas définir son sinus à partir
d’un triangle rectangle, mais dans le triangle trigonométrique, on peut le définir en
appliquant la même méthode que précédemment, on a donc :
sin β = |OS 0 |
82
Par contre, dans le cas d’un angle γ > π, on a un sinus négatif (car on est dans les valeurs
négatives de y) et donc :
sin γ = −|OS 00 |
Que se passe-t’il pour des angles supérieurs à 2π (360◦ ) ? ? Et bien c’est simple : on est
près pour un deuxième tour de cercle ! Ainsi, au fur et à mesure que l’on augmente la
valeur de l’angle, on va tourner dans le cercle de sorte que l’on retrouvera ainsi les mêmes
valeurs pour la fonction sinus : on dit que la fonction est périodique. Cela est bien visible
en regardant son graphe :
83
On a :
sin α = |OB|
Les même remarques que pour la fonction sinus s’appliquent encore ici. Le graphe de la
fonction cosinus est semblable à celui de la fonction sinus, à une translation près :
On projette donc sur une droite verticale tangente au cercle au point B = (1, 0).
84
On peut prouver que :
sin α
tan α =
cos α
En effet :
cote oppose
sin α hypothenuse cote oppose
= cote adjacent
= = tan α
cos α hypothenuse
cote adjacent
85
Chapitre 7
Analyse
7.1 Introduction
7.1.1 Les paradoxes de Zénon d’Elée
Zénon d’Elée était un philosophe grec né vers -495. Il était l’élève de Parménide et
soutenait sa doctrine : Parménide pensait que tout mouvement est impossible ou n’est
qu’illusion. C’était une conclusion basée sur des raisons assez étranges, sur l’unicité de
l’Être : Parménide affirme que la pluralité n’existe pas et par conséquent le mouvement
non plus.
Zénon va tenter de prouver ce point de vue en énonçant plusieurs paradoxes sur le
mouvement des corps. Le plus connu de ces paradoxes (et le plus difficile à résoudre) est
le fameux paradoxe d’Achille et de la tortue.
Ces paradoxes sont nombreux et sont pour la plupart assez faciles à réfuter. Voici
trois des plus célèbre de ces paradoxes :
1. Le paradoxe d’Achille et de la tortue que nous analyserons plus loin,
2. Le paradoxe de la pierre lancé vers un arbre : une pierre lancée vers un arbre ne
pourra jamais l’atteindre car avant cela elle devra parcourir la moitié du parcours,
mais pour cela elle devra d’abord parcourir la moitié de cette distance (donc le
quart de la distance totale), et ainsi de suite : la flèche n’ateindra jamais son
objectif (remarque : ce paradoxe est fondamentalement identique au précédent
comme nous le verrons),
3. Enfin, le paradoxe de la flèche en vol : imaginons une flèche en vol. A chaque
instant, elle occupe une position bien précise et si on l’observe la flèche sur un
seul instant infiniment bref, elle n’a pas le temps de bouger, et une succession
de position fixes ne peut engendrer un mouvement : la flèche ne peut donc pas
bouger ! (on reparle de ce paradoxe dans la partie «Fonction dérivée» de ce cours).
Il faut remarquer que ces «paradoxes» sont a proprement parler des sophismes.
86
7.1.2 Qu’est ce que l’analyse ?
L’analyse mathématique est l’étude rigoureuse du «calcul infinitésimal». Les termes
d’«analyse» et de «calcul infinitésimal» sont en fait des synonymes, le premier terme étant
plus moderne et tendant à remplacer le second. Mais l’expression «calcul infinitésimal»
n’a pas seulement un intérêt historique, il a aussi un certain intérêt pédagogique.
En effet, il faut essayer de comprendre qu’est ce que l’on entend par «infinitésimal».
Pour le comprendre, nous allons adopter un point de vue historique et discuter de la
forme la plus ancienne de «calcul infinitésimal», ou plus exactement, quelque chose qui y
ressemble : c’est la méthode d’exhaustion, utilisée par les grecques durant l’antiquité.
Cette méthode était par exemple utilisée pour calculer la surface d’un disque. On
encadrait un disque en construisant un polygone régulier à l’intérieur du disque, et un
autre englobant le disque. En calculant les surfaces respectives de ces deux polygones,
on savait que la surface du disque était quelque part entre ces deux valeurs. Puis, en
augmentant le nombres de côtés de deux polygones, on approchait de plus en plus de la
surface, et l’encadrement devenait de plus en plus précis.
La chose intéressante est qu’il est possible de déduire la surface exacte du disque. Il
suffit en effet d’augmenter le nombre de côtés à l’«infini», c’est à dire que l’on considère
un cercle comme un polygone régulier ayant un nombre infini de côtés, chacun de ces
côtés ayant une longueur nulle. On pourrait croire qu’une telle chose est impossible à
calculer mais nous verrons qu’il n’en est rien.
La suite du chapitre a donc deux buts : formaliser ce genre de raisonnement, et
comprendre mieux les pièges et les subtilités que l’on rencontre lorsque l’on parle d’infini.
87
]a, b] = {x ∈ R|a < x ≤ b}
[a, b[= {x ∈ R|a ≤ x < b}
]a, b[= {x ∈ R|a < x < b}
Les intervalles de type [a, b] sont dits fermés, les intervalles de type ]a, b[ sont dits ouverts
et les intervalles comme ]a, b] ou [a, b[ sont dits semi-ouverts.
Le symbole ∞, qui représente l’«infini» est utile pour représenter certains intervalles.
Par exemple, on note l’ensemble des nombres «supérieurs ou égals à deux» : [2, +∞[,
l’ensemble des nombres strictement inférieurs à 4 est ] − ∞, 4[.
On rajoute donc aux définitions faites plus haut :
7.2.2 Propriétés
On peut montrer que :
1. l’intersection de deux intervalles est encore un intervalles, par exemple ] − ∞, 10] ∩
[2, 20] = [2, 20],
2. l’union de deux intervalles n’est pas toujours un intervalle, par exemple [0, 1]∪[3, 4]
n’est pas intervalle.
88
2. Pour parcourir cette distance, Achille met une seconde, temps pendant lequel la
tortue avance d’un mètre (temps écoulés : 10+1=11 s),
3. Pour parcourir ce mètre, Achille met 0.1 s, la tortue avance donc de 10 cm (temps
écoulé : 11+1/10)
4. etc...
On peut écrire alors que le temps total pour qu’Achille rejoigne la tortue est :
1 1 1
t = 10 + 1 + + + + ...
10 100 1000
Cette somme comporte un nombre infini de termes : elle ne s’arrête jamais. Zénon en
conclut que le résultat est alors infini : Achille ne rejoindra jamais la tortue.
Autrement dit, Il fait l’hypothèse que :
+∞
X
ai = +∞
i=1
quel que soit la valeur des ai : une somme est infinie dès qu’il y a un nombre infini de
termes (tous positifs évidemment).
vach = 10vtor
et donc :
10vtor t = vtor t + 100
89
c’est une simple équation du premier degré en t qui donne :
100
t=
9vtor
100
Dans notre cas, vtor = 1m/s et donc t = = 11.111...
90
Intéressons nous donc cette fameuse somme de plus près...
Définition 41. Une suite numérique est une fonction N0 → R c’est à dire qu’ à chaque
nombre naturel n, on fait correspondre un réel an qui est le n-ième terme de la suite. Elle
est notée a1 , a2 , a3 , ... ou plus simplement :{an }n∈N
∀n ∈ N : an ≤ an+1
90
2. Une suite {an }n∈N est décroissante si l’on a :
∀n ∈ N : an ≥ an+1
lim an = 0
n→+∞
1
On peut trouver d’autre suites intéressantes. Par exemple, pour la suite an = 1 − la
n
suite est croissante et tend vers 1 :
1 2 3 5
0, , , , , ...
2 3 4 6
et on peut donc écrire :
lim an = 1
n→+∞
91
Imaginons une suite qui tende vers un nombre a. Prenons un terme an tel que n soit
très très grand (mais vraiment très !). Cela veut dire que la «distance» entre an et a est
TRÈS petite (presque nulle) :
|an − a| <
Ou :
>0
et ce fameux est choisi TRÈS petit pour montrer que cette distance entre entre an et a
est vraiment infime.
On peut aussi prendre un autre nombre an , mais ou cette fois n est encore plus grand,
et choisir un encore plus petit et ainsi de suite mais ça ne servira à rien et cela va nous
mener loin !
Pourtant l’idée d’ écrire :
|an − a| <
avec :
>0
pour montrer que a est la limite de la suite ne semble pas mauvaise mais il faut améliorer.
Comment ? On ne peut pas examiner chaque an séparément et trouver à chaque fois un
adéquat. Pourtant, on peut le faire implicitement à l’aide du quantificateur universel ! Ça
donne :
Définition 42. Une suite numérique {an }n∈N admet une limite a si :
92
7.5 Fonctions numériques
7.5.1 Introduction
La notion de fonction a déjà été vue de manière assez théorique dans le cours de théorie
des ensembles. On avait alors introduit le concept de «graphe» comme un ensemble
de couples. Dans la pratique, il est commode de représenter ces couples de manière
géométrique.
x2
Prenons un exemple : une fonction de R vers R défini comme suit : f (x) = . On
4
peut représenter le graphe de la fonction dans un système d’axe :
Chaque point de la courbe a deux coordonnées qui sont les couples du graphe.
Le graphique d’une fonction permet d’observer directement ses propriétés. Nous
allons maintenant définir quelques notions supplémentaires par rapport à ces fonctions
numériques :
1. Une fonction est croissante sur un intervalle I si :
93
7.5.2 Fonctions continues
Nous allons commencer par définir de manière formelle une fonction continue. Si vous
ne comprenez pas la définition du premier coup il ne faut pas s’inquiéter : elle n’est pas
très évidente mais j’expliquerai cette définition juste après.
On dit qu’une fonction est continue sur un intervalle si elle est continue à chaque
point de cet intervalle.
On commence par dire que l’on peut prendre n’importe quel > 0 (sous entendu :
aussi petit soit-il), et qu’il existe un nombre η (pour cette valeur de ), tel que (x
appartenant à I), si la «distance» entre x et x0 est plus petite que η, alors la «distance»
entre f (x) et f (x0 ) est plus petite que :
Pour bien montrer ce que cela veut dire, il suffit de voir une fonction non continue :
94
La fonction est ici tracée en bleu pour plus de lisibilité.
On voit bien que la fonction n’est pas continue en x0 : une fois avoir choisi un positif,
quelque soit le nombre η que l’on prend, certaine images se seront pas dans l’intervalle
]f (x0 ) − , f (x0 ) + [. Dans le schéma, un tel nombre x est en évidence, ainsi que son
image (en rouge). Même si on choisissait un autre η plus petit, on arriverai toujours à
avoir des images qui «sortent» de l’intervalle ]f (x0 ) − , f (x0 ) + [ : la fonction n’est pas
continue.
On peut définir très simplement la continuité d’une fonction sur un intervalle : une
fonction est continue sur un intervalle si elle est continue à chaque point de cet intervalle.
Si vous avez bien compris la définition d’une fonction continue, vous pouvez facilement
comprendre qu’il est facile de savoir si une fonction est continue ou pas rien qu’en regardant
son graphe : une fonction est continue si on peut la tracer sans «lever le crayon».
x2 − 1
On peut trouver facilement des exemples de fonctions non continues : f (x) =
|x − 1|
1
ou encore f (x) = ne sont pas continues sur R.
x
Si f et g sont continues sur I, alors (sur l’intervalle I) :
1. f + g est continue,
2. f · g est continue,
f
3. est continue (à condition que ∀x ∈ I, g(x) 6= 0).
g
95
7.5.3 Limites de fonction
A partir de la définition de la continuité, on peut facilement étendre le concept de
limite de suite pour le cas des fonctions. On a la définition suivante :
lim f (x) = L
x→x0
Cela veut dire que si x se rapproche de x0 (on a en effet |x − x0 | < η), alors f (x) se
rapproche de L (|f (x) − L| < ).
On va prendre un exemple numérique comme nous l’avions fait avec les suites. Prenons
x 1
par exemple, f (x) = pour faire simple. On choisit un epsilon assez petit, disons = .
2 100
Supposons que nous voulions calculer la limite en 2. Il faut choisir un η adéquat pour
que :
|x − x0 | < η ⇒ |f (x) − L| <
dans notre cas :
1
|x − 2| < η ⇒ |f (x) − L| <
100
x
et comme f (x) = :
2
x 1
|x − 2| < η ⇒ | − L| <
2 100
donc :
x 1 x 1
x−η <2<x+η ⇒ − <L< +
2 100 2 100
on multiplie par 2 la deuxième inégalité pour pouvoir «comparer» les deux inégalité :
1 1
x−η <2<x+η ⇒x− <2·L<x+
50 50
1
on peut donc prendre η = :
50
1 1 1 1
x− <2<x+ ⇒x− <2·L<x+
50 50 50 50
et en comparant les deux inégalités, on conclut que L = 1 :
x
lim =1
x→2 2
Je vous entend déjà dire : mais en fait c’est facile de calculer une limite :limx→a f (x) =
f (a) ! Eh bien non ! Ceci n’est valable que si la fonction est continue en a. Mais si la fonction
96
n’est pas continu en a, il peut quand même y avoir une limite (dans certains cas). Par
x2 − 1
exemple : f (x) = n’est pas continue en 1 (forcément, il n’y a même pas d’image en 1)
x−1
x2 − 1 (x − 1)(x + 1)
et pourtant la limite existe : limx→1 = limx→1 = limx→1 (x+1) = 2.
x−1 x−1
On a parfaitement le droit de simplifier par x − 1 ici car x n’est pas égal à 1 mais on fait
tendre x vers 1.
Tout comme nous avons définit la notion de limite d’une suite, nous allons maintenant
définir la notion de limite d’une fonction en un point. On peut se baser sur la notion
de limite d’une suite. En effet, considérons une suite de nombres que l’on va noter
x1 , x2 , x3 , ..., et imaginons que cette suite tende vers un nombre a :
lim xn = a
n→+∞
L’idée est de se demander si la suite de nombres f (x1 ), f (x2 ), f (x3 ), ... converge vers une
certaine limite. Supposons que cette suite tende vers L, on note alors :
lim f (x) = L
x→a
et on dit que «f (x) tend vers L lorsque x tend vers a». Notez que c’est juste une nouvelle
notation pour écrire :
lim f (xn ) = L
n→+∞
On peut assez facilement comprendre (et le montrer mathématiquement) que si la fonction
est continue :
lim f (x) = f (a)
x→a
On pourrait croire naïvement que cette dernière égalité est toujours vraie. Pour montrer
que ce n’est pas le cas, considérons la fonction :
x2 − 1
f (x) =
x−1
Et cherchons sa limite en 1. On sait déjà que cette limite ne peux pas être f (1), puisque
f (1) n’est pas défini (division par zéro). Alors cette limite existe t-elle ? Oui, et on peut
le voir de la manière suivante. En sachant que x2 − 1 = (x + 1)(x − 1) :
x2 − 1 (x + 1)(x − 1)
lim f (x) = lim = lim = lim x + 1 = 2
x→1 x→1 x − 1 x→1 x−1 x→1
Peut-être pensez vous que cela est faux puisque l’on divise par (x − 1) qui vaut zéro si
x = 1. Mais souvenez vous que par définition :
lim f (x) = lim f (xn )
x→1 n→+∞
Avec limn→+∞ xn = 1. On peut choisir par exemple la suite xn tel que x0 = 0.9, x1 = 0.99,
x2 = 0.999... On voit bien que cette suite tend vers 1. En fait lorsque l’on calcule :
(x + 1)(x − 1)
lim
x→1 x−1
97
c’est équivalent à calculer :
(xn + 1)(xn − 1)
lim
n→+∞ xn − 1
Or, quel que soit le xn de la suite définie plus haut, xn 6= 1 et donc xn − 1 6= 0. Il n’y a
donc pas de division par zéro.
Nous allons maintenant voir une application pratique de cette notion.
98
Plus ∆t sera petit et plus la mesure de la vitesse sera précise. On va donc utiliser une
nouvelle fois la notion de limite :
f (t + ∆t) − f (t)
v = lim
∆t→0 ∆t
(2 + ∆t)2 − 22
v = lim∆t→0
∆t
22 + (∆t)2 + 4∆t − 22
= lim∆t→0
∆t
(∆t)2 + 4∆t
= lim∆t→0
∆t
= lim∆t→0 (∆t + 4)
= 4m/s
On peut illustrer cela graphiquement. Mais avant d’aller plus loin, il peut peut être
nécessaire de faire un rappel sur la notion de pente d’une droite :
Rappel pour ceux qui ne sont pas familiers avec la notion de pente d’une droite :
prenons par exemple, la droite ci dessous :
99
On voit que cette droite «monte», on dit qu’elle a une certaine «pente». Plus la droite
«monte» plus la valeur de la pente est forte. On va maintenant montrer comment on
calcule cette pente. Observez le schéma suivant :
Le dessin est quadrillé pour une meilleur compréhension. Si on part d’un point
quelconque du graphique, on voit que si l’on avance de deux cases vers la droite, on doit
remonter ensuite d’une case pour retrouver le graphique. On dit donc que la pente de la
droite est de un demi.
100
On montre sur le dessin comment on peut calculer la pente de la droite. On choisi
deux points quelconques du graphique et on regarde la différence d’abscisse (que l’on
note ∆x) et la différence d’ordonnée ∆y. On a donc pour calculer la pente m, la formule :
∆x
m= . On voit aussi sur le dessin que le calcul de la pente donne le même résultat
∆y
quel que soit les deux points choisis.
Revenons sur la notion de nombre dérivé. Prenons une fonction f quelconque.
Considérons la droite passant par les points f (x0 ) et f (x0 + ∆x) (voir schéma ci
dessous) :
Une fonction quelconque est tracée en bleu. On prend deux points, x0 et x0 + ∆x, et
on regarde leurs images.
On peut repérer sur le graphique les points (x0 , f (x0 )) et (x0 + ∆x, f (x0 + ∆x)), et
tracer la droite passant par ces deux points. On obtient la droite en rouge sur le dessin.
f (x0 + ∆x) − f (x0 )
On a donc que la pente de la droite est : m = .
∆x
f (x0 + ∆x) − f (x0 )
On sait que le nombre dérivé est : lim∆x→0 , c’est à dire la pente
∆x
de la droite lorsque ∆x tend vers zéro. C’est à dire, si vous regardez à nouveau le schéma,
quand x0 et x0 + ∆x sont infiniment proches et donc que la droite en rouge ne touche plus
qu’un seul point du graphique : on peut dit alors que la droite est tangente au graphique.
Exemple en image :
101
√
On a tracé en bleu la fonction f (x) = x. Le nombre dérivé en x0 = 4 est (rappel :
(a + b)(a − b) = a2 − b2 ) :
f (4 + ∆x) − f (4)
α = lim∆x→0
√ ∆x √
4 + ∆x − 4
= lim∆x→0
√ ∆x √ √ √
( 4 + ∆x − 4)( 4 + ∆x + 4)
= lim∆x→0 √ √
∆x( 4 + ∆x + 4)
(4 + ∆x) − 4
= lim∆x→0 √ √
∆x( 4 + ∆x + 4)
∆x
= lim∆x→0 √ √
∆x( 4 + ∆x + 4)
1
= lim∆x→0 √ √
4 + ∆x + 4
1
=√
4+2
1
=
4
1
Si on trace la tangente en x = 4, on a donc que la pente de la droite est (voir
4
schéma).
102
df (x) f (x + ∆x) − f (x)
f 0 (x) = = lim
dx ∆x→0 ∆x
Remarque : on utilise souvent la lettre «h» au lieu de ∆x pour alléger l’écriture.
Démonstration :
Soit donc f : [a, b] 7→ R et g : [a, b] 7→ R deux fonctions dérivables. On doit dériver
f + g, donc :
(f + g)(x + h) − (f + g)(x)
(f + g)0 (x) = limh→0
h
f (x + h) + g(x + h) − f (x) − g(x)
= limh→0
h
f (x + h) − f (x) g(x + h) − g(x)
= limh→0 + limh→0
h h
= f 0 (x) + g 0 (x)
Démonstration :
Soit donc f : [a, b] 7→ R et g : [a, b] 7→ R deux fonctions dérivables. On doit dériver
f g, donc :
103
On rajoute le terme −f (x)g(x + h) pour faire apparaître la dérivée de f :
f (x + h)g(x + h) − f (x)g(x) − f (x)g(x + h) + f (x)g(x + h)
(f g)0 (x) = limh→0
h
f (x + h)g(x + h) − f (x)g(x + h) + f (x)g(x + h) − f (x)g(x)
= limh→0
h
f (x + h) − f (x) g(x + h) − g(x)
= limh→0 g(x + h) + f (x)
h h
0 0
= limh→0 (g(x + h)f (x) + f (x)g (x))
= f 0 (x)g(x) + f (x)g 0 (x)
104
7.7.4 Dérivée d’une fonction composée
Théorème 20. Soit f : [a, b] 7→ R et g : [a, b] 7→ R deux fonctions dérivables, alors
g ◦ f : [a, b] 7→ R est dérivable et :
La fonction f (x) = x2 :
f (x + h) − f (x)
f 0 (x) = limh→0
h
(x + h)2 − x2
= limh→0
h
x2 + 2xh + h2 − x2
= limh→0
h
2xh + h2
= limh→0
h
= limh→0 (2x + h)
= 2x
105
√
La fonction f (x) = x:
f (x + h) − f (x)
f 0 (x) = limh→0
√ h √
x+h− x
= limh→0
√ h √ √ √
( x + h − x)( x + h + x)
= limh→0 √ √
h( x + h + x)
x+h−x
= limh→0 √ √
h( x + h + x)
1
= limh→0 √ √
x+h+ x
1
= √
2 x
Remarquez qu’on a utilisé (a − b)(a + b) = a2 − b2 .
1
La fonction :
x
f (x + h) − f (x)
f 0 (x) = limh→0
h
1 1
−
= limh→0 x + h x
h
x − (x + h)
x(x + h)
= limh→0
h
−h
= limh→0
hx(x + h)
−1
= limh→0
x(x + h)
−1
= 2
x
n
Les fonctions du type f (x) = x avec n ∈ N :
On va montrer que f 0 (x) = nxn−1 . On sait déjà que c’est vrai pour n = 0 : (x0 )0 =
k = 0, pour n = 1 : (x1 )0 = x0 = 1 · x0 = x et pour n = 2 : (x2 )0 = 2x1 = 2x. Pour x = 3
0
et x = 4 :
(x3 )0 = (x2 · x)0 = 2x · x + x2 = 3x2
(x4 )0 = (x3 · x)0 = 3x2 · x + x3 = 4x3
On peut continuer ainsi encore très longtemps, mais on peut remarquer que si on sait
que (xn )0 = nxn−1 pour un certains n, alors on peut prouver la même formule pour n + 1
c’est à dire (xn+1 )0 = (n + 1)xn . En effet :
Et on prouve ainsi implicitement la formule pour tout n, car on sait que c’est vrai pour
n = 4 donc c’est vrai pour n = 5, et donc pour n = 6, ... C’est un raisonnement par
récurrence.
106
La fonction f (x) = sin x :
f (x + h) − f (x)
f 0 (x) = limh→0
h
sin(x + h) − sin x
= limh→0
h
x+h−x x+h+x
2 sin cos
= limh→0 2 2
h
h
2 sin 2x + h
= limh→0 2 lim
h→0 cos
h 2
h
sin
= limh→0 2 cos x
h
2
= cos x
p−q p+q
On utilise la formule sin p − sin q = 2 sin cos pour passe de la deuxième à la
2 2
sin(x)
troisième ligne, et la formule limx→0 = 1 à la fin.
x
La fonction f (x) = cos(x) :
0
π
f 0 (x) = sin −x
2 0
π π
= cos −x · −x
2 2
π
= cos − x · (−1)
2
= − sin(x)
π π
On utilise cos x = sin − x et sin x = cos −x .
2 2
La fonction f (x) = tan(x) :
0
sin x cos x cos x − (− sin x) sin x 1
(tan(x))0 = = =
cos x cos2 x cos2 x
En résumé :
k0 = 0 (xn )0 = nxn−1
x0 = 1 (sin x)0 = cos x
(x2 )0 = 2x (cos x)0 = − sin x
√ 0 1 1
x = √ (tan x)0 =
2 x cos2 x
0
1 −1
= 2
x x
107
7.9 Théorème des valeurs intermédiaires
7.9.1 Introduction
Nous allons maintenant énoncer une série de théorèmes important en analyse. Le
premier de ces théorèmes est vraiment très simple à énoncer. On considère une fonction
continue quelconque, sur un intervalle [a, b] :
On regarde les points images f (a) et f (b) sur l’axe y. Entre ces deux points, on en
choisit un, n’importe lequel, appelons-le x. Alors, le théorème dit qu’il est possible de
trouver un point c entre a et b, tel que x = f (c).
On peut en donner une illustration simple. Supposons que nous nous tenions au pied
d’une montagne, à une altitude de cent mètres au dessus du niveau de la mer. Le sommet
de la montagne se trouve lui à mille mètres au dessus du niveau de la mer. On emprunte
un chemin qui nous emmène au sommet, et disons qu’il faille douze kilomètres pour y
arriver. On peut définir la fonction «altitude» (qu’on va noter simplement f ) qui donne
l’altitude en fonction de la distance parcourue. En prenant la convention d’être à zéro au
pied de la montagne :
f (0) = 0.1
et :
f (12) = 1
en exprimant tout en kilomètres. Le théorème nous dit donc, que pour n’importe quel
altitude z comprise entre 0.1 et 1 km au dessus du niveau de la mer, correspond au moins
un point sur le chemin situé à cette altitude. C’est tout à fait logique : on passe par
toutes les altitudes intermédiaires (d’où le nom du théorème).
108
7.9.2 Énoncé
Théorème 21. Soit une fonction continue f : [a, b] → R, alors :
Notez que l’on s’assure que de traiter les cas f (a) 6 f (b) et f (a) > f (b) gràce à
l’utilisation du «ou» logique (symbole «∨»).
7.9.3 Démonstration
Nous allons tout d’abord poser que f (a) 6 f (b), le cas contraire se démontrant de
manière similaire. On considère le sous-ensemble E de [a, b], des éléments x tel que
f (x) 6 u (u étant compris entre f (a) et f (b)). On pose encore c = sup E. On peut
montrer qu’il est possible de trouver une suite d’éléments de E tendant vers c (cette
démonstration n’est pas encore sur Freesciences). Pour chaque élément xi de cette suite,
on a f (xi ) 6 u (par définition de E) ; en passant à la limite, on a donc f (c) 6 u.
On peut maintenant prouver f (c) > u, on aura donc f (c) = u et le théorème sera
démontré. Si c = b, c’est vrai car u a été choisi tel f (b) > u. Si c 6= b, on considère
l’intervalle semi-ouvert ]c, b]. Ses éléments vérifient f (x) > u, puisqu’ils n’appartiennent
pas à E, étant strictement supérieurs à sa borne supérieure. Comme précédemment, c
étant l’infimum de l’intervalle, il est limite d’une suite d’éléments de cet intervalle, par
passage à la limite, on a f (c) > u.
109
7.10 Théorème de Rolle
7.10.1 Introduction
Le théorème de Rolle est tout aussi facile à comprendre que le précédent. Sa facilité
ne doit pas faire oublier son importance dans l’élaboration rigoureuse de l’analyse ; il est
effet nécessaire en mathématique de démontrer toute assertion, aussi évident soit-elle
intuitivement.
Nous allons ici donner l’intuition sous-jacente à ce théorème, sans aller dans les détails
mathématiques. Considérons une fonction sur un certain intervalle [a, b], cette fonction
étant telle que :
f (a) = f (b)
Le théorème de Rolle nous dit alors que si la fonction est dérivable, il existe un certain
point c entre a et b tel que :
f 0 (c) = 0
Une première manière de comprendre ce résultat est de visualiser un dessin et de voir
que la «pente instantanée» de la fonction s’annule en un point. Je vous propose ici une
méthode plus «cinématique».
Nous avons vu que la vitesse en fonction du temps est la dérivée (par rapport au
temps) de la fonction de la position en fonction du temps. Imaginons une fourmi se
déplaçant sur un axe gradué, et un expérimentateur mesure sa position sur l’axe en
fonction du temps. Son mouvement se fait sur une dimension, mais peut-être assez
compliqué : elle change de vitesse, peut faire des demi-tours,... Il est possible à partir des
mesures de construire une fonction x(t) de la position en fonction du temps. Imaginons
qu’elle repasse deux fois au même endroit, par exemple au temps t = 10s et t = 20s, c’est
à dire mathématiquement :
x(10) = x(20)
Le théorème dit alors, qu’à un certain temps t∗ , entre dix et vingt secondes :
x0 (t∗ ) = 0
Mais la dérivée de x(t) donnant la vitesse, on sait donc qu’au temps t∗ , la vitesse de la
fourmi est nulle. Cela est tout à fait normal : étant repassée deux fois au même endroit,
elle a dû au moins une fois faire demi-tour, à l’instant précis où elle fait demi-tour, sa
vitesse est nulle.
7.10.2 Énoncé
Théorème 22. Soit f : [a, b] → R, une fonction continue, dérivable sur ]a, b[, et telle
que f (a) = f (b). Il existe c ∈ [a, b] tel que :
f 0 (c) = 0
110
7.10.3 Démonstration
Si la fonction est constante sur [a, b], le théorème est bien évidemment vrai. Dans le
cas contraire, la fonction passe par un certain maximum global que l’on note f (c). Le
maximum étant atteint au point c on a, quel que soit h > 0 et tel que c + h ∈ [a, b] :
f (c + h) − f (c)
≤0
h
Si fait tendre h vers zéro par valeurs positives, on peut en déduire que f 0 (c) ≤ 0.
Toutefois, on peut très bien refaire le même raisonnement avec des valeurs négative
de h, cette fois, on aurait :
f (c + h) − f (c)
≥0
h
Et donc cette fois, f 0 (c) ≥ 0. On en conclut donc que f 0 (c) = 0.
f (b) − f (a)
b−a
représente la «pente moyenne» de la fonction entre a et b. Reprenons un exemple
cinématique. On part en voiture d’un point a pour arriver au point b, la vitesse de la
voiture est susceptible de changer régulièrement pendant le voyage. En supposant que
la voiture aille en ligne droite, la distance entre les points a et b est x(tb ) − x(ta ) ; tb et
ta étant les temps de passages au points a et b respectivement. Pour calculer la vitesse
moyenne, on divise la distance parcourue par le temps tb − ta :
x(tb ) − x(ta )
vm =
tb − ta
En appliquant le théorème, on sait qu’il existe un certain temps t∗ ou la vitesse instantanée
de la voiture sera égale à sa vitesse moyenne. C’est logique : si on fait un parcours à
60 kilomètres par heure de moyenne, à un instant donné au moins on aura été à cette
vitesse.
111
7.11.2 Énoncé
Théorème 23. Soit f : [a, b] → R, une fonction continue, dérivable sur ]a, b[. Il existe
c ∈ [a, b] tel que :
f (b) − f (a)
f 0 (c) =
b−a
7.11.3 Démonstration
On pose g(x) = f (x) − αx, α étant une certaine constante réelle. On fixe cette
constante en imposant que g(a) = g(b), c’est à dire qu’on doit avoir :
f (a) − αa = f (b) − αb
f (b) − f (a)
α=
b−a
Comme g est par construction continue sur [a, b] et dérivable sur ]a, b[, et que de plus
g(a) = g(b), il satisfait aux conditions du théorème de Rolle. Il existe donc un certain
c ∈ [a, b] tel que g 0 (c) = 0. Partant de la définition de g et en dérivant, f 0 (c) s’écrit :
f (b) − f (a)
f 0 (c) = g 0 (c) + α = α =
b−a
Cela peut se comprendre de la manière suivante. La fonction g(x) est prise «en sandwich»
entre f et h, si ces fonctions tendent vers une certaine limite en un point, elle se rejoignent
et g(x) «prise en étau» atteint la même limite.
112
7.12.2 Introduction
Théorème 24. Soit I un intervalle de R, et a ∈ I un nombre réel. Soient encore trois
fonctions f , g et h définies sur I, sauf éventuellement en a. Si :
— ∀x ∈ I ∧ x 6= a, f (x) ≤ g(x) ≤ h(x)
— limx→a f (x) = limx→a h(x) = L
Alors :
lim g(x) = L
x→a
7.12.3 Démonstration
On commence par prouver un cas particuliers du théorème. On choisit f (x) = 0 pour
tout x ∈ I, et L = 0. La deuxième hypothèse nous dit que :
lim h(x) = 0
x→a
∀x ∈ I ∧ x 6= a, 0 ≤ g(x) ≤ h(x)
En conclusion :
lim g(x) = 0 = L
x→a
Ce qui prouve donc le cas particuliers. Pour prouver le cas général, partons de :
On soustrait f (x) :
0 ≤ g(x) − f (x) ≤ h(x) − f (x)
Si on fait tendre x vers a, f (x) et h(x) tendent vers L et h(x) − f (x) tend vers 0. On se
retrouve dans le cas particuliers déjà prouvé, qui nous dit que g(x) − f (x) → 0. On a
donc :
lim g(x) = (g(x) − f (x)) + f (x) = 0 + L = L
x→a
113
7.13 Calcul intégral
7.13.1 Comment calculer la surface d’un disque ?
La question semble innocente. Simple. La plupart d’entre vous ont sans doute en
lisant le titre, repensé à la fameuse formule connue depuis longtemps : S = πr2 . Une
formule toute simple. Se pose juste une question un peu délicate : cette formule, d’où
vient-elle ?
On peut par un découpage approprié de la sphère (on la découpe comme une tarte)
donner peut être pas une démonstration rigoureuse mais au moins une intuition pour la
justifier. Nous allons utiliser une autre technique, plus formelle, qui aura l’avantage de
fonctionner pour calculer la surface de beaucoup d’autre formes géométriques.
Inspirons nous des techniques habituelles de la géométrie. Très souvent lorsque l’on
est confronté à un polygone un peu «spécial», on a le réflexe de le découper en triangles.
L’idée est donc le décomposer une forme compliquée en plusieurs formes simples dont la
surface est facile à calculer. Dans le cas d’un disque cependant, il est impossible de faire
un découpage exact en polygones. Mais c’est pas très grave.
En effet, nous allons utiliser une forme très simple : le rectangle. On peut se rendre
facilement compte qu’une tel découpage ne sera qu’une approximation, du moins dans
un premier temps. Pour faire ce découpage, nous allons nous mettre dans un système
d’axe et nous allons de plus utiliser la notion de fonction. En effet, c’est bien beau de
dire : «on va découper en rectangle» mais après qu’est ce qu’on fait comme calcul ? Il
faut connaître la largeur et la longueur de chaque rectangle.
Considérons un disque de rayon r centré à l’origine. L’ensemble des points du bord
du disque est l’ensemble des points qui sont à une distance r de l’origine, c’est à dire
l’ensemble des points (x, y) tels que :
x2 + y 2 = r 2
Cependant, pour utiliser la notion de fonction, il faut qu’à chaque abscisse x corresponde
au plus un point sur le disque. On va donc se restreindre à un demi disque, d’équation :
p
y= r 2 − x2
114
Notons a = −r et b = r. On découpe donc l’intervalle [a, b] pour construire la base
des rectangles. On a donc des nombres x1 , x2 , x3 , ..., xn qui forment ce découpage avec
a = x1 et b = xn .
À chaque rectangle correspond deux nombres, xi et xi+1 , tel que le segment qui joint
ces points sur l’axe x soit la base du rectangle. Les rectangles sont construits de manière
à ce que leur hauteur soit l’image du nombre situé entre xi et xi+1 , soit :
xi + xi+1
f
2
La surface de chaque rectangle est sa base multiplié par sa hauteur :
xi + xi+1
Si = (xi+1 − xi )f
2
Comme on fait un découpage régulier, les bases de tout √
les rectangles sont égales, et on
va noter h = (xi+1 − xi ). De même, on sait que f (x) = r2 − x2 , donc :
s
(xi + xi+1 )2
Si = h r 2 −
4
mais on sait que xi+1 = xi + h, donc :
s
(2xi + h)2
Si = h r2 −
4
Et la surface totale est donc la somme de tout les Si multipliée par 2 car on n’a pour
l’instant qu’un demi-disque :
s
n
X (2xi + h)2
Stot = 2 h r2 −
i=1
4
115
Plus les rectangles sont fins et nombreux, plus le calcul de la surface est précis, à la limite
donc, pour des rectangles infiniment fins, on a la somme exacte :
s
n 2
X (2x i + h)
Stot = 2 lim h r2 −
n→+∞
i=1
4
Il reste à prouver que :
Stot = πr2
Ce qui semble loin d’être simple... on n’a pas encore calculé la limite d’une expression
aussi compliquée ! ! C’est pourtant possible et nous allons voir comment.
116
Exemple de calcul d’une intégrale
Ce que nous savons maintenant n’est pas suffisant pour calculer la surface d’un disque.
Mais on peut trouver un cas plus simple. Laissons de coté le cas où la fonction est une
droite : le calcul est simple, mais tellement simple que le recours au calcul de l’intégrale
de Riemann ne se justifie pas. Nous allons plutôt calculer la surface en dessous de la
courbe y = x2 entre 0 et 1.
On découpe donc l’intervalle [0, 1] en n intervalles de même longueur (la longueur
sera donc n1 ). On peut choisir les xi tels que xi = ni , avec i variant de 1 à n (et xn = 1).
2
1 i 1 i
La surface de chaque rectangle sera donc n ·f n = n · n :
2 2 2 2
1 1 1 2 1 i 1 n
S= · + · + ... + · + ... + ·
n n n n n n n n
1
en mettant n3
en évidence :
1 2 2 2
S= 1 + 2 + ... + i + ... + n
n3
Or on peut prouver que :
n(n + 1)(2n + 1)
1 + 22 + ... + i2 + ... + n2 =
6
Donc :
1 n(n + 1)(2n + 1) 1 2n3 + 3n2 + n 2 3 1
S= 3
= 3
= + + 2
n 6 n 6 6 6n 6n
n Z 1
1 1 1 1
2
S= x dx = lim + + 2 =
0 n→∞ 3 2n 6n 3
Malheureusement, ce calcul est souvent très compliqué. Mais rendez vous compte déjà
du résultat : la surface que nous avons calculé n’est pas une surface simple, la somme de
Riemann montre déjà son intérêt.
117
7.14.2 Énoncé
Théorème 25. Soit deux fonctions f et g deux fonctions continues définies sur [a, b]
telles que ∀x ∈ [a, b], g(x) ≤ 0. Il existe alors un nombre c ∈ [a, b] tel que :
Z b Z b
f (x)g(x)dx = f (c) g(x)dx
a a
7.14.3 Démonstration
Tout d’abord, il faut noter que nous allons utiliser le théorème des bornes, qui dit
qu’une fonction continue sur un intervalle [a, b], possède un minimum et un maximum.
Aussi simple et logique soit cette énoncé, sa démonstration l’est moins, et ne figure pas
encore sur Freesciences.
Notons donc, m et M le minimum et maximum de f . On a donc, pour tout x ∈ [a, b],
m ≤ f (x) ≤ M , et puisque, g(x) ≤ 0 :
On applique donc le théorème des valeurs intermédiaires, pour trouver c ∈ [a, b] tel que
f (c) = d :
Z b Z b
f (c) g(x)dx = f (x)g(x)dx
a a
ce qui achève la démonstration.
Théorème 26. Soit une fonction f une fonction continue définie sur [a, b]. Il existe
alors un nombre c ∈ [a, b] tel que :
Z b
f (x)dx = f (c)(b − a)
a
118
7.15 Théorèmes fondamentaux de l’analyse
7.15.1 Introduction
Nous voici arrivés aux deux théorèmes fondamentaux de l’analyse, qui vont enfin
nous permettre de répondre à l’une des motivations de départ, à savoir comment calculer
une surface compliquée.
Ces théorèmes font le lien entre primitive et intégrale. Nous avons vu ce qu’est une
intégrale mais qu’est ce qu’une primitive ? C’est simple. On dit que la fonction F est une
primitive de la fonction f si la dérivée de F est f . Le calcul intégrale se réduit donc à
une calcul de primitive, en effet, le deuxième théorème fondamental de l’analyse nous dit
que :
Z b
f (x)dx = F (b) − F (a)
a
On voit que si l’on connaît F le calcul est incroyablement simple !
Essayons d’en avoir une intuition «physique». Supposons un point se déplaçant sur
une ligne droite, sa vitesse est la dérivée de la position par rapport au temps :
dx
v(t) = x0 (t) =
dt
Les notations x0 (t) et dx
dt sont équivalentes. La deuxième, dite notation de Leibniz, peut
se comprendre de manière intuitive. En effet, à partir de la vitesse moyenne :
∆x
vm =
∆t
on obtient la vitesse instantané en passant à la limite (on obtient donc la dérivée de x(t)),
pour montrer cela on remplacer ∆ par d :
∆x dx
v(t) = lim =
∆t→0 ∆t dt
Et mathématiquement, on a tout à fait le droit de réécrire notre équation comme ceci :
v(t) · dt = dx
N’oublions pas que dx n’est rien d’autre que ∆x lorsque l’on prend la limite. dx est donc
une «distance infinitésimale». Pour connaître la distance totale parcourue par le mobile,
on additionne donc une infinité de «distance infinitésimale». C’est à dire, par l’équation
précédente, sommer des termes infinitésimaux comme v(t) · dt. Pour le noter, on reprend
le concept de limite :
n
X
x(t) = lim v(t)∆ti
∆t→0
i=1
On retombe sur la définition de l’intégrale de Riemann ! On note alors :
Z t
x(t) = v(τ )dτ
0
On voit sur cette dernière équation qu’intégrer revient à «retomber» sur une primitive.
On va maintenant énoncer cela de façon rigoureuse.
119
7.15.2 Premier théorème fondamental de l’analyse
Énoncé
Théorème 27. Considérons une fonction f (x) continue sur l’intervalle [a, b]. Alors, la
fonction F (x) = ax f (t)dt est dérivable sur ]a, b[ et est telle que :
R
F 0 (x) = f (x)
pour tout x appartenant à ]a, b[.
Démonstration
Prenons deux points dans [a, b], x et x + ∆x. On peut écrire :
Z x+∆x Z x
F (x + ∆x) − F (x) = f (t)dt − f (t)dt
a a
donc :
F (x + ∆x) − F (x) = f (c)∆x
ou encore :
F (x + ∆x) − F (x)
= f (c)
∆x
En prenant la limite quand ∆x tend vers zéro, le membre de droite devient la dérivée de
F (x) :
F 0 (x) = lim f (c)
∆x→0
120
Pour calculer cette limite, on utilise le théorème du sandwich. On sait que x ≤ c ≤ x + ∆x
et que lim∆x→0 x = x et lim∆x→0 x + ∆x = x, le théorème nous dit donc que :
lim c(x) = x
∆x→0
Où c(x) est une fonction qui donne une valeur possible de c en fonction de x. Faire tendre
∆x vers zéro revient donc à faire tendre c vers x, c’est à dire :
F 0 (x) = f (x)
f (x) = F 0 (x)
Si f est une fonction intégrable sur [a, b], alors :
Z b
f (x)dx = F (b) − F (a)
a
Démonstration
Rappelons tout d’abord la définition de l’intégrale de Riemann :
Z b n
X
f (x)dx = lim f (yi )∆xi
a ∆x→0
i=1
Rappelons encore que l’on découpe l’intervalle [a, b] de telle sorte que :
donc :
F (b) − F (a) = F (xn+1 ) − F (x1 )
Rajoutant des termes s’annulant deux à deux (des termes comme (−F (xi ) + F (xi ))) :
F (b)−F (a) = F (xn+1 )+(−F (xn )+F (xn ))+...+(−F (xi )+F (xi ))+...+(−F (x2 )+F (x2 ))−F (x1 )
121
On peux alors regrouper différemment les termes :
F (b)−F (a) = (F (xn+1 )−F (xn ))+(F (xn )−F (xn−1 ))+...+(F (xi+1 )−F (xi ))+...+(F (x2 )−F (x1 ))
C’est à dire : n
X
F (b) − F (a) = F (xi+1 ) − F (xi )
i=1
Le théorème des accroissements finis nous dit qu’il existe un certain c ∈ [a, b] tel que
F 0 (c) = F (b)−F
b−a
(a)
, c’est à dire que :
On reconnaît bien là une somme de Riemann, il suffit donc de prendre la limite pour
conclure la démonstration :
n
X Z b
lim F (b) − F (a) = lim f (ci )∆xi = f (x)dx
∆x→0 ∆x→0 a
i=1
122
Chapitre 8
Mécanique newtonienne
8.2 Cinématique
8.2.1 Notion de référentiel
Il est évident que la notion d’observateur est très importante en physique. Pour faire
de la physique, il faut évidemment faire des mesures, et pour qu’une mesure ait un sens,
il faut soit que tout les observateurs s’accordent sur cette mesure (ou au moins une
classe particulière d’observateurs «privilégiés»), ou du moins que l’on puisse toujours
contextualiser la mesure.
Précisons cette idée. Deux personnes différentes observant un même phénomène
naturel peuvent avoir des visions tout à fait différentes. Un exemple simple : on sait tous
(ou presque) que la terre tourne autour du soleil. Mais si ceci est vrai en particuliers pour
123
un observateur immobile par rapport au soleil, pour un observateur terrestre, le soleil
tourne autour de la terre. Il faut donc préciser ce que cela veut dire : «la terre tourne
autour du soleil», est-ce une simple question de perspective ou y a t-il quelque de plus
profond derrière ? On reviendra sur ce genre de questionnement en abordant la relativité
de Galilée.
Il existe une notion plus précise et plus commode que la notion un peu vague
d’«observateur» : c’est la notion de référentiel. On peut définir un référentiel en faisant
appel explicitement à un système de coordonnée précis, mais ce n’est pas obligatoire.
Ici, on va faire une distinction : ainsi on va dire par exemple que deux observateurs
immobiles l’un par rapport à l’autre sont dans le même référentiel, mais bien sûr ils sont
libre d’utiliser chacun le système de coordonnées de leur choix.
Un référentiel est donc un cadre particuliers dans lequel on va faire des mesures. Pour
cela, on va attacher au référentiel un ou plusieurs systèmes de coordonnée dans le but
de mesurer les positions, vitesses, ... des différents mobiles étudiés. On peut utiliser le
type de système de coordonnée que l’on souhaite : cartésiens, sphériques, cylindrique, ...
Un système de coordonnées spatiales n’est pas suffisant : il faut de plus pouvoir mesurer
le temps, intuitivement on pourrait dire que l’on attache au référentiel une horloge. En
mécanique newtonienne, toutes les horloges (supposées infiniment précises !) de tout les
référentiels sont parfaitement synchronisées. Une conséquence particulière est que la
simultanéité est absolu : deux événements simultanés dans un référentiel le sont dans
tout les autres référentiels.
Cette façon de présenter les choses n’est cependant pas satisfaisante. En fait, si
l’on veut être précis et pouvoir garder la même définition dans le cadre de la relativité
restreinte, il nous faut une infinité d’horloge, une en chaque point de l’espace. Elles sont
toutes immobiles et synchronisées les unes par rapport aux autres. Si donc un évènement
survient en un certain point de l’espace, on note le temps correspondant en regardant
le temps indiqué par l’horloge en ce point. Bien sûr c’est une vue de l’esprit, on ne pas
réellement couvrir tout l’espace d’horloges.
On peut prendre les mêmes précautions pour les mesures spatiales. On va imaginer
que l’on peut repérer les positions des horloges par des règles (et éventuellement pouvoir
aussi mesurer des angles) de manière à étiqueter chaque horloges par ses coordonnées. Ce
qui permet, pour n’importe quel évènement, de simplement lire sa position dans l’espace,
en regardant l’étiquetage de l’horloge en ce point.
Pour connaître la trajectoire d’un corps, il faut déterminer quel est sa position au
cours du temps. Pour repérer la position d’un point, il suffit de donner ses coordonnées
par rapport au système de coordonnée du référentiel. Pour un objet étendu c’est plus
compliqué : il est constitué de plusieurs points et il peut tourner sur lui-même pendant
son déplacement ! Voila pourquoi on va commencer par étudier des objets (imaginaires)
qui sont de simple points, c’est à dire des objet ponctuel.
124
la trajectoire. Il ne faut pas confondre cette notion avec celle de trajectoire : la donnée du
support de la trajectoire ne dit pas ou se trouve le mobile à un certains temps donné
contrairement la trajectoire.
Supposons que l’on ait un repère (O,~i, ~j, ~k). On repère la position d’un point P :
~ = x~i + y~j + z~k
OP
x, y, z sont les coordonnées du point P . Si ces coordonnées évoluent au cours du temps et
que X(t), Y (t), Z(t) sont les coordonnées du point en fonction du temps on peut écrire :
~ (t) = X(t)~i + Y (t)~j + Z(t)~k
OP
Ce qui définit une fonction f~ tel que OP
~ (t) = f~(t) donc la position du mobile en fonction
du temps : c’est la trajectoire du mobile.
8.2.3 Vitesse
Nous allons maintenant définir la vitesse d’un mobile : c’est tout simplement la
distance parcourue par unité de temps donc :v = ∆s ∆t où ∆s représente la distance
parcourue par le mobile sur le support de la trajectoire pendant le temps ∆t. Il s’agit
évidemment là de la vitesse moyenne calculé sur le temps ∆t. Cependant, dans le cas de
mobile ayant une vitesse variant à chaque instant, la notion de vitesse instantanée est
très utile, pour définir la vitesse instantanée, on passe à la limite de ∆t tendant vers zéro
(on définit la fonction S comme donnant la position sur la courbe en fonction du temps :
s = S(t)) :
∆s S(t + ∆t) − S(t) dS(t)
v(t) = lim = lim =
∆t→0 ∆t ∆t→0 ∆t dt
On peut de plus définir le vecteur vitesse du mobile. En un point du support de la
trajectoire, le vecteur vitesse a pour norme la vitesse (comme définit ci dessus) et est
tangeant au support. De plus, le sens du vecteur est le sens de déplacement du mobile.
Considérons le vecteur position OP ~ du mobile, à l’instant t et t + ∆t (c’est à dire les
vecteurs OP ~ (t) et OP
~ (t + ∆t)) :
125
Le point P (t) est à la position S(t) sur la courbe et le point P (t + ∆t) est à la position
S(t + ∆t). Si on fait tendre ∆t vers zéro, le vecteur P (t)P (t~ + ∆t) devient tangeant à la
courbe et sa norme tend à être égale à S(t + ∆t) − S(t) = dS(t). Si on divise ce vecteur
par ∆t, sa norme lorsque ∆t tend vers zéro devient donc dS(t) dt c’est à dire la vitesse.
On a donc que le vecteur vitesse est :
~ (t + ∆t) − OP
OP ~ (t) ~ (t)
dOP
~v (t) = lim =
∆t→0 ∆t dt
8.2.4 Accélération
∆v
L’accélération est simplement l’accroissement de la vitesse par unité de temps : a = ∆t .
Comme pour la vitesse on défini l’accélération instantanée :
Et donc :
x = v(t − t0 ) + x0
Dans le cas du mouvement rectiligne uniforme, le graphique de la position en fonction du
temps est donc une droite.
126
Mouvements rectilignes uniformément accélérés
Un mouvement rectiligne uniformément accéléré est un mouvement dans lequel la
vitesse est constante, le mobile se dirigeant en ligne droite. On choisit encore une fois le
repère de manière à n’avoir qu’une coordonnée spatiale et on cherche encore la trajectoire.
En notant a l’accélération, on a va vitesse en fonction du temps :
v = a(t − t0 ) + v0
dx
Posons t0 = 0 pour simplifier. On a : v = at + v0 . Ce qui donne dt = at + v0 , c’est à dire
dx = [at + v0 ]dt et on intègre :
Z t
1
x= [aτ + v0 ]dτ + x0 = at2 + v0 t + x0
0 2
Dans le cas du mouvement rectiligne uniformément accéléré, le graphe de la position en
fonction du temps est donc une parabole.
127
centrifuge. Vous n’aurez toujours aucune idée de sa vitesse, mais vous pourrez mesurer son
accélération relativement facilement. Pour ne pas devoir traiter ces cas, on va supposer
que le bateau se déplace en ligne droite et que sa vitesse est constante. On dit dans ce
cas que le référentiel du bateau est galiléen ou inertiel.
Le principe de relativité exclut l’existence d’un référentiel privilégié par rapport
auquel on pourrait calculer sa vitesse (un référentiel au repos absolu). Dire que l’on se
déplace à une certaine vitesse n’a de sens qu’en précisant par rapport à quel référentiel
cette vitesse est mesurée. Certes, quand nous marchons, on peut dire qu’on se déplace
à une certaine vitesse. Mais nous déplaçons nous par rapport à la terre ou la terre se
déplace t elle par rapport à nous ? Galilée affirme qu’il n’y a aucune raison de choisir
l’une ou l’autre de ces affirmations.
Cela se traduit par les équations qui permettent de passer d’un référentiel à l’autre.
Elles montrent que les lois de la physique sont les mêmes pour tout les référentiels
galiléens. Dans ce cas, le principe vu plus haut se justifie.
x0 = x − vt
128
Déplacer le référentiel suivant l’axe x n’as évidemment pas changer les coordonnées y
et z :
y0 = y
z0 = z
Enfin, Galilée ajoute :
t0 = t
pour montrer que les coordonnées de temps sont les mêmes dans les 2 référentiels (ex : si
un phénomène prend 2 minutes dans un référentiel, il prendra 2 minutes dans l’autre : le
temps s’écoule de la même manière dans tous les référentiels). Nous avons donc :
x0 = x − vt
y0 = y
z0 = z
0
t =t
Ces relations s’inversent facilement :
x = x0 + vt0
y = y0
z = z0
0
t=t
129
0
Car on a évidemment v 0 = dx dt0 .
Exemple :
Imaginons un train roulant à la vitesse de 20 m/s, et un voyageur se déplaçant dans
le couloir du train à 1 m/s, dans le sens de la marche du train. Sa vitesse par rapport à
la terre est donc de 20+1=21 m/s.
Sur ce schéma, tout se passe en une seconde. Les lignes en pointillé marquent la position
du voyageur si il était resté immobile dans le train. Il s’est déplacé de 1 m dans le train,
qui s’est lui même déplacé de 20 m. Le déplacement totale du voyageur est donc de 21 m,
en 1s.
C’est la loi d’addition des vitesses. A l’inverse si le voyageur marchait dans le sens
contraire du train, sa vitesse par rapport à la terre serait 20-1=19 m/s donc dans ce cas
on doit soustraire les vitesses. Mais en réalité, on peut dire aussi qu’on les additionnes
si on pose que la vitesse du voyageur est négative. Plus précisément on impose un sens
positif et un sens négatif pour les vitesses ce qui permet de garder une seule formule pour
l’addition des vitesses.
Si le mobile va de gauche à droite, sa vitesse est positive, dans le cas contraire sa vitesse
sera négative ce qui permet de garder une seule forme pour la loi d’addition des vitesses :
additionner une vitesse négative au lieu de faire une soustraction.
130
8.4 Dynamique : notions de bases
8.4.1 Introduction
Jusqu’ ici, nous avons fait de la cinématique, étudier le mouvement des corps sans
s’occuper du pourquoi de leur mouvement, de la cause du mouvement. C’est ce que
nous allons faire maintenant : la dynamique. Dans cette branche de la physique, on
parle beaucoup des concepts de force et de masse, deux notion très importante qu’ il
faut préciser. Tout d’abord, qu’est ce que la masse ? Question très difficile en réalité car
demandant une définition précise. Ce qui n’est pas simple avec la masse.
Il existe en réalité deux «masses différentes» : la masse grave et la masse inerte. La
masse grave est celle qui intervient dans la force de gravitation, tandit que la masse inerte
intervient dans la deuxième loi de Newton (voir plus loin). Le problème est de savoir
pourquoi ces deux masses sont égales.
Disons simplement pour l’instant que pour un corps donné on peux lui associé un
nombre m que l’on appelle la «masse» du corps. Nous avons comme propriété que la
masse d’un corps est indépendante de sa vitesse et de sa position.
Le concept de «masse» amène tout naturellement le concept de quantité de mouve-
ment.
p∝v
Ce qui intuitif étant donné son appellation. Maintenant, supposons deux corps avec deux
quantités de mouvement différentes. On peut dire (encore intuitivement) qu’il est plus
«facile» de stopper le corps qui a le moins de quantité de mouvement. Effectivement, il
est plus facile d’arrêter un objet lent qu’un objet rapide, mais on se rend compte aussi
facilement que la masse joue un rôle important : pour deux mobiles à vitesses égales, il
est plus facile de stopper le plus léger. On suppose donc que l’on peut écrire :
p=m·v
Définition 47. La quantité de mouvement d’un corps est sa masse multiplié par sa
vitesse :
p~ = m~v
131
On reviendra sur notre approche intuitive de la quantité de mouvement plus loin.
Mais il n’est pas difficile de sentir déjà que la notion (intuitive) de force, est directement
liée à la variation de la quantité de mouvement.
132
La réponse est simple et intuitive : le frottement du mobile sur la table n’est pas le
même dans les deux cas. Dans le cas de la balle qui roule, le frottement est très faible.
On comprend facilement pourquoi le mouvement s’arrête : ce n’est pas parce qu’aucune
force n’agit sur le mobile comme le pensait Aristote, mais bien parce que justement il y a
une force qui le ralenti (la force de frottement). On voit que la balle parcourt une grande
distance, en imaginant un cas idéal où il n’y a aucun frottement, la boule continue à la
même vitesse indéfiniment !
133
On peut traiter en même temps les cas du changement de vitesse et du changement
de direction. En effet, dans les deux cas, on a une variation du vecteur vitesse, ce qui
veut dire que dans les deux cas le vecteur accélération est non nul. Il faut faire attention
au fait que pour un objet ayant une vitesse constante mais une trajectoire courbe, il a
bien une accélération non nulle !
L’effet de la force sur l’objet est donc de lui fournir une certaine accélération. Si
on reprend notre approche intuitive de la notion de quantité de mouvement, on peut
intuitivement supposer que la force correspond à la variation de la quantité de mouvement,
ou plus précisément à sa dérivée. On a donc envie d’écrire :
p d(m~v )
d~ d~v
F~ = =m = m~a
dt dt dt
La force est donc proportionnelle à l’accélération, ce qui n’est intuitivement pas surprenant.
On va convenir de généraliser cela de façon à pouvoir traiter le cas où l’on a plusieurs
forces. Il suffit pour cela de postuler que l’on puisse simplement additionner vectoriellement
les forces :
N
F~T OT =
X
Fi
i=1
8.6.2 Énoncé
La force totale exercée sur un corps est égale au produit de sa
masse m et de son accélération a :
F~ = m~a
134
On pourrait conclure alors qu’il est impossible de tirer un chariot : comment peux
t-on faire puisque si on exerce une force sur le chariot, il exercera une force égale mais
opposée ?
La réponse est simple : la force que l’on exerce sur le chariot est bien la même que la
force que le chariot va exercer sur nous, mais l’effet de ces deux forces sera différente :
1. Le chariot va avancer sous l’effet de la force et il y aura peut de frottement, car il
est sur roues,
2. Nous allons avancer car la force que le chariot exerce sur nous est compensée
par le fait que nous allons exercer une force sur la Terre elle même. C’est par
l’intermédiaire de nos pied que l’on pousse sur le sol, et c’est donc par le sol que
l’on «évacue» la force que tend à nous empêcher d’avancer. C’est encore le principe
d’action-réaction : on pousse sur la Terre avec notre pied et la force de réaction
de la Terre sur nous nous fait avancer !
Théorème 29. La quantité de mouvement totale d’un système isolé est constante au
cours du temps.
Par «isolé», on entend par là qu’il n’existe aucune interaction avec une particule (ou
quoi que ce soit d’autre) en dehors du système.
Démonstration : on veut donc montrer que la dérivée par rapport au temps de la
quantité de mouvement totale est nulle. On a :
N
dP~T OT d( N
P
i=1 p
~i ) X d~
pi
= =
dt dt i=1
dt
F~kl = −F~lk
135
Et donc :
dP~T OT 1 XX ~ 1 XX ~
F~ki = F~ik = (Fki + F~ik ) = 0
XX XX
= Fki +
dt i k6=i
2 i k6=i k i6=k
2 i k6=i
Où l’on utilise d’abord le fait que l’on peut librement renommer les indices de sommations,
puis on utilise le fait que : XX XX
(...) = (...)
k i6=k i k6=i
C’est à dire que l’on peut sommer d’abord sur i puis sur k, où l’inverse.
Notons que l’on peut généraliser facilement ce théorème dans le cas où l’on a des
forces extérieurs F~i , on a alors :
dP~T OT
F~i = F~EXT
X
=
dt i
136
Chapitre 9
Electromagnétisme
9.1 Introduction
Les phénomènes dits «électrostatiques» sont connus des scientifiques et philosophes
depuis l’antiquité. Les Grecs avaient constatés qu’en frottant de l’ambre jaune, cette
ambre pouvait attirer des corps légers. D’ailleurs, le mot «électricité» vient du grec
«elektron », qui signifie ambre. On peut faire la même expérience très facilement en
utilisant du plastique à la place de l’ambre.
Nous allons tout d’abord tenter d’expliquer cette attraction avec des expériences
plus précises. la plupart d’entre vous je pense, ont déjà vu ces expériences à l’école (les
fameuses petites boules en sureau ou en polystyrène suspendues par des fils) et ça n’est
pas la peine de reparler de ces expériences trop longtemps, je rappellerai brièvement le
principe de ces expériences pour ceux qui ne les connaîtrai pas ou plus.
L’électrostatique est relativement simple à aborder au départ, c’est seulement après
(électromagnétisme...) que les choses vont se compliquer. Il est donc important de
comprendre les bases, sans quoi il ne sera pas possible de comprendre la suite.
137
On constate une attraction, les propriétés de l’ambre ont été modifiées par le fait qu’on
l’ai frotté.
Dans cette deuxième expérience, on met une des boules en contact avec de l’ambre et
l’autre avec du verre. Puis on constate qu’elles s’ attirent. Ensuite, on refait la même
expérience, mais en en les mettant en contact avec la même substance (dans le dessin
ci-dessus c’est de l’ambre mais ça peut être du verre : on constate le même résultat),
on constate alors qu’elles se repoussent (entre les deux expériences, il faut évidemment
décharger les deux boules).
138
Ceci prouve plusieurs choses :
1. il y a bien deux «sortes» d’électricité différentes,
2. l’ électricité peut passer d’un corps à l’autre par simple contact,
3. les phénomènes électrostatiques sont attractifs ou répulsifs.
On suppose alors que puisque l’électricité peux passer d’un corps à l’autre, «quelque
chose» de concret passe grâce au contact.
En utilisant des balances extrêmement précises, on ne parvient pas à mettre en
évidence une variation de masse entre un objet au moment ou il est électrisé et au
moment ou il ne l’est pas.
On émet alors l’hypothèse qu’il existe des particules dans la matière, libre de se
déplacer d’un corps à l’autre, et portant une certaine charge électrique q, positive ou
négative, et de plus, ces particules doivent être suffisamment légères vu qu’on ne constate
pas de variation de masse.
F = kq1 q2
Il reste une constante k qui n’est pas vraiment une constante car on n’a pas encore pensé
à une chose : la distance entre q1 et q2 . Plus cette distance est grande, plus la force
électrique est faible.
Le physicien Français Coulomb a fait une série d’expériences sur la force électrique et
a montré que cette force était inversement proportionnelle à la distance entre les charges,
de plus la force est dirigée selon la droite qui relie les deux charges (même remarque
qu’en mécanique : on considère des corps ponctuels).
139
En regroupant toutes les remarques précédentes on arrive à la conclusion :
q1 q2
F =K
r2
ou r est la distance entre les charges et K une constante universelle.
Mais ça n’est pas tout. Pour des raisons de simplicité (pour des formules plus complexes
tels que les équations de Maxwell) on pose :
1
ε0 =
4πK
et donc finalement (j’en profite pour mettre la forme vectorielle) :
1 q1 q2
F~ = ~u
4πε0 r2
ε = ε0 · εr
Ainsi on connaît la valeur de εr pour tout les milieux possibles, et quand, dans la pratique,
on a besoin de calculer une permittivité, on consulte une table de permittivité électrique
relative.
q =n·e
140
Avant même le résultat de Milikan, en 1897, le physicien Joseph John Thomson
découvre l’existence de l’électron. Il faisait des expériences sur les rayons cathodiques :
ces «rayons», très étudiés à l’époque, méritent une petite parenthèse.
Ils furent découverts en 1876. Une simple expériences permet de les observer. On
a un tube dans lequel on fait le vide le plus parfait possible, et dans ce tube, deux
électrodes : l’une positive et l’autre négative. Dans le tube, une lueur violacée apparaît.
Ce sont les rayons cathodiques. Ce qui est particulièrement intéressant, c’est que ces
rayons proviennent de la matière elle-même (ici d’une cathode). Ce qui constitue ces
fameux rayons se trouve donc dans la matière en temps «normal».
Beaucoup d’expériences ont été faites. Thomson a montré que les rayons cathodiques
sont en fait constitués de petites particules, légères, et chargées négativement. On les a
appelées «électrons».
Ce résultat ainsi que celui de Milikan montre que les électrons sont responsables du
fait que l’électricité puisse passer d’un corps à l’autre. Ils ont évidemment une charge
égale à −1, 6·10−19 C, la charge élémentaire calculée par Milikan. Ils sont présents partout,
dans tout les objets de la vie courante.
Maintenant, il est évident que la matière n’est pas constituée uniquement d’électrons,
sinon tout les objets du monde seraient chargés négativement. Diverses réflexions sur
les fluides ont conduits bon nombres de chimistes a émettre l’hypothèse que la matière
est constituée d’atomes, en particulier John Dalton. Il pensait que les atomes sont
indivisibles, comme Démocrite avant lui. Thomson connaissaient la théorie atomique
quand il a découvert l’électron, cette théorie était acceptée par tous à cette époque, et il
devait en tenir compte.
Il imagina donc un nouveau modèle atomique. Il imagina que les atomes sont des sortes
de «billes» chargées positivement avec des électrons «enfoncés» dedans, à la manière d’un
pain aux raisins, ou les raisins représentent justement les électrons. Puisque les électrons
sont «collés» à une «substance» positive, l’atome est globalement neutre (en temps
«normal» on constate tous que la matière est neutre, on n’observe pas en permanence
des phénomènes électrostatiques).
Certaines réflexions théoriques ont conduit Rutherford a modifier cette vision de
l’atome. Il affirme alors qu’en réalité les atomes ont un noyau chargé positivement autour
duquel tournent les électrons, maintenus sur leur orbite par la force de Coulomb (tout
comme la force gravitationnelle maintient la lune en orbite autour de la terre).
Ces réflexions sur la structure de la matière pourront nous aider par la suite.
141
~ le
On va donc dire qu’à chaque point de l’espace autour de q, il existe un vecteur E,
vecteur champs électrique. Le champ électrique est donc un champs vectoriel.
On va donc poser que :
F~ = q1 E(M
~ )
Ou F~ est évidemment la force de Coulomb, et q1 la charge qui subit la force au point M
(car plongée dans le champs électrique).
En identifiant avec la formule de Coulomb, on obtient :
~ 1 q
E(M )= ~u
4πε0 r2
142