M102 Cours
M102 Cours
Franck Benoist
1 Logique et raisonnements 5
1.1 Énoncés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Connecteurs logiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Tautologies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4 Quelques types de raisonnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2 Ensembles et applications 13
2.1 Ensembles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3 Cas des ensembles finis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4 Arithmétique 27
4.1 Divisibilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.2 Division euclidienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.3 Algorithme d’Euclide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.4 Décomposition en facteurs premiers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.5 Congruences et Z/dZ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
5 Nombres complexes 35
5.1 Définitions et premières propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
5.2 Interprétation géométrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.3 Quelques équations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
6 Polynômes 41
6.1 Définitions et premières propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
6.2 Racines d’un polynôme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
6.3 Factorisation des polynômes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3
4
Chapitre 1
Logique et raisonnements
Objectif : donner quelques règles logiques pour des raisonnements mathématiques rigoureux
1.1 Énoncés
On va considérer dans la suite des énoncés, qui peuvent être vrais ou faux. On utilisera aussi souvent
les valeurs de vérité 0 (pour faux) et 1 (pour vrai).
Exemple 1.1
1. P : 3 ≤ 5. P est vrai.
2. Q : 5 est pair. Q est faux.
3. R : Le ciel est bleu.
Parfois, les énoncés dépendent de variables (on notera P (x) pour un énoncé qui dépend d’une variable
x). Il faudra alors donner des valeurs (pas forcément numériques) à ces variables avant de pouvoir dire
si ces énoncés sont vrais ou faux.
Exemple 1.2
Négation (non,¬)
Si P est un énoncé, on peut considérer sa négation non P (notée aussi parfois ¬P ). L’énoncé non P est
vrai exactement quand P est faux. On utilise souvent des tables de vérité pour résumer ces propriétés :
P non P
0 1
1 0
5
Exemple 1.3
Exemple 1.4
P (n) : n est un nombre impair et n est un nombre premier.
P (2) est faux (car 2 est pair), P (9) est faux (car 9 n’est pas premier), P (3) est vrai.
On
( utilise aussi parfois une accolade, en particulier quand on écrit des systèmes d’équations :
x+y =3
signifie x + y = 3 et x − y = 1.
x−y =1
Quand on utilise plusieurs connecteurs logiques et qu’il y a risque de confusion, on utilise des parenthèses.
Exemple 1.5
1.
P Q non (P et Q) (non P) et Q
0 0 1 0
1 0 1 0
0 1 1 1
1 1 0 0
Les énoncés non (P et Q) d’une part, (non P ) et Q d’autre part, n’ont pas les mêmes valeurs de
vérité, on évite donc d’écrire non P et Q, qui serait ambigu.
2. Les énoncés (P et Q) et R d’une part, P et (Q et R) d’autre part, ont mêmes valeur de vérité
(on le constate en écrivant les tables de vérité), on peut donc se permettre d’écrire P et Q et R.
Disjonction (ou, ∨)
Si P et Q sont des énoncés, on peut construire l’énoncé P ou Q (noté aussi parfois P ∨ Q). L’énoncé
P ou Q est vrai exactement quand P est vrai ou Q est vrai (éventuellement les deux) :
P Q P ou Q
0 0 0
1 0 1
0 1 1
1 1 1
Si on veut exprimer le "ou exclusif" (P est vrai ou Q est vrai mais pas les deux), on peut utiliser les
connecteurs précédents et écrire (P ou Q) et non (P et Q) :
P Q (P ou Q) et non (P et Q)
0 0 0
1 0 1
0 1 1
1 1 0
6
Implication (⇒, si ... alors ...)
Si P et Q sont des énoncés, on peut construire l’énoncé P ⇒ Q (si P alors Q). L’énoncé P ⇒ Q est vrai
exactement quand P est faux ou Q est vrai :
P Q P⇒Q
0 0 1
1 0 0
0 1 1
1 1 1
Exemple 1.7 "Si je me couche tôt ce soir, alors le jour se lèvera demain". C’est vrai car la conclusion
est vraie (il n’est même pas nécessaire de savoir si la prémisse est vraie ou fausse). L’implication au sens
logique ne correspond donc pas à la recherche de cause.
Une manière peut-être plus intuitive de justifier la table de vérité d’une implication est de considérer sa
négation : P ⇒ Q est faux exactement quand P est vrai mais Q est faux.
Exemple 1.8 Si je joue au loto, alors je gagne au loto. C’est faux car il est possible que la prémisse
soit vraie (je joue au loto) mais que la conclusion soit fausse (je ne gagne pas au loto).
Attention : pour une implication P ⇒ Q, ne pas confondre sa négation non (P ⇒ Q), l’implication
réciproque Q ⇒ P , et l’implication contraposée (non Q) ⇒ (non P ) (que l’on verra plus tard).
Exemple 1.9 L’implication "si j’ai gagné au loto, alors j’ai joué au loto" est toujours vraie.
Sa négation "j’ai gagné au loto et je n’ai pas joué" est toujours fausse.
L’implication réciproque "si j’ai joué au loto, alors j’ai gagné au loto" peut être fausse (voir plus haut).
L’implication contraposée "si je n’ai pas joué au loto, alors je n’ai pas gagné au loto" est toujours vraie.
Exemple 1.10
7
2. L’eau gèle si et seulement si sa température est portée à 0◦ C ou moins.
Exemple 1.11 1. ∀x x2 ≥ 0
2. ∀a ∀b (a + b)2 = a2 + 2ab + b2
Souvent, on précise dans quel ensemble peut varier la variable x. On écrit ∀x ∈ X P (x) pour dire
∀x (x ∈ X ⇒ P (x)). On peut aussi imposer des conditions sur x, par exemple ∀x ≥ 2 x2 ≥ 4 signifie
∀x (x ≥ 2 ⇒ x2 ≥ 4).
Exemple 1.12 ∃x ∈ C x2 + 1 = 0
Attention : quand on utilise plusieurs quantificateurs différents, l’ordre dans lequel on les écrit est im-
portant. Par exemple, ∀x ∈ R ∃y ∈ R y < x est vrai : pour tout réel x, on peut trouver un réel y (qui
dépend de x) tel que y < x, par exemple y = x − 1. Mais ∃y ∈ R ∀x ∈ R y < x est faux : on ne peut pas
trouver de réel y (choisi une fois pour toute) qui soit strictement plus petit que tous les réels x.
1.3 Tautologies
On dit qu’un énoncé est une tautologie s’il est toujours vrai, indépendamment des valeurs de vérité
des énoncés qui le composent.
On peut souvent vérifier qu’un énoncé est une tautologie en écrivant sa table de vérité :
Pour cet exemple, on peut aussi faire le raisonnement suivant. Pour montrer qu’une implication est vraie,
on suppose que la prémisse est vraie, et on cherche à montrer que la conclusion est vraie (c’est une consé-
quence de la table de vérité de l’implication : si la prémisse est fausse, on sait déjà que l’implication est
8
vraie). Supposons que (P ⇒ Q) et (Q ⇒ R) est vrai, on veut montrer que P ⇒ R est vrai. On suppose
donc que P est vrai. Comme P ⇒ Q est vrai, Q est vrai. Comme Q ⇒ R est vrai, R est vrai. Ainsi,
P ⇒ R est vrai, et on conclut que ((P ⇒ Q) et (Q ⇒ R)) ⇒ (P ⇒ R) est une tautologie.
Modus ponens
Si P est vrai et P ⇒ Q est vrai, alors Q est vrai. Par exemple, pour montrer un théorème T , on commence
par montrer un lemme L, puis on montre que le lemme implique le théorème (L ⇒ T ).
Exemple 1.14 Soit n un entier. Montrons que si n2 est pair, alors n est pair. Cela revient à montrer la
contraposée de cette implication : si n est impair, alors n2 est impair. Supposons que n est impair, on peut
l’écrire n = 2k+1 pour un certain entier k. On calcule alors n2 = (2k+1)2 = 4k 2 +4k+1 = 2(2k 2 +2k)+1 :
c’est un nombre impair.
Raisonnement par l’absurde
C’est une variante du raisonnement par contraposée. Pour montrer qu’un énoncé P est vrai, on suppose
que P est faux et on cherche à aboutir à un énoncé F dont on sait qu’il est faux. Si on y parvient, on a
montré l’implication (non P ) ⇒ F , et donc, par contraposée, l’implication (non F ) ⇒ (non non P ) (et
9
donc (non F ) ⇒ P car non non P est équivalent à P ). Comme F est faux, non F est vrai, et donc P
aussi.
a b
Exemple 1.15 Soient a et b deux nombres réels positifs tels que 1+b = 1+a . Montrer que a = b.
a b
On suppose par l’absurde que a 6= b. Comme 1+b = 1+a , on obtient a(1 + a) = b(1 + b), ou encore
a2 − b2 = b − a, puis en factorisant (a − b)(a + b) = −(a − b). Comme on a supposé que a 6= b, on peut
diviser par a − b (qui est non-nul), et on obtient a + b = −1 : c’est faux car la somme de deux nombres
positifs ne peut pas valoir −1. On a donc monté que a = b.
Raisonnement par contre-exemple
Comme non (∀x P (x)) est équivalent à ∃x (non P (x)), pour montrer que ∀x P (x) est faux, il suffit de
trouver un contre-exemple, c’est-à-dire trouver x tel que P (x) soit faux.
Exemple 1.16 Montrons que l’énoncé suivant est faux : pour tout entier n, si n est divisible par 6 et
par 4, alors n est divisible par 24.
On cherche une valeur particulière de n telle que cette implication soit fausse, c’est-à-dire telle que la
prémisse soit vraie mais la conclusion fausse. On peut prendre n = 12 : 12 = 6 × 2 = 4 × 3 est divisible
par 6 et par 4, mais il n’est pas divisible par 24.
Raisonnement par équivalence
D’après la tautologie ((P ⇔ Q) et (Q ⇔ R)) ⇒ (P ⇔ R), si on montre une suite d’équivalences
P1 ⇔ P2 ⇔ . . . ⇔ Pn , alors on a obtenu P1 ⇔ Pn . C’est ce qu’on utilise en particulier quand on cherche
à résoudre des équations. Par exemple, 2x + 3 = 7 ⇔ 2x = 4 ⇔ x = 2 : la seule solution de l’équation
2x + 3 = 7 est x = 2. Dans ce type de raisonnement, il faut prendre garde à bien écrire des équivalences.
Par exemple, dans ce qui précède, l’équation 1 implique l’équation 2 (en retranchant 3) et l’équation 2
implique l’équation 1 (en ajoutant 3), l’équation 2 implique l’équation 3 (en divisant par 2) et l’équation
3 implique l’équation 2 (en multipliant par 2).
Dans le passage du premier système au second, l’implication directe est vraie (on retranche x dans la
première équation, puis on remplace y par sa valeur dans la deuxième équation), mais pas l’implication
réciproque (on a oublié la troisième équation du premier système, et on ne peut pas la retrouver à partir
du second système).
En fait, on obtient seulement
x + y = 1
(
x=2
x−y =3 ⇒
y = −1
x − 2y = 1
que la seule solution possible au système est x = 2 et y = −1. Mais ce n’est pas une
ce qui signifie
2 + (−1) = 1
solution car 2 − (−1) = 3 est faux, donc le système n’a pas de solution.
2 − 2 × (−1) = 1
10
utilisé.
Pour un énoncé P (n) qui porte sur un entier n, et n0 un certain entier fixé, si P (n0 ) est vrai et si pour
tout n ≥ n0 , P (n) ⇒ P (n + 1) est vrai, alors pour tout n ≥ n0 , P (n) est vrai. C’est une application en
cascade du principe du modus ponens : P (n0 ) est vrai par hypothèse ; comme P (n0 ) ⇒ P (n0 + 1) est
vrai, P (n0 + 1) est vrai ; comme P (n0 + 1) ⇒ P (n0 + 2) est vrai, P (n0 + 2) est vrai ; etc...
Exemple 1.18 On cherche à donner une formule pour calculer la somme des n premiers nombres en-
tiers.
Notation : on note
Xn
i = 0 + 1 + . . . + n.
i=0
Plus généralement, pour une suite (ui ), on note la somme des ui pour i allant de 0 à n
n
X
ui = u0 + u1 + . . . + un .
i=0
11
12
Chapitre 2
Ensembles et applications
2.1 Ensembles
Les ensembles sont des collections d’objets, qu’on appelle éléments de l’ensemble (ceci n’est pas une
définition, seulement une manière de décrire les ensembles). Si X est un ensemble, on note x ∈ X pour
dire que x appartient à X, ou encore x est un élément de X (et x 6∈ X pour la négation de x ∈ X). Le
point essentiel est qu’un ensemble est déterminé par ses éléments, c’est-à-dire que l’énoncé suivant est
vrai :
X = Y ⇔ (∀x (x ∈ X ⇔ x ∈ Y )),
ou encore : deux ensembles sont égaux ssi ils ont exactement les mêmes éléments.
On peut préciser : on dit que l’ensemble X est inclus (ou contenu) dans l’ensemble Y , ou encore que
X est un sous-ensemble de Y , si ∀x (x ∈ X ⇒ x ∈ Y ). On note alors X ⊂ Y .
On a plusieurs moyens pour décrire des ensembles. On peut déjà considérer certains ensembles qu’on
considère bien connus : N, R, . . .. Pour des ensembles finis (c’est-à-dire des ensembles avec un nombre fini
d’éléments), il suffit d’en faire la liste ; on note {a1 , . . . , an } l’ensemble dont les éléments sont exactement
a1 , . . . , an . L’ordre et les éventuelles répétitions n’ont pas d’importance : par exemple, {1, 2, 1}, {2, 1} et
{1, 2} représentent le même ensemble.
On peut aussi utiliser des ensembles connus pour décrire de nouveaux ensembles. Si X est un ensemble
et P (x) un énoncé qui dépend d’une variable dans X, on peut regarder le sous-ensemble de X formé des
éléments tels que P (x) est vrai, on le note
{x ∈ X; P (x)}.
En particulier, on peut choisir pour P (x) un énoncé qui est toujours faux :
{x ∈ X; x 6= x}.
Cet ensemble n’a aucun élément, on l’appelle l’ensemble vide et on le note ∅. Il n’y a qu’un ensemble
vide (il est caractérisé par le fait qu’il n’a pas d’élément).
13
Preuve ∀x (x ∈ ∅ ⇒ x ∈ X) est vrai car x ∈ ∅ est toujours faux.
2. l’intersection de X et Y , dont les éléments sont les objets qui appartiennent à la fois à X et à Y :
x ∈ X ∩ Y ⇔ x ∈ X et x ∈ Y
x ∈ X \ Y ⇔ x ∈ X et non x ∈ Y
Exemple 2.5 Dans l’ensemble N, soit P le sous-ensemble des entiers naturels pairs. Alors Pc , le
complémentaire de P (sous-entendu : dans N) est le sous-ensemble des entiers naturels impairs.
Dans R, [1, 3]c =] − ∞, 1[∪]3, +∞[.
4. la différence symétrique de X et de Y , dont les éléments sont les objets qui appartiennent à X ou
à Y mais pas aux deux :
X∆Y = (X ∪ Y ) \ (X ∩ Y ) = (X \ Y ) ∪ (Y \ X)
Y ∈ P(X) ⇔ Y ⊂ X
Exemple 2.6 Si X = {1, 2}, alors P(X) = {∅, {1}, {2}, {1, 2}}.
Définition 2.7 Pour deux objets x et y, on définit le couple (x, y). Il est caractérisé par la propriété
suivante :
(x, y) = (x′ , y ′ ) ⇔ (x = x′ et y = y ′ ).
Remarque 2.8 Ne pas confondre le couple (x, y) avec la paire {x, y}. Par exemple, (1, 2) 6= (2, 1) mais
{1, 2} = {2, 1}.
Définition 2.9 Pour deux ensembles X et Y , on définit le produit cartésien X × Y : c’est l’ensemble
dont les éléments sont tous les couples (x, y) avec x ∈ X et y ∈ Y .
Définition 2.10 Plus généralement, pour tout entier n ≥ 1, on définit le n-uplet (x1 , . . . , xn ), caractérisé
par le fait que
(x1 , . . . , xn ) = (x′1 , . . . , x′n ) ⇔ (x1 = x′1 et . . . et xn = x′n ).
Pour n ensembles X1 , . . . , Xn , on définit le produit cartésien X1 × . . . × Xn : c’est l’ensemble dont les
éléments sont tous les n-uplets (x1 , . . . , xn ) avec x1 ∈ X1 , . . . , xn ∈ Xn .
On note X n = X × . . . × X (n fois).
14
2.2 Applications
Soient X et Y deux ensembles. Une application f de X dans Y , notée f : X → Y , est un objet f qui
à tout élément x ∈ X associe un élément de Y , noté f (x). On écrit souvent x →
7 f (x). On dit que X est
l’ensemble de départ de f et Y l’ensemble d’arrivée.
Exemple 2.11 Pour tout ensemble X, on peut définir l’application identité, notée id ou idX :
id : X → X
x 7→ x
X → Y
x 7→ y
On peut aussi utiliser le terme fonction au lieu d’application. De manière générale, une fonction f de X
dans Y est une application de X ′ dans Y pour un certain sous-ensemble X ′ de X, appelé le domaine de
définition de f .
1
Exemple 2.12 La fonction x 7→ x de R dans R désigne l’application de R∗ dans R qui à tout x ∈ R∗
associe x1 .
Définition 2.13 Soit une application f : X → Y . Le graphe de f est l’ensemble de tous les couples
(x, f (x)) avec x ∈ X. C’est un sous-ensemble de X × Y .
Remarque 2.14 On a l’habitude des applications de R dans R (souvent définies par des formules).
Comme le graphe d’une application f : R → R est un sous-ensemble du plan R2 , on peut le représenter
graphiquement. Par exemple, si f : R → R est définie par f (x) = x + 1, le graphe de f est la droite
d’équation y = x + 1.
Mais la notion de graphe existe pour toutes les applications, même quand il n’existe pas d’interprétation
graphique. Par exemple, si X est l’ensemble des étudiants de la promo et Y l’ensemble des lycées, on
peut considérer l’application f : X → Y qui à chaque étudiant associe son lycée d’origine. Le graphe de
f est alors l’ensemble des couples formés d’un étudiant et de son lycée d’origine.
Proposition 2.15 Soit G un sous-ensemble de X × Y . Alors G est le graphe d’une certaine application
f : X → Y ssi ∀x ∈ X ∃!y ∈ Y (x, y) ∈ G.
Preuve Si G est le graphe d’une application f : X → Y , G est l’ensemble des couples (x, f (x)) avec
x ∈ X. Donc, pour tout x ∈ X, le seul y ∈ Y tel que (x, y) ∈ G est y = f (x).
Réciproquement, si G vérifie la propriété ∀x ∈ X ∃!y ∈ Y (x, y) ∈ G, on peut définir une application
f : X → Y , qui à tout x ∈ X associe l’unique y ∈ Y tel que (x, y) ∈ G. Alors le graphe de f est G :
si (x, y) ∈ G, alors y = f (x) donc (x, y) est dans le graphe de f ; réciproquement si (x, y) est dans le
graphe de f , cela signifie que y = f (x) et donc (x, y) ∈ G.
Remarque 2.16 On peut aussi voir par l’argument précédent qu’une application est complètement dé-
terminée par son graphe.
puisque x ∈ ∅ est toujours faux. On appelle application vide l’application de ∅ dans Y associée à ce
graphe, c’est la seule application de ∅ dans Y .
15
Exemple 2.19 Soit l’application f : R → R définie par f (x) = x2 . Alors f|N est l’application
f|N : N → R
x 7→ x2
Exemple 2.21 Soient f et g les applications de R dans R définies par f (x) = x + 1 et g(x) = x2 . Alors
f ◦ g et g ◦ f sont des applications de R dans R, définies par f ◦ g(x) = x2 + 1 et g ◦ f (x) = (x + 1)2 .
Remarque 2.22 Attention : on ne peut définir g ◦ f que si l’ensemble d’arrivée de f est le même que
l’ensemble de départ de g.
f (X ′ ) = {y ∈ Y ; ∃x ∈ X ′ y = f (x)}.
Définition 2.26 Soit une application f : X → Y . On dit que f est surjective, ou que f est une surjec-
tion, ssi f (X) = Y .
Cela revient à dire, puisque l’inclusion f (X) ⊂ Y est toujours vraie, que
∀y ∈ Y ∃x ∈ X f (x) = y.
Définition 2.28 Soit une application f : X → Y . On dit que f est injective, ou que f est une injection,
ssi :
∀x ∈ X ∀x′ ∈ X (x 6= x′ =⇒ f (x) 6= f (x′ )),
ou, de manière équivalente, en considérant la contraposée :
16
Exemple 2.29 1. L’application f : R → R définie par f (x) = x + 1 est injective : pour tous réels x
et x′ , si x + 1 = x′ + 1, alors x = x′ .
2. L’application f : R → R définie par f (x) = x2 n’est pas injective : il suffit de trouver deux réels
distincts qui ont la même image par f , par exemple f (2) = f (−2) = 4.
3. Soit X l’ensemble des étudiants de la promo et f : X → N l’application qui à tout étudiant
associe son numéro d’étudiant. Alors f est injective : deux étudiants différents ont leurs numéros
d’étudiant différents. Et f n’est pas surjective : il suffit pour le voir de trouver un entier qui n’est
le numéro d’étudiant d’aucun étudiant.
Définition 2.30 Soit une application f : X → Y . On dit que f est bijective, ou que f est une bijection,
ssi f est à la fois injective et surjective.
Exemple 2.31 Pour tout ensemble X, l’application identité idX : X → X est bijective. En effet, comme
idX (x) = x, si idX (x) = idX (x′ ), alors x = x′ , donc idX est injective. Et pour tout x ∈ X, x = idX (x) ∈
idX (X) : idX est surjective.
Remarque 2.32 Soit f : X → Y une application. Dire que f est surjective, c’est dire que pour tout
y ∈ Y , il existe au moins un x ∈ X tel que f (x) = y. Dire que f est injective, c’est dire que si
f (x) = f (x′ ), alors x = x′ . Et donc dire que f est bijective est équivalent à :
∀y ∈ Y ∃!x ∈ X f (x) = y.
Théorème 2.33 Soit une application f : X → Y , où X et Y sont des ensembles non vides.
1. f est injective ssi il existe une application g : Y → X telle que g ◦ f = idX .
2. f est surjective ssi il existe une application g : Y → X telle que f ◦ g = idY .
3. f est bijective ssi il existe une application g : Y → X telle que g ◦ f = idX et f ◦ g = idY .
Preuve
1. On suppose que f est injective. Fixons un élément a ∈ X. On définit g : Y → X par
(
l’unique x ∈ X tel que f (x) = y si un tel x existe
g(y) =
a sinon
Dans le premier cas, x est unique car f est injective, donc f (x) = f (x′ ) = y implique x = x′ .
Vérifions que g ◦ f = idX : pour tout x ∈ X, si y = f (x), g(y) = x car x est l’unique élément tel
que f (x) = y, et ainsi g(f (x)) = x.
Réciproquement, on suppose qu’il existe g : Y → X telle que g ◦ f = idX . Supposons que
f (x) = f (x′ ). En appliquant g, on trouve que g(f (x)) = g(f (x′ )), et donc que x = x′ puisque
g ◦ f = idX .
2. On suppose que f est surjective. On définit g : Y → X de la manière suivante : pour tout y ∈ Y ,
il existe au moins un x ∈ X tel que f (x) = y (car f est surjective), on en choisit un et on pose
g(y) = x. On peut alors vérifier que f ◦ g = idY : pour tout y ∈ Y , posons x = g(y), alors
f (x) = y d’après la construction de g, donc f (g(y)) = y. Remarque : on a utilisé sans le dire pour
la définition de g un axiome appelé l’axiome du choix.
Réciproquement, on suppose qu’il existe g : Y → X telle que f ◦ g = idY . Alors pour tout y ∈ Y ,
en posant x = g(y), on voit que y = f (g(y)) = f (x), donc f est surjective.
3. On suppose que f est bijective. On définit g : Y → X de la manière suivante : pour tout y ∈ Y ,
d’après la remarque précédente, il existe un unique x ∈ X tel que f (x) = y, et on pose g(y) = x.
Alors g ◦ f = idX : si x ∈ X et y = f (x), g(y) = x par définition de g, donc g(f (x)) = x. Et
f ◦ g = idY : si y ∈ Y et x = g(y), alors f (x) = y par définition de g, donc f (g(y)) = y.
Réciproquement, s’il existe une application g : Y → X telle que g ◦ f = idX et f ◦ g = idY , on
peut en particulier en déduire que f est injective d’après le cas 1, et que f est surjective d’après
le cas 2, donc f est bijective.
17
Exemple 2.34 Soit f : R → R l’application définie par f (x) = x2 . On a déjà vu que f (R) = R+ ; on
sait aussi que f (x) = f (x′ ) ssi x = x′ ou x = −x′ . On en déduit les résultats suivants :
1. Soit f : R+ → R définie par f (x) = x2 . Alors f est injective. Construisons g : R → R+ comme
dans la preuve du théorème, avec 0 comme valeur "par défaut" : si y < 0, il n’existe pas de
x ∈ R+ tel que f (x) = y, et on pose donc g(y) = 0 ; si y ≥ 0, l’unique x ∈ R+ tel que f (x) = y
√ √
est x = y, on pose donc g(y) = y. Et on vérifie bien que g ◦ f = idR+ : pour tout x ∈ R+ ,
√
g(f (x)) = x2 = |x| = x.
2. Soit f : R → R+ définie par f (x) = x2 . Alors f est surjective. Construisons g : R+ → R comme
dans la preuve du théorème : pour tout y ∈ R+ , il existe deux (ou un seul si y = 0) x ∈ R tels que
√ √
f (x) = y, à savoir y et − y, et il faut en choisir un des deux. On peut par exemple définir :
(√
√ √ y si y ∈ Q
g : y 7→ y ou g : y 7→ − y ou g : y 7→ √
− y si y ∈ R+ \ Q
√
Dans tous les cas, f ◦ g = idR+ : pour tout y ∈ R+ , f (g(y)) = (± y)2 = y.
3. Soit f : R+ → R+ définie par f (x) = x2 . Alors f est bijective. Pour tout y ∈ R+ , l’unique élément
√ √
x ∈ R+ tel que f (x) = y est x = y. On définit donc g : R+ → R+ par g(y) = y, et on vérifie
comme dans les deux cas précédents que g ◦ f = f ◦ g = idR+ .
Proposition et définition 2.35 Soit f : X → Y une application bijective. Alors il existe une unique
application g : Y → X telle que f ◦ g = idY et g ◦ f = idX . On l’appelle application réciproque de f et
on la note f −1 . Pour tout x ∈ X et tout y ∈ Y , on a l’équivalence :
y = f (x) ⇔ f −1 (y) = x
Preuve On sait déjà d’après le théorème précédent qu’il existe une application g : Y → X telle que
f ◦ g = idY et g ◦ f = idX . Reste à montrer que g est unique : si h : Y → X est une autre application telle
que f ◦h = idY et h◦f = idX , on calcule de deux manières g ◦f ◦h = g ◦idY = g et g ◦f ◦h = idX ◦h = h,
et on conclut que g = h.
Puis, si y = f (x), on obtient en appliquant f −1 que f −1 (y) = f −1 (f (x)) = x. Et réciproquement, si
x = f −1 (y), on obtient en appliquant f (x) = f (f −1 (y)) = y.
Proposition 2.36 Soit f : X → Y une bijection. Alors f −1 : Y → X est aussi une bijection, et
(f −1 )−1 = f .
Preuve L’application réciproque est caractérisée par f ◦ f −1 = idY et f −1 ◦ f = idX . D’après le théo-
rème 2.33, l’existence de f implique que f −1 est bijective, et f = (f −1 )−1 .
Exemple 2.37 1. Dans l’exemple précédent, avec f : R+ → R+ définie par f (x) = x2 , on a vu que
√
f : R+ → R+ est définie par f −1 (y) = y.
−1
18
1. On raisonne par récurrence sur card(X).
Si card(X) = 0, le résultat est évident puisqu’on a nécessairement card(Y ) ≥ 0.
On suppose que le résultat est vrai quand card(X) = n, et on charche à montrer le résultat pour
un ensemble X de cardinal n + 1. Fixons x ∈ X et posons X ′ = X \ {x}, c’est un ensemble de
cardinal n. Notons que pour tout x′ ∈ X, f (x′ ) 6= f (x) car f est injective ; on peut donc définir
g : X′ → Y \ {f (x)}
x′ 7→ f (x′ )
C’est encore une application injective : pour deux éléments distincts x′ et x′′ dans X ′ , f (x′ ) 6=
f (x′′ ) car f est injective et donc g(x′ ) 6= g(x′′ ). Donc d’après l’hypothèse de récurrence card(X ′ ) ≤
card(Y \ {f (x)}). En ajoutant un élément de chaque côté, on trouve bien que card(X) ≤ card(Y ),
ce qui achève la démonstration par récurrence.
2. On va utiliser deux fois le théorème 2.33. Comme f : X → Y est surjective, il existe une application
g : Y → X telle que f ◦ g = idY . Puis, l’existence de f telle que f ◦ g = idY montre que g est
injective. On peut donc appliquer le point précédent : card(Y ) ≤ card(X).
3. Puisque f est bijective, elle est injective et surjective, et on peut donc appliquer les deux points
précédents pour conclure que card(X) = card(Y ).
Remarque 2.39 En prenant les contraposées des implications précédentes, on obtient aussi des résultats
importants :
1. Si card(X) > card(Y ), il n’existe pas d’injection X → Y .
2. Si card(X) < card(Y ), il n’existe pas de surjection X → Y .
3. Si card(X) 6= card(Y ), il n’existe pas de bijection X → Y .
On appelle parfois ces résultats le principe des tiroirs : si on veut ranger m chaussettes dans n tiroirs, avec
m > n, alors un des tiroirs contiendra plus d’une chaussette (car la fonction qui associe à une chaussette
le tiroir dans laquelle on la range ne peut pas être injective). Et si on veut ranger m chaussettes dans n
tiroirs, avec m < n, il y aura au moins un tiroir qui ne contiendra aucune chaussette (car la fonction
qui associe à une chaussette le tiroir dans laquelle on la range ne peut pas être surjective).
Corollaire 2.40 Soient X et Y deux ensembles finis tels que card(X) = card(Y ), et soit une application
f :X →Y.
Alors f est bijective ssi (f est injective ou f est surjective).
En d’autres termes, si f est injective, elle est automatiquement surjective, et si f est surjective, elle est
automatiquement injective.
Preuve Supposons que f : X → Y est injective. Supposons par l’absurde qu’elle n’est pas surjective.
Alors il existe y ∈ Y tel que pour tout x ∈ X, f (x) 6= y. L’application f permet donc de définir une
application de f˜ : X → Y \ {y} avec f˜(x) = f (x) pour tout x ∈ X. Il est clair que f˜ est encore injective.
Or Y \ {y} a un élément de moins que Y , donc aussi que X : c’est impossible d’après le principe des
tiroirs.
Si on suppose maintenant que f est surjective, on trouve d’près le théorème 2.33 une application
g : Y → X telle que f ◦ g = idY . En utilisant encore le théorème 2.33, on en déduit que g est in-
jective, et donc qu’elle est bijective d’après le point précédent. En composant l’égalité f ◦ g = idY par
g −1 , on trouve f ◦ g ◦ g −1 = idY ◦ g −1 , et donc f = g −1 , qui est une application bijective d’après la
proposition 2.36.
Remarque 2.41 Attention, le résultat est bien entendu faux si on ne suppose pas card(X) = card(Y ),
puisqu’on sait qu’il n’existe pas de bijection entre deux ensembles finis de cardinal différent.
Corollaire 2.42 Soient deux ensembles finis X et Y de même cardinal tel que X ⊂ Y . Alors X = Y .
19
Preuve Comme X ⊂ Y , on peut définir "l’application d’inclusion" :
X → Y
x 7→ x
Cette application est clairement injective, elle est donc surjective, ce qui signifie que pour tout y ∈ Y , il
existe x ∈ X tel que y = x. Ainsi Y ⊂ X et donc X = Y .
Remarque 2.43 Les corollaires précédents peuvent être généralisés à d’autres situations qui seront vues
par la suite, par exemple en algèbre linéaire.
Le fait suivant est intuitivement clair.
Fait 2.44 Soient X et Y deux ensembles finis disjoints. Alors card(X ∪ Y ) = card(X) + card(Y ).
Corollaire 2.45 Soient X1 , . . . , Xn des ensembles finis deux à deux disjoints. Alors
Corollaire 2.46 Soient X et Y deux ensembles finis. Alors card(X ∪Y ) = card(X)+card(Y )−card(X ∩
Y ).
Preuve Il est facile de vérifier que X ∪ Y = (X \ Y ) ∪ (Y \ X) ∪ (X ∩ Y ), et que ces trois ensembles
sont deux à deux disjoints. Le corollaire précédent donne donc que card(X ∪ Y ) = card(X \ Y ) +
card(Y \ X) + card(X ∩ Y ). De plus, X = (X \ Y ) ∪ (X ∩ Y ), et ces deux ensembles sont disjoints, donc
card(X) = card(X \ Y ) + card(X ∩ Y ), ou encore card(X \ Y ) = card(X) − card(X ∩ Y ). De la même
manière, card(Y \ X) = card(Y ) − card(X ∩ Y ). En reportant dans la première égalité, on obtient :
Corollaire 2.47 Soit X et Y deux ensembles finis et f : X → Y une surjection. On suppose qu’il existe
un entier p tel que pour tout y ∈ Y , card(f −1 ({y})) = p. Alors card(X) = p × card(Y ).
Preuve Posons card(Y ) = n et y1 , . . . , yn les éléments de Y . Pour i entre 1 et n, on pose Xi = f −1 ({yi }).
Par hypothèse, Xi est de cardinal p. On voit que X = X1 ∪ . . . ∪ Xn : pour tout x ∈ X, f (x) = yi pour un
certain i entre 1 et n, ce qui nous dit que x ∈ Xi , et donc que X ⊂ X1 ∪ . . . ∪ Xn (l’inclusion réciproque
étant évidente puisque les Xi sont des sous-ensembles de X). De plus, les ensembles X1 , . . . , Xn sont
deux à deux disjoints : si i 6= j, si un élément x est dans Xi ∩ Xj , on devrait avoir f (x) = yi = yj , ce qui
est impossible. On peut donc appliquer le corollaire précédent :
Corollaire 2.48 Soient X et Y deux ensembles finis. Alors card(X × Y ) = card(X) × card(Y ).
20
Preuve Soit l’application (appelée projection sur Y )
f : X ×Y → Y
(x, y) 7→ y
Cette application est surjective : pour tout y ∈ Y , on choisit x ∈ X, et alors f (x, y) = y (le cas où X = ∅
se traite différemment mais est facile). De plus, pour tout y ∈ Y , f −1 ({y}) = X × {y}, qui a le même
cardinal que X (on peut le justifier par le fait que l’application X → X × {y}, x 7→ (x, y) est une bijec-
tion). En utilisant le corollaire précédent, on peut donc conclure que card(X ×Y ) = card(X)×card(Y ).
Corollaire 2.49 Soient X et Y deux ensembles finis, et Z l’ensemble de toutes les applications de X
dans Y . Alors
card(Z) = card(Y )card(X)
Preuve On prouve le résultat par récurrence sur card(X).
Si card(X) = 0, c’est-à-dire X = ∅, la seule application de ∅ dans Y est l’application vide, on a donc
bien card(Z) = 1 = card(Y )0 .
On suppose le résultat connu pour card(X) = n, et on veut le montrer pour card(X) = n + 1. Si
card(X) = n + 1, on choisit x0 ∈ X et on pose X ′ = X \ {x0 }, qui est de cardinal n. Posons Z ′ l’ensemble
des applications de X ′ dans Y . Considérons l’application suivante :
g : Z → Z′ × Y
f 7 → (f|X ′ , f (x0 ))
′
On montre que g est injective : si g(f ) = g(f ′ ), alors f|X ′ = f|X ′
′ et f (x0 ) = f (x0 ), ce qui permet de dire
que f (x) = f (x) pour tout x ∈ X, et donc f = f . Et on montre que g est surjective : soit (f0 , y) ∈ Z ′ ×Y ,
′ ′
posons f : X → Y définie par f (x) = f0 (x) si x ∈ X ′ et f (x0 ) = y. On a bien g(f ) = (f0 , y). Comme
g est bijective, card(Z) = card(Z ′ × Y ), et donc card(Z) = card(Z ′ ) × card(Y ) d’après le corollaire
′
précédent. Or, d’après l’hypothèse de récurrence, card(Z ′ ) = card(Y )card(X ) = card(Y )n . Donc
card(Z) = card(Y )n × card(Y ) = card(Y )n+1 = card(Y )card(X) .
D’autres résultats de cardinalité sont importants à retenir. Se reporter aux feuilles d’exercices pour les
démonstrations. On rappelle la notation pour la factorielle d’un entier n : n! = 1 × 2 × . . . × n, et par
convention 0! = 1.
Fait 2.50 1. Soit X un ensemble fini de cardinal n, et Y l’ensemble des bijections de X dans X (on
dit aussi : les permutations de X). Alors card(Y ) = n!.
2. Soit X un ensemble fini de cardinal n, et p un entier tel que 0 ≤ p ≤ n. Soit Y l’ensemble des
n!
sous-ensembles de X qui sont de cardinal p. Alors card(Y ) = p!(n−p)! , qu’on appelle coefficient
n
binomial p . L’appellation "coefficient binomial" provient de la formule du binôme de Newton,
que l’on énonce ci-dessous.
21
La deuxième preuve utilise la caractérisation de np comme nombre de parties à p éléments d’un en-
semble à n éléments. Soit X un ensemble à n éléments. Par hypothèse, n ≥ 1 donc on peut fixer a un
élément de X. L’ensemble des parties de X à p éléments est l’union de P1 , l’ensemble des parties de X
à p éléments qui contiennent a, et de P2 , l’ensemble des parties de X à p éléments qui ne contiennent
pas a. De plus, ces deux ensembles sont disjoints, donc par les résultats précédents, np , qui est le car-
dinal de l’ensembles des parties de X à p éléments, est égal à card(P1 ) + card(P2 ). Puis, comme une
partie de X (à p éléments) qui ne contient pas a est exactement une partie (à p éléments) de X \ {a},
qui est un ensemble à n − 1 éléments, on obtient card(P2 ) = n−1 p . Quant à P1 , choisir une partie de
X à p éléments qui contient a revient exactement à choisir une partie de X \ {a} à p − 1 éléments et
à lui joindre a. Si on veut être plus précis, on peut montrer que l’application Y 7→ Y ∪ {a} est une
bijection de l’ensemble des parties de X \ {a} à p − 1 éléments
vers l’ensemble des parties
de X à p élé-
ments qui contiennent a. Cela montre que card(P1 ) = n−1 n
p−1 . On conclut donc que p =
n−1
p + n−1
p−1 .
Preuve On montre
la formule par récurrence sur n.
Pour n = 1, 10 = 11 = 1, on a donc bien (a + b)1 = a +b = 10 a0 b1 + 11 a1 b0 .
P n
Passons à l’hérédité. On suppose que (a + b)n = p=0 np ap bn−p et on veut montrer la formule au rang
n + 1. On développe et on regroupe les termes :
n+1
X n+1
= aq bn+1−q
q=0
q
22
Chapitre 3
3.1 Généralités
Soit X un ensemble. Une relation binaire sur l’ensemble X est un énoncé P (x, y) dépendant de deux
éléments x et y de X. Si on appelle R cette relation, on note souvent xRy pour dire que P (x, y) est vrai.
Exemple 3.1 1. Soit X n’importe quel ensemble. L’égalité est une relation binaire sur X : x = y.
2. Sur R, on a la relation d’ordre x ≤ y.
3. Soit X l’ensemble des étudiants de la promo. On définit une relation binaire sur X par : x est
plus jeune que y.
Remarque 3.2 On s’intéressera seulement ici aux relations binaires (on dit aussi : d’arité 2), c’est-à-
dire aux énoncés qui dépendent de deux variables. Mais on peut aussi parler de relations de n’importe
quelle autre arité. Par exemple, sur l’ensemble R, on peut définir une relation ternaire (ou encore :
d’arité 3) par x < y < z.
Définition 3.3 Soit R une relation binaire sur un ensemble X. On dit que :
1. R est réflexive si pour tout x dans X, xRx.
Par exemple, l’ǵalité est une relation réflexive (sur n’importe quel ensemble) car on a toujours
x = x.
2. R est une relation symétrique si pour tous x et y dans X, xRy équivaut à yRx.
Par exemple, l’ǵalité est une relation symétrique (sur n’importe quel ensemble) car x = y est
toujours équivalent à y = x. La relation ≤ sur R n’est pas symétrique car x ≤ y n’est pas
équivalent à y ≤ x.
3. R est une relation antisymétrique si pour tous x et y dans X, (xRy et yRx) implique x = y.
Par exemple, la relation ≤ sur R est antisymétrique car si x ≤ y et y ≤ x, alors x = y.
4. R est une relation transitive si pour tous x, y, z dans X, (xRy et yRz) implique xRz.
Par exemple, la relation xRy définie par "x est plus jeune que y" est transitive : si x est plus
jeune que y et y est plus jeune que z, alors x est plus jeune que z.
Remarque 3.4 Dans la suite, nous étudierons des relations qui vérifient certaines de ces propriétés.
Mais il existe aussi des relations binaires qui ne satisfont pas ces propriétés. Par exemple, sur l’ensemble
X = {1, 2, 3}, définissons une relation R en posant que 1R2, 2R3 et 3R2 sont vrais, et tous les autres
énoncés xRy sont faux. Alors R n’est pas réflexive puisque 1R1 est faux ; R n’est pas symétrique car 1R2
est vrai mais 2R1 est faux ; R n’est pas antisymétrique car 2R3 et 3R2 sont vrais mais 2 6= 3 ; R n’est
pas transitive car 1R2 et 2R3 sont vrais mais 1R3 est faux.
23
Exemple 3.6 1. La relation d’égalité sur n’importe quel ensemble X est une relation déquivalence.
En effet, pour tous x, y, z dans X, on a bien : x = x ; x = y ssi y = x ; si x = y et y = z alors
x = z.
2. Fixons un entier d ∈ Z. Sur l’ensemble Z, on définit la relation R par : nRm ssi il existe k ∈ Z
tel que n = m + kd. On note souvent cette relation n ≡ m [d] (on lit : n est congru à m modulo
d) plutôt que nRm. C’est une relation d’équivalence : n ≡ n [d] car n = n + 0 × d ; si n ≡ m [d],
alors il existe k ∈ Z tel que n = m + kd, et donc m = n + (−k)d, c’est-à-dire m ≡ n [d] ; enfin si
n ≡ m [d] et m ≡ p [d], il existe k et l dans Z tels que n = m + kd et m = p + ld, ce qui donne
n = p + (k + l)d, et donc n ≡ p [d].
3. On définit de la même façon la relation x ≡ y [2π] sur R par x ≡ y [2π] ssi il existe k ∈ Z tel
que x = y + k × 2π. C’est une relation d’équivalence par le même argument que pour l’exemple
précédent.
Proposition 3.7 Soit une application f : X → Y . Soit R la relation sur X définie par : xRy ssi
f (x) = f (y). Alors R est une relation d’équivalence.
Preuve La relation R est réflexive car f (x) = f (x). Elle est symétrique car f (x) = f (y) équivaut à
f (y) = f (x). Elle est transitive car si f (x) = f (y) et f (y) = f (z), alors f (x) = f (z).
Exemple 3.8 Soit X l’ensemble des étudiants de la promo et f : X → R l’application qui à un étudiant
associe sa note à l’examen. La relation d’équivalence décrite ci-dessus est donnée par : xRy ssi x et y
ont eu la même note à l’examen.
Définition 3.9 Soit R une relation d’équivalence sur un ensemble X, et x ∈ X. La classe d’équivalence
de x, souvent notée x ou Cx , est le sous-ensemble de X formé des éléments y équivalents à x :
x = Cx = {y ∈ X; yRx}.
Proposition 3.10 Soient x et y deux éléments de X, qui est muni d’une relation d’équivalence R.
Si xRy, alors x = y.
Si non xRy, alors x ∩ y = ∅.
Preuve Supposons que xRy. Pour tout z ∈ X, on obtient zRx ⇔ zRy en utilisant la propriété de
transitivité, c’est-à-dire z ∈ x ssi z ∈ y. Donc x = y.
Pour le deuxième point, on va montrer la contraposée : si x ∩ y 6= ∅, choisissons z ∈ x ∩ y, alors zRx et
zRy et donc xRy par transitivité.
Définition 3.11 Soit R une relation d’équivalence sur l’ensemble X. On définit l’ensemble quotient X/R
comme l’ensemble formé des classes d’équivalences x pour x ∈ X. On dit que l’application
X → X/R
x 7→ x
Proposition et définition 3.13 Soit X/R l’ensemble quotient d’un ensemble X par une relation R.
Alors X/R forme une partition de X, au sens où :
— les éléments de X/R sont des sous-ensembles non vides de X (car x contient x)
— les éléments de X/R sont deux à deux disjoints (d’après la proposition 3.10, si x 6= y, alors
x ∩ y = ∅)
24
— les éléments de X/R recouvrent X : tout x ∈ X est dans un élément de X/R, à savoir x
Exemple 3.14 1. Sur l’ensemble Z, considérons la relation d’équivalence R donnée par nRm ssi n ≡
m [2] (voir l’exemple 3.6). L’ensemble quotient Z/R est habituellement noté Z/2Z. Remarquons
que 0 et 1 ne sont pas équivalents, car il n’existe pas k ∈ Z tel que 1 = 0 + 2k. Donc 0 6= 1. Par
définition, 0 = {2k; k ∈ Z} : c’est l’ensemble des entiers relatifs pairs. Et 1 = {2k + 1; k ∈ Z} :
c’est l’ensemble des entiers relatifs impairs. S’il existait une autre classe d’équivalence, elle devrait
être disjointe de 0 et de 1, ce qui est impossible puisque tout entier relatif est soit pair, soit impair.
On a donc monté que Z/2Z = {0, 1}. Notons que ce choix des représentants 0 et 1 pour ces classes
d’équivalence est arbitraire : on voit par exemple que 0 ≡ 6 [2] et 1 ≡ 3 [2], on peut donc aussi
écrire Z/2Z = {6, 5}
2. Soit l’application f : R → R définie par f (x) = x2 , et R la relation d’équivalence sur R définie par
xRy ssi f (x) = f (y). On sait que xRy ssi y = ±x. Alors les classes d’équivalence sont 0 = {0}
et, pour tout x > 0, x = −x = {x, −x}.
Proposition 3.15 Soit X un ensemble muni d’une relation d’équivalence R, f : X → X/R l’application
canonique et g : X → Y une application telle que pour tous x, y ∈ X, si xRy, alors g(x) = g(y). Alors il
existe une unique application h : X/R → Y telle que g = h ◦ f .
Exemple 3.16 Soit X l’ensemble des étudiants de la promo, et R la relation d’équivalence définie par
xRy ssi x et y ont la même note à l’examen, avec f : X → X/R l’application canonique. Soit Y
l’ensemble des mentions, et g : X → Y telle que g(x) est la mention obtenue par l’étudiant x. Chaque
élément de X/R correspond à une note ; l’application h est l’application qui associe aux notes entre 10
et 12 la mention passable, aux notes entre 12 et 14 la mention assez bien, etc. Alors on a bien g = h ◦ f .
Remarque 3.19 On a défini ici les relations d’ordre R au sens large, au sens où elles vérifient xRx.
On peut toujours leur associer une relation d’ordre strict, définie par xRy et x 6= y. Par exemple, la
relation d’ordre strict associée à ≤ est <, la relation d’ordre strict associée à ⊂ est (.
Exemple 3.21 1. Sur N (ou Z, ou R), l’ordre ≤ est total : on a toujours soit x ≤ y, soit y ≤ x.
2. Soit X = P({1, 2}), l’ordre ⊂ est partiel, car les ensembles {1} et {2} sont incomparables.
On peut représenter une relation d’ordre avec un graphe, tel que xRy ssi il existe un chemin allant de x
à y en suivant les flèches.
Par exemple, pour l’ordre ⊂ sur X = P({1, 2}) :
25
{1, 2}
{1} {2}
On n’a pas besoin de tracer de flèche de ∅ vers {1, 2} car l’énoncé ∅ ⊂ {1, 2} peut être déduit des autres
flèches.
Dans le cas d’une relation d’ordre total (par exemple ≤ sur N), on obtient un graphe linéaire :
0 → 1 → 2 → ...
Définition 3.22 Soit X un ensemble avec une relation d’ordre ≤, et x ∈ X. On dit que :
— x est le plus grand élément de X si pour tout y ∈ X, y ≤ x
— x est le plus petit élément de X si pour tout y ∈ X, x ≤ y
— x est un élément maximal de X s’il n’existe pas de y ∈ X tel que x < y
— x est un élément minimal de X s’il n’existe pas de y ∈ X tel que y < x
Exemple 3.23 1. Dans N avec l’ordre ≤, 0 est le plus petit élément, et il n’y a pas de plus grand
élément.
2. Dans l’ensemble X = {∅, {1}, {2}}, avec l’ordre ⊂ : ∅ est un élément minimal, et aussi le plus
petit élément de X ; {1} et {2} sont des éléments maximaux de X, mais ce ne sont pas des plus
grands éléments (car {1} 6⊂ {2} et {2} 6⊂ {1}).
Proposition 3.24 Si ≤ est une relation d’ordre total sur X, et x un élément minimal de X, alors c’est
le plus petit élément de X.
De même, si x est un élément maximal de X, alors c’est le plus grand élément de X.
Preuve On suppose que x un élément minimal de X. Soit y ∈ X. Comme x est un élément minimal de
X, on ne peut pas avoir y < x. Or, comme l’ordre ≤ est total, y ≤ x ou x ≤ y, il faut donc que x ≤ y :
x est bien le plus petit élément de X.
L’argument est le même pour le deuxième point.
26
Chapitre 4
Arithmétique
On entend par arithmétique l’étude des entiers avec les opérations élémentaires (addition, multipli-
cation...). Nous donnerons les définitions et les résultats pour l’ensemble des entiers naturels N, avec
éventuellement les adaptations pour l’ensemble des entiers relatifs Z.
4.1 Divisibilité
Définition 4.1 Soient m et n deux entiers. On définit la relation m|n : m|n ssi il existe k ∈ N tel que
n = mk. On dit alors que m divise n, ou encore que m est un diviseur de n, que n est divisible par m
ou que n est un multiple de m.
Preuve Si m|n, on trouve k ∈ N tel que n = mk. Il y a deux cas : soit k = 0 et alors n = m × 0 = 0 ;
soit k ≥ 1 et alors n = mk ≥ m.
La relation | est réflexive : pour tout n ∈ N, n|n car n = n × 1.
La relation | est antisymétrique : si n|m et m|n, on veut montrer que n = m. D’après la première
propriété, comme n|m, alors n ≤ m ou m = 0. Si m = 0, comme m|n, on peut écrire n = mk, alors
n = 0 × k = 0 = m. Si n ≤ m, comme m|n, alors m ≤ n ou n = 0 : dans le premier cas, n = m car
la relation ≤ est antisymétrique, dans le deuxième cas, on conclut de n = 0 et de n|m que m = 0 = n
comme précédemment.
La relation | est transitive : si m|n et n|p, on veut montrer que m|p. Comme m|n, on trouve k ∈ N tel
que n = mk. Comme n|p, on trouve l ∈ N tel que p = nl. On en déduit que p = nl = mkl donc m|p.
Si m|n et m|n′ , on trouve k et k ′ dans N tels que n = mk et n′ = mk ′ . Alors n+n′ = mk+mk ′ = m(k+k ′ )
donc m|n + n′ .
Remarque 4.4 On définit la relation | sur Z : pour m et n dans Z, m|n s’il existe k ∈ Z tel que n = mk.
La relation | n’est pas une relation d’ordre sur Z car elle n’est pas antisymétrique : par exemple 3| − 3
car −3 = (−1) × 3 et −3|3 car 3 = (−1) × (−3), mais 3 6= −3.
Définition 4.5 Soit p ∈ N. On dit que p est un nombre premier si p ≥ 2 et si les seuls diviseurs de p
sont 1 et p.
27
Exemple 4.6 2, 3, 5, 7,... sont premiers. Dans la pratique, comme les diviseurs de p (pour p 6= 0) sont
≤ p, il suffit de vérifier s’il existe entre 1 et p d’autres diviseurs de p que 1 et p.
6 n’est pas premier car 6 = 2 × 3 : 2 et 3 sont des diviseurs de 6 distincts de 1 et 6.
Proposition et définition 4.7 Soit m et n deux entiers naturels avec m 6= 0. Alors il existe des entiers
naturels q et r, avec r < m, tels que n = mq + r.
Ces entiers q et r sont uniques ; q s’appelle le quotient de la division euclidienne de n par m, et r le
reste.
Exemple 4.8 Division euclidienne de 311 par 12 : 311 = 12 × 25 + 11, avec 11 < 12 ; 25 est le quotient,
et 11 le reste.
Preuve On fixe m 6= 0 et on montre par récurrence sur n la propriété P (n) : il existe q et r dans N
avec r < m tel que n = mq + r.
P (0) est vraie : pour q = 0 et r = 0 < m, on a bien 0 = m × 0 + 0.
P (n) ⇒ P (n + 1) : d’après P (n), on trouve q et r dans N avec r < m tels que n = mq + r. On cherche
maintenant à faire la division euclidienne de de n + 1 par m : on peut écrire n + 1 = mq + r + 1. Puisque
r < m, il y a deux cas : soit r < m − 1, et alors r′ = r + 1 < m et on a bien n + 1 = mq + r′ ; soit
r = m − 1, et alors n + 1 = mq + m = m(q + 1) + 0 avec 0 < m.
Cela montre la propriété P (n) pour tout n ∈ N. Il faut encore montrer l’unicité de q et r. Supposons
qu’on a deux écritures n = mq + r = mq ′ + r′ avec r < m et r′ < m. Si r = r′ , on obtient en retranchant
r que mq = mq ′ , et donc que q = q ′ (en divisant par m, qui est non nul). Si r 6= r′ , quitte à échanger r
avec r′ et q avec q ′ , on peut supposer que r′ > r. En faisant la différence entre les deux écritures de n,
on obtient m(q − q ′ ) + (r − r′ ) = 0, ou encore m(q − q ′ ) = r′ − r, avec 0 < r′ − r < m. C’est impossible,
car cela signifierait que m divise r − r′ , ce qui implique r − r′ = 0 ou m ≤ r − r′ .
On utilisera aussi dans la suite une version de la division euclidienne pour les entiers relatifs.
Proposition 4.10 Soient m et n dans Z avec m 6= 0. Alors il existe q et r dans Z, uniques, tels que
n = mq + r et 0 ≤ r < |m|.
Exemple 4.11 Soient a et b deux nombres premiers distincts. Les seuls diviseurs de a sont 1 et a, les
seuls diviseurs de b sont 1 et b, et comme a 6= b, le seul diviseur commun de a et de b est 1, et c’est donc
évidemment le plus grand diviseur commun.
Si b = 0, tous les diviseurs de a sont aussi des diviseurs de 0. Or le plus grand diviseur de a est a pour
l’ordre | (car a divise a et si n divise a alors n|a), donc a est le plus grand diviseur commun de a et de
0.
Lemme 4.12 Soit a et b dans N avec b 6= 0. Soit a = bq + r la division euclidienne de a par b. Alors
pour tout n ∈ N, n divise à la fois a et b ssi n divise à la fois b et r.
28
donc n divise a, et il divise b par hypothèse.
On s’arrête quand le dernier reste rn+1 obtenu est 0 ; cette situation se produit obligatoirement car les
suites strictement décroissantes d’entiers naturels r1 > r2 > . . . > rn > rn+1 atteignent nécessairement
0.
En appliquant n fois le lemme 4.12, on obtient que les diviseurs communs de r0 et de r1 sont les mêmes
que ceux de r1 et de r2 , qui sont les mêmes que ceux de r2 et de r3 , . . ., qui sont les mêmes que ceux de
rn et de rn+1 . Or, comme rn+1 = 0, on a vu que le plus grand diviseur commun de rn et de rn+1 est rn ;
c’est donc aussi le plus grand diviseur commun de a et de b. On a donc démontré le résultat suivant :
Proposition et définition 4.13 Soient a et b dans N. Il existe un plus grand diviseur commun de a et
de b (pour l’ordre |), que l’on note pgcd(a, b).
Il est obtenu comme le dernier reste non-nul dans l’algorithme d’Euclide.
51 = 2 × |{z}
|{z} 18 + |{z}
15 (1)
r0 r1 r2
18 = 1 × |{z}
|{z} 15 + |{z}
3 (2)
r1 r2 r3
15 = 5 × |{z}
|{z} 3 + |{z}
0 (3)
r2 r3 r4
Le dernier reste non-nul est 3, donc pgcd(51, 18) = 3 : 3 divise à la fois 51 et 18 (51 = 3×17 et 18 = 3×6)
et tout entier n qui divise à la fois 51 et 18 divise 3 (donc n = 1 ou n = 3).
Définition 4.15 On dit que deux entiers a et b sont premiers entre eux si pgcd(a, b) = 1.
Exemple 4.16 On a vu dans l’exemple 4.11 que si a et b sont deux nombres premiers distincts, alors
ils sont premiers entre eux.
On peut avoir deux nombres premiers entre eux même s’ils ne sont pas premiers. Par exemple, on constate
par l’algorithme d’Euclide que pgcd(4, 9) = 1 mais ni 4, ni 9 ne sont premiers.
29
l’algorithme d’Euclide :
Remarque 4.18 On ne s’est intéressé qu’à des entiers naturels a et b, mais les coefficients u et v trouvés
sont en général des entiers relatifs.
Exemple 4.19 On a vu dans l’exemple 4.14 que pgcd(51, 18) = 3. En utilisant les équations qu’on a
données, on va trouver u et v dans Z tels que 3 = 51u + 18v. L’équation (2) donne 3 = 18 − 15, et
l’équation (1) donne 15 = 51 − 18 × 2, donc 3 = 18 − (51 − 18 × 2) = −51 + 18 × 3 = 51u + 18v avec
u = −1 et v = 3.
Corollaire 4.20 Soient a et b dans N. Alors a et b sont premiers entre eux ssi il existe u et v dans Z
tels que 1 = au + bv.
Preuve On utilise le corollaire 4.20 : comme a et b sont premiers entre eux, il existe u et v dans Z tels
que au + bv = 1. En multipliant par c, on trouve c = acu + bcv. Or a|bc donc il existe k ∈ N tel que
bc = ak. On obtient donc c = acu + akv = a(cu + kv), ce qui dit que a|c.
30
Preuve On montre le résultat par récurrence sur le nombre n de facteurs dans le produit.
Si n = 1, le résultat est trivial : si p|a1 , alors p|a1 .
On suppose le résultat vrai pour un certain n et on le montre pour n + 1. On suppose que p divise
a1 . . . an+1 , qu’on voit comme a1 (a2 . . . an+1 ). Si p|a1 , on a terminé. Sinon, p et a1 sont premiers entre
eux : en effet, comme p est premier, les seuls diviseurs de p sont 1 et p ; or p ne divise pas a1 donc le
seul diviseur commun de p et a1 est 1. On peut donc appliquer le lemme de Gauss : p divise a2 . . . an+1 .
Comme c’est un produit de n nombres entiers, on peut appliquer l’hypothèse de récurrence : p divise a2
ou . . . ou an+1 .
Preuve On montre par récurrence sur n ≥ 2 que n admet une décomposition en facteurs premiers.
Si n = 2, on a déjà la décomposition puisque 2 est premier.
On montre la propriété d’hérédité sous la forme suivante : on suppose que le résultat est vrai pour tout
entier < n et on le démontre pour n. Si n est premier, on a terminé. Sinon, on trouve deux entiers u
et v tels que n = uv avec u et v strictement compris entre 1 et n. On peut donc utiliser l’ypothèse de
récurrence pour u et v : u = p1 . . . pk et v = q1 . . . ql pour des nombres premiers p1 , . . . , pk , q1 , . . . , ql . Et
donc n = uv = p1 . . . pk q1 . . . ql .
On démontre maintenant l’unicité : on suppose que n = p1 . . . pk = q1 . . . ql pour des nombres premiers
p1 , . . . , pk , q1 , . . . , ql . On montre le résultat par récurrence sur le nombre de facteurs dans ces décompo-
sitions, c’est-à-dire sur k + l. Par construction, k ≥ 1 et l ≥ 1. Le cas d’initialisation est donc k = l = 1,
et la situation est alors n = p1 = q1 , et le résultat est évident.
On écrit maintenant p1 . . . pk = q1 . . . ql et on suppose le résultat vrai quand le nombre de facteurs est
< k + l. En particulier, p1 divise q1 . . . ql , et p1 est premier. Donc, par le corollaire 4.22, p1 divise l’un des
qi . Quitte à faire une permutation de q1 , . . . , ql , on peut supposer que p1 |q1 . Comme q1 est premier et
p1 6= 1, cela implique p1 = q1 . On peut maintenant diviser l’égalité p1 . . . pk = q1 . . . ql par p1 : on obtient
p2 . . . pk = q2 . . . ql (dans le cas k = 1, le membre de gauche est en fait 1, donc celui de droite aussi,
ce qui donne l = 1, et on a terminé ; même chose si l = 1). On obtient donc deux décompositions avec
moins de facteurs premiers (à savoir k + l − 2), et l’hypothèse de récurrence donnne donc k − 1 = l − 1,
et p2 = q2 , . . . , pk = qk quitte à réordonner q2 , . . . , qk .
Lemme 4.25 Soit deux entiers naturels n et m ≥ 1. D’après la remarque précédente, on peut écrire
les décompositions en facteurs premiers n = pn1 1 . . . pnk k et m = pm mk
1 . . . pk
1
avec p1 , . . . , pk des nombres
premiers deux à deux distincts et des exposants n1 , . . . , nk , m1 , . . . , mk ≥ 0. Alors n|m ssi pour tout i
entre 1 et k, ni ≤ mi .
Preuve On suppose que n|m. Alors il existe u ∈ N tel que m = nu. On peut supposer que la dé-
composition en facteurs premiers de u s’écrit u = pu1 1 . . . puk k avec ui ≥ 0 pour tout i. Alors m = nu
mk
s’écrit pm
1 . . . pk
1
= p1n1 +u1 . . . pknk +uk . L’unicité de la décomposition en facteurs premiers implique que
mi = ni + ui pour tout i entre 1 et n, et donc aussi mi ≥ ni .
Réciproquement, si mi ≥ ni pour tout i, on peut considérer l’entier u = pm 1
1 −n1
. . . pkmk −nk . On calcule
n1 nk m1 −n1 mk −nk m1 mk
alors nu = p1 . . . pk p1 . . . pk = p1 . . . pk = m, ce qui donne que n|m.
31
Exemple 4.26 12 = 22 × 31 et 72 = 23 × 32 , donc 12|72.
12 = 22 × 31 × 50 et 30 = 21 × 31 × 51 donc 12 ne divise pas 30, à cause de l’exposant de 2.
m1 +n1 mk +nk
mn = p1 . . . pk et, d’après les résultats précédents,
min(m1 ,n1 )+max(m1 ,n1 ) min(mk ,nk )+max(mk ,nk )
pgcd(m, n) × ppcm(m, n) = p1 . . . pk .
Corollaire 4.31 Soient a, b, c des entiers ≥ 1. On suppose que a et b sont premiers entre eux, que a
divise c et que b divise c. Alors ab divise c.
Preuve Le fait que a et b sont premiers entre eux siginifie que pgcd(a, b) = 1, et donc ppcm(a, b) = ab
d’après la proposition précédente. Or, par hypothèse, c est un multiple commun de a et de b, et comme
ppcm(a, b) est le plus petit multiple commun de a et de b pour la relation |, on obtient ab|c.
Remarque 4.32 On a deux méthodes pour calculer le pgcd de deux entiers m et n : utiliser l’algorithme
d’Euclide ou la proposition 4.27 avec les décompositions en facteurs premiers. Pour le calcul du ppcm,
on dispose de la proposition et définition 4.28 avec les décompositions en facteurs premiers.
Parfois, surtout pour de grands entiers m et n, il est difficile de trouver la décomposition en facteurs
premiers de m et n, et plus simple d’utiliser l’algorithme d’Euclide. Ainsi, pour calculer le ppcm de m et n,
on peut calculer pgcd(m, n) par l’algorithme d’Euclide et utiliser la formule mn = pgcd(m, n)×ppcm(m, n)
pour en déduire ppcm(m, n).
32
L’ensemble quotient pour cette relation d’équivalence est noté Z/dZ ; pour n ∈ Z, on note n sa classe
d’équivalence.
Proposition 4.33 L’ensemble Z/dZ contient exactement d éléments : Z/dZ = {0, . . . , d − 1}.
Preuve Les éléments 0, . . . , d − 1 sont dans Z/dZ par définition ; on montre que tous les éléments de
Z/dZ peuvent être écrits sous cette forme. Tout élément de Z/dZ est la classe d’équivalence n d’un cer-
tain élément n de Z. Écrivons la division euclidienne de n par d : il existe q et r dans Z, avec 0 ≤ r < d,
tels que n = dq + r. Cela siginifie que n ≡ r [d], c’est-à-dire n = r, avec 0 ≤ r ≤ d − 1.
Puis on montre que les éléments 0, . . . , d − 1 sont deux à deux distincts. Soient i et j compris entre 0 et
d − 1, avec i 6= j. On peut, quitte à échanger i et j, supposer que i > j. Alors 0 < i − j < d, donc d ne
peut pas diviser i − j, donc i 6= j.
Proposition et définition 4.35 On peut définir une addition et une multiplication sur Z/dZ. Ces
opérations sont caractérisées par :
pour tout n, m ∈ Z, n + m = n + m et n × m = n × m.
Exemple 4.36 On peut donner les tables d’addition et de multiplication de Z/4Z. On utilise la définition
précédente, et la division euclidienne par 4 pour représenter tous les éléments de Z/4Z comme la classe
d’un entier entre 0 et 3 :
+ 0 1 2 3 × 0 1 2 3
0 0 1 2 3 0 0 0 0 0
1 1 2 3 0 1 0 1 2 3
2 2 3 0 1 2 0 2 0 2
3 3 0 1 2 3 0 3 2 1
Remarque 4.38 En utilisant une division euclidienne, on peut représenter tout élément de Z/dZ comme
la classe d’un entier compris entre 0 et d − 1. Mais parfois, il peut être plus utile d’écrire cet élément
comme la classe d’un entier hors de cet intervalle.
Par exemple, on cherche à déterminer le chiffre des unités de 2019167 . Pour un entier n, le chiffre des
unités de n correspond au reste de la division euclidienne de n par 10. Ainsi, 2019 = 201 × 10 + 9, ce
qui dit aussi que 2019 = 9 dans Z/10Z. Pour calculer le chiffre des unités de 2019167 , on va calculer
2019167 dans Z/10Z. On a 2019167 = (2019)167 = (9)167 . Or il est difficile de calculer (9)167 ; sachant
que 9 = −1 dans Z/10Z, on calcule plutôt (−1)167 = (−1)167 = −1 = 9. Ainsi, 2019167 = 9, ce qui dit
que le chiffre des unités de 2019167 est 9.
33
34
Chapitre 5
Nombres complexes
Opérations sur C
Remarque 5.2 On note bien sûr i le nombre complexe 0 + i1. D’après la formule pour la multiplication,
il vérifie i2 = −1. Dans la pratique, pour multiplier deux nombres complexes, il suffit d’utiliser les
propriétés énoncées dans le fait précédent et le fait que i2 = −1.
Pour un nombre complexe z = a + ib (on sous-entend toujours que a et b sont réels), le conjugué
de z, noté z, est défini par z = a − ib.
Proposition 5.3 1. z = z
′
2. z + z′ =z+z
3. zz ′ = zz ′
35
Module et argument d’un nombre complexe
On rappelle le fait suivant. Noter que l’usage en mathématiques est d’exprimer les angles en radians
(la mesure de l’angle plat π, celle de l’angle droit π/2,...).
Fait 5.5 Soit x, y ∈ R tels que x2 + y 2 = 1. Alors il existe un unique réel θ ∈] − π, π] tel que x = cos(θ)
et y = sin(θ).
Soit z = a + ib ∈ C, on suppose que z 6= 0, et donc aussi |z| = 6 0. On peut toujours diviser un
nombre complexe par un nombre réel non nul (il suffit de diviser la partie réelle et la partie ima-
z
ginaire par ce réel), regardons donc |z| = √a2a+b2 + i √a2b+b2 . Utilisons le fait précédent : puisque
a2 +b2
( √a2a+b2 )2 + ( √a2b+b2 )2 = a2 +b2 = 1, il existe un unique θ ∈] − π, π] tel que √ a
a2 +b2
= cos(θ) et
√ b = sin(θ). On appelle θ l’argument de z, on le note Arg(z).
a2 +b2
Remarque 5.6 La réciproque du fait précédentqest également vraie : pour tout θ ∈ R, cos2 (θ)+sin2 (θ) =
1. Cela signifie aussi que | cos(θ) + i sin(θ)| = cos2 (θ) + sin2 (θ) = 1.
Si z ∈ C est non nul, on pose r = |z| ∈ R∗+ et θ = Arg(z) ∈] − π, π], et on a alors z = r(cos(θ) + i sin(θ)).
Cette écriture est unique : si z = r(cos(θ) + i sin(θ)) = r′ (cos(θ′ ) + i sin(θ′ )), avec r, r′ des réels > 0 et
θ, θ′ dans ] − π, π], alors r = r′ = |z| et θ = θ′ = Arg(z).
Remarque 5.7 Soit z ∈ C non nul, r = |z| et θ = Arg(z). Si θ′ ≡ θ [2π], c’est-à-dire s’il existe k ∈ Z
tel que θ′ = θ + k × 2π, alors cos(θ′ ) = cos(θ) et sin(θ′ ) = sin(θ) car les fonctions cosinus et sinus sont
2π-périodiques. On a donc également z = r(cos(θ′ ) + i sin(θ′ )), et on dit que θ′ est un argument de z.
Notation exponentielle
Soit θ ∈ R. On note eiθ = cos(θ) + i sin(θ). Ainsi, si z ∈ C est non nul, avec r = |z| et θ un argu-
ment de z, alors z = reiθ : c’est ce qu’on appelle l’écriture trigonométrique de z.
On voit ici cette écriture seulement comme une notation, mais elle a en fait un sens plus profond. On va
voir maintenant que cette notation est conforme à l’usage habituel du calcul des puissances, on rappelle
pour cela les formules trigonométriques.
36
C’est bien la formule attendue pour un produit d’exponentielles. On a en particulier montré le résultat
suivant.
Proposition 5.9 Soient z, z ′ deux nombres complexes non nuls, θ un argument de z et θ′ un argument
de z ′ , alors θ + θ′ est un argument de zz ′ .
Exemple 5.10 En prenant les valeurs des fonctions cosinus et sinus en différentes valeurs simples, on
voit que 1 = ei×0 , i = eiπ/2 , −1 = eiπ et −i = e−iπ/2 .
Attention : Arg(−i) = −π/2 ∈] − π, π], mais −π/2 + (−π/2) = −π est seulement un argument de
(−i) × (−i) = −1 ; pour avoir l’argument de −1 il faut ajouter 2π pour obtenir Arg(−1) = π ∈] − π, π].
Division
Soit z ∈ C, on a vu que zz = |z|2 . En particulier, si z 6= 0, on peut diviser cette égalité par le réel
non nul |z|2 , et on obtient : z × |z|z 2 = 1. On dit alors que |z|z 2 est l’inverse de z, qu’on peut noter z1 . On
z 1 zz ′
peut donc aussi calculer, pour tous z, z ′ ∈ C, avec z ′ 6= 0, z′ =z× z′ = |z ′ |2 .
Exemple 5.12
1+i (1 + i)(1 − 2i) 3 1
= = − i.
1 + 2i (1 + 2i)(1 − 2i) 5 5
1 z
Si |z| = 1, alors z = |z|2 = z.
La méthode précédente permet de calculer le quotient de deux nombres complexes sous la forme al-
′
gébrique. Si z = reiθ et z ′ = r′ eiθ sont données sous forme trigonométrique, avec r′ 6= 0, les calculs
précédents montrent que
′ 1 ′ r′ ′ ′
r′ eiθ × ′ e−iθ = ′ ei(θ −θ ) = ei×0 = 1
r r
1 1 −iθ ′ z r i(θ−θ ′ )
Ainsi, z′ = r′ e et z′ = r′ e .
Fait 5.13 L’application de C vers le plan, qui à tout z ∈ C associe le point M d’affixe C, est une
bijection.
Soit
√ M le point d’affixe z. En utilisant le théorème de Pythagore, on voit que la distance OM est égale
à a2 + b2 , c’est-à-dire OM = |z|.
−→ −−→
Si z 6= 0, M 6= O et on peut considérer θ, la mesure de l’angle orienté entre les vecteurs OI et OM . Les
formules de trigonométrie dans le triangle donnent que a = OM × cos(θ) et b = OM × sin(θ), c’est-à-dire
z
|z| = cos(θ) + i sin(θ), et donc θ est un argument de z.
Le point M ′ d’affixe z est obtenu en prenant l’image de M (d’affixe z) par la symétrie orthogonale par
rapport à la droite (OI).
On appelle cercle trigonométrique le cercle de centre O et de rayon 1. C’est l’ensemble des points d’affixe
z avec |z| = 1 ; on peut écrire tous ces points sous la forme z = eiθ avec θ ∈ R (ou seulement θ ∈] − π, π]).
37
5.3 Quelques équations
Racines carrées
Soit w ∈ C. On cherche les racines carrées de w, c’est-à-dire les éléments z ∈ C tels que z 2 = w.
Forme algébrique
On suppose que w = c + id est donné sous forme algébrique et on cherche également z = a + ib sous
forme algébrique.
On calcule z 2 = (a2 − b2 ) + i2ab ; on en déduit que
( (
2 Re(z 2 ) = Re(w) a 2 − b2 = c
z =w⇔ ⇔
Im(z 2 ) = Im(w) 2ab = d
Pour rendre la résolution de ce système plus facile, on introduit une nouvelle équation : z 2 = w implique
que |z 2 | = |z|2 = |w|, c’est-à-dire a2 + b2 = |w|, et donc
q
2 2 2 c+|w| c+|w|
a − b = c (1)
a = 2
a = ± 2
q
z 2 = w ⇔ 2ab = d ⇔ b2 = |w|−c 2
⇔ b=± |w|−c
2 2
a + b2 = |w| (3)
2ab = d
2ab = d
On a obtenu la valeur de a2 en faisant la somme des équations (1) et (3), et celle de b2 en faisant leur
différence. L’équation 2ab = d est utilisée pour déterminer les signes : si d > 0, a et b sont de même
signe ; si d < 0, a et b sont de signes différents ; et si d = 0, a = 0 ou b = 0.
Exemple p5.15 Racines carrées de w = 3 − 4i. En reprenant les calculs précédents, avec c = 3, d = −4
et |w| = 32 + (−4)2 = 5, on trouve
a = ±2
2
(a + ib) = 3 − 4i ⇔ b = ±1
2ab = −4
Comme on doit avoir 2ab = −4, a et b sont de signes différents, ce qui donne deux racines carrées :
z1 = 2 − i et z2 = −2 + i = −z1 .
Forme trigonométrique
On suppose que w = Reiφ est donné sous forme trigonométrique et on cherche également z = reiθ sous
forme trigonométrique.
Lemme 5.16 Soit d et T des réels, avec d 6= 0. Alors pour tous x, y dans R, dx ≡ dy [T ] ssi x ≡ y [T /d].
Preuve Si dx ≡ dy [T ], il existe k ∈ Z tel que dx = dy + kT , et donc x = y + kT d en divisant par d (qui
est non nul), ce qui dit que x ≡ y [T /d]. L’implication réciproque se montre de la même façon, cette fois
en multipliant par d.
Par choix, r et R sont srictement positifs, et alors :
( ( √
2 2 2iθ iφ r2 = R r= R
z = w ⇔ r e = Re ⇔ ⇔
2θ ≡ φ [2π] θ ≡ φ2 [π]
Cela donne bien deux racines carrées pour w : en écrivant θ = φ2 +kπ, si k = 2k ′ est pair, alors θ ≡ φ2 [2π],
√
ce qui donne z = Reiφ/2 , et si k = 2k ′ + 1 est impair, alors θ = φ2 + π + 2k ′ π ≡ φ2 + π [2π], ce qui donne
√ √
z = Rei(φ/2+π) . Puisque eiπ = −1, on peut aussi écrire ces deux solutions z = ± Reiφ/2 .
38
Exemple 5.17 Cherchons les racines carrées de i.
2 2
a − b = 0
On cherche z = a + ib tel que z 2 = i, ce qui donne les équations 2ab = 1 , ce qui équivaut à
2
a + b2 = 1
√
2
a = ±√2
b = ± 22 . D’après la dernière équation, a et b sont de même signe, ce qui donne les racines carrées
2ab = 1
√ √
z = ±( 22 + i 22 ).
D’autre part, i s’écrit sous forme géométrique
( i = eiπ/2 . On cherche z = reiθ (avec r > 0) tel que
2
r =1
z 2 = eiπ/2 , ce qui donne les équations et donc z = ±eiπ/4 .
2θ ≡ π/2 [2π]
On identifie
√
les√deux formes des racines carrées de i. Comme√cos(π/4) > 0 et sin(π/4) > 0, on doit avoir
e iπ/4
= 2 + i 22 . On en déduit que cos(π/4) = sin(π/4) = 22 .
2
Soit un entier n ≥ 2. On cherche dans C les solutions de l’équation z n = 1 ; on les appelle ( les racines
n
r =1
n-ièmes de l’unité. On cherche z = reiθ sous forme trigonométrique ; z n = 1 équivaut à .
nθ ≡ 0 [2π]
Comme r > 0, rn = 1 équivaut à r = 1 ; d’après le lemme 5.16, nθ ≡ 0 [2π] équivaut à θ ≡ 0 [2π/n],
et il existe donc k ∈ Z tel que θ = 2kπ n . En écrivant la division euclidienne de k par n, k = qn + s avec
0 ≤ s ≤ n − 1, on trouve que θ = 2sπ 2sπ
n + q2π, avec q ∈ Z, c’est-à-dire θ ≡ n [2π]. On trouve donc les n
i2sπ/n
racines n-ièmes de l’unité : ce sont les e , pour s entier variant entre 0 et n − 1. Géométriquement,
ces racines n-ièmes de l’unité sont situées sur le cercle trigonométrique ; pour s = 0, on obtient le point
d’affixe 1, et les racines suivantes sont obtenues en appliquant succesivement une rotation d’angle 2π/n.
Ces n points forment un polygône régulier à n côtés.
39
40
Chapitre 6
Polynômes
On va s’intéresser dans ce chapitre aux polynômes, à coefficients dans R ou dans C. Comme les
définitions et la plupart des résultats sont les mêmes pour R et C, on écrira K pour désigner soit R, soit
C.
Définition 6.1 Soit P ∈ K[X] un polynôme non nul, et (an )n∈N ses coefficients. On définit le degré de
P , noté deg(P ), comme le plus grand entier N tel que aN 6= 0.
Par convention, si P = 0, le polynôme nul, alors deg(P ) = −∞.
2.
2N
X n
X
n
P (X)Q(X) = cn X avec cn = ai bn−i
n=0 i=0
Remarque 6.4 En pratique, plutôt que de calculer un produit à l’aide de la règle de la définition, on
utilise les propriétés ci-dessus qui permettent de développer un produit selon les règles habituelles (avec
bien sûr an X n bm X m = an bm X n+m ). La règle donnée dans la définition peut être utile si on n’a besoin
de connaitre qu’un des coefficients du produit. Par exemple, si on fait le produit (X 5 + 3X 4 − X 3 + 2X 2 +
5X − 2)(7X 2 + 2X − 4), le coefficient de X 6 sera 1 × 2 + 3 × 7 = 23.
41
Pour le résultat suivant, on utilise les conventions habituelles pour −∞ : si x ∈ N ou x = −∞, alors
x + (−∞) = −∞ et max(x, −∞) = x.
Remarque 6.6 Si P est un polynôme non nul de degré n, le coefficient devant X n s’appelle le coefficient
dominant de P . La preuve précédente nous dit que le coefficient dominant de P Q est le produit du
coefficient dominant de P et de celui de Q.
Remarque 6.9 1. Cette définition est pour l’instant uniquement formelle, c’est une manipulation
sur les coefficients du polynôme qui n’utilise pas la notion de dérivée au sens de l’analyse.
2. Si deg(P ) ≤ 0, on dit que P est un polynôme constant. Dans ce cas, on peut écrire P = a0 et
alors P ′ = 0 × a0 = 0.
42
PN PN P2N
Pour le produit, écrivons P (X) = n=0 an X n et Q(X) = n=0 bn X n . Alors P (X)Q(X) = n=0 cn X n
Pn P2N
avec cn = j=0 aj bn−j . Et donc (P Q)′ (X) = n=1 ncn X n−1 : en faisant le changement de variable
Pm+1
m = n − 1, on voit que le coefficient de X m dans (P Q)′ est (m + 1)cm+1 = (m + 1) j=0 aj bm+1−j .
D’autre part, faisons Ple produit P ′ Q : le coefficent de X i dans P ′ est (i + 1)ai+1 donc le coefficient
m
de X dans P Q est i=0 (i + 1)ai+1 bm−i . Par le même argument, le coefficient de X m dans P Q′ est
P
m ′
m m
i=0 ai (m − i + 1)bm−i+1 . Donc le coefficient de X dans P ′ Q + P Q′ est
m
X m
X m+1
X m
X
(i + 1)ai+1 bm−i + ai (m − i + 1)bm−i+1 = jaj bm−j+1 + aj (m − j + 1)bm−j+1
i=0 i=0 j=1 j=0
| {z } | {z }
j=i+1 j=i
m
X
= (m + 1)am+1 b0 + (j + m − j + 1)aj bm−j+1 + (m + 1)a0 bm+1
j=1
m+1
X
= (m + 1) aj bm+1−j
j=0
Remarque 6.14 Les opérations de somme, produit et dérivée sur les polynômes correspondent aux
mêmes opérations sur les fonctions polynomiales associées.
Définition 6.15 Soit P ∈ K[X] et a ∈ K. On dit que a est une racine de P (on précise parfois : dans
K) si P (a) = 0.
Exemple 6.16 1. Soit P = a0 un polynôme constant ; la fonction polynomiale associée est la fonc-
6 0, P n’admet pas de racine ; si a0 = 0, tout élément a ∈ K est
tion constante égale à a0 . Si a0 =
racine de P .
2. Soit P (X) = aX + b ∈ K[X] un polynôme de degré 1 (avec donc a 6= 0). Alors la seule racine de
P dans K est − ab .
43
On a vu dans le chapitre précédent que toute équation du second degré à coefficients dans C admet au
moins une solution dans C, ce qui signifie exactement que tout polynôme P ∈ C[X] de degré 2 admet au
moins une racine. On a en fait un résultat beaucoup plus général, que l’on admet sans démonstration.
La situation est différente pour les polynômes à coefficients réels. Le fait suivant est bien connu.
Fait 6.18 Soit P (X) = aX 2 + bX + c ∈ R[X] un polynôme de degré 2, et ∆ = b2 − 4ac son discriminant.
Alors P admet une racine dans R ssi ∆ ≥ 0.
Exemple 6.19 P (X) = X 2 + 1 n’admet pas de racine réelle car son discriminant est −4.
Preuve On va utiliser des notions d’analyse. On peut supposer que aN > 0 (si ce n’est pas le cas, il
suffit de considérer −P , sachant que P et −P ont exactement les mêmes racines). Alors la limite de P (x)
quand x tend vers +∞ est +∞, et celle en −∞ est −∞. En particulier, on peut trouver deux réels x0
et x1 tels que P (x0 ) < 0 et P (x1 ) > 0. D’autre part, les fonctions polynomiales sont continues, donc
en appliquant le théorème des valeurs intermédiaires, on peut trouver x compris entre x0 et x1 tel que
P (x) = 0 : x est une racine de P .
Définition 6.21 Soit P ∈ K[X] et a ∈ K. On dit que a est une racine de P de multiplicité m si
P (a) = P ′ (a) = . . . = P (m−1) (a) = 0 et P (m) (a) 6= 0.
On dira aussi que a est une racine simple si a est une racine de multiplicité 1 (c’est-à-dire P (a) = 0 et
P ′ (a) 6= 0), a est une racine double si elle est de multiplicité 2,...
Exemple 6.22 1. Soit P (X) = X 2 − 3X + 2 ; 1 est une racine de P car P (1) = 0, P ′ (X) = 2X − 3
′
et P (1) 6= 0 donc 1 est une racine simple de P .
2. Soit P (X) = X 2 + 2X + 1, P ′ (X) = 2X + 2, P ′′ (X) = 2 ; P (−1) = P ′ (−1) = 0 et P ′′ (−1) 6= 0
donc −1 est une racine double de P .
Remarque 6.23 Soit P un polynôme non nul, de degré N , de coefficient dominant aN . On a vu que
P (N ) est le polynôme constant N !aN 6= 0 ; en particulier, pour toute racine a de P , on pourra trouver
un entier n tel que P (n) (a) 6= 0.
44
6.3 Factorisation des polynômes
Un certain nombre de notions et résultats d’arithmétique ont des analogues pour les polynômes. Nous
ne donnerons pas toutes les démonstrations, certaines ne sont que des adaptations des démonstrations
de l’arithmétique.
Définition 6.25 Soient P et Q dans K[X]. On dit que P divise Q, et on note P |Q, s’il existe U ∈ K[X]
tel que Q = P U .
Proposition et définition 6.27 Soient P et Q deux polynômes non nuls ; (P |Q et Q|P ) ssi il existe
une constante non nulle λ ∈ K (c’est-à-dire un polynôme de degré 0) telle que Q = λP .
On dit dans ce cas que P et Q sont associés.
Preuve On suppose que P |Q et Q|P . Comme P |Q, il existe U ∈ K[X] tel que Q = P U . Notons que
U 6= 0 car Q 6= 0. D’après les propriétés du degré, deg(Q) = deg(P ) + deg(U ), avec deg(U ) ≥ 0 car
U 6= 0, donc deg(Q) ≥ deg(P ). On montre de la même manière, en utilisant cette fois le fait que Q|P ,
que deg(P ) ≥ deg(Q). On peut donc conclure que deg(Q) = deg(P ) ; cela implique donc que deg(U ) = 0,
donc U est une constante non nulle λ, et Q = λP .
Montrons maintenant la réciproque. S’il existe une constante non nulle λ ∈ K telle que Q = λP , alors
P |Q par définition, et on obtient aussi que P = λ1 Q, donc Q|P .
Définition 6.28 Soit P un polynôme dans K[X] de degré ≥ 1. On dit que P est irréductible dans K[X]
si pour tous P1 et P2 dans K[X] tels que P = P1 P2 , P1 ou P2 est associé à P .
Exemple 6.29 Si P est de degré 1, alors il est irréductible. En effet, si on a une factorisation P = P1 P2 ,
alors deg(P1 ) + deg(P2 ) = deg(P ) = 1, ce qui oblige à ce que deg(P1 ) = 0 et deg(P2 ) = 1 (ou vice-versa).
Dans ce cas, P1 est une constante non nulle et donc P est associé à P2 .
bn n−d bn
P1 = P3 + X P2 = (Q + X n−d )P2 + R,
ad ad
c’est ce qu’on voulait, avec Q + abnd X n−d comme quotient et R, de degré < d, comme reste.
Reste à voir l’unicité de Q et de R. Si P1 = Q1 P2 + R1 = Q2 P2 + R2 , avec R1 et R2 de degré <
deg(P2 ), on peut écrire que R2 − R1 = (Q1 − Q2 )P2 . Donc P2 divise R2 − R1 , avec deg(R2 − R1 ) ≤
max(deg(R1 ), deg(R2 )) < deg(P2 ) : c’est impossible, sauf si R2 −R1 = 0. On a donc montré que R1 = R2 ,
ce qui donne (Q1 − Q2 )P2 = 0, et donc Q2 − Q1 = 0 (on peut le justifier encore une fois avec les degrés).
45
La preuve donne aussi un algorithme pour faire la division euclidienne de P1 par P2 . Si deg(P1 ) < deg(P2 ),
il n’y a rien à faire. Sinon, on élimine le terme de plus haut degré de P1 en lui retranchant un polynôme
de la forme abnd X n−d P2 ; et on recommence jusqu’à obtenir un reste dont le degré est < deg(P2 ). On peut
poser cette division euclidienne comme on le fait pour les entiers.
X5 − 3X 4 + X3 + 2X 2 + 5X − 1 X 3 + 2X + 1
− (X 5 + 2X 3 + X 2) X 2 − 3X − 1
− 3X 4 − X3 + X2 + 5X − 1
− (− 3X 4 − 6X 2 − 3X)
− X3 + 7X 2 + 8X − 1
− (− X3 − 2X − 1)
7X 2 + 10X
Remarque 6.32 Soient P1 et P2 dans K[X], avec P2 6= 0. Alors P2 |P1 ssi le reste de la division
euclidienne de P1 par P2 est nul.
Corollaire 6.35 Soient P ∈ K[X], a ∈ K et un entier m ≥ 1. Alors (X − a)m divise P ssi a est une
racine de P de multiplicité ≥ m.
On en déduit aussi que a est une racine de P de multiplicité exactement m ssi (X − a)m divise P mais
(X − a)m+1 ne divise pas P .
Preuve On ne donne pas tous les détails de la démonstration.
Pour m = 1, c’est exactement le théorème 6.34.
Considérons le cas m = 2. Si (X − a)2 divise P , on écrit P (X) = U (X)(X − a)2 . On a déjà vu que
P (a) = 0, et on calcule P ′ (X) = U ′ (X)(X − a)2 + U (X) × 2(X − a), donc P ′ (a) = 0. Cela signifie que a
est une racine au moins double de P . Réciproquement, supposons que a est une racine au moins double
de P . Comme a est une racine de P , on sait déjà qu’on peut écrire P (X) = (X − a)U (X) d’après le
théorème 6.34. En dérivant, on obtient P ′ (X) = U (X) + (X − a)U ′ (X), et en prenant la valeur en a,
P ′ (a) = U (a) + 0. Or P ′ (a) = 0 puisque a est une racine au moins double de P , donc U (a) = 0, et en ap-
pliquant le théorème 6.34, on sait qu’on peut écrire U (X) = (X − a)V (X). Donc P (X) = (X − a)2 V (X).
Le cas général s’obtient en répétant cet argument.
46
Exemple 6.36 Soit P (X) = aX 2 + bX + c ∈ R[X] un polynôme de degré 2, et soit ∆ = b2 − 4ac son
discriminant.
Si ∆ ≥ 0, on sait que P admet une racine α, donc on sait par le thórème 6.34 que P peut se factoriser
en P (X) = (X − α)U (X) ; de plus deg(X − α) = deg(U ) = 1 (car la somme des degrés doit être 2), donc
ni (X − α) ni U (X) ne sont associés à P , donc P n’est pas irréductible.
Supposons maintenant que ∆ < 0, on sait que P n’admet pas de racine réelle. Si on se donne une
factorisation P (X) = P1 (X)P2 (X) dans R[X], où ni P1 ni P2 ne sont des constantes, on doit avoir
que deg(P1 ) = deg(P2 ) = 1. On écrit P1 (X) = uX + v (avec u 6= 0), alors P (X) = (uX + v)P2 (X) =
(X + uv ) × (uP2 (X)). Donc X + uv divise P , ce qui donne que − uv est une racine réelle de P , une
contradiction. Donc une telle factorisation de P n’existe pas, ce qui signifie que P est irréductible.
Soit un polynôme P ∈ K[X] de degré ≥ 1. On cherche à le factoriser dans K[X] en un produit de facteurs
irréductibles. Si P est déjà irréductible, il n’y a rien à faire. Sinon, on peut écrire P = P1 P2 , avec P1 et P2
qui ne sont pas associés à P , ce qui implique qu’ils sont de degré compris entre 1 et deg(P ) strictement.
On peut donc recommencer la factorisation avec les polynômes "plus simples" P1 et P2 . On obtient de
cette manière un théorème analogue à celui de l’arithmétique.
Théorème 6.37 Tout polynôme P ∈ K[X] de degré ≥ 1 peut être écrit comme un produit de facteurs
irréductibles.
Définition 6.38 Un polynôme P ∈ K[X] de degré ≥ 1 est dit scindé (dans K[X]) s’il peut être écrit
P (X) = λ(X − a1 ) . . . (X − an )
Proposition 6.40 Les polynômes irréductibles de C[X] sont exactement les polynômes de degré 1.
Preuve On a déjà vu que les polynômes de degré 1 sont irréductibles (exemple 6.29).
Réciproquement, supposons que P est un polynôme irréductible (en particulier de degré ≥ 1 par défini-
tion). D’après le théorème 6.17, P admet une racine a ∈ C, et donc, d’après le théorème 6.34, on peut
factoriser P sous la forme P (X) = (X − a)U (X). Comme P est irréductible, U doit être une constante
non nulle, et donc P est de degré 1.
Lemme 6.42 Soient P ∈ K[X], et a et b deux racines distinctes de P . Alors (X − a)(X − b) divise P .
47
Preuve On utilise le théorème 6.34. Comme a est une racine de P , on peut écrire P (X) = (X −a)U (X).
De plus, b est une racine de P , donc P (b) = (b − a)U (b) = 0. Comme b 6= a, cela implique que
U (b) = 0. On peut donc maintenant appliquer le théorème 6.34 pour U : il existe V ∈ K[X] tel que
U (X) = (X − b)V (X), et donc P (X) = (X − a)(X − b)V (X).
Remarque 6.43 On pourrait aussi donner une démonstration analogue à celle d’arithmétique en disant
que (X − a) et (X − b) sont "premiers entre eux" (on n’a pas défini ici cette notion pour les polynômes).
Corollaire 6.45 Les polynômes irréductibles de R[X] sont exactement les polynômes de degré 1 et les
polynômes de degré 2 de discriminant < 0.
Preuve On a déjà vu que les polynômes de degré 1 sont irréductibles (exemple 6.29) et qu’un polynôme
de degé 2 est irréductible dans R[X] ssi son discriminant est < 0 (exemple 6.36). Il reste donc à montrer
que si P ∈ R[X] est un polynôme de degré ≥ 3, il n’est pas irréductible.
Si P admet une racine réelle a, il est divisible par X − a et donc il n’est pas irréductible. Sinon, on sait
que P admet une racine complexe z (par le théorème 6.17) qui n’est donc pas réelle. On a alors z 6= z. Or,
par la proposition 6.24, z est aussi une racine de P , et donc, en utilisant les deux lemmes précédents, P
est divisible par Q(X) = (X − z)(X − z), qui est un polynôme réel : on peut écrire P (X) = Q(X)U (X),
avec deg(P ) = 3 > 2 = deg(Q), donc U n’est pas une constante, et P n’est pas irréductible.
Exemple 6.46 1. On veut factoriser le polynôme P (X) = X 4 − 12X 3 + 42X 2 − 52X + 21. On voit
que P (1) = 0 : 1 est une racine évidente de P . Puis on calcule P ′ (1) = 0 et P ′′ (1) 6= 0 : 1 est une
racinde double de P . On en déduit que P est divisible par (X − 1)2 . En faisant la division de P
par (X − 1)2 (ou encore X 2 − 2X + 1), on trouve que P (X) = (X − 1)2 (X 2 − 10X + 21). Puis
on trouve facilement les racines de Q(X) = X 2 − 10X + 21, à savoir 3 et 7 (avec ∆ = 16), ce qui
donne Q(X) = (X − 3)(X − 7) (car le coefficient dominant de Q est 1). Donc la décomposition
en facteurs irréductibles de P est P (X) = (X − 1)2 (X − 3)(X − 7) ; en particulier P est scindé,
avec 4 racines comptées avec leur multiplicité.
2. On veut factoriser le polynôme P (X) = X 4 +X 3 +2X 2 +X +1 dans R[X]. On sait que P n’est pas
irréductible car il est de degré 4, mais on ne parvient pas à trouver de racine réelle. Cherchons des
racines complexes : on voit que P (i) = 1 − i − 2 + i + 1 = 0. Ainsi, i est une racine de P , et donc
i = −i aussi, et on sait que P est divisible par Q(X) = (X −i)(X +i) = X 2 +1 (c’est un polynôme
irréductible dans R[X]). On fait la division de P par Q et on trouve P (X) = (X 2 +1)(X 2 +X +1).
Or X 2 + X + 1 est un polynôme irréductible dans R[X] puisque son discriminant est −3 ; on a
donc bien trouvé la décomposition de P en facteurs irréductibles dans R[X].
48
Chapitre 7
Soient deux points A et B du plan P, et leurs coordonnées respectives (xA , yA ) et (xB , yB ). On peut
−−→
considérer le vecteur d’origine A et d’extrémité B, noté AB.
−−→
Pour un tel vecteur AB, on définit ses coordonnées (xB − xA , yB − yA ) dans R2 . Un(vecteur est complète-
−−→ −−→ xB − xA = xD − xC
ment déterminé par ses coordonnées : cela siginifie que AB = CD si et seulement si ;
yB − yA = yD − yC
deux vecteurs égaux peuvent avoir des origines et des extrémités différentes.
→
−
On appelle le vecteur nul le vecteur dont les coordonnées sont nulles : 0 = (0, 0).
Dire que deux vecteurs − →
u et −→v sont colinéaires revient à dire qu’il existe un réel λ tel que −
→
v = λ−→
u ou
→
− →
− →
− →
−
u = λ v . Le vecteur nul est colinéaire à tous les vecteurs puisqu’on a toujours 0 = 0 u .
−→ −→ −→ −→
On suppose désormais que le repère (O, OI, OJ) est orthogonal, c’est-à-dire que les vecteurs OI et OJ
→
−
sont orthogonaux (on peut aussi dire perpendiculaires). Pour deux vecteurs − →u = (x, y) et u′ = (x′ , y ′ ),
on définit leur produit scalaire :
−
→
h−
→u , u′ i = xx′ + yy ′ .
−
→ −
→
Fait 7.1 Les vecteurs →
−
u et u′ sont orthogonaux ssi leur produit scalaire h→
−
u , u′ i est nul.
7.1.2 Droites
Pour définir une droite, il suffit de deux points distincts : pour tous points distincts A et B, il existe
une unique droite passant par A et B, que l’on note habituellement (AB).
−−→
Pour tout point M du plan, le point M appartient à la droite (AB) ssi le vecteur AM est colinéaire au
−−→ −−→
vecteur AB. On dit dans ce cas que A est une origine de la droite et AB en est un vecteur directeur.
Plus généralement, si on se donne un point A de coordonnées (xA , yA ) et un vecteur non nul − →
u = (a, b),
→
−
on peut définir la droite D d’origine A et de vecteur directeur u : c’est l’ensemble des points M du plan
−−→
tels que AM est colinéaire à − →
u . Ainsi, en notant (x,
(y) les coordonnées de M , le point M appartient à
−−→ x − xA = λa
D ssi il existe λ ∈ R tel que AM = λu, c’est-à-dire
y − yA = λb
49
.(On obtient ainsi la description paramétrique de la droite D : c’est l’ensemble des points de coordonnées
x = xA + λa
, où le paramètre λ parcourt R.
y = yA + λb
De manière alternative, on peut décrire la droite D à partir d’une origine et d’un vecteur normal. Un
vecteur normal à une droite est un vecteur non nul qui est orthogonal au vecteur directeur de la droite.
Si A de coordonnée (xA , yA ) est une origine de la droite D, et si −
→
v = (c, d) est un vecteur normal à D,
−−→ →
−
alors le point M appartient à D ssi AM est orthogonal à v . On a donc, en notant (x, y) les coordonnées
de M :
−−→ →
M ∈ D ⇔ hAM , − v i = 0 ⇔ c(x − xA ) + d(y − yA ) = 0.
On a ainsi obtenu une équation cartésienne de la droite D :
D = {M ∈ P; cx + dy = cxA + dyA }.
Notons que les coefficients devant les coordonnées x et y de M sont précisément les coordonnées (c, d)
du vecteur normal −
→v.
Exemple 7.2 Considérons les points A de coordonnées (1, 2) et B de coordonnées (3, 5), et D la droite
(AB).
−−→
La droite D admet A comme origine et AB = (2, 3) comme vecteur
( directeur. On en déduit sa description
x = 1 + 2λ
paramétrique : D est l’ensemble des points M de coordonnées quand λ parcourt R.
y = 2 + 3λ
−−→ →
On constate facilement que −→v = (−3, 2) est un vecteur normal à la droite D, puisque hAB, − vi =
2 × (−3) + 3 × 2 = 0. En utilisant la méthode précédente, on peut alors obtenir une équation cartésienne
de la droite D : D = {M ∈ P; −3x + 2y = 1}.
On peut également faire le travail précédent dans le sens inverse. Soit D une droite donnée par son
équation cartésienne cx + dy = e. Pour trouver une origine et un vecteur directeur de D, il suffit de
trouver deux point distincts de A et B sur D : on peut alors considérer A comme l’origine de D et
−−→
AB comme vecteur directeur. D’après ce qu’on a vu précédemment, il est encore plus facile de trouver
un vecteur normal pour D, simplement en utilisant les coefficients de l’équation cartésienne : le vecteur
→
−v = (c, d) est un vecteur normal pour D.
Fait 7.3 Les vecteurs directeurs de D sont tous colinéaires entre eux. Les vecteurs normaux à D sont
tous colinéaires entre eux.
Exemple 7.4 Soit D la droite d’équation 2x + y = 3. On voit que les points A de coordonnées (0, 3) et
B de coordonnées (3, −3) sont deux points distincts de D ; ainsi D est la droite d’origine A et de vecteur
−−→ −−→
directeur AB = (3, −6). Le vecteur −→
v = (6, 3) est orthogonal au vecteur directeur AB, c’est donc un
vecteur normal à D. On peut aussi trouver un vecteur normal en regardant l’équation cartésienne de D :
→′
− →
−
v = (2, 1) est aussi un vecteur normal à D, et on constate bien que −→v et v ′ sont colinéaires.
7.1.3 Distance
−→ −→
On suppose désormais que le repère (O, OI, OJ) est orthonormal (on dit aussi orthonormé), c’est-à-
−→ −→
dire que c’est un repère orthogonal tel que de plus les vecteurs OI et OJ sont de longueur 1. En utilisant
−−→
le théorème de Pythagore, on peut alors calculer la longueur de tout vecteur OM .
−−→ p
Proposition 7.5 Soit M un point de coordonnées (x, y). Alors la longueur du vecteur OM est x2 + y 2 .
Preuve Considérons le point N de coordonnée (x, 0), alors le triangle OM N est rectangle en N (on
peut faire le dessin). Lepthéorème de Pythagore donne donc OM 2 = ON 2 + M N 2 , or ON = |x| et
M N = |y| donc OM = x2 + y 2 .
−−→ −−→
Soient A et B deux points du plan, et M le point de coordonnées (xB − xA , yB − yA ). Alors OM = AB,
et on en déduit :
50
p
Corollaire 7.6 La distance entre deux points A et B est (xB − xA )2 + (yB − yA )2 .
Cela permet d’écrire l’équation des cercles. Soit A un point du plan et R un réel positif. Le cercle de
centre A et de rayon R est l’ensemble des points M tel que AM = R. En utilisantp le corollaire ci-dessus,
et en notant (x, y) les coordonnées de M , on trouve l’équation du cercle : (x − xA )2 + (y − yA )2 = R,
qu’on écrit le plus souvent sous sa forme équivalente : (x − xA )2 + (y − yA )2 = R2 .
On peut aussi faire le travail dans l’autre sens, et reconnaître l’équation de cercles comme dans l’exemple
suivant.
Exemple 7.7 On cherche à caractériser l’ensemble des points M dont les coordonnées (x, y) satisfont
l’équation x2 + y 2 + 4x + 6y + 2 = 0. La méthode est de reconnaître dans les termes en x et les termes
en y le début de développement d’un carré : x2 + y 2 + 4x + 6y + 2 = (x + 2)2 − 4 + (y + 3)2 − 9 + 2.
Donc x2 + y 2 + 4x + 6y + 2 = 0 ssi√(x + 2)2 + (y + 3)2 = 11 : c’est l’équation du cercle de centre A, de
coordonnées (−2, −3), et de rayon 11.
Exercice Déterminer l’ensemble des points M de coordonnées (x, y) qui vérifient x2 + y 2 − 2x + 4y ≤ 30.
−
→ −
→
Fait 7.8 Les vecteurs →
−
u et u′ sont orthogonaux ssi leur produit scalaire h→
−
u , u′ i est nul.
51
On peut également définir un plan dans l’espace à partir de trois points non alignés : si A, B, C sont
trois points non alignés, il existe un unique plan P qui contient A, B, C. Plus précisément, P est défini
−−→ −→
en choisissant A comme origine et les vecteurs AB et AC comme vecteurs générateurs :
−−→ −−→ −→
P = PA,−
−→ −→ := {M ∈ E; ∃λ ∈ R ∃µ ∈ R AM = λAB + µAC}
AB,AC
Si on permute les rôles joués par A, B et C, on obtient le même plan. Par exemple, en conservant la
notation ci-dessus, vérifions que PA,−
−→ −→ = P −
AB,AC
−→−
B,BA,BC
→ . On va utiliser les relations de Chasles qui nous
−
−−→ −−→ −→ −−→ −−→
donnent AB = −BA et AC = −BA + BC. Alors si M ∈ PA,− −→ −→ , il existe par définition des réels λ et
AB,AC
−−→ −−→ −→ −−→ −−→ −−→ −−→ −−→
µ tels que AM = λAB + µAC, et donc BM = BA + AM = (1 − λ − µ)BA + µBC, ce qui prouve que
M ∈ PB,− −→−−→ . On a donc montré que P − −→ −→ ⊂ P − −
→−−→ ; on montre l’inclusion réciproque de la
BA,BC A,AB,AC B,BA,BC
même manière et ainsi que PA,− −→ −→ = P −
AB,AC
−
→− −
B,BA,BC
→ . On emploie la même méthode si on choisit C comme
origine.
−−→ x − xA = λa
appartient à D ssi il existe λ ∈ R tel que AM = λu, c’est-à-dire y − yA = λb
z − zA = λc
.On obtient ainsi la description paramétrique de la droite D : c’est l’ensemble des points de coordonnées
x = xA + λa
y = yA + λb , où le paramètre λ parcourt R.
z = zA + λc
Cherchons maintenant des équations cartésiennes pour une telle droite D. Comme le vecteur − →u = (a, b, c)
est non-nul, au moins une des coordonnées a, b, c est non-nulle. Supposons par exemple que a 6= 0 (si on
avait a = 0, il faudrait adapter le raisonnement ci-dessous en faisant jouer à b ou c le rôle de a). On sait
x − xA = λa
que le point M appartient à D ssi il existe λ ∈ R tel que y − yA = λb . Comme a 6= 0, la seule valeur
z − zA = λc
de λ possible pour que la première condition soit vérifiée est λ = x−x a . Pour que cette valeur de λ soit
A
bien ( une solution de tout le système, il faut aussi que les deux autres équations soient vérifiées, c’est-à-
y = yA + x−xa b
A
dire x−xA . En réécrivant ces équations, on trouve une condition nécessaire et suffisante
z = zA + a c
pour que M ∈ P : (
bx − ay = bxA − ayA
M ∈P ⇔
cx − az = cxA − azA
Ce sont des équations cartésiennes de D.
Notons que, d’après ce qu’on a vu précédemment, bx − ay = bxA − ayA est l’équation cartésienne d’un
plan dans l’espace, et de même pour cx − az = cxA − azA . La droite D est alors l’intersection de ces
deux plans.
7.2.4 Distance
−→ −→ −−→
On suppose désormais que le repère (O, OI, OJ, OK) est orthonormal (on dit aussi orthonormé),
−→ −→ −−→
c’est-à-dire que c’est un repère orthogonal tel que de plus les vecteurs OI, OJ et OK sont de longueur
52
−−→
1. En utilisant le théorème de Pythagore, on peut alors calculer la longueur de tout vecteur OM .
−−→ p
Proposition 7.9 Soit M un point de coordonnées (x, y, z). Alors la longueur du vecteur OM est x2 + y 2 + z 2 .
Preuve Considérons le point N de coordonnée (x, y, 0), alors le triangle OM N est rectangle en N (on le
−−→ −−→
vérifie en calculant le produit scalaire hON , N M i = x × 0 + y × 0 + 0 × z = 0). Le théorème de Pythagore
donne donc OM 2 = 2 2 2 2 2
p ON + M N , or M N = |z| et ON = x + y (c’est le même calcul que dans le
plan) donc OM = x + y + z .
2 2 2
p
Corollaire 7.10 La distance entre deux points A et B est (xB − xA )2 + (yB − yA )2 + (zB − zA )2 .
Exemple 7.11 On cherche à caractériser l’ensemble des points M dont les coordonnées (x, y, z) satisfont
l’équation (x − 2)2 + (y + 1)2 + (z − 1)2 = 9. En posant A le point de coordonnées (2, −1, 1), cette équation
peu s’écrire AM 2 = 9. On a donc l’équation de la sphère de centre A et de rayon 3.
53