0% ont trouvé ce document utile (0 vote)
14 vues53 pages

M102 Cours

Le document présente un cours d'algèbre et de géométrie, structuré en plusieurs chapitres abordant des thèmes tels que la logique, les ensembles, les relations, l'arithmétique, les nombres complexes, les polynômes et la géométrie. Chaque chapitre est détaillé avec des sous-sections qui expliquent les concepts fondamentaux et les méthodes associées. L'objectif est d'offrir une base solide en mathématiques pour les étudiants de première année à l'Université Paris-Saclay.

Transféré par

micheldjomo2006
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
14 vues53 pages

M102 Cours

Le document présente un cours d'algèbre et de géométrie, structuré en plusieurs chapitres abordant des thèmes tels que la logique, les ensembles, les relations, l'arithmétique, les nombres complexes, les polynômes et la géométrie. Chaque chapitre est détaillé avec des sous-sections qui expliquent les concepts fondamentaux et les méthodes associées. L'objectif est d'offrir une base solide en mathématiques pour les étudiants de première année à l'Université Paris-Saclay.

Transféré par

micheldjomo2006
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

M102 - Algèbre et géométrie

Franck Benoist

L1S1 - Université Paris-Saclay


2
Table des matières

1 Logique et raisonnements 5
1.1 Énoncés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Connecteurs logiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Tautologies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4 Quelques types de raisonnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2 Ensembles et applications 13
2.1 Ensembles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3 Cas des ensembles finis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

3 Relations sur un ensemble 23


3.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.2 Relations d’équivalence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.3 Relations d’ordre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

4 Arithmétique 27
4.1 Divisibilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.2 Division euclidienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.3 Algorithme d’Euclide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.4 Décomposition en facteurs premiers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.5 Congruences et Z/dZ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

5 Nombres complexes 35
5.1 Définitions et premières propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
5.2 Interprétation géométrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.3 Quelques équations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

6 Polynômes 41
6.1 Définitions et premières propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
6.2 Racines d’un polynôme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
6.3 Factorisation des polynômes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

7 Géométrie dans le plan et dans l’espace 49


7.1 Géométrie dans le plan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
7.1.1 Coordonnées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
7.1.2 Droites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
7.1.3 Distance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
7.2 Géométrie dans l’espace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
7.2.1 Coordonnées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
7.2.2 Plan dans l’espace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
7.2.3 Droite dans l’espace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
7.2.4 Distance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

3
4
Chapitre 1

Logique et raisonnements

Objectif : donner quelques règles logiques pour des raisonnements mathématiques rigoureux

1.1 Énoncés
On va considérer dans la suite des énoncés, qui peuvent être vrais ou faux. On utilisera aussi souvent
les valeurs de vérité 0 (pour faux) et 1 (pour vrai).

Exemple 1.1

1. P : 3 ≤ 5. P est vrai.
2. Q : 5 est pair. Q est faux.
3. R : Le ciel est bleu.
Parfois, les énoncés dépendent de variables (on notera P (x) pour un énoncé qui dépend d’une variable
x). Il faudra alors donner des valeurs (pas forcément numériques) à ces variables avant de pouvoir dire
si ces énoncés sont vrais ou faux.

Exemple 1.2

1. P (n) : n est un nombre premier.


P (3) est vrai et P (4) est faux.
2. Q(X, Y ) : X est un ensemble contenu dans l’ensemble Y .
Q(N, R) est vrai.
On appelle théorème un énoncé mathématique dont on a pu montrer qu’il est vrai. On utilise aussi
parfois d’autres termes, selon l’importance qu’on accorde à ces théorèmes : proposition, propriété (pour
des théorèmes de moindre importance), lemme (un résultat préliminaire pour démontrer un théorème),
corollaire (une conséquence facile d’un théorème).

1.2 Connecteurs logiques


On peut utiliser différents connecteurs logiques pour construire des énoncés à partir d’autres énoncés.

Négation (non,¬)
Si P est un énoncé, on peut considérer sa négation non P (notée aussi parfois ¬P ). L’énoncé non P est
vrai exactement quand P est faux. On utilise souvent des tables de vérité pour résumer ces propriétés :

P non P
0 1
1 0

5
Exemple 1.3

1. P : 5 est pair ; non P : 5 est impair.


P est faux ; non P est vrai.
2. Q(X, Y ) : X est contenu dans Y ; non Q(X, Y ) : X n’est pas contenu dans Y (attention, ce n’est
pas : Y est contenu X)
3. R : le chat est noir ; non R : le chat n’est pas noir.
Conjonction (et, ∧)
Si P et Q sont des énoncés, on peut construire l’énoncé P et Q (noté aussi parfois P ∧ Q). L’énoncé
P et Q est vrai exactement quand P et Q sont tous les deux vrais :
P Q P et Q
0 0 0
1 0 0
0 1 0
1 1 1

Exemple 1.4
P (n) : n est un nombre impair et n est un nombre premier.
P (2) est faux (car 2 est pair), P (9) est faux (car 9 n’est pas premier), P (3) est vrai.
On
( utilise aussi parfois une accolade, en particulier quand on écrit des systèmes d’équations :
x+y =3
signifie x + y = 3 et x − y = 1.
x−y =1
Quand on utilise plusieurs connecteurs logiques et qu’il y a risque de confusion, on utilise des parenthèses.

Exemple 1.5

1.
P Q non (P et Q) (non P) et Q
0 0 1 0
1 0 1 0
0 1 1 1
1 1 0 0
Les énoncés non (P et Q) d’une part, (non P ) et Q d’autre part, n’ont pas les mêmes valeurs de
vérité, on évite donc d’écrire non P et Q, qui serait ambigu.
2. Les énoncés (P et Q) et R d’une part, P et (Q et R) d’autre part, ont mêmes valeur de vérité
(on le constate en écrivant les tables de vérité), on peut donc se permettre d’écrire P et Q et R.
Disjonction (ou, ∨)
Si P et Q sont des énoncés, on peut construire l’énoncé P ou Q (noté aussi parfois P ∨ Q). L’énoncé
P ou Q est vrai exactement quand P est vrai ou Q est vrai (éventuellement les deux) :
P Q P ou Q
0 0 0
1 0 1
0 1 1
1 1 1
Si on veut exprimer le "ou exclusif" (P est vrai ou Q est vrai mais pas les deux), on peut utiliser les
connecteurs précédents et écrire (P ou Q) et non (P et Q) :
P Q (P ou Q) et non (P et Q)
0 0 0
1 0 1
0 1 1
1 1 0

6
Implication (⇒, si ... alors ...)
Si P et Q sont des énoncés, on peut construire l’énoncé P ⇒ Q (si P alors Q). L’énoncé P ⇒ Q est vrai
exactement quand P est faux ou Q est vrai :

P Q P⇒Q
0 0 1
1 0 0
0 1 1
1 1 1

Dans l’implication P ⇒ Q, P s’appelle la prémisse et Q la conclusion.

Exemple 1.6 P (n) : n ≥ 4 ⇒ n ≥ 2. (Si n ≥ 4, alors n ≥ 2.)


L’énoncé P (n) est vrai pour tout entier n (en utilisant les propriétés de l’ordre et le fait que 4 ≥ 2). On
peut voir les différentes situations où une implication est vraie pour différentes valeurs de n :
P (1) est vrai : la prémisse est fausse et la conclusion est fausse.
P (3) est vrai : la prémisse est fausse et la conclusion est vraie.
P (5) est vrai : la prémisse est vraie et la conclusion est vraie.

Exemple 1.7 "Si je me couche tôt ce soir, alors le jour se lèvera demain". C’est vrai car la conclusion
est vraie (il n’est même pas nécessaire de savoir si la prémisse est vraie ou fausse). L’implication au sens
logique ne correspond donc pas à la recherche de cause.

Une manière peut-être plus intuitive de justifier la table de vérité d’une implication est de considérer sa
négation : P ⇒ Q est faux exactement quand P est vrai mais Q est faux.

Exemple 1.8 Si je joue au loto, alors je gagne au loto. C’est faux car il est possible que la prémisse
soit vraie (je joue au loto) mais que la conclusion soit fausse (je ne gagne pas au loto).

Attention : pour une implication P ⇒ Q, ne pas confondre sa négation non (P ⇒ Q), l’implication
réciproque Q ⇒ P , et l’implication contraposée (non Q) ⇒ (non P ) (que l’on verra plus tard).

P Q P⇒Q non (P ⇒ Q) Q⇒ P (non Q) ⇒ (non P)


0 0 1 0 1 1
1 0 0 1 1 0
0 1 1 0 0 1
1 1 1 0 1 1

Exemple 1.9 L’implication "si j’ai gagné au loto, alors j’ai joué au loto" est toujours vraie.
Sa négation "j’ai gagné au loto et je n’ai pas joué" est toujours fausse.
L’implication réciproque "si j’ai joué au loto, alors j’ai gagné au loto" peut être fausse (voir plus haut).
L’implication contraposée "si je n’ai pas joué au loto, alors je n’ai pas gagné au loto" est toujours vraie.

Équivalence (⇔, équivalent à, si et seulement si)


Si P et Q sont des énoncés, on peut construire l’énoncé P ⇔ Q (P est équivalent à Q, P si et seulement
si Q, qu’on écrit souvent P ssi Q). L’énoncé P ⇔ Q est vrai exactement quand P et Q ont la même
valeur de vérité (tous les deux vrais ou tous les deux faux), ou encore quand P ⇒ Q et Q ⇒ P sont
vrais :
P Q P⇔Q
0 0 1
1 0 0
0 1 0
1 1 1

Exemple 1.10

1. x est supérieur ou égal à 4 ssi x n’est pas strictement inférieur à 4.

7
2. L’eau gèle si et seulement si sa température est portée à 0◦ C ou moins.

Quantificateur universel (∀, pour tout, quelque soit)


Si P (x) est un énoncé qui dépend d’une variable x (et peut-être d’autres), on peut construire l’énoncé
∀x P (x) (pour tout x, P (x) ; quelque soit x, P (x)). L’énoncé ∀x P (x) est vrai exactement quand P (x)
est vrai pour toutes les valeurs de x. L’énoncé ∀x P (x) ne dépend plus de la variable x, on n’a pas besoin
de donner une valeur à x pour savoir si ∀x P (x) est vrai ou faux.

Exemple 1.11 1. ∀x x2 ≥ 0
2. ∀a ∀b (a + b)2 = a2 + 2ab + b2

Souvent, on précise dans quel ensemble peut varier la variable x. On écrit ∀x ∈ X P (x) pour dire
∀x (x ∈ X ⇒ P (x)). On peut aussi imposer des conditions sur x, par exemple ∀x ≥ 2 x2 ≥ 4 signifie
∀x (x ≥ 2 ⇒ x2 ≥ 4).

Quantificateur existentiel (∃, il existe ... tel que)


Si P (x) est un énoncé qui dépend d’une variable x (et peut-être d’autres), on peut construire l’énoncé
∃x P (x) (il existe x tel que P (x)). L’énoncé ∃x P (x) est vrai exactement quand il existe au moins une
valeur de x telle que P (x) soit vrai. L’énoncé ∃x P (x) ne dépend plus de la variable x, on n’a pas besoin
de donner une valeur à x pour savoir si ∃x P (x) est vrai ou faux.
On utilisera aussi la variante suivante : ∃!x P (x) (il existe un unique x tel que P (x)). Cet énoncé est
vrai quand il existe exactement une valeur de x telle que P (x) soit vrai.
Comme pour le quantificateur universel, on peut préciser un ensemble auquel appartient la variable x ou
une condition qu’elle doit satisfaire : ∃x ∈ X P (x) signifie ∃x (x ∈ X et P (x)).

Exemple 1.12 ∃x ∈ C x2 + 1 = 0

Attention : quand on utilise plusieurs quantificateurs différents, l’ordre dans lequel on les écrit est im-
portant. Par exemple, ∀x ∈ R ∃y ∈ R y < x est vrai : pour tout réel x, on peut trouver un réel y (qui
dépend de x) tel que y < x, par exemple y = x − 1. Mais ∃y ∈ R ∀x ∈ R y < x est faux : on ne peut pas
trouver de réel y (choisi une fois pour toute) qui soit strictement plus petit que tous les réels x.

1.3 Tautologies
On dit qu’un énoncé est une tautologie s’il est toujours vrai, indépendamment des valeurs de vérité
des énoncés qui le composent.

Exemple 1.13 1. P ou (non P ) est une tautologie


2. P ou Q n’est pas une tautologie : cet énoncé est faux quand P et Q le sont
3. ((P ⇒ Q) et (Q ⇒ R)) ⇒ (P ⇒ R) est une tautologie

On peut souvent vérifier qu’un énoncé est une tautologie en écrivant sa table de vérité :

P Q R P⇒Q Q⇒R (P⇒ Q) et (Q⇒ R) P⇒R ((P⇒ Q) et (Q⇒ R))⇒ (P⇒ R)


0 0 0 1 1 1 1 1
1 0 0 0 1 0 0 1
0 1 0 1 0 0 1 1
1 1 0 1 0 0 0 1
0 0 1 1 1 1 1 1
1 0 1 0 1 0 1 1
0 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1

Pour cet exemple, on peut aussi faire le raisonnement suivant. Pour montrer qu’une implication est vraie,
on suppose que la prémisse est vraie, et on cherche à montrer que la conclusion est vraie (c’est une consé-
quence de la table de vérité de l’implication : si la prémisse est fausse, on sait déjà que l’implication est

8
vraie). Supposons que (P ⇒ Q) et (Q ⇒ R) est vrai, on veut montrer que P ⇒ R est vrai. On suppose
donc que P est vrai. Comme P ⇒ Q est vrai, Q est vrai. Comme Q ⇒ R est vrai, R est vrai. Ainsi,
P ⇒ R est vrai, et on conclut que ((P ⇒ Q) et (Q ⇒ R)) ⇒ (P ⇒ R) est une tautologie.

Voici quelques autres tautologies :


1. (P et Q) ⇒ P ; (P et Q) ⇒ Q
2. P ⇒ (P ou Q) ; Q ⇒ (P ou Q)
3. ((∀x P (x)) ou (∀x Q(x))) ⇒ (∀x (P (x) ou Q(x))) (attention, l’implication réciproque n’est pas
toujours vraie)
4. (∃x (P (x) et Q(x)) ⇒ ((∃x P (x)) et (∃x Q(x))) (attention, l’implication réciproque n’est pas
toujours vraie)
5. ((P ⇔ Q) et (Q ⇔ R)) ⇒ (P ⇔ R)
6. P ⇒ (Q ⇒ P )
Quand un énoncé de la forme P ⇔ Q est une tautologie (pour des énoncés particuliers P et Q), on
dit que P et Q sont équivalents entre eux. Il existe un grand nombre d’équivalences (en fait une infinité),
voici une liste de celles qu’on utilise fréquemment dans les raisonnements mathématiques :
1. P est équivalent à non non P
2. Lois de Morgan : non (P et Q) est équivalent à (non P ) ou (non Q) ; non (P ou Q) est équivalent
à (non P ) et (non Q)
3. Distributivité : (P et Q) ou R est équivalent à (P ou R) et (Q ou R) ; (P ou Q) et R est équi-
valent à (P et R) ou (Q et R)
4. non (∃x P (x)) est équivalent à ∀x (non P (x))
5. non (∀x P (x)) est équivalent à ∃x (non P (x))
6. Contraposée : P ⇒ Q est équivalent à (non Q) ⇒ (non P )
7. ∀x (P (x) et Q(x)) est équivalent à (∀x P (x)) et (∀x Q(x)) (attention, ça devient faux si on
remplace et par ou)
8. ∃x (P (x) ou Q(x)) est équivalent à (∃x P (x)) ou (∃x Q(x)) (attention, ça devient faux si on
remplace ou par et)

1.4 Quelques types de raisonnement


On peut déduire des tautologies précédentes quelques types de raisonnement souvent utilisés.

Modus ponens
Si P est vrai et P ⇒ Q est vrai, alors Q est vrai. Par exemple, pour montrer un théorème T , on commence
par montrer un lemme L, puis on montre que le lemme implique le théorème (L ⇒ T ).

Raisonnement par contraposée


On a vu que P ⇒ Q est équivalent à (non Q) ⇒ (non P ). Il est parfois plus facile, plutôt que de montrer
directement P ⇒ Q (on suppose que P est vrai et on cherche à prouver que Q est vrai), de montrer la
contraposée (non Q) ⇒ (non P ) (on suppose que Q est faux et on cherche à prouver que P est faux).

Exemple 1.14 Soit n un entier. Montrons que si n2 est pair, alors n est pair. Cela revient à montrer la
contraposée de cette implication : si n est impair, alors n2 est impair. Supposons que n est impair, on peut
l’écrire n = 2k+1 pour un certain entier k. On calcule alors n2 = (2k+1)2 = 4k 2 +4k+1 = 2(2k 2 +2k)+1 :
c’est un nombre impair.
Raisonnement par l’absurde
C’est une variante du raisonnement par contraposée. Pour montrer qu’un énoncé P est vrai, on suppose
que P est faux et on cherche à aboutir à un énoncé F dont on sait qu’il est faux. Si on y parvient, on a
montré l’implication (non P ) ⇒ F , et donc, par contraposée, l’implication (non F ) ⇒ (non non P ) (et

9
donc (non F ) ⇒ P car non non P est équivalent à P ). Comme F est faux, non F est vrai, et donc P
aussi.
a b
Exemple 1.15 Soient a et b deux nombres réels positifs tels que 1+b = 1+a . Montrer que a = b.
a b
On suppose par l’absurde que a 6= b. Comme 1+b = 1+a , on obtient a(1 + a) = b(1 + b), ou encore
a2 − b2 = b − a, puis en factorisant (a − b)(a + b) = −(a − b). Comme on a supposé que a 6= b, on peut
diviser par a − b (qui est non-nul), et on obtient a + b = −1 : c’est faux car la somme de deux nombres
positifs ne peut pas valoir −1. On a donc monté que a = b.
Raisonnement par contre-exemple
Comme non (∀x P (x)) est équivalent à ∃x (non P (x)), pour montrer que ∀x P (x) est faux, il suffit de
trouver un contre-exemple, c’est-à-dire trouver x tel que P (x) soit faux.

Exemple 1.16 Montrons que l’énoncé suivant est faux : pour tout entier n, si n est divisible par 6 et
par 4, alors n est divisible par 24.
On cherche une valeur particulière de n telle que cette implication soit fausse, c’est-à-dire telle que la
prémisse soit vraie mais la conclusion fausse. On peut prendre n = 12 : 12 = 6 × 2 = 4 × 3 est divisible
par 6 et par 4, mais il n’est pas divisible par 24.
Raisonnement par équivalence
D’après la tautologie ((P ⇔ Q) et (Q ⇔ R)) ⇒ (P ⇔ R), si on montre une suite d’équivalences
P1 ⇔ P2 ⇔ . . . ⇔ Pn , alors on a obtenu P1 ⇔ Pn . C’est ce qu’on utilise en particulier quand on cherche
à résoudre des équations. Par exemple, 2x + 3 = 7 ⇔ 2x = 4 ⇔ x = 2 : la seule solution de l’équation
2x + 3 = 7 est x = 2. Dans ce type de raisonnement, il faut prendre garde à bien écrire des équivalences.
Par exemple, dans ce qui précède, l’équation 1 implique l’équation 2 (en retranchant 3) et l’équation 2
implique l’équation 1 (en ajoutant 3), l’équation 2 implique l’équation 3 (en divisant par 2) et l’équation
3 implique l’équation 2 (en multipliant par 2).

Exemple 1.17 Le raisonnement suivant n’est pas correct :



x + y = 1
 (
y =1−x
x−y =3 ⇔

 x − (1 − x) = 3
x − 2y = 1
(
2x = 4

y =1−x
(
x=2

y = −1

Dans le passage du premier système au second, l’implication directe est vraie (on retranche x dans la
première équation, puis on remplace y par sa valeur dans la deuxième équation), mais pas l’implication
réciproque (on a oublié la troisième équation du premier système, et on ne peut pas la retrouver à partir
du second système).
En fait, on obtient seulement 
x + y = 1

(
x=2
x−y =3 ⇒

 y = −1
x − 2y = 1

 que la seule solution possible au système est x = 2 et y = −1. Mais ce n’est pas une
ce qui signifie
2 + (−1) = 1

solution car 2 − (−1) = 3 est faux, donc le système n’a pas de solution.


2 − 2 × (−1) = 1

Raisonnement par récurrence


Ce type de raisonnement n’est pas aussi général que les précédents ; il ne s’applique que lorsque l’on
veut démontrer une propriété P (n) qui dépend d’un entier n. Nous le signalons ici car il est très souvent

10
utilisé.
Pour un énoncé P (n) qui porte sur un entier n, et n0 un certain entier fixé, si P (n0 ) est vrai et si pour
tout n ≥ n0 , P (n) ⇒ P (n + 1) est vrai, alors pour tout n ≥ n0 , P (n) est vrai. C’est une application en
cascade du principe du modus ponens : P (n0 ) est vrai par hypothèse ; comme P (n0 ) ⇒ P (n0 + 1) est
vrai, P (n0 + 1) est vrai ; comme P (n0 + 1) ⇒ P (n0 + 2) est vrai, P (n0 + 2) est vrai ; etc...

Exemple 1.18 On cherche à donner une formule pour calculer la somme des n premiers nombres en-
tiers.
Notation : on note
Xn
i = 0 + 1 + . . . + n.
i=0

Plus généralement, pour une suite (ui ), on note la somme des ui pour i allant de 0 à n
n
X
ui = u0 + u1 + . . . + un .
i=0

On a une notation similaire pour le produit des ui pour i allant de 0 à n :


n
Y
ui = u0 × u1 × . . . × un .
i=0

Revenons à notre problème : on va montrer par récurrence sur n ≥ 0 l’énoncé


n
X n(n + 1)
P (n) : i=
i=0
2

P (0) est vrai : 0 = 0×1


2 .
Pour tout n ≥ 0, on montre que P (n) ⇒ P (n + 1) : on suppose que P (n) est vrai (pour ce n donné) et
on cherche à montrer que P (n + 1) est vrai :
n+1
X n 
X
i= i + (n + 1)
i=0 i=0
n(n + 1)
= + (n + 1) en utilisant P (n)
2
n 
= (n + 1) +1 en factorisant par n + 1
2
(n + 1)(n + 2)
=
2
C’est exactement l’énoncé P (n + 1). On a donc montré par récurrence que P (n) est vrai pour tout entier
n ≥ 0.

11
12
Chapitre 2

Ensembles et applications

2.1 Ensembles
Les ensembles sont des collections d’objets, qu’on appelle éléments de l’ensemble (ceci n’est pas une
définition, seulement une manière de décrire les ensembles). Si X est un ensemble, on note x ∈ X pour
dire que x appartient à X, ou encore x est un élément de X (et x 6∈ X pour la négation de x ∈ X). Le
point essentiel est qu’un ensemble est déterminé par ses éléments, c’est-à-dire que l’énoncé suivant est
vrai :
X = Y ⇔ (∀x (x ∈ X ⇔ x ∈ Y )),
ou encore : deux ensembles sont égaux ssi ils ont exactement les mêmes éléments.
On peut préciser : on dit que l’ensemble X est inclus (ou contenu) dans l’ensemble Y , ou encore que
X est un sous-ensemble de Y , si ∀x (x ∈ X ⇒ x ∈ Y ). On note alors X ⊂ Y .

Proposition 2.1 X = Y ssi (X ⊂ Y et Y ⊂ X).

Preuve D’après les tautologies vues au chapitre précédent, (∀x (x ∈ X ⇒ x ∈ Y )) et (∀x (x ∈ Y ⇒ x ∈


X)) est équivalent à ∀x ∈ X ((x ∈ X ⇒ x ∈ Y ) et (x ∈ Y ⇒ x ∈ X)), c’est-à-dire ∀x (x ∈ X ⇔ x ∈ Y ),
ce qui est équivalent à X = Y . 
On note souvent X ( Y pour dire que X est inclus dans Y mais X 6= Y : tous les éléments de X
appartiennent à Y mais il existe (au moins) un élément de Y qui n’est pas dans X.

On a plusieurs moyens pour décrire des ensembles. On peut déjà considérer certains ensembles qu’on
considère bien connus : N, R, . . .. Pour des ensembles finis (c’est-à-dire des ensembles avec un nombre fini
d’éléments), il suffit d’en faire la liste ; on note {a1 , . . . , an } l’ensemble dont les éléments sont exactement
a1 , . . . , an . L’ordre et les éventuelles répétitions n’ont pas d’importance : par exemple, {1, 2, 1}, {2, 1} et
{1, 2} représentent le même ensemble.
On peut aussi utiliser des ensembles connus pour décrire de nouveaux ensembles. Si X est un ensemble
et P (x) un énoncé qui dépend d’une variable dans X, on peut regarder le sous-ensemble de X formé des
éléments tels que P (x) est vrai, on le note

{x ∈ X; P (x)}.

Exemple 2.2 {n ∈ N; ∃k ∈ N n = 2k} est l’ensemble des entiers naturels pairs.


R+ = {x ∈ R; x ≥ 0}

En particulier, on peut choisir pour P (x) un énoncé qui est toujours faux :

{x ∈ X; x 6= x}.

Cet ensemble n’a aucun élément, on l’appelle l’ensemble vide et on le note ∅. Il n’y a qu’un ensemble
vide (il est caractérisé par le fait qu’il n’a pas d’élément).

Proposition 2.3 Pour tout ensemble X, ∅ ⊂ X.

13
Preuve ∀x (x ∈ ∅ ⇒ x ∈ X) est vrai car x ∈ ∅ est toujours faux. 

Soient X et Y deux ensembles, on définit :


1. la réunion de X et Y , dont les éléments sont les objets qui appartiennent à X ou à Y (éventuel-
lement aux deux) :
x ∈ X ∪ Y ⇔ x ∈ X ou x ∈ Y

2. l’intersection de X et Y , dont les éléments sont les objets qui appartiennent à la fois à X et à Y :

x ∈ X ∩ Y ⇔ x ∈ X et x ∈ Y

On peut aussi écrire X ∩ Y = {x ∈ X; x ∈ Y } = {x ∈ Y ; x ∈ X}.


On dit que X et Y sont disjoints si X ∩ Y = ∅ (il n’y a pas d’éléments à la fois dans X et Y ).
3. la différence X privé de Y , dont les éléments sont les éléments de X qui n’appartiennent pas à Y :

x ∈ X \ Y ⇔ x ∈ X et non x ∈ Y

On peut aussi écrire X \ Y = {x ∈ X; x 6∈ Y }.

Exemple 2.4 R∗ = R \ {0} = {x ∈ R; x 6= 0}

Si Y est un sous-ensemble de X, on dit aussi que X \ Y est le complémentaire de Y dans X.


Parfois, l’ensemble X est sous-entendu, et on dit seulement que X \ Y est le complémentaire de
Y , et on note Y c .

Exemple 2.5 Dans l’ensemble N, soit P le sous-ensemble des entiers naturels pairs. Alors Pc , le
complémentaire de P (sous-entendu : dans N) est le sous-ensemble des entiers naturels impairs.
Dans R, [1, 3]c =] − ∞, 1[∪]3, +∞[.

4. la différence symétrique de X et de Y , dont les éléments sont les objets qui appartiennent à X ou
à Y mais pas aux deux :

X∆Y = (X ∪ Y ) \ (X ∩ Y ) = (X \ Y ) ∪ (Y \ X)

5. l’ensemble des parties de X, dont les éléments sont les sous-ensembles de X :

Y ∈ P(X) ⇔ Y ⊂ X

Exemple 2.6 Si X = {1, 2}, alors P(X) = {∅, {1}, {2}, {1, 2}}.

Définition 2.7 Pour deux objets x et y, on définit le couple (x, y). Il est caractérisé par la propriété
suivante :
(x, y) = (x′ , y ′ ) ⇔ (x = x′ et y = y ′ ).

Remarque 2.8 Ne pas confondre le couple (x, y) avec la paire {x, y}. Par exemple, (1, 2) 6= (2, 1) mais
{1, 2} = {2, 1}.

Définition 2.9 Pour deux ensembles X et Y , on définit le produit cartésien X × Y : c’est l’ensemble
dont les éléments sont tous les couples (x, y) avec x ∈ X et y ∈ Y .

Définition 2.10 Plus généralement, pour tout entier n ≥ 1, on définit le n-uplet (x1 , . . . , xn ), caractérisé
par le fait que
(x1 , . . . , xn ) = (x′1 , . . . , x′n ) ⇔ (x1 = x′1 et . . . et xn = x′n ).
Pour n ensembles X1 , . . . , Xn , on définit le produit cartésien X1 × . . . × Xn : c’est l’ensemble dont les
éléments sont tous les n-uplets (x1 , . . . , xn ) avec x1 ∈ X1 , . . . , xn ∈ Xn .
On note X n = X × . . . × X (n fois).

14
2.2 Applications
Soient X et Y deux ensembles. Une application f de X dans Y , notée f : X → Y , est un objet f qui
à tout élément x ∈ X associe un élément de Y , noté f (x). On écrit souvent x →
7 f (x). On dit que X est
l’ensemble de départ de f et Y l’ensemble d’arrivée.

Exemple 2.11 Pour tout ensemble X, on peut définir l’application identité, notée id ou idX :

id : X → X
x 7→ x

En choisissant un élément y de Y , on peut définir l’application constante égale à y :

X → Y
x 7→ y

On peut aussi utiliser le terme fonction au lieu d’application. De manière générale, une fonction f de X
dans Y est une application de X ′ dans Y pour un certain sous-ensemble X ′ de X, appelé le domaine de
définition de f .
1
Exemple 2.12 La fonction x 7→ x de R dans R désigne l’application de R∗ dans R qui à tout x ∈ R∗
associe x1 .

Définition 2.13 Soit une application f : X → Y . Le graphe de f est l’ensemble de tous les couples
(x, f (x)) avec x ∈ X. C’est un sous-ensemble de X × Y .

Remarque 2.14 On a l’habitude des applications de R dans R (souvent définies par des formules).
Comme le graphe d’une application f : R → R est un sous-ensemble du plan R2 , on peut le représenter
graphiquement. Par exemple, si f : R → R est définie par f (x) = x + 1, le graphe de f est la droite
d’équation y = x + 1.
Mais la notion de graphe existe pour toutes les applications, même quand il n’existe pas d’interprétation
graphique. Par exemple, si X est l’ensemble des étudiants de la promo et Y l’ensemble des lycées, on
peut considérer l’application f : X → Y qui à chaque étudiant associe son lycée d’origine. Le graphe de
f est alors l’ensemble des couples formés d’un étudiant et de son lycée d’origine.

Proposition 2.15 Soit G un sous-ensemble de X × Y . Alors G est le graphe d’une certaine application
f : X → Y ssi ∀x ∈ X ∃!y ∈ Y (x, y) ∈ G.
Preuve Si G est le graphe d’une application f : X → Y , G est l’ensemble des couples (x, f (x)) avec
x ∈ X. Donc, pour tout x ∈ X, le seul y ∈ Y tel que (x, y) ∈ G est y = f (x).
Réciproquement, si G vérifie la propriété ∀x ∈ X ∃!y ∈ Y (x, y) ∈ G, on peut définir une application
f : X → Y , qui à tout x ∈ X associe l’unique y ∈ Y tel que (x, y) ∈ G. Alors le graphe de f est G :
si (x, y) ∈ G, alors y = f (x) donc (x, y) est dans le graphe de f ; réciproquement si (x, y) est dans le
graphe de f , cela signifie que y = f (x) et donc (x, y) ∈ G. 

Remarque 2.16 On peut aussi voir par l’argument précédent qu’une application est complètement dé-
terminée par son graphe.

Remarque 2.17 En prenant X = ∅, ∅ × Y = ∅ et G = ∅, vu comme sous ensemble de ∅ × Y vérifie la


propriété qui caractérise les graphes :

∀x(x ∈ ∅ ⇒ (∃!y ∈ Y (x, y) ∈ G))

puisque x ∈ ∅ est toujours faux. On appelle application vide l’application de ∅ dans Y associée à ce
graphe, c’est la seule application de ∅ dans Y .

Définition 2.18 Soit une application f : X → Y , et X ′ un sous-ensemble de X. La restriction de f à


X ′ , notée f|X ′ , est l’application de X ′ dans Y qui à tout x dans X associe f (x).

15
Exemple 2.19 Soit l’application f : R → R définie par f (x) = x2 . Alors f|N est l’application

f|N : N → R
x 7→ x2

Définition 2.20 Soient deux applications f : X → Y et g : Y → Z. On définit l’application composée


g ◦ f : c’est l’application de X dans Z qui à tout x dans X associe g(f (x)).

Exemple 2.21 Soient f et g les applications de R dans R définies par f (x) = x + 1 et g(x) = x2 . Alors
f ◦ g et g ◦ f sont des applications de R dans R, définies par f ◦ g(x) = x2 + 1 et g ◦ f (x) = (x + 1)2 .

Remarque 2.22 Attention : on ne peut définir g ◦ f que si l’ensemble d’arrivée de f est le même que
l’ensemble de départ de g.

Proposition 2.23 Soit une application f : X → Y . Alors f ◦ idX = f et idY ◦ f = f .


Preuve Il suffit de calculer, pour tout x ∈ X : f ◦idX (x) = f (idX (x)) = f (x) et idY ◦f (x) = idY (f (x)) =
f (x). 

Définition 2.24 Soit une application f : X → Y .


1. Soit X ′ un sous-ensemble de X. On appelle image directe de X ′ par f , et on note f (X ′ ), le
sous-ensemble de Y dont les éléments sont tous les f (x) avec x ∈ X ′ , ou encore

f (X ′ ) = {y ∈ Y ; ∃x ∈ X ′ y = f (x)}.

2. Soit Y ′ un sous-ensemble de Y . On appelle image réciproque de Y ′ par f , et on note f −1 (Y ′ ), le


sous-ensemble suivant de X
f −1 (Y ′ ) = {x ∈ X; f (x) ∈ Y ′ }

Exemple 2.25 Soit l’application f : R → R définie par f (x) = x2 .


Montrons que f ([0, 2]) = [0, 4]. Si 0 ≤ x ≤ 2, alors 0 ≤ x2 ≤ 4, ce qui montre que f ([0, 2]) ⊂ [0, 4]. Puis,
√ √
pour l’inclusion réciproque, si y ∈ [0, 4], y ∈ [0, 2], ce qui montre que y = f ( y) ∈ f ([0, 2]). On conclut
que f ([0, 2]) = [0, 4].
Montrons que f −1 ([0, 4]) = [−2, 2]. Si x ∈ [−2, 2], alors f (x) ∈ [0, 4], ce qui signifie que x ∈ f −1 ([0, 4]).
Puis, plutôt que de montrer l’implication réciproque, on montre la contraposée de l’implication réciproque :
si x 6∈ [−2, 2], alors x > 2 ou x < −2, et dans les deux cas, f (x) > 4 donc x 6∈ f −1 ([0, 4]). On conclut
que f −1 ([0, 4]) = [−2, 2].

Définition 2.26 Soit une application f : X → Y . On dit que f est surjective, ou que f est une surjec-
tion, ssi f (X) = Y .
Cela revient à dire, puisque l’inclusion f (X) ⊂ Y est toujours vraie, que

∀y ∈ Y ∃x ∈ X f (x) = y.

Remarque 2.27 Attention, cette notion dépend de l’ensemble d’arrivée Y .


Par exemple, si f : R → R est l’application définie par f (x) = x2 , on voit facilement que f (R) = R+ ( R,
donc f n’est pas surjective. Mais pour g : R → R+ définie par g(x) = x2 (définie par la même formule
que f mais avec un ensemble d’arrivée différent), alors on a de la même manière g(R) = R+ ce qui
donne cette fois que g est surjective.

Définition 2.28 Soit une application f : X → Y . On dit que f est injective, ou que f est une injection,
ssi :
∀x ∈ X ∀x′ ∈ X (x 6= x′ =⇒ f (x) 6= f (x′ )),
ou, de manière équivalente, en considérant la contraposée :

∀x ∈ X ∀x′ ∈ X (f (x) = f (x′ ) =⇒ x = x′ ).

16
Exemple 2.29 1. L’application f : R → R définie par f (x) = x + 1 est injective : pour tous réels x
et x′ , si x + 1 = x′ + 1, alors x = x′ .
2. L’application f : R → R définie par f (x) = x2 n’est pas injective : il suffit de trouver deux réels
distincts qui ont la même image par f , par exemple f (2) = f (−2) = 4.
3. Soit X l’ensemble des étudiants de la promo et f : X → N l’application qui à tout étudiant
associe son numéro d’étudiant. Alors f est injective : deux étudiants différents ont leurs numéros
d’étudiant différents. Et f n’est pas surjective : il suffit pour le voir de trouver un entier qui n’est
le numéro d’étudiant d’aucun étudiant.

Définition 2.30 Soit une application f : X → Y . On dit que f est bijective, ou que f est une bijection,
ssi f est à la fois injective et surjective.

Exemple 2.31 Pour tout ensemble X, l’application identité idX : X → X est bijective. En effet, comme
idX (x) = x, si idX (x) = idX (x′ ), alors x = x′ , donc idX est injective. Et pour tout x ∈ X, x = idX (x) ∈
idX (X) : idX est surjective.

Remarque 2.32 Soit f : X → Y une application. Dire que f est surjective, c’est dire que pour tout
y ∈ Y , il existe au moins un x ∈ X tel que f (x) = y. Dire que f est injective, c’est dire que si
f (x) = f (x′ ), alors x = x′ . Et donc dire que f est bijective est équivalent à :

∀y ∈ Y ∃!x ∈ X f (x) = y.

Théorème 2.33 Soit une application f : X → Y , où X et Y sont des ensembles non vides.
1. f est injective ssi il existe une application g : Y → X telle que g ◦ f = idX .
2. f est surjective ssi il existe une application g : Y → X telle que f ◦ g = idY .
3. f est bijective ssi il existe une application g : Y → X telle que g ◦ f = idX et f ◦ g = idY .
Preuve
1. On suppose que f est injective. Fixons un élément a ∈ X. On définit g : Y → X par
(
l’unique x ∈ X tel que f (x) = y si un tel x existe
g(y) =
a sinon

Dans le premier cas, x est unique car f est injective, donc f (x) = f (x′ ) = y implique x = x′ .
Vérifions que g ◦ f = idX : pour tout x ∈ X, si y = f (x), g(y) = x car x est l’unique élément tel
que f (x) = y, et ainsi g(f (x)) = x.
Réciproquement, on suppose qu’il existe g : Y → X telle que g ◦ f = idX . Supposons que
f (x) = f (x′ ). En appliquant g, on trouve que g(f (x)) = g(f (x′ )), et donc que x = x′ puisque
g ◦ f = idX .
2. On suppose que f est surjective. On définit g : Y → X de la manière suivante : pour tout y ∈ Y ,
il existe au moins un x ∈ X tel que f (x) = y (car f est surjective), on en choisit un et on pose
g(y) = x. On peut alors vérifier que f ◦ g = idY : pour tout y ∈ Y , posons x = g(y), alors
f (x) = y d’après la construction de g, donc f (g(y)) = y. Remarque : on a utilisé sans le dire pour
la définition de g un axiome appelé l’axiome du choix.
Réciproquement, on suppose qu’il existe g : Y → X telle que f ◦ g = idY . Alors pour tout y ∈ Y ,
en posant x = g(y), on voit que y = f (g(y)) = f (x), donc f est surjective.
3. On suppose que f est bijective. On définit g : Y → X de la manière suivante : pour tout y ∈ Y ,
d’après la remarque précédente, il existe un unique x ∈ X tel que f (x) = y, et on pose g(y) = x.
Alors g ◦ f = idX : si x ∈ X et y = f (x), g(y) = x par définition de g, donc g(f (x)) = x. Et
f ◦ g = idY : si y ∈ Y et x = g(y), alors f (x) = y par définition de g, donc f (g(y)) = y.
Réciproquement, s’il existe une application g : Y → X telle que g ◦ f = idX et f ◦ g = idY , on
peut en particulier en déduire que f est injective d’après le cas 1, et que f est surjective d’après
le cas 2, donc f est bijective.


17
Exemple 2.34 Soit f : R → R l’application définie par f (x) = x2 . On a déjà vu que f (R) = R+ ; on
sait aussi que f (x) = f (x′ ) ssi x = x′ ou x = −x′ . On en déduit les résultats suivants :
1. Soit f : R+ → R définie par f (x) = x2 . Alors f est injective. Construisons g : R → R+ comme
dans la preuve du théorème, avec 0 comme valeur "par défaut" : si y < 0, il n’existe pas de
x ∈ R+ tel que f (x) = y, et on pose donc g(y) = 0 ; si y ≥ 0, l’unique x ∈ R+ tel que f (x) = y
√ √
est x = y, on pose donc g(y) = y. Et on vérifie bien que g ◦ f = idR+ : pour tout x ∈ R+ ,

g(f (x)) = x2 = |x| = x.
2. Soit f : R → R+ définie par f (x) = x2 . Alors f est surjective. Construisons g : R+ → R comme
dans la preuve du théorème : pour tout y ∈ R+ , il existe deux (ou un seul si y = 0) x ∈ R tels que
√ √
f (x) = y, à savoir y et − y, et il faut en choisir un des deux. On peut par exemple définir :
(√
√ √ y si y ∈ Q
g : y 7→ y ou g : y 7→ − y ou g : y 7→ √
− y si y ∈ R+ \ Q

Dans tous les cas, f ◦ g = idR+ : pour tout y ∈ R+ , f (g(y)) = (± y)2 = y.
3. Soit f : R+ → R+ définie par f (x) = x2 . Alors f est bijective. Pour tout y ∈ R+ , l’unique élément
√ √
x ∈ R+ tel que f (x) = y est x = y. On définit donc g : R+ → R+ par g(y) = y, et on vérifie
comme dans les deux cas précédents que g ◦ f = f ◦ g = idR+ .

Proposition et définition 2.35 Soit f : X → Y une application bijective. Alors il existe une unique
application g : Y → X telle que f ◦ g = idY et g ◦ f = idX . On l’appelle application réciproque de f et
on la note f −1 . Pour tout x ∈ X et tout y ∈ Y , on a l’équivalence :

y = f (x) ⇔ f −1 (y) = x

Preuve On sait déjà d’après le théorème précédent qu’il existe une application g : Y → X telle que
f ◦ g = idY et g ◦ f = idX . Reste à montrer que g est unique : si h : Y → X est une autre application telle
que f ◦h = idY et h◦f = idX , on calcule de deux manières g ◦f ◦h = g ◦idY = g et g ◦f ◦h = idX ◦h = h,
et on conclut que g = h.
Puis, si y = f (x), on obtient en appliquant f −1 que f −1 (y) = f −1 (f (x)) = x. Et réciproquement, si
x = f −1 (y), on obtient en appliquant f (x) = f (f −1 (y)) = y. 

Proposition 2.36 Soit f : X → Y une bijection. Alors f −1 : Y → X est aussi une bijection, et
(f −1 )−1 = f .
Preuve L’application réciproque est caractérisée par f ◦ f −1 = idY et f −1 ◦ f = idX . D’après le théo-
rème 2.33, l’existence de f implique que f −1 est bijective, et f = (f −1 )−1 . 

Exemple 2.37 1. Dans l’exemple précédent, avec f : R+ → R+ définie par f (x) = x2 , on a vu que

f : R+ → R+ est définie par f −1 (y) = y.
−1

2. Soit f = idX , alors f −1 = idX car idX ◦ idX = idX .

2.3 Cas des ensembles finis


Soit X un ensemble fini, c’est-à-dire un ensemble avec un nombre fini d’éléments. On appelle cardinal
de X le nombre d’éléments de X, et on note card(X), |X| ou #X. Par exemple, card(∅) = 0.

Proposition 2.38 Soit une application f : X → Y où X et Y sont des ensembles finis.


1. Si f est injective, alors card(X) ≤ card(Y ).
2. Si f est surjective, alors card(X) ≥ card(Y ).
3. Si f est bijective, alors card(X) = card(Y ).
Preuve

18
1. On raisonne par récurrence sur card(X).
Si card(X) = 0, le résultat est évident puisqu’on a nécessairement card(Y ) ≥ 0.
On suppose que le résultat est vrai quand card(X) = n, et on charche à montrer le résultat pour
un ensemble X de cardinal n + 1. Fixons x ∈ X et posons X ′ = X \ {x}, c’est un ensemble de
cardinal n. Notons que pour tout x′ ∈ X, f (x′ ) 6= f (x) car f est injective ; on peut donc définir

g : X′ → Y \ {f (x)}
x′ 7→ f (x′ )

C’est encore une application injective : pour deux éléments distincts x′ et x′′ dans X ′ , f (x′ ) 6=
f (x′′ ) car f est injective et donc g(x′ ) 6= g(x′′ ). Donc d’après l’hypothèse de récurrence card(X ′ ) ≤
card(Y \ {f (x)}). En ajoutant un élément de chaque côté, on trouve bien que card(X) ≤ card(Y ),
ce qui achève la démonstration par récurrence.
2. On va utiliser deux fois le théorème 2.33. Comme f : X → Y est surjective, il existe une application
g : Y → X telle que f ◦ g = idY . Puis, l’existence de f telle que f ◦ g = idY montre que g est
injective. On peut donc appliquer le point précédent : card(Y ) ≤ card(X).
3. Puisque f est bijective, elle est injective et surjective, et on peut donc appliquer les deux points
précédents pour conclure que card(X) = card(Y ).


Remarque 2.39 En prenant les contraposées des implications précédentes, on obtient aussi des résultats
importants :
1. Si card(X) > card(Y ), il n’existe pas d’injection X → Y .
2. Si card(X) < card(Y ), il n’existe pas de surjection X → Y .
3. Si card(X) 6= card(Y ), il n’existe pas de bijection X → Y .
On appelle parfois ces résultats le principe des tiroirs : si on veut ranger m chaussettes dans n tiroirs, avec
m > n, alors un des tiroirs contiendra plus d’une chaussette (car la fonction qui associe à une chaussette
le tiroir dans laquelle on la range ne peut pas être injective). Et si on veut ranger m chaussettes dans n
tiroirs, avec m < n, il y aura au moins un tiroir qui ne contiendra aucune chaussette (car la fonction
qui associe à une chaussette le tiroir dans laquelle on la range ne peut pas être surjective).

Corollaire 2.40 Soient X et Y deux ensembles finis tels que card(X) = card(Y ), et soit une application
f :X →Y.
Alors f est bijective ssi (f est injective ou f est surjective).
En d’autres termes, si f est injective, elle est automatiquement surjective, et si f est surjective, elle est
automatiquement injective.

Preuve Supposons que f : X → Y est injective. Supposons par l’absurde qu’elle n’est pas surjective.
Alors il existe y ∈ Y tel que pour tout x ∈ X, f (x) 6= y. L’application f permet donc de définir une
application de f˜ : X → Y \ {y} avec f˜(x) = f (x) pour tout x ∈ X. Il est clair que f˜ est encore injective.
Or Y \ {y} a un élément de moins que Y , donc aussi que X : c’est impossible d’après le principe des
tiroirs.
Si on suppose maintenant que f est surjective, on trouve d’près le théorème 2.33 une application
g : Y → X telle que f ◦ g = idY . En utilisant encore le théorème 2.33, on en déduit que g est in-
jective, et donc qu’elle est bijective d’après le point précédent. En composant l’égalité f ◦ g = idY par
g −1 , on trouve f ◦ g ◦ g −1 = idY ◦ g −1 , et donc f = g −1 , qui est une application bijective d’après la
proposition 2.36. 

Remarque 2.41 Attention, le résultat est bien entendu faux si on ne suppose pas card(X) = card(Y ),
puisqu’on sait qu’il n’existe pas de bijection entre deux ensembles finis de cardinal différent.

Corollaire 2.42 Soient deux ensembles finis X et Y de même cardinal tel que X ⊂ Y . Alors X = Y .

19
Preuve Comme X ⊂ Y , on peut définir "l’application d’inclusion" :

X → Y
x 7→ x

Cette application est clairement injective, elle est donc surjective, ce qui signifie que pour tout y ∈ Y , il
existe x ∈ X tel que y = x. Ainsi Y ⊂ X et donc X = Y . 

Remarque 2.43 Les corollaires précédents peuvent être généralisés à d’autres situations qui seront vues
par la suite, par exemple en algèbre linéaire.
Le fait suivant est intuitivement clair.

Fait 2.44 Soient X et Y deux ensembles finis disjoints. Alors card(X ∪ Y ) = card(X) + card(Y ).

Corollaire 2.45 Soient X1 , . . . , Xn des ensembles finis deux à deux disjoints. Alors

card(X1 ∪ . . . ∪ Xn ) = card(X1 ) + . . . + card(Xn ).

Preuve On montre le résultat par récurrence sur n ≥ 1.


Si n = 1, le résultat est évident : card(X1 ) = card(X1 ).
Puis on suppose le résultat vrai pour un n ≥ 1, et on veut le montrer pour n + 1. Si X1 , . . . , Xn+1
sont deux à deux disjoints, Xn+1 n’a pas délément commun avec X1 , . . . , Xn , donc il est disjoint de
X1 ∪ . . . ∪ Xn . On peut donc appliquer le fait 2.44 à X1 ∪ . . . ∪ Xn et Xn+1 : card(X1 ∪ . . . ∪ Xn ∪ Xn+1 ) =
card(X1 ∪ . . . ∪ Xn ) + card(Xn+1 ). Or les ensembles X1 , . . . , Xn sont deux à deux disjoints, donc
card(X1 ∪ . . . ∪ Xn ) = card(X1 ) + . . . + card(Xn ) d’après l’hypothèse de récurrence, ce qui permet
de conclure que card(X1 ∪ . . . ∪ Xn+1 ) = card(X1 ) + . . . + card(Xn+1 ). 

Corollaire 2.46 Soient X et Y deux ensembles finis. Alors card(X ∪Y ) = card(X)+card(Y )−card(X ∩
Y ).
Preuve Il est facile de vérifier que X ∪ Y = (X \ Y ) ∪ (Y \ X) ∪ (X ∩ Y ), et que ces trois ensembles
sont deux à deux disjoints. Le corollaire précédent donne donc que card(X ∪ Y ) = card(X \ Y ) +
card(Y \ X) + card(X ∩ Y ). De plus, X = (X \ Y ) ∪ (X ∩ Y ), et ces deux ensembles sont disjoints, donc
card(X) = card(X \ Y ) + card(X ∩ Y ), ou encore card(X \ Y ) = card(X) − card(X ∩ Y ). De la même
manière, card(Y \ X) = card(Y ) − card(X ∩ Y ). En reportant dans la première égalité, on obtient :

card(X∪Y ) = card(X)−card(X∩Y )+card(Y )−card(X∩Y )+card(X∩Y ) = card(X)+card(Y )−card(X∩Y ).

Corollaire 2.47 Soit X et Y deux ensembles finis et f : X → Y une surjection. On suppose qu’il existe
un entier p tel que pour tout y ∈ Y , card(f −1 ({y})) = p. Alors card(X) = p × card(Y ).
Preuve Posons card(Y ) = n et y1 , . . . , yn les éléments de Y . Pour i entre 1 et n, on pose Xi = f −1 ({yi }).
Par hypothèse, Xi est de cardinal p. On voit que X = X1 ∪ . . . ∪ Xn : pour tout x ∈ X, f (x) = yi pour un
certain i entre 1 et n, ce qui nous dit que x ∈ Xi , et donc que X ⊂ X1 ∪ . . . ∪ Xn (l’inclusion réciproque
étant évidente puisque les Xi sont des sous-ensembles de X). De plus, les ensembles X1 , . . . , Xn sont
deux à deux disjoints : si i 6= j, si un élément x est dans Xi ∩ Xj , on devrait avoir f (x) = yi = yj , ce qui
est impossible. On peut donc appliquer le corollaire précédent :

card(X) = card(X1 ) + . . . + card(Xn ) = p × n = p × card(Y ).

Corollaire 2.48 Soient X et Y deux ensembles finis. Alors card(X × Y ) = card(X) × card(Y ).

20
Preuve Soit l’application (appelée projection sur Y )
f : X ×Y → Y
(x, y) 7→ y
Cette application est surjective : pour tout y ∈ Y , on choisit x ∈ X, et alors f (x, y) = y (le cas où X = ∅
se traite différemment mais est facile). De plus, pour tout y ∈ Y , f −1 ({y}) = X × {y}, qui a le même
cardinal que X (on peut le justifier par le fait que l’application X → X × {y}, x 7→ (x, y) est une bijec-
tion). En utilisant le corollaire précédent, on peut donc conclure que card(X ×Y ) = card(X)×card(Y ). 

Corollaire 2.49 Soient X et Y deux ensembles finis, et Z l’ensemble de toutes les applications de X
dans Y . Alors
card(Z) = card(Y )card(X)
Preuve On prouve le résultat par récurrence sur card(X).
Si card(X) = 0, c’est-à-dire X = ∅, la seule application de ∅ dans Y est l’application vide, on a donc
bien card(Z) = 1 = card(Y )0 .
On suppose le résultat connu pour card(X) = n, et on veut le montrer pour card(X) = n + 1. Si
card(X) = n + 1, on choisit x0 ∈ X et on pose X ′ = X \ {x0 }, qui est de cardinal n. Posons Z ′ l’ensemble
des applications de X ′ dans Y . Considérons l’application suivante :
g : Z → Z′ × Y
f 7 → (f|X ′ , f (x0 ))

On montre que g est injective : si g(f ) = g(f ′ ), alors f|X ′ = f|X ′
′ et f (x0 ) = f (x0 ), ce qui permet de dire

que f (x) = f (x) pour tout x ∈ X, et donc f = f . Et on montre que g est surjective : soit (f0 , y) ∈ Z ′ ×Y ,
′ ′

posons f : X → Y définie par f (x) = f0 (x) si x ∈ X ′ et f (x0 ) = y. On a bien g(f ) = (f0 , y). Comme
g est bijective, card(Z) = card(Z ′ × Y ), et donc card(Z) = card(Z ′ ) × card(Y ) d’après le corollaire

précédent. Or, d’après l’hypothèse de récurrence, card(Z ′ ) = card(Y )card(X ) = card(Y )n . Donc
card(Z) = card(Y )n × card(Y ) = card(Y )n+1 = card(Y )card(X) .

D’autres résultats de cardinalité sont importants à retenir. Se reporter aux feuilles d’exercices pour les
démonstrations. On rappelle la notation pour la factorielle d’un entier n : n! = 1 × 2 × . . . × n, et par
convention 0! = 1.

Fait 2.50 1. Soit X un ensemble fini de cardinal n, et Y l’ensemble des bijections de X dans X (on
dit aussi : les permutations de X). Alors card(Y ) = n!.
2. Soit X un ensemble fini de cardinal n, et p un entier tel que 0 ≤ p ≤ n. Soit Y l’ensemble des
n!
sous-ensembles de X qui sont de cardinal p. Alors card(Y ) = p!(n−p)! , qu’on appelle coefficient
n

binomial p . L’appellation "coefficient binomial" provient de la formule du binôme de Newton,
que l’on énonce ci-dessous.

Lemme 2.51 Formule de Pascal.   


n n−1 n−1
Soient des entiers 0 < p < n. Alors p = p + p−1 .
Preuve On peut donner deux preuves.
La première est un calcul de fractions :
   
n−1 n−1 (n − 1)! (n − 1)!
+ = +
p p−1 p!(n − 1 − p)! (p − 1)!(n − p)!
(n − 1)! 1 1
= ×( + )
(p − 1)!(n − 1 − p)! p n−p
(n − 1)! n
= ×
(p − 1)!(n − 1 − p)! p(n − p)
 
n! n
= =
p!(n − p)! p

21

La deuxième preuve utilise la caractérisation de np comme nombre de parties à p éléments d’un en-
semble à n éléments. Soit X un ensemble à n éléments. Par hypothèse, n ≥ 1 donc on peut fixer a un
élément de X. L’ensemble des parties de X à p éléments est l’union de P1 , l’ensemble des parties de X
à p éléments qui contiennent a, et de P2 , l’ensemble des parties de X à p éléments qui ne contiennent
pas a. De plus, ces deux ensembles sont disjoints, donc par les résultats précédents, np , qui est le car-
dinal de l’ensembles des parties de X à p éléments, est égal à card(P1 ) + card(P2 ). Puis, comme une
partie de X (à p éléments) qui ne contient pas a est exactement une  partie (à p éléments) de X \ {a},
qui est un ensemble à n − 1 éléments, on obtient card(P2 ) = n−1 p . Quant à P1 , choisir une partie de
X à p éléments qui contient a revient exactement à choisir une partie de X \ {a} à p − 1 éléments et
à lui joindre a. Si on veut être plus précis, on peut montrer que l’application Y 7→ Y ∪ {a} est une
bijection de l’ensemble des parties de X \ {a} à p − 1 éléments
 vers l’ensemble des parties
 de X à p élé-
ments qui contiennent a. Cela montre que card(P1 ) = n−1 n
p−1 . On conclut donc que p =
n−1
p + n−1
p−1 . 

Théorème 2.52 Formule du binôme de Newton.


Soit un entier n ≥ 1 et deux réels a et b (le théorème est en fait encore valable dans des contextes plus
généraux, par exemple pour a et b deux nombres complexes). Alors
n  
n
X n
(a + b) = ap bn−p .
p=0
p

Preuve On montre
 la formule par récurrence sur n.  
Pour n = 1, 10 = 11 = 1, on a donc bien (a + b)1 = a +b = 10 a0 b1 + 11 a1 b0 .
P n
Passons à l’hérédité. On suppose que (a + b)n = p=0 np ap bn−p et on veut montrer la formule au rang
n + 1. On développe et on regroupe les termes :

(a + b)n+1 = (a + b)(a + b)n


n   n  
X n p n−p X n p n−p
=a× a b +b× a b
p=0
p p=0
p
n   n  
X n p+1 n−p X n p n+1−p
= a b + a b
p=0
p p=0
p
| {z } | {z }
q=p+1 q=p
n+1
X  n  
n X n q n+1−q
= aq bn+1−q + a b
q=1
q−1 q=0
q
  n      
n 0 n+1
X n n q n+1−q n
= a b + + a b + an+1 b0
0 q=1 |
q − 1 q n
| {z } {z } | {z }
=1=(n+10 ) = ( n+1
q ) =1= (n+1
n+1)

n+1
X n+1 
= aq bn+1−q
q=0
q

22
Chapitre 3

Relations sur un ensemble

3.1 Généralités
Soit X un ensemble. Une relation binaire sur l’ensemble X est un énoncé P (x, y) dépendant de deux
éléments x et y de X. Si on appelle R cette relation, on note souvent xRy pour dire que P (x, y) est vrai.

Exemple 3.1 1. Soit X n’importe quel ensemble. L’égalité est une relation binaire sur X : x = y.
2. Sur R, on a la relation d’ordre x ≤ y.
3. Soit X l’ensemble des étudiants de la promo. On définit une relation binaire sur X par : x est
plus jeune que y.

Remarque 3.2 On s’intéressera seulement ici aux relations binaires (on dit aussi : d’arité 2), c’est-à-
dire aux énoncés qui dépendent de deux variables. Mais on peut aussi parler de relations de n’importe
quelle autre arité. Par exemple, sur l’ensemble R, on peut définir une relation ternaire (ou encore :
d’arité 3) par x < y < z.

Définition 3.3 Soit R une relation binaire sur un ensemble X. On dit que :
1. R est réflexive si pour tout x dans X, xRx.
Par exemple, l’ǵalité est une relation réflexive (sur n’importe quel ensemble) car on a toujours
x = x.
2. R est une relation symétrique si pour tous x et y dans X, xRy équivaut à yRx.
Par exemple, l’ǵalité est une relation symétrique (sur n’importe quel ensemble) car x = y est
toujours équivalent à y = x. La relation ≤ sur R n’est pas symétrique car x ≤ y n’est pas
équivalent à y ≤ x.
3. R est une relation antisymétrique si pour tous x et y dans X, (xRy et yRx) implique x = y.
Par exemple, la relation ≤ sur R est antisymétrique car si x ≤ y et y ≤ x, alors x = y.
4. R est une relation transitive si pour tous x, y, z dans X, (xRy et yRz) implique xRz.
Par exemple, la relation xRy définie par "x est plus jeune que y" est transitive : si x est plus
jeune que y et y est plus jeune que z, alors x est plus jeune que z.

Remarque 3.4 Dans la suite, nous étudierons des relations qui vérifient certaines de ces propriétés.
Mais il existe aussi des relations binaires qui ne satisfont pas ces propriétés. Par exemple, sur l’ensemble
X = {1, 2, 3}, définissons une relation R en posant que 1R2, 2R3 et 3R2 sont vrais, et tous les autres
énoncés xRy sont faux. Alors R n’est pas réflexive puisque 1R1 est faux ; R n’est pas symétrique car 1R2
est vrai mais 2R1 est faux ; R n’est pas antisymétrique car 2R3 et 3R2 sont vrais mais 2 6= 3 ; R n’est
pas transitive car 1R2 et 2R3 sont vrais mais 1R3 est faux.

3.2 Relations d’équivalence


Définition 3.5 Soit R une relation binaire sur un ensemble X. On dit que R est une relation d’équiva-
lence si elle est réflexive, symétrique et transitive.

23
Exemple 3.6 1. La relation d’égalité sur n’importe quel ensemble X est une relation déquivalence.
En effet, pour tous x, y, z dans X, on a bien : x = x ; x = y ssi y = x ; si x = y et y = z alors
x = z.
2. Fixons un entier d ∈ Z. Sur l’ensemble Z, on définit la relation R par : nRm ssi il existe k ∈ Z
tel que n = m + kd. On note souvent cette relation n ≡ m [d] (on lit : n est congru à m modulo
d) plutôt que nRm. C’est une relation d’équivalence : n ≡ n [d] car n = n + 0 × d ; si n ≡ m [d],
alors il existe k ∈ Z tel que n = m + kd, et donc m = n + (−k)d, c’est-à-dire m ≡ n [d] ; enfin si
n ≡ m [d] et m ≡ p [d], il existe k et l dans Z tels que n = m + kd et m = p + ld, ce qui donne
n = p + (k + l)d, et donc n ≡ p [d].
3. On définit de la même façon la relation x ≡ y [2π] sur R par x ≡ y [2π] ssi il existe k ∈ Z tel
que x = y + k × 2π. C’est une relation d’équivalence par le même argument que pour l’exemple
précédent.

Proposition 3.7 Soit une application f : X → Y . Soit R la relation sur X définie par : xRy ssi
f (x) = f (y). Alors R est une relation d’équivalence.

Preuve La relation R est réflexive car f (x) = f (x). Elle est symétrique car f (x) = f (y) équivaut à
f (y) = f (x). Elle est transitive car si f (x) = f (y) et f (y) = f (z), alors f (x) = f (z). 

Exemple 3.8 Soit X l’ensemble des étudiants de la promo et f : X → R l’application qui à un étudiant
associe sa note à l’examen. La relation d’équivalence décrite ci-dessus est donnée par : xRy ssi x et y
ont eu la même note à l’examen.

Définition 3.9 Soit R une relation d’équivalence sur un ensemble X, et x ∈ X. La classe d’équivalence
de x, souvent notée x ou Cx , est le sous-ensemble de X formé des éléments y équivalents à x :

x = Cx = {y ∈ X; yRx}.

Proposition 3.10 Soient x et y deux éléments de X, qui est muni d’une relation d’équivalence R.
Si xRy, alors x = y.
Si non xRy, alors x ∩ y = ∅.

Preuve Supposons que xRy. Pour tout z ∈ X, on obtient zRx ⇔ zRy en utilisant la propriété de
transitivité, c’est-à-dire z ∈ x ssi z ∈ y. Donc x = y.
Pour le deuxième point, on va montrer la contraposée : si x ∩ y 6= ∅, choisissons z ∈ x ∩ y, alors zRx et
zRy et donc xRy par transitivité. 

Définition 3.11 Soit R une relation d’équivalence sur l’ensemble X. On définit l’ensemble quotient X/R
comme l’ensemble formé des classes d’équivalences x pour x ∈ X. On dit que l’application

X → X/R
x 7→ x

est l’application canonique de X dans X/R.

Remarque 3.12 L’application canonique X → X/R est surjective par construction.


La définition précédente donne une construction réciproque à la proposition 3.7 : si f : X → X/R est
l’application canonique, alors pour tous x, y ∈ X, f (x) = f (y) ssi xRy (c’est une conséquence de la
proposition 3.10).

Proposition et définition 3.13 Soit X/R l’ensemble quotient d’un ensemble X par une relation R.
Alors X/R forme une partition de X, au sens où :
— les éléments de X/R sont des sous-ensembles non vides de X (car x contient x)
— les éléments de X/R sont deux à deux disjoints (d’après la proposition 3.10, si x 6= y, alors
x ∩ y = ∅)

24
— les éléments de X/R recouvrent X : tout x ∈ X est dans un élément de X/R, à savoir x

Exemple 3.14 1. Sur l’ensemble Z, considérons la relation d’équivalence R donnée par nRm ssi n ≡
m [2] (voir l’exemple 3.6). L’ensemble quotient Z/R est habituellement noté Z/2Z. Remarquons
que 0 et 1 ne sont pas équivalents, car il n’existe pas k ∈ Z tel que 1 = 0 + 2k. Donc 0 6= 1. Par
définition, 0 = {2k; k ∈ Z} : c’est l’ensemble des entiers relatifs pairs. Et 1 = {2k + 1; k ∈ Z} :
c’est l’ensemble des entiers relatifs impairs. S’il existait une autre classe d’équivalence, elle devrait
être disjointe de 0 et de 1, ce qui est impossible puisque tout entier relatif est soit pair, soit impair.
On a donc monté que Z/2Z = {0, 1}. Notons que ce choix des représentants 0 et 1 pour ces classes
d’équivalence est arbitraire : on voit par exemple que 0 ≡ 6 [2] et 1 ≡ 3 [2], on peut donc aussi
écrire Z/2Z = {6, 5}
2. Soit l’application f : R → R définie par f (x) = x2 , et R la relation d’équivalence sur R définie par
xRy ssi f (x) = f (y). On sait que xRy ssi y = ±x. Alors les classes d’équivalence sont 0 = {0}
et, pour tout x > 0, x = −x = {x, −x}.

On utilisera la proposition suivante dans la suite (on l’admet sans démonstration).

Proposition 3.15 Soit X un ensemble muni d’une relation d’équivalence R, f : X → X/R l’application
canonique et g : X → Y une application telle que pour tous x, y ∈ X, si xRy, alors g(x) = g(y). Alors il
existe une unique application h : X/R → Y telle que g = h ◦ f .

Exemple 3.16 Soit X l’ensemble des étudiants de la promo, et R la relation d’équivalence définie par
xRy ssi x et y ont la même note à l’examen, avec f : X → X/R l’application canonique. Soit Y
l’ensemble des mentions, et g : X → Y telle que g(x) est la mention obtenue par l’étudiant x. Chaque
élément de X/R correspond à une note ; l’application h est l’application qui associe aux notes entre 10
et 12 la mention passable, aux notes entre 12 et 14 la mention assez bien, etc. Alors on a bien g = h ◦ f .

3.3 Relations d’ordre


Définition 3.17 Soit R une relation binaire sur un ensemble X. On dit que R est une relation d’ordre
si elle est réflexive, antisymétrique et transitive.

Exemple 3.18 1. Soit X l’ensemble N ou Z ou R, et R la relation ≤. C’est une relation d’ordre :


x ≤ x ; si x ≤ y et y ≤ x alors x = y ; si x ≤ y et y ≤ z alors x ≤ z.
2. Soit Y un ensemble et X = P(Y ) l’ensemble des sous-ensembles de Y . Soit la relation ⊂ sur X.
C’est une relation d’ordre : A ⊂ A ; si A ⊂ B et B ⊂ A alors A = B ; si A ⊂ B et B ⊂ C alors
A ⊂ C.

Remarque 3.19 On a défini ici les relations d’ordre R au sens large, au sens où elles vérifient xRx.
On peut toujours leur associer une relation d’ordre strict, définie par xRy et x 6= y. Par exemple, la
relation d’ordre strict associée à ≤ est <, la relation d’ordre strict associée à ⊂ est (.

Définition 3.20 Soit R une relation d’ordre sur un ensemble X.


On dit que R est une relation d’ordre total si pour tous x, y dans X, xRy ou yRx.
Sinon, on dit que R est une relation d’ordre partiel : il existe deux éléments x, y dans X tels qu’on n’a
ni xRy, ni yRx (on dit alors que x et y sont incomparables).

Exemple 3.21 1. Sur N (ou Z, ou R), l’ordre ≤ est total : on a toujours soit x ≤ y, soit y ≤ x.

2. Soit X = P({1, 2}), l’ordre ⊂ est partiel, car les ensembles {1} et {2} sont incomparables.

On peut représenter une relation d’ordre avec un graphe, tel que xRy ssi il existe un chemin allant de x
à y en suivant les flèches.
Par exemple, pour l’ordre ⊂ sur X = P({1, 2}) :

25
{1, 2}

{1} {2}

On n’a pas besoin de tracer de flèche de ∅ vers {1, 2} car l’énoncé ∅ ⊂ {1, 2} peut être déduit des autres
flèches.
Dans le cas d’une relation d’ordre total (par exemple ≤ sur N), on obtient un graphe linéaire :

0 → 1 → 2 → ...

Définition 3.22 Soit X un ensemble avec une relation d’ordre ≤, et x ∈ X. On dit que :
— x est le plus grand élément de X si pour tout y ∈ X, y ≤ x
— x est le plus petit élément de X si pour tout y ∈ X, x ≤ y
— x est un élément maximal de X s’il n’existe pas de y ∈ X tel que x < y
— x est un élément minimal de X s’il n’existe pas de y ∈ X tel que y < x

Exemple 3.23 1. Dans N avec l’ordre ≤, 0 est le plus petit élément, et il n’y a pas de plus grand
élément.
2. Dans l’ensemble X = {∅, {1}, {2}}, avec l’ordre ⊂ : ∅ est un élément minimal, et aussi le plus
petit élément de X ; {1} et {2} sont des éléments maximaux de X, mais ce ne sont pas des plus
grands éléments (car {1} 6⊂ {2} et {2} 6⊂ {1}).

Proposition 3.24 Si ≤ est une relation d’ordre total sur X, et x un élément minimal de X, alors c’est
le plus petit élément de X.
De même, si x est un élément maximal de X, alors c’est le plus grand élément de X.

Preuve On suppose que x un élément minimal de X. Soit y ∈ X. Comme x est un élément minimal de
X, on ne peut pas avoir y < x. Or, comme l’ordre ≤ est total, y ≤ x ou x ≤ y, il faut donc que x ≤ y :
x est bien le plus petit élément de X.
L’argument est le même pour le deuxième point. 

26
Chapitre 4

Arithmétique

On entend par arithmétique l’étude des entiers avec les opérations élémentaires (addition, multipli-
cation...). Nous donnerons les définitions et les résultats pour l’ensemble des entiers naturels N, avec
éventuellement les adaptations pour l’ensemble des entiers relatifs Z.

4.1 Divisibilité
Définition 4.1 Soient m et n deux entiers. On définit la relation m|n : m|n ssi il existe k ∈ N tel que
n = mk. On dit alors que m divise n, ou encore que m est un diviseur de n, que n est divisible par m
ou que n est un multiple de m.

Exemple 4.2 2 divise 6, 3 ne divise pas 5.


Pour tout entier n, 1|n car n = 1 × n.
Pour tout entier n, n|0 car 0 = n × 0.

Proposition 4.3 Si m|n, alors m ≤ n ou n = 0.


La relation | est une relation d’ordre, avec 1 comme plus petit élément et 0 comme plus grand élément
(d’après les exemples précédents).
Si m|n et m|n′ , alors m|n + n′ .
Par définition, m|mk.

Preuve Si m|n, on trouve k ∈ N tel que n = mk. Il y a deux cas : soit k = 0 et alors n = m × 0 = 0 ;
soit k ≥ 1 et alors n = mk ≥ m.
La relation | est réflexive : pour tout n ∈ N, n|n car n = n × 1.
La relation | est antisymétrique : si n|m et m|n, on veut montrer que n = m. D’après la première
propriété, comme n|m, alors n ≤ m ou m = 0. Si m = 0, comme m|n, on peut écrire n = mk, alors
n = 0 × k = 0 = m. Si n ≤ m, comme m|n, alors m ≤ n ou n = 0 : dans le premier cas, n = m car
la relation ≤ est antisymétrique, dans le deuxième cas, on conclut de n = 0 et de n|m que m = 0 = n
comme précédemment.
La relation | est transitive : si m|n et n|p, on veut montrer que m|p. Comme m|n, on trouve k ∈ N tel
que n = mk. Comme n|p, on trouve l ∈ N tel que p = nl. On en déduit que p = nl = mkl donc m|p.
Si m|n et m|n′ , on trouve k et k ′ dans N tels que n = mk et n′ = mk ′ . Alors n+n′ = mk+mk ′ = m(k+k ′ )
donc m|n + n′ . 

Remarque 4.4 On définit la relation | sur Z : pour m et n dans Z, m|n s’il existe k ∈ Z tel que n = mk.
La relation | n’est pas une relation d’ordre sur Z car elle n’est pas antisymétrique : par exemple 3| − 3
car −3 = (−1) × 3 et −3|3 car 3 = (−1) × (−3), mais 3 6= −3.

Définition 4.5 Soit p ∈ N. On dit que p est un nombre premier si p ≥ 2 et si les seuls diviseurs de p
sont 1 et p.

27
Exemple 4.6 2, 3, 5, 7,... sont premiers. Dans la pratique, comme les diviseurs de p (pour p 6= 0) sont
≤ p, il suffit de vérifier s’il existe entre 1 et p d’autres diviseurs de p que 1 et p.
6 n’est pas premier car 6 = 2 × 3 : 2 et 3 sont des diviseurs de 6 distincts de 1 et 6.

4.2 Division euclidienne


Le résultat de division euclidienne sera essentiel pour les théorèmes suivants.

Proposition et définition 4.7 Soit m et n deux entiers naturels avec m 6= 0. Alors il existe des entiers
naturels q et r, avec r < m, tels que n = mq + r.
Ces entiers q et r sont uniques ; q s’appelle le quotient de la division euclidienne de n par m, et r le
reste.

Exemple 4.8 Division euclidienne de 311 par 12 : 311 = 12 × 25 + 11, avec 11 < 12 ; 25 est le quotient,
et 11 le reste.

Preuve On fixe m 6= 0 et on montre par récurrence sur n la propriété P (n) : il existe q et r dans N
avec r < m tel que n = mq + r.
P (0) est vraie : pour q = 0 et r = 0 < m, on a bien 0 = m × 0 + 0.
P (n) ⇒ P (n + 1) : d’après P (n), on trouve q et r dans N avec r < m tels que n = mq + r. On cherche
maintenant à faire la division euclidienne de de n + 1 par m : on peut écrire n + 1 = mq + r + 1. Puisque
r < m, il y a deux cas : soit r < m − 1, et alors r′ = r + 1 < m et on a bien n + 1 = mq + r′ ; soit
r = m − 1, et alors n + 1 = mq + m = m(q + 1) + 0 avec 0 < m.
Cela montre la propriété P (n) pour tout n ∈ N. Il faut encore montrer l’unicité de q et r. Supposons
qu’on a deux écritures n = mq + r = mq ′ + r′ avec r < m et r′ < m. Si r = r′ , on obtient en retranchant
r que mq = mq ′ , et donc que q = q ′ (en divisant par m, qui est non nul). Si r 6= r′ , quitte à échanger r
avec r′ et q avec q ′ , on peut supposer que r′ > r. En faisant la différence entre les deux écritures de n,
on obtient m(q − q ′ ) + (r − r′ ) = 0, ou encore m(q − q ′ ) = r′ − r, avec 0 < r′ − r < m. C’est impossible,
car cela signifierait que m divise r − r′ , ce qui implique r − r′ = 0 ou m ≤ r − r′ . 

Remarque 4.9 m|n ssi le reste de la division euclidienne de n par m est 0.

On utilisera aussi dans la suite une version de la division euclidienne pour les entiers relatifs.

Proposition 4.10 Soient m et n dans Z avec m 6= 0. Alors il existe q et r dans Z, uniques, tels que
n = mq + r et 0 ≤ r < |m|.

4.3 Algorithme d’Euclide


On se pose la question suivante : soient a et b deux éléments de N. Peut-on trouver parmi les diviseurs
communs de a et de b un plus grand élément, pour la relation | ?

Exemple 4.11 Soient a et b deux nombres premiers distincts. Les seuls diviseurs de a sont 1 et a, les
seuls diviseurs de b sont 1 et b, et comme a 6= b, le seul diviseur commun de a et de b est 1, et c’est donc
évidemment le plus grand diviseur commun.
Si b = 0, tous les diviseurs de a sont aussi des diviseurs de 0. Or le plus grand diviseur de a est a pour
l’ordre | (car a divise a et si n divise a alors n|a), donc a est le plus grand diviseur commun de a et de
0.

Lemme 4.12 Soit a et b dans N avec b 6= 0. Soit a = bq + r la division euclidienne de a par b. Alors
pour tout n ∈ N, n divise à la fois a et b ssi n divise à la fois b et r.

Preuve Si n divise a et b, on peut trouver k et l tels que a = nk et b = nl, ce qui donne r = a − bq =


n(k − lq), donc n divise r, et il divise b par hypothèse.
Si n divise b et r, on peut trouver k et l tels que b = nk et r = nl, ce qui donne a = bq + r = n(kq + l),

28
donc n divise a, et il divise b par hypothèse. 

On peut maintenant décrire l’algorithme d’Euclide. Posons r0 = a et r1 = b. Si b = 0, on sait déjà


que le plus grand diviseur commun de a et de b est a. Si b 6= 0, on peut faire la division euclidienne par
b : r0 = q0 r1 + r2 avec r2 < r1 . On continue à faire une suite de divisions euclidiennes tant que c’est
possible, c’est-à-dire tant que le dernier reste obtenu est 6= 0 :

r0 = q0 r1 + r2 avec r2 < r1 (1)


r1 = q1 r2 + r3 avec r3 < r2 (2)
..
.
rn−1 = qn−1 rn + rn+1 avec rn+1 < rn (n)

On s’arrête quand le dernier reste rn+1 obtenu est 0 ; cette situation se produit obligatoirement car les
suites strictement décroissantes d’entiers naturels r1 > r2 > . . . > rn > rn+1 atteignent nécessairement
0.
En appliquant n fois le lemme 4.12, on obtient que les diviseurs communs de r0 et de r1 sont les mêmes
que ceux de r1 et de r2 , qui sont les mêmes que ceux de r2 et de r3 , . . ., qui sont les mêmes que ceux de
rn et de rn+1 . Or, comme rn+1 = 0, on a vu que le plus grand diviseur commun de rn et de rn+1 est rn ;
c’est donc aussi le plus grand diviseur commun de a et de b. On a donc démontré le résultat suivant :

Proposition et définition 4.13 Soient a et b dans N. Il existe un plus grand diviseur commun de a et
de b (pour l’ordre |), que l’on note pgcd(a, b).
Il est obtenu comme le dernier reste non-nul dans l’algorithme d’Euclide.

Exemple 4.14 Calculer pgcd(51, 18).


On utilise l’algorihme d’Euclide :

51 = 2 × |{z}
|{z} 18 + |{z}
15 (1)
r0 r1 r2

18 = 1 × |{z}
|{z} 15 + |{z}
3 (2)
r1 r2 r3

15 = 5 × |{z}
|{z} 3 + |{z}
0 (3)
r2 r3 r4

Le dernier reste non-nul est 3, donc pgcd(51, 18) = 3 : 3 divise à la fois 51 et 18 (51 = 3×17 et 18 = 3×6)
et tout entier n qui divise à la fois 51 et 18 divise 3 (donc n = 1 ou n = 3).

Définition 4.15 On dit que deux entiers a et b sont premiers entre eux si pgcd(a, b) = 1.

Exemple 4.16 On a vu dans l’exemple 4.11 que si a et b sont deux nombres premiers distincts, alors
ils sont premiers entre eux.
On peut avoir deux nombres premiers entre eux même s’ils ne sont pas premiers. Par exemple, on constate
par l’algorithme d’Euclide que pgcd(4, 9) = 1 mais ni 4, ni 9 ne sont premiers.

Proposition 4.17 Identité de Bézout.


Soient a et b dans N, et d = pgcd(a, b). Alors il existe u et v dans Z tels que d = au + bv.

Preuve La preuve qu’on donne ici permet de calculer u et v. On pose r0 = a, r1 = b, et on applique

29
l’algorithme d’Euclide :

r0 = q0 r1 + r2 avec r2 < r1 (1)


r1 = q1 r2 + r3 avec r3 < r2 (2)
..
.
rn−2 = qn−2 rn−1 + rn avec rn < rn−1 (n − 1)
rn−1 = qn−1 rn + rn+1 avec rn+1 < rn (n)

où rn est le dernier reste non-nul, c’est-à-dire rn+1 = 0 et rn = pgcd(a, b) = d. On va montrer successive-


ment, pour i = n, n − 1, . . . , 0, qu’il existe ui et vi dans Z tels que d = ri ui + ri+1 vi (c’est une "récurrence
inverse").
L’énoncé est évident pour i = n : on a par construction d = rn = rn × 1 + rn+1 × 0.
On suppose que l’énoncé est vrai au rang i pour i ≥ 1 : d = ri ui + ri+1 vi et on veut le montrer au rang
i − 1. On utilise l’équation (i) : ri−1 = qi−1 ri + ri+1 , donc ri+1 = ri−1 − qi−1 ri , et donc

d = ri ui + ri+1 vi = ri ui + (ri−1 − qi−1 ri )vi = ri−1 vi + ri (ui − qi−1 vi ).

C’est l’identité qu’on voulait obtenir au rang i − 1.


En particulier, au rang i = 0, avec a = r0 et b = r1 , on trouve d = au0 + bv0 . 

Remarque 4.18 On ne s’est intéressé qu’à des entiers naturels a et b, mais les coefficients u et v trouvés
sont en général des entiers relatifs.

Exemple 4.19 On a vu dans l’exemple 4.14 que pgcd(51, 18) = 3. En utilisant les équations qu’on a
données, on va trouver u et v dans Z tels que 3 = 51u + 18v. L’équation (2) donne 3 = 18 − 15, et
l’équation (1) donne 15 = 51 − 18 × 2, donc 3 = 18 − (51 − 18 × 2) = −51 + 18 × 3 = 51u + 18v avec
u = −1 et v = 3.

Corollaire 4.20 Soient a et b dans N. Alors a et b sont premiers entre eux ssi il existe u et v dans Z
tels que 1 = au + bv.

Preuve L’implication directe est la proposition précédente avec d = 1.


Pour l’implication réciproque, supposons qu’il existe u et v dans Z tels que 1 = au + bv. Si n est un
diviseur commun de a et de b, alors on obtient en utilisant la proposition 4.3 que n|a|au et n|b|bv et
donc n|au + bv, c’est-à-dire n|1. On a vu que 1 est le plus petit élément pour l’ordre |, ce qui donne que
le seul diviseur de 1 est 1. Ainsi, n = 1, 1 est le seul diviseur commun de a et de b et donc pgcd(a, b) = 1. 

4.4 Décomposition en facteurs premiers


Le résultat suivant est appelé lemme de Gauss, mais c’est un résultat essentiel.

Lemme 4.21 Lemme de Gauss.


Soient a, b, c dans N. On suppose que a|bc et que a et b sont premiers entre eux. Alors a|c.

Preuve On utilise le corollaire 4.20 : comme a et b sont premiers entre eux, il existe u et v dans Z tels
que au + bv = 1. En multipliant par c, on trouve c = acu + bcv. Or a|bc donc il existe k ∈ N tel que
bc = ak. On obtient donc c = acu + akv = a(cu + kv), ce qui dit que a|c. 

Corollaire 4.22 Soit p un nombre premier et a1 . . . an un produit de n entiers naturels (n ≥ 1). Si


p|a1 . . . an , alors p divise l’un des ai .

30
Preuve On montre le résultat par récurrence sur le nombre n de facteurs dans le produit.
Si n = 1, le résultat est trivial : si p|a1 , alors p|a1 .
On suppose le résultat vrai pour un certain n et on le montre pour n + 1. On suppose que p divise
a1 . . . an+1 , qu’on voit comme a1 (a2 . . . an+1 ). Si p|a1 , on a terminé. Sinon, p et a1 sont premiers entre
eux : en effet, comme p est premier, les seuls diviseurs de p sont 1 et p ; or p ne divise pas a1 donc le
seul diviseur commun de p et a1 est 1. On peut donc appliquer le lemme de Gauss : p divise a2 . . . an+1 .
Comme c’est un produit de n nombres entiers, on peut appliquer l’hypothèse de récurrence : p divise a2
ou . . . ou an+1 . 

Théorème 4.23 Décomposition en facteurs premiers.


Soit un entier n ≥ 2. Alors il existe des nombres premiers p1 , . . . , pk tels que n = p1 . . . pk .
De plus, cette décomposition est unique : si n = p1 . . . pk et n = q1 . . . ql sont deux décompositions en
facteurs premiers, alors k = l et, quitte à faire une permutation de q1 , . . . , ql , pi = qi pour tout i entre 1
et k.

Preuve On montre par récurrence sur n ≥ 2 que n admet une décomposition en facteurs premiers.
Si n = 2, on a déjà la décomposition puisque 2 est premier.
On montre la propriété d’hérédité sous la forme suivante : on suppose que le résultat est vrai pour tout
entier < n et on le démontre pour n. Si n est premier, on a terminé. Sinon, on trouve deux entiers u
et v tels que n = uv avec u et v strictement compris entre 1 et n. On peut donc utiliser l’ypothèse de
récurrence pour u et v : u = p1 . . . pk et v = q1 . . . ql pour des nombres premiers p1 , . . . , pk , q1 , . . . , ql . Et
donc n = uv = p1 . . . pk q1 . . . ql .
On démontre maintenant l’unicité : on suppose que n = p1 . . . pk = q1 . . . ql pour des nombres premiers
p1 , . . . , pk , q1 , . . . , ql . On montre le résultat par récurrence sur le nombre de facteurs dans ces décompo-
sitions, c’est-à-dire sur k + l. Par construction, k ≥ 1 et l ≥ 1. Le cas d’initialisation est donc k = l = 1,
et la situation est alors n = p1 = q1 , et le résultat est évident.
On écrit maintenant p1 . . . pk = q1 . . . ql et on suppose le résultat vrai quand le nombre de facteurs est
< k + l. En particulier, p1 divise q1 . . . ql , et p1 est premier. Donc, par le corollaire 4.22, p1 divise l’un des
qi . Quitte à faire une permutation de q1 , . . . , ql , on peut supposer que p1 |q1 . Comme q1 est premier et
p1 6= 1, cela implique p1 = q1 . On peut maintenant diviser l’égalité p1 . . . pk = q1 . . . ql par p1 : on obtient
p2 . . . pk = q2 . . . ql (dans le cas k = 1, le membre de gauche est en fait 1, donc celui de droite aussi,
ce qui donne l = 1, et on a terminé ; même chose si l = 1). On obtient donc deux décompositions avec
moins de facteurs premiers (à savoir k + l − 2), et l’hypothèse de récurrence donnne donc k − 1 = l − 1,
et p2 = q2 , . . . , pk = qk quitte à réordonner q2 , . . . , qk . 

Remarque 4.24 Soit n = p1 . . . pk la décomposition de n en facteurs premiers. Il est possible que


certains des pi soient égaux entre eux ; dans ce cas, on les regroupe. Par exemple, pour n = 12 = 2×2×3,
on écrit 12 = 22 × 3.
On peut faire apparaitre de manière artificielle un nombre premier dans une telle décomposition en lui
assignant l’exposant 0. Par exemple, on peut écrire 12 = 22 × 31 × 50 . Cette idée est principalement
utilisée pour comparer les décompositions en facteurs premiers de plusieurs nombres entiers. On pourra
écrire 1 sous cette forme en fixant tous les exposants à 0.

Lemme 4.25 Soit deux entiers naturels n et m ≥ 1. D’après la remarque précédente, on peut écrire
les décompositions en facteurs premiers n = pn1 1 . . . pnk k et m = pm mk
1 . . . pk
1
avec p1 , . . . , pk des nombres
premiers deux à deux distincts et des exposants n1 , . . . , nk , m1 , . . . , mk ≥ 0. Alors n|m ssi pour tout i
entre 1 et k, ni ≤ mi .

Preuve On suppose que n|m. Alors il existe u ∈ N tel que m = nu. On peut supposer que la dé-
composition en facteurs premiers de u s’écrit u = pu1 1 . . . puk k avec ui ≥ 0 pour tout i. Alors m = nu
mk
s’écrit pm
1 . . . pk
1
= p1n1 +u1 . . . pknk +uk . L’unicité de la décomposition en facteurs premiers implique que
mi = ni + ui pour tout i entre 1 et n, et donc aussi mi ≥ ni .
Réciproquement, si mi ≥ ni pour tout i, on peut considérer l’entier u = pm 1
1 −n1
. . . pkmk −nk . On calcule
n1 nk m1 −n1 mk −nk m1 mk
alors nu = p1 . . . pk p1 . . . pk = p1 . . . pk = m, ce qui donne que n|m. 

31
Exemple 4.26 12 = 22 × 31 et 72 = 23 × 32 , donc 12|72.
12 = 22 × 31 × 50 et 30 = 21 × 31 × 51 donc 12 ne divise pas 30, à cause de l’exposant de 2.

Proposition 4.27 Soient deux entiers n et m ≥ 1, et les décompositions en facteurs premiers n =


pn1 1 . . . pnk k et m = pm mk
1 . . . pk
1
avec p1 , . . . , pk des nombres premiers deux à deux distincts et des exposants
n1 , . . . , nk , m1 , . . . , mk ≥ 0. Pour tout i, posons ui = min(ni , mi ). Alors pgcd(n, m) = pu1 1 . . . puk k .
Preuve Posons u = pu1 1 . . . pkuk . On utilise le lemme précédent : par définition, ui ≤ ni pour tout i donc
u|n. De la même manière, u|m ; donc u est un diviseur commun de m et de n. Soit d un diviseur commun
de m et n, écrivons sa décomposition d = pd11 . . . pdkk . Comme d|n, on doit avoir di ≤ ni pour tout i ; et
comme d|m, on doit avoir di ≤ mi pour tout i. Cela donne di ≤ min(ni , mi ) = ui pour tout i. Donc d|u
d’après le lemme précédent, ce qui signifie que u est bien le plus grand (au sens de la relation |) diviseur
commun de m et n. 

Une démonstration semblable donne le résultat suivant.

Proposition et définition 4.28 Soient deux entiers n et m ≥ 1, et les décompositions en facteurs


premiers n = pn1 1 . . . pnk k et m = pm mk
1 . . . pk
1
avec p1 , . . . , pk des nombres premiers deux à deux distincts
et des exposants n1 , . . . , nk , m1 , . . . , mk ≥ 0. Pour tout i, posons vi = max(ni , mi ), et v = pv11 . . . pvkk .
Alors v est le plus petit multiple commun de m et n (au sens de |), et on le note v = ppcm(m, n).

Exemple 4.29 Les décompositions en facteurs premiers de 60 et de 14 sont 60 = 22 × 31 × 51 × 70 et


14 = 21 × 30 × 50 × 71 donc pgcd(60, 14) = 21 × 30 × 50 × 70 = 2 et ppcm(60, 14) = 22 × 31 × 51 × 71 = 420.

Proposition 4.30 Soient deux entiers m et n ≥ 1. Alors mn = pgcd(m, n) × ppcm(m, n).


Preuve En écrivant les décompositions en facteurs premiers n = pn1 1 . . . pnk k et m = pm mk
1 . . . pk , on a
1

m1 +n1 mk +nk
mn = p1 . . . pk et, d’après les résultats précédents,
min(m1 ,n1 )+max(m1 ,n1 ) min(mk ,nk )+max(mk ,nk )
pgcd(m, n) × ppcm(m, n) = p1 . . . pk .

Or on a le résultat général : a + b = min(a, b) + max(a, b) ; car si a ≤ b, min(a, b) = a et max(a, b) = b,


donc min(a, b) + max(a, b) = a + b, et même raisonnement si a > b. En appliquant ce résultat à chacun
des exposants, on trouve bien mn = pgcd(m, n) × ppcm(m, n). 

Corollaire 4.31 Soient a, b, c des entiers ≥ 1. On suppose que a et b sont premiers entre eux, que a
divise c et que b divise c. Alors ab divise c.
Preuve Le fait que a et b sont premiers entre eux siginifie que pgcd(a, b) = 1, et donc ppcm(a, b) = ab
d’après la proposition précédente. Or, par hypothèse, c est un multiple commun de a et de b, et comme
ppcm(a, b) est le plus petit multiple commun de a et de b pour la relation |, on obtient ab|c. 

Remarque 4.32 On a deux méthodes pour calculer le pgcd de deux entiers m et n : utiliser l’algorithme
d’Euclide ou la proposition 4.27 avec les décompositions en facteurs premiers. Pour le calcul du ppcm,
on dispose de la proposition et définition 4.28 avec les décompositions en facteurs premiers.
Parfois, surtout pour de grands entiers m et n, il est difficile de trouver la décomposition en facteurs
premiers de m et n, et plus simple d’utiliser l’algorithme d’Euclide. Ainsi, pour calculer le ppcm de m et n,
on peut calculer pgcd(m, n) par l’algorithme d’Euclide et utiliser la formule mn = pgcd(m, n)×ppcm(m, n)
pour en déduire ppcm(m, n).

4.5 Congruences et Z/dZ


On fixe pour ce paragraphe un entier d ≥ 1.
On rappelle (voir chapitre 3) qu’on a la relation d’équivalence de congruence modulo d sur Z : pour
n, m ∈ Z,
n ≡ m [d] ssi ∃k ∈ Z n = m + kd ssi d|n − m

32
L’ensemble quotient pour cette relation d’équivalence est noté Z/dZ ; pour n ∈ Z, on note n sa classe
d’équivalence.

Proposition 4.33 L’ensemble Z/dZ contient exactement d éléments : Z/dZ = {0, . . . , d − 1}.

Preuve Les éléments 0, . . . , d − 1 sont dans Z/dZ par définition ; on montre que tous les éléments de
Z/dZ peuvent être écrits sous cette forme. Tout élément de Z/dZ est la classe d’équivalence n d’un cer-
tain élément n de Z. Écrivons la division euclidienne de n par d : il existe q et r dans Z, avec 0 ≤ r < d,
tels que n = dq + r. Cela siginifie que n ≡ r [d], c’est-à-dire n = r, avec 0 ≤ r ≤ d − 1.
Puis on montre que les éléments 0, . . . , d − 1 sont deux à deux distincts. Soient i et j compris entre 0 et
d − 1, avec i 6= j. On peut, quitte à échanger i et j, supposer que i > j. Alors 0 < i − j < d, donc d ne
peut pas diviser i − j, donc i 6= j. 

Lemme 4.34 On suppose que n ≡ n′ [d] et m ≡ m′ [d]. Alors n + m ≡ n′ + m′ [d] et nm ≡ n′ m′ [d].

Preuve On peut écrire n′ = n + kd et m′ = m + ld pour des éléments l et m de Z. Alors n′ + m′ =


n + m + (k + l)d donc n + m ≡ n′ + m′ [d] et n′ m′ = (n + kd)(m + ld) = nm + (km + nl + kld)d donc
nm ≡ n′ m′ [d]. 
On en déduit, en utilisant la proposition 3.15 :

Proposition et définition 4.35 On peut définir une addition et une multiplication sur Z/dZ. Ces
opérations sont caractérisées par :
pour tout n, m ∈ Z, n + m = n + m et n × m = n × m.

Exemple 4.36 On peut donner les tables d’addition et de multiplication de Z/4Z. On utilise la définition
précédente, et la division euclidienne par 4 pour représenter tous les éléments de Z/4Z comme la classe
d’un entier entre 0 et 3 :
+ 0 1 2 3 × 0 1 2 3
0 0 1 2 3 0 0 0 0 0
1 1 2 3 0 1 0 1 2 3
2 2 3 0 1 2 0 2 0 2
3 3 0 1 2 3 0 3 2 1

Les règles de calculs élémentaires de Z se répercutent pour Z/dZ.

Fait 4.37 Pour tous m, n, p dans Z/dZ :


m + n = n + m et m × n = n × m (commutativité)
m + (n + p) = (m + n) + p et m × (n × p) = (m × n) × p (associativité)
m × (n + p) = m × n + m × p (distributivité)

Remarque 4.38 En utilisant une division euclidienne, on peut représenter tout élément de Z/dZ comme
la classe d’un entier compris entre 0 et d − 1. Mais parfois, il peut être plus utile d’écrire cet élément
comme la classe d’un entier hors de cet intervalle.
Par exemple, on cherche à déterminer le chiffre des unités de 2019167 . Pour un entier n, le chiffre des
unités de n correspond au reste de la division euclidienne de n par 10. Ainsi, 2019 = 201 × 10 + 9, ce
qui dit aussi que 2019 = 9 dans Z/10Z. Pour calculer le chiffre des unités de 2019167 , on va calculer
2019167 dans Z/10Z. On a 2019167 = (2019)167 = (9)167 . Or il est difficile de calculer (9)167 ; sachant
que 9 = −1 dans Z/10Z, on calcule plutôt (−1)167 = (−1)167 = −1 = 9. Ainsi, 2019167 = 9, ce qui dit
que le chiffre des unités de 2019167 est 9.

33
34
Chapitre 5

Nombres complexes

5.1 Définitions et premières propriétés


Un nombre complexe z est donné par deux nombres réels : sa partie réelle, notée Re(z), et sa partie
imaginaire, notée Im(z). Si Re(z) = a et Im(z) = b, on note z = a + ib (on le voit pour l’instant
simplement comme une notation). On note C l’ensemble des nombres complexes.
On dit que z est réel si Im(z) = 0. On peut ainsi identifier R à un sous-ensemble de C ; plus formellement,
l’application suivante est une injection :
R → C
a 7→ a + i0
On dit que z est imaginaire pur si Re(z) = 0.

Opérations sur C

Soient des nombres complexes z = a + ib et z ′ = a′ + ib′ .


On définit l’addition par : z + z ′ = (a + a′ ) + i(b + b′ ).
On définit la mutiplication par zz ′ = (aa′ − bb′ ) + i(ab′ + a′ b).

Fait 5.1 Pour tous z, z ′ , z ′′ dans C :


1. z + z ′ = z ′ + z et zz ′ = z ′ z (commutativité)
2. z + (z ′ + z ′′ ) = (z + z ′ ) + z ′′ et z(z ′ z ′′ ) = (zz ′ )z ′′ (associativité)
3. z(z ′ + z ′′ ) = zz ′ + zz ′′ (distributivité)

Remarque 5.2 On note bien sûr i le nombre complexe 0 + i1. D’après la formule pour la multiplication,
il vérifie i2 = −1. Dans la pratique, pour multiplier deux nombres complexes, il suffit d’utiliser les
propriétés énoncées dans le fait précédent et le fait que i2 = −1.

Conjugué d’un nombre complexe

Pour un nombre complexe z = a + ib (on sous-entend toujours que a et b sont réels), le conjugué
de z, noté z, est défini par z = a − ib.

Proposition 5.3 1. z = z

2. z + z′ =z+z
3. zz ′ = zz ′

Preuve On note z = a + ib et z ′ = a′ + ib′ .


z = a − ib = a − i(−b) = a + ib = z.
z + z ′ = (a + a′ ) + i(b + b′ ) = a − ib + a′ − ib′ = z + z ′ .
zz ′ = (aa′ − bb′ ) + i(ab′ + a′ b) = (aa′ −bb′ )−i(ab′ +a′ b) et zz ′ = (a−ib)(a′ −ib′ ) = (aa′ −bb′ )−i(ab′ +a′ b).


35
Module et argument d’un nombre complexe

Soit z = a + ib ∈ C, avec a, b ∈ R. On calcule zz = (a + ib)(a − ib) = a2 + b2 : c’est


√ un nombre
√ réel positif
ou nul, dont on peut prendre la racine carrée. On définit le module de z : |z| = zz = a2 + b2 .

Proposition 5.4 1. |z| = 0 ssi z = 0


2. |zz ′ | = |z||z ′ |
p
Preuve Si z = 0, il est clair que |z| = 0 × 0 = 0. √
Réciproquement, pour z = a + ib, supposons que |z| = a2 + b2 = 0. Alors a2 + b2 est une somme de
deux nombres réels positifs ou nuls, qui est nulle, ce qui oblige à ce que les deux termes soient nuls. Donc
a = b = 0 et ainsi z = 0. √ √
Pour calculer |zz ′ |, on utilise la proposition 5.3 : |zz ′ | = zz ′ zz ′ = zzz ′ z ′ = |z||z ′ |. 

On rappelle le fait suivant. Noter que l’usage en mathématiques est d’exprimer les angles en radians
(la mesure de l’angle plat π, celle de l’angle droit π/2,...).

Fait 5.5 Soit x, y ∈ R tels que x2 + y 2 = 1. Alors il existe un unique réel θ ∈] − π, π] tel que x = cos(θ)
et y = sin(θ).
Soit z = a + ib ∈ C, on suppose que z 6= 0, et donc aussi |z| = 6 0. On peut toujours diviser un
nombre complexe par un nombre réel non nul (il suffit de diviser la partie réelle et la partie ima-
z
ginaire par ce réel), regardons donc |z| = √a2a+b2 + i √a2b+b2 . Utilisons le fait précédent : puisque
a2 +b2
( √a2a+b2 )2 + ( √a2b+b2 )2 = a2 +b2 = 1, il existe un unique θ ∈] − π, π] tel que √ a
a2 +b2
= cos(θ) et
√ b = sin(θ). On appelle θ l’argument de z, on le note Arg(z).
a2 +b2

Remarque 5.6 La réciproque du fait précédentqest également vraie : pour tout θ ∈ R, cos2 (θ)+sin2 (θ) =
1. Cela signifie aussi que | cos(θ) + i sin(θ)| = cos2 (θ) + sin2 (θ) = 1.

Si z ∈ C est non nul, on pose r = |z| ∈ R∗+ et θ = Arg(z) ∈] − π, π], et on a alors z = r(cos(θ) + i sin(θ)).
Cette écriture est unique : si z = r(cos(θ) + i sin(θ)) = r′ (cos(θ′ ) + i sin(θ′ )), avec r, r′ des réels > 0 et
θ, θ′ dans ] − π, π], alors r = r′ = |z| et θ = θ′ = Arg(z).

Remarque 5.7 Soit z ∈ C non nul, r = |z| et θ = Arg(z). Si θ′ ≡ θ [2π], c’est-à-dire s’il existe k ∈ Z
tel que θ′ = θ + k × 2π, alors cos(θ′ ) = cos(θ) et sin(θ′ ) = sin(θ) car les fonctions cosinus et sinus sont
2π-périodiques. On a donc également z = r(cos(θ′ ) + i sin(θ′ )), et on dit que θ′ est un argument de z.
Notation exponentielle

Soit θ ∈ R. On note eiθ = cos(θ) + i sin(θ). Ainsi, si z ∈ C est non nul, avec r = |z| et θ un argu-
ment de z, alors z = reiθ : c’est ce qu’on appelle l’écriture trigonométrique de z.
On voit ici cette écriture seulement comme une notation, mais elle a en fait un sens plus profond. On va
voir maintenant que cette notation est conforme à l’usage habituel du calcul des puissances, on rappelle
pour cela les formules trigonométriques.

Fait 5.8 cos(θ + θ′ ) = cos(θ) cos(θ′ ) − sin(θ) sin(θ′ )


sin(θ + θ′ ) = cos(θ) sin(θ′ ) + sin(θ) cos(θ′ )

On en déduit, en utilisant aussi les formules de multiplication, que si z = reiθ et z ′ = r′ eiθ , alors

zz ′ = reiθ r′ eiθ = rr′ (cos(θ) + i sin(θ))(cos(θ′ ) + i sin(θ′ ))
= rr′ (cos(θ) cos(θ′ ) − sin(θ) sin(θ′ ) + i(cos(θ) sin(θ′ ) + sin(θ) cos(θ′ )))
= rr′ (cos(θ + θ′ ) + i sin(θ + θ′ ))

= rr′ ei(θ+θ ) .

36
C’est bien la formule attendue pour un produit d’exponentielles. On a en particulier montré le résultat
suivant.

Proposition 5.9 Soient z, z ′ deux nombres complexes non nuls, θ un argument de z et θ′ un argument
de z ′ , alors θ + θ′ est un argument de zz ′ .

Exemple 5.10 En prenant les valeurs des fonctions cosinus et sinus en différentes valeurs simples, on
voit que 1 = ei×0 , i = eiπ/2 , −1 = eiπ et −i = e−iπ/2 .
Attention : Arg(−i) = −π/2 ∈] − π, π], mais −π/2 + (−π/2) = −π est seulement un argument de
(−i) × (−i) = −1 ; pour avoir l’argument de −1 il faut ajouter 2π pour obtenir Arg(−1) = π ∈] − π, π].

Remarque 5.11 Attention : il n’existe pas de formule simple pour |z + z ′ | et Arg(z + z ′ ).

Division

Soit z ∈ C, on a vu que zz = |z|2 . En particulier, si z 6= 0, on peut diviser cette égalité par le réel
non nul |z|2 , et on obtient : z × |z|z 2 = 1. On dit alors que |z|z 2 est l’inverse de z, qu’on peut noter z1 . On
z 1 zz ′
peut donc aussi calculer, pour tous z, z ′ ∈ C, avec z ′ 6= 0, z′ =z× z′ = |z ′ |2 .

Exemple 5.12
1+i (1 + i)(1 − 2i) 3 1
= = − i.
1 + 2i (1 + 2i)(1 − 2i) 5 5
1 z
Si |z| = 1, alors z = |z|2 = z.

La méthode précédente permet de calculer le quotient de deux nombres complexes sous la forme al-

gébrique. Si z = reiθ et z ′ = r′ eiθ sont données sous forme trigonométrique, avec r′ 6= 0, les calculs
précédents montrent que
′ 1 ′ r′ ′ ′
r′ eiθ × ′ e−iθ = ′ ei(θ −θ ) = ei×0 = 1
r r
1 1 −iθ ′ z r i(θ−θ ′ )
Ainsi, z′ = r′ e et z′ = r′ e .

5.2 Interprétation géométrique


−→ −→
On se place dans le plan avec un repère orthonormé (O; OI, OJ). Soit z = a + ib ∈ C avec a, b ∈ R.
On peut lui associer dans le plan le point M de coordonnées (a, b). On dit alors que M est le point
d’affixe z, ou encore que z est l’affixe de M .

Fait 5.13 L’application de C vers le plan, qui à tout z ∈ C associe le point M d’affixe C, est une
bijection.

Exemple 5.14 L’affixe du point O est 0, l’affixe de I est 1 et l’affixe de J est i.

Soit
√ M le point d’affixe z. En utilisant le théorème de Pythagore, on voit que la distance OM est égale
à a2 + b2 , c’est-à-dire OM = |z|.
−→ −−→
Si z 6= 0, M 6= O et on peut considérer θ, la mesure de l’angle orienté entre les vecteurs OI et OM . Les
formules de trigonométrie dans le triangle donnent que a = OM × cos(θ) et b = OM × sin(θ), c’est-à-dire
z
|z| = cos(θ) + i sin(θ), et donc θ est un argument de z.
Le point M ′ d’affixe z est obtenu en prenant l’image de M (d’affixe z) par la symétrie orthogonale par
rapport à la droite (OI).
On appelle cercle trigonométrique le cercle de centre O et de rayon 1. C’est l’ensemble des points d’affixe
z avec |z| = 1 ; on peut écrire tous ces points sous la forme z = eiθ avec θ ∈ R (ou seulement θ ∈] − π, π]).

37
5.3 Quelques équations
Racines carrées

Soit w ∈ C. On cherche les racines carrées de w, c’est-à-dire les éléments z ∈ C tels que z 2 = w.

Forme algébrique
On suppose que w = c + id est donné sous forme algébrique et on cherche également z = a + ib sous
forme algébrique.
On calcule z 2 = (a2 − b2 ) + i2ab ; on en déduit que
( (
2 Re(z 2 ) = Re(w) a 2 − b2 = c
z =w⇔ ⇔
Im(z 2 ) = Im(w) 2ab = d

Pour rendre la résolution de ce système plus facile, on introduit une nouvelle équation : z 2 = w implique
que |z 2 | = |z|2 = |w|, c’est-à-dire a2 + b2 = |w|, et donc
   q
2 2 2 c+|w| c+|w|

 a − b = c (1) 
 a = 2


 a = ± 2
q
z 2 = w ⇔ 2ab = d ⇔ b2 = |w|−c 2
⇔ b=± |w|−c

 2   2
a + b2 = |w| (3)
 
2ab = d 
2ab = d

On a obtenu la valeur de a2 en faisant la somme des équations (1) et (3), et celle de b2 en faisant leur
différence. L’équation 2ab = d est utilisée pour déterminer les signes : si d > 0, a et b sont de même
signe ; si d < 0, a et b sont de signes différents ; et si d = 0, a = 0 ou b = 0.

Exemple p5.15 Racines carrées de w = 3 − 4i. En reprenant les calculs précédents, avec c = 3, d = −4
et |w| = 32 + (−4)2 = 5, on trouve

a = ±2

2
(a + ib) = 3 − 4i ⇔ b = ±1


2ab = −4

Comme on doit avoir 2ab = −4, a et b sont de signes différents, ce qui donne deux racines carrées :
z1 = 2 − i et z2 = −2 + i = −z1 .
Forme trigonométrique
On suppose que w = Reiφ est donné sous forme trigonométrique et on cherche également z = reiθ sous
forme trigonométrique.

Lemme 5.16 Soit d et T des réels, avec d 6= 0. Alors pour tous x, y dans R, dx ≡ dy [T ] ssi x ≡ y [T /d].
Preuve Si dx ≡ dy [T ], il existe k ∈ Z tel que dx = dy + kT , et donc x = y + kT d en divisant par d (qui
est non nul), ce qui dit que x ≡ y [T /d]. L’implication réciproque se montre de la même façon, cette fois
en multipliant par d. 
Par choix, r et R sont srictement positifs, et alors :
( ( √
2 2 2iθ iφ r2 = R r= R
z = w ⇔ r e = Re ⇔ ⇔
2θ ≡ φ [2π] θ ≡ φ2 [π]

Cela donne bien deux racines carrées pour w : en écrivant θ = φ2 +kπ, si k = 2k ′ est pair, alors θ ≡ φ2 [2π],

ce qui donne z = Reiφ/2 , et si k = 2k ′ + 1 est impair, alors θ = φ2 + π + 2k ′ π ≡ φ2 + π [2π], ce qui donne
√ √
z = Rei(φ/2+π) . Puisque eiπ = −1, on peut aussi écrire ces deux solutions z = ± Reiφ/2 .

Application : calcul de certaines valeurs de cosinus et sinus


Pour certains nombres complexes dont on connait à la fois la forme algébrique et la forme trigonomé-
trique, on peut utiliser les deux méthodes et comparer les résultats.

38
Exemple 5.17 Cherchons les racines carrées de i. 
2 2
a − b = 0

On cherche z = a + ib tel que z 2 = i, ce qui donne les équations 2ab = 1 , ce qui équivaut à

 2
a + b2 = 1
 √
2
a = ±√2

b = ± 22 . D’après la dernière équation, a et b sont de même signe, ce qui donne les racines carrées


2ab = 1
√ √
z = ±( 22 + i 22 ).
D’autre part, i s’écrit sous forme géométrique
( i = eiπ/2 . On cherche z = reiθ (avec r > 0) tel que
2
r =1
z 2 = eiπ/2 , ce qui donne les équations et donc z = ±eiπ/4 .
2θ ≡ π/2 [2π]
On identifie

les√deux formes des racines carrées de i. Comme√cos(π/4) > 0 et sin(π/4) > 0, on doit avoir
e iπ/4
= 2 + i 22 . On en déduit que cos(π/4) = sin(π/4) = 22 .
2

Équations du second degré

On cherche les solutions de l’équation αz 2 + βz + γ = 0, où α, β, γ sont des coefficients dans C, avec


α 6= 0. Comme pour les équations du second degré à coefficients réels, on peut la mettre sous forme
canonique :
β 2 β 2 − 4αγ
αz 2 + βz + γ = α((z + ) − ).
2α 4α2
On note encore le discriminant ∆ = β 2 − 4αγ. C’est un élément de C, on a vu précédemment qu’on peut
trouver δ ∈ C tel que δ 2 = ∆. On en déduit la factorisation
β 2 δ −β + δ −β − δ
αz 2 + βz + γ = α((z + ) − ( )2 ) = α(z − )(z − )
2α 2α 2α 2α
−β±δ
et donc les solutions de αz 2 + βz + γ = 0 sont z = 2α .

Racines n-ièmes de l’unité

Soit un entier n ≥ 2. On cherche dans C les solutions de l’équation z n = 1 ; on les appelle ( les racines
n
r =1
n-ièmes de l’unité. On cherche z = reiθ sous forme trigonométrique ; z n = 1 équivaut à .
nθ ≡ 0 [2π]
Comme r > 0, rn = 1 équivaut à r = 1 ; d’après le lemme 5.16, nθ ≡ 0 [2π] équivaut à θ ≡ 0 [2π/n],
et il existe donc k ∈ Z tel que θ = 2kπ n . En écrivant la division euclidienne de k par n, k = qn + s avec
0 ≤ s ≤ n − 1, on trouve que θ = 2sπ 2sπ
n + q2π, avec q ∈ Z, c’est-à-dire θ ≡ n [2π]. On trouve donc les n
i2sπ/n
racines n-ièmes de l’unité : ce sont les e , pour s entier variant entre 0 et n − 1. Géométriquement,
ces racines n-ièmes de l’unité sont situées sur le cercle trigonométrique ; pour s = 0, on obtient le point
d’affixe 1, et les racines suivantes sont obtenues en appliquant succesivement une rotation d’angle 2π/n.
Ces n points forment un polygône régulier à n côtés.

39
40
Chapitre 6

Polynômes

On va s’intéresser dans ce chapitre aux polynômes, à coefficients dans R ou dans C. Comme les
définitions et la plupart des résultats sont les mêmes pour R et C, on écrira K pour désigner soit R, soit
C.

6.1 Définitions et premières propriétés


On se donne un nom de variable X. Un polynôme en la variable X, à coeffcients dans K, est donné
par une suite de coefficients (an )n∈N dans K, nuls à partir d’un certain rang, c’est-à-dire ∃N ∈ N ∀n ≥
PN
N an = 0. On note un tel polynôme P = aN X N +aN −1 X N −1 +. . .+a1 X+a0 , ou encore P = n=0 an X n .
On écrira parfois aussi P (X) au lieu de P . On appelle polynôme nul le polynôme dont tous les coefficients
sont nuls.
On note K[X] l’ensemble des polynômes en X à coefficients dans K. Comme R ⊂ C, R[X] ⊂ C[X].

Définition 6.1 Soit P ∈ K[X] un polynôme non nul, et (an )n∈N ses coefficients. On définit le degré de
P , noté deg(P ), comme le plus grand entier N tel que aN 6= 0.
Par convention, si P = 0, le polynôme nul, alors deg(P ) = −∞.

Exemple 6.2 Soit P (X) = aX 2 + 3X − 1. Si a 6= 0, alors deg(P ) = 2. Si a = 0, alors deg(P ) = 1.


On définit maintenant la somme et le produit de deux polynômes. Soient P (X) = aN X N + . . . + a1 X + a0
et Q(X) = bN X N + . . . + b1 X + b0 (on peut toujours écrire des expressions de ce type avec le même N
pour P et Q, quitte à remplir par des coefficients nuls). Alors on définit :
1.
XN
P (X) + Q(X) = (an + bn )X n
n=0

2.
2N
X n
X
n
P (X)Q(X) = cn X avec cn = ai bn−i
n=0 i=0

Fait 6.3 La somme et le produit de polynômes vérifient les propriétés suivantes :


1. P (X) + Q(X) = Q(X) + P (X) et P (X)Q(X) = Q(X)P (X) (commutativité)
2. (P (X) + Q(X)) + R(X) = P (X) + (Q(X) + R(X)) et (P (X)Q(X))R(X) = P (X)(Q(X)R(X))
(associativité)
3. P (X)(Q(X) + R(X)) = P (X)Q(X) + P (X)R(X) (distributivité)

Remarque 6.4 En pratique, plutôt que de calculer un produit à l’aide de la règle de la définition, on
utilise les propriétés ci-dessus qui permettent de développer un produit selon les règles habituelles (avec
bien sûr an X n bm X m = an bm X n+m ). La règle donnée dans la définition peut être utile si on n’a besoin
de connaitre qu’un des coefficients du produit. Par exemple, si on fait le produit (X 5 + 3X 4 − X 3 + 2X 2 +
5X − 2)(7X 2 + 2X − 4), le coefficient de X 6 sera 1 × 2 + 3 × 7 = 23.

41
Pour le résultat suivant, on utilise les conventions habituelles pour −∞ : si x ∈ N ou x = −∞, alors
x + (−∞) = −∞ et max(x, −∞) = x.

Proposition 6.5 Soient P et Q dans K[X]. Alors :


1. deg(P +Q) ≤ max(deg(P ), deg(Q)) ; si deg(P ) 6= deg(Q), alors deg(P +Q) = max(deg(P ), deg(Q))
2. deg(P Q) = deg(P ) + deg(Q)
Preuve Les cas où P ou Q sont nuls sont faciles à vérifier, car P + 0 = P et P × 0 = 0. On suppose
donc maintenant que P (X), de coefficients (an )n∈N , et Q(X), de coefficients (bn )n∈N , sont non nuls.
Soit N = max(deg(P ), deg(Q)). Si n > N , alors n > deg(P ), donc an = 0, et n > deg(Q), donc bn = 0,
et on obtient donc an + bn = 0. Cela dit que le degré de P + Q est ≤ N . Si de plus deg(P ) 6= deg(Q),
on peut supposer que N = deg(P ) > deg(Q) quitte à échanger P et Q. Comme N > deg(Q), bN = 0, et
donc aN + bN = aN 6= 0, donc N = deg(P + Q).
P2N Pn
Pour le produit, écrivons P (X)Q(X) = n=0 cn X n avec cn = i=0 ai bn−i (ici N est n’importe Pn quel en-
tier ≥ max(deg(P ), deg(Q))). Regardons cn pour n > deg(P )+deg(Q). Dans la somme cn = i=0 ai bn−i ,
si i > deg(P ) alors ai = 0 et donc ai bn−i = 0, et si i ≤ deg(P ) alors n−i > deg(P )+deg(Q)−i > deg(Q)
donc bn−i = 0 et donc aussi ai bn−i = 0. Ainsi cn est une somme de termes nuls, donc cn = 0. Cela dit
que deg(P Q) ≤ deg(P ) + deg(Q). De plus, pour nP= deg(P ) + deg(Q), on voit par un raisonnement
n
semblable au précédent que dans la somme cn = i=0 ai bn−i , le seul terme non nul est obtenu pour
i = deg(P ) et donc n − i = deg(P ) + deg(Q) − deg(P ) = deg(Q), puisque dans ce cas ai 6= 0 et bn−i 6= 0
par définition du degré (les autres termes sont nuls car soit ai = 0, soit bn−i = 0). On a donc trouvé
cdeg(P )+deg(Q) = adeg(P ) bdeg(Q) 6= 0, ce qui justifie que le degré de P Q est deg(P ) + deg(Q). 

Remarque 6.6 Si P est un polynôme non nul de degré n, le coefficient devant X n s’appelle le coefficient
dominant de P . La preuve précédente nous dit que le coefficient dominant de P Q est le produit du
coefficient dominant de P et de celui de Q.

Exemple 6.7 1. P (X) = 4X 3 − 2X + 1 et Q(X) = 5X 2 − X + 2 ; deg(P ) = 3 et deg(Q) = 2.


P (X) + Q(X) = 4X 3 + 5X 2 − 3X + 3 ; deg(P + Q) = 3 = max(deg(P ), deg(Q)).
P (X)Q(X) = 20X 5 − 4X 4 − 2X 3 + 7X 2 − 5X + 2 ; deg(P Q) = 5 = deg(P ) + deg(Q), le coefficient
dominant de P Q est 20 = 4 × 5.
2. P (X) = 2X 2 − 3X + 1 et Q(X) = −2X 2 + X − 4, tous les deux de degré 2.
P (X) + Q(X) = −2X − 3 ; deg(P + Q) = 1 ≤ 2 = max(deg(P ), deg(Q)).
PN
Définition 6.8 Soit un polynôme P (X) = n=0 an X n . On définit sa dérivée, notée P ′ , par
N
X
P ′ (X) = nan X n−1 .
n=1

Remarque 6.9 1. Cette définition est pour l’instant uniquement formelle, c’est une manipulation
sur les coefficients du polynôme qui n’utilise pas la notion de dérivée au sens de l’analyse.
2. Si deg(P ) ≤ 0, on dit que P est un polynôme constant. Dans ce cas, on peut écrire P = a0 et
alors P ′ = 0 × a0 = 0.

Proposition 6.10 Soient deux polynômes P et Q.


1. Si P est de degré N ≥ 1, de coefficient dominant aN , alors P ′ est de degré N − 1, de coefficient
dominant N aN .
2. (P + Q)′ = P ′ + Q′
3. (P Q)′ = P Q′ + P ′ Q
Preuve Si N = deg(P ) ≥ 1, on peut écrire P (X) = aN X N + . . . + a1 X + a0 avec aN 6= 0, et alors
P ′ (X) = N aN X N −1 + . . . + a1 avec N aN 6= 0, donc deg(P ) = N − 1 et le coefficient dominant de P ′ est
N aN .
La propriété (P + Q)′ = P ′ + Q′ se vérifie immédiatement.

42
PN PN P2N
Pour le produit, écrivons P (X) = n=0 an X n et Q(X) = n=0 bn X n . Alors P (X)Q(X) = n=0 cn X n
Pn P2N
avec cn = j=0 aj bn−j . Et donc (P Q)′ (X) = n=1 ncn X n−1 : en faisant le changement de variable
Pm+1
m = n − 1, on voit que le coefficient de X m dans (P Q)′ est (m + 1)cm+1 = (m + 1) j=0 aj bm+1−j .
D’autre part, faisons Ple produit P ′ Q : le coefficent de X i dans P ′ est (i + 1)ai+1 donc le coefficient
m
de X dans P Q est i=0 (i + 1)ai+1 bm−i . Par le même argument, le coefficient de X m dans P Q′ est
P
m ′
m m
i=0 ai (m − i + 1)bm−i+1 . Donc le coefficient de X dans P ′ Q + P Q′ est

m
X m
X m+1
X m
X
(i + 1)ai+1 bm−i + ai (m − i + 1)bm−i+1 = jaj bm−j+1 + aj (m − j + 1)bm−j+1
i=0 i=0 j=1 j=0
| {z } | {z }
j=i+1 j=i
m
X 
= (m + 1)am+1 b0 + (j + m − j + 1)aj bm−j+1 + (m + 1)a0 bm+1
j=1
m+1
X
= (m + 1) aj bm+1−j
j=0

On retrouve bien le coefficient de X m dans (P Q)′ , donc (P Q)′ = P ′ Q + P Q′ . 

Définition 6.11 On définit les derivées successives de P par récurrence sur n :


P (0) = P et pour tout n ∈ N, P (n+1) = (P (n) )′ .
On appelle P (n) la dérivée n-ième de P .
Pour les petites valeurs de n, on utilise plutôt les notations P ′ = P (1) , P ′′ = P (2) , ...

Remarque 6.12 Soit P un polynôme de degré N ≥ 1, de coefficient dominant aN . En appliquant la


propriété 1 de la proposition 6.10 N fois successivement, on obtient que P (N ) est le polynôme constant
N !aN . Et donc P (N +1) = 0.

Exemple 6.13 P (X) = 3X 2 − 4X + 3 ; P ′ (X) = 6X − 4 ; P ′′ (X) = P (2) (X) = 6 = 2! × 3 ; P (3) (X) = 0.

6.2 Racines d’un polynôme


PN
Soit P (X) = n=0 an X n un élément de K[X]. Alors P permet de définir une application de K dans
K:
K → K
PN n
x 7 → n=0 an x

On l’appelle la fonction polynomiale associée à P ; par simplicité, on la note encore P .


Comme R[X] ⊂ C[X], si P ∈ R[X], on a aussi P ∈ C[X] : P permet donc à la fois de définir une fonction
polynomiale de R dans R et aussi de C dans C.

Remarque 6.14 Les opérations de somme, produit et dérivée sur les polynômes correspondent aux
mêmes opérations sur les fonctions polynomiales associées.

Définition 6.15 Soit P ∈ K[X] et a ∈ K. On dit que a est une racine de P (on précise parfois : dans
K) si P (a) = 0.

Exemple 6.16 1. Soit P = a0 un polynôme constant ; la fonction polynomiale associée est la fonc-
6 0, P n’admet pas de racine ; si a0 = 0, tout élément a ∈ K est
tion constante égale à a0 . Si a0 =
racine de P .
2. Soit P (X) = aX + b ∈ K[X] un polynôme de degré 1 (avec donc a 6= 0). Alors la seule racine de
P dans K est − ab .

43
On a vu dans le chapitre précédent que toute équation du second degré à coefficients dans C admet au
moins une solution dans C, ce qui signifie exactement que tout polynôme P ∈ C[X] de degré 2 admet au
moins une racine. On a en fait un résultat beaucoup plus général, que l’on admet sans démonstration.

Théorème 6.17 - Théorème de d’Alembert-Gauss, Théorème fondamental de l’algèbre


Tout polynôme P ∈ C[X] non constant admet au moins une racine dans C.

La situation est différente pour les polynômes à coefficients réels. Le fait suivant est bien connu.

Fait 6.18 Soit P (X) = aX 2 + bX + c ∈ R[X] un polynôme de degré 2, et ∆ = b2 − 4ac son discriminant.
Alors P admet une racine dans R ssi ∆ ≥ 0.

Exemple 6.19 P (X) = X 2 + 1 n’admet pas de racine réelle car son discriminant est −4.

Proposition 6.20 Soit P (X) = aN X N + . . . + a0 ∈ R[X] un poynôme de degré N impair. Alors P


admet une racine réelle.

Preuve On va utiliser des notions d’analyse. On peut supposer que aN > 0 (si ce n’est pas le cas, il
suffit de considérer −P , sachant que P et −P ont exactement les mêmes racines). Alors la limite de P (x)
quand x tend vers +∞ est +∞, et celle en −∞ est −∞. En particulier, on peut trouver deux réels x0
et x1 tels que P (x0 ) < 0 et P (x1 ) > 0. D’autre part, les fonctions polynomiales sont continues, donc
en appliquant le théorème des valeurs intermédiaires, on peut trouver x compris entre x0 et x1 tel que
P (x) = 0 : x est une racine de P . 

Définition 6.21 Soit P ∈ K[X] et a ∈ K. On dit que a est une racine de P de multiplicité m si
P (a) = P ′ (a) = . . . = P (m−1) (a) = 0 et P (m) (a) 6= 0.
On dira aussi que a est une racine simple si a est une racine de multiplicité 1 (c’est-à-dire P (a) = 0 et
P ′ (a) 6= 0), a est une racine double si elle est de multiplicité 2,...

Exemple 6.22 1. Soit P (X) = X 2 − 3X + 2 ; 1 est une racine de P car P (1) = 0, P ′ (X) = 2X − 3

et P (1) 6= 0 donc 1 est une racine simple de P .
2. Soit P (X) = X 2 + 2X + 1, P ′ (X) = 2X + 2, P ′′ (X) = 2 ; P (−1) = P ′ (−1) = 0 et P ′′ (−1) 6= 0
donc −1 est une racine double de P .

Remarque 6.23 Soit P un polynôme non nul, de degré N , de coefficient dominant aN . On a vu que
P (N ) est le polynôme constant N !aN 6= 0 ; en particulier, pour toute racine a de P , on pourra trouver
un entier n tel que P (n) (a) 6= 0.

Proposition 6.24 Soit P (X) = aN X N + . . . + a1 X + a0 ∈ R[X] un polynôme à coefficients réels et


z ∈ C une racine de P . Alors le conjugué z est aussi une racine de P , de même multiplicité que z.

Preuve Prenons le conjugué de l’égalité P (z) = aN z N + . . . + a1 z + a0 = 0. En utilisant les règles de


calcul pour le conjugué, on obtient aN z N + . . . + a1 z + a0 = 0 = 0. Comme tous les coefficients an sont
réels, ils vérifient an = an , et l’égalité précédente devient donc aN z N + . . . + a1 z + a0 = 0, c’est-à-dire
P (z) = 0.
Supposons maintenant que z est une racine de multiplicité m de P . Alors P (z) = P ′ (z) = . . . =
P (m−1) (z) = 0 et P (m) (z) 6= 0. En appliquant ce qu’on vient de montrer aux polynômes P, P ′ , . . . , P (m−1) ,
qui sont des polynômes à coefficients réels, on trouve que P (z) = P ′ (z) = . . . = P (m−1) (z) = 0. De plus,
P (m) (z) 6= 0 : en effet, si on suppose par l’absurde que P (m) (z) = 0, en appliquant encore une fois le
premier résultat on obtient que P (m) (z) = 0, c’est-à-dire P (m) (z) = 0, ce qui est une contradiction. On
a donc montré que z est une racine de P de multiplicité m. 

44
6.3 Factorisation des polynômes
Un certain nombre de notions et résultats d’arithmétique ont des analogues pour les polynômes. Nous
ne donnerons pas toutes les démonstrations, certaines ne sont que des adaptations des démonstrations
de l’arithmétique.

Définition 6.25 Soient P et Q dans K[X]. On dit que P divise Q, et on note P |Q, s’il existe U ∈ K[X]
tel que Q = P U .

Fait 6.26 La relation P |Q est réflexive et transitive.


Si P |Q et P |R, alors P |Q + R.

Proposition et définition 6.27 Soient P et Q deux polynômes non nuls ; (P |Q et Q|P ) ssi il existe
une constante non nulle λ ∈ K (c’est-à-dire un polynôme de degré 0) telle que Q = λP .
On dit dans ce cas que P et Q sont associés.

Preuve On suppose que P |Q et Q|P . Comme P |Q, il existe U ∈ K[X] tel que Q = P U . Notons que
U 6= 0 car Q 6= 0. D’après les propriétés du degré, deg(Q) = deg(P ) + deg(U ), avec deg(U ) ≥ 0 car
U 6= 0, donc deg(Q) ≥ deg(P ). On montre de la même manière, en utilisant cette fois le fait que Q|P ,
que deg(P ) ≥ deg(Q). On peut donc conclure que deg(Q) = deg(P ) ; cela implique donc que deg(U ) = 0,
donc U est une constante non nulle λ, et Q = λP .
Montrons maintenant la réciproque. S’il existe une constante non nulle λ ∈ K telle que Q = λP , alors
P |Q par définition, et on obtient aussi que P = λ1 Q, donc Q|P . 

Définition 6.28 Soit P un polynôme dans K[X] de degré ≥ 1. On dit que P est irréductible dans K[X]
si pour tous P1 et P2 dans K[X] tels que P = P1 P2 , P1 ou P2 est associé à P .

Exemple 6.29 Si P est de degré 1, alors il est irréductible. En effet, si on a une factorisation P = P1 P2 ,
alors deg(P1 ) + deg(P2 ) = deg(P ) = 1, ce qui oblige à ce que deg(P1 ) = 0 et deg(P2 ) = 1 (ou vice-versa).
Dans ce cas, P1 est une constante non nulle et donc P est associé à P2 .

Proposition et définition 6.30 - Division euclidienne


Soient P1 et P2 deux éléments de K[X], avec P2 6= 0. Alors il existe Q et R dans K[X], uniquement
déterminés, tels que P1 = P2 Q + R avec deg(R) < deg(P2 ).
On dit que Q est le quotient de la division euclidienne de P1 par P2 , et R son reste.

Preuve On se donne le polynôme P2 non nul, de degré d et de coefficient dominant ad . On va montrer


l’existence de la division euclidienne par récurrence sur le degré de P1 : on suppose qu’on sait faire la
division euclidienne de P3 par P2 pour tout polynôme P3 de degré < n et on va montrer qu’on peut faire
la division euclidienne de P1 par P2 pour tout P1 de degré n.
Si n < deg(P2 ), il n’y a rien à faire : P1 = P2 × 0 + P1 avec deg(P1 ) = n < deg(P2 ) : 0 est le quotient et
P1 le reste. Cela joue le rôle d’étape d’initialisation.
Supposons maintenant que deg(P1 ) = n ≥ d = deg(P2 ). Notons bn le coefficient dominant de P1 . Alors
( abnd X n−d )P2 est un polynôme de degré n, et de coefficient dominant abnd ad = bn . En faisant la différence
P3 = P1 − abnd X n−d P2 , les coefficients de X n se simplifient et on obtient un polynôme P3 de degré < n.
On peut alors appliquer l’hypothèse de récurrence : il existe Q et R dans K[X], avec deg(R) < d tels que
P3 = QP2 + R. En revenant à la définition de P3 , on trouve que

bn n−d bn
P1 = P3 + X P2 = (Q + X n−d )P2 + R,
ad ad

c’est ce qu’on voulait, avec Q + abnd X n−d comme quotient et R, de degré < d, comme reste.
Reste à voir l’unicité de Q et de R. Si P1 = Q1 P2 + R1 = Q2 P2 + R2 , avec R1 et R2 de degré <
deg(P2 ), on peut écrire que R2 − R1 = (Q1 − Q2 )P2 . Donc P2 divise R2 − R1 , avec deg(R2 − R1 ) ≤
max(deg(R1 ), deg(R2 )) < deg(P2 ) : c’est impossible, sauf si R2 −R1 = 0. On a donc montré que R1 = R2 ,
ce qui donne (Q1 − Q2 )P2 = 0, et donc Q2 − Q1 = 0 (on peut le justifier encore une fois avec les degrés).

45

La preuve donne aussi un algorithme pour faire la division euclidienne de P1 par P2 . Si deg(P1 ) < deg(P2 ),
il n’y a rien à faire. Sinon, on élimine le terme de plus haut degré de P1 en lui retranchant un polynôme
de la forme abnd X n−d P2 ; et on recommence jusqu’à obtenir un reste dont le degré est < deg(P2 ). On peut
poser cette division euclidienne comme on le fait pour les entiers.

Exemple 6.31 On veut faire la division euclidienne de P1 (X) = X 5 − 3X 4 + X 3 + 2X 2 + 5X − 1 par


P2 (X) = X 3 + 2X + 1 :

X5 − 3X 4 + X3 + 2X 2 + 5X − 1 X 3 + 2X + 1
− (X 5 + 2X 3 + X 2) X 2 − 3X − 1
− 3X 4 − X3 + X2 + 5X − 1
− (− 3X 4 − 6X 2 − 3X)
− X3 + 7X 2 + 8X − 1
− (− X3 − 2X − 1)
7X 2 + 10X

Ce qui nous donne : X 5 − 3X 4 + X 3 + 2X 2 + 5X − 1 = (X 3 + 2X + 1)(X 2 − 3X − 1) + 7X 2 + 10X,


X 2 − 3X − 1 est le quotient et 7X 2 + 10X est le reste.

Remarque 6.32 Soient P1 et P2 dans K[X], avec P2 6= 0. Alors P2 |P1 ssi le reste de la division
euclidienne de P1 par P2 est nul.

Lemme 6.33 Soient P ∈ K[X], a ∈ K, et P = (X − a)Q + R la division euclidienne de P par le


polynôme X − a. Alors R est un polynôme constant, de valeur P (a).
Preuve Par définition de la division euclidienne, on doit avoir deg(R) < deg(X − a) = 1, donc R est
un polynôme constant. Pour avoir sa valeur, on peut l’évaluer en n’importe quel point. Or, en prenant
la valeur en a dans l’égalité P = (X − a)Q + R, on trouve P (a) = 0 × Q(a) + R(a) = R(a). 

Théorème 6.34 Soient P ∈ K[X] et a ∈ K. Alors (X − a) divise P ssi P (a) = 0.


Preuve Si (X − a)|P , on peut écrire P (X) = (X − a)U (X) pour un certain polynôme U (X), et donc
P (a) = 0 × U (a) = 0.
Réciproquement, supposons que P (a) = 0. D’après le lemme 6.33, le reste de la division euclidienne de
P par X − a est le polynôme constant nul, et donc, par la remarque 6.32, X − a divise P . 

Corollaire 6.35 Soient P ∈ K[X], a ∈ K et un entier m ≥ 1. Alors (X − a)m divise P ssi a est une
racine de P de multiplicité ≥ m.
On en déduit aussi que a est une racine de P de multiplicité exactement m ssi (X − a)m divise P mais
(X − a)m+1 ne divise pas P .
Preuve On ne donne pas tous les détails de la démonstration.
Pour m = 1, c’est exactement le théorème 6.34.
Considérons le cas m = 2. Si (X − a)2 divise P , on écrit P (X) = U (X)(X − a)2 . On a déjà vu que
P (a) = 0, et on calcule P ′ (X) = U ′ (X)(X − a)2 + U (X) × 2(X − a), donc P ′ (a) = 0. Cela signifie que a
est une racine au moins double de P . Réciproquement, supposons que a est une racine au moins double
de P . Comme a est une racine de P , on sait déjà qu’on peut écrire P (X) = (X − a)U (X) d’après le
théorème 6.34. En dérivant, on obtient P ′ (X) = U (X) + (X − a)U ′ (X), et en prenant la valeur en a,
P ′ (a) = U (a) + 0. Or P ′ (a) = 0 puisque a est une racine au moins double de P , donc U (a) = 0, et en ap-
pliquant le théorème 6.34, on sait qu’on peut écrire U (X) = (X − a)V (X). Donc P (X) = (X − a)2 V (X).
Le cas général s’obtient en répétant cet argument. 

46
Exemple 6.36 Soit P (X) = aX 2 + bX + c ∈ R[X] un polynôme de degré 2, et soit ∆ = b2 − 4ac son
discriminant.
Si ∆ ≥ 0, on sait que P admet une racine α, donc on sait par le thórème 6.34 que P peut se factoriser
en P (X) = (X − α)U (X) ; de plus deg(X − α) = deg(U ) = 1 (car la somme des degrés doit être 2), donc
ni (X − α) ni U (X) ne sont associés à P , donc P n’est pas irréductible.
Supposons maintenant que ∆ < 0, on sait que P n’admet pas de racine réelle. Si on se donne une
factorisation P (X) = P1 (X)P2 (X) dans R[X], où ni P1 ni P2 ne sont des constantes, on doit avoir
que deg(P1 ) = deg(P2 ) = 1. On écrit P1 (X) = uX + v (avec u 6= 0), alors P (X) = (uX + v)P2 (X) =
(X + uv ) × (uP2 (X)). Donc X + uv divise P , ce qui donne que − uv est une racine réelle de P , une
contradiction. Donc une telle factorisation de P n’existe pas, ce qui signifie que P est irréductible.

Soit un polynôme P ∈ K[X] de degré ≥ 1. On cherche à le factoriser dans K[X] en un produit de facteurs
irréductibles. Si P est déjà irréductible, il n’y a rien à faire. Sinon, on peut écrire P = P1 P2 , avec P1 et P2
qui ne sont pas associés à P , ce qui implique qu’ils sont de degré compris entre 1 et deg(P ) strictement.
On peut donc recommencer la factorisation avec les polynômes "plus simples" P1 et P2 . On obtient de
cette manière un théorème analogue à celui de l’arithmétique.

Théorème 6.37 Tout polynôme P ∈ K[X] de degré ≥ 1 peut être écrit comme un produit de facteurs
irréductibles.

Définition 6.38 Un polynôme P ∈ K[X] de degré ≥ 1 est dit scindé (dans K[X]) s’il peut être écrit

P (X) = λ(X − a1 ) . . . (X − an )

où λ, a1 , . . . , an sont des éléments de K.

Remarque 6.39 1. Si on peut écrire P (X) = λ(X − a1 ) . . . (X − an ), on vérifie facilement que n


est le degré de P , a1 , . . . , an sont les racines de P (éventuellement avec répétition), et λ est le
coefficient dominant de P .
2. On regroupe souvent les racines quand elles sont égales entre elles : si P est scindé, on peut l’écrire
sous la forme
P (X) = λ(X − b1 )m1 . . . (X − br )mr ,
où les b1 , . . . , br sont deux à deux distincts. Ce sont les racines de P , et pour tout i, mi est la
multiplicité de la racine bi . On constate en particulier que le degré de P vaut m1 + . . . + mr : on
dit que le degré de P est égal au nombre de racines de P , comptées avec leur multiplicité (b1 est
compté m1 fois, ...).
3. Plus généralement, pour un polynôme non nul, on a toujours que le nombre de racines de P est
inférieur ou égal au degré de P .
4. Certains polynômes ne sont pas scindés. Par exemple X 2 + 1 n’est pas scindé dans R[X] car il
n’a pas de racine dans R (et il devrait avoir deux racines dans R s’il était scindé). Attention : ne
pas confondre les cas P (X) = X 2 + 1, qui n’est pas scindé dans R[X], et P (X) = (X + 1)2 , qui
est scindé dans R[X], avec −1 comme racine double.

Proposition 6.40 Les polynômes irréductibles de C[X] sont exactement les polynômes de degré 1.

Preuve On a déjà vu que les polynômes de degré 1 sont irréductibles (exemple 6.29).
Réciproquement, supposons que P est un polynôme irréductible (en particulier de degré ≥ 1 par défini-
tion). D’après le théorème 6.17, P admet une racine a ∈ C, et donc, d’après le théorème 6.34, on peut
factoriser P sous la forme P (X) = (X − a)U (X). Comme P est irréductible, U doit être une constante
non nulle, et donc P est de degré 1. 

En utilisant le théorème 6.37, on en déduit donc :

Corollaire 6.41 Tout polynôme P ∈ C[X] est scindé dans C[X].

Lemme 6.42 Soient P ∈ K[X], et a et b deux racines distinctes de P . Alors (X − a)(X − b) divise P .

47
Preuve On utilise le théorème 6.34. Comme a est une racine de P , on peut écrire P (X) = (X −a)U (X).
De plus, b est une racine de P , donc P (b) = (b − a)U (b) = 0. Comme b 6= a, cela implique que
U (b) = 0. On peut donc maintenant appliquer le théorème 6.34 pour U : il existe V ∈ K[X] tel que
U (X) = (X − b)V (X), et donc P (X) = (X − a)(X − b)V (X). 

Remarque 6.43 On pourrait aussi donner une démonstration analogue à celle d’arithmétique en disant
que (X − a) et (X − b) sont "premiers entre eux" (on n’a pas défini ici cette notion pour les polynômes).

Lemme 6.44 Soit z ∈ C. Alors (X − z)(X − z) ∈ R[X].


Preuve En développant, on trouve P (X) = (X −z)(X −z) = X 2 −(z +z)X +zz. Or z +z = 2Re(z) ∈ R
et zz = |z|2 ∈ R : tous les coefficients de P sont dans R, ce qui signifie que P ∈ R[X]. 

Corollaire 6.45 Les polynômes irréductibles de R[X] sont exactement les polynômes de degré 1 et les
polynômes de degré 2 de discriminant < 0.
Preuve On a déjà vu que les polynômes de degré 1 sont irréductibles (exemple 6.29) et qu’un polynôme
de degé 2 est irréductible dans R[X] ssi son discriminant est < 0 (exemple 6.36). Il reste donc à montrer
que si P ∈ R[X] est un polynôme de degré ≥ 3, il n’est pas irréductible.
Si P admet une racine réelle a, il est divisible par X − a et donc il n’est pas irréductible. Sinon, on sait
que P admet une racine complexe z (par le théorème 6.17) qui n’est donc pas réelle. On a alors z 6= z. Or,
par la proposition 6.24, z est aussi une racine de P , et donc, en utilisant les deux lemmes précédents, P
est divisible par Q(X) = (X − z)(X − z), qui est un polynôme réel : on peut écrire P (X) = Q(X)U (X),
avec deg(P ) = 3 > 2 = deg(Q), donc U n’est pas une constante, et P n’est pas irréductible. 

Méthodes de factorisation des polynômes


On cherche à factoriser un polynôme P ∈ K[X], de degré ≥ 1, en facteurs irréductibles.
Le cas de la factorisation dans C[X] est le plus simple (au moins en théorie) : tous les facteurs irréduc-
tibles de P sont de degré 1, et pour les trouver, il suffit de chercher une racine a de P : on peut alors
écrire P (X) = (X − a)Q(X) (on trouve Q en faisant la division de P par X − a), et on cherche ensuite
à factoriser Q. Mieux, on peut chercher la multiplicité m de la racine a, ce qui permet de factoriser
P (X) = (X − a)m U (X), et le degré de U est plus petit que celui du polynôme Q précédent si m ≥ 2.
En pratique, on sait bien trouver les racines de P s’il est de degré 1 ou 2, mais on n’a pas de méthode si
deg(P ) ≥ 3. Dans la plupart des exemples qui seront vus, il existera toujours une racine évidente, et on
trouvera une racine de P en cherchant des valeurs simples : 0, 1, −1, 2, . . ..
Le cas de la factorisation dans R[X] peut être plus compliqué, car il est possible que P n’admette
pas de racine réelle, sans pour autant être irréductible. On peut alors commencer à factoriser P dans
C[X] comme vu précédemment. Et si on trouve une racine complexe non réelle z, P est divisible par
(X − z)(X − z), qui est un polynôme irréductible dans R[X].

Exemple 6.46 1. On veut factoriser le polynôme P (X) = X 4 − 12X 3 + 42X 2 − 52X + 21. On voit
que P (1) = 0 : 1 est une racine évidente de P . Puis on calcule P ′ (1) = 0 et P ′′ (1) 6= 0 : 1 est une
racinde double de P . On en déduit que P est divisible par (X − 1)2 . En faisant la division de P
par (X − 1)2 (ou encore X 2 − 2X + 1), on trouve que P (X) = (X − 1)2 (X 2 − 10X + 21). Puis
on trouve facilement les racines de Q(X) = X 2 − 10X + 21, à savoir 3 et 7 (avec ∆ = 16), ce qui
donne Q(X) = (X − 3)(X − 7) (car le coefficient dominant de Q est 1). Donc la décomposition
en facteurs irréductibles de P est P (X) = (X − 1)2 (X − 3)(X − 7) ; en particulier P est scindé,
avec 4 racines comptées avec leur multiplicité.
2. On veut factoriser le polynôme P (X) = X 4 +X 3 +2X 2 +X +1 dans R[X]. On sait que P n’est pas
irréductible car il est de degré 4, mais on ne parvient pas à trouver de racine réelle. Cherchons des
racines complexes : on voit que P (i) = 1 − i − 2 + i + 1 = 0. Ainsi, i est une racine de P , et donc
i = −i aussi, et on sait que P est divisible par Q(X) = (X −i)(X +i) = X 2 +1 (c’est un polynôme
irréductible dans R[X]). On fait la division de P par Q et on trouve P (X) = (X 2 +1)(X 2 +X +1).
Or X 2 + X + 1 est un polynôme irréductible dans R[X] puisque son discriminant est −3 ; on a
donc bien trouvé la décomposition de P en facteurs irréductibles dans R[X].

48
Chapitre 7

Géométrie dans le plan et dans l’espace

7.1 Géométrie dans le plan


7.1.1 Coordonnées
−→ −→
On considère le plan P muni d’un repère (O, OI, OJ) : O est appelé l’origine du repère, et les vecteurs
−→ −→
OI et OJ sont par définition non-colinéaires. Tout point M de P peut alors être décrit par ses coordonnées
(xM , yM ) ∈ R2 dans ce repère. Cela signifie que
−−→ −→ −→
OM = xM OI + yM OJ

Soient deux points A et B du plan P, et leurs coordonnées respectives (xA , yA ) et (xB , yB ). On peut
−−→
considérer le vecteur d’origine A et d’extrémité B, noté AB.
−−→
Pour un tel vecteur AB, on définit ses coordonnées (xB − xA , yB − yA ) dans R2 . Un(vecteur est complète-
−−→ −−→ xB − xA = xD − xC
ment déterminé par ses coordonnées : cela siginifie que AB = CD si et seulement si ;
yB − yA = yD − yC
deux vecteurs égaux peuvent avoir des origines et des extrémités différentes.


On appelle le vecteur nul le vecteur dont les coordonnées sont nulles : 0 = (0, 0).
Dire que deux vecteurs − →
u et −→v sont colinéaires revient à dire qu’il existe un réel λ tel que −

v = λ−→
u ou

− →
− →
− →

u = λ v . Le vecteur nul est colinéaire à tous les vecteurs puisqu’on a toujours 0 = 0 u .
−→ −→ −→ −→
On suppose désormais que le repère (O, OI, OJ) est orthogonal, c’est-à-dire que les vecteurs OI et OJ


sont orthogonaux (on peut aussi dire perpendiculaires). Pour deux vecteurs − →u = (x, y) et u′ = (x′ , y ′ ),
on définit leur produit scalaire :


h−
→u , u′ i = xx′ + yy ′ .


→ −

Fait 7.1 Les vecteurs →

u et u′ sont orthogonaux ssi leur produit scalaire h→

u , u′ i est nul.

7.1.2 Droites
Pour définir une droite, il suffit de deux points distincts : pour tous points distincts A et B, il existe
une unique droite passant par A et B, que l’on note habituellement (AB).
−−→
Pour tout point M du plan, le point M appartient à la droite (AB) ssi le vecteur AM est colinéaire au
−−→ −−→
vecteur AB. On dit dans ce cas que A est une origine de la droite et AB en est un vecteur directeur.
Plus généralement, si on se donne un point A de coordonnées (xA , yA ) et un vecteur non nul − →
u = (a, b),


on peut définir la droite D d’origine A et de vecteur directeur u : c’est l’ensemble des points M du plan
−−→
tels que AM est colinéaire à − →
u . Ainsi, en notant (x,
(y) les coordonnées de M , le point M appartient à
−−→ x − xA = λa
D ssi il existe λ ∈ R tel que AM = λu, c’est-à-dire
y − yA = λb

49
.(On obtient ainsi la description paramétrique de la droite D : c’est l’ensemble des points de coordonnées
x = xA + λa
, où le paramètre λ parcourt R.
y = yA + λb
De manière alternative, on peut décrire la droite D à partir d’une origine et d’un vecteur normal. Un
vecteur normal à une droite est un vecteur non nul qui est orthogonal au vecteur directeur de la droite.
Si A de coordonnée (xA , yA ) est une origine de la droite D, et si −

v = (c, d) est un vecteur normal à D,
−−→ →

alors le point M appartient à D ssi AM est orthogonal à v . On a donc, en notant (x, y) les coordonnées
de M :
−−→ →
M ∈ D ⇔ hAM , − v i = 0 ⇔ c(x − xA ) + d(y − yA ) = 0.
On a ainsi obtenu une équation cartésienne de la droite D :

D = {M ∈ P; cx + dy = cxA + dyA }.

Notons que les coefficients devant les coordonnées x et y de M sont précisément les coordonnées (c, d)
du vecteur normal −
→v.

Exemple 7.2 Considérons les points A de coordonnées (1, 2) et B de coordonnées (3, 5), et D la droite
(AB).
−−→
La droite D admet A comme origine et AB = (2, 3) comme vecteur
( directeur. On en déduit sa description
x = 1 + 2λ
paramétrique : D est l’ensemble des points M de coordonnées quand λ parcourt R.
y = 2 + 3λ
−−→ →
On constate facilement que −→v = (−3, 2) est un vecteur normal à la droite D, puisque hAB, − vi =
2 × (−3) + 3 × 2 = 0. En utilisant la méthode précédente, on peut alors obtenir une équation cartésienne
de la droite D : D = {M ∈ P; −3x + 2y = 1}.

On peut également faire le travail précédent dans le sens inverse. Soit D une droite donnée par son
équation cartésienne cx + dy = e. Pour trouver une origine et un vecteur directeur de D, il suffit de
trouver deux point distincts de A et B sur D : on peut alors considérer A comme l’origine de D et
−−→
AB comme vecteur directeur. D’après ce qu’on a vu précédemment, il est encore plus facile de trouver
un vecteur normal pour D, simplement en utilisant les coefficients de l’équation cartésienne : le vecteur

−v = (c, d) est un vecteur normal pour D.

Fait 7.3 Les vecteurs directeurs de D sont tous colinéaires entre eux. Les vecteurs normaux à D sont
tous colinéaires entre eux.

Exemple 7.4 Soit D la droite d’équation 2x + y = 3. On voit que les points A de coordonnées (0, 3) et
B de coordonnées (3, −3) sont deux points distincts de D ; ainsi D est la droite d’origine A et de vecteur
−−→ −−→
directeur AB = (3, −6). Le vecteur −→
v = (6, 3) est orthogonal au vecteur directeur AB, c’est donc un
vecteur normal à D. On peut aussi trouver un vecteur normal en regardant l’équation cartésienne de D :
→′
− →

v = (2, 1) est aussi un vecteur normal à D, et on constate bien que −→v et v ′ sont colinéaires.

7.1.3 Distance
−→ −→
On suppose désormais que le repère (O, OI, OJ) est orthonormal (on dit aussi orthonormé), c’est-à-
−→ −→
dire que c’est un repère orthogonal tel que de plus les vecteurs OI et OJ sont de longueur 1. En utilisant
−−→
le théorème de Pythagore, on peut alors calculer la longueur de tout vecteur OM .
−−→ p
Proposition 7.5 Soit M un point de coordonnées (x, y). Alors la longueur du vecteur OM est x2 + y 2 .

Preuve Considérons le point N de coordonnée (x, 0), alors le triangle OM N est rectangle en N (on
peut faire le dessin). Lepthéorème de Pythagore donne donc OM 2 = ON 2 + M N 2 , or ON = |x| et
M N = |y| donc OM = x2 + y 2 . 
−−→ −−→
Soient A et B deux points du plan, et M le point de coordonnées (xB − xA , yB − yA ). Alors OM = AB,
et on en déduit :

50
p
Corollaire 7.6 La distance entre deux points A et B est (xB − xA )2 + (yB − yA )2 .

Cela permet d’écrire l’équation des cercles. Soit A un point du plan et R un réel positif. Le cercle de
centre A et de rayon R est l’ensemble des points M tel que AM = R. En utilisantp le corollaire ci-dessus,
et en notant (x, y) les coordonnées de M , on trouve l’équation du cercle : (x − xA )2 + (y − yA )2 = R,
qu’on écrit le plus souvent sous sa forme équivalente : (x − xA )2 + (y − yA )2 = R2 .
On peut aussi faire le travail dans l’autre sens, et reconnaître l’équation de cercles comme dans l’exemple
suivant.

Exemple 7.7 On cherche à caractériser l’ensemble des points M dont les coordonnées (x, y) satisfont
l’équation x2 + y 2 + 4x + 6y + 2 = 0. La méthode est de reconnaître dans les termes en x et les termes
en y le début de développement d’un carré : x2 + y 2 + 4x + 6y + 2 = (x + 2)2 − 4 + (y + 3)2 − 9 + 2.
Donc x2 + y 2 + 4x + 6y + 2 = 0 ssi√(x + 2)2 + (y + 3)2 = 11 : c’est l’équation du cercle de centre A, de
coordonnées (−2, −3), et de rayon 11.

Exercice Déterminer l’ensemble des points M de coordonnées (x, y) qui vérifient x2 + y 2 − 2x + 4y ≤ 30.

7.2 Géométrie dans l’espace


7.2.1 Coordonnées
Les premières notions de géométrie dans l’espace sont très semblables à celles dnas le plan. On
−→ −→ −−→
considère l’espace E muni d’un repère (O, OI, OJ, OK) : O est appelé l’origine du repère, et les vecteurs
−→ −→ −−→
OI, OJ et OK sont par définition non-coplanaires (ils ne sont pas contenus dans un même plan). Tout
point M de E peut alors être décrit par ses coordonnées (xM , yM , zM ) ∈ R3 dans ce repère. Cela signifie
que
−−→ −→ −→ −−→
OM = xM OI + yM OJ + zM OK
Soient deux points A et B de l’espace E, et leurs coordonnées respectives (xA , yA , zA ) et (xB , yB , zB ).
−−→
On peut considérer le vecteur d’origine A et d’extrémité B, noté AB.
−−→
Pour un tel vecteur AB, on définit ses coordonnées (xB − xA , yB − yA , zB − zA ) dans R3 . Un vec-
−−→ −−→
teur
 est complètement déterminé par ses coordonnées : cela siginifie que AB = CD si et seulement si
xB − xA = xD − xC

yB − yA = yD − yC ; deux vecteurs égaux peuvent avoir des origines et des extrémités différentes.


zB − zA = zD − zC


On appelle le vecteur nul le vecteur dont les coordonnées sont nulles : 0 = (0, 0, 0).
−→ −→ −−→ −→
On suppose désormais que le repère (O, OI, OJ, OK) est orthogonal, c’est-à-dire que les vecteurs OI,
−→ −−→ →

OJ et OK sont orthogonaux deux à deux. Pour deux vecteurs − →
u = (x, y, z) et u′ = (x′ , y ′ , z ′ ), on définit
leur produit scalaire :


h−

u , u′ i = xx′ + yy ′ + zz ′ .


→ −

Fait 7.8 Les vecteurs →

u et u′ sont orthogonaux ssi leur produit scalaire h→

u , u′ i est nul.

7.2.2 Plan dans l’espace


Contrairement à ce qui se passe dans le plan, un vecteur normal et une origine dans l’espace ne per-
mettent pas de définir une droite, mais un plan. Plus précisément, considérons un point A de coordonnées
−−→
(xA , yA , zA ) et un vecteur non nul −→
v = (a, b, c). Alors l’ensemble des points M tels que AM est orthogo-

− →

nal à v forme un plan P ; on l’appelle le plan d’origine A et de vecteur normal v . En écrivant le produit
−−→ →
scalaire hAM , − v i, et en notant (x, y, z) les coordonnées de M , on obtient une équation cartésienne de
P :
M ∈ P ⇔ ax + by + cz = axA + byA + czA
Tous les vecteurs non nuls colinéaires à − →v sont aussi des vecteurs normaux à P .

51
On peut également définir un plan dans l’espace à partir de trois points non alignés : si A, B, C sont
trois points non alignés, il existe un unique plan P qui contient A, B, C. Plus précisément, P est défini
−−→ −→
en choisissant A comme origine et les vecteurs AB et AC comme vecteurs générateurs :
−−→ −−→ −→
P = PA,−
−→ −→ := {M ∈ E; ∃λ ∈ R ∃µ ∈ R AM = λAB + µAC}
AB,AC

Si on permute les rôles joués par A, B et C, on obtient le même plan. Par exemple, en conservant la
notation ci-dessus, vérifions que PA,−
−→ −→ = P −
AB,AC
−→−
B,BA,BC
→ . On va utiliser les relations de Chasles qui nous

−−→ −−→ −→ −−→ −−→
donnent AB = −BA et AC = −BA + BC. Alors si M ∈ PA,− −→ −→ , il existe par définition des réels λ et
AB,AC
−−→ −−→ −→ −−→ −−→ −−→ −−→ −−→
µ tels que AM = λAB + µAC, et donc BM = BA + AM = (1 − λ − µ)BA + µBC, ce qui prouve que
M ∈ PB,− −→−−→ . On a donc montré que P − −→ −→ ⊂ P − −
→−−→ ; on montre l’inclusion réciproque de la
BA,BC A,AB,AC B,BA,BC
même manière et ainsi que PA,− −→ −→ = P −
AB,AC

→− −
B,BA,BC
→ . On emploie la même méthode si on choisit C comme
origine.

7.2.3 Droite dans l’espace


Pour définir une droite dans l’espace, il suffit de deux points distincts : pour tous points distincts A
et B, il existe une unique droite passant par A et B, notée (AB).
−−→
Pour tout point M de l’espace, le point M appartient à la droite (AB) ssi le vecteur AM est colinéaire
−−→ −−→
au vecteur AB. On dit dans ce cas que A est une origine de la droite et AB en est un vecteur directeur.
Plus généralement, si on se donne un point A de coordonnées (xA , yA , zA ) et un vecteur non nul − →
u =


(a, b, c), on peut définir la droite D d’origine A et de vecteur directeur u : c’est l’ensemble des points
−−→
M du plan tels que AM est colinéaire à − →u . Ainsi, en notant (x, 
y, z) les coordonnées de M , le point M

−−→ x − xA = λa

appartient à D ssi il existe λ ∈ R tel que AM = λu, c’est-à-dire y − yA = λb


z − zA = λc
.On obtient ainsi la description paramétrique de la droite D : c’est l’ensemble des points de coordonnées
x = xA + λa

y = yA + λb , où le paramètre λ parcourt R.


z = zA + λc
Cherchons maintenant des équations cartésiennes pour une telle droite D. Comme le vecteur − →u = (a, b, c)
est non-nul, au moins une des coordonnées a, b, c est non-nulle. Supposons par exemple que a 6= 0 (si on
avait a = 0, il faudrait adapter le raisonnement ci-dessous  en faisant jouer à b ou c le rôle de a). On sait
x − xA = λa

que le point M appartient à D ssi il existe λ ∈ R tel que y − yA = λb . Comme a 6= 0, la seule valeur


z − zA = λc
de λ possible pour que la première condition soit vérifiée est λ = x−x a . Pour que cette valeur de λ soit
A

bien ( une solution de tout le système, il faut aussi que les deux autres équations soient vérifiées, c’est-à-
y = yA + x−xa b
A
dire x−xA . En réécrivant ces équations, on trouve une condition nécessaire et suffisante
z = zA + a c
pour que M ∈ P : (
bx − ay = bxA − ayA
M ∈P ⇔
cx − az = cxA − azA
Ce sont des équations cartésiennes de D.
Notons que, d’après ce qu’on a vu précédemment, bx − ay = bxA − ayA est l’équation cartésienne d’un
plan dans l’espace, et de même pour cx − az = cxA − azA . La droite D est alors l’intersection de ces
deux plans.

7.2.4 Distance
−→ −→ −−→
On suppose désormais que le repère (O, OI, OJ, OK) est orthonormal (on dit aussi orthonormé),
−→ −→ −−→
c’est-à-dire que c’est un repère orthogonal tel que de plus les vecteurs OI, OJ et OK sont de longueur

52
−−→
1. En utilisant le théorème de Pythagore, on peut alors calculer la longueur de tout vecteur OM .
−−→ p
Proposition 7.9 Soit M un point de coordonnées (x, y, z). Alors la longueur du vecteur OM est x2 + y 2 + z 2 .

Preuve Considérons le point N de coordonnée (x, y, 0), alors le triangle OM N est rectangle en N (on le
−−→ −−→
vérifie en calculant le produit scalaire hON , N M i = x × 0 + y × 0 + 0 × z = 0). Le théorème de Pythagore
donne donc OM 2 = 2 2 2 2 2
p ON + M N , or M N = |z| et ON = x + y (c’est le même calcul que dans le
plan) donc OM = x + y + z .
2 2 2 

p
Corollaire 7.10 La distance entre deux points A et B est (xB − xA )2 + (yB − yA )2 + (zB − zA )2 .

Exemple 7.11 On cherche à caractériser l’ensemble des points M dont les coordonnées (x, y, z) satisfont
l’équation (x − 2)2 + (y + 1)2 + (z − 1)2 = 9. En posant A le point de coordonnées (2, −1, 1), cette équation
peu s’écrire AM 2 = 9. On a donc l’équation de la sphère de centre A et de rayon 3.

53

Vous aimerez peut-être aussi