Polynômes et Anneaux en Mathématiques MPSI
Polynômes et Anneaux en Mathématiques MPSI
POLYNÔMES ET RACINES
Dans ce chapitre, K est l’un des corps R ou C, sauf dans la dernière partie où une généralisation au cas des corps finis F p
est abordée.
Définition (Polynôme à une indéterminée à coefficients dans K) On appelle polynôme (à une indéterminée) à
coefficients dans K toute suite presque nulle d’éléments de K, i.e. toute suite (ak )k∈N d’éléments de K dont les éléments
sont nuls à partir d’un certain rang. Pour tout k ∈ N, le coefficient ak est appelé le coefficient de degré k du polynôme.
On note généralement X l’indéterminée X = (0, 1, 0, 0, . . .) et K[X ] l’ensemble des polynômes à coefficients dans K, mais
parfois on préférera les noter T et K[T ], etc.
Identification des coefficients : Deux polynômes sont égaux si et seulement si leurs coefficients sont égaux.
Avec cette définition, un polynôme est une suite (a0 , a1 , . . . , an , 0, 0, . . .) à coefficients dans K que nous noterons bientôt
an X n + . . . + a1 X + a0 . Gardez cet objectif en tête, il vous aidera à comprendre les prochaines définitions. Pour tout λ ∈ K,
notons au moins dès à présent λ le polynôme constant (λ, 0, 0, . . .). En particulier, le polynôme 0 est appelé le polynôme nul.
Le principe d’identification des coefficients est une trivialité maintenant que les polynômes sont des suites. Au lycée, on
vous a énoncé un principe plus délicat d’identification des coefficients propre aux fonctions polynomiales, plus délicat car la
connaissance d’une fonction polynomiale n’équivaut pas à la connaissance de son expression, i.e. de ses coefficients. Nous
prouverons ce résultat plus loin.
1
Christophe Bertault — Mathématiques en MPSI
Attention, le polynôme nul n’a pas de coefficient dominant. Quand on veut utiliser le coefficient dominant d’un polynôme
P dans un raisonnement, il faut supposer P non nul.
Il est facile à présent de définir une loi d’addition sur K[X ]. L’ensemble KN des suites à valeurs dans K est un groupe pour
la loi héritée de K définie par la relation (uk )k∈N +(vk )k∈N = (uk + vk )k∈N pour tous (uk )k∈N , (vk )k∈N ∈ KN . Montrons que K[X ]
en est un sous-groupe. Or déjà, 0 = (0)n∈N ∈ K[X ]. Pour la stabilité par différence, soient P = (ak )k∈N , Q = (bk )k∈N ∈ K[X ].
Ainsi, ak = bk = 0 à partir d’un certain rang N , donc ak − bk = 0 pour tout k ¾ N , donc P − Q ∈ K[X ].
X k
Pour tous P = (ak )k∈N , Q = (bk )k∈N ∈ K[X ], posons maintenant P × Q = ai bk−i = a0 bk + . . . + ak b0 k∈N . S’agit-il
i=0 k∈N
bien d’un polynôme ? Autrement dit, la famille P × Q est-elle bien presque nulle ? Eh bien oui, car si on note N un rang à
Xk X
N −1 Xk
partir duquel ak = bk = 0, alors pour tout k ¾ 2N : ai bk−i = ai bk−i + ai bk−i = 0.
|{z} |{z}
i=0 i=0 i=N
= 0 car =0
k−i > k−N ¾ N
Théorème (Anneau K[X ] et notation polynomiale) Le triplet K[X ], +, × est un anneau commutatif d’éléments
neutres additif le polynôme nul 0 et multiplicatif le polynôme constant 1.
X
+∞
Pour tout P = (ak )k∈N ∈ K[X ] : P = ak X k , écriture unique dans laquelle la somme est faussement infinie car P
k=0 X
+∞
est une suite presque nulle. En outre, pour tout λ ∈ K : λP = λak X k .
k=0
$ Attention ! X N’EST PAS UN NOMBRE ! Ôtez-vous une fois pour toutes cette idée de la tête.
Démonstration Fixons une fois pour toutes P = (ak )k∈N , Q = (bk )k∈N , R = (ck )k∈N ∈ K[X ].
Xk
j = k−i
X
k
• Commutativité de × : Pour tout k ∈ N : ai bk−i = b j ak− j , donc PQ = QP.
i=0 j=0
• Multiplication par un scalaire et élément neutre pour × : Soit λ ∈ K. Pour tout k ∈ N, le coefficient de
degré k de λ × P = (λ, 0, 0, . . .) × (ak )k∈N vaut λak + [Link]−1 + . . . + 0.a0 = λak , donc λP = (λak )k∈N . En
particulier, 1 × P = P × 1 = P.
• Associativité de × : Pour tout k ∈ N, le coefficient de degré k de (PQ) R vaut :
Xk X i X X
k X
k X
k X
k− j
l = i− j
a j bi− j ck−i = a j bi− j ck−i = aj bi− j ck−i = aj bl c(k− j)−l ,
i=0 j=0 0¶ j¶i¶k j=0 i= j j=0 l=0
donc est égal au coefficient de degré k de P (QR). Par conséquent, (PQ) R = P (QR).
• Distributivité de × sur + : Pour tout k ∈ N, le coefficient de degré k de P (Q + R) vaut :
Xk X
k X
k
ai (bk−i + ck−i ) = ai bk−i + ai ck−i ,
i=0 i=0 i=0
donc est égal au coefficient de degré k de (PQ) + (PR). Par conséquent, P (Q + R) = (PQ) + (PR).
• Notation polynomiale : Sachant que X = (0, 1, 0, 0, . . .), il n’est pas dur de montrer par récurrence que
X k = (0, . . . , 0, 1, 0, 0, . . .) pour tout k ∈ N, où le 1 apparaît au degré k. Ainsi, pour tout P = (ak )k∈N ∈ K[X ] :
X
+∞ X
+∞ X
+∞
P= (0, . . . , 0, ak , 0, 0, . . .) = (ak , 0, 0, . . .) × (0, . . . , 0, 1, 0, 0, . . .) = ak X k .
k=0 k=0 k=0
En dépit de la construction qui précède, abstenez-vous impérativement de penser que les polynômes sont des suites
presque nulles. Nous les avons construits ainsi, mais d’autres constructions sont possibles. Soyez juste convaincus que les
fonctions polynomiales sont une chose et les polynômes une autre.
Xn
a b a+b
Exemple Pour tous a, b, n ∈ N : = (formule de Vandermonde).
n 2 k n−k n
X n 2n
k=0
En particulier, = pour a = b = n.
k=0
k n
Nous avons déjà prouvé ces formules par double comptage au chapitre « Dénombrement ».
2
Christophe Bertault — Mathématiques en MPSI
a+b
X a
X b
X
a+b k a+b a b a i b
Démonstration X = (X + 1) = (X + 1) (X + 1) = X × X j.
k=0
k i=0
i j=0
j
Or que vaut le coefficient de degré n des deux côtés de cette identité ?
Xn
a+b a b
Il vaut à gauche et à droite par définition du produit de deux polynômes.
n i=0
i n−i
Démonstration Le résultat est évident si P ou Q est nul. Supposons-les non nuls et notons m le degré de P et
X
+∞ X
+∞ X
+∞
n celui de Q. Introduisons aussi leurs coefficients : P = ak X k , Q = bk X k et PQ = ck X k .
k=0 k=0 k=0
(i) ak + bk = 0 pour tout k > max m, n , donc deg(P + Q) ¶ max m, n = max deg(P), deg(Q) .
Xk X
m Xk
(ii) Pour tout k > m + n : ck = ai bk−i = ai bk−i + ai bk−i = 0, donc deg(PQ) ¶ m + n.
|{z} |{z}
i=0 i=0 i=m+1
=0 =0
=0 =0
X
m−1 z }| { X z}|{
m+n
Inversement : cm+n = ai bm+n−i + am bn + ai bm+n−i = am bn avec am 6= 0 et bn 6= 0, donc
i=0 i=m+1
cm+n 6= 0, donc deg(PQ) ¾ m + n.
Théorème (Intégrité de K[X ]) L’anneau K[X ] est intègre : ∀P, Q ∈ K[X ], PQ = 0 =⇒ P = 0 ou Q = 0 .
Démonstration Pour commencer, K[X ] est un anneau non nul. Ensuite, pour tous P, Q ∈ K[X ], si PQ = 0, alors
deg(P) + deg(Q) = deg(PQ) = −∞, donc deg(P) ou deg(Q) vaut −∞, donc P ou Q est nul.
Ce résultat serait nettement plus difficile à prouver si on travaillait avec des fonctions polynomiales et non avec des
polynômes. En effet, si P(x)Q(x) = 0 pour tout x ∈ R, alors en tout point l’une des fonctions P et Q s’annule, mais qui nous
dit que l’une des deux s’annule tout le temps ? Rien a priori.
Concrètement, dire que l’application P 7−→ P(x) est un morphisme d’anneaux, c’est dire qu’elle envoie le polynôme 1 sur
le nombre 1, et surtout que pour tous P, Q ∈ K[X ] : (P + Q)(x) = P(x) + Q(x) et (PQ)(x) = P(x) Q(x).
3
Christophe Bertault — Mathématiques en MPSI
Dans ce paragraphe, on apprend à composer les polynômes et à les dériver, mais les polynômes ne sont pas des fonctions !
X
+∞ X
+∞
Définition-théorème (Composition) On pose P ◦ Q = ak Q k pour tous P = ak X k ∈ K[X ] et Q ∈ K[X ].
k=0 k=0
(i) Degré : Si Q n’est pas constant, alors deg(P ◦ Q) = deg(P) × deg(Q).
Démonstration Pour (i), supposons Q non constant et posons m = deg(P). Par produit, deg Q k = k deg(Q)
pour tout k ∈ N, donc comme deg(Q) ¾ 1 et am 6= 0 :
Inégalité STRICTE !
deg am−1 Q m−1 + . . . + a1Q + a0 ¶ (m − 1) deg(Q) < m deg(Q) = deg am Q m .
¦ ©
donc : deg(P ◦ Q) = deg am Q m + . . . + a1Q + a0 = max deg amQ m , deg am−1Q m−1 + . . . + a1Q + a0 , et
enfin deg(P ◦ Q) = deg(P) × deg(Q).
X
+∞ X
+∞
Définition-théorème (Dérivation) On pose P ′ = kak X k−1 pour tout P = ak X k ∈ K[X ].
k=0 k=0
Attention, on convient ici que 0 . X −1 = 0 pour k = 0 — fausse apparition de X −1 , donc.
′
À partir de là, on définit les polynômes dérivés successifs de P en posant P (0) = P et P (n+1) = P (n) pour tout n ∈ N.
Soient P, Q ∈ K[X ], λ ∈ K et n ∈ N.
(i) Degré : Si n ¶ deg(P), alors deg P (n) = deg(P) − n, et si au contraire n > deg(P), alors P (n) = 0.
(ii) Opérations usuelles : (λP + Q)′ = λP ′ + Q′ , (PQ)′ = P ′ Q + PQ′ et (P ◦ Q)′ = Q′ × P ′ ◦ Q.
(iii) Lien avec la dérivation des fonctions : f
P′ = e
P′.
Le symbole ′ a deux sens très différents ici !
X P (k) (λ)
+∞
(iv) Formule de Taylor polynomiale : Pour tous P ∈ K[X ] et λ ∈ K : P = (X − λ)k .
k!
P (k) (0) k=0
En particulier, le coefficient de degré k de P vaut pour tout k ∈ N.
k!
Le seuil n = deg(P) de l’assertion (i) doit être bien compris. Sur l’exemple du polynôme P = X n , voilà ce que ça donne :
P = nX n−1 , P ′′ = n(n − 1) X n−2 , . . ., P (n) = n!, puis P (n+1) = 0.
′
La formule de Taylor montre qu’on connaît tout d’un polynôme quand on le connaît « profondément » en un point, i.e. si
on connaît la valeur de toutes ses dérivées en ce seul point.
X
+∞ X
+∞
Démonstration Introduisons les coefficients de P et Q : P= ak X k et Q= bk X k .
k=0 k=0
X
d
′ ′
(i) Posons d = deg(P). Si d ¶ 0, alors P = 0. Si au contraire d ¾ 1, alors P = kak X k−1 avec d ad 6= 0, donc
′
deg(P ) = d − 1. Pour les dérivées suivantes, récurrence ! k=0
X
k+1
(iii) Montrons que (PQ)′ = P ′ Q + PQ′ . Soit k ∈ N. Le coefficient de degré k de (PQ)′ vaut (k + 1) ai bk+1−i
X
k X
k i=0
et celui de P ′ Q + PQ′ vaut ( j + 1) a j+1 bk− j + ai (k − i + 1) bk−i+1 . Ces coefficients sont égaux car :
j=0 i=0
X
k X
k
i = j+1
X
k+1 X
k
( j + 1) a j+1 bk− j + ai (k − i + 1) bk−i+1 = iai bk+1−i + ai (k − i + 1) bk−i+1
j=0 i=0 i=1 i=0
X
k+1 X
k+1 X
k+1 X
k+1
= iai bk+1−i + ai (k − i + 1) bk−i+1 = iai bk+1−i + ai (k − i + 1) bk+1−i = (k + 1) ai bk+1−i .
i=0 i=0 i=0 i=0
′
Montrons que (P ◦Q)′ = Q′ × P ′ ◦Q. Par récurrence à partir de la relation précédente, Q k = kQ′ Q k−1 pour
X
+∞
′ X
+∞
tout k ∈ N, donc (P ◦ Q)′ = ak Q k = Q ′ kak Q k−1 = Q′ × P ′ ◦ Q.
k=0 k=0
4
Christophe Bertault — Mathématiques en MPSI
X
+∞ X
+∞
i!
(iv) Cas où λ = 0 : En notant P = ai X i , dérivons k fois pour tout k ∈ N : P (k) = ai X i−k ,
(i − k)!
i=0
P (k) (0) X P (k) (0) i=k
+∞
puis évaluons en 0 : (k)
P (0) = ak k!. Aussitôt, ak = donc P = X k.
|{z} k! k!
k=0
i=k
Cas général : Posons Q = P(X + λ). Pour tout k ∈ N : Q(k) = P (k) (X + λ), donc :
X Q(k) (0)
+∞ X P (k) (λ)
+∞
Q= Xk = X k, et on compose à droite par X − λ pour terminer.
k=0
k! k=0
k!
X
+∞ X
+∞
Définition-théorème (Conjugaison) On pose P = ak X k pour tout P = ak X k ∈ C[X ].
k=0 k=0
Définition-théorème (Relation de divisibilité) Soient A, B ∈ K[X ]. On dit que A divise B, ce qu’on note A | B, si
B = AP pour un certain P ∈ K[X ]. On dit aussi que A est un diviseur de B, que B est divisible par A ou que B est un
multiple de A.
• Relation d’ordre : La relation de divisibilité | est réflexive et transitive sur K[X ], mais pas antisymétrique car
pour tous A, B ∈ K[X ] :
A|B et B|A ⇐⇒ ∃ λ ∈ K∗ , A = λB. Le cas échéant, on dit que A et B sont associés.
Cela dit, la relation | est une relation d’ordre sur l’ensemble des polynômes unitaires ou nuls de K[X ].
• Combinaisons linéaires et produits : Soient A, B, C, D ∈ K[X ].
— Si D | A et D | B, alors D (AU + BV ) pour tous U, V ∈ K[X ].
— Si A | B et C | D, alors AC | BD, et en particulier, Ak B k pour tout k ∈ N.
1
Démonstration Pour le défaut d’antisymétrie, si A = λB pour un certain λ ∈ K∗ , alors B = A, donc A | B et
λ
B | A. Réciproquement, faisons l’hypothèse que A | B et B | A. Ainsi, A = BP et B = AQ pour certains P, Q ∈ K[X ],
donc B = B (PQ).
— Si B = 0, alors A = BP = 0, donc A = λB pour λ = 1.
— Si B 6= 0, alors PQ = 1 par intégrité de K[X ], donc deg(P) + deg(Q) = 0, donc deg(P) = deg(Q) = 0 car
deg(P) et deg(Q) appartiennent à N ⊔ −∞ . Ainsi, P est une constante non nulle λ et A = λB.
Nous pratiquons la division euclidienne des polynômes depuis la fin du chapitre « Techniques élémentaires de calcul
intégral », mais nous n’avions rien démontré à ce moment-là.
Théorème (Théorème de la division euclidienne) Soient A, B ∈ K[X ] avec B 6= 0. Il existe un et un seul couple
(Q, R) ∈ K[X ] × K[X ] pour lequel A = BQ + R et deg(R) < deg(B). On appelle A le dividende de la division euclidienne
de A par B, B son diviseur, Q son quotient et R son reste.
5
Christophe Bertault — Mathématiques en MPSI
Démonstration
• Existence : Êtes-vous d’accord que toute partie non vide N ∪ −∞ possède ¦un plus petit élément ? Tant ©
mieux. Notons b le degré de B et β son coefficient dominant. L’ensemble D = deg(A − BK) | K ∈ K[X ]
est une partie non vide de N∪ −∞ , donc possède un plus petit élément r. Notons Q ∈ K[X ] un polynôme
pour lequel deg(A − BQ) = r, puis posons R = A − BQ. Est-il vrai que deg(R) < deg(B) ?
ρ
Par l’absurde, supposons r ¾ b et notons ρ le coefficient dominant de R. Alors deg R − X r−b B < r car la
β
ρ r−b r ρ r−b
soustraction de X B tue le terme dominant ρX de R. Pourtant, deg R − X B = deg(A−BK) ∈ D
β β
ρ
pour K = Q + X r−b , donc la minimalité de r est contredite et r < b comme voulu.
β
• Unicité : Soient (Q 1 , R1 ) et (Q 2 , R2 ) deux couples de division euclidienne de A par B. Si Q 1 6= Q 2 , alors
deg(Q 1 − Q 2 ) ¾ 0, donc :
¦ ©
deg(B) ¶ deg(B) + deg(Q 1 − Q 2 ) ¶ deg B (Q 1 − Q 2 ) = deg(R1 − R2 ) ¶ max deg(R1 ), deg(R2 ) < deg(B)
— contradiction. Ainsi Q 1 = Q 2 , donc R1 = A − BQ 1 = A − BQ 2 = R2 .
Telle qu’elle est définie, la notion de divisibilité aurait pu dépendre du corps K, mais en fait non.
Théorème (Divisibilité dans C[X ] de polynômes réels) Soient A, B ∈ R[X ] — à coefficients réels, donc.
A divise B dans C[X ] si et seulement si A divise B dans R[X ].
Démonstration On peut effectuer a priori deux divisions euclidiennes de B par A, une dans R[X ] et une dans
C[X ]. Cela dit, la division euclidienne dans R[X ] est aussi une division euclidienne dans C[X ], donc par unicité
de la division euclidienne dans C[X ], les deux divisions euclidiennes coïncident et le résultat en découle.
À partir de ce théorème dans K[X ] identique à celui que nous avons démontré dans Z, deux chemins naturels d’étude de
K[X ] se présentent à nous. Nous pourrions suivre la piste arithmétique des PGCD, relations de Bézout, lemme d’Euclide et
prouver que les polynômes possèdent une et une seule factorisation irréductible, cet analogue polynomial de la factorisation
première dans Z. Le long de ce chemin, les preuves sont essentiellement les mêmes que dans Z, mais nous verrons cela plus
tard au chapitre « Arithmétique des polynômes et fractions rationnelles ». L’autre chemin que nous suivons à présent, c’est
celui des racines, très spécifique aux polynômes et qui nous permet de contourner l’arithmétique encore quelques temps.
3 RACINES
Théorème (Division euclidienne par X − λ) Soient λ ∈ K et P ∈ K[X ]. Le reste de la division euclidienne de P par
X − λ est P(λ).
Définition (Racine) Soient P ∈ K[X ] et λ ∈ K. On dit que λ est une racine de P (dans K) si l’une des deux assertions
équivalentes suivantes est vraie : P(λ) = 0 ou bien : P est divisible par X − λ.
Via la notion de racine, on ramène souvent les problèmes de divisibilité à des problèmes d’évaluation — et vice versa.
6
Christophe Bertault — Mathématiques en MPSI
Exemple Pour tout n ∈ N, le reste de la division euclidienne de X n par X 2 − 3X + 2 vaut (2n − 1) X − (2n − 2).
Démonstration Soit n ∈ N. La division euclidienne de X n par X 2 − 3X + 2 s’écrit X n = (X − 1)(X − 2)Q + aX + b
pour certains Q ∈ R[X ] et a, b ∈ R. Après évaluation en 1 et 2, 1 = a + b et 2n = 2a + b, donc a = 2n − 1 et
b = 2 − 2n .
Démonstration
¦ ©
(i) Pour montrer que l’ensemble M = k ∈ N | (X − λ)k divise P possède un plus grand élément, montrons
que c’est une partie non vide majorée de N. Or déjà, M contient 0. Montrons maintenant que deg(P) majore
M . Pour tout k ∈ M , P = (X − λ)k Q pour
un certain Q ∈ K[X ], or Q 6= 0 car P 6= 0, donc deg(Q) ¾ 0, et
enfin k ¶ deg(Q) + k = deg (X − λ)k Q = deg(P).
(ii) Montrons seulement l’équivalence, le résultat sur la dérivation en découle directement. L’air de rien, la
formule de Taylor nous fournit facilement la division euclidienne de P par (X − λ)m :
Taylor
X P (i) (λ)
+∞ X P (i) (λ)
+∞ X P (i) (λ)
m−1
P = (X − λ)i = (X − λ)m (X − λ)i−m + (X − λ)i .
i=0
i! i=m
i! i=0
i!
| {z }
Degré strictement inférieur à m
On en tire les équivalences suivantes :
X P (i) (λ)
m−1
λ est de multiplicité au moins m dans P ⇐⇒ (X − λ)m divise P ⇐⇒ (X − λ)i = 0
i!
X P (i) (λ)
m−1 i=0
⇐⇒ Xi = 0 après composition à droite par X + λ
i=0
i!
⇐⇒ ∀i ∈ ¹0, m − 1º, P (i) (λ) = 0.
A fortiori : λ est de multiplicité au moins m + 1 dans P ⇐⇒ ∀i ∈ ¹0, mº, P (i) (λ) = 0, donc λ est
de multiplicité exactement m si et seulement si P (i) (λ) = 0 pour tout i ∈ ¹0, m − 1º mais P (m) (λ) 6= 0.
Soient A, B ∈ K[X ] avec B 6= 0. On l’a vu, le reste de la division euclidienne de A par B peut être calculé à partir des
racines de B. Pour B = (X − 2)3 (X + 3), cette division s’écrit A = (X − 2)3 (X + 3) Q + aX 3 + bX 2 + cX + d pour certains
Q ∈ R[X ] et a, b, c, d ∈ R. On n’obtient que deux équations linéaires en évaluant en 2 et −3 alors qu’il nous en faut quatre
pour calculer a, b, c et d, mais la multiplicité de 2 dans B cache deux équations supplémentaires. Pour les faire surgir, on
dérive ! Le réel 2 est de multiplicité au moins 3 dans BQ = (X − 2)3 (X + 3) Q, donc au moins 2 dans (BQ)′ et au moins 1
dans (BQ)′′ . Deux nouvelles équations en découlent : A′ (2) = 12a + 4b + c et A′′ (2) = 12a + 2b, et on conclut en
résolvant un système linéaire 4 × 4.
Théorème (Racines complexes d’un polynôme réel) Soient P ∈ R[X ] — à coefficients réels, donc — et λ ∈ C. Alors
λ et λ ont la même multiplicité dans P.
7
Christophe Bertault — Mathématiques en MPSI
Démonstration L’application T 7−→ T est un automorphisme d’anneau de C[X ], donc pour tout k ∈ N :
k
(X − λ) divise P ⇐⇒ ∃ Q ∈ C[X ], P = (X − λ)k Q ⇐⇒ ∃ Q ∈ C[X ], P = (X − λ)k Q
k k
⇐⇒ ∃ Q ∈ C[X ], P = X −λ Q ⇐⇒ X − λ divise P,
donc en effet, λ et λ ont la même multiplicité dans P.
On dit souvent qu’on factorise par les racines, mais en réalité, ce ne sont pas les racines λ qu’on met en facteur, ce sont
les polynômes X − λ.
Théorème (Factorisation par les racines) Soient P ∈ K[X ] non nul et λ1 , . . . , λ r des racines distinctes de P de
multiplicités respectives m1 , . . . , m r . Alors (X − λ1 )m1 . . . (X − λ r )mr divise P. En particulier, m1 + . . . + m r ¶ deg(P).
Démonstration Montrons par récurrence que pour tout k ∈ ¹1, rº, (X − λ1 )m1 . . . (X − λk )mk divise P.
Initialisation : λ1 est racine de P de multiplicité m1 , donc (X − λ1 )m1 divise P.
Hérédité : Soit k ∈ ¹1, r − 1º. Faisons l’hypothèse que (X − λ1 )m1 . . . (X − λk )mk divise P.
— Dans ces conditions, P = (X − λ1 )m1 . . . (X − λk )mk A pour un certain A ∈ K[X ].
— Ensuite, si on note α la multiplicité de λk+1 dans A, A = (X − λk+1 )α B pour un certain B ∈ K[X ] avec
B(λk+1 ) 6= 0. Et comme (X − λk+1 )α divise A, il divise aussi P, donc α ¶ mk+1 .
— Enfin, P = (X − λk+1 )mk+1 C pour un certain C ∈ K[X ] avec C(λk+1 ) 6= 0.
Il découle de ces trois points que : (X − λ1 )m1 . . . (X − λk )mk (X − λk+1 )α B = (X − λk+1 )mk+1 C. Divisons par
(X − λk+1 )α grâce à l’intégrité de K[X ] : (X − λ1 )m1 . . . (X − λk )mk B = (X − λk+1 )mk+1 −α C. Or le polynôme de
gauche n’admet pas λk+1 pour racine, donc celui de droite non plus, donc α = mk+1 . Conclusion : (X − λk+1 )mk+1
divise A, donc (X − λ1 )m1 . . . (X − λk+1 )mk+1 divise P.
Exemple À quelle condition nécessaire et suffisante sur n ∈ N le polynôme X 2 + 1 divise-t-il X n + 1 ? Réponse : n ≡ 2 [4].
2 n n
Démonstration X + 1 divise X + 1 ⇐⇒ i et − i sont racines de X + 1
⇐⇒ i est racine de X n + 1 car X n + 1 est à coefficients réels ⇐⇒ in + 1 = 0
inπ nπ
⇐⇒ e 2 = eiπ ⇐⇒ ≡ π [2π] ⇐⇒ n ≡ 2 [4].
2
Dans cette chaîne d’équivalences, le théorème de factorisation par les racines justifie l’implication :
i et −i sont racines de X n + 1 =⇒ X 2 + 1 divise X n + 1.
Exemple Le polynôme (X − 1)4 X 2 (X + 2) possède en tout trois racines distinctes, à savoir 1 de multiplicité 4, 0 qui est
double et −2 qui est simple. On dit en revanche qu’il possède 7 = 4 + 2 + 1 racines comptées avec multiplicité.
Théorème (Rigidité de K[X ]) Un polynôme NON NUL P ∈ K[X ] possède au plus deg(P) racines comptées avec
multiplicité. En particulier, seul le polynôme nul possède une infinité de racines.
$ Attention ! En dépit des apparences, ce théorème est l’un des plus importants du chapitre !
Un polynôme de degré n ne possède pas forcément n racines comptées avec multiplicité. Nous verrons que c’est le cas si
K = C, mais pas si K = R. Par exemple, le polynôme réel X 2 + 1 est de degré 2 mais n’a pas de racine réelle.
Exemple Soit P ∈ C[X ]. On suppose que P(n) = n3 − n2 + 1 pour tout n ∈ N. Alors P = X 3 − X 2 + 1, donc après coup,
P(z) = z 3 − z 2 + 1 pour tout z ∈ C !
Démonstration On connaît les valeurs et même une expression polynomiale de P sur N, mais un polynôme
n’est pas une fonction. Les coefficients de l’expression de P sur N sont-ils les coefficients de P tout court ? La
réponse est oui par rigidité. Par hypothèse, le polynôme P − X 3 + X 2 − 1 admet tout entier naturel pour racine,
il possède donc une infinité de racines, donc il est nul par rigidité. En d’autres termes, P = X 3 − X 2 + 1.
8
Christophe Bertault — Mathématiques en MPSI
On le voit bien sur cet exemple, la rigidité de K[X ] est un principe de « dés-évaluation » — le terme n’existe pas,
je l’invente. Évaluer, c’est passer d’une égalité polynomiale à une égalité de nombres. Dés-évaluer, c’est faire le contraire
et remonter d’une collection d’égalités de nombres à une égalité polynomiale. Concrètement, quand on connaît certaines
valeurs d’un polynôme P, il est souvent fructueux de les interpréter en termes de racines d’un autre polynôme Q. Si Q a trop
de racines, il est nul par rigidité et on en tire des informations sur P.
p3
Exemple La fonction x 7−→ x 2 + 1 n’est pas polynomiale sur R.
p3
Démonstration Supposons par l’absurde qu’il existe un polynôme P ∈ R[X ] pour lequel P(x) = x 2 + 1 pour
3 2
tout x ∈ R. Le polynôme P − X − 1 possède alors une infinité de racines, en l’occurrence tous les réels, il est
2
donc nul par rigidité, et ainsi P 3 = X 2 + 1. En particulier, 3 deg(P) = 2 donc deg(P) = — contradiction.
3
1
Exemple Soit P ∈ R[X ]. On suppose que P est de degré n entier et que P(k) = pour tout k ∈ ¹1, n + 1º.
k
Dans ces conditions : P(−1) = n + 1.
Démonstration
• Analyse des hypothèses : Le polynôme X P(X )−1 admet 1, 2, . . . , n+1 pour racines, soit déjà n+1 racines
Y
n+1
distinctes. Cela dit, il est justement de degré n + 1, donc X P(X ) − 1 = λ (X − k) pour un certain λ ∈ R∗ .
Y
n+1
(−1)n k=1
(−1)n Y
n+1
Évaluons en 0 : −1 = λ (−k), i.e. λ = . Conclusion : X P(X ) = 1 + (X − k).
k=1
(n + 1)! (n + 1)! k=1
• Calcul de P(−1) : Évaluons ce résultat en −1 :
(−1)n Y
n+1
(−1)n
−P(−1) = 1+ −(k+1) = 1+ ×(−1)n+1 (n+2)! = 1−(n+2), donc P(−1) = n+1.
(n + 1)! k=1 (n + 1)!
Théorème (Identification polynôme/fonction polynomiale) Le morphisme d’anneaux P 7−→ e P est injectif de K[X ]
dans KK . En d’autres termes, pour tous P, Q ∈ K[X ], si les fonctions polynomiales e e sont égales, les polynômes P
P et Q
et Q eux-mêmes le sont, i.e. ont les mêmes coefficients.
Démonstration Montrons que Ker f = 0 . Soit P ∈ Ker f . La fonction f (P) = e P est identiquement nulle sur
K, donc P possède une infinité de racines car ici K ∈ R, C , donc P = 0 par rigidité.
Définition (Polynôme scindé) Soit P ∈ K[X ]. On dit que P est scindé (sur K) s’il n’est pas constant et possède
exactement deg(P) racines (dans K) comptées avec multiplicité.
Il est équivalent d’exiger que P puisse être écrit sous la forme P = a(X −λ1 )m1 . . . (X −λ r )mr avec a le coefficient dominant
de P, λ1 , . . . , λ r ses racines distinctes dans K et m1 , . . . , m r leurs multiplicités respectives.
$aucune
Attention ! La précision « scindé
2
K » n’est pas superflue car un polynôme peut avoir des racines complexes mais
SUR
réelle. Par exemple, X + 1 = (X + i)(X − i) est scindé sur C, mais pas sur R.
Y Y
n−1
2ikπ
n ∗ n
Exemple Le polynôme X − 1 est scindé sur C pour tout n ∈ N : X −1= (X − ω) = X −e n .
ω∈Un k=0
Démonstration X n − 1 n’est pas constant et admet les n éléments de Un pour racines distinctes. Cela dit, X n − 1
possède au plus n racines comptées avec multiplicité pour une raison de degré, donc forcément, il en possède
exactement n, donc est scindé sur C.
iπ iπ
Exemple Le polynôme X 3 + 27 est scindé sur C et sa forme scindée est X 3 + 27 = (X − 3) X − 3 e 3 X − 3 e− 3 .
iπ 3
Démonstration Pour tout r ∈ C : r 3 + 27 = 0 ⇐⇒ r 3 = −27 = 3 e 3
iπ 2ikπ
⇐⇒ ∃ k ∈ ¹0, 2º, r = 3e 3 + 3 .
iπ iπ
Les racines complexes de X 3 + 27 sont ainsi 3 e 3 pour k = 0, −3 pour k = 1 et 3 e− 3 pour k = 2. Ces trois
racines sont distinctes et X 3 + 27 est de degré 3, donc scindé sur C à racines simples, et par ailleurs unitaire.
9
Christophe Bertault — Mathématiques en MPSI
Mais finalement, tout polynôme possède-t-il une racine ? Question essentielle à laquelle nous n’avons pas encore répondu.
La réponse affirmative suivante est un théorème majeur de l’algèbre.
Théorème (Théorème de d’Alembert-Gauss) Tout polynôme non constant de C[X ] possède une racine COMPLEXE.
A fortiori, tout polynôme non constant de C[X ] est scindé sur C.
$exemple
Attention ! Le théorème est faux sur R — un polynôme non constant de R[X ] peut ne pas avoir de racine
le polynôme X + 1.2
RÉELLE , par
Les multiplicités sont aux polynômes ce que les valuations p-adiques sont aux entiers. Le critère de divisibilité qui suit se
démontre ainsi dans C[X ] comme son analogue dans Z.
Théorème (Divisibilité dans C[X ] et racines) Soient A, B ∈ C[X ] non nuls. Alors A divise B si et seulement si pour
tout λ ∈ C, la multiplicité de λ dans A est inférieure à sa multiplicité dans B.
Ce théorème ramène toute question de divisibilité à une comparaison de multiplicités, mais une telle réduction n’est
possible que dans C[X ] car grâce au théorème de d’Alembert-Gauss, on connaît tout d’un polynôme complexe quand on
connaît son coefficient dominant, ses racines et leurs multiplicités. Ici, les coefficients dominants ne servent à rien car la
relation de divisibilité n’y est pas sensible.
On travaille dans ce paragraphe avec des polynômes non constants de C[X ], donc avec des polynômes scindés sur C
d’après le théorème de d’Alembert-Gauss.
• Polynômes de degré 2 : Soit P = a2 X 2 + a1 X + a0 ∈ C[X ] de racines λ1 et λ2 comptées avec multiplicité. Alors :
a1
P = a2 (X − λ1 )(X − λ2 ) = a2 X 2 − a2 (λ1 + λ2 ) X + a2 λ1 λ2 , donc après identification : λ1 + λ2 = − et
a0 a 2
λ1 λ2 = .
a2
• Polynômes de degré 3 : Soit P = a3 X 3 + a2 X 2 + a1 X + a0 ∈ C[X ] de racines λ1 , λ2 , λ3 comptées avec
multiplicité.
Alors : P = a3 (X − λ1 )(X − λ2 )(X − λ3 ) = a3 X 3 − a3 λ1 + λ2 + λ3 X 2 + a3 λ1 λ2 + λ1 λ3 + λ2 λ3 X − a3 λ1 λ2 λ3 ,
a2 a0 a1
donc après identification : λ1 + λ2 + λ3 = − , λ1 λ2 λ3 = − et λ1 λ2 + λ1 λ3 + λ2 λ3 = .
a3 a3 a3
Le résultat qui suit généralise les calculs précédents par « simple » développement du produit (X − λ1 ) . . . (X − λn ).
La relation obtenue n’exprime pas les racines λ1 , . . . , λn de P en fonction de ses coefficients a0 , . . . , an , mais par identifica-
an−k
tion, nous pouvons en tirer σk en fonction de a0 , . . . , an pour tout k ∈ ¹1, nº : σk = (−1)k . Vues comme fonctions de
an
λ1 , . . . , λn , les expressions σ1 , . . . , σn sont appelées les fonctions symétriques élémentaires de λ1 , . . . , λn — symétriques parce
qu’elles ne dépendent pas de l’ordre dans lequel on a rangé λ1 , . . . , λn . Deux d’entre elles sont particulièrement naturelles :
Xn Yn
σ1 = λk (somme des racines) et σn = λk (produit des racines).
k=1 k=1
10
Christophe Bertault — Mathématiques en MPSI
Mais pour que tout soit bien clair, détaillons σ1 , σ2 , σ3 et σ4 dans le cas où n = 4 : σ1 = λ1 + λ2 + λ3 + λ4 ,
σ2 = λ1 λ2 + λ1 λ3 + λ1 λ4 + λ2 λ3 + λ2 λ4 + λ3 λ4 , σ3 = λ1 λ2 λ3 + λ1 λ2 λ4 + λ1 λ3 λ4 + λ2 λ3 λ4 et σ4 = λ1 λ2 λ3 λ4 .
X
n−1
2ikπ X Y
n−1
2ikπ Y
Exemple Pour tout n ¾ 2 : e n = ω=0 et e n = ω = (−1)n+1 .
k=0 ω∈Un k=0 ω∈Un
Démonstration Nous avons déjà calculé ces deux
X quantités à la main,
Y mais notre but est différent ici. Dans
n
le contexte du polynôme scindé X − 1 : σ1 = ω et σn = ω et les relations coefficients-racines
ω∈Un ω∈Un
s’écrivent : X n − 1 = X n − σ1 X n−1 + . . . + (−1)n σn , donc σ1 = 0 et σn = (−1)n+1 .
Exemple Le polynôme non constant X 3 − 3X + 4 est scindé sur C d’après le théorème de d’Alembert-Gauss — mais pas
forcément sur R — et nous pouvons noter x, y et z ses trois racines complexes comptées avec multiplicité. L’unique polynôme
unitaire de degré 3 dont les racines sont x y, xz et yz est alors le polynôme X 3 + 3X 2 − 16.
Vous verrez ci-dessous qu’on arrive au résultat sans jamais avoir eu la moindre idée de ce que valent x, y et z.
Démonstration Il s’agit de calculer explicitement les coefficients du polynôme (X − x y)(X − xz)(X − yz).
Posons pour cela σ1 = x + y + z, σ2 = x y + yz + z x et σ3 = x yz. Les relations coefficients-racines du polynôme
X 3 − 2X + 5 s’écrivent : σ1 = 0, σ2 = −3 et σ3 = −4, donc :
(X − x y)(X − xz)(X − yz) = X 3 − (x y + xz + yz) X 2 + x 2 yz + x y 2 z + x yz 2 X − x 2 y 2 z 2
= X 3 − σ2 X 2 + σ1 σ3 X − σ32 = X 3 + 3X 2 − 16.
Donnons-nous un polynôme non constant P ∈ C[X ] de degré n. Que suffit-il de connaître pour connaître P entièrement ?
On peut répondre de trois manières à cette question.
— Par définition, P est entièrement déterminé par ses coefficients : P = a n X n + . . . + a1 X + a0 .
— D’après le théorème de d’Alembert-Gauss, P est entièrement déterminé par son coefficient dominant et de ses racines
complexes comptées avec multiplicité : P = an (X − λ1 ) . . . (X − λn ).
— D’après la théorie des polynômes d’interpolation de Lagrange du prochain paragraphe, P est entièrement déterminé
par la donnée de n + 1 valeurs P(x 1 ), . . . , P(x n+1 ).
Dans les trois cas, P est entièrement déterminé par une collection de n + 1 nombres — soit n + 1 coefficients, soit le
coefficient dominant et les n racines complexes comptées avec multiplicité, soit n + 1 valeurs. À mes yeux, cette trinité de
points de vue est très importante, car manipuler des polynômes, c’est jongler avec les points de vue.
Si on creuse un peu, pourtant, il est très curieux que les deux premiers points de vue soient équivalents. Pour la clarté du
propos, supposons P unitaire, i.e. que an = 1. Connaître P revient alors connaître au choix soit ses coefficients a0 , . . . , an−1 ,
soit ses racines λ1 , . . . , λn . La bizarrerie de l’affaire, c’est qu’on modifie P = X n + an−1 X n−1 + . . . + a0 = (X − λ1 ) . . . (X − λn )
quand on modifie l’ordre des coefficients mais pas quand on modifie l’ordre des racines, indiscernables par commutativité
de K[X ]. Il y a ainsi autant d’information dans la collection ordonnée des coefficients que dans la collection non ordonnée
des racines alors qu’on manipule n nombres dans les deux cas.
Le point intéressant, c’est que a0 , . . . , an−1 et λ1 , . . . , λn ont beau déterminer entièrement P, on ne connaît pas P de la
même manière selon qu’on connaît les uns ou les autres. Quand on connaît λ1 , . . . , λn , on n’a qu’à développer le produit
P = (X − λ1 ) . . . (X − λn ) pour calculer a0 , . . . , an−1 . Le résultat, ce sont les relations coefficients-racines, mais à défaut
d’exprimer chaque racine individuellement en fonction des coefficients, ces relations donnent à toutes les racines le même
rôle. En sens inverse, on ne sait pas faire, on ne sait pas calculer les racines à partir des coefficients et cette affirmation
est fortement liée à l’indiscernabilité des racines. On aurait bien aimé pouvoir exprimer les racines à partir des coefficients
p
à l’aide des symboles +, ×, ÷ et k · comme on sait le faire avec les polynômes de degré 2. Des formules sont disponibles
jusqu’au degré n = 4, mais à partir de n = 5, un théorème profond énonce qu’aucune formule ne saurait convenir.
11
Christophe Bertault — Mathématiques en MPSI
Étant donnés des réels x 1 , . . . , x n pour lesquels x 1 < . . . < x n et des réels y1 , . . . , yn quelconques, le problème de
l’interpolation consiste à construire des fonctions f : [x 1 , x n ] −→ R pour lesquelles f (x i ) = yi pour tout i ∈ ¹1, nº. Il
existe bien sûr beaucoup de fonctions de ce genre, on peut par exemple en construire une en reliant linéairement les points
de coordonnées (x 1 , y1 ), . . . , (x n , yn ). La méthode d’interpolation de Lagrange de ce paragraphe propose une autre approche.
Définition (Polynômes de Lagrange d’une famille de points distincts) Soient x 1 , . . . , x n ∈ K distincts. Pour tout
Y X−x
k
i ∈ ¹1, nº, on pose L i = . Les polynômes L1 , . . . , L n sont appelés les polynômes de Lagrange de x 1 , . . . , x n .
x
1¶k¶n i
− x k
k6=i
Propriété fondamentale : Pour tous i, j ∈ ¹1, nº : L i (x j ) = δi j .
En particulier, L i admet x 1 , . . . , x i−1 , x i+1 , . . . , x n pour racines.
On rappelle que Kn−1 [X ] est l’ensemble des polynômes de degré AU PLUS n − 1 de K[X ].
xπ
Exemple Notons f la fonction x 7−→ sin sur [0, 4], pour laquelle : f (0) = f (2) = f (4) = 0, f (1) = 1 et
2
f (3) = −1. Notons ensuite L0 , . . . , L4 les polynômes de Lagrange de 0, . . . , 4. Le polynôme d’interpolation de Lagrange de
f aux points 0, . . . , 4 vaut alors f (0) L0 + . . . + f (4) L4 = L1 − L3 . Or :
1 1
L1 = − X (X − 2)(X − 3)(X − 4) et L3 = − X (X − 1)(X − 2)(X − 4),
6 6
1 1 1
donc L1 − L3 = − X (X − 2)(X − 3)(X − 4) + X (X − 1)(X − 2)(X − 4) = X (X − 2)(X − 4).
6 6 3
b b b b b
b b b b b b b b b b b b b b b b b b b b
xπ
y = sin y = L1 (x) − L3 (x)
b b
2 b b b b b b
b b
Théorème (Détermination d’un polynôme par ses valeurs) Soient x 1 , . . . , x n ∈ K distincts. On note L1 , . . . , L n leurs
polynômes de Lagrange.
X
n Xn
Pour tout P ∈ Kn−1 [X ] : P = P(x i ) L i , et aucun autre polynôme de la forme yi L i ne coïncide avec P.
i=1 i=1
Démonstration Pour tout P ∈ Kn−1 [X ], P envoie x i sur P(x i ) pour tout i ∈ ¹1, nº, donc d’après le théorème
précédent, P = P(x 1 ) L1 + . . . + P(x n ) L n .
12
Christophe Bertault — Mathématiques en MPSI
Définition-théorème (Polynômes annulateurs d’une matrice carrée) Soit A ∈ Mn (K). On appelle polynôme annu-
lateur de A tout polynôme P ∈ K[X ] pour lequel P(A) = 0.
On dit aussi que A annule P, mais jamais que A est « racine de P ». Les racines sont définitivement des éléments de K.
1 1 1
Exemple Le polynôme X 3 − 2X 2 − 1 annule A = 1 1 0 car A3 − 2A2 − I3 = 0 après calcul.
0 1 0
Exemple Soit A ∈ M2 (C). Il n’est pas dur de vérifier coefficient par coefficient
que le polynôme X 2 −tr(A) X +det(A) annule
1 3
A, i.e. que A2 = tr(A) A − det(A) I2 . Par exemple, X 2 − 6X − 1 annule 2 5
.
Les polynômes annulateurs d’une matrice carrée servent aussi à calculer ses puissances. Deux mots d’ordre en la matière,
division euclidienne et racines !
1 1 1 2k+1 + (−1)k 2k − (−1)k 2k − (−1)k
∗ k 1
Exemple On pose A = 1 0 0 . Pour tout k ∈ N : A = 2k − (−1)k 2k−1 + (−1)k 2k−1 + (−1)k .
1 0 0 3 2k − (−1)k 2k−1 + (−1)k 2k−1 + (−1)k
3 1 1 5 3 3
2 3
Démonstration A = 1 1 1 et A = 3 1 1 = A2 + 2A,
1 1 1 3 1 1
donc le polynôme P = X 3 − X 2 − 2X = (X + 1)X (X − 2) annule A.
À présent, soit k ∈ N∗ . La division euclidienne de X k par P s’écrit X k = PQ + aX 2 + bX + c pour certains Q ∈ R[X ]
et a, b, c ∈ R. Évaluons en les racines de P : (−1)k = a − b + c, 0 = c et 2k = 4a + 2b + c. Après calcul :
2k−1 + (−1)k 2k−1 − 2(−1)k
a= , b= et c = 0, donc :
3 3
k 2 2k−1 + (−1)k 3 1 1 2k−1 − 2(−1)k 1 1 1
A = P(A) Q(A) + aA + bA + cI3 = 1 1 1 + 1 0 0 .
|{z} 3 1 1 1 3 1 0 0
=0
13
Christophe Bertault — Mathématiques en MPSI
2 3
Exemple Dans F3 [X ] : X + 1 = X2 + 2X + 1 = X2 − X + 1 et X +1 = X 3 + 3 X 2 + 3 X + 1 = X 3 + 1.
$Il n’est
Attention ! La dérivation pose problème dans F [X ]. Par exemple, X = p X
′
p
p ′ p−1 p
= 0 alors que X n’est pas constant.
donc pas vrai que deg(P ) = deg(P) − 1 pour tout P ∈ F [X ] non constant. La formule de Taylor tombe également, et
p
avec elle la possibilité de calculer les multiplicités à partir des polynômes dérivés. En effet, p divise k! pour tout k ¾ p, donc
k! = 0 et on ne peut pas diviser par 0.
Y
Exemple Xp −X = (X − x). A fortiori, le polynôme X p − X + 1 n’a pas de racine dans F p .
x∈F p
Démonstration De degré p, X p − X possède au plus p racines comptées avec multiplicité. Cela dit, tout élément
de F p en est racine d’après le petit théorème de Fermat, donc X p − X est scindé sur F p et le résultat proposé est
sa forme scindée.
Nous l’avons vu, les fonctions de R dans R ne sont pas toutes polynomiales, mais au moins, tout polynôme peut être
identifié à la fonction polynomiale qui lui est associée. Sur F p , c’est l’inverse ! Toute fonction est polynomiale, mais le théorème
d’identification tombe. Par exemple, les polynômes X p et X sont distincts, mais x p = x pour tout x ∈ F p d’après le petit
théorème de Fermat.
F
Théorème (Toute fonction est polynomiale) Le morphisme d’anneaux P 7−→ e
P est surjectif de F p [X ] sur F p p . En
d’autres termes, toute fonction de F p dans F p est polynomiale.
14