0% ont trouvé ce document utile (0 vote)
67 vues104 pages

Espaces Vectoriels Normés : Normes et Propriétés

Ce document présente une analyse des espaces vectoriels normés, en définissant les normes, les distances, et les propriétés associées. Il inclut des exemples concrets de normes sur différents espaces, ainsi que des propositions et des exercices pour illustrer les concepts. Les notions de produit scalaire et d'équivalence des normes sont également abordées.

Transféré par

Dark Prosto
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
67 vues104 pages

Espaces Vectoriels Normés : Normes et Propriétés

Ce document présente une analyse des espaces vectoriels normés, en définissant les normes, les distances, et les propriétés associées. Il inclut des exemples concrets de normes sur différents espaces, ainsi que des propositions et des exercices pour illustrer les concepts. Les notions de produit scalaire et d'équivalence des normes sont également abordées.

Transféré par

Dark Prosto
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

ANALYSE 4

Emmanuel Schenck 1

Université Paris Nord, L2, semestre 4

1. [email protected]
www.math.univ-paris13.fr/∼schenck/L2Analyse4.html
2

Remarques générales :
1. Les définitions, théorèmes et propositions du cours doivent être sus par
cœur.
2. Vous devez savoir refaire sans indications les exemples et exercices du cours.
Certains vous seront redemandés en contrôle continu.
3. Des questions, des erreurs, des commentaires ? Écrivez-moi un e-mail.
Chapitre 1

Espaces vectoriels normés

1.1 Normes et distances


Soit E un ensemble. On aimerait définir sur E une distance entre ses points, ce
qui permettra de faire de la géométrie sur E. On attend d’une distance qu’elle
respecte un certain nombre de propriétés intuitives, comme le fait qu’une distance
soit positive, et cette quantité mesure la longueur du « plus court chemin » entre
deux points de E.
Dans ce chapitre, nous allons considérer des distances sur un type particulier
d’espace E : les espaces vectoriels sur un corps K. Dans ce cours, sans précision
supplémentaire, K fera référence au corps R ou C.
Vous connaissez déjà des distances sur Rn pour n = 1, 2, 3 :
— pour x, y ∈ R, on peut poser d(x, y) = |x − y|
— ppour a = (x, y) ∈ R2 et b = (x′ , y ′ ) ∈ R2 , on peut poser d(a, b) =
(x − x′ )2 + (y − y ′ )2
— Pour z, z ′ ∈ C, on peut poser
p
d(z, z ′ ) = |z − z ′ | = (Re(z − z ′ ))2 + (Im(z − z ′ ))2 .

Définition 1.1. Soit E un espace vectoriel. Une norme sur E est une application
N : E → R qui vérifie :
1. N (x) ≥ 0 et N (x) = 0 ⇔ x = 0.
2. ∀x ∈ E, ∀λ ∈ K, N (λx) = |λ|N (x).
3. ∀x, y ∈ E, N (x + y) ≤ N (x) + N (y)
Une norme est donc une application qui sert à « mesurer la taille » d’un vecteur.
L’inégalité du dernier point s’appelle l’inégalité triangulaire. On dit que N (x) est
la norme de x. On appelle espace vectoriel normé (e.v.n. en abrégé) un couple
(E, N ) où N est une norme sur E.

3
4 CHAPITRE 1. ESPACES VECTORIELS NORMÉS

Proposition 1.2. Soit E, N un e.v.n.. Alors


(i) N (x1 + · · · + xn ) ≤ N (x1 ) + . . . N (xn ).
(ii) |N (x) − N (y)| ≤ N (x − y).

Démonstration. Au tableau.

Exemple 1.3. Sur R, N p(x) = |x| est une norme. De même, on peut prendreN (z) =
|z| sur C puis N (u) = u21 + u22 sur R2 , où u = (u1 , u2 ). Les vérifications de l’in-
égalité triangulaire ne sont pas immédiates et nécessitent Cauchy-Schwarz (cf.
ci-dessous).

Définition 1.4. soit E un K-espace vectoriel. On dit que E est un ( espace eucli-
E×E →K
dien, s’il est muni d’un produit scalaire, c’est à dire une application
(u, v) 7→ ⟨u, v⟩
qui vérifie :
— Antisymétrie : ⟨u, v⟩ = ⟨v, u⟩
— Linéarité à gauche ⟨λu + βu′ , v⟩ = α⟨u, v⟩ + β⟨u′ , v⟩.
— Positivité : ⟨u, u⟩ ≥ 0 avec égalité si et seulement si u = 0.
Notons que l’antisymétrie implique que ⟨u, λv + βv ′ ⟩ = λ⟨u, v⟩ + β⟨u, v ′ ⟩, c’est à
dire l’antilinéarité à droite.

Remarque 1.5. Sur un R-espace vectoriel, la conjugaison complexe est sans effet :
on obtient donc une application symétrique et bilinéaire, c’est à dire linéaire en
chacun des argument.

Revenons au cas général d’un K-espace vectoriel E euclidien. On pose alors


def
p
N (u) = ⟨u, u⟩.

Les propriétés du produit scalaires impliquent directement 1 et 2. Pour voir 3,


commençons par redémontrer l’inégalité de Cauchy-Schwarz dans le cas général
K = R ou C.

Proposition 1.6. (Inégalité de Cauchy-Schwarz) Soit E un espace euclidien sur


K = R ou C. Alors,

∀x, y ∈ E : |⟨x, y⟩| ≤ N (x)N (y).

Démonstration. Considérons donc x, y ̸= 0, 0 sinon il n’y a rien à démontrer. On


pose pour z ∈ K
P (z) = N (x + zy)2 ≥ 0.
En développant, on trouve :

P (z) = ⟨x + zy, x + zy⟩ = N (x)2 + z̄⟨x, y⟩ + z⟨y, x⟩ + |z|2 N (y)2 .


1.1. NORMES ET DISTANCES 5

On prend alors z = − N⟨x,y⟩


(y)2
∈ K, ce qui donne

|⟨x, y⟩|2 |⟨x, y⟩|2


P (z) = N (x)2 + N (y) 2
− 2 ≥0
N (y)4 N (y)2
⇔ N (x)2 N (y)2 ≥ |⟨x, y⟩|2 .

Pour montrer que la norme euclidienne vérifie bien l’inégalité triangulaire, il suffit
alors d’appliquer l’inégalité de Cauchy Schwarz :

N (u + v)2 = ⟨u + v, u + v⟩ = N (u)2 + 2 Re⟨u, v⟩ + N (v)2


≤ N (u)2 + 2|⟨u, v⟩| + N (v)2
≤ N (u)2 + 2N (u)N (v) + N (v)2
≤ (N (u) + N (v))2 .

En prenant la racine, on a bien l’inégalité triangulaire (tout est positif).

Exemple 1.7. Au tableau. Soit φ : E → E ′ une application linéaire injective. On


suppose que N ′ est une norme sur E ′ . Alors, si u ∈ E, l’application
def
u 7→ N (u) = N ′ (φ(u))

est une norme sur E.

def
On notera parfois N = φ∗ N ′ , de sorte que φ∗ N ′ (x) = N ′ (φ(x)). On dit qu’on a
« tiré en arrière » la norme N ′ sur E ′ à l’aide de φ : E → E ′ .

Exemple 1.8. (un cas de dimension infinie - à voir en TD). Soit C l’espace
vectoriel des fonctions continues sur [−1, 1], à valeurs dans R. C’est un espace
vectoriel de dimension infinie (il contient la restriction de R[X] sur cet intervalle).
On pose, pour f ∈ C,
∥f ∥∞ = sup |f (x)|
x∈[−1,1]

On vérifie que c’est bien une norme.

Exemple 1.9. (TD) Toujours sur ce même espace, on peut encore poser
Z 1
∥f ∥1 = |f (x)|dx
0

C’est bien une norme, mais le point 1 est plus délicat et nécessite de manière
cruciale la continuité de f .
6 CHAPITRE 1. ESPACES VECTORIELS NORMÉS

Comme on peut le prévoir, il existe bien d’autres normes sur Rn que la norme
euclidienne. Soit donc x = (x1 , . . . , xn ) ∈ Rn . On pose :
qX
def
X
∥x∥1 = |xi |, ∥x∥2 = |xi |2 , ∥x∥∞ = max |xi |.
1≤i≤n

Ce sont des normes sur Rn . On l’a déjà vu pour ∥ · ∥2 .

Exercice 1.10. Le vérifier pour les autres.

Proposition 1.11. Pour tout x ∈ Rn , on a les inégalités

∥x∥∞ ≤ ∥x∥2 ≤ ∥x∥1 ≤ n∥x∥∞

Démonstration. Au tableau.
Remarque 1.12. Ceci se généralise à tout espace vectoriel E de dimension n, et
pas seulement Rn : si {e1 , . . . , en } est une base de E, tout vecteur x ∈ E s’écrit
de manière unique
Xn
x= xi e i ,
i=1

où les nombres xi sont les coordonnées de x dans la base (ei ). Il suffit de poser
∥x∥1 , ∥x∥2 , ∥x∥∞ comme ci-dessus en utilisant les coordonnées de x.

On appelera ∥x∥1 , ∥x∥2 , ∥x∥∞ les normes standard de x sur Rn . Cette définition
est propre à notre cours. Nous utiliserons parfois la notation ∥ · ∥ pour désigner
l’application norme (que ce soit l’une des normes standard ou une autre, en fonc-
tion du contexte) : (
E→R
∥·∥:
x 7→ ∥x∥.

Définition 1.13. Soit E un espace vectoriel. On dit que deux normes N1 , N2 sont
équivalentes s’il existe une constante C > 0 telle que

∀x ∈ E, N1 (x) ≤ CN2 (x) et N2 (x) ≤ CN1 (x).

On écrit parfois
1
N2 ≤ N1 ≤ CN2
C
et l’on remarque que l’inégalité précédente est aussi vraie en échangeant N1 et N2 .

Exercice 1.14. Soit E un espace vectoriel muni de deux normes N1 , N2 . Suppo-


sons que l’on a montré qu’il existe C ′ , C ′′ > 0 telles que

N1 ≤ C ′ N2 et N2 ≤ C ′′ N1 .

Montrer que ces normes sont équivalentes.


1.1. NORMES ET DISTANCES 7

Ainsi, la proposition précédente montre que les normes ∥·∥1 , ∥·∥2 , ∥·∥∞ sont toutes
équivalentes entre elles sur Rn , et plus généralement sur tout espace vectoriel de
dimension n.
Définition 1.15. (Norme produit). Soient E1 , E2 deux espaces vectoriels normés,
munis respectivement des normes N1 et N2 . Pour x = (x1 , x2 ) ∈ E1 × E2 on pose

N (x) = max(N (x1 ), N (x2 )).

Alors N est une norme sur E1 × E2 .


Exercice 1.16. Le vérifier.

De même, on peut définir un norme sur une somme d’espace vectoriels :


Définition 1.17. Soit E = F ⊕ G. On suppose que (F, N ′ ) et (G, N ′′ ) sont des
e.v.n. Alors, tout x ∈ E s’écrit de manière unique x = u + v avec u ∈ F et v ∈ G,
on peut poser
N (x) = N ′ (u) + N ′′ (v)
Exercice 1.18. Vérifier que l’application N ci-dessus est bien une norme sur E.
Exercice 1.19. On prend E = F ⊕ G comme ci-dessus. On suppose que F et
G sont chacun munis d’un produit scalaire ⟨, ⟩F et ⟨, ⟩G . Alors, si u = x + y et
v = x′ + y ′ où la décomposition (unique) est faite selon F ⊕ G, on définit :
def
⟨u, v⟩ = ⟨x, x′ ⟩F + ⟨y, y ′ ⟩G .

1. Vérifier que ceci définit un produit scalaire sur E = F ⊕ G.


2. En déduire l’expression de la norme provenant de ce produit scalaire sur
E. On dit qu’elle est adaptée à la décomposition E = F ⊕ G.

On peut remarquer qu’en écrivant


   
2 1 0
R ≃ R ⊕ R = {x +y , x, y ∈ R}
0 1

et qu’on munit R du produit scalaire ⟨x, y⟩ = xy (qui est effectivement un produit


de scalaires !), la construction ci-dessus nous donne en fait le produit scalaire
euclidien sur R2 .
Exercice 1.20. (Normes standard sur Cn ) Soit n ≥ 1 un entier naturel. On
considère Cn comme un R-espace vectoriel.
1. Vérifier que
(
Cn → R2n
φ:
(z1 , . . . , zn ) 7→ (Re z1 , Im z1 , Re z2 , Im z2 , . . . , Re zn , Im zn )

est un isomorphisme.
8 CHAPITRE 1. ESPACES VECTORIELS NORMÉS

2. Justifier que l’on peut appliquer la construction de l’exemple 1.7 lorsqu’on


munit R2n de ses trois normes standard pour définir trois normes sur Cn .
Donner l’expression de ces trois normes sur Cn , c’est à dire de
φ∗ ∥ · ∥1 , φ∗ ∥ · ∥2 , φ∗ ∥ · ∥∞

3. On pose, pour z = (z1 , . . . , zn ) ∈ Cn ,


N1 (z) = |z1 | + · · · + |zn |.
En notant ∥ · ∥1 la norme 1 standard sur R2n , comparer N1 la norme φ∗ ∥ · ∥1
sur Cn .
4. L’expression (φ−1 )∗ N1 a-t-elle un sens ? Si oui, lequel, et pourquoi ? Com-
parer alors (φ−1 )∗ N1 et ∥ · ∥1 sur R2n .
Exemple 1.21. Soit E = Rm [X]. On note {e1 , . . . , em+1 } la base canonique de
Rm+1 .

1. Vérifier que l’application canonique linéaire


(
Rm [X] → Rm+1 = Vect(e1 , . . . , em+1 )
φ:
X k 7→ ek+1
est injective.
2. En déduire la construction de normes N sur Rm [X] à l’aide des normes
standard sur Rm+1 . On donnera leurs expressions pour un polynôme
P = a0 + a1 X + · · · + am X m ∈ Rm [X].

Nous pouvons maintenant introduire le concept de distance.


Définition 1.22. (Distance sur un espace vectoriel normé). Soit (E, N ) un e.v.n..
Pour x, y ∈ E on appelle distance de x à y (associée à la norme N ) la quantité
d(x, y) = N (x − y).
On obtient ainsi une application d : E × E → R+ , et N (x) = d(x, 0).
Proposition 1.23. La distance précédente vérifie les propriétés suivantes :
(i) ∀x, y ∈ E, d(x, y) ≥ 0 et d(x, y) = 0 ⇔ x = y.
(ii) Symétrie : ∀x, y ∈ E, d(x, y) = d(y, x).
(iii) Inégalité triangulaire : ∀x, y, z ∈ E, d(x, z) ≤ d(x, y) + d(y, z).
Remarque 1.24. De manière générale, on définit une distance sur un ensemble
E comme une application d : E × E → R+ qui vérifie les trois propriétés pré-
cédentes. Dans le cas d’une distance associée à une norme, on a des propriétés
supplémentaires, comme :
(iv) Invariance par translation : ∀x, y, a ∈ E, d(x + a, y + a) = d(x, y).
1.1. NORMES ET DISTANCES 9

Démonstration. (i) vient du fait que N ≥ 0 et que si N (x − y) = 0 alors x − y = 0.


La symétrie (ii) vient de N (x − y) = N ((−1)(y − x)) = N (y − x). (iv) découle de
N ((x + a) − (y + a)) = N (x − y + a − a). (iii) s’obtient en écrivant

d(x, z) = N (x − z) = N (x − y + y − z)
≤ N (x − y) + N (y − z) = d(x − y) + d(y − z).

Exemple 1.25. " Cet exemple sort du cadre des espaces vectoriels.
Définition 1.26. Soit E un espace vectoriel normé et a ∈ E. Soit r > 0. La boule
ouverte de centre a et de rayon r est

B(a, r) = {x ∈ E : d(x, a) < r} = {x ∈ E, N (x − a) < r}.

Soit r ≥ 0. La boule fermée de centre a et de rayon r est

B(a, r) = {x ∈ E : d(x, a) ≤ r} = {x ∈ E, N (x − a) ≤ r}.

On remarque qu’on a les propriétés suivantes :


1. Si le rayon r ̸= 0 alors B(a, r) ⊂ B(a, r).
2. B(a, 0) = {x : d(x, a) = 0} = {a}.
3. Si 0 ≤ r ≤ r′ alors B(a, r) ⊂ B(a, r′ )
4. Si 0 < r ≤ r′ alors B(a, r) ⊂ B(a, r′ ).

Exercice 1.27. Montrer en détail les 4 propositions ci-dessus.

Exemple 1.28. Pour E = R, N (x) = |x|, a ∈ R, on a

B(a, r) =]a − r, a + r[, B(a, r) = [a − r, a + r]

Pour E = C, N (z) = |z|, B(a, r) = {z ′ : |a − z ′ | < r} : c’est le disque ouvert de


centre a et de rayon r.
Pour E = R2 , on a :

— B∞ (0, 1) = {(x1 , x2 ) : |x1 | < 1 et |x2 | < 1}. C’est le carré (ouvert) centré
de côté 2.
— De même, B2 (0, 1) = {(x1 , x2 ) : x21 + x22 < 1}. C’est le disque (ouvert)
centré, de rayon 1.
— Enfin, B1 (0, 1) = {(x1 , x2 ) : |x1 |+|x2 | < 1}. C’est un carré ouvert de côté 1,
centré, dont les côtés sont perpendiculaires aux axes du repère orthonormé
canonique.
10 CHAPITRE 1. ESPACES VECTORIELS NORMÉS

1.2 Limites et continuité

1.2.1 Suites et convergence


Définition 1.29. Soit E un espace vectoriel muni de la norme N . On dit qu’une
suite (un )n∈N d’éléments de E converge vers ℓ ∈ E si la suite réelle N (un − ℓ)
converge vers 0, c’est à dire si
n→+∞
d(un , ℓ) = N (un − ℓ) −−−−→ 0.

Autrement dit,
n→+∞ def n→+∞
un −−−−→ ℓ ⇔ N (un − ℓ) −−−−→ 0,
ce qui s’exprime avec des quantificateurs par :

∀ϵ > 0, ∃n0 ≥ 0 tel que si n ≥ n0 alors N (un − ℓ) < ϵ.

n→+∞
Nous écrirons parfois simplement → au lieu de −−−−→ lorsqu’il n’y a pas d’ambi-
guité.

Définition 1.30. Soit (vn )n∈N une suite de E. On dit que (vn ) est une suite de
Cauchy, si pour tout ϵ > 0 il existe n0 ∈ N tel que

∀n, m ≥ n0 : N (vn − vm ) < ϵ.

Exercice 1.31. Soit (un ) une suite de E qui converge vers ℓ ∈ E.


(a) Démontrer que pour tout ϵ > 0, il existe r > 0 tel que B(ℓ, r) contient tous
les termes de la suite sauf un nombre fini.
(b) Démontrer que (un ) est une suite de Cauchy.
(c) Démontrer que dans les deux définitions ci-dessus, on peut de manière équi-
valente remplacer les < par des ≤.

Exemple 1.32. Soit (zn ) une suite de nombre complexes, où C est muni de sa
n→∞
norme usuelle donnée par le module. Alors zn −−−→ z si et seulement si

Re zn → Re z et Im zn → Im z.

En effet, les inégalités classiques | Im z| ≤ |z| et | Re z| ≤ |z| impliquent

| Re(zn ) − Re(z)| = | Re(zn − z)| ≤ |zn − z| → 0,

de même pour la partie imaginaire. Ceci montre les convergences des parties réelles
et imaginaires. La réciproque est immédiate car
q
|zn − z| = Re2 (zn − z) + Im2 (zn − z) → 0 + 0.
1.2. LIMITES ET CONTINUITÉ 11

Attention, l’argument d’une suite complexe convergente peut très bien ne pas
converger ! Considérer par exemple
1
zn = einπ → 0
n+1
1
ou encore zn = n+1
ein .
Proposition 1.33. Soient (un ), (vn ) deux suites de E, espace vectoriel sur K et
α, β ∈ K deux scalaires. Si un → ℓ et vn → ℓ′ alors
n→∞
αun + βvn −−−→ αℓ + βℓ′ .

Démonstration. On a
N (αun + βvn − (αℓ + βℓ′ )) = N (α(un − ℓ) + β(vn − ℓ′ ))
≤ N (α(un − ℓ)) + N (β(vn − ℓ′ ))
≤ |α|N (un − ℓ) + |β|N (vn − ℓ′ ) → 0 + 0.

Remarquons que la limite d’une suite, si elle existe, est unique : si un → a et


un → b, alors
0 ≤ N (a − b) = N (a − un + un − b)
≤ N (un − a) + N (un − b) → 0.
Ainsi, N (a − b) = 0, c’est à dire a = b.
Proposition 1.34. Soient N1 , N2 deux normes équivalentes sur E et (un ) une
suite de E. Alors (un ) converge vers ℓ pour N1 si et seulement si (un ) converge
vers ℓ pour N2 .
Autrement dit, deux normes équivalentes ont les mêmes suites convergentes, avec
les mêmes limites.

Démonstration. Il suffit de voir que pour tout n, N1 (un − ℓ) ≤ CN2 (un − ℓ) et


N2 (un − ℓ) ≤ CN1 (un − ℓ). La comparaison de ces suites réelles positives donne
immédiatement
n→+∞ n→+∞
N2 (un − ℓ) −−−−→ 0 ⇔ N1 (un − ℓ) −−−−→ 0.

En corollaire, quelque chose que nous avons déjà remarqué : soit (un ) une suite
de Rp , alors on peut écrire
un = (x1,n , . . . , xp,n )
où chaque coordonnée (xi,n )n∈N définit une suite à valeurs réelles.
12 CHAPITRE 1. ESPACES VECTORIELS NORMÉS

Corollaire 1.35. La suite (un )de Rp converge vers ℓ = (ℓ1 , . . . , ℓp ) ∈ Rp pour


l’une des normes 1, 2, ∞ si et seulement si pour tout i = 1 . . . p,
n→∞
xi,n −−−→ ℓi .

Démonstration. Au tableau.

Exemple 1.36. Soit E = Rm [X]. On reprend la suite d’un exemple précédent.

(i) Soit P ∈ Rm [X]. Alors la suite (P (k) )k∈N converge vers le polynôme nul pour
la norme N2 . C’est vrai car pour n assez grand, (X k )(n) = 0. Donc la suite est
constante (de valeur 0) à partir d’un certain rang, par exemple n0 = deg P + 1.
(ii) Si (Qn ) → P est une suite de polynômes qui converge vers P , alors pour tout
i = 0 . . . n, le coefficient de X i de Qn converge vers le coefficient de X i de P
lorsque n → ∞.
En effet, puisque Rm [X] ≃ Rm+1 par une bijection canonique φ (exemple 1.21)
nous avons vu que l’on peut munir Rm [X] de normes standard, tirées en arrière
par φ depuis les normes standard de Rm+1 . Ainsi, une suite de Rm [X] converge
si et seulement l’image de cette suite dans Rm+1 converge. La convergence dans
Rm+1 se faisant coordonnées par coordonnées, l’identification par φ montre qu’on
a convergence coefficients par coefficients dans Rm [X].
Remarque 1.37. Soit φ : E → E ′ une injection linéaire, et N ′ une norme sur E ′ .
n→+∞
Soit (un ) une suite de E. Si un −−−−→ ℓ pour la norme φ∗ N ′ si et seulement si
n→+∞
φ(un ) −−−−→ φ(ℓ) pour la norme N ′ . C’est simplement la définition, car

φ∗ N ′ (un − ℓ) → 0 ⇔ N ′ (φ(un − ℓ) = N ′ (φ(un ) − φ(ℓ)) → 0.

Terminons cette section par un résultat que nous admettrons cette année, mais
qu’il est bon d’avoir en tête :

Théorème 1.38. (admis) Sur un espace E de dimension finie, toutes les normes
sont équivalentes.

Ce théorème est très utile, car il montre que le choix d’une norme particulière en
dimension finie n’a pas d’importance pour les questions de convergence au vu de
la proposition 1.34 !

1.2.2 Applications continues


Définition 1.39. Soient (E, N ) et (E, N ′ ) deux e.v.n., A ⊂ E un sous-ensemble,
x0 ∈ A et f : E → E ′ . On dit que f est continue en x0 ssi

∀ϵ > 0, ∃η > 0 : ∀x ∈ A tel que N (x − x0 ) < η ⇒ N ′ (f (x) − f (x0 )) < ϵ. (1.1)


1.2. LIMITES ET CONTINUITÉ 13

On dit que f est continue sur A si pour tout x0 ∈ A, f est continue en x0 .


Enfin, on dira que
lim f (x) = f (a)
x→a
si et seulement si f est continue en a, c’est à dire si et seulement si l’équation
(1.1) est vérifiée.
Remarque 1.40. Cette définition généralise la définition pour les fonction à une
variable en remplaçant la valeur absolue (ou le module) par la norme.
Exercice 1.41. La définition précédente peut se reformuler à l’aide de boules ou
de distances : vérifier que f est continue en x0 ssi
∀ϵ > 0, ∃η > 0 tel que f (B(x0 , η)) ⊂ B(f (x0 ), ϵ),
ou encore si et seulement si
∀ϵ > 0, ∃η > 0 : dN (x, x0 ) < η ⇒ dN ′ (f (x), f (x0 )) < ϵ,
où les distances sont associées aux normes respectives de E et E ′ .
Exercice 1.42. Vérifier qu’on peut remplacer les < par des ≤ dans la définition
de la continuité, c’est à dire que f est continue en x0 si et seulement si
∀ϵ > 0, ∃η > 0 : ∀x ∈ A tel que N (x − x0 ) ≤ η ⇒ N ′ (f (x) − f (x0 )) ≤ ϵ.
Exemple 1.43. Les exemples ci-dessous sont à connaître, avec les démonstrations
associées :
— L’identité IdE : E → E est continue.
— Si f est continue sur A et B ⊂ A, alors f |B est continue sur B.
— Si N1 est une norme équivalente à N sur E et N1′ est une norme équivalente
à N ′ sur E ′ , alors f : (E, N ) → (E ′ , N ′ ) est continue en si et seulement si f :
(E, N1 ) → (E ′ , N1′ ) est continue en x0 . En d’autres termes, remplacer une
norme par une norme équivalente ne change pas la propriété de continuité.

Par exemple, pour f : Rp → Rp on peut donc choisir n’importe laquelle
des norme 1, 2, ∞ pour étudier la continuité.
Proposition 1.44. Soit (E, N ) un e.v.n.. Alors la norme N : E → R est une
application continue.

Démonstration. En effet, d’après la proposition 1.2, on a


|N (x) − N (a)| ≤ N (x − a).
La continuité est alors directe : soit ϵ > 0, il suffit de prendre η = ϵ pour avoir le
résultat, car si N (x − a) < η = ϵ alors d’après l’inégalité ci-dessus,
|N (x) − N (a)| ≤ ϵ
14 CHAPITRE 1. ESPACES VECTORIELS NORMÉS

Exercice 1.45. Soit (E, N ) un e.v.n. et f : E → R. On suppose que la propriété


suivante est vérifiée :

∀x, y ∈ E, |f (x) − f (y)| < 3N 2 (x − y).

Soit a ∈ E et ϵ > 0. Démontrer qu’il existe un η > 0 qu’on calculera, tel que si
N (x − a) < η alors |f (x) − f (a)| < ϵ. La fonction f est-elle continue sur E ?

1.2.3 Opérations sur les fonctions continues.


On rappelle que si f, g : A → E ′ on définit f + g : A → E ′ par

x 7→ (f + g)(x) = f (x) + g(x),

la dernière somme étant celle des vecteurs de E ′ . De même, pour λ un scalaire,


on définit λf : A → E ′ par
λf : x 7→ λ.f (x),
cette dernière multiplication externe étant celle de E ′ .
Proposition 1.46. (i) Si f et g sont continues en x0 , alors λf et f + g sont
continues en x0 .
(ii) Si E ′′ , N ′′ est un e.v.n. et B ⊂ E ′ est tel que f (A) ⊂ B. Si h : B → E ′′ est
continue en f (x0 ), alors h ◦ f est continue en x0 .

Démonstration. On laisse la démonstration du premier point en exercice, il suffit


d’appliquer la définition. Au tableau pour la suite.

Proposition 1.47. Soient (E, N ), (E ′ , N ′ ) deux e.v.n., A ⊂ E, f : A → E ′ .


Supposons f continue en a ∈ A. Alors, pour toute suite (xn ) qui converge vers a,
f (xn ) converge vers f (a).

Démonstration. Au tableau.

Cette proposition permet en fait une caractérisation de la continuité à l’aide des


suites, c’est la propriété de la continuité séquentielle exprimée par le théorème
suivant.
Théorème 1.48. Soit f : A → E ′ comme ci-dessus, et a ∈ A. Il y a équivalence
entre
(i) f est continue en a
(ii) Pour toute suite (xn )n∈N de A convergeant vers a, la suite (f (xn ))n∈N converge
vers f (a).
1.2. LIMITES ET CONTINUITÉ 15

Démonstration. L’implication (i) ⇒ (ii) est donnée par la proposition précédente.


Reste à montrer la réciproque : pour cela, il revient au même de montrer que (i)
est faux implique (ii) est faux.
La suite au tableau.

Le cas du produit de fonctions continues est un peu particulier : il faut se res-


treindre à E ′ = K car on ne dispose pas de produit naturel dans un espace vectoriel
de dimension ≥ 2. Soit f, g : A ⊂ E → K. On pose
(
E→K
fg :
x 7→ f (x)g(x).

Proposition 1.49. Soit f, g : A ⊂ (E, N ) → (K, | · |) des applications continues


en a. Alors l’application f g est continue en a.
n→+∞
Démonstration. Utilisons le théorème 1.48. Soit une suite quelconque xn −−−−→ a.
n→+∞
Notre but est de démontrer que f g(xn ) −−−−→ f g(a). On a, par définition,
f g(xn ) = f (xn )g(xn ).
n→+∞
D’après le théorème 1.48, f (xn ) −−−−→ f (a) en tant que suite réelle (ou complexe),
car f est continue. De même, g(xn ) → g(a). Or le produit de deux suites complexes
(ou réelles) convergentes est convergente, vers le produit des limites. Donc on a
n→+∞
bien f (xn )g(xn ) −−−−→ f (a)g(a), ce qui montre la continuité de f g puisque la
suite (xn ) est arbitraire.

Considérons maintenant le cas particulier de E ′ = Rp .


Proposition 1.50. Soit (E, N ) un espace vectoriel normé, A ⊂ E et f : A → Rp .
Écrivons
f (x) = (f1 (x), . . . , fp (x)) ∈ Rp
où les fi : A → R sont les applications coordonnées de f .
Alors f est continue en A ⇔∀i = 1 . . . p, fi est continue en a.

Démonstration. Au tableau.

Définition 1.51. Soit (E, N ), (F, N ′ ) et A ⊂ E. Soit f : A → F . On dit que f


est bornée sur A, s’il existe C = CA ≥ 0 telle que
∀x ∈ A, N ′ (f (x)) ≤ C.
Remarquons que la constante C dépend a priori de A, mais que cette borne est
uniforme pour x ∈ A.
16 CHAPITRE 1. ESPACES VECTORIELS NORMÉS

Définition 1.52. On prend les mêmes notations que ci-dessus, mais cette fois on
suppose que A = E et que f est linéaire. On dit alors que f est bornée si elle
est bornée sur B E (0, 1), c’est à dire s’il existe M ≥ 0 tel que

∀x ∈ E avec N (x) = 1, on a N ′ (f (x)) ≤ M.

Soit maintenant u : E → E ′ une application linéaire. Alors u est continue ssi u


est continue en 0. En effet, on a

u(a) − u(x) = u(a − x)

donc u est continue si et seulement si limx→a u(x − a) = 0, ce qui est équivalent à


demander limh→0 u(h) = 0, i.e. u est continue en 0.

Proposition 1.53. Soit u : E → E ′ linéaire entre e.v.n.. L’application u est


continue si et seulement si il existe C > 0 tel que

∀x ∈ E, N ′ (u(x)) ≤ CN (x). (1.2)

Démonstration. Au tableau.

Remarque 1.54. On déduit de ce qui précède qu’une application linéaire u : E →


E ′ est continue si et seulement si elle est bornée.

Proposition 1.55. Soit E, N un espace vectoriel normé. Alors toute application


linéaire f : Rp → E est continue lorsqu’on muni Rp de la norme 1, 2 ou ∞. En
particulier, toute application linéaire de Rp dans Rq muni d’une de ces normes est
continue.

Démonstration. Pour le voir, il suffit comme remarqué plus haut de montrer que
f est continue en 0. Soit (e1 , . . . , ep ) la base canonique de Rp . Écrivons
p
X
x= xi e i .
i=1

Alors par l’inégalité triangulaire,


p
X
N (f (x)) ≤ |xi |N (f (ei )) ≤ M ∥x∥1
i=1

avec M = maxi N (f (ei )). Donc, pour tout ϵ > 0, on peut trouver η = ϵ/M de
sorte que si ∥x∥1 < η, on a clairement N (f (x)) < ϵ. Ainsi, f est continue en 0,
donc continue de Rp → E lorsqu’on munit Rp de la norme 1. Par équivalence des
normes, ceci reste donc vrai avec les normes 2 et ∞.
1.2. LIMITES ET CONTINUITÉ 17

Exemple 1.56. Les applications


( (
R2 → R R2 → R
,
(x, y) 7→ xy (x, y) 7→ x + y

sont continues. En effet, les applications coordonnées π1 : (x, y) → x et π2 :


(x, y) → y sont continues car linéaires sur R2 . On a vu alors que π1 π2 et π1 + π2
sont continues comme produit de fonctions continues à valeur dans R et somme
de fonctions continues.
De même, l’application (
C×C→C
f:
(z1 , z2 ) 7→ z1 z2
est continue lorsqu’on munit C × C de la norme N1 (z, z ′ ) = |z| + |z ′ | et C de sa
norme usuelle. En effet, c’est encore le produit des deux applications continues π1
et π2 à valeur dans C définies comme ci-dessus.
Exercice 1.57. En utilisant seulement la définition 1.39, montrer que l’applica-
tion f précédente est continue en (a, b) ∈ C2 . On pourra utiliser (en le vérifiant)
que l’on a, pour (z, z ′ ) ∈ C2 ,

|zz ′ − ab| = |(z − a)z ′ + (z ′ − b)a|.

Ce que l’on vient de voir a une conséquence intéressante :


Proposition 1.58. Pour tout n ∈ N, l’application z 7→ z n est continue. En
particulier, toute fonction polynôme est une fonction continue.
Exemple 1.59. Soit E un e.v.n., A ⊂ E et f : A → K continue. Supposons que
1
∀x ∈ A, f (x) ̸= 0, i.e. f ne s’annule pas sur A. Alors x 7→ f (x) est continue sur A.
1
De même, si f est continue en x0 et f (x0 ) ̸= 0, alors x 7→ f (x) est continue en x0 .

Finissons cette section avec un exemple de fonction non continue. Soit f : R2 → R


définie par (
xy
2 2 si (x, y) ̸= (0, 0)
f (x, y) = x +y
0 si (x, y) = (0, 0).
Montrons que cette fonction n’est pas continue. Pour cela, soit λ > 0 et mλ : R →
R2 définie par
mλ : t 7→ (t, λt)
Alors mλ est continue, comme on le voit en considérant le point de vue des suites :
si tn → t alors (tn , λtn ) → (t, λt). Si f était continue, alors f ◦ mλ : R → R serait
continue, comme composition de fonctions continues. Or, si t ̸= 0, mλ (t) ̸= 0 et
donc on calcule facilement
λt2 λ
f (mλ (t)) = 2 2 2
= >0
t +λ t 1 + λ2
18 CHAPITRE 1. ESPACES VECTORIELS NORMÉS

qui est indépendant de t. Mais f (mλ (0)) = 0, ce qui montre que f ◦ mλ n’est pas
continue en 0, une contradiction.
Remarquons que le problème persiste même si l’on pose f (0, 0) = a ̸= 0. Il suffit
λ
de reprendre la construction précédente et choisir λ > 0 tel que 1+λ2 ̸= a.

1.2.4 Espace vectoriels de matrices


Dans cette section, nous allons considérer le cas où
E = Mp,n (K),
espace des matrices de taille p × n à coefficients dans K. C’est un espace vectoriel
sur K. Il se trouve qu’en plus, cet espace vectoriel est muni d’un produit lorsque
p = n, le produit matriciel E × E → E.
Pour A ∈ Mp,n (K), on écrit A = (ai,j ) 1≤i≤p et l’on pose
1≤j≤n

def
N (A) = n max |ai,j |.
1≤i≤p
1≤j≤n

Proposition 1.60. L’application N ci-dessus est une norme. De plus, on a


∥AX∥∞ ≤ N (A)∥X∥∞ ,
et si n = p,
N (AB) ≤ N (A)N (B).

Démonstration. Au tableau. laissée en exercice. On a


n
X n
X
∥AX∥∞ = sup | ajk Xk | ≤ sup |aj,k |∥X∥∞
1≤j≤p j,k
k=1 k=1
≤ n sup |aj,k |∥X∥∞ = N (A)∥X∥∞ .
j,k

D’autre part, si n = p,
n
X
(AB)i,j = aik bkj
k=1
d’où
n
X
|(AB)i,j | ≤ sup |ai,k | sup |bk,j |
i,k k,j
k=1
n
X 1 1
≤ N (A) N (B)
k=1
n n
−1
≤ n N (A)N (B)
ce qui donne le résultat car N (AB) = n supi,j |(AB)i,j |.
1.3. TOPOLOGIE D’UN ESPACE VECTORIEL NORMÉ 19

Exercice 1.61. (Norme d’opérateur). Soit A ∈ Mn (K). On considère l’application


fA : Kn → Kn donnée par
fA : X 7→ AX
 
x1
 .. 
où X =  .  ∈ Kn . Ainsi, A est précisément la matrice de l’application fA .
xn
On munit Kn de l’une de ses normes standard, que l’on notera N . On pose alors
N (AX)
∥A∥ = sup .
∥x∦=0 N (X)

1. Montrer que l’on a aussi

∥A∥ = sup N (AX).


N (X)=1

2. En utilisant l’expression précédente, démontrer que ∥ · ∥ est bien une norme


sur Mn (K).
3. Démontrer que ∥AB∥ ≤ ∥A∥∥B∥.

Exercice 1.62. Sur Mn (K) × Mn (K) on met la norme

∥(A, B)∥ = max(N (A), N (B))

Muni de cette norme, montrer l’application « produit de matrices »


(
Mn (K) × Mn (K) → Mn (K)
(A, B) 7→ AB

est continue. Indication : Commencer par écrire

N (AB − A0 B0 ) = N ((A − A0 + A0 )(B − B0 + B0 ) − A0 B0 )

puis utiliser l’inégalité triangulaire avec trois termes bien choisis.

1.3 Topologie d’un espace vectoriel normé

1.3.1 Ouverts associés à une norme


Définition 1.63. Soit E un e.v.n.. On dit qu’un sous ensemble U ⊂ E est ouvert
si ∀x ∈ U , ∃r > 0 avec B(x, r) ⊂ U .

Comme toujours, on prendra garde au fait que la propriété d’être ouvert dépend
de la norme utilisée pour construire les boules.
20 CHAPITRE 1. ESPACES VECTORIELS NORMÉS

Exemple 1.64. Les exemples ci-dessous sont à connaître absolument.


1. Les ensembles ∅ et E sont ouverts. Dans R, tout intervalle ]a, b[ est ouvert
car pour x ∈]a, b[,
r < min{|x − a|, |x − b|}
convient car ]x − r, x + r[⊂]a, b[.
2. Soit I un ensemble, pas nécessairement dénombrable. Soit (Ui )i∈I une fa-
mille d’ouverts indexée par I. Alors,
[
U= Ui
i∈I

est ouvert. En effet, si x ∈ U , il existe j ∈ I tel que x ∈ Uj . L’ensemble Uj


étant ouvert, on peut trouver r (qui va dépendre de x et de j) tel que

B(x, r) ⊂ Uj ⊂ U.

3. Si U, V sont ouvert, il en est de même pour U ∩ V . En effet, si x ∈ U ∩ V


il existe rU et rV tels que

B(x, rU ) ⊂ U, B(x, rV ) ⊂ V.

En prenant r = min(rU , rV ) > 0, la boule B(x, r) convient car elle est dans
U ∩ V , d’après les propriétés données à la suite de la définition 1.26.
Par une récurrence immédiate, on peut généraliser ce dernier exemple :
Proposition 1.65. Une réunion quelconque d’ouverts est encore un ouvert.
Toute intersection finie d’ouverts est encore un ouvert.

" Une intersection infinie d’ouverts n’est pas nécessairement ouverte, comme le
montre \
] − n−1 , n−1 [= {0}
n≥1

Or {0} n’est clairement pas ouvert, car il ne contient aucune boule de rayon > 0.
On rappelle que si f : X → Y et Z ⊂ Y , on définit l’image réciproque de Z par

f −1 (Z) = {x ∈ X : f (x) ∈ Z}.

Proposition 1.66. Une application f : E → E ′ entre e.v.n. est continue si et


seulement si l’image réciproque d’un ouvert de E ′ est un ouvert de E.

Démonstration. Au tableau. c’est un ouvert. Sinon, il existe x0 ∈ f −1 (V ) et donc


f (x0 ) ∈ V . Celui-ci est ouvert, donc il existe une boule B(f (x0 ), r) ⊂ V . Main-
tenant, par continuité de f en x0 , en prenant ϵ = r, il existe η > 0 tel que si
N (x − x0 ) < η alors N (f (x) − f (x0 )) < r. Il s’ensuit que

f (B(x0 , η)) ⊂ B(f (x0 ), r) ⊂ V.


1.3. TOPOLOGIE D’UN ESPACE VECTORIEL NORMÉ 21

Donc B(x0 , η) ⊂ f −1 (V ) qui est alors ouvert par définition.


Réciproquement, si l’image réciproque d’un ouvert est ouverte, considérons x0 ∈ E
et y = f (x0 ) ∈ f (E) ⊂ E ′ . Il faut montrer que f est continue en x0 . Prenons
ϵ > 0 arbitraire et considérons B(f (x0 ), ϵ) ⊂ E ′ . C’est une boule ouverte, donc
U = f −1 (B(f (x0 ), ϵ)) est un ouvert de E par hypothèse. Clairement x0 ∈ U , donc
il existe η > 0 tel que B(x0 , η) ⊂ U . Mais alors

f (B(x0 , η)) ⊂ B(f (x0 ), ϵ) ⇔ {N (x − x0 ) < η ⇒ N ′ (f (x) − f (x0 )) < ϵ}

ce qui est exactement la continuité de f en x0 .

Applications de ce principe :
— Soit a ∈ E et r > 0. Alors la boule ouverte B(a, r) est un ouvert. En effet,

B(a, r) = f −1 (] − ∞, r[)

et f : x 7→ N (x − a) est continue (x 7→ x − a est continue et la proposition


1.44 assure la continuité de N , par composition f est continue), tandis que
] − ∞, r[ est ouvert.
— Le complémentaire d’une boule fermée E \ B(a, r) est ouvert. En effet,

E \ B(a, r) = {x : N (x − a) > r} = f −1 (]r, +∞[)

où f est comme ci-dessus et ]r, +∞[ est ouvert.


Proposition 1.67. Soient N1 , N2 deux normes équivalentes sur un espace vecto-
riel E. Alors U est ouvert pour N1 si et seulement si U est ouvert pour N2 .

Démonstration. Au tableau. il l’est pour N2 . On notera B1,2 les boules dont le


rayon est mesuré à l’aide de N1,2 respectivement. Soit x ∈ U . Par hypothèse, il
existe r > 0 tel que
B1 (x, r) ⊂ U.
Or, par équivalence des normes il existe C > 0 tel que
1
N2 ≤ N1 ≤ CN2
C
En particulier, si y ∈ B2 (x, Cr ) alors
r
N1 (x − y) ≤ CN2 (x − y) < C = r.
C
Donc y ∈ B1 (x, r) et B2 (x, r/C) ⊂ B1 (x, r). Ainsi, B1 (x, r) est bien un ouvert
pour N2 .
La réciproque est évidente, il suffit d’échanger les rôles de N1 et N2 .
Corollaire 1.68. Sur E = Rp les ouverts pour les normes standard sont les
mêmes.
22 CHAPITRE 1. ESPACES VECTORIELS NORMÉS

Exemple 1.69. Soit E = R2 et

S = {(x, y) : a < x < b; c < y < d}.

Alors S est ouvert. Cela « se voit » sur un dessin, mais il est important de pouvoir
écrire une démonstration rigoureuse. Au tableau.

A = {(x, y) : a < x < b}, B = {(x, y) : c < x < d}

sont ouverts, car


A = π1−1 (]a, b[)
et π1 : (x, y) → x est continue car linéaire sur un espace de dimension finie (nous
l’avons déjà vu) tandis que ]a, b[ est ouvert. De même, B = π2−1 (]c, d[) est ouvert
pour les même raisons avec π2 : (x, y) → y continue. On conclut en notant que

S =A∩B

est l’intersection de deux ouverts.

Définition 1.70. Soit E un e.v.n. et A ⊂ E un sous-ensemble. On dit qu’un


sous-ensemble V ⊂ E est un voisinage de A, s’il existe un ouvert U ⊂ E tel que

A ⊂ U ⊂ V.

(Faire un dessin). On dit qu’un propriété P est vraie au voisinage de A s’il existe
une voisinage V de A tel que la propriété P est vraie sur V .

Remarques :
1. V n’est pas nécessairement ouvert.
2. Tout ouvert U qui contient A est un voisinage de A.
3. Tout ouvert U est un voisinage de chacun de ses points, puisque pour x ∈ U
il existe une boule ouverte B(x, ϵ) ⊂ U .
4. Soit r > 0. B(0, r) et B(0, r) sont des voisinages de 0.
5. f linéaire est continue si et seulement si elle est continue au voisinage de
0.

1.3.2 Ensembles fermés

Définition 1.71. On dit qu’un ensemble F ⊂ E est fermé si son complémentaire


E \ F est ouvert.

— Les ensembles ∅, E sont fermés.


1.3. TOPOLOGIE D’UN ESPACE VECTORIEL NORMÉ 23

— Toute boule fermée est fermée, car

B(a, r) = E \ (E \ B(a, r))

et E \ B(a, r) est ouvert comme on l’a vu.


— {x : d(x, a) ≥ r} est fermé, c’est le complémentaire de B(a, r) qui est
ouvert.

Proposition 1.72. Si F, G sont fermés dans E T alors F ∪G est encore fermé dans
E. Si (Fi )i∈I est une famille de fermés, alors i∈I Fi est fermé dans E.
En d’autres termes, une intersection quelconque de fermés est encore un fermé.
Une réunion finie de fermés est fermés.

Démonstration. Au tableau. qui sont ouverts. Alors

U ∩ V = {x ∈ E : x ∈
/ F et x ∈
/ G}

Si x ∈ F ∪ G, alors x ∈/ U ou x ∈
/ V . En particulier, x ∈
/ U ∩ V . Réciproquement,
si x ∈
/ U ∩ V , alors x ∈ F ∪ G. Ainsi,

F ∪ G = E \ (U ∩ V ).
Or, U ∩ V est ouvert comme intersection finie de deux ouverts. Donc F ∪ G est
bien fermé comme complémentaire d’un ouvert. Le résultat pour une union finie
en découle par une récurrence immédiate.
Enfin, soit Uj = E \ Fj ouvert. Alors
\ [
E\ Fi = {x : ∃j, x ∈
/ Fj } = {x : ∃j, x ∈ Uj } = Uj
i j

et cette dernière réunion est ouverte.

Nous allons voir qu’on peut caractériser les ensembles fermés à l’aide de la conver-
gence des suites, ce qui sera très utile en pratique.

Proposition 1.73. Pour qu’un ensemble F ⊂ E soit fermé, il faut et il suffit que
pour toute suite (xn )n∈N d’éléments de F qui converge vers une limite ℓ, on ait en
fait ℓ ∈ F .

Démonstration. Au tableau. de F . On veut montrer que ℓ ∈ F . Sinon, ℓ ∈ E \ F


qui est ouvert, et il existe ϵ > 0 tel que B(ℓ, ϵ) ⊂ E \ F . Mais par définition
de la convergence , il existe n0 ≥ 0 tel que si n ≥ n0 , on a xn ∈ B(ℓ, ϵ). Mais
alors xn ∈
/ F à partir du rang n0 , ce qui contredit le fait que (xn ) est une suite
d’éléments de F .
24 CHAPITRE 1. ESPACES VECTORIELS NORMÉS

Réciproquement, si toute suite convergente d’éléments de F converge dans F ,


montrons que F est fermé. Soit U = E \ F . On veut montrer que U est ouvert.
Soit donc ℓ ∈ U . Si U n’est pas ouvert, toute boule ouverte de rayon > 0 centrée
en ℓ n’est pas complètement incluse dans U . Par exemple, pour tout n−1 > 0 on
peut trouver un xn ∈ / U tel que d(xn , ℓ) < n−1 et xn ∈
/ U . Mais alors, xn ∈ F
n→+∞
pour tout n, et clairement xn −−−−→ ℓ. On devrait donc avoir ℓ ∈ F , c’est une
contradiction.

Exercice 1.74. Vérifier que [a, b], ] − ∞, a], [a, +∞[ sont des fermés de R.

" Un ensemble peut être à la fois ouvert et fermé, par exemple E, ∅ . Un ensemble
1
peut n’être ni ouvert, ni fermé : ]0, 1] par exemple. Cela se voit car n+1 est dans
[0, 1[ mais converge vers 0 ∈]0,
/ 1], donc F n’est pas fermé. Il n’est pas ouvert non
plus, car pour tout ϵ > 0, la boule B(1, ϵ) =]1 − ϵ, 1 + ϵ[ contient par exemple
1 + ϵ/2 ∈]0,
/ 1].

Définition 1.75. Soit A ⊂ E. On appelle adhérence de A, notée A, l’ensemble


def
A = {ℓ ∈ E : ∃(xn )n∈N suite de A telle que lim xn = ℓ}.
n→∞

Proposition 1.76. On a les propriétés suivantes :


(i)A ⊂ A.
(ii) A est fermé.
(iii) A est fermé si et seulement si A = A.

Démonstration. Soit a ∈ A. Prendre xn = a ∈ A : cette suite constante et converge


vers a donc a ∈ A.
def
Pour montrer que A est fermé, soit y ∈ U = E \ A. Si U n’est pas ouvert, pour
tout ϵ = n−1 > 0 on peut trouver xn ∈ / U tel que d(xn , y) < n−1 . Clairement ceci
n→+∞
nous dit que xn −−−−→ y. Or xn ∈ / U ⇔ xn ∈ A. Par définition de l’adhérence,
k→∞
il existe donc une suite (xn,k )k∈N de A telle que xn,k −−−→ xn . En particulier, on
peut trouver un k = k(n) tel que N (xn − xn,k(n) ) < n−1 . La suite yn = xn,k(n) est
bien une suite de A et elle converge vers y, car
2
N (yn − y) < N (yn − xn ) + N (xn − y) < .
n
Par définition de l’adhérence, on doit donc avoir y ∈ A : c’est une contradiction
car y ∈
/ A. Finalement, A est bien fermé.
Pour (iii) on note que si A = A, alors A est fermé puisqu’on vient de voir que A
est fermé. Reste la réciproque : mais si A est fermé, toute suite de A qui converge,
converge dans A. Cela signifie que A ⊂ A. On conclut avec (i) pour l’inclusion
inverse.
1.4. EXCURSIONS EN DIMENSION INFINIE 25

Finissons cette section par une caractérisation des fonctions continues :

Théorème 1.77. (Caractérisation topologique des fonctions continues). Soit f :


E → E ′ une application entre espace vectoriels normés. Les propositions suivantes
sont équivalentes :
(i) f est continue.
(ii) Pour tout ouvert V ⊂ E ′ , l’image réciproque f −1 (V ) est un ouvert de E.
(iii) Pour tout fermé F ⊂ E ′ , l’image réciproque f −1 (F ) est un fermé de E.

Démonstration. Au tableau.

1.4 Excursions en dimension infinie


Commençons par un exemple avec une série de fonctions.

Exemple 1.78. Un exemple important, en dimension infinie. Soit C l’espace vec-


toriel des fonctions continues sur R+ muni de la norme sup :

∥f ∥∞ = sup |f |
R

1
Posons vk (x) = x2 +k2
. On considère la série de fonctions
X X 1
vk (x) = .
k≥1 k≥1
x2 + k2

Il est clair que chaque vk est continue. De plus,


1
∥vk ∥∞ ≤ .
k2
P −2
Or, la série k est convergente par Riemann. Ainsi, la série de fonctions ci-
dessus est normalement convergente sur R puisque

X
∥vk ∥∞ < ∞.
k=1

Puisque la convergence normale implique la convergence uniforme (Analyse 3), la


série de fonctions converge uniformément sur R vers une fonction u, continue sur
R. Mais la convergence uniforme est précisément la convergence pour la norme
∥ · ∥∞ dans l’espace vectoriel normé C, puisque
n +∞
X 1 X 1 n→+∞
u− = −−−−→ 0.
k=1
x + k2
2
k=n+1
x2 + k2
∞ ∞
26 CHAPITRE 1. ESPACES VECTORIELS NORMÉS

Ainsi, on peut dire par exemple que la suite de fonctions de C


n
X 1
un (x) =
k=1
x2 + k2

converge dans C pour la norme ∥ · ∥∞ .

Nous pouvons remarqué que les définitions de normes, de continuité, d’ouverts,


de fermés... ne dépendent pas de la dimension de l’espace vectoriel considéré.
Récapitulons quelques résultats qui, eux, dépendent du fait que la dimension est
finie. Par exemple :
1. Une application linéaire entre espaces de dimension finie (munie d’une
norme standard) est continue (Proposition 1.55).
2. Toute suite bornée de R admet une sous-suite convergente (c’est le théo-
rème de Bolzano-Weierstrass, chapitre 2 d’Analyse 2). Ce théorème se gé-
néralise facilement à Rp : si (Xn )n∈N = (x1,n , . . . , xp,n ) est une suite de Rp
bornée (disons pour la norme ∞, mais par équivalence ceci sera vrai pour
les autres normes standard), on a par définition
∃M > 0, ∀n ∈ N, ∥Xn ∥∞ ≤ M
Ainsi, chaque coordonnée est une suite réelle bornée, et on peut donc par
Bolzano-Weierstrass extraire une sous-suite convergente de chacune des
suites coordonnées, ce qui donnera un vecteur convergent dans Rp .
Il se trouve que ceci n’est plus nécessairement vrai en dimension infinie.
Exemple 1.79. Soit E = R[X]. On pose, pourP un polynôme quelconque,
def
∥P ∥ = max{|a|, a coefficient de P }
Il est clair que ∥P ∥ ≥ 0 et que ∥P ∥ = 0 ssi tous ses coefficients sont nuls, c’est
à dire ssi P = 0. L’égalité ∥λP ∥ = |λ|∥P ∥ est directe. Enfin, pour P, Q avec par
exemple n = deg(P ) ≥ deg(Q), notons ai les coefficients de P , bi les coefficients
de Q (si deg P > deg Q, on pose bi = 0 pour i = deg Q + 1, . . . , deg P ). On a alors
∥P + Q∥ = max |ai + bi | ≤ max |ai | + |bi |
1≤i≤n i

≤ max |ai | + max |bj | = ∥P ∥ + ∥Q∥.


i j

On a donc bien une norme. Considérons maintenant l’application dérivée


D : P 7→ P ′
C’est une application linéaire, et l’on va montrer qu’elle n’est pas continue en
montrant que l’équation (1.2) n’est pas vérifiée. Pour cela, on considère la suite
(Pn ) = (X n )n≥1 . Cette suite est bornée, car
∀n, ∥X n ∥ = 1.
1.4. EXCURSIONS EN DIMENSION INFINIE 27

Par contre, ∥D(X n )∥ = ∥nX n−1 ∥ = n. Si D était continue, on aurait l’existence


d’un C > 0 tel que
∀P ∈ R[X], ∥D(P )∥ ≤ C∥P ∥
En prenant la suite (X n ) , on aurait donc

∀n ∈ N, n≤C ×1

C’est évidemment absurde comme on le voit en faisant n → ∞. L’application


linéaire D n’est pas continue !

Enfin, un dernier exemple :


R1
Exemple 1.80. Soit L = {f ∈ C 0 ([0, 1])} muni de la norme ∥f ∥1 = 0
|f |. Alors,
la suite (fn : x 7→ xn )n∈N est une suite bornée, car
Z 1
1
∥fn ∥1 = xn dx =
0 n+1

Cette suite converge donc vers la fonction nulle pour la norme ∥ · ∥1 .


Mais si l’on prend ∥·∥∞ , cette suite de fonctions est toujours bornée, et si Bolzano-
Weierstrass était vrai dans ce cadre, on s’attendrait à ce qu’une sous-suite de (fn )
converge pour la norme ∥ · ∥∞ vers une fonction limite f ∈ L. C’est bien sûr faux,
car nous avons vu au premier semestre qu’une telle fonction f serait continue à
cause de la convergence uniforme (toutes les fn sont continues). Or, la convergence
uniforme implique la convergence simple, et toute sous-suite fnk (x) = xnk converge
simplement lorsque k → ∞ vers la fonction non continue
(
0 si x ̸= 1
f˜(x) =
1 si x = 1

ce qui aboutit à une contradiction. Le théorème de Bolzano-Weierstrass n’est plus


vrai (tel quel) en dimension infinie !
28 CHAPITRE 1. ESPACES VECTORIELS NORMÉS
Chapitre 2

Différentiabilité dans Rn

2.1 Introduction
Ce chapitre ne traitera que de fonction à variables réelles. Soit f : R → R une
fonction. On rappelle que f est dérivable au point a ∈ R si le taux d’accroissement
en a admet une limite :
f (a + h) − f (a)
lim = f ′ (a) ∈ R.
h→0 h
On appelle nombre dérivé de f en a, le nombre f ′ (a). Lorsque f est dérivable sur
un intervalle I ⊂ R, ceci permet de définir la fonction dérivée, qui est la fonction
qui à a associe le nombre dérivé f ′ (a) :
(
′ I→R
f :
a 7→ f ′ (a).

On aimerait généraliser cette formule pour des applications f : Rn → Rp (pas


forcément des applications linéaires), et même, encore plus généralement, pour f :
E → F entre espaces vectoriels normés (pas néccessairement de dimensions finie).
La formule ci-dessus du taux d’accroissement présente un problème immédiat : si
h ∈ Rn ou h ∈ E, diviser par h n’a pas de sens !
La bonne manière de s’en sortir est d’écrire plutôt un développement limité au
lieu d’un taux d’accroisement :
h→0
f (a + h) = f (a) + f ′ (a)h + hε(h), ε(h) −−→ 0.
La généralisation recherchée s’exprime alors de la manière suivante : soit E, F deux
espaces vectoriels normés sur K, et U ⊂ E un ouvert. On dira qu’une application
f : U → F est différentiable au point a ∈ U s’il existe une application linéaire
L : E → F ou L ∈ L(E, F ) telle que
f (a + h) = f (a) + L.h + r(h), (2.1)

29
30 CHAPITRE 2. DIFFÉRENTIABILITÉ DANS Rn

où le reste r(h) ∈ F vérifie


∥r(h)∥F h→0
−−→ 0. (2.2)
∥h∥E
On appelle l’application L la différentielle de f au point a. Cette application
dépend donc de a, on notera parfois L = La pour insister sur cette dépendance.
Cette définition appelle plusieurs commentaires importants.
1. Pour insister sur la linéarité, nous choisirons souvent d’écrire L.h, ou même
Lh. Ce qu’il faut bien entendu réaliser, c’est que l’application L : h 7→ L(h)
est linéaire : L(αh + β h̃) = αL(h) + βL(h̃). En particulier, si E = Rn et
F = Rp , L peut être vue comme une matrice, et tous les outils de l’algèbre
linéaire seront disponibles.
2. Le reste r : E → F n’est pas une application linéaire en général. Vous
aurez remarqué que l’équation (2.2) est une écriture de o(h) dans un e.v.n. :
effet, r(h) est négligeable devant h, lorsqu’on mesure les vecteurs à l’aide
des normes.
3. La définition d’une fonction différentiable est compatible avec le cas des
fonctions à une variable. En effet, le module joue le rôle de norme, et une
application linéaire K → K est simplement la donnée d’un scalaire ℓ, de
sorte qu’elle s’écrive h 7→ ℓh. Ce scalaire est précisément le nombre f ′ (a).
4. Il est important de lire l’équation (2.1) comme une fonction de h, c’est à
dire en pensant à h comme une variable. Comme pour les développements
limités, cette équation prendra tout son intérêt lorsque h → 0 (maintenant
au sens de la norme dans E), puisqu’en dehors de cette limite, on ne sait
rien a priori sur le reste r. Lorsque h varie dans une petite boule autour de
0, on a donc
f (a + h) = f (a) + La .h + reste(h)
ou encore, en posant h = x − a,

f (x) = f (a) + La .(x − a) + reste(x − a).

Nous pouvons maintenant insister sur l’idée fondamental du calcul diffé-


rentiel :

Valeur de la fonction en x proche de a = (valeur de la fonction en a)


+ (terme linéaire en le déplacement x − a)
+ (petit terme correctif).

5. Enfin, si l’on dispose d’une « formule » qui donne f , par exemple, f (x, y) =
. . . pour une fonction de R2 → R, y a-t-il une formule qui permette de
calculer la différentielle, comme nous disposions de formules pour dériver
les fonctions usuelles d’une variable ?
2.2. DÉRIVÉES PARTIELLES 31

Définition 2.1. Soit E, F deux e.v.n., h ∈ E et r : E → F . Nous écrirons que


r = o(∥h∥), ou plus simplement r = o(h), si

∥r(h)∥F
lim = 0K .
h→0 ∥h∥E

On pourrait également écrire

r(h) = ∥h∥ ε(h),

où ε : E → F vérifie
h→0E E h→0
ε(h) −−−→ 0F ⇔ ∥ε(h)∥F −−−→ 0K .

On dira, comme pour le cas d’une variable réelle, que r(h) est « un petit o de
h », c’est à dire que r(h) est négligeable devant h, ou encore que r(h) est un reste
d’ordre h.
Plus généralement, on dira que r est un reste d’ordre N , ou encore r = o(∥h∥N ),
si
∥r(h)∥F
lim = 0K
h→0 (∥h∥E )N

" Ne pas confondre les notation o et O :

Définition 2.2. Soit E, F deux e.v.n., A ⊂ E et f : E → F . Soit N ≥ 1 un


entier, on dira que f : E → F est un grand O de ∥h∥N sur A s’il existe une
constante C ≥ 0 telle que

∀h ∈ A, ∥f (h)∥F ≤ C (∥h∥E )N

Remarque 2.3. Si A = E, l’application f est automatiquement continue dès que


f = O(∥h∥).
Remarque 2.4. Soit A = E, ou encore soit A contenant un voisinage de 0. Si N ≥ 2
et f = O(∥h∥N ) alors f = o(∥h∥). En effet,

∥f (h)∥ ∥h∥N h→0


≤C = C∥h∥N −1 −−→ 0.
∥h∥ ∥h∥

2.2 Dérivées partielles


On munit Rn de la norme ∥x∥ = ∥x∥∞ = sup1≤i≤n |xi |. La boule ouverte de centre
a = (a1 , . . . , an ) et de rayon r > 0 pour cette norme vaut donc
n
Y
B(a, r) = {x ∈ Rn : ∥x − a∥ < r} = ]ai − r, ai + r[.
i=1
32 CHAPITRE 2. DIFFÉRENTIABILITÉ DANS Rn

Si U est un ouvert de Rn et a ∈ U , il existe r > 0 tel que B(a, r) ⊂ U (faire un


dessin). On définit l’application
(
]ak − r, ak + r[→ Rn
αk :
t 7→ αk (t) = (a1 , . . . , ak−1 , t, ak+1 , . . . , an )

On a que ∀t ∈]ak − r, ak + r[ on a αk (t) ∈ B(a, r) ⊂ U .

Définition 2.5. Soit U un ouvert de Rn et f : U → R, a ∈ U . On dit que


f admet une dérivée partielle au point a par rapport à la k-ième variable si la
fonction d’une variable
(
]ak − r, ak + r[→ R
t 7→
f ◦ αk (t) = f (a1 , . . . , ak−1 , t, ak+1 , . . . , an )

est dérivable en t = ak . Sa dérivée se note


∂f
(a)
∂xk
Si la dérivée partielle par rapport à la k-ième variable existe pour tout x ∈ U , on
note (
∂f U 7→ R
: ∂f
∂xk x 7→ ∂x (x)
k

la fonction donnée par la dérivée par rapport à xk .


Notation : on écrira parfois
∂f
∂ xk f = .
∂xk
En pratique : on fixe toutes les variables, sauf celle par rapport laquelle on
veut calculer les dérivées partielles. On est ramené au calcul de la dérivée d’une
fonction d’une variable réelle.

Exemple 2.6. Soit f (x, y, z) = yz x définie sur U = {(x, y, z) : z > 0}. Notez
que c’est bien un ouvert : une manière rapide et rigoureuse de le montrer est
d’observer que U est l’image réciproque d’un ouvert par une fonction continue :
U = π3−1 (]0, +∞[) où π3 (x, y, z) = z est clairement continue comme on l’a vu.

— Calcul de ∂f∂y
en (x0 , y0 , z0 ) : on considère y 7→ yz0x0 et on calcule sa dérivée
en y = y0 . On obtient
∂y f (x0 , y0 , z0 ) = z0x0 .
— Calcul de ∂f∂z
en (x0 , y0 , z0 ) : on considère z 7→ y0 z x0 et on calcule sa dérivée
en z = z0 . On obtient

∂z f (x0 , y0 , z0 ) = y0 x0 z0x0 −1 .
2.3. DIFFÉRENTIABILITÉ 33

— Calcul de ∂f∂x
en (x0 , y0 , z0 ) : on considère x 7→ y0 z0x = y0 ex log(z0 ) et on
calcule sa dérivée en x = x0 . On obtient

∂x f (x0 , y0 , z0 ) = y0 log z0 ex log z0 = y0 (log z0 )z0x0 .

Soit un ouvert U ⊂ Rn , f : U → Rp notée

x 7→ f (x) = (f1 (x), . . . , fp (x)), x = (x1 , . . . , xn ).

On peut considérer chaque fonction fi : U → R et, si elles existent, les dérivées


∂fi
partielles ∂xj
.

Définition 2.7. On dit que f : U → Rp est de classe C 1 si pour tout i =


∂fi
1 . . . p, pour tout j = 1 . . . n, les dérivées partielles ∂xj
existent, et si les fonctions
(
U →R
sont continues, pour tout 1 ≤ i ≤ p et 1 ≤ j ≤ n.
x 7→ ∂xj fi

Exemple 2.8. (i) On vérifie que les dérivées partielles de la fonction f de l’exemple
précédent sont continues sur U = {(x, y, z) : z > 0}. Donc f est C 1 sur U .
(ii) Soit f : R2 → R définie par f (x, y) = x2xy
+y 2
si (x, y) ̸= (0, 0) et f (0, 0) = 0.
1 2
Alors, f est C sur R \ {(0, 0)}. En effet, en dehors de zéro, on caclule

∂f y0 2x20 y0 ∂f x0 2y02 x0
(x0 , y0 ) = 2 − , (x0 , y0 ) = 2 − .
∂x x0 + y02 (x20 + y02 )2 ∂y x0 + y02 (x20 + y02 )2

et ces fonctions de (x0 , y0 ) sont continues en dehors de (0, 0).


Le cas (0, 0) nécessite une étude particulière puisque les formules ne s’appliquent
pas directement : au tableau.

Exercice 2.9. En considérant f (x, tx), redémontrer que f n’est pas continue à
l’origine.

2.3 Différentiabilité
Nous pouvons faire maintenant le lien avec l’introduction et la notion de différen-
tielle.

Théorème 2.10. (Différentiabilité des fonctions C 1 à valeur dans R) Soit U un


ouvert de Rn , f : U → R une fonction de classe C 1 , a ∈ U . Il existe r > 0 ainsi
qu’une fonction ε : B(0, r) → R continue en 0 qui vérifie ε(0) = 0, telle que
n
X ∂f
∀h ∈ B(0, r), f (a + h) = f (a) + (a)hj + ∥h∥ε(h).
j=1
∂x j
34 CHAPITRE 2. DIFFÉRENTIABILITÉ DANS Rn

En particulier, f est différentiable en a et sa différentielle (en a) est l’application


La : Rn → R donnée par
 
n
X ∂f h 1
h 7→ La h = (a)hj = (∂x1 f (a), . . . , ∂xn f (a))  ...  ∈ R.
 
j=1
∂xj
hn

L’écriture de la dernière équation est un produit matriciel entre une matrice ligne
et un vecteur colonne.
r→0
Remarque 2.11. Puisque la fonction ε est continue en 0, elle vérifie ε(r) −−→
ε(0) = 0.
Comme noté ci-dessus, on peut voir l’application linéaire La comme une matrice
à une ligne et n colonnes. Ceci suggère la définition suivante :
Définition 2.12. Soit U un ouvert de Rn , f : U → R une fonction de classe C 1 ,
a ∈ U . On appelle gradient de f en a la matrice colonne
 ∂f 
∂x1
(a)
∇f (a) =  ..
 ∈ Mn,1 (R).
 
.
∂f
∂xn
(a)

On identifiera souvent, comme en algèbre linéaire, Mn,1 (R) ≃ Rn et on considèrera


le gradient comme un vecteur (colonne). Avec cette identification, la différentielle
La peut par exemple s’écrire à l’aide du produit scalaire euclidien :

La h = ⟨∇f (a), h⟩.

Avec le produit matriciel, on a également

La h = (t ∇f (a)).h,

où t ∇f (a) est la transposée de la matrice colonne ∇f (a).

Démonstration. On rappelle que la norme choisie est la norme sup. Choisissons


r > 0 assez petit de sorte que B(a, r) ⊂ U . Alors, ∀h ∈ B(0, r), on a a + h ∈
B(a, r) ⊂ U .
Nous allons faire la démonstration dans le cas n = 2, la généralisation ne pose pas
de problème particulier pour n ≥ 3.
notons x = (x1 , x2 ) et a = (a1 , a2 ), h = (h1 , h2 ). Nous devons démontrer la
propriété suivante : ∀ϵ > 0, ∃η > 0 tel que ∀h ∈ B(0, η),

|f (a + h) − f (a) − ∂x1 f (a)h1 − ∂x2 f (a)h2 | ≤ ϵ∥h∥.

En effet, la fonction dans la valeur absolue est continue par hypothèse, et l’équation
ci-dessus exprime exactement que c’est un o(∥h∥).
2.3. DIFFÉRENTIABILITÉ 35

Notons f (x) = f (x1 , x2 ) puis


f (a1 + h1 , a2 + h2 ) − f (a1 , a2 ) = f (a1 + h1 , a2 + h2 ) − f (a1 , a2 + h2 )
+ f (a1 , a2 + h2 ) − f (a1 , a2 )
= I + II.
Considérons le terme II. La fonction h2 → f (a1 , a2 + h2 ) − f (a1 , a2 ) est, à (a1 , a2 )
fixés, une fonction dérivable (même C 1 ) de h2 , de dérivée ∂x2 f . Nous pouvons
donc écrire que ∀ϵ > 0, ∃η > 0 tel que
ϵ ϵ
|h2 | < η ⇒ |f (a1 , a2 + h2 ) − f (a1 , a2 ) − ∂x2 f (a1 , a2 )h2 | < |h2 | < ∥h∥.
2 2
Considérons le terme I. À h2 fixé, l’application h1 7→ f (a1 +h1 , a2 +h2 )−f (a1 , a2 +
h2 ) est dérivable sur ]−r, r[ et continue sur [−r, r] puisque f est supposée de classe
C 1 . Par le théorème des accroissements finis, il existe θ(h1 , h2 ) vérifiant |θ| ≤ |h1 |
tel que
f (a1 + h1 , a2 + h2 ) − f (a1 , a2 + h2 ) = ∂x1 f (a1 + θ, a2 + h2 ).h1
∂f
Or, par hypothèse, (x1 , x2 ) → ∂x1
(x1 , x2 ) est continue. Par continuité en a, on a
donc pour tout ϵ > 0 l’existence d’un η > 0 tel que si ∥k∥ < η alors
ϵ
|∂x1 f (a1 + k1 , a2 + k2 ) − ∂x1 f (a1 , a2 )| < .
2
Maintenant, prenons k = (θ(h1 , h2 ), h2 ) avec |h2 | < η et |h1 | < η. On a donc bien
∥k∥ < η . En combinant les deux équations précédentes, on obtient
|f (a + h) − f (a) − ∂x1 f (a)h1 − ∂x2 f (a)h2 |
≤ |f (a1 , a2 + h2 ) − f (a1 , a2 ) − ∂x2 f (a1 , a2 )h2 |
+|f (a1 + h1 , a2 + h2 ) − f (a1 , a2 + h2 ) − ∂x1 f (a1 , a2 + h2 )h1 |
ϵ
≤ ∥h∥ + |(∂x1 f (a1 + θ, a2 + h2 ) − ∂x1 f (a1 , a2 + h2 ))h1 |
2
ϵ ϵ
≤ ∥h∥ + ∥h∥ = ϵ∥h∥.
2 2

Ce résultat s’étend facilement aux fonctions f = (f1 , . . . , fp ) : Rn → Rp avec


p ≥ 1.
Corollaire 2.13. Soit U un ouvert de Rn , f : U → Rp une application de classe
C 1 . Il existe pour tout a ∈ U un r > 0 et des fonctions continues ϵi : B(0, r) → R
vérifiant ϵi (0) = 0 telles que l’on ait
n
X ∂fi
∀i = 1 . . . p, fi (a + h) = fi (a) + (a)hj + ∥h∥ϵi (h).
j=1
∂xj

En particulier, la fonction f est continue sur U .


36 CHAPITRE 2. DIFFÉRENTIABILITÉ DANS Rn

Démonstration. Il suffit d’appliquer le théorème précédent à chaque composante


fi de f . En particulier,
n
X ∂fi
|fi (a + h) − fi (a)| ≤ (a)hj + ∥h∥|ϵi (h)|
j=1
∂xj
≤ M ∥h∥
pour un certain M ≥ 0 qui dépend de f et de a. La continuité de f en a en découle
immédiatement.
Définition 2.14. On appelle matrice jacobienne de f en a la matrice Jf (a) ∈
Mp,n (R) donnée par
 ∂f1 ∂f1 ∂f1

  ∂x1 ∂x2
... ∂xn
∂fi  .. . .. 
Jf (a) = (a) = . .. . 
∂xj 1≤i≤p
∂fp ∂fp ∂fp
1≤j≤n
∂x1 ∂x2
... ∂xn
 ∂f1 
∂xj
La j-ème colonne Jf (a) est  ...  ∈ Mp,1 (R). On pose
 
∂fp
∂xj
 ∂f1 
∂xj
∂f
=  ...  .
 
∂xj ∂fp
∂xj

Avec ces notations, il est aisé d’utiliser


  les produits matriciels. Pour cela, on consi-
h1
dère par convention que h =  ...  ∈ Rn ≃ Mn,1 (R). On remarque alors que
 
hn
 
n h 1
X ∂fi 
∂fi ∂fi

 .. 
hj = ∂x . . . ∂xn  . 
j=1
∂xj 1
hn
 
h1
est la i-ème composante du vecteur Jf (a).h = Jf (a)  ...  ou encore la ième
 
hn
Pn ∂f (a)
composante de la combinaison linéaire j=1 ∂xj hj ∈ Rp . On peut donc écrire, si
f est de classe C 1 sur U à valeurs dans Rp ,
f (a + h) = f (a) + Jf (a).h + ∥h∥ϵ(h)
n
X ∂f
= f (a) + hj + ∥h∥ϵ(h)
j=1
∂xj
2.3. DIFFÉRENTIABILITÉ 37
 
ϵ1 (h)
où l’on gardera bien à l’esprit que ϵ(h) =  ...  est une fonction de B(0, r) →
 
ϵp (h)
R (donc à p composantes), vérifiant ϵ(0) = 0 ∈ Rp . Cette propriété permet de
p

généraliser la notion de fonction de classe C 1 .

Définition 2.15. Soit U un ouvert de Rn , f : U → Rp et a ∈ U . On dit que f est


différentiable en a si il existe une matrice A ∈ Mp,n (R), r > 0 et ϵ : B(0, r) → Rp
une fonction continue vérifiant ϵ(0) = 0, telle que

f (a + h) = f (a) + A.h + ∥h∥ϵ(h), ∀h ∈ B(0, r).

On dit que A est la différentielle de f en a. On la note parfois A = Df (a) ou


encore dfa .

Remarques :
• Le théorème précédent et son corollaire montre que si f est C 1 sur U , alors f
est différentiable en tout point a ∈ U et sa différentielle en a est précisément la
matrice jacobienne A = Jf (a).
• Si f est différentiable en a, alors
 fadmet des dérivées partielles en a : si on
h1
 0 
applique la définition avec h =   on trouve que
..
.
 
1
f (a1 + h, a2 , . . . an ) − f (a1 , . . . an ) = h1 .A  0  + h1 ϵ(h1 ).
 
..
.

Ainsi la fonction h1 7→ f (a1 + h, a2 , . . . an ) est dérivable en h1 = 0 et sa dérivée


est  
1
∂f  0 
(a1 . . . , an ) = A   ,
∂x1 ..
.
soit la première colonne de A. On obtient la réciproque du point précédent : si f
est différentiable en a, sa différentielle est donnée par la matrice jacobienne Jf (a).
• Par contre, il se peut que les dérivées partielles de f en un point donné a
existent, sans que f soit différentiable en a. En effet, on a vu que la différentiabilité
impliquait la continuité (corollaire 2.13). Or, nous avons vu que la fonction f :
R2 → R définie par
(
xy
2 2 si (x, y) ̸= (0, 0)
f (x, y) = x +y
f (0, 0) = 0.
38 CHAPITRE 2. DIFFÉRENTIABILITÉ DANS Rn

admet des dérivées partielles en a = (0, 0) mais qu’elle n’est pas continue en (0, 0) :

"f admet des dérivées partielles ⇏ f différentiable

• La différentielle en a d’une application f : Rn → Rp est bien donnée par une


application linéaire
Df (a) ∈ L(Rn , Rp ),
dont la matrice dans la base canonique est la matrice jacobienne Jf (a). L’applica-
tion différentielle de f est, lorsqu’elle est définie, l’application a 7→ Df (a) : c’est
une application de Rn à valeurs dans L(Rn , Rp ).
 
y cos(x)
Exemple 2.16. (i) Soit f (x, y) = de R2 dans R2 . Cette application
x sin(y)
est clairement C 1 . Calculons sa différentielle en (0, 0). C’est une matrice 2 par 2,
puisque f : R2 → R2 . On trouve, en un point (x, y) quelconque,
 
−y sin x cos x
Df = .
sin y x cos y
En particulier,  
0 1
Df (0) = .
0 0
D’après ce qui précède, on a donc
    
0 0 1 h1
f (h1 , h2 ) = + + o(h)
0 0 0 h2
 
h2
= + o(h).
0

(ii) Différentielle de l’identité. Soit Id : Rn → Rn l’application identité. Écrivons


simplement
Id(X + h) = X + h = X + Id .h + o(h)
où l’on a en fait o(h) = 0. On trouve que
 
1 ... 0
D Id =  ... . . . ...  = Id .
 
0 ... 1

D’après la définition 2.15, la différentielle de l’application identité est donc l’iden-


tité (vue comme application linéaire L(Rn , Rn ).
(iii) Différentielle des projections canoniques. Soit
(
R2 → R
π1 :
(x, y) 7→ x.
2.4. CALCULS DES DÉRIVÉES PARTIELLES 39

Sa différentielle est donc une application linéaire de R2 dans R. En coordonnées,


c’est une matrice à une ligne et 2 colonnes. On calcule
 
 h1
π1 (x + h1 , y + h2 ) = x + h1 = x + 1 0 +0
h2
d’où on tire 
Dπ1 (x, y) = 1 0 .
On remarque que cette différentielle ne dépend pas du point (x, y). Comme cette
application est C 1 , elle est différentiable et l’on pourrait calculer sa différentielle
en calculant sa matrice jacobienne. Faisons-le pour π2 (x, y) = y : par le corollaire
2.13 et la définition qui suit,
 
Dπ2 (x, y) = ∂π ∂π2
2

∂x ∂y = 0 1 .

(iv) S oit p ≥ 2 et (
R → Rp
Q:
x 7→ (1, x1 , . . . , xp−1 )
Sa différentielle est une matrice de Mp,1 (R). Comme cette application est claire-
ment C 1 , on calcule facilement sa matrice jacobienne :
 
0

 1 

JQ (x) = 
 2x .

 .. 
 . 
p−2
(p − 1)x

2.4 Calculs des dérivées partielles


2.4.1 Somme et produit
Soient U ⊂ Rn un ouvert et f, g : U → Rp . Si ∂xj f et ∂xj g existent au point a,
alors f + g admet une dérivée partielle par rapport à la jème variable en a, et
∂(f + g) ∂f ∂g
(a) = (a) + (a).
∂xj ∂xj ∂xj

Lorsque p = 1, c’est à dire que les fonctions sont à valeur dans R, on peut définir le
produit f g. Si ∂xj f et ∂xj g existent au point a, alors f g admet une dérivée partielle
par rapport à la jème variable en a, qui est donnée par la règle de Leibniz :
∂ ∂f ∂g
(f g)(a) = (a)g(a) + f (a) (a).
∂xj ∂xj ∂xj

Les vérifications de ceci ne présentent pas de difficulté particulière et sont laissées


au lecteur.
40 CHAPITRE 2. DIFFÉRENTIABILITÉ DANS Rn

2.4.2 Composition de fonctions C 1 .


Si f et g sont des fonctions dérivables d’une variable réelle, on a la très importante
règle de la chaîne :
(g ◦ f )′ (a) = g ′ (f (a)).f ′ (a)
Il s’agit de généraliser cette formule aux fonctions de plusieurs variables.

Théorème 2.17. Soit U un ouvert de Rn , f : U → Rp une fonction de classe


C 1 sur U . Soit V un ouvert de Rp , g : V → Rq une fonction de classe C 1 sur V .
Supposons que f (U ) ⊂ V . Alors g ◦ f : U → Rq est de classe C 1 , et

∀a ∈ U, Jg◦f (a) = Dg(f (a)).Df (a) (= Jg (f (a)).Jf (a)).

Remarquons que Jf (a) ∈ Mp,n (R) et Jg (a) ∈ Mq,p (R) donc le produit des matrices
différentielles a bien un sens. Or nous savons qu’un produit de matrices correspond
à la composée des applications linéaires représentées par ces mêmes matrices : la
différentielle d’une fonction composée est donc la composée des différentielles.
C’est de cette propriété que la règle de la chaîne tire son nom.

" Pour D(g ◦ f )(a), la différentielle de g est évaluée au point f (a) !


On retient parfois le théorème précédent de la manière suivante, un peu moins
correcte : « la différentielle d’une composée est le produit des différentielles » , le
produit s’entendant comme le produit des matrices jacobiennes. Encore une fois,
il est de la plus haute importance de prendre garde au point auquel sont calculées
les matrices jacobiennes avant d’effectuer le produit matriciel.

Démonstration. On calcule directement :

g(f (a + h)) = g(f (a) + Df (a)h + ∥h∥ϵf (h))


= g(f (a) + h̃)
= g(f (a)) + Dg(f (a)).h̃ + ∥h̃∥ϵg (h̃)
= g(f (a)) + Dg(f (a).Df (a).h + Dg(a)(∥h∥ϵf (h)) + ∥h̃∥ϵg (h̃)

h→0 h→0
où h̃ = Df (a)h + ∥h∥ϵf (h)) −−→ 0. En particulier, on a bien ϵg (h̃) −−→ 0 et donc
on peut écrire
ϵg (h̃) = ϵ(h).
D’autre part, d’après la proposition 1.60,

∥h̃∥ ≤ N (Dg(f (a))∥h∥ + ∥h∥∥ϵf (h)∥


≤ ∥h∥(N (Dg(f (a)) + ϵf (h))
≤ C∥h∥,
2.5. DÉRIVÉE DIRECTIONNELLE 41

où la constante C dépend de f, g et a. Enfin, il est clair que

Dg(a)(∥h∥ϵf (h)) = ∥h∥Dg(a)(ϵf (h))


= o(h).
h→0
En effet, ϵf (h) −−→ 0 et Dg(f (a)) est une application linéaire en dimension finie,
qui est automatiquement continue donc bornée. En résumé, nous avons vérifié que

∥h̃∥ϵg (h̃) = o(h),

ce qui termine la démonstration.


Une autre manière de le voir est de noter que la ième composante gi (f ) est une
fonction Rn → R , et qu’un calcul similaire à ce qui précède donne
p
∂ X ∂gj ∂fk
gi (f (x))|x=a = (f (a)) (a).
∂xj k=1
∂yk ∂xj

C’est bien le coefficient de Jg (f (a)).Jf (a) à l’intersection de la ième ligne et de la


jème colonne.
Exemple 2.18. Soit g(x, y) = x + y 2 et f (x, y) = (cos(x), cos(y)). Alors

(g ◦ f )(x, y) = cos(x) + cos2 (y).

On calcule 
Dg ◦ f = − sin x −2 cos y sin y ,
c’est bien une matrice de M1,2 (R). Retrouvons ce résultat grâce à la règle de la
chaîne. D’une part,  
− sin x 0
Df =
0 − sin y
D’autre part, 
Dg = 1 2y
Puis

D(g ◦ f )(x, y) = Dg(cos x, cos y).Df (x, y)


 
 − sin x 0
= 1 2 cos y
0 − sin y

= − sin x −2 cos y sin y .

2.5 Dérivée directionnelle


Cette section est une manière un peu plus géométrique d’aborder la notion de
dérivée partielle, mais vous noterez que l’on reste dans l’esprit de la section 2.2.
42 CHAPITRE 2. DIFFÉRENTIABILITÉ DANS Rn

Soit v ∈ Rn un vecteur non nul. Le vecteur v engendre un sous-espace vectoriel de


Rn de dimension 1, {tv, t ∈ R}. On dit que l’espace V est une droite vectorielle,
de direction v. Notons que pour tout vecteur v ′ non nul colinéaire à v, V est aussi
une droite vectorielle de direction v ′ .
Soit f : Rn → R une application différentiable et x ∈ Rn fixé. Lorsque t parcourt
R, x + tv parcourt la droite passant par x et de direction v. Les vecteurs x et v
étant fixés, on peut former la fonction d’une seule variable t 7→ f (x + tv). Cette
fonction est définie sur R, puisque nous avons supposé que f est définie sur Rn .

Définition 2.19. Soit f : Rn → R, x ∈ Rn et v ∈ Rn . On dit que la fonction f


est dérivable dans la direction v au point x si l’application fx,v : t 7→ f (x + tv)
définie sur R est dérivable en t = 0.
Si, pour tout x ∈ Rn , f est dérivable dans la direction v ∈ Rn au point x , on
appelle dérivée directionnelle de f dans la direction v la fonction
(
Rn → R

x 7→ dtd t=0 f (x + tv) = fx,v (0).

Proposition 2.20. Soit f : Rn → R une application différentiable et x ∈ Rn .


Alors f est dérivable dans toutes les directions au point x. Plus précisément, en
notant dfx la différentielle de f au point x et v ∈ Rn , on a

d
f (x + tv) = dfx (v) ∈ R.
dt t=0

Démonstration. Puisque f est différentiable au point x, le corollaire 2.13 permet


d’écrire
f (x + tv) = f (x) + dfx (tv) + ∥tv∥ε(tv).
Or, dfx est linéaire, donc dfx (tv) = tdfx (v). Il en découle que si t ̸= 0,

f (x + tv) − f (x) |t|∥v∥


= dfx (v) + ε(tv)
t t
t→0
= dfx (v) + ∥v∥ sgn(t)ε(tv) −−→ dfx (v).

Ici, sgn(t) est par convention le signe de t ̸= 0, à savoir +1 si t > 0 ou −1 si t < 0.


t→0
Par suite, ∥v∥ sgn(t) = ±∥v∥ est une fonction bornée de t, tandis que ∥tv∥ −−→ 0
t→0
et donc ε(tv) −−→ 0, ce qui justifie le passage à la limite ci-dessus.

La proposition suivante fait le lien avec les dérivées partielles telles que nous
les avons vues précédemment : si l’on prend pour v le ième vecteur de la base
canonique, la dérivée directionnelle dans la direction ei coïncide avec la dérivée
partielle ∂xi f :
2.5. DÉRIVÉE DIRECTIONNELLE 43

Proposition 2.21. Soit f : Rn → R une application et a ∈ Rn . On note B =


{e1 , . . . , en } la base canonique de Rn . Soit i tel que 1 ≤ i ≤ n. On a équivalence
entre les points suivants :
(i) f est dérivable dans la direction ei au point a
∂f
(ii) La dérivées partielle ∂xi
est bien définie au point a.
Pn
Plus précisément, si {e1 , . . . , en } est la base canonique de Rn avec a = i=1 ai ei ,
on a
∂f d
(a) = f (a + tei ).
∂xi dt t=0

Démonstration. On considère la direction v = ei . On a

f (a1 , . . . , ai−1 , s, ai+1 , . . . ) = f (a1 , . . . , ai−1 , ai + (s − ai ), ai+1 , . . . ).

Soit v = ei , de sorte que

(a1 , . . . , ai−1 , ai + (s − ai ), ai+1 , . . . ) = a + (s − ai )v.

On a donc f (a1 , . . . , ai−1 , s, ai+1 , . . . ) = fa,ei (s − ai ). On utilise ensuite la dériva-


bilité de fa,ei pour écrire

f (a1 , . . . , ai−1 , s, ai+1 , . . . ) = f (a) + (s − ai )fa,e i
(0) + o(s − ai ).

En considérant s → ai , ceci montre immédiatement que s 7→ f (a1 , . . . , ai−1 , s, ai+1 , . . . )



est dérivable en ai , de dérivée fa,e i
(0). Avec les notations de la section 2.2, on a
bien
∂f ′ d
(a) = fa,e (0) = f (a + tei ).
∂xi i
dt t=0

Remarque 2.22. La proposition précédente montre qu’une fonction dérivable dans


toutes les directions admet des dérivées partielles, et que si une fonction n’est dé-
rivable dans aucune direction en un point, elle ne peut être différentiable (car ses
dérivées partielles n’existent pas en ce point). Attention, sans hypothèse supplé-
mentaires, on ne peut pas déduire qu’une fonction qui admet des dérivées partielles
est dérivable dans toutes les directions...
Remarque 2.23. On peut généraliser facilement ce qui précède aux fonctions f :
Rn → Rp en considérant les dérivées partielles des composantes de f = (f1 , . . . , fp ).
Remarque 2.24. Bien que x et v soient tous les deux des vecteurs de Rn , vous
aurez peut être noté qu’ils ne jouent pas tout à fait le même rôle : x se voit plutôt
comme une position (on considère la fonction au voisinage du « point » x), alors
que v se voit effectivement comme un vecteur, qui décrit l’exploration selon une
droite du voisinage du point x comme on l’a noté plus haut. Nous reviendrons
là-dessus au cours du dernier chapitre à propos des courbes et surfaces.
44 CHAPITRE 2. DIFFÉRENTIABILITÉ DANS Rn

Exemple 2.25. Soit R3 = {(x, y, z)}. Calculons la dérivée directionnelle de la


fonction f (x, y, z) = x2 + y 2 + z 2 dans la direction v = (1, 1, 0) en un point
(x, y, z) quelconque.

Exemple 2.26. Non-différentiabilité de la norme en 0. Nous allons démontrer


qu’une norme n’est jamais différentiable à l’origine, en montrant qu’elle n’est
dérivable dans aucune direction. En effet,

N (0 + tv) = |t|N (v)

donc
N (0 + tv) − N (0) |t|
= N (v)
t t
et ce dernier terme n’a pas de limite, car il vaut N (v) pour t → 0+ et −N (v) ̸=
N (v) pour t → 0− .
Ce qui précède n’implique pas qu’une norme ne soit différentiable nulle part. Par
exemple, sur R2 , p
N2 (x, y) = x2 + y 2
est différentiable partout sauf en (0, 0),par composition de fonctions différen-
tiables. On peut même calculer sa différentielle : si (x, y) ̸= (0, 0), alors

∂N2 x ∂N2 y
(x, y) = , (x, y) = ,
∂x N2 (x, y) ∂y N2 (x, y)

qui sont des fonctions continues sur R2 \ (0, 0). Ainsi, N2 est une fonction C 1 sur
R2∗ et, pour (x, y) ̸= (0, 0),
1
∈ L(R2 , R).

DN2 (x, y) = x y
N2 (x, y)
Chapitre 3

Équations différentielles

3.1 Généralités
Définition 3.1. Soit U un ouvert de R2 et f : U → R une fonction continue. On
appelle équation différentielle du premier ordre, ou encore équation différentielle
ordinaire, une équation de fonction inconnue y de la forme

y ′ = f (t, y).

On appelle solution de cette équation différentielle une fonction φ définie sur un


intervalle ouvert I ⊂ R, dérivable sur I, telle que pour tout t ∈ I, on a

(t, φ(t)) ∈ U

et
∀t ∈ I, φ′ (t) = f (t, φ(t)).
On dit que U est le domaine de l’équation différentielle.

Exemple 3.2. Prenons f (t, y) = y. Alors l’équation s’écrit

y ′ = y.

Soit φ(t) = λ et , (λ ∈ R). Alors φ est solution sur R car φ′ = φ.

Exemple 3.3. Soit f (t, y) = a(t)y avec t 7→ a(t) une fonction continue sur un
intervalle J. Alors y ′ = a(t)y est une équation différentielle de domaine U = J ×R.
Soit A : J → R une primitive de a. Alors

φ(t) = λ exp(A(t))

est solution de l’équation y ′ = a(t)y sur I = J, comme on le voit en calculant la


dérivée de φ.

45
46 CHAPITRE 3. ÉQUATIONS DIFFÉRENTIELLES

Nous pouvons généraliser ce qui précède à tout ordre :


Définition 3.4. Soit n ∈ N∗ , U un ouvert de Rn+1 , f : U → R une fonction
continue. Une solution de l’équation différentielle d’ordre n

y (n) = f (t, y, y ′ , . . . , y (n−1) )

est une fonction n fois dérivable φ, définie sur un intervalle ouvert I telle que
∀t ∈ I, (t, φ(t), . . . , φ(n−1) (t)) ∈ U et

∀t ∈ I, φ(n) (t) = f (t, φ(t), . . . , φ(n−1) (t))

Exemple 3.5. L’équation du deuxième ordre y ′′ = −y a comme solution

φ(t) = λ cos t + µ sin t.

En fait, on peut ramener toute équation d’ordre n à une équation d’ordre 1 à


valeurs vectorielles :
Définition 3.6. Soit U un ouvert de Rn+1 et
(
U → Rn
F :
(t, Y ) 7→ F (t, Y )

une fonction continue. Une solution de l’équation différentielle d’ordre 1 vectorielle


Y ′ = F (t, Y ) est une fonction Φ : I → Rn définie et dérivable sur un intervalle
ouvert I telle que

∀t ∈ I, (t, Φ(t)) ∈ U et Φ′ (t) = F (t, Φ(t)).

Remarque 3.7. Par « Φ dérivable », on entend bien sûr que chaque composante
Φi de Φ = (Φ1 , . . . , Φn ) : I → Rn est une fonction dérivable d’une variable réelle.

Soit alors une équation d’ordre n

y (n) = f (t, y, y ′ , . . . , y (n−1) ). (3.1)

On pose  
y(t)
 y ′ (t) 
Y (t) =  .
 
..
 . 
y (n−1) (t)
Alors,    
y ′ (t) y ′ (t)

 y ′′ (t)   y ′′ (t) 
Y (t) =  =
   
.. .. 
 .   . 
y (n) (t) f (t, y, y ′ , . . . , y (n−1) )
3.2. LE PROBLÈME DE CAUCHY 47

Soit Y = (y1 , . . . , yn ) ∈ Rn et


R × Rn → Rn  

y2



..
  
F :  . 

(t, y1 , y2 , . . . , yn ) = (t, Y ) 7→ F (t, Y ) =  .
yn

  

  
f (t, y1 , . . . , yn )

On voit que φ est solution de (3.1) si et seulement si


 
φ(t)
 φ′ (t) 
Φ(t) = 
 
.. 
 . 
(n−1)
φ (t)

est solution de Φ′ = F (t, Φ(t)). On s’est bien ramené à une équation d’ordre 1.

Exemple 3.8. L’équation différentielle standard de l’oscillateur harmonique y ′′ +


ωy = 0, ω ∈ R est une équation de degré 2. On pose
 
y(t)
Y (t) = .
y ′ (t)

Alors
y ′ (t) y ′ (t)
      
′ 0 1 y(t)
Y = = =
y ′′ (t) −ω 2 y(t) −ω 2 0 y ′ (t)
On s’est ramené à
 
′ 0 1
Y = AY, avec A = .
−ω 2 0

Remarque 3.9. Si φ est solution de φ′ = f (t, φ), comme φ et f sont continues,


t 7→ f (t, φ(t)) est continue : donc φ est C 1 .

3.2 Le problème de Cauchy

3.2.1 Équations scalaires du premier ordre

On ne peut espérer que les solutions d’une équation différentielle soient uniques :
par exemple, pour l’équation y ′ = 0, les solutions sont toutes les fonctions constantes
y = λ, λ ∈ R. Pour espérer avoir l’unicité, il faudra aussi se donner une condition
initiale y(t0 ) = λ en un point t0 donné.
48 CHAPITRE 3. ÉQUATIONS DIFFÉRENTIELLES

Théorème 3.10. (Cauchy-Lipschitz) Soit f : U → R une fonction de classe C 1 .


Soit (t0 , y0 ) ∈ U . Il existe un intervalle ouvert contenant t0 et φ : I → R solution
sur I de l’équation différentielle

y ′ = f (t, y)

vérifiant la condition initiale y(t0 ) = y0 .


De plus, sur cet intervalle I, la solution φ vérifiant la condition initiale φ(t0 ) = y0
est unique.

La démonstration de ce théorème dépasse le cadre de notre cours : nous l’admet-


trons, comme la proposition suivante.

Proposition 3.11. Soit f : U → R de classe C 1 . Soit φ : I → R et ψ : J → R


deux solutions de y ′ = f (t, y) telles que I ∩ J =
̸ ∅ et qu’il existe t0 ∈ I ∩ J avec
φ(t0 ) = ψ(t0 ). Alors
∀x ∈ I ∩ J, φ(t) = ψ(t).

Définition 3.12. Soit s : J → R une solution de l’équation différentielle y ′ =


f (t, y). On dit que s est une solution maximale s’il n’existe pas d’intervalle ouvert
J ′ avec J ⊊ J ′ et de solution φ : J ′ → R solution de y ′ = f (t, y) avec φ|J = s.
(
R×R→R
Exemple 3.13. Considérons f : 2
et l’équation différentielle y ′ =
(t, y) 7→ y
y . Soit φ(t) = (1 − t) définie sur ] − ∞, 1[. Alors φ′ (t) = (1−x)
2 −1 1
2 = φ(t)
2
donc
φ : J → R est une solution. Il se trouve que c’est une solution maximale : soit
J ′ contenant strictement J et ψ : J ′ → R une solution sur J ′ telle que ψJ = φJ .
Puisque J ⊈ J ′ , on aurait nécessairement 1 ∈ J ′ et

1
ψ(1) = lim− ψ(t) = lim− φ(t) = lim− = +∞.
t→1 t→1 t→1 1−t
C’est absurde. De même, on montre que t 7→ (1 − t)−1 est une solution maximale
sur ]1, +∞[.
Remarque importante : l’exemple précédent montre que les solutions maxi-
males peuve n’être définies que sur un domaine plus petit que celui où l’équation
différentielle est posée.

Théorème 3.14. Soit f : U → R de classe C 1 . Alors pour tout (t0 , y0 ) ∈ U il


existe une unique solution maximale s de l’équation y ′ = f (t, y) telle que s(t0 ) =
y0 .

Démonstration. Soit E = {(I, φI )} où I est un intervalle ouvert contenant t0 et


φI : I → R solution de y ′ = f (t, y) avec φI (t0 ) = y0 . Soit J la réunion de tous
les intervalles I tels qu’il existe φI avec (I, φI ) ∈ E . C’est une union d’intervalles
3.3. QUELQUES EXEMPLES DE RÉSOLUTION EXPLICITE 49

ouverts contenant t0 , donc c’est encore un intervalle ouvert contenant t0 . On définit


alors s : J → R de la manière suivante. Soit t ∈ J. Alors il existe (I, φI ) ∈ E tel
que t ∈ I. On pose s(t) = φI (t). D’après la proposition précédente, la définition
est sans ambiguité car la solution est unique sur I. En outre, s est solution, elle
est aussi maximale par construction.

Exercice 3.15. Démontrer qu’une union quelconque d’intervalles ouverts conte-


nant un point fixé t0 ∈ R est encore un intervalle ouvert.

3.2.2 Extension à l’ordre n et aux équations vectorielles


Si U est un ouvert de R × Rn , (t0 , y0 ) ∈ U et F : U → Rn est C 1 , les résultats
précédents se généralisent : il existe une unique solution maximale s : J → Rn à
l’équation différentielle y ′ = F (x, y) vérifiant les conditions initiales y(t0 ) = y0 .
Pour les équations scalaires d’ordre n, on dispose du théorème suivant.

Théorème 3.16. Soit U un ouvert de R × Rn et f : U → R de classe C 1 . Soit


(t0 , a0 , a1 , . . . , an−1 ) ∈ R × Rn . Il existe une unique solution maximale s : J → R
à l’équation différentielle d’ordre n

y (n) = f (t, y, y ′ , . . . , y (n−1) )

vérifiant la condition intiale

s(t0 ) = a0 , s′ (t0 ) = a1 , . . . , s(n−1) (t0 ) = an−1 .

3.3 Quelques exemples de résolution explicite


En général, on ne peut pas trouver une formule explicite donnant les solutions
d’une équation différentielle, même si le théorème de Cauchy-Lipschitz nous assure
de l’existence d’une solution. C’est toutefois possible pour quelques équations
particulières.

3.3.1 Équations à variables séparées (ou séparable)


On considère les équations de la forme

y ′ = a(t)b(y)

sur un domaine U tel que ∀(t, y) ∈ U , b(y) ̸= 0. On prendra U = I × J, I, J


̸ 0 pour tout y ∈ J, et on supposera que a, b sont des
intervalles ouverts, b(y) =
1
fonctions C .
50 CHAPITRE 3. ÉQUATIONS DIFFÉRENTIELLES

On cherche une solution φ(t) vérifiant φ(t0 ) = y0 . Si l’équation est vérifiée, on


aura φ′ (t) = a(t)b(φ(t)) soit encore (puisque b(φ(t)) ̸= 0) :
φ′ (t)
∀t ∈ I, φ(t) ∈ J, = a(t)
b(φ(t))
d d
⇔ B(φ(t)) = A(t),
dt dt
1
où B est une primitive de y 7→ b(y) et A une primitive de t 7→ a(t). En effet,
d’après la règle de la chaîne,
d
B(φ(t)) = B ′ (φ(t))φ′ (t)
dt
1
= φ′ (t).
b(φ(t))
On aura donc B(φ(t)) = A(t) + C, où C est une constante. Si l’on choisit
Z y Z t
du
B(y) = , A(t) = a(s)ds,
y0 b(u) t0

on aura B(φ(t0 )) = B(y0 ) = 0 et A(t0 ) = 0, ce qui montre qu’en fait C = 0.


Finalement,
B(φ(t)) = A(t).
Comme b−1 (y) ̸= 0 pour tout y ∈ J, b−1 a un signe constant sur J. Il s’ensuit que
B est strictement monotone, donc bijective sur J : on peut donc écrire que
φ(t) = B −1 (A(t))
pour t dans le plus grand intervalle contenant t0 et tel que A(t) ∈ B(J).
Calcul pratique. Le raisonnement qui précède se met en œuvre de la manière
suivante. On écrit y ′ = a(t)b(y), b ̸= 0 sous la forme
dy dy
= a(t)b(y) ⇔ = a(t)dt.
dt b(y)
Si l’on cherche une solution φ telle que φ(t0 ) = y0 , elle est donnée par
Z φ(t) Z t
du
= a(t)dt.
y0 b(u) t0
1+y 2
Exemple 3.17. Soit y ′ = t
, y ∈ R, t > 0. On a
dy dt
2
= ⇔ (arctan y)′ = (log t)′
1+y t
Donc arctan y = arctan y0 + log tt0 . Or, arctan : R →] − π2 , π2 [ est bijective. Soit
t
I ′ = {t > 0, arctan y0 + log ∈] − π/2, π/2[}.
t0
On aura, pour tout t ∈ I ′ ,
t
φ(t) = tan(arctan y0 + log ).
t0
3.3. QUELQUES EXEMPLES DE RÉSOLUTION EXPLICITE 51

3.3.2 Changement de variables dans les équations différen-


tielles

Soient J un intervalle ouvert, V un ouvert de R, f : J × V → R continue.


Supposons connue une solution φ de y ′ = f (x, y) définie sur un intervalle ouvert
I ⊂ J. Supposons donnée une application θ : J1 → R une application C 1 telle que
θ(J1 ) = J. Alors, θ−1 (I) est un ouvert, et si I1 ⊂ θ−1 (I) est un intervalle ouvert,
on a, pour tout u ∈ I1 :

φ′ (θ(u)) = f (θ(u), φ(θ(u))).

Mais alors, ceci implique que

φ′ (θ(u))θ′ (u) = f (θ(u), φ(θ(u)))θ′ (u).

Si l’on pose ψ(u) = φ ◦ θ(u), on voit que ψ est solution de

ψ ′ (u) = θ′ (u)f (θ(u), ψ(u))

c’est à dire de l’équation


dy
= f (θ(u), y)θ′ (u).
du
On dit que cette équation est déduite de y ′ = f (t, y) par le changement de variables
t = θ(u).
Procédé mnémotechnique : on écrit l’équation de départ sous la forme dy =
f (x, y)dx, puis on remplace t = θ(u), ce qui donne

dy = f (θ(u), y)dθ(u) = f (θ(u), y)θ′ (u)du,


dy
d’où du
= f (θ(u), y)θ′ (u).

Exemple 3.18. Soit


dy y t
= 2 + , t > 0, y > 0.
dt t y

On fait le changement de variables t = u. Alors
√ √
y t 2y u √ 2y u du
dy = (2 + )dt ⇒ dy = ( √ + )d u = ( √ + ) √
t y u y u y 2 u

soit
dy y 1
= + .
du u 2y
Il n’est pas clair qu’on peut résoudre cette nouvelle équation pour l’instant, mais
nous allons voir que ce sera le cas en changeant de fonction inconnue.
52 CHAPITRE 3. ÉQUATIONS DIFFÉRENTIELLES

3.3.3 Changement d’inconnues


Supposons donné Φ : J → K un difféomorphisme C 1 entre deux ouverts de R.
def
Soit φ : I → R une solution de y ′ = f (t, y). Soit ψ(t) = Φ ◦ φ(t) qu’on suppose
bien défini. Alors
ψ ′ (t) = Φ′ (φ(t))φ′ (t)
= Φ′ (φ(t))f (t, φ(t))
Comme φ(t) = Φ−1 (ψ(t)), on a obtenu
ψ ′ (t) = Φ′ (Φ−1 (ψ(t))f (t, Φ−1 (ψ(t))).
C’est une solution de l’équation différentielle (obtenue par changement d’incon-
nue)
dz
= Φ′ (Φ−1 (z))f (t, Φ−1 (z)).
dt
En pratique : On cherche z = Φ(y) d’où
dz = dΦ(y)dy = dΦ(y)f (t, y)dt = dΦ(Φ−1 (z))f (t, Φ−1 (z))dt.
Exemple 3.19. Dans l’exemple précédent, on s’était ramené à
dy y 1
= +
du u 2y
Comme on s’intéresse à y > 0, cherchons z = y 2 . Alors
y 1
dz = 2ydy = 2y( + )du
u 2y
2
y z
= (2 + 1)du = (2 + 1)du.
u u
On s’est maintenant ramené à
dz 2z
= + 1.
du u
Cette équation est linéaire, c’est à dire que si l’on omet le second membre 1,
toute combinaison de solutions est encore solution. Nous verrons une méthode
qui permet de résoudre systématiquement de telles équations (second membre
compris).
Exercice 3.20. Soit K un intervalle ouvert et f : K → R une fonction continue.
Soit U = {(t, y); t ̸= 0, y/t ∈ K}. On considère l’équation
y 
y′ = f ,
t
dont on cherche une solution φ. En posant ψ(t) = φ(t)
t
comme nouvelle fonction
inconnue, montrer qu’on peut se ramener à une équation à variable séparées sur
ψ (qu’on saurait éventuellement résoudre dans un cas particulier grâce à ce qui
précède, avant de revenir à φ(t) = tψ(t)).
3.4. ÉQUATIONS LINÉAIRES 53

3.4 Équations linéaires


Définition 3.21. Une équation linéaire d’ordre 1 est une équation de la forme

Y ′ (t) = A(t)Y (t) + B(t) (3.2)

où Y (t) ∈ Rn , t 7→ A(t) est une appliation continue définie sur un intervalle ouvert
I et à valeurs dans Mn (R), t 7→ B(t) est continue de I dans Rn . On dit que cette
équation est homogène si B = 0 :

Y ′ = A(t)Y (3.3)

On dit que l’équation est scalaire si n = 1.

Définition 3.22. Une équation linéaire scalaire d’ordre n est une équation diffé-
rentielle de la forme

y (n) = a0 (t)y + a1 (t)y ′ + · · · + an−1 (t)y (n−1) + b(t)

où y est à valeurs dans R, et aj : I → R, b : I → R sont continues.

Comme précédemment, une équation scalaire d’ordre n se ramène à une équation


d’ordre 1 à valeurs dans Rn , en posant
 
y(t)
Y (t) = 
 .. 
. 
y (n−1) (t)

On trouve alors
   
0 1 0 ... 0
 0 0 1 ...   .. 
A(t) =  , B(t) =  .  .
   
.. ..
 . .   0 
a0 a1 . . . an−1 b(t)

Remarque 3.23. L’application F (t, Y ) = A(t)Y est continue, donc le théorème de


Cauchy-Lipschitz s’applique et l’on a existence locale de solutions à partir d’une
condition initiale. Nous allons, dans le cas précis des équations différentielles du
premier ordre, redémontrer ce résultat.

D’autres remarques :
1. Toute solution de (3.2) est de classe C 1 . En effet, une solution est dérivable
sur I, donc continue. Le second membre de l’équation montre alors que φ′
est continue, donc φ : I → Rn est bien C 1 .
54 CHAPITRE 3. ÉQUATIONS DIFFÉRENTIELLES

2. L’ensemble des solutions de l’équation homogène est un un sous-espace


vectoriel de C 1 (I, Rn ). En effet, toute combinaison linéaire de solutions est
encore solution : cela vient du fait que
(
C 1 (I) → C 0 (I)
D:
φ 7→ φ′ − aφ

est une application linéaire. Notez que φ solution de (3.2) équivaut à


D(φ) = B tandis qu’une solution de (3.3) est par définition dans ker D.
Attention, les espaces vectoriels considérés ici ne sont pas de dimension
finie !

3.4.1 Cas des équations scalaires

Théorème 3.24. Soit y ′ = ay avec a une fonction continue sur un intervalle I,


et t0 ∈ I. On a les propriétés suivantes :
(i) L’ensemble des solutions forme un espace vectoriel de dimension 1 sur R si a
est à valeurs réelles, sur C si a est à valeurs complexes. Une base est donnée par
la fonction t 7→ exp(A(t)), où A est une primitive de a sur I.
(ii) Soit y0 ∈ R. Il existe une et une seule solution définie sur I vérifiant y(t0 ) = 0.
Cette solution est donnée par
Rt
a(s)ds
φ0 (t) = y0 e t0
.

Démonstration. Il est clair que l’ensemble des solution S forme un espace vectoriel,
car
(αy1 + βy2 )′ = αy1′ + βy2′ = αay1 + βay2 = a(αy1 + βy2 ).
Puisque A′ (t) = a(t), on vérifie que eA est solution. Pour montrer que toute
autre solution est proportionnelle à φ, posons ψ(t) = k(t) eA(t) . Ce changement de
fonction inconnue est inversible : se donner ψ équivaut à se donner k puisque φ
ne s’annule jamais. La fonction ψ vérifie l’équation, donc ψ ′ = aψ = ka eA . or

ψ ′ = k ′ eA +k(eA )′ = k ′ eA +ka eA

On obtient que k ′ (t) eA(t) = 0 pour tout t ∈ I. Comme eA ̸= 0, k ′ (t) = 0 pour tout
t et k est une constante. Finalement, on a bienS = Vect(eA ).
Pour (ii) on vérifie facilement que φ0 (t0 ) = y0 e0 = y0 satisfait aux conditions
initiales. C’est la seule, puisque tout autre solution s’écrit C eA(t) d’après le point
(i), et alors
C eA(t0 ) = y0 ⇔ y = y0 eA(t)−A(t0 )
et l’argument de l’exponentielle est bien la primitive de a qui s’annule en t0 .
3.5. SUITES ET SÉRIES DE FONCTIONS : RAPPELS ET EXTENSION AUX EVN55

t2
Exemple 3.25. Sur R, les solutions de y ′ = ty sont les fonctions t 7→ C e 2 , avec
C ∈ R.
Exemple 3.26. Sur R, la solution de y ′ = i cos(t)y vérifiant y(0) = 2 − 3 i est la
fonction
y(t) = (2 − 3 i) ei sin(t) .
Théorème 3.27. (Variation de la constante, cas scalaire). Soit y ′ = ay + b avec
a, b continues sur un intervalle I, et φ0 une solution de l’équation de cette équation.
Alors l’ensemble des solutions est de la forme

S = {φ0 (t) + C eA(t) , C ∈ K}

Autrement dit, deux solutions diffèrent toujours d’une solution du cas homogène.
De plus, si t0 ∈ I, une solution particulière est donnée par
Z 
−A(t)
φ(t) = b(t) e dt eA(t)

Le terme entre parenthèse doit se comprendre comme une primitive de la fonction


t 7→ b(t) e−A(t) .

Démonstration. Il est clair que si ψ est une autre solution, un calcul direct montre
que ψ − φ0 vérifie l’équation différentielle homogène, d’où le premier point.
Pour le deuxième, on utilise la méthode dite de la « variation de la constante »
(due à Lagrange). Cette méthode est à connaître. L’idée est de changer de fonction
inconnue en cherchant une solution de la forme

φ(t) = c(t) eA(t) .

Comme précédemment, puisque l’exponentielle ne s’annule pas, se donner c équi-


vaut à se donner φ. On calcule φ′ = c′ eA +ca eA d’une part, mais φ′ = aφ + b =
ac eA +b d’autre part, ce qui conduit à

c′ eA = b ⇔ c′ = b e−A .

Il suffit d’intégrer cette équation pour conclure (notez que t 7→ b(t) e−A(t) est une
fonction continue d’après les hypothèses faites sur a et b).

3.5 Suites et séries de fonctions : rappels et exten-


sion aux EVN
Soit E, ∥ · ∥ un espace vectoriel normé. On s’intéresse aux suites de fonctions
(fn )n∈N définies sur un intervalle réel I non vide et à valeurs dans E :

fn : I ⊂ R → E.
56 CHAPITRE 3. ÉQUATIONS DIFFÉRENTIELLES

Contrairement au premier semestre, nous n’avons plus fn : R → R mais nous


allons voir que la généralisation à E des théorèmes du cours d’Analyse 3 ne pose
aucun problème.
La notion de convergence simple se modifie comme suit. Si f : I → R on écrira
s n→+∞
fn →
− f ⇔ ∀t ∈ I, ∥fn (t) − f (t)∥ −−−−→ 0.

Pour la convergence uniforme, on dira que fn converge uniformément vers la fonc-


tion f sur I si
n→+∞
sup ∥fn (t) − f (t)∥ −−−−→ 0.
t∈I

Soit B(I, E) l’espace des fonctions bornées définies sur I à valeurs dans E. Cet
espace est clairement un espace vectoriel sur R, mais il est de dimension infinie (il
contient par exemple la restriction des fonctions polynômes à I). On pose
def
N∞ (f ) = sup ∥f (t)∥.
t∈I

L’application N∞ est une norme sur B(I, E), dite norme de la convergence uni-
forme.
Exercice 3.28. Vérifier que N∞ est bien une norme sur B(I, R).
u
Ainsi la convergence uniforme fn →
− f se définit par
u n→+∞
fn →
− f ⇔ N∞ (fn − f ) −−−−→ 0,
ou encore fn → f pour la norme N∞ .
Théorème 3.29. Tous les résultats du premier semestre sur les suites de fonctions
se généralisent au cas des fonctions à valeurs dans E muni d’une norme ∥ · ∥. En
particulier, la convergence uniforme de fonctions continues sur un intervalle I
vers une fonction f : I → E assure la continuité de f .
De même, la convergence uniforme permet la permutation des limites avec les
opérations standard (intégration, dérivation) sous les hypothèses adéquates.

Nous ne donnerons pas les détails et les hypothèses précises mais indispensables
des énoncés ci-dessus, ils se déduisent facilement du cas E = R et l’on renvoie le
lecteur à son cours d’Analyse 3.
Remarque 3.30. Les notions de convergence de suites de fonctions ci-dessus dé-
pendent de la norme ∥ · ∥ définie sur E. Ceci n’est pas en soi problématique,
d’ailleurs les propriétés de convergence seront les mêmes pour toute autre norme
N équivalente à ∥·∥ (Proposition 1.34). En pratique, nous considérerons la plupart
du temps que E est de dimension finie. Or, le théorème 1.38 (que vous démontre-
rez en L3) affirme que sur un espace de dimension finie, toutes les normes sont
équivalentes : en dimension finie, le choix de la norme ∥ · ∥ sur E n’a finalement
pas d’importance.
3.5. SUITES ET SÉRIES DE FONCTIONS : RAPPELS ET EXTENSION AUX EVN57

Les séries de fonctions se généralisent Pde la même manière : lorsqu’on parle de


convergence d’une série de fonctions fn , on parle en faitPde la convergence de
N
la suite de fonctions (SN )P
N ∈N des sommes partielles SN = n=0 fn . On dira donc
que la série de fonctions
P fn converge simplement vers la fonction g : U → E si
la série numérique fn (t) (à valeurs dans E) converge en chaque t ∈ I, c’est à
dire :
N
N →∞
X
∀t ∈ I, g(t) − fn (t) −−−→ 0.
n=0
P+∞
On écrira simplement n=0 fn (t) = g(t).
Comme dans le cas E = R, on a la caractérisation suivante pour la convergence
uniforme :
P
Proposition 3.31. La série de fonctions fn définiesPsur I converge uniformé-
ment vers une fonction g : I → E si et seulement si fn converge simplement
vers g sur I, et si la suite des restes converge uniformément vers 0.

On rappelle que la convergence simple implique que la suite de fonctions des restes
Rn est bien définie :
+∞
X
Rn : t 7→ Rn (t) = fn (t), t ∈ I.
n+1

P u P s n→∞
Ainsi fn →
− g si et seulement si fn →
− g et N∞ (Rn ) −−−→ 0.

Théorème 3.32.
P Les résultats du premier semestre sont maintenus : si une série
de fonctions fn définies sur I converge uniformément vers une fonction g : I →
E, la continuité des fn assure la continuité de la limite g.
De même, la convergence uniforme permet l’interversion des symboles (sommes/limites,
somme/intégration, somme/dérivation) sous les hypothèses adéquates, en rem-
plaçant R, | · | par E, ∥ · ∥.

Là encore nous renvoyons le lecteur à son cours d’Analyse 3 pour qu’il formule
précisément les énoncés ci-dessus.
P
Enfin, on dira que la série fn converge normalement, si pour tout n la Pfonction
fn est bornée (de sorte que N∞ (fn ) ait un sens), et si la série numérique N∞ (fn )
est convergente.
P
Proposition 3.33. Si une série de fonctions fn Pconverge normalement sur I,
alors elle converge uniformément sur I, et la série ∥fn (t)∥ est convergente.

On retiendra, là encore, que

convergence normale ⇒ convergence uniforme ⇒ convergence simple.


58 CHAPITRE 3. ÉQUATIONS DIFFÉRENTIELLES

3.6 Équations du premier ordre : cas général

3.6.1 Existence et unicité

Nous allons démontrer complètement le résultat suivant :

Théorème 3.34. Soit I un intervalle ouvert, A : I → Mn (R) et B : I → Rn


des applications continues. Soit t0 ∈ I et Y0 un vecteur de Rn . Alors, l’équation
différentielle (
Y ′ = A(t)Y + B(t)
Y (t0 ) = Y0
a une unique solution définie sur I.

Notez que ce n’est rien d’autre que le théorème de Cauchy-Lipschitz, mais dans le
cas linéaire (où nous allons pouvoir donner la démonstration, pas si simple mais
instructive !)
On commence par donner une version intégrale de l’équation différentielle :

Lemme 3.35. Soit t0 ∈ I et y0 ∈ Rn . Une application φ ∈ C 0 (I, Rn ) est une


solution de (3.2) qui vérifie la condition de Cauchy φ(t0 ) = y0 si et seulement si
elle vérifie l’équation intégrale
Z t Z t
∀t ∈ I, φ(t) = y0 + B(s)ds + A(s)φ(s)ds.
t0 t0

Il suffit d’intégrer (3.2) de t0 à t pour obtenir l’équation intégrale. La réciproque


est évidente d’après le théorème fondamental de l’intégration.
Malheureusement, nous ne disposons pas, pour n > 1, de méthodes comparables
à la dimension 1 pour résoudre l’équation (3.2) (qui permet, dans le cas où les
intégrales sont calculables, d’avoir une solution explicite. C’est ce qu’on appelle
une résolution par quadratures.

Démonstration. (du theorème 3.34). Nous allons utiliser une méthode importante
due à Picard (fin du 19e), dite des approximations successives. Notons
Z t
φ0 (t) = y0 + B(s)ds.
t0

Alors, d’après le lemme précédent, toute solution vérifie


Z t
ψ(t) = φ0 (t) + A(s)ψ(s)ds.
t0
3.6. ÉQUATIONS DU PREMIER ORDRE : CAS GÉNÉRAL 59

L’idée est de considérer l’intégrale du deuxième membre comme une perturbation :


c’est le cas si t est proche de t0 , car l’intégrale tend alors vers 0. Ceci conduit à
construire par récurrence la suite de fonctions (on prend t0 = 0 par la suite pour
simplifier) :
Z t Z t
U0 (t) = Y0 + B(s)ds, Un+1 (t) = A(s)Un (s)ds.
0 0

Ces fonctions sont bien sûr à valeur dans Rn , nous sommes donc dans le cadre des
rappels de la section précédente. Nous alons démontrer que la série de fonctions
Un converge normalement sur tout intervalle de la forme [0, b′ ] ou de la forme
P
[a′ , 0] avec
a < a′ < 0 < b′ < b.

Dans tout ce qui suit, on note pour simplifier |Q| la norme d’une quantité Q, le
contexte permettant d’identifier cette norme précisément. Posons
Z t Z t
′ ′
N (t) = |B(t )|dt + |Y0 |, M (t) = |A(t′ )|dt′ .
0 0

Dans l’équation précédente, |A| désigne une norme de matrice. L’espace des ma-
trices étant de dimension finie, le choix précis de la norme n’a pas d’importance
pour les questions de convergence (voir la remarque 3.30, ou le théorème 1.38).
Nous allons montrer que la série de fonctions
X
Un

est uniformément convergente et nous fournit la solution de l’équation différen-


tielle avec la condition initiale Y (0) = Y0 . La suite au tableau.
Unicité (non traité en amphi, les notations sont celles du tableau pour l’existence) :
Montrons maintenant que la solution est unique pour cette condition initiale.
Sinon, soient Y1 et Y2 deux solutions. Alors Y = Y1 − Y2 vérifie

Y ′ = AY, Y (0) = 0.

Posons K(t) = sup0≤t′ ≤t |Y (t′ )|. Par construction, K est une fonction croissante,
et K(0) = 0. Notons
t∗ = sup{t > 0; K(t) = 0}.

Par définition de t∗ , K(s) = 0 pour tout s < t∗ . Ceci implique que pour tout
s < t∗ , on a Y (s) = 0. Par continuité de Y , on a donc nécessairement Y (t∗ ) = 0
et finalement aussi K(t∗ ) = 0.
60 CHAPITRE 3. ÉQUATIONS DIFFÉRENTIELLES

On veut montrer que t∗ = b. Supposons t∗ < b. On a donc pour t > t∗ ,


Z t
Y (t) = Y (t∗ ) + A(t′ )Y (t′ )dt′
| {z } t∗
=0
Z t
⇒ |Y (t)| ≤ |A(t′ )||Y (t′ )|dt′
t∗
Z t
def
≤ K(t) |A(t′ )|dt′ = K(t)M (t, t∗ ).
t∗

M (t, t∗ ) une fonction continue croissante de t, nulle en t = t∗ . En particulier, il


existe h > 0 tel que M (t, t∗ ) < 1/2 sur l’intervalle [t∗ , t∗ + h]. En prenant le sup
sur [0, t∗ + h] dans l’équation ci-dessus, on obtient que
1
K(t∗ + h) ≤ K(t∗ + h)M (t∗ + h, t∗ ) ≤ K(t∗ + h) < K(t∗ + h).
2
Donc K(t∗ + h) = 0 et K est nul sur [t∗ , t∗ + h], ce qui contredit la définition de
t∗ . Le théorème est complètement démontré.

3.6.2 Structure affine de l’espace des solutions


Définition 3.36. Soient
( (
I → Mn (R) I → Rn
,
t 7→ A(t) t 7→ B(t)
des applications continues, et soit
(E) Y ′ = A(t)Y + B(t)
On appelle équation homogène associée à (E) l’équation
(H) Y ′ = A(t)Y.
Théorème 3.37. L’ensemble SH des solutions de l’équation H est un sous-espace
vectoriel de dimension n de l’espace C 1 (I, Rn ).
Remarque 3.38. Bien sûr, C 1 (I, Rn ) n’est pas de dimension finie.

Démonstration. Nous l’avons déjà remarqué, l’ensemble SH des solutions d’une


équation linéaire homogène est un sous-ensemble de l’espace vectoriel C 1 (R, Rn ),
stable par combinaisons linéaires. C’est donc un sous-espace vectoriel de C 1 (R, Rn ).
Pour montrer qu’il est de dimension n, il suffit de construire une bijection linéaire

S−→ Rn . Soit t0 ∈ I et prenons
(
S → Rn
Φ:
Y 7→ Y (t0 ).
Alors Φ est linéaire par construction. Elle est bijective, puisque si Y0 ∈ Rn , il existe
d’après le théorème 3.34 un unique Y ∈ S vérifiant Y (t0 ) = Y0 , i.e. Φ(Y ) = Y0 .
3.6. ÉQUATIONS DU PREMIER ORDRE : CAS GÉNÉRAL 61

Proposition 3.39. Soit ϕ : I → Rn une solution de (E). On dit que ϕ est une
solution particulière de (E). Alors, l’ensemble des solutions SE de l’équation (E)
peut s’écrire
SE = {ϕ + ϕ0 , ϕ0 ∈ SH }

On dit parfois que SE est un espace affine de direction SH .

Démonstration. En effet, il est direct de vérifier que si ϕ̃ est une autre solution,
alors ϕ − ϕ̃ est solution de l’équation homogène. Voir également la remarque
précédent la section sur les équation scalaires du premier ordre ci-dessus.

3.6.3 Wronskien

Définition 3.40. Soit l’équation (H) homogène Y ′ = A(t)Y . Supposons données


nsolutions de (H), φ1 , . . . , φn . On appelle matrice wronskienne de φ1 , . . . , φn au
point t ∈ I la matrice

W (t) = φ1 (t) φ2 (t) . . . φn (t) ∈ Mn (R)

où les φi sont écrits en colonne. On appelle wronskien de φ1 , . . . , φn en t le déter-


minant
def
w(t) = det W (t).

Proposition 3.41. Soit Y ′ = AY une équation différentielle homogène donnée


par A : I → Mn (R) continue. Soit S l’espace vectoriel des solutions. Il y a équi-
valence entre :
(i) φ1 , . . . , φn est une base de S
(ii) ∀t0 ∈ I, (φ1 (t0 ), . . . , φn (t0 )) est une base de Rn , i.e. ∀t0 ∈ I, w(t0 ) ̸= 0
(iii) ∃t0 ∈ I tel que (φ1 (t0 ), . . . , φn (t0 )) soit une base de Rn , i.e. ∃t0 ∈ I, w(t0 ) ̸=
0.

Démonstration. C’est une conséquence de la bijection linéaire Φ construite dans


la preuve du théorème 3.37, on laisse les détails de la rédaction au lecteur.

Remarque 3.42. On peut démontrer que l’on a


Rt
tr A(s)ds
w(t) = w(t0 ) e t0

ce qui permet de retrouver l’équivalence entre les deux derniers points de la pro-
position.
62 CHAPITRE 3. ÉQUATIONS DIFFÉRENTIELLES

3.6.4 Méthode de la variation des constantes : premier ordre


On considère une équation (vectorielle) Y ′ = A(t)Y + B dont on connaît une base
(φ1 , . . . , φn ) de l’espace des solutions SH du cas homogène. On sait que toute
solution φ du cas homogène se décompose de manière unique sous la forme
n
X
φ(t) = λi φi (t), λi ∈ R.
i=1

Comme pour le cas scalaire, l’idée est de changer de fonction inconnue, et de


chercher des solutions de l’équation avec second membre sous la forme
n
X
φ(t) = λi (t)φi (t),
i=1

où les λi sont des fonctions C 1 à déterminer. D’après la structure affine de l’en-


semble des solutions, nous savons qu’il suffit de trouver une solution particulière.
La fonction φ de cette forme vérifie donc
X X
φ′ (t) = λ′i (t)φi (t) + λi (t)φ′i (t)
X X
= λ′i (t)φi (t) + λi (t)A(t)φi (t).

Par ailleurs, φ doit vérifier l’équation différentielle avec second membre, donc on
a aussi
φ′ (t) = A(t)φ(t) + B(t)
X
= A(t) λi (t)φi (t) + B(t).

En combinant les deux équations il vient


X
B(t) = λ′j (t)φj (t).

Or, par définition de W et du produit matriciel,


 

λ 1 (t)
λ′i (t)φi (t) = W (t)  ...  .
X  
λ′n (t)

La matrice W (t) étant inversible, il s’ensuit que


 
λ′1 (t)
 .. −1
 = W (t) B(t).

 .
λ′n (t)

Le membre de droite est connu et détermine donc les λ′i (t). Il ne reste plus qu’à in-
tégrer toutes ces fonction pour trouver les λi , et par suite une solution particulière
de l’équation.
3.6. ÉQUATIONS DU PREMIER ORDRE : CAS GÉNÉRAL 63

Exercice 3.43. Considérons le système


(
2t2 −1
y1′ = 1+t
t 1
2 y1 + 1+t2 y2 + 1+t2

y2′ = − 1+t
1 t 3t
2 y1 + 1+t2 y2 + 1+t2

1. Montrer que
   2 
1 t 1 1 2t − 1
A(t) = , B(t) = .
1 + t2 −1 t 1 + t2 3t
   
1 t
2. Vérifier que φ1 (t) = et φ2 (t) = sont solutions de l’équation
−t 1
homogène.
3. Trouver une solution particulière, puis la forme générale des solutions à
l’aide de la méthode de la variation des constantes.

3.6.5 Méthode de la variation des constantes : ordre ≥ 2


Comme dans la définition 3.22, on considère une équation scalaire d’ordre n
(E) : y (n) = a0 (t)y + a1 (t)y ′ + · · · + an−1 (t)y (n−1) + b(t)
et son équation homogène associée.
(H) : y (n) = a0 (t)y + a1 (t)y ′ + · · · + an−1 (t)y (n−1)
que l’on convertit en une équation vectorielle d’ordre 1 de la forme

Y ′ = A(t)Y + B(t),
où  
y(t)
Y (t) = 
 .. 
. 
y (n−1) (t)
et    
0 1 0 ... 0
 0 0 1 ...   .. 
A(t) =  , B(t) =  .  .
   
.. ..
 . .   0 
a0 a1 . . . an−1 b(t)
Soit 

 C n (I) → C 0 (I,
 Rn ) 

φ




 φ′
 
Ω: 

 φ 7→ Ω(φ) =  .. .
.

  

  
(n−1)
φ

64 CHAPITRE 3. ÉQUATIONS DIFFÉRENTIELLES

Alors, Ω est bijective de l’espace des solutions de (E) sur l’espace des solutions
de Y ′ = AY + B, et également bijective de l’espace des solutions de (H) sur
les solutions de Y ′ = AY . En particulier, l’espace des solutions de (H) est un
espace vectoriel de dimension n, et (φ1 , . . . , φn ) est une base de cet espace ssi
(Ω(φ1 ), . . . , Ω(φn )) est une base de l’espace des solutions de Y ′ = AY .

Définition 3.44. On appelle matrice wronskienne associée à une base (φ1 , . . . .φn )
de solutions de (H) la matrice
 
φ1 φn
 φ′1 φ′n 
W (t) =  .. .. .
 
 . ... . 
(n−1) (n−1)
φ1 φn

Comme précédemment, on va chercher une solution générale de (E), donc la solu-


tion générale de Y ′ = AY + B, à l’aide d’une méthode de variation des constantes.
On sait, d’après cette méthode pour l’ordre 1 général, que si l’on pose

ϕj = Ω(φj )

cette solution générale sera d’une part


X
λj (t)ϕj (t)
 
φ
 φ′ 
et d’autre part, elle sera de la forme  . On cherche donc des fonctions
 
..
 . 
φ(n−1)
λ1 (t), . . . , λn (t) telles que

φ(t) = λ1 (t)φ1 (t) + · · · + λn (t)φn (t)

soit solution de (E) et que pour tout k = 1 . . . n − 1,


(k)
φ(k) (t) = λ1 (t)φ1 (t) + · · · + λn (t)φn(k) (t).

En pratique, on peut soit raisonner sur le système, soit ne pas se ramener à l’odre
1 et chercher directement φ sous la forme

φ(t) = λ1 (t)φ1 (t) + · · · + λn (t)φn (t)

et procéder comme pour l’ordre 1 mais en dérivant n fois et en utilisant l’équation


différentielle pour annuler les termes en φ(n) : on se ramène alors à n problèmes
d’intégration (cf exercice sur l’ordre 2 en TD).
3.7. EQUATIONS LINÉAIRES À COEFFICIENTS CONSTANTS 65

3.7 Equations linéaires à coefficients constants

3.7.1 Méthode générale


On s’intéresse ici aux systèmes
Y ′ = AY, A ∈ Mn (R) constante.
L’idée générale est de diagonaliser A (si c’est possible), où à défaut de mettre A
sous forme triangulaire (réduction de Jordan). Nous supposerons ici il existe une
matrice inversible P ∈ GLn (C) telle que
P −1 AP = T triangulaire supérieure à coefficients complexes.
Dans les exemples, soit on pourra diagonaliser A et prendre T = D diagonale, soit
il sera fourni une méthode particulière pour arriver à l’équation ci-dessus.
Naturellement, on pose Z(t) = P −1 Y . Alors, vu que P ne dépend pas de t,
Z ′ (t) = P −1 Y ′ (t) = P −1 AY (t) = P −1 AP Z(t) = T Z(t).
On est ainsi ramené à un système triangulaire Z ′ = T Z que l’on résout en com-
mençant par le bas, c’est à dire la dernière équation, qui est une équation scalaire
de la forme zn′ = azn avec a ∈ C :
    
z1′ a1 . . . ∗ z1
 ..   .. . . .  . 
 . = . . ..   ..  .
zn′ 0 . . . an zn

Les solutions seront donc à valeurs complexes, il faudra prendre les parties réelles
pour obtenir les solutions réelles.
 
1 0 1
Exemple 3.45. Système de taille 3 avec A =  2 −1 0  . On trouve 1
1 −1 1/2
valeur propre double et −3/2 valeur  propre simple. Par des méthodes d’algèbre
−2 1 0
linéaires, on trouve une matrice P =  8 1 0  telle que
5 0 1
 
−3/2 0 1/10
P −1 AP = T =  0 1 3/5  .
0 0 1
Le système en Z s’écrit 
′ 3 1
z1 = − 2 z1 − 10 z3

z2′ = z2 + 45 z3

 ′
z3 = z3
66 CHAPITRE 3. ÉQUATIONS DIFFÉRENTIELLES

On résout la dernière en z3 = λ3 et . Puis pour z2′ = z2 + 45 λ3 et il faut utiliser la


variation de la constante, ce qui donne
4
z2 = ( λ3 t + λ2 ) et .
5
On reporte enfin z3 dans la première équation, ce qui amène
3 1
z1′ = − z1 − λ3 et
2 10
−λ3 3
Encore une variation des constantes donne z1 = 25
et +λ1 e− 2 t . On utilise enfin
P pour revenir à Y = P Z. On donne :
4λ3 t 3
y3 = e +5λ1 e− 2 t ,
5
on laisse les autres en exercice.

3.7.2 Utilisation de l’exponentielle de matrices


Proposition 3.46. On munit Mn (R) de la norme d’opérateur, ce qui en fait un
espace vectoriel normé sur R, de dimension finie n2 . Soit A ∈ Mn (R). Alors la
série X 1
An
n!
converge normalement dans Mn (R), on note sa somme eA .

Quelques mots sur la preuve : il est clair que la série converge normalement, car
∥An ∥ ≤ ∥A∥n et
N
X 1 N →+∞
∥A∥n −−−−→ e∥A∥ .
n=0
n!
def PN 1 n
Ainsi, la suite de matrices AN = n=0 n! A , vue comme un vecteur de Mn (R),
2
converge dans l’espace E = Mn (R) ≃ Rn et sa limite eA ∈ Mn (R) est donc bien
définie (chapitre 1).
Propriétés de l’exponentielle de matrices :
1. Si A et B commutent (AB = BA), alors eA eB = eA+B = eB eA .
2. Pour tout A, eA est inversible avec e−A = (eA )−1 .
d
3. On a dt
etA = A etA .
Il suffit d’écrire A + B = B + A et de développer les sommes partielles en commu-
tant les termes pour le premier point (en raison de la commutation de A et B, tout
se passe comme si on avait un produit de séries exponentielles numériques – cf.
fin du cours d’Analyse 3 sur la série exponentielle). Le deuxième en découle avec
3.7. EQUATIONS LINÉAIRES À COEFFICIENTS CONSTANTS 67

B = −A et e0 = Id. Pour le troisième, il faut considérer la fonction f (t) : t 7→ etA


définie sur R et à valeurs dans E = Mn (R). Les termes de la série sont bien C 1 (en
fait ils sont même C ∞ ) et la série dérivée converge normalement sur tout intervalle
compact de R : en effet on vérifie facilement que
X d (tA)n X 1 X (tA)n
n−1 n−1
= At A = A ,
n≥0
dt n! n≥1
(n − 1)! n≥0 n!

et si t ∈ [a, b], on a, pour M = max |a|, |b|,


N∞ ((tA)n ) ≤ M n ∥A∥n .
n
Or (M ∥A∥)
n!
est le terme général d’une série convergente (de limite eM ∥A∥ ∈ R).
D’après les rappels sur la convergence normale d’une série de fonction à valeur
dans un EVN, on peut permuter somme et dérivée ce qui donne tout de suite le
point 3.
Exemple 3.47. Si D = diag(a1 , . . . , an ) est une matrice diagonale, alors
eD = diag(ea1 , . . . , ean ).
La vérification est immédiate, car Dk = diag(ak1 , . . . ) et il suffit de calculer la
série terme à terme sur la diagonale. Ceci se généralise de la manière suivante : si
A = P −1 DP , alors eA = P −1 eD P . En effet,
Ak = P −1 Dk P
et donc
AN = P −1 DN P → P −1 DP
car la multiplication de matrice est une opération continue Mn (R) → Mn (R).
Théorème 3.48. Soit A ∈ Mn (R). L’ensemble des solutions de l’équation diffé-
rentielle Y ′ = AY est l’ensemble
S = {etA Λ, Λ ∈ Rn }.

Démonstration. C’est une conséquence immédiate du point 3 des propriétés de


l’exponentielle de matrice : il est clair alors que etA Y0 est solution de l’équation
pour tout Y0 ∈ Rn , avec comme donnée initiale Y0 ∈ Rn arbitraire. D’après
l’unicité des solutions à conditions initiales fixées pour les équations du premier
ordre, on a bien trouvé la forme générale des solutions.
Corollaire 3.49. Si (v1 , . . . , vn ) est une base de Rn , posons ϕj (t) = etA vj . Alors
(ϕ1 , . . . , ϕn ) est base de l’espace des solutions de Y ′ = AY .

Démonstration. Chacun des ϕj est solution d’après le théorème. Il suffit de vérifier


que le wronskien est non nul en un point (Proposition 3.41). Or, en t = 0, on a
det(ϕ1 (0), . . . , ϕn (0)) = det(v1 , . . . , vn ) ̸= 0
puisque les vi forment une base de Rn .
68 CHAPITRE 3. ÉQUATIONS DIFFÉRENTIELLES

3.7.3 Application aux équations scalaires d’ordre 2


On considère l’équation
y ′′ + ay ′ + by = 0.
Vectoriellement,

y′
      
0 1 y y
= =A .
y ′′ −b −a y′ y′
Le polynôme caractéristique de A est

X 2 − X tr A + det A = X 2 + aX + b.

On appelle équation caractéristique associée à (H) l’équation

(C) r2 + ar + b = 0.

Proposition 3.50. Soit ∆ = a2 − 4b.


(i) Si ∆ > 0, notons r1 , r2 les deux racines réelles distinctes de (C). Alors er1 t , er2 t
forment une base de l’espace des solutions de (H)
(ii) Supposons que ∆ < 0. Alors (C) a deux racines complexes conjuguées r =
ρ + iω, r = ρ − iω, ρ ∈ R, ω ∈ R \ {0}. Alors

{eρt cos ωt, eρt sin ωt}

forment une base de solutions de (H).


(iii) Si ∆ = 0, il existe une racine réelle double r, et {ert , t ert } est une base de
solutions.

Démonstration. Il suffit de vérifier, pour chaque cas, que la paire de fonctions


proposée est solution. On conclut car ces fonctions sont clairement indépendantes,
et que l’on sait que l’espace vectoriel des solutions est de dimension 2.
Chapitre 4

Courbes paramétrées

4.1 Généralités
Définition 4.1. Soit I ⊂ R un intervalle ouvert (pas forcément borné) et n ≥ 2
un entier. Une courbe paramétrée est une application

γ : I → Rn .

Nous dirons que c’est une courbe différentiable si l’application γ est différentiable,
de classe C k si γ est de classe C k . La trace de γ est l’ensemble

γ(I) = {γ(t) ∈ Rn , t ∈ I}.

Exemple 4.2. (1) Soit f : I → R et posons, pour t ∈ R, γ(t) = (t, f (t)) . Si


f est de classe C k , alors γ est une courbe paramétrée de R2 . Ce type de courbe
paramétrée t 7→ (t, f (t)) s’appelle un graphe. Sa trace est le graphe de la fonction
f :

γ(I) = {(x, y) ∈ R2 , ∃t ∈ I : (x, y) = (t, f (t))}


= {(x, y) ∈ R2 , x ∈ I, y = f (x)}

(2) Le cercle unité est la trace d’une courbe paramétrée, par exemple
(
R → R2
γ:
t 7→ (cos t, sin t)

Ce n’est pas la seule dont la trace est le cercle, comme nous le verrons bientôt.
(3) Soit (
R → R3
γ:
t 7→ (cos t, sin t, t)
γ est une hélice.

69
70 CHAPITRE 4. COURBES PARAMÉTRÉES

Figure 4.1 – Le graphe d’une fonction vu comme une courbe paramétrée

Figure 4.2 – Le cercle unité est la trace d’une courbe paramétrée.


4.1. GÉNÉRALITÉS 71

Exemple 4.3. (4) Soit α : R → R2 définie par α(t) = (t3 −4t, t2 −4). L’application
α n’est pas injective, car α(2) = α(−2) = (0, 0).

Définition 4.4. Soit γ : I → Rn une courbe de classe C k avec k ≥ 1 et t0 ∈ I.


Le vecteur tangent à γ au temps t0 est par définition le vecteur

 
γ1′ (t0 )
v(t0 ) = γ ′ (t0 ) =  ..
.
 
.

γn (t0 )

Ce vecteur peut s’interpréter comme la vitesse d’un point dont la trajectoire dans
Rn serait donnée par t 7→ γ(t).

Exemple 4.5. (1) Soit γ(t) = (t cos t, t sin t, t). C’est une hélice qui se « dilate ».
Calculons son vecteur tangent :

γ ′ (t) = (cos t − t sin t, sin t + t cos t, 1)

On note que limt→±∞ ∥v(t)∥ = +∞ : la courbe est parcourue de « plus en plus


vite ».
72 CHAPITRE 4. COURBES PARAMÉTRÉES

Exemple 4.6. (2) Dessin de la courbe α(t) = (t3 , t2 ). Sa trace dans R2 se confond
avec le graphe de la fonction numérique réelle f : x 7→ |x|2/3 . Notez bien la
différence de ces deux objets : le vecteur tangent en 0 à la courbe α est (0, 0) alors
que f n’est pas dérivable en 0.
(3) L’application α(t) = (t, |t|) définie sur R n’est pas une courbe différentiable
car t 7→ |t| n’est pas différentiable en 0.
(4) Les courbes α(t) = (cos(t), sin(t)) et β(t) = (cos(2t), sin(2t)) ont la même
trace, à savoir le cercle unité. Cependant, le vecteur tangent à la deuxième courbe
est le double de celui de la première courbe.

4.1.1 Reparametrisation
Définition 4.7. Soient (I, γ) et (J, η) deux courbes paramétrées. On dit qu’elles
sont équivalentes s’il existe u : I → J bijection de classe C k telle que u−1 soit
aussi de classe C k et
γ = η ◦ u.
Remarque 4.8. Si u : I → J est de classe C k , on sait que u−1 est de classe C k si
et seulement si pour tout t ∈ I, on a u′ (t) ̸= 0. Ceci est dû au fait que
1
(u−1 )′ = .
u′ ◦ u−1
Exemple 4.9. Soit S+ = {(x, y) ∈ R2 , x2 + y 2 = 1, y > 0}. Alors
(
] − 1, 1[→ R2
γ: √
t 7→ (t, 1 − t2 )

est un premier paramétrage de S+ . Mais


(
]0, π[→ R2
η:
θ 7→ (cos(θ), sin(θ))
4.1. GÉNÉRALITÉS 73

est un autre paramétrage. Comme sin θ = 1 − cos2 θ pour θ ∈]0, π[, on a γ(cos θ) =
η(θ), i.e. η = γ ◦ u où u :]0, π[→] − 1, 1[ est défini par u(θ) = cos θ . Il est immédiat
que u est C ∞ et bijective, de plus u′ (θ) = − sin(θ) ̸= 0 ∀θ ∈]0, π[ : il s’ensuit que
u−1 est aussi C ∞ . Donc γ et η sont des paramétrages équivalents (de classe C ∞ ) .
Enfin, (
]0, +∞[→ R2
δ: 1−s2 2s
s 7→ ( 1+s 2 , 1+s2 )

est aussi un paramétrage de S+ équivalent à γ. En effet on laisse en exercice la


vérification que (
] − 1, 1[→]0, +∞[
v: q
t 7→ 1−t1+t

est bijective, de classe C ∞ , d’inverse C ∞ . Si l’on pose s = v(t), on trouve que


q
1−t
1−s 2
2s 2 1+t √ √ √
2
= t, 2
= 2 = 1 − t 1 + t = 1 − t2
1+s 1+s 1+t

et donc δ ◦ v(t) = γ(t) pour tout t ∈] − 1, 1[.


Remarque 4.10. Finalement, la trace d’une courbe ne serait pas le plus important ?
Démontrer que deux courbes équivalentes ont la même trace. Ainsi, la trace d’une
courbe est indépendante de la paramétrisation de celle-ci !

4.1.2 Orientation
Soient (I, γ) et (J, η) deux courbes paramétrées de Rn , de classe C k et u : I → J
un changement de paramétrage. Comme u′ (t) ̸= 0 ∀t ∈ I, on a soit u′ > 0 sur I
et u est strictement croissante, soit u′ < 0 sur I et u est strictement décroissante.
Définition 4.11. On dit que u préserve l’orientation si ∀t ∈ I, u′ (t) > 0. On dit
que u renverse l’orientation si ∀t ∈ I, u′ (t) < 0.
Une courbe paramétrée orientée est une classe d’équivalence de courbes paramé-
trées pour la relation suivante : (I, γ) ∼ (J, η) si et seulement si γ et η sont
équivalentes par une changement de paramètre u : I → J qui préserve l’orienta-
tion.
Remarque 4.12. Une relation d’équivalence est une relation qui est symétrique
(xRy ⇔ yRx), réflexive (xRx) et transitive (xRy et yRz ⇒ xRz).
Exemple 4.13. Les courbes γ et η de l’exemple 4.9 sont équivalentes, mais le
changement de paramétrage renverse l’orientation, puisque
η = γ ◦ u, u(θ) = cos θ, cos′ θ = − sin θ < 0, ∀θ ∈]0, π[.
Ces deux courbes paramétrées orientées sont différentes, elles n’appartiennent pas
à la même classe d’équivalence.
74 CHAPITRE 4. COURBES PARAMÉTRÉES

4.2 Tangente et plan osculateur


On va considérer par la suite uniquement des courbes C ∞ . Le lecteur adaptera
sans difficulté les définitions et résultats au cas des courbes C k , modulo les mo-
difications de rigueur. On rappelle que si (I, γ) est une courbe paramétrée de
Rn ,
def (k)
γ (k) = (γ1 , . . . , γn(k) )
où les dérivées des composantes de γ sont des dérivées de fonctions numériques
d’une variable réelle.
Définition 4.14. Soit (I, γ) une courbe paramétrée de Rn . On dit que γ admet
une tangente en t0 ∈ I s’il existe k ∈ N∗ tel que γ (k) (t0 ) ̸= 0. La tangente à
la courbe paramétrée à l’instant t0 est alors la droite passant par t0 de vecteur
directeur γ (p) (t0 ), où p est le plus petit entier ≥ 1 tel que γ (p) (t0 ) ̸= 0.
Définition 4.15. On dit que t0 est un point régulier, ou non stationnaire, si
γ ′ (t0 ) ̸= 0. Dans ce cas la tangente a pour vecteur directeur γ ′ (t0 ).
Exemple 4.16. (1) Le cercle γ(t) = (cos t, sin t) vérifie γ ′ (t) = (− sin t, cos t). On
a ∥γ ′ (t)∥ = 1 pour tout t donc tout point est régulier.

(2) Soit γ(t) = (t2 , t3 ), t ∈ R. Si t ̸= 0, on a γ ′ (t) = (2t, 3t2 ) ̸= (0, 0) mais


γ ′ (0, 0) = 0. Par contre, γ ′′ (0) = (2, 0) : on a tout de même une tangente en γ(0),
de direction donnée par e1 = (1, 0).
4.2. TANGENTE ET PLAN OSCULATEUR 75

Définition 4.17. Soit (I, γ) une courbe paramétrée. Supposons qu’elle admette
une tangente en t0 . Soit p le plus petit entier ≥ 1 tel que γ (p) (t0 ) ̸= 0. On dit que
γ admet un plan osculateur en t0 s’il existe k > p tel que γ (p) (t0 ) et γ (k) (t0 ) soient
linéairement indépendants. Dans ce cas, le plan osculateur est le plan engendré
par les vecteurs γ (p) (t0 ) et γ (k) (t0 ) passant par γ(t0 ).
Remarque 4.18. Attention, une courbe paramétrée peut avoir des points muliples,
i.e. il peut exister t1 < t2 tels que γ(t1 ) = γ(t2 ) dans Rn . Il se peut, dans ce cas,
que la tangente en t1 soit différente de la tangente en t2 .

4.2.1 Étude locale des courbes planes


Soit γ : I → R2 une courbe plane. Supposons que γ admette un plan osculateur en
t0 (ce plan est donc nécessairement R2 tout entier). On note p < q les plus petits
entiers tels que (γ (p) (t0 ), γ (q) (t0 )) soit libre. Notez que si p > 1, nécessairement,
tous les γ (k) (t0 ) pour 1 ≤ k < p sont nuls. On écrit la formule de Taylor à l’ordre
q de
t 7→ γ(t) = (x(t), y(t)).
On a alors
q−1
γ (p) (t0 ) p
X γ (k) (t0 )
γ(t) = γ(t0 ) + 0 + (t − t0 ) + (t − t0 )k
p! k=p+1
k!
| {z }
colinéaire à γ (p) (t0 )
(q)
γ (t0 )
+ (t − t0 )q + O(t − t0 )q+1 .
q!
(p) (q)
Posons e1 = γ p!(t0 ) et e2 = γ q!(t0 ) . Alors (e1 , e2 ) est une base de R2 . On appelle
sécante la droite passant par γ(t0 ) et de vecteur directeur e2 . Par définition de
(k)
e1,2 si k = p + 1, . . . , q − 1 on a γ k!(t0 ) = λk e1 . La formule de Taylor peut donc se
réécrire

γ(t) = γ(t0 ) + v1 (t − t0 )p (1 + λp+1 (t − t0 ) + . . . )


+ v2 (t − t0 )q + O(t − t0 )q+1 .
76 CHAPITRE 4. COURBES PARAMÉTRÉES

Dans la base (e1 , e2 ), on a finalement


γ(t) − γ(t0 ) = X(t)v1 + Y (t)v2
avec
X(t) = (t − t0 )p (1 + O(t − t0 ))
Y (t) = (t − t0 )q (1 + O(t − t0 )).
Lemme 4.19. Pour t suffisamment proche de t0 , 1 + O(t − t0 ) est du signe de 1,
donc positif.

Démonstration. Ce raisonnement est un rappel de première année. Par définition,


il existe M ≥ 0 tel que
|O(t − t0 )| ≤ M |t − t0 | ⇔ −M |t − t0 |O(t − t0 ) ≤ M |t − t0 |.
On a donc
1 − M |t − t0 | ≤ 1 + O(t − t0 ) ≤ 1 + M |t − t0 |.
Si |t − t0 | < ϵ , on trouve en particulier que
1 + O(t − t0 ) ≥ 1 − M ϵ.
1
Il suffit alors de prendre par exemple ϵ < 2M
, ce qui donne
1
|t − t0 | < ϵ ⇒ 1 + O(t − t0 ) > 1 − M = 1/2 > 0.
2M

D’après le lemme, pour t suffisamment proche de t0 , le signe de X(t) est donné


par celui de (t − t0 )p , et celui de Y (t) par celui de (t − t0 )q . Si t → t+
0 , c’est à dire
t proche de t0 et t > t0 , on aura toujours X(t) > 0 et Y (t) > 0 (figure).
Par contre, si t → t−
0 , c’est à dire t proche de t0 et t < t0 , il faut étudier les signes
de X(t) et Y (t) selon la parité respective de p et q.
— Cas p impair et q pair. Alors (t − t0 )p < 0 et (t − t0 )q > 0 donc X(t) < 0
et Y (t) > 0. La courbe reste du même côté de la tangente et traverse la
sécante. On dit qu’on a une configuration de point ordinaire.
— Cas p impair et q impair. Dans ce cas, (t − t0 )p < 0 et (t − t0 )q < 0 donc
X(t) et Y (t) < 0 : la courbe traverse la tangente et la sécante : on dit qu’on
a un point d’inflexion.
— Cas q pair et q impair : on a alors X(t) > 0 et Y (t) < 0. La courbe
traverse la tangente et reste du même côté de la sécante. On a un point de
rebroussement de première espèce.
— Cas p et q pairs : on a X(t), Y (t) > 0 : la courbe reste du même côté de
la tangente et de la sécante : on dit qu’on a un point de rebroussement de
deuxième espèce.
4.2. TANGENTE ET PLAN OSCULATEUR 77

Figure 4.3 – À gauche, γ(t) pour t > t0 . À droite, une configuration de point
ordinaire (p impair et q pair).

Figure 4.4 – Point d’inflexion (en haut). Point de rebroussement de première


espèce (en bas à gauche), de deuxième espèce (en bas à droite).
78 CHAPITRE 4. COURBES PARAMÉTRÉES

4.3 Étude pratique des courbes planes


On note
γ(t) = (x(t), y(t)).

Réduction éventuelle du domaine d’étude : périodicité, parité.


– Si les fonctions x et y sont impaires, alors γ(−t) = −γ(t) et la courbe s’en déduit
par symétrie par rapport à l’origine.

– Si x est impaire et y est paire,


 
−x(t)
γ(−t) =
y(t)

et la courbe est symétrique par rapport à l’axe Oy.

– Si x est paire et y est impaire,


 
x(t)
γ(−t) =
−y(t)

et la courbe est symétrique par rapport à l’axe Ox.


4.3. ÉTUDE PRATIQUE DES COURBES PLANES 79

Figure 4.5 – Asymptote verticale x = ℓ et horizontale y = ℓ.

- Si x et y sont paires, il suffit d’étudier la courbe pour t ≥ 0 ou t ≤ 0.


Etude locale près des points stationnaires.
Soit t0 un point stationnaire, c’est à dire tel que γ ′ (t0 ) = 0. On fait un dévelop-
pement limité de γ(t) en t0 :
     ′   (2) 
x(t) x(t0 ) x (t0 ) 1 2 x (t0 )
= + (t − t0 ) + (t − t0 ) + ...
y(t) y(t0 ) y ′ (t0 ) 2! y (2) (t0 )
 
N ϵ1 (t − t0 )
+ (t − t0 ) .
ϵ2 (t − t0 )
L’ordre N est choisi sufisamment grand pour qu’on puisse appliquer les résultats
de la section 4.2.1.
Notons que si la courbe est régulière (γ ′ ̸= 0) alors elle n’a pas de point de rebrous-
sement. En effet, si toutes les autres dérivées sont nulles, il s’agit localement d’une
portion de droite. Sinon, on note que p = 1 avec les notations de la section 4.2.1
et l’on a, suivant la parité de q < ∞, un point ordinaire ou un point d’inflexion.
Étude des branches infinies :
S’il existe t0 tel que
lim x(t) = ℓ < ∞ et lim− y(t) = ±∞,
t→t−
0 t→t0

la droite d’équation x = ℓ est asymptote à la courbe.


Exercice 4.20. Déterminer ce qui se passe pour les cas limt→t−0 x(t) = ±∞ et
limt→t−0 y(t) = ℓ. Même question pour t → t+
0.

t→t−
0
Si x(t), y(t) −−−→ ±∞, on détermine la limite éventuelle du quotient y(t)/x(t).
Si limt−0 y/x = a, on dit que y = ax est direction asymptotique. Dans ce cas on
calcule la limite éventuelle de y(t) − ax(t), si cette limite est finie et vaut b, la
droite y = ax + b est asymptote à la courbe.
80 CHAPITRE 4. COURBES PARAMÉTRÉES

Si limt−0 y(t) − ax(t) = ±∞ on dit que la courbe a une branche parabolique.



Par exemple, la courbe γ(t) = (t, t) a une branche parabolique, c’est d’ailleurs
toujours le cas si a = 0.

Si limt−0 y/x = ±∞, alors la droite x = 0 est direction asymptotique, et on a aussi


une direction parabolique.
Remarque 4.21. Une courbe peut « partir à l’infini » sans direction asymptotique :
considérer la spirale
γ(t) = (t cos t, t sin t), t ≥ 0.
4.3. ÉTUDE PRATIQUE DES COURBES PLANES 81

Une fois les études précédentes réalisées, on peut tracer un tableau de variation et
esquisser l’allure de la courbe.
Exemple 4.22. Considérons
t2 t3
t 7→ ( , ).
1 + t3 1 + t3
Il n’y a pas de symétrie particulière et de réduction du domaine d’étude associé.
On calcule
2t − t4 3t2
x′ (t) = , y ′
(t) = .
(1 + t3 )2 (1 + t3 )2

Le seul point stationnaire (qui vérifie donc x′ (t0 ) = y ′ (t0 ) = 0) est t0 = 0. Un


développement limité donne

x(t) = t2 + o(t4 ), y(t) = t3 + o(t5 )

donc    
2 1 3 0
γ(t) = t +t + o(t3 ).
0 1
Avec les notations de la section 4.2.1 on trouve p = 2 et q = 3. C’est un point
  de
1
rebroussement de première espèce. La tangente est donnée par le vecteur .
0
Pour t → 0, on a x(t) > 0 et y(t) du signe de t.
Les branches infinies se remarquent pour t → −1 : dans ce cas, lim−1 |x| = +∞
et lim−1 |y| = +∞. On calcule s’il y a une direction asymptotique :
y(t) t→−1
= t −−−→ −1.
x(t)
Donc y = −x est direction asymptotique. On calcule ensuite
1
lim y(t) − (−x(t)) =
t→−1 3
82 CHAPITRE 4. COURBES PARAMÉTRÉES

(exercice !), on en conclut que la droite y = −x + 13 est asymptote. Un développe-


memt limité de y(t) + x(t) − 1/3 en t = −1 donne :

1
y(t) + x(t) − 1/3 = − (t + 1) + O((t + 1)2 )
3
1
= − (t + 1)(1 + o(1))
3

qui est du signe de t + 1 lorsque t → −1. La courbe est au dessus de l’asymptote


pour t → −1+ , au dessous pour t → −1− .

On calcule facilement que y ′ (t) > 0 pour tout t, et

1
x′ (t) > 0 ⇔ t(2 − t3 ) > 0 ⇔ t ∈]0, 2 3 [.

Les limites en ±∞ se calculent aussi :

lim (x(t), y(t)) = (0, 1), lim (x(t), y(t)) = (0, 1).
t→−∞ t→+∞

Ces considérations permettent de dresser éventuellement un tableau de variations,


et d’esquisser l’allure de la courbe.
4.4. LONGUEUR D’ARC ET PARAMÉTRAGE NATURELS 83

4.4 Longueur d’arc et paramétrage naturels


Soit γ : [a, b] → Rn une courbe paramétrée C 1 . On veut définir la longueur de la
courbe. Une idée est de subdiviser l’intervalle [a, b] en N sous-intervalles
b−a
[a + jh, a + (j + 1)h], j = 0 . . . N − 1, h= .
N
Si tj = a + jh, la réunion des segments [γ(tj ), γ(tj+1 )] approxime la courbe. On
note, pour x = (x1 , . . . , xn ) vecteur de Rn ,
v
u n
uX
∥x∥ = t x2i .
i=1

Alors la ligne brisée ∪j [γ(tj ), γ(tj+1 )] a pour longueur


N −1
def
X
∥γ(tj+1 ) − γ(tj )∥ = LN (γ).
j=0

On voudrait définir la longueur de la courbe comme étant la limite de LN lorsque


N → +∞. Le problème est de montrer que cette limite existe, et d’obtenir une
expression pour celle-ci.
Proposition 4.23. Soit γ : [a, b] → R une courbe C 1 , tj et LN comme ci-dessus.
def
Alors L(γ) = limN →∞ LN (γ) existe et vaut
Z b
L(γ) = ∥γ ′ (t)∥dt.
a

Démonstration. On donne la démonstration dans le cas où γ est C 2 . Soit γi :


[a, b] → R la i-ème composante de γ et

Mi = sup |γi′′ (t)|.


[a,b]
84 CHAPITRE 4. COURBES PARAMÉTRÉES

La formule de Taylor à l’ordre 2 entraîne que pour tout t ∈ [a, b], h ∈ R tel que
a ≤ t + h ≤ b,
Mi 2
|γi (t + h) − γi (t) − hγi′ (t)| ≤ h.
2
On en déduit que
M 2
∥γ(t + h) − γ(t) − γ ′ (t)h∥ ≤ h
2
1/2
où M = ( i Mi2 ) , et donc, d’après la deuxième inégalité triangulaire,
P

M 2
|∥γ(t + h) − γ(t)∥ − ∥γ ′ (t)h∥| ≤ h.
2
b−a
Appliquons ceci avec t = tj , h = N
. On obtient, pour tout j = 0 . . . N − 1 :
b−a ′ M (b − a)2
∥γ(tj+1 ) − γ(tj )∥ − ∥γ (tj )∥ ≤ .
N 2 N2
Alors,
N −1 N −1
X b−a X b−a
LN − ∥γj′ (tj )∥ = ∥γ(tj+1 ) − γ(tj )∥ − ∥γ(tj )∥
j=0
N j=0
N
N −1
X b−a
≤ ∥γ(tj+1 ) − γ(tj )∥ − ∥γ(tj )∥
j=0
N
N −1
X M (b − a)2 M b−a
≤ ≤ .
j=0
2 N2 2 N

On rappelle maintenant ce résultat de première année : si f : [a, b] → R est une


fonction continue, alors
N −1   Z b
X b − a b − a N →∞
f a+j −−−→ f (t)dt.
j=0
N N a

(Le membre de gauche est une somme de Riemmann de f ). Il suffit pour conclure
d’appliquer ceci à f (t) = ∥γ ′ (t)∥.
Rb
Remarque 4.24. Les sommes de Riemmann de limite a f ne sont pas uniques, il
existe d’autres subdivisions donnant la même limite. Par exemple, il suffit d’avoir
une subdivision qui vérifie
N →+∞
max |tj+1 − tj | −−−−→ 0.
j

Définition 4.25. On appelle longueur de la courbe paramétrée γ : [a, b] → Rn ,


ou longueur d’arc, le nombre
Z b
L(γ) = ∥γ ′ (t)∥dt.

4.4. LONGUEUR D’ARC ET PARAMÉTRAGE NATURELS 85

Dans le cas d’une courbe paramétrée définie


R sur un intervalle non borné I, on
définit L(γ) comme l’intégrale impropre I ∥γ(t)∥dt, lorsque celle-ci converge.
Exemple 4.26. Longueur de l’hélice. Soit γ : [0, 2nπ] → R3 donnée par
t 7→ γ(t) = (r cos t, r sin t, kt).
On calcule
 
−r sin t q √
γ ′ (t) =  r cos t  , ′
∥γ (t)∥ = r2 (cos2 t + sin2 t) + k 2 = r2 + k 2 .
k
On trouve Z 2nπ √ √
L(γ) = r2 + k 2 dt = 2nπ r2 + k 2 .
0
Notez le cas particulier k = 0 pour lequel on obtient un cercle de rayon r parcouru
n fois. Si n = 1, on retrouve le périmètre bien connu 2πr.
Proposition 4.27. La longueur d’arc d’une courbe est invariante par changement
de paramètre, c’est à dire que si (I, γ) et (J, γ̃) sont deux courbes équivalentes (de
classe C 1 ), alors
L(γ) = L(γ̃).

Démonstration. Notons u : I → J le changement de paramètre tel que


γ = γ̃ ◦ u.
Puisque u est une bijection, pour [a, b] ⊂ I il existe [c, d] ⊂ J tel que u([a, b]) =
[c, d]. Notons γ|[a,b] et γ̃|[c,d] les restrictions de γ et γ̃ à ces intervalles. Comme
γ ′ (t) = (γ̃ ◦ u)′ = η ′ (u(t))u′ (t)
on a Z b Z b

L(γ|[a,b] ) = ∥γ (t)∥dt = ∥γ̃ ′ (u(t))∥|u′ (t)|dt.
a a
Or u est continue, bijective [a, b] → [c, d]. On sait alors que soit u est croissante et
donc u′ ≥ 0 sur I, soit u est décroissante et donc u′ ≤ 0 sur I. Dans le premier cas,
u′ = |u′ | et u(a) = c, u(b) = d et donc par un changement de variable s = u(t),
Z d Z b

L(γ̃|[c, d]) = ∥γ̃ (s)∥ds = ∥γ̃ ′ (u(t))∥u′ (t)dt = L(γ|[a,b] ).
c a
′ ′
Dans le second cas, u = −|u | mais u(a) = d tandis que u(b) = c, d’où
Z d=u(a) Z a

L(γ̃|[c, d]) = ∥γ̃ (s)∥ds = ∥γ̃ ′ (u(t))∥u′ (t)dt
c=u(b) b
Z a
=− ∥γ̃ ′ (u(t))∥|u′ (t)|dt
b
= L(γ|[a,b] ).
86 CHAPITRE 4. COURBES PARAMÉTRÉES

Définition 4.28. Soit (I, γ) une courbe paramétrée régulière (i.e. telle que γ ′ (t) ̸=
0, ∀t ∈ I). On dit que γ est un paramétrage naturel, ou paramétrage par l’abscisse
curviligne, ou par la longueur d’arc, si

∀t ∈ I, ∥γ ′ (t)∥ = 1.

Proposition 4.29. Soit (I, γ) une courbe paramétrée régulière. Il existe un pa-
ramétrage naturel de (I, γ) ayant la même orientation. De plus deux tels para-
métrages se déduisent l’un de l’autre par translation, c’est à dire que si (J, η) et
(J1 , η1 ) sont deux paramétrage naturels équivalents de même orientation, alors il
existe s0 tel que η1 (s) = η(s + s0 ) et J1 = J + s0 = {s + s0 , s ∈ J}.

Démonstration. Notons que toute bijection u : I → J induit un changement de


paramétrage (J, η) avec η = γ ◦ u−1 .
Existence : on cherche u : I → J un changement de paramètre tel que γ(t) =
η(u(t)) et ∥η ′ (s)∥ = 1, ∀s ∈ J. Or, ceci implique γ ′ (t) = η ′ (u(t))u′ (t) d’où
∥γ ′ (t)∥ = ∥η ′ (u(t))∥|u′ (t)|. Si l’on veut que u préserve l’orientation, on doit avoir
u′ (t) > 0 ∀t et comme ∥η ′ (s)∥ = 1 puisque l’on veut un paramétrage est naturel,
on trouve que η est un paramétrage naturel de même orientation si et seulement
si
∀t ∈ I, u′ (t) = ∥γ ′ (t)∥.
Si t0 ∈ I est fixé, on définit
Z t
u(t) = ∥γ ′ (t)∥dt.
t0

Si γ est de classe C k , k ≥ 1 alors γ ′ est de classe C k−1 . Comme γ ′ (t) ̸= 0 ∀t ∈ I,


la fonction X
t 7→ (γi′ (t))2

est C k−1 à valeurs dans R \ {0}. Comme x 7→ x est C ∞ sur R \ {0}, on en déduit
que t 7→ ∥γ ′ (t)∥ est C k−1 , donc u est C k . De plus, u′ (t) = ∥γ ′ (t)∥ > 0 donc u
est strictement croissante. On sait alors que c’est un changement de paramétrage
qui préserve l’orientation puisque u′ (t) > 0 ∀t. Le paramétrage recherché est
η = γ ◦ u−1 : J → Rn .
Unicité aux translations près : si η1 est un autre paramétrage naturel avec γ =
η1 ◦ u1 on a comme noté ci-dessus ∥γ ′ (t)∥ = |u′1 (t)| et si u1 préserve l’orientation,
u′1 > 0 d’où u′1 = ∥γ ′ (t)∥ = u′ (t). D’où u′1 − u′ = 0 et u(t) = u1 (t) + C où C est
une constante.
Exemple 4.30. On reprend l’hélice t 7→ γ(t) = (r cos t, r sin t, kt) de R → R3 . On
cherche un paramétrage naturel, c’est à dire s 7→ η(s) ∈ R3 tel que ∥η ′ (s)∥ = 1 et
qu’il existe u : R → R changement de paramètre avec

γ(t) = η ◦ u(t), ∀t ∈ R.
4.5. COURBURE DANS LE PLAN 87
√ √
On a vu que u′ (t) = ∥γ ′ (t)∥ = r2 + k 2 . Prenons donc u(t) = t r2 + k 2 . C’est
bien une bijection croissante, avec u−1 (s) = √r2s+k2 .D’après ce qui précède,

η(s) = γ ◦ u−1 (s) = γ(s(r2 + k 2 )−1/2 )


     
s s s
= r cos √ , r sin √ ,k√ .
r2 + k2 r2 + k2 r2 + k2

4.5 Courbure dans le plan

4.5.1 Repère mobile


Si v ∈ R2 , on note
   
0 −1 ⊥ def 0 −1
σ= , v = v = σv.
1 0 1 0
On vérifie en coordonnées que
   
v1 ⊥ −v2
v= ⇒v = .
v2 v1

Donc ⟨v, v ⊥ ⟩ = 0, ∥v ⊥ ∥ = ∥v∥ et det(v, v ⊥ ) = +1 : on en conclut que (v, v ⊥ ) est


une base orthonormée directe du plan (on rappelle qu’une base de Rn est directe,
si le déterminant de son système de vecteurs est positif).
Enfin, rappelons que si R2 = F ⊕ G est une décomposition orthogonale pour le
produit scalaire usuel avec F = Vect(u), G = Vect(v), et u, v orthonormés, alors
pour tout x ∈ R2 on a la décomposition unique
x = αu u + αv v,
et l’on a les formules :
⟨x, u⟩ = ⟨αu u, u⟩ + 0 = αu ⟨u, u⟩ = αu ,
⟨x, v⟩ = ⟨αv v, v⟩ + 0 = αv ⟨v, v⟩ = αv .
Définition 4.31. Soit (I, γ) une courbe paramétrée régulière. Pour tout s ∈ I,
on pose
γ ′ (s)
t(s) = ′ , n(s) = t(s)⊥ .
∥γ (s)∥
Le vecteur t(s) est le vecteur tangent unitaire à γ à l’instant s, tandis que n(s)
est le vecteur normal unitaire à γ à l’instant s.
On pose ensuite
Rγ (s) = (γ(s); (t(s), n(s))) ∈ R2 × R2 × R2 .
On dit que Rγ (s) est le repère mobile de la courbe γ à l’instant s.
88 CHAPITRE 4. COURBES PARAMÉTRÉES

Exemple 4.32. Dans le cas d’un graphe s 7→ (s, f (s)) on trouve



   
√ 1′ 2 √−f (s)
1+f (s)
t(s) =  ′  , n(s) =  1+f1 ′ (s)2 
√ f (s)′ 2 √ ′ 2
1+f (s) 1+f (s)

Dans le cas du cercle γ(θ) = (r cos θ, r sin θ) on trouve


   
− sin θ − cos θ
t(θ) = , n(θ) = .
cos θ − sin θ
Lemme 4.33. Soit (J, η) une courbe équivalente à (I, γ) et u : I → J le chan-
gement de paramètre tel que γ = η ◦ u. Alors, le repère mobile de γ à l’instant s
vérifie
(i) Rγ (s) = Rη (u) si γ, η ont la même orientation (ici u = u(s))
(ii) Rη (u) = (γ(s), −t(s), −n(s)) si γ et η ont des orientations opposées.

Démonstration. On a
γ ′ (s) = η ′ (u(s))u′ (s)
Supposons que les orientations soient les mêmes, alors u′ = |u′ | et l’on en tire
∥γ ′ ∥ = ∥η ′ ∥u′ . Par suite,
γ′ η′
= × 1,
∥γ ′ ∥ ∥η ′ ∥
donc les tangentes unitaires coïncident (et les normales aussi, après mutiplication
par la matrice σ). Si les orientations sont opposées, |u′ | = −u′ et l’on trouve
γ′ η′
= × (−1).
∥γ ′ ∥ ∥η ′ ∥

4.5.2 Courbure algébrique


Lemme 4.34. Soient f, g deux fonctions dérivables de R → Rn . Alors
d
⟨f (t), g(t)⟩ = ⟨f ′ , g⟩ + ⟨f, g ′ ⟩.
dt
Démonstration. On calcule
n
d d X
⟨f (t), g(t)⟩ = fi (t)gi (t)
dt dt i=1
n
X
= fi′ (t)gi (t) + fi (t)gi′ (t)
i=1
= ⟨f ′ , g⟩ + ⟨f, g ′ ⟩.
4.5. COURBURE DANS LE PLAN 89

Corollaire 4.35. Soit f : R → Rn dérivable, telle que ∥f (t)∥ est constante. Alors

∀t, ⟨f ′ (t), f (t)⟩ = 0.

En effet, il suffit d’appliquer le lemme précédent avec f = g : la symétrie du


produit scalaire donne alors
d
⟨f, f ⟩ = cst ⇒ ⟨f, f ⟩ = ⟨f ′ , f ⟩ + ⟨f, f ′ ⟩ = 2⟨f, f ′ ⟩ = 0.
dt

Comme application de ce principe, soit (I, γ) une courbe C ∞ paramétrée par


la longueur d’arc s. On note t(s) le vecteur tangent. Alors, ∥t(s)∥ = 1 est une
constante et d’après ce qui précède, t′ (s) ⊥ t(s) : le vecteur t′ (s) est donc dans l’hy-
perplan orthogonal à t(s), ici en dimension 2 il s’agit simplement de Vect(n(s)).Par
conséquent, t′ (s) est nécessairement colinéaire à n(s) : il existe donc un nombre
κ∗ (s) ∈ R unique tel que
t′ (s) = κ∗ (s)n(s).
Remarque 4.36. Attention : en général, t′ (s) et γ ′′ (s) ne sont pas colinéaires, sauf
si t(s) = γ ′ (s), auquel cas t′ (s) = γ ′′ (s). On pourra faire quelques calculs sur un
exemple pour s’en√convaincre. Soitγ(s) = (s2 , s). On trouve que γ ′ (s) = (2s, 1)
qui est de norme 4s2 + 1. On a γ ′′ (s) = (2, 1) mais
2s 1
t(s) = ( √ ,√ )
4s + 1 4s2 + 1
2

et donc

′ 8s 1 1 16s2 8s
t (s) = 2 3/2
(2s, 1) + √ (2, 0) = √ ( 2 + 2, 2 )
(4s + 1) 2
4s + 1 4s + 1 4s + 1
2 4s + 1

qui n’est pas colinéaire à (2, 1) en général.

Définition 4.37. On appelle courbure algébrique de (I, γ) le réel κ∗ (s). C’est une
fonction C ∞ sur I (plus généralement, κ∗ est de classe C k−1 si γ est de classe C k ).
On appelle courbure de (I, γ) le nombre positif
def
κ(s) = |κ∗ (s)| ≥ 0.

Il est possible de trouver des expressions pour la courbure algébrique. Attention,


la proposition suivante concerne les paramétrage naturels :

Proposition 4.38. Si γ est paramétrée par la longueur d’arc, on a les formules :

t′ (s) = κ∗ (s)n(s), κ∗ (s) = ⟨t′ (s), n(s)⟩,

κ∗ (s) = −⟨t(s), n′ (s)⟩, n′ (s) = −κ∗ (s)t(s).


90 CHAPITRE 4. COURBES PARAMÉTRÉES

Démonstration. La première formule est la définition. Pour la deuxième, il suffit


de faire le produit scalaire avec n(s) dans la définition :

⟨t′ (s), n(s)⟩ = κ∗ (s)⟨n(s), n(s)⟩ = κ∗ (s) × 1.

Comme ⟨t(s), n(s)⟩ = 0, en dérivant ceci par rapport à s on trouve que ⟨t′ , n⟩ +
⟨t, n′ ⟩ = 0. Il s’ensuit que l’on a aussi

κ∗ (s) = −⟨t(s), n′ (s)⟩.

Enfin, comme la matrice σ ne dépend pas de s,


   
0 −1 ′ 0 −1
n(s) = t(s) ⇒ n (s) = t′ (s) = t′ (s)⊥ .
1 0 1 0
Mais alors
 
′ ⊥ ∗ ⊥ 0 −1
t (s) = κ (s)n(s) = κ∗ (s)n(s) = κ∗ (s)σ 2 n(s) = −κ∗ (s)t(s)
1 0

puisque σ 2 = − Id.

Exemple 4.39. Le cercle de centre 0 et de rayon R, parcouru dans le sens trigo-


nométrique et paramétré par la longueur d’arc est donné par la courbe
s s
γ(s) = (R cos , R sin ), s ∈ [0, 2πR].
R R
On calcule
− sin Rs − cos Rs
   
t(s) = , n(s) =
cos Rs − sin Rs
et
cos Rs
 
′ −1 1
t (s) = = n(s).
R sin Rs R
Donc κ∗ (s) = 1
R
, et ce pour tout s ∈ [0, 2π].

Définition 4.40. Le rayon de courbure en s est défini par

def 1
R(s) = .
|κ∗ (s)|

Le centre de courbure est


def 1
Cγ (s) = γ(s) + n(s).
κ∗ (s)

On dit que le cercle de centre Cγ (s) et de rayon R(s) est le cercle osculateur de γ
en s.
4.5. COURBURE DANS LE PLAN 91

Dans le cas d’un paramétrage quelconque, le calcul de la courbure se fait comme


suit. On commence par prendre un paramétrage par la longueur d’arc (J, η) équi-
valent à (I, γ) et de même orientation :

γ = η ◦ u, u : I → J, u′ = 0.

On définit κ∗γ courbure de γ à l’instant τ ∈ I par

def
κ∗γ (τ ) = κ∗η (u(τ )),

cette dernière quantité étant bien définie précédemment puisque η est paramétrée
naturellement.

Proposition 4.41. Soit (I, γ) une courbe paramétrée régulière. Notons


 
x(t)
γ(t) = .
y(t)

Alors, la courbure algébrique est donnée par

x′ x′′

′ ′′
det(γ (τ ), γ (τ )) y ′ y ′′
κγ (τ ) = = ′2 .
∥γ ′ (τ )∥3 (x + y ′2 )3/2

Démonstration. En exercice ! Méthode : Poser η ◦ u = γ avec η paramétrage par la


longueur d’arc préservant l’orientation, et calculer la courbure de η en exprimant
toutes les quantités en fonction de γ.
Remarque 4.42. Cette formule est évidemment valable dans le cas d’un para-
métrage par la longueur d’arc, elle se réduit alors à la troisième formule de la
proposition 4.38.

Nous allons maintenant nous intéresser à la position de la courbe par rapport à


sa tangente en un point, dans le cas d’une courbure non nulle en ce point.
On commence par rappeler que droite D du plan passant par un point a ∈ R2
et de vecteur directeur u sépare R2 en deux demi-plans ouverts disjoints. On
peut distinguer ces deux demi-plans de la manière suivante : si M ∈ R2 , on pose
n = σu = u⊥ et

D+ = {m ∈ R2 , ⟨m − a, n⟩ > 0}, D− = {m ∈ R2 , ⟨m − a, n⟩ < 0}.

Ces deux ensembles sont clairement disjoints, et si x ∈ R2 \ (D− ∪ D+ ) alors


nécessairement
⟨x − a, n⟩ = 0,
c’est à dire que x − a est colinéaire à u (ce raisonnement n’est valable qu’en
dimension 2 bien sûr).
92 CHAPITRE 4. COURBES PARAMÉTRÉES

Remarque 4.43. Il est possible de fermer ces demi plans, qui s’intersectent alors
en D, en demandant des inégalités larges dans les produits scalaires.
Voici la description attendue de la courbe au voisinage d’un point de courbure
non nulle :
Proposition 4.44. Soit (I, γ) une courbe paramétrée régulière et s0 ∈ I. Suppo-
sons que κ∗ (s0 ) ̸= 0. Il existe un intervalle ouvert I0 contenant s0 tel que γ(I0 )
soit contenu dans l’un des demi-plans fermés délimités par la tangente en γ(s0 ).
Plus précisément, si la courbure est positive, la courbe se situe dans le demi-plan
qui contient le point γ(s0 ) + n(s0 ), c’est à dire le demi-plan
D+ (s0 ) = {m ∈ R2 , ⟨m − a, n(s0 )⟩ > 0}.
Si la courbure est négative, la courbe est localement dans le demi-plan D− (s0 ), qui
contient le point γ(s0 ) − n(s0 ).

Démonstration. Quitte à changer de paramétrage, on peut supposer que γ est


paramétrée par l’abscisse curviligne. On a, d’après la formule de Taylor,
1
γ(s) = γ(s0 ) + γ ′ (s0 )(s − s0 ) + γ ′′ (s0 )(s − s0 )2 + O((s − s0 )3 )
2
1 ∗
= γ(s0 ) + t(s0 )(s − s0 ) + κ (s0 )n(s0 )(s − s0 )2 + O((s − s0 )3 ).
2
Il suffit de faire le produit scalaire avec n(s0 ), ce qui donne
1
⟨(γ(s) − γ(s0 )), n(s0 )⟩ = κ∗ (s0 )(s − s0 )2 (1 + O(s − s0 )).
2
Or, pour s assez proche de s0 , et s ̸= s0 , on a 1 + O(s − s0 ) > 0 car O(s − s0 ) → 0.
Donc :
1. si κ∗ (s0 ) > 0, pour s assez proche de s0 et s ̸= s0 on a ⟨(γ(s)−γ(s0 )), n(s0 )⟩ >
0 et γ(s) − γ(s0 ) est dans le demi plan {x : ⟨x, n(s0 )⟩ > 0}.
2. si κ∗ (s0 ) < 0, pour s assez proche de s0 et s ̸= s0 on a ⟨(γ(s)−γ(s0 )), n(s0 )⟩ <
0 et γ(s) − γ(s0 ) est dans le demi plan {x : ⟨x, n(s0 )⟩ < 0}.
4.5. COURBURE DANS LE PLAN 93

Ci-dessus, une courbe paramétrée de courbure positive au voisinage d’un point. Les
vecteurs t′ (s) et n(s) sont de même direction, de manière équivalente κ∗ (s) > 0.
On a représenté le cercle osculateur de centre C. Localement, la courbe est dans
le demi-plan D+ : en effet, ⟨γ(s + h) − γ(s), n(s)⟩ > 0 pour h proche de s. Ainsi,
en courbure positive, la courbe est bien localement dans le demi-plan qui contient
le cercle osculateur.

En cas de courbure négative au voisinage d’un point, les vecteurs t′ (s) et n(s)
sont de direction opposée, de manière équivalente κ∗ (s) < 0. La situation est
représentée ci-dessous. Localement, la courbe est dans le demi-plan D− : en effet,
⟨γ(s + h) − γ(s), n(s)⟩ < 0 pour h proche de s. Ainsi, en courbure négative comme
en courbure positive (mais non nulle !), la courbe est toujours localement dans le
demi-plan qui contient le cercle osculateur.

Attention : sauf si R(s) = 1, le centre C ne coincide pas avec γ(s) + t′ (s).

Terminons cette section avec la question suivante : dans le cas d’un paramétrage
général, il est légitime de se demander si l’on a encore t′ (s) colinéaire à n(s),
comme c’est le cas lorsqu’on parmètre avec la longueur d’arc. La réponse est
positive, c’est l’objet de la proposition suivante, qui nous servira par ailleurs dans
la classification des courbes planes.

Proposition 4.45. Soit (I, γ) une courbe paramétrée régulière. Alors

t′γ (s) = ∥γ ′ (s)∥κ∗γ (s)nγ (s).

Démonstration. Un calcul instructif et pas si facile, laissé en exercice !


94 CHAPITRE 4. COURBES PARAMÉTRÉES

4.6 Coordonnées polaires dans le plan

4.6.1 Généralités

Soit g : I → R la courbe d’équation polaire ρ = g(θ) est par définition la courbe


paramétrée (
x(θ) = g(θ) cos(θ)
y(θ) = g(θ) sin(θ)
L’interprétation géométrique est la suivante : θ est l’angle polaire entre l’axe des
abscisses et le point (x(θ), y(θ)). g(θ) est la distance à l’origine, affectée d’un signe.
On a
x′ (θ) g ′ (θ) cos θ − g(θ) sin θ
   
=
y ′ (θ) g ′ (θ) sin θ + g(θ) cos θ
   
′ cos θ − sin θ
= g (θ) + g(θ)
sin θ cos θ

Posons    
cos θ − sin θ
er (θ) = , eθ (θ) =
sin θ cos θ
Le déterminant de ces deux vecteurs vaut 1, et c’est une base orthonormée de R2 .
En particulier,  ′ 
x (θ)
= 0 ⇔ g(θ) et g ′ (θ) = 0.
y ′ (θ)
Tout point de la courbe hormis l’origine (i.e. avec g(θ) ̸= 0) est non stationnaire.
La tangente en un tel point a pour vecteur directeur

t(θ) = g ′ (θ)er + g(θ)eθ .

Un point de la courbe se repère par


−−→
OM (θ) = g(θ)→

er .

Si v est l’angle entre er et la tangente, le vecteur tangent est donné par

t(θ) = |t(θ)|(cos v er + sin v eθ ).

On a alors
|t(θ)| cos v = g ′ (θ), |t(θ)| sin v = g(θ)
d’où, lorsque g ′ (θ) ̸= 0,
g(θ)
tan v = .
g ′ (θ)
4.7. QUELQUES QUESTIONS GLOBALES 95

4.6.2 Étude pratique


— On fait le tableau de variation de ρ = g(θ) : les points où g(θ) ̸= 0 sont
non-stationnaires.
— S’il existe θ0 avec g(θ0 ) = 0 et g ′ (θ0 ) = 0, on a un point stationnaire. Pour
étudier la courbe en ce point, on écrit
(
x(θ) = g(θ) cos θ
y(θ) = g(θ) sin θ

et on procède comme dans le cas d’une courbe paramétrée générale.


— On étudie les éventuels points doubles : on cherche à savoie s’il existe
−−→ −−→
θ1 ̸= θ2 avec OM (θ1 ) = OM (θ2 )
On étudie les branches infinies.
1er cas : s’il existe θ0 avec limθ→θ0 g(θ) = ±∞, on dit que la direction faisant
l’angle θ0 avec l’axe des abscisses est une direction asymptotique.
Pour déterminer s’il y a une asymptote non verticale de pente tan θ0 (lorsque
cos θ0 ̸= 0), on calcule
sin θ0 g(θ)
y(θ) − tan θ0 x(θ) = g(θ)(sin θ − cos θ) = sin(θ − θ0 ).
cos θ0 cos θ0
— Si
lim g(θ) sin(θ − θ0 ) = b < ∞,
θ→θ0

alors la droite d’équation y = x tan θ0 + cosb θ est asymptote à la courbe.


Si cette limite est infinie, on dit qu’on a une branche parabolique dans la
direction d’angle θ0 .
— Si cos θ0 = 0, on calcule plutôt la limite éventuelle de x(θ) − cot θ0 y(θ).
2ème cas : si limθ→∞ g(θ) = ±∞ : on dit qu’il y a une spirale lorsque θ → ∞.

4.7 Quelques questions globales

4.7.1 Classification des courbes planes régulières


Définition 4.46. Un déplacement de R2 est une application de la forme

T : x 7→ a + u(x)

où a ∈ R2 et u est une rotation, c’est à dire une application linéaire de matrice


dans la base canonique donnée par
 
cos θ − sin θ
Matcan u = .
sin θ cos θ
96 CHAPITRE 4. COURBES PARAMÉTRÉES

Proposition 4.47. Soit (I, γ) une courbe paramétrée régulière et T un déplace-


ment. Soit η = T ◦ γ. Alors

(tη (s), nη (s)) = u(tγ (s), nγ (s)).

De plus,
∀s, ∥η ′ ∥ = ∥γ ′ ∥ et κ∗η = κ∗γ .

Démonstration. Au tableau.

La proposition précédente exprime que deux courbes paramétrées déduites l’une


de l’autre par un déplacement vérifient en tout point qu’elles ont même courbure
et même longueur du vecteur tangent. Il se trouve que la réciproque est vraie :

Théorème 4.48. Soient (I, γ) et (J, η) deux courbes paramétrées régulières défi-
nies sur le même intervalle I. On suppose que pour tout t ∈ I,

∥γ ′ (s)∥ = ∥η ′ (s)∥, κ∗γ (s) = κ∗η (s).

Il existe alors a ∈ R2 , u rotation telle que si T = a + u, on a

η = T ◦ γ.

Démonstration. Au tableau.

On peut également démontrer que si l’on se donne deux fonctions v, κ : I → R de


classe C ∞ avec v ≥ 0, il existe, à déplacement près, une unique courbe paramétrée
γ telle que ∥γ ′ ∥ = v et κ∗γ = κ :

Théorème 4.49. Soit I ⊂ R un intervalle, v, κ : I → R de classe C ∞ sur I avec


v(t) ≥ 0 pour tout t ∈ I. Alors, il existe un courbe paramétrée régulière (I, γ) telle
que
∀t ∈ I, ∥γ ′ (t)∥ = v(t), κ∗γ (t) = κ(t).
D’après le théorème précédent, une telle courbe est unique à déplacement près.

Ce résultat s’interprète de la manière suivante : la vitesse et la courbure déter-


minent une courbe paramétrée du plan de manière unique, à déplacement près. On
dit qu’on a classifié les courbes paramétrées du plan, c’est à dire qu’on a identifié
des quantités qui permettent de décider si oui ou non, deux courbes sont « les
mêmes » – au sens où elles se déduisent l’une de l’autre par un déplacement.

Démonstration. Admise par manque de temps, cette démonstration n’est pas spé-
cialement difficile.
4.7. QUELQUES QUESTIONS GLOBALES 97

4.7.2 Aire bornée par une courbe fermée simple

Définition 4.50. Soient a < b < ∞. On dit que ([a, b], γ) est une courbe fermée
si γ(a) = γ(b). On dit qu’elle est simple si elle n’a pas de points doubles, c’est à
dire si t 7→ γ(t) est injective de [a, b] → R2 . On dit qu’elle est C k par morceaux
si γ est continue, et qu’il existe une subdivision a = t0 < · · · < tn = b telle que
γ : [ti , ti+1 ] → R2 soit C k . Enfin, une courbe fermée sera dite orientée positivement,
si en chaque point le vecteur normal pointe à l’intérieur de la courbe.

On commence par remarquer (nous l’avons déjà vu) que si f est une fonction
C ∞ définie sur un intervalle I = [a, b] alors le graphe de f s’identifie à la courbe
paramétrée (I, γ) avec γ(t) = (t, f (t)).

Quitte à ajouter une constante à f de sorte que f ≥ 0, l’aire (positive) située


entre la courbe et l’axe des abscisses est donnée par

Z b Z b
A= f (t)dt = f (x(t))dx(t), x(t) = t.
a a

Cette formule se généralise à un paramétrage quelconque : si la trace de γ s’identifie


avec un graphe, c’est que l’on peut écrire y(t) = f (x(t)) pour une certaine fonction
f , et donc en notant xa = x(a) et xb = x(b), l’aire sous le graphe vaut encore

Z xb Z b Z b

A= f (x)dx = f (x(t))x (t)dt = y(t)x′ (t)dt.
xa a a

Considérons maintenant la courbe fermée construite depuis le graphe de deux


fonctions f, g comme dans la figure ci-dessous.
98 CHAPITRE 4. COURBES PARAMÉTRÉES

Ces graphes de fonctions (disons C k ) au dessus d’un même segment peuvent être
reliés par des segments verticaux aux extrémités. On peut paramétrer la courbe
obtenue : celle-ci a la régularité C k par morceaux seulement. Notons qu’il y a
deux sens d’orientation possible (sens positif sur le dessin).

Notons xa < xb les abscisses des extrémités gauche et droite de la courbe, formées
par des portions de droite verticales. L’aire incluse dans la courbe fermée tracée
sur la figure est clairement
Z xb Z xb
A= f− g.
xa xa

Si l’on écrit un paramétrage de cette courbe fermée à l’aide de f et g, en notant


t1 < t2 l’intervalle de temps où la courbe parcourt le graphe de g et t3 < t4 celui
4.7. QUELQUES QUESTIONS GLOBALES 99

ou elle parcourt le graphe de f , cette aire se calcule désormais comme


Z xb Z xb
A= f− g
xa xa
Z t4  Z t2 
′ ′
= −y(t)x (t)dt − y(t)x (t)dt .
t3 t1

En effet, pour le graphe de f , si t varie de t3 à t4 alors x(t) varie de xb à xa , donc


Z xb Z t3 Z t4

y(x)dx = y(x(t))x (t)dt = −y(x(t))x′ (t)dt.
xa t4 t3

Puisque x′ = 0 sur les portion verticales, on peut rajouter les intégrales de −yx′
sur les intervalles de temps correspondants car celles-ci seront nulles, et l’on tombe
encore sur Z
A = −yx′ ≥ 0.
γ

Soit maintenant ABC un triangle du plan. Nous allons calculer son aire à l’aide
du point de vue ci-dessus. Si ce triangle n’est pas plat, il existe un côté, disons AB,
qui n’est pas orthogonal à l’axe des abscisses. Considérons ce triangle comme une
courbe paramétrée γ(t) = (x(t), y(t)) continue, orientée positivement, de classe
C ∞ par morceaux, définie sur un intervalle [a, b]. Découpons le triangle en tranches
verticales, de sorte qu’on puisse appliquer le principe précédent de calcul d’une
aire comprise entre deux graphes.
100 CHAPITRE 4. COURBES PARAMÉTRÉES

En découpant [a, b] en sous-intervalles de manière à ce que la trace de γ soit un


graphe sur ces sous-intervales, montrons que l’aire incluse dans le triangle vaut
toujours
Z b
AABC = − y(t)x′ (t)dt.
a

En effet, l’aire de la portion de gauche vaut (attention à l’orientation pour la


partie inférieure) :
Z b Z t1

−yx − yx′
t3 t0

tandis que celle de droite vaut


Z t3 Z t2

−yx − yx′ .
t2 t1

Si l’on somme tous ces termes, on obtient :


Z t1 Z t2 Z t3 Z b Z
′ ′ ′ ′
A=− yx − yx + −yx + −yx = −yx′ .
t0 t1 t2 t3 ABC

Continuons notre généralisation. Soit maintenant un polygone P , et O un point


quelconque à l’intérieur. En découpant le polygone en triangles dont deux som-
mets sont des sommets du polygone et le troisième le point O, on trouve que les
intégrales le long des côtés intérieurs se compensent exactement, car elles sont
parcourues deux fois mais en sens contraire. Ainsi, l’aire du polygone est toujours
donnée par
Z b
AP = − yx′ .
a
4.7. QUELQUES QUESTIONS GLOBALES 101

Cette intégrale se comprend par morceaux, avec un paramétrage du polygone côté


par côté.
Finalement, il n’est pas très difficile d’imaginer que lorsque la subdivision est
petite, l’aire du polygone est une bonne approximation de l’aire bornée par la
courbe. Ceci est même vrai à la limite (nous allons le démontrer), ce qui conduit
à poser la définition suivante :
Définition 4.51. Soit ([a, b], γ) une courbe fermée, de classe C 1 par morceaux,
orientée positivement. Alors, l’aire incluse à l’intérieur de la courbe est définie par
Z b Z b Z b
′ ′ 1
Aγ = − y(t)x (t)dt = y (t)x(t)dt = (x(t)y ′ (t) − y(t)x′ (t))dt.
a a a 2

Remarque 4.52. Cette formule appelle plusieurs commentaires.


(1) Tout d’abord, les deux dernières égalités proviennent de la première en inté-
grant par partie, et en utilisant que la courbe est fermée, i.e. γ(a) = γ(b).
(2) Notons ensuite que les hypothèses sur γ sont assez faibles : il n’est pas néces-
saire de supposer la courbe régulière, et les points stationnaires sont permis. Nous
n’avons pas supposé non plus que la courbe est simple.
(3) Lorsque la courbe est définie par morceaux, l’intégrale s’entend comme la
somme des intégrales sur les subdivisions . . . ti < ti+1 . . . et les fonctions x′ , y ′

sont continues en t+
i et ti , sans nécessairement que les limites soient égales.

(4) Enfin, si l’orientation est indéterminée, c’est la valeur absolue des intégrales
ci-dessus qui donnera l’aire.
Comment justifier cette définition ? Pour le voir, on peut procéder comme pour
la longueur d’arc. Supposons pour simplifier que la courbe est simple, et de classe
C 2 . On subdivise l’intervalle
N
[ −1
[a, b] = [ti , ti+1 ]
i=0

en N sous-intervalles de taille δN = (b − a)/N . Soit ϵ > 0. Alors, il existe N0 tel


que si N ≥ N0 , pour tout i,
∥γ(ti + h) − (γ(ti ) + hγ ′ (ti ))∥ ≤ ϵ.
En effet, c’est une application de la formule de Taylor, exactement comme dans
la preuve de la proposition 4.23, avec une majoration du reste qui dépend de
sup |γ ′′ | < ∞.
[a,b]

Remarque 4.53. Notez qu’il est crucial que [a, b] soit un intervalle borné et que
γ soit C 2 , pour qu’on puisse appliquer le résultat important de première année
suivant : « une fonction continue sur un intervalle bornée est bornée et atteint ses
bornes ».
102 CHAPITRE 4. COURBES PARAMÉTRÉES

Soit maintenant pour h ∈ [0, δN ],

γ(ti+1 ) − γ(ti )
βi (h) = γ(ti ) + h .
δN

Notons que le vecteur que multiplie h est toujours non nul car la courbe est simple.
On a
h
βi (h) = γ(ti ) + (δN γ ′ (ti ) + O(ϵ)) = γ(ti ) + hγ ′ (ti ) + O(ϵ).
δN
Ainsi,
∀i, ∥γ(ti + h) − βi (h)∥ = O(ϵ).
Insistons encore sur le fait que cette estimation est uniforme en i, c’est à dire que
le membre de droite ne dépend pas de i (cf remarque précédente).
Soit maintenant Γ = ΓN la courbe paramétrée continue, lisse par morceau, définie
par Γ(ti ) = γ(ti ) et
Γ(ti + h) = βi (h), h ∈ [0, δN ].
Cette courbe est précisément notre polygone qui approxime γ par sergments.
Alors,

N
X −1 Z ti+1 N
X −1 Z ti+1
(yΓ x′Γ ′
− yx )dt ≤ |yΓ x′Γ − yx′ |dt
i=0 ti i=0 ti
N
X −1 Z ti+1
≤ |(yΓ − y + y)(x′Γ − x + x) − yx|dt
i=0 ti
N
X −1 Z ti+1
≤ |(yΓ − y)x + y(x′Γ − x) + (yΓ − y)(xΓ − x)|dt
i=0 ti

≤ Cϵ(b − a).

Puisque ϵ peut être choisi arbitrairement petit (il suffit pour cela de prendre N
assez grand), ce calcul montre ce que nous cherchons :

Proposition 4.54. Pour le polygone ΓN qui approxime γ, l’aire incluse dans ΓN


vérifie : Z Z
′ N →∞
A(ΓN ) = −yΓ xΓ −−−→ −yx′ .
Γ γ

En effet nous avons vu que le membre de gauche est l’aire du polygone ΓN .


Remarque 4.55. Comme pour la longueur d’arc, cette limite ne dépend pas en fait
de la subdivision, pourvu qu’elle soit choisie de sorte que ti+1 − ti → 0 uniformé-
ment en i lorsque N → ∞.
4.7. QUELQUES QUESTIONS GLOBALES 103

4.7.3 Inégalité isopérimétrique.


Théorème 4.56. Soit γ une courbe paramétrée simple, fermé, régulière, de lon-
gueur ℓ, et A l’aire bornée par γ. Alors

4πA ≤ ℓ2

avec égalité si et seulement si γ est un cercle.

Démonstration. Soient L, L′ deux droites verticales tangentes à γ de sorte que


γ soit à contenue dans la bande bornée par L et L′ . On choisit de paramétrer
naturellement la courbe γ par s ∈ [0, ℓ] et quitte à décaler le repère du plan, on
def
suppose que x(s) ≥ 0. Soit C un cercle de diamètre 2r = |xL − xL′ | paramétré
par
C(s) = (x(s), ȳ(s))
On admet qu’il existe une fonction ȳ(s) de sorte que ceci soit possible. On pourra
se convaincre cependant avec un dessin qu’une telle paramétrisation n’est ni ré-
gulière, ni simple, mais que la formule de l’aire s’applique encore (la courbe fait
des aller-retours sur elle même localement, lorsque t 7→ x(t) n’est pas monotone.)
Appliquons la formule de l’aire :
Z ℓ Z ℓ
Aγ = xy ′ , AC = − ȳx′ = πr2 .
0 0

On trouve donc que


Z ℓ
Aγ + πr = 2
xy ′ − ȳx′
0
Z ℓ Z ℓp
′ ′
≤ |xy − ȳx | = (xy ′ − ȳx′ )2
0 0
Z ℓp
≤ x2 + ȳ 2 = ℓr.
0

En effet p
|xy ′ − ȳx′ | = |⟨(x, −ȳ), (y ′ , x′ )⟩| ≤ (x2 + ȳ 2 )(x′2 + y ′2 )
Maintenant on utilise l’inégalité bien connue pour a, b ≥ 0 avec égalité si et seule-
ment si a = b : (en exercice !)
a+b
a1/2 b1/2 ≤ .
2
Il s’ensuit que
p √ Aγ + πr2 1
Aγ πr2 ≤ ≤ ℓr.
2 2
Ceci montre l’inégalité.
104 CHAPITRE 4. COURBES PARAMÉTRÉES

En cas d’égalité, 4πAγ = ℓ2 et on a donc égalité dans l’inégalité ci-dessus, ce qui


oblige
A = πr2 .
En particulier, on remarque que ℓ = 2πr et r ne dépend pas du choix des droites
L et L′ !
De plus, la valeur de A implique l’égalité dans le calcul ci-dessus, donc par Cauchy
Schwartz les vecteurs (x, −ȳ), (y ′ , x′ ) sont colinéaires. Supposons que

(x, ȳ) = λ(y ′ , −x′ ).

Alors x2 + ȳ 2 = λ2 mais comme (x, ȳ) est la paramétrisation d’un cercle de rayon
r, on trouve que
λ = ±r.
Ainsi, x = ±ry ′ . Comme noté plus haut, r ne dépend pas de L et L′ , donc on
peut refaire le raisonnement en permutant les axes et trouver y = ±rx′ . Il suffit
alors de noter que
x2 + y 2 = r2 (x′2 + y ′2 ) = r2 ,
on a bien un cercle.

Vous aimerez peut-être aussi