Itu Mat102
Thèmes abordés
Itu Mat102
Thèmes abordés
Ce document est un support de cours et non un livre. Le but de ce cours n’est pas
d’essayer d’amener le lecteur à devenir un mathématicien chevronné et, de ce fait, il est
un peu léger. Le but de ce cours est de délivrer les prémices de la culture mathématique
conformément au programme de l’Ecole. On rafraı̂chit en fait notre mémoire. Ceux qui
voudraient compléter leur connaissance parce qu’ils auront pris goût aux maths et veulent
changer de filière peuvent aller dans les établissements réservés à cela. Tout le monde peut
tout de même compléter ce qui est écrit ici sur le web.
Nous utiliserons souvent l’expression “objet mathématique” dans ce recueil. Un objet
mathématique est un objet qui n’existe que dans l’univers mathématique, c’est-à-dire dans
la tête des mathématiciens. On représente les objets mathématiques par des symboles
scripturaux pour qu’on puisse en discuter plus facilement et pour en conserver un souvenir
dans des documents. Un objet mathématique peut être une proposition, un théorème, un
nombre, un ensemble, etc.. Les mathématiques traitent des objets mathématiques, on les
y définit, on y étudie leurs caractéristiques, leurs propriétés, comment les utiliser, etc.. Un
objet mathématique doit être “bien défini”, c’est-à-dire doit être tel que, en le “voyant”,
le mathématicien ne peut avoir aucun doute dans l’esprit. Par exemple, il est bien connu
que la proposition “Je suis beau” n’est pas un objet mathématique mais que la proposition
“2 fois 2 font 5” est un objet mathématique. Évidemment, comme pour tout objet, qu’il
soit mathématique ou pas, plus on manipule l’objet, plus il vous est familier. Cela peut
signifier aussi que, plus on avance dans l’étude des mathématiques, plus on pourra voir
d’objets mathématiques.
Nous donnons trois livres qui peuvent vous faire aimer les mathématiques. Mais la liste
n’est pas exhaustive.
Alain Ralambo (Octobre 2012).
c Tsy azo amidy ary tsy azo adika na amin’ny ampahany aza.
R
Alain Ralambo, e-mail: ralamboalain@[Link], Département de Mathématique
et Informatique, Faculté des Sciences, Antananarivo 2012.
Histoire de Mathématiques.
[BOL] Marcel Boll, Histoire des Mathématiques, Que sais-je, Presses Universi-
taires de France.
[DAH] A. Dahan-Dalmedico, J. Peiffer, Une histoire des mathématiques, Routes
et dédales, Points Sciences, Seuil.
[DAV] P.J. Davis, R. Hersh, L’Univers Mathématique, Gauthier-Villars.
1 Suites et Séries. 5
1 Nombres réels. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5
2 Résultats divers sur les suites et séries dans R et dans C. . . . . . . . . . . . . . . . . . . . . . . 13
Développement d’un nombre réel par rapport à une base p. . . . . . . . . . . . . . . . . . . . 21
2 FONCTIONS NUMÉRIQUES. 25
1 Généralités. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2 LIMITES. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3 CONTINUITÉ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4 DÉRIVATIONS ET APPLICATIONS.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
5 FONCTIONS CONVEXES. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6 FONCTIONS de plusieurs variables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
7 INTÉGRATION. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
Cours élémentaire d’Algèbre et d’analyse (2012)
Alain Ralambo.
ITU, Andoharanofotsy
Antananarivo Atsimondrano. Madagascar.
(R6) Existence d’inverses : x+(−x)=0 pour tout x, et x·x−1 =1 pour x= 0. On note aussi
1
pour x−1 .
x
2◦ ) (Q, +, ·) est aussi un corps commutatif contenu dans R, Q ⊂ R.
3◦ ) (Z, +, ·) est un anneau commutatif contenu dans Q, Z ⊂ Q ⊂ R.
4◦ ) Enfin, N l’ensemble des entiers naturels est contenu dans Z, N ⊂ Z ⊂ Q ⊂ R.
R est partitionné en trois parties notées R+ − +
∗ , R∗ et le singleton {0}. R∗ est l’ensemble
des nombres réels dits positifs, il contient tous les nombres rationnels positifs et tous les
entiers naturels. R−∗ est l’ensemble des nombres réels négatifs, il contient tous les nombres
rationnels négatifs et tous les entiers relatifs négatifs. Le partitionnement de R signifie
qu’un nombre réel donné est soit positif, soit négatif, soit nul. La réunion R+ ∗ ∪ {0} est
aussi notée R+ dont les éléments sont dits positifs ou nuls et, de même, R−∗ ∪ {0} est aussi
notée R− dont les éléments sont dits négatifs ou nuls. Les deux parties R+ −
∗ et R∗ sont
stables pour l’addition, c’est-à-dire que si x et y sont dans R+ −
∗ (respectivement dans R∗ )
+ −
alors x+y est encore dans R∗ (respectivement dans R∗ ). Il en est de même pour les parties
R+ et R− . De plus, ces parties vérifient la propriété suivante : “Si x ∈ R+ −
∗ alors −x ∈ R∗ ”.
Enfin, R+ +
∗ et R sont stables pour la multiplication.
Pour x et y∈ R, on dit que x est plus grand que y (ou que x est supérieur à y) si
x −y∈ R+ −
∗ , ce qui équivaut à y−x ∈ R∗ , et l’on note x>y. On dit alors aussi que y est plus
petit que x (ou que y est inférieur à x). On a alors une relation d’ordre ≤ qui prolonge
celle que l’on connaı̂t déjà sur Q et sur Z. Rappelons que la relation a≤b est une relation
d’ordre au sens suivant : elle est réflexive, c.à.d. a≤a pour un a∈ R, elle est antisymétrique
c.à.d. que si l’on a en même temps a≤b et b≤a alors a=b, et enfin elle est transitive c.à.d.
que si l’on a, en même temps, a≤b et b≤c, alors a≤c. Rappelons enfin que l’ordre est total,
c.à.d. que si a et b sont deux réels quelconques alors on a un et un seul des cas suivants :
a<b, a=b, a>b.
Rappelons qu’une partie A de R est dite majorée (resp. minorée) s’il existe au moins
un majorant (resp. un minorant) de A, c.à.d. un nombre M (resp. m) tel que a<M (a>m)
pour a∈A. Si une partie A est majorée (resp. minorée) et s’il existe un majorant (resp. un
minorant) plus petit (resp. plus grand ) que tous les autres, il est appelé la borne supérieure
de A (resp. la borne inférieure de A). On dit que A est borné s’il admet un minorant et
un majorant.
Rappelons qu’on appelle intervalle I de R toute partie de R telle que si a et b∈I et
si a<b alors tout nombre x tel que a<x<b appartient aussi à I. Il y a des intervalles
bornés et des intervalles non bornés. En fait, il y a principalement 4 types d’intervalles
]a,b[, ]a,b],[a,b[ et [a,b] où a est soit un nombre réel, soit le symbole −∞ quand le premier
crochet est “]” et b est soit un nombre supérieur ou égal à a, soit le symbole +∞ si le
second crochet est “[”. Et ]a,b[={x∈ R/a<x<b}, ]a,b]={x∈ R/a<x≤b}, [a,b[={x∈ R/a≤
x<b}, [a,b]={x∈ R/a≤x≤b}, avec la convention que tout nombre réel est <+∞ et >−∞.
Le nombre a ou le symbole −∞ est appelé l’extrémité gauche de l’intervalle et le nombre
b ou +∞ son extrémité droite. Un intervalle dont les 2 extrémités sont exclues est appelé
intervalle ouvert, un intervalle dont les 2 extrémités sont incluses est appelé intervalle
fermé, un intervalle dont l’une des 2 extrémités est exclue est appelé intervalle semi-ouvert
du côté de l’extrémité exclue.
Densité de Q dans R. Une propriété importante des nombres rationnels, c.à.d. des
éléments de Q, est la densité dans R, qui signifie que “tout intervalle ]a,b[ de R avec a<b
contient au moins un nombre rationnel”. La propriété est aussi vérifiée par les nombres
irrationnels, c.à.d. que R\Q est aussi dense dans R ou que “tout intervalle ]a,b[ de R avec
a<b contient au moins un nombre irrationnel”. En fait, il y a plus de nombres irrationnels
que de nombres rationnels dans chaque intervalle ]a,b[ de R. Rappelons q’un nombre est
irrationnel s’il n’est pas rationnel (ce qui ressemble à une lapalissade).
R est archimédien. Une propriété importante de R et de Q (que N et Z possèdent
aussi mais qui présente une importance particulière dans R et dans Q) est que “pour tout
nombre réel x, il existe toujours un entier naturel n supérieur à x, c.à.d. n>x”. On dit que
se trouve au rang n dans la suite. Ce que l’on note en abrégé, en utilisant la variable n,
par (xn )n∈N et que l’on appelle une suite dans E ou une suite d’éléments de E, et l’on écrit
aussi (xn )n∈N ⊂E.
Le processus de définiton d’une suite peut être très complexe. Par exemple, une suite
peut aussi être définie par récurrence, c.à.d. que certains éléments initiaux sont donnés et
l’élément de rang n est exprimé en “fonction” des éléments de rang 0 à n−1. Ainsi en est
de la suite xn =n! (factorielle n).
Lorsque E=R, on dit que la suite (xn )n est une suite de nombres réels et, lorsque E=C,
on a une suite de nombres complexes (zn )n qui correspond généralement à deux suites de
nombres réels, la suites des parties réelles (an )n et (bn )n la suite des parties imaginaires si
1 1 1 1
zn =an +ibn . Par exemple, (1, , , , ...) est une suite dans R noté ( )n∈N . Mais,
2 3 4 n+1
comme on le sait depuis la terminale, il faut noter que les éléments d’une suite peuvent ne
pas être définis pour tout n.
Soit (xn )n une suite dans R. On dit que (xn )n converge ou tend vers un nombre x ∈ R,
appelée limite de (xn )n , si chaque fois qu’on prend un ε ∈ R∗+ , on peut trouver un rang
nε ∈ N, tel que si n≥nε alors |xn − x| ≤ ε, c.à.d. d(xn ,x)<ε. Ce qui se traduit aussi :
“xn ∈[x−ε, x+ε] pour n≥ nε ”. On note x=lim xn (lire : “x égale limite de xn quand n
n∞
tend vers l’infini”) ou (xn )n −→ x (lire “xn tend vers x quand n tend vers l’infini”). On
n∞
dit alors que la suite (xn )n est convergente si elle admet une limite, sinon on dit qu’elle est
divergente.
On définit de même la notion de suite double et la convergence d’une suite double
(xm,n )m,n . On dit que (xm,n )m,n converge ou tend vers un nombre x ∈ R, appelée limite de
(xm,n )m,n , si chaque fois qu’on prend un ε ∈ R∗+ , on peut trouver un rang nε ∈ N, tel que
si m,n≥nε alors |xm,n − x| ≤ ε c.à.d. d(xm,n ,x)<ε (xm,n ∈[x−ε, x+ε] pour m,n≥ nε ”). On
note x=m,n∞lim xm,n (lire : “x égale limite de xm,n quand m et n tendent vers l’infini”) ou
(xm,n )m,n −→ x (lire “xm,n tend vers x quand m,n tendent vers l’infini”). On dit alors que la
m,n∞
suite (xm,n )m,n est convergente si elle admet une limite, sinon on dit qu’elle est divergente.
1
Par exemple, la suite convergente que tout le monde connaı̂t est (xn )n avec xn =
n
pour n=0, elle converge vers x=0 (car si on prend ε ∈ R∗+ , on peut trouver nε ∈ N
1 1 1
tq < ε, R étant archimédien, et si n≥nε alors ≤ < ε). De même, la suite
nε n nε n
q q
(rn )n∈N pour |r| < 1 converge vers 0; en effet, si |r|= avec 0<q<p, alors |r|n = <
p p
1 1 1 1
n< q . <ε, pour n> q .
q 1 − n ε(1 − )
1 + (1 − ) p p
p
1.2 Définition. On dit qu’une suite (xn )n est de Cauchy si la suite double (xm,n )m,n ,
avec xm,n =xm −xn , converge vers 0.
Preuve : Soit ε ∈ R∗+ , comme la suite (xn )n converge vers x, on peut trouver nε tq
si n≥nε alors |xn − x| ≤ ε et donc, si m≥nε alors |xm − x| ≤ ε. Donc, si m,n≥nε alors
ε
|xn − xm | ≤ |xn − x| + |x − xm | ≤ 2ε, et on aurait pu prendre à la place de ε. c.q.f.d.
2
Remarque : Quand on se place dans Q, la réciproque est fausse en général. Un ex-
emple de suite de Cauchy de rationnels non convergente dans Q est donnée par la relation de
1 1
récurrence : x0 =0 et xn+1 = (x2n +1). On vérifie que |xn+1 − xm+1 | ≤ |xn − xm | |xn + xm |,
8 8
1
chaque xn est bien dans Q et est inférieur à en valeur absolue, donc |xn+1 − xm+1 | ≤
4
1 1 1 1 2
|xn − xm | ≤ 2 |xn−1 − xm−1 | ≤ · · · ≤ m+1 |xn−m − x0 | ≤ m+1 . qui tend vers 0 quand
8 8 8 8 4
m et n tendent vers l’infini avec n≥m. Donc, (xn )n est bien de Cauchy, mais si elle converge
1
vers a∈ Q, alors a= (a2 +1) (par continuité, nous le verrons plus tard). C.à.d. 8a=a2 +1.
8
Donc, a ne peut pas être un entier, sinon a=1 (car a|1), or c’est impossible que a soit 1.
p
Si a= avec (p,q)=1, on aurait 8pq=p2 +q2 et q diviserait p, ce qui est impossible.
q
1.4 Définition. On appelle série dans R une suite (xn , sn )n∈N où xn ∈ R et sn+1 =sn +xn ,
n
ce qui s’écrit aussi sn = xp , sn est appelée la somme partielle de la série et xn est le terme
p=0
général de la série. Pour distinguer une suite d’une série, on note aussi la série par [xn ]n∈N
ou (Σxn )n∈N . On dit que la série [xn ]n∈N converge vers s (s∈ R) si la suite des sommes
partielles (sn )n converge vers s. On dit alors que s est la somme de la série [xn ]n∈N et
∞ ∞
on écrit s= xn . Remarquer que l’indice n dans xn est une variable muette comme
n=0 n=0
dans tout symbole abréviatif. Si la suite (sn )n n’a pas de limite, on dit que la série est
divergente. Lorsque la série converge, on appelle reste d’ordre ou de rang n le nombre Rn =
∞
s−sn = xp = lim (sm −sn ).
p=n+1 m∞
Une série généralise la somme usuelle. Dans un ensemble muni d’une opération d’addition
associative et commutative, on connaı̂t la somme a+b+c+d qui est (a+b)+c)+d. La ques-
tion se pose de savoir comment on peut définir une somme d’un nombre infini d’opérandes,
de façon que les propriétés usuelles de l’opération d’addition (commutativité, associativité,
...) soient conservées. La réponse trouvée par les mathématiciens est l’introduction de la
notion de limite.
1.5 Proposition . Toute série [xn ]n∈N convergente vérifie le critère de Cauchy
∗
suivant : “Pour ε ∈ R+ , on on peut trouver un rang nε ∈ N, tel que si n≥m≥nε alors
n
xp < ε”.
p=m
suite (xn )n est une suite géométrique de raison r si xn+1 =[Link] , ce qui donne xn =x0 rn . La
rn+1 − 1 1
somme partielle de la série est sn =x0 qui tend vers x0 .
r−1 1−r
1.7 Proposition . Toute suite de Cauchy est bornée. La réciproque est fausse en
général. Cependant, toute suite croissante majorée est de Cauchy. Donc, deux suites
adjacentes sont de Cauchy.
Preuve : Si (xn )n est de Cauchy, on peut trouver n1 ∈ N tel que si m,n≥ n1 on a
|xm − xn | ≤1. Donc, xn1 − 1 ≤ xn ≤ xn1 + 1 pour n>n1 . En prenant M=max(x0 , x1 , ...,
xn1 , xn1 + 1), on voit que xn ≤ M, pour tout n. Donc, (xn )n est majorée. On montre de
même que (xn )n est minorée. La suite (−1n )n est bornée mais n’est pas de Cauchy.
Soit (xn )n une suite croissante dans R qui est majorée par M. Si (xn )n n’est pas de
Cauchy, on peut trouver ε ∈ R∗+ tel que pour tout n∈ N, on peut touver m>n tel que
xm −xn ≥ ε. Donc, pour n=1, on a m1 > 1 tel que xm1 −x1 > ε. Donc, xm1 >x1 + ε. Pour
n=m1 , on a m2 >m1 tel que xm2 −xm1 > ε. Donc, xm2 >xm1 + ε >x1 + 2ε. Pour n=m2 ,
on a m3 >m1 tel que xm3 −xm2 > ε. Donc, xm3 >x1 + 3ε. Or, on ne peut pas continuer ce
processus indéfiniment car il arrivera un k∈ N tel que xmk >x1 +kε >M. Contradiction, car
xmk <M. Donc, (xn )n est de Cauchy. c.q.f.d.
Donnons quelques propriétés utiles des limites.
1.8 Proposition . (a) Si (xn )n converge vers x et (yn )n converge vers y, alors :
la suite (zn )n telle que zn =xn ±yn converge vers x±y,
la suite (tn )n telle que tn =αxn converge vers αx pour α ∈ R,
la suite (un )n telle que un =xn .yn converge vers x.y
1 1
la suite (vn )n telle que vn = converge vers si x=0,
xn x
(b) Si (xn )n converge vers x et (yn )n converge vers y, et si xn <yn pour n suffisamment
grand, alors x≤y. Inversement, si x<y, alors on peut trouver n0 ∈ N tel que pour n≥n0 ,
xn <yn .
(c) Corollaire de (b) Si (xn )n converge vers l et (yn )n converge vers l et si xn ≤zn ≤ yn ,
alors (zn )n converge vers l.1
ε ε
Preuve : (a) Prenons ε ∈ R∗+ et nε ∈ N, tel que si n≥nε alors x− ≤xn ≤x+
ε ε 2 2
et y− ≤yn ≤y+ . En additionnant membre à membre, on obtient : x+y−ε ≤xn +yn ≤
2 2
x+y+ε, pour n≥nε . On aurait pu démontrer ce résultat en utilisant que |(x+y) − (xn +yn )| ≤
|x − xn | + |y − yn |. On procède de la même manière pour les autres résultats (on utilisera
les inégalités suivantes : |(αx) − (αxn )| ≤ |α| . |x − xn |, |(x.y) − (xn .yn )| ≤ |x − xn | . |y| +
1 1 1
|y − yn | . |yn |, − ≤ |x − xn |).
x xn |[Link] |
ε ε ε ε
(b) Prenons ε ∈ R∗+ et nε ∈ N, tel que si n≥nε alors x− ≤xn ≤x+ et y− ≤yn ≤y+ .
ε ε ε ε 2 2 2 2
Donc, pour n≥nε , x− ≤xn ≤yn ≤y+ , x− ≤y+ , x≤y+ε. Comme on a pris un quel-
2 2 2 2
∗ 1
conque ε dans R+ , nécessairement, x≤y, sinon on aurait une contradiction si ε= (x−y).
2
1 ∗
Inversement, supposons que x<y. Prenons ε = (y−x)∈ R+ et nε ∈ N, tel que si n≥nε
ε ε ε ε 2 ε ε
alors x− ≤xn ≤x+ et y− ≤yn ≤y+ . Donc, si n≥nε alors xn ≤x+ < y− ≤yn
ε 2 ε ε 2ε 2 2 2 2
(x+ < y− car + =ε < y−x). Donc, xn <yn pour n≥ nε . Ce raisonnement permet
2 2 2 2
d’ailleurs, par l’absurde, de montrer la première partie de (b). c.q.f.d.
1.9 Proposition . Toute suite croissante (au sens large) (xn )n majorée converge vers sa
borne supérieure (sup {xn /n∈ N}). De même, toute suite décroissante minorée converge
vers sa borne inférieure.
Preuve : On utilise la propriété de la borne supérieure b=sup {xn /n∈ N}. Pour ε > 0,
on peut trouver xn0 tel que b−ε<xn0 ≤ b. Si n≥ n0 , alors b≥ xn ≥ xn0 >b−ε. c.q.f.d.
1.10 Proposition . Deux suites adjacentes dans R sont convergentes et convergent vers
la même limite.
Preuve : Soient (an )n et (bn )n deux suites adjacentes. Leur convergence découle de la
proposition précédente car deux suites adjacentes sont bornées. Les limites a=lim an et
n∞
b=lim bn sont égales car an −bn tend vers 0. c.q.f.d.
n∞
1.11 Proposition . R est complet, c.à.d. toute suite de Cauchy est convergente dans
R.
Preuve : Soit (xn )n une suite de Cauchy. On construit deux suites accessoires de la
manière suivante : n∈ N, αn =inf{xp /p≥n} et βn =sup{xp /p≥n}. Puisque {xp /p≥n+1}⊂
{xp /p≥n}, alors αn+1 ≤ αn et βn+1 ≥ βn , c.à.d. (αn )n est croissante et (βn )n décroissante.
De plus, par construction, αn ≤ xn ≤ βn et aussi αn ≤ xp ≤ βn pour p≥ n et ce pour
n∈ N. Donc, pour p,q≥ n, on a αn ≤ xp ≤ βn et αn ≤ xq ≤ βn , ce qui donne αn − βn ≤
xq −xp ≤ βn − αn , c.à.d. |xq − xp | ≤ βn − αn , (tout ceci est valable même si (xn )n n’est
1
Ce résultat est appelé aussi “théorème du chariot” ou ‘théorème des gendarmes”.
pas de Cauchy mais, si (xn )n est de Cauchy, les suites (αn )n et (βn )n sont dans R car (xn )n
est bornée, voir 2.8, 2.9). Pour que les suites (αn )n et (βn )n soient adjacentes, il reste la
condition lim
n∞
(βn − αn )=0 qui va découler de ce que (xn )n est de Cauchy. En effet, comme
(xn )n est de Cauchy, pour ε ∈ R+ ∗ fixé on peut trouver nε ∈ N tel que si p,q≥ nε alors
|xp − xq | < ε. Pour n≥ nε , on peut trouver pn ≥ n et qn ≥ n tels que αn ≤ xpn < αn + ε
et βn − ε <xqn ≤ βn (propriété des bornes supérieures et inférieures). Ce qui donne, pour
n≥ nε , βn − αn − 2ε <xqn −xpn < βn − αn . En ne gardant que la première inégalité,
βn − αn − 2ε <xqn −xpn ≤ |xqn − xpn | ≤ ε et finalement βn − αn − 2ε < ε ou βn − αn < 3ε
pour n≥ nε . Ainsi, les suites (αn )n et (βn )n sont adjacentes, donc elles convergent vers une
même limite et (xn )n converge vers cette limite car αn ≤ xn ≤ βn pour tout n. c.q.f.d.
1.12 Définition. Une suite (xn )n non convergente est dite divergente. Cela peut signifier
deux choses : la suite (xn )n n’a pas de limite, comme la suite ((−1)n )n , ou la suite diverge
vers l’infini. On dit que (xn )n diverge2 vers “plus l’infini” si pour un α > 0 donné, on peut
trouver nα ∈ N tel que si n≥ nα alors xn > α. On note alors (xn )n −→ +∞ ou lim xn =+∞.
n∞ n∞
On définit de manière duale la divergence vers “moins l’infini”.
Par exemple, toute suite croissante non majorée diverge vers +∞, toute suite décroissante
non minorée diverge vers −∞.
1.13 Définition (Sous-suites). Étant donné une suite (xn )n , on appelle sous-suite ou
suite extraite de (xn )n toute suite (yk )k telle que yk =xnk où (nk )k est une suite croisante
d’entiers naturels (nk+1 >nk pour tout k).
Par exemple, (x2n )n et (x2n+1 )n sont les deux sous-suites les plus connues de (xn )n , la
sous-suite des termes de rang pair et la sous-suite des termes de rang impair, il suffit de
poser yk =x2k par exemple pour la première sous-suite. On rappelle que l’indice n d’une
suite peut être remplacée par n’importe quelle autre variable, c’est le symbole x de xn qui
est important, c.à.d. que si j’écris (xn )n ou (xk )k , j’utilise la même suite.
On montre facilement que toute suite extraite d’une suite de Cauchy est de Cauchy,
toute suite extraite d’une suite convergente converge vers la limite de la suite mère. Toute
suite extraite d’une suite extraite de (xn )n est encore une suite extraite de (xn )n .
β−α
d’intervalles [αk ,βk ] de longueur qui contiennent tous une infinité d’éléments de s0 et
2k
tels que αk ≤ αk+1 ≤ βk+1 ≤ βk , pour tout k∈ N∗ . On choisit un xnk dans [αk ,βk ] de telle
façon que la suite d’indice (nk )k soit croissante. On laisse à l’étudiant le soin de terminer
la démonstration.
2.1 Définition. On dit qu’une suite de nombres complexes (zn )n est bornée si la suite
(|zn |)n est bornée. On dit qu’une partie A⊂ C est bornée si l’ensemble {|z|/z∈a} est borné
dans R.
On dit qu’une suite (zn )n est bornée devant une suite (z′n )n si l’on peut trouver un rang
zn
n0 ∈ N tel que la suite ′ est bornée, on note (zn )n =O((z′n )n ) ou, plus simplement,
zn n≥n0
zn =O(zn ), lire “zn est un grand O de z′n ”. Une suite est bornée ssi elle est bornée devant
la suite constante 1.
On dit que (zn )n est négligeable devant (z′n )n si l’on peut trouver un rang n0 ∈ N tel
zn
que la suite ′ tend vers 0, on note (zn )n =o((z′n )n ) ou, plus simplement, zn =o(z′n ),
zn n≥n0
lire “zn est un petit O de z′n ”. Une suite tend vers 0 ssi elle est négligeable devant la suite
constante 1. Un “grand O de zn ” est un “petit o de zn ”, évidemment.
On dit que (zn )n est équivalente à (z′n )n si l’on peut trouver un rang n0 ∈ N tel que
zn
la suite tend vers 1, on note (zn )n ≈(z′n )n ou, plus simplement, zn ≈z′n , ce qui
z′n n≥n0
équivaut à (zn −z′n )=o(z′n ). Cette dernière relation est une relation d’équivalence.
On rappelle qu’une relation R définie entre les éléments d’un ensemble donné E est une
relation d’équivalence si elle est réflexive, symétrique et transitive. Elle est réflexive au
sens que xRx pour chaque x∈E, elle est symétrique au sens que si xRy alors yRx aussi,
elle est transitive au sens que si xRy et yRz alors xRz aussi. Une relation d’équivalence
donne une partition de l’ensemble E en classe(s) d’équivalence, une classe d’équivalence est
une partie de E constituée par tous les éléments équivalents à un élément donné et E est
la réunion de toutes les classes d’équivalence et deux classes d’équivalence distinctes ont
une intersection vide.3 .
2.2 Proposition . Toute suite convergente est bornée (dans R et dans C). En fait,
toute suite de Cauchy est bornée. (cf. prop. 1.7 pour le cas réel).
En effet, |zn |=|zn − l + l| ≤ |zn − l| + |l| ≤ (ε + max {|zk − l|/ k=0, n−1})+|l|, où est
la limite de la suite (zn )n .
2.3 Proposition . Une suite (zn )n converge vers z, dans C, ssi les suites (an )n et
(bn )n telles que an = Re(zn ) et bn = Im(zn ) convergent respectivement vers a=Re(z) et
b=Im(z).
Preuve : La suite (zn )n (zn =xn +iyn ) converge vers l=a+ib ssi les suites (xn −a)n et
(yn −b)n converge vers 0 dans R. En effet, |zn − l|= |(xn − a)+i(yn − b)| ≤ |xn − a| +
|yn − b| d’une part et d’autre part, |xn − a| ≤ |zn − l| et |yn − b| ≤ |zn − l|. c.q.f.d.
2.5 Proposition . Toute suite convergente est de Cauchy. Et toute suite de Cauchy
dans C est convergente dans C. Toute série dans C converge ssi elle vérifie le critère de
Cauchy. Si une série [zn ]n∈N converge, alors la suite (zn )n tend vers 0. Le reste d’ordre n
∞
Rn = xp tend vers 0 quand n−→ n∞
∞. Ces résultats sont valables aussi pour des suites
p=n+1
et des séries dans R.
Preuve : On remarque d’abord que la suite (zn )n est de Cauchy ssi les suites (xn )n
et (yn )n sont de Cauchy, xn = Re(zn ) et yn =Im(zn ). En effet, comme précédemment,
3
Pour la construction de R, on utilise la relation d’équivalence suivante entre suite de Cauchy dans Q
définie par (xn )n R(yn )n si |xn − yn | −→ 0. R est alors l’ensemble des classes d’équivalence sur lequel on
n∞
définit une addition et une multiplication.
2.7 Proposition . Soient (xn )n et (yn )n deux suites dans R, telles que (xn )n −→ +∞
n∞
(resp. −∞) et (yn )n −→
n∞
y∈ R. Alors :
(i) (xn +yn )n −→
n∞
+∞ (resp. −∞); en fait il suffit que la suite (yn )n soit minorée (resp.
majorée).
(ii) La suite (xn yn )n −→ +∞ si y>0 et −∞ si y<0, on ne peut rien dire à priori si y=0.
n∞
1 + − 1
(iii) La suite ( )n −→ 0 (resp. 0 ), c.à.d. ( )n −→ 0 tout en restant >0 (resp. <0).
xn n∞ xn n∞
Preuve : (i) Supposons (yn )n est minorée, c.à.d. yn >m pour tout n∈ N. Comme (xn )n
−→ +∞, on peut trouver, pour α > 0, un nα ∈ N, tel que si n≥ nα alors xn > α−m, donc
n∞
xn +yn >(α−m)+m= α. Donc (xn +yn )n −→ +∞. Et si (yn )n −→ y∈ R, on sait que (yn )n
n∞ n∞
est bornée donc minorée.
4
En anglais, un élément de R est dit “extended real”. On dit par fois aussi en français “réel généralisé”.
(ii) Supposons y>0. Si (yn )n est minorée par un m>0, c.à.d. si yn >m>0, alors on
1
trouvera comme précédemment, pour α > 0, un nα ∈ N tel que si n≥ nα alors xn > α. ,
m
1
donc xn yn > α. .m=α. Donc (xn yn )n −→ +∞.
m n∞
(iii) Comme (xn )n −→ +∞, on peut trouver, pour ε > 0, un nε ∈ N, tel que si n≥ nε
n∞
1 1 1
alors xn > α = , donc on a bien < ε pour n≥ nε , tout en ayant > 0. c.q.f.d.
ε xn xn
2.8 Définition. Soit une suite (xn )n dans R, bornée. On note (αn )n et (βn )n les suites
telles que βn =sup{xp /p≥n} et αn =inf{xp /p≥n}. Comme la suite (xn )n est bornée, αn et
βn sont des nombres réels. On appelle limite supérieure de (xn )n notée lim sup xn ou lim xn
n∞ n∞
la limite de la suite (βn )n et limite inférieure de (xn )n notée lim
n∞
inf xn ou limxn la limite
n∞
de la suite (αn )n . Si la suite (xn )n n’est pas bornée, on peut considérer les suites (αn )n et
(βn )n dans R.
2.9 Proposition . Les limites supérieures et inférieures d’une suite bornée (xn )n dans
R existent dans R. Si la suite n’est pas bornée, elles existent dans R.
Preuve : Notons les résultats suivants concernant les suites (αn )n et (βn )n . Puisque
{xp /p≥n+1}⊂ {xp /p≥n}, alors αn+1 ≤ αn et βn+1 ≥ βn . De plus, αn ≤ xn ≤ βn . Si la suite
(βn − αn )n tend vers 0, les deux suites (αn )n et (βn )n seraient adjacentes et convergeraient
vers une limite unique l qui serait donc aussi la limte de (xn )n . Mais en général, la suite
(βn − αn )n ne tend pas vers 0. Cependant, si (xn )n est minorée alors la suite (βn )n est une
suite décroissante minorée, et elle converge si elle est dans R. La condition “(xn )n majorée”
assure qu’elle est dans R. De même, la condition “(xn )n bornée” assure la convergence de
la suite suite (αn )n .
Si la suite n’est pas minorée, il se peut que αn = −∞, et si la suite n’est pas majorée, il se
peut que βn = +∞. Donc, les deux suites (αn )n et (βn )n seraient dans R. Mais, il est facile
de voir que dans R, on a les résultats “toute suite décroissante converge” éventuellement
vers −∞ et “toute suite croissante converge” éventuellement vers +∞.
2.10 Proposition . Une suite dans R (xn )n converge vers x ssi lim xn =lim
n∞
xn = x. (En
n∞
fait, le résultat reste vrai même si l’on se place dans R).
Preuve : Voir la démonstration précédente de la proposition 2.9.
2.11 Proposition . Si une suite (xn )n dans R ou C converge vers x, alors elle converge
x0 + x1 + · · · + xn
en moyenne vers x, c.à.d. la suite (xn )n de terme général xn = converge
n+1
vers x. On dit aussi que (xn )n converge au sens de Césaro vers x.
La démonstration (facile) sera donnée à titre d’exercice.
Passons aux séries dans R ou dans C. Donnons quelques critères classiques bien connus
de convergence de séries, ceux qui nous sont accessibles pour le moment, mais il y en a
d’autres utilisant des résultats que nous n’avons pas encore démontrés. Le critère le plus
simple est celui qui dit que si le terme général d’une série [z n ] n dans C ou R s’écrit
2.12 Définition. On dit qu’une série [xn ]n dans R ou une série [zn ]n dans C est
absolument convergente si la série de nombres réels [|xn |]n (resp. [|zn |]n ) converge, c.à.d.
∞ ∞
si |xn | < +∞ (resp. |zn | < +∞). On dit que la série est semi-convergente si elle
n=0 n=0
est convergente sans être absolument convergente. On dit qu’une série [xn ]n dans R est
alternée si xn xn+1 <0, c.à.d. xn est xn+1 sont de signes opposés.
On dit qu’une série série [xn ]n dans R ou une série [zn ]n dans C est commutativement
convergente si la série de nombres réels [xσ(n) ]n (resp. [zσ(n) ]n ) converge et converge vers la
∞ ∞ ∞ ∞
même somme que [xn ]n (resp. [zn ]n ), c.à.d. si xn = xσ(n) (resp. zn = zσ(n) ) pour
n=0 n=0 n=0 n=0
toute permutation σ de N, c.à.d. pour toute bijection σ de N sur N, ou un réarrangement
des éléments de la série initiale.
Nous admettrons que “toute série absolument convergente est commutativement con-
vergente et réciproquement”.
2.15 Proposition . Deux séries de nombres réels [xn ] et [yn ]n telles que xn ≈yn et les
termes de (xn )n gardent un signe contant sont de même nature. En conséquence, si deux
séries [zn ] et [z′n ]n sont telles que zn ≈z′n et si l’une est absolument convergente, l’autre l’est
aussi.
Preuve : C’est un corollaire de la précédente, car on peut trouver n0 ∈ N tel que − 12 yn
<xn −yn ≤ 12 yn , pour n≥ n0 . C.à.d. 12 yn <xn ≤ 32 yn . c.q.f.d.
5
La série [yn ]n est dite “majorante”.
De l’autre côté, x2n+1 ≤ x2n+1 −1 , x2n+1 ≤ x2n+1 −2 , ..., x2n+1 ≤ x2n +1 = x2n+1 −(2n −1) , x2n+1 ≤
1
x2n =x2n+1 −2n . Et en faisant l’addition membre à membre, on obtient . 2n+1 x2n+1 ≤
2
1 1
x2n+1 −1 +x2n+1 −2 + · · · +x2n +1 +x2n . C’est-à-dire yn+1 ≤ s2n+1 −1 −s2n −1 . Ce qui donne
2 2
n+1 1
yp = sn+1 ≤ s2n+1 −1 −s20 −1 = s2n+1 −1 −s1 . Donc, si la suite ( s2n+1 −1 )n est bornée, la suite
p=0 2
1
( sn+1 )n aussi.
2
Si on applique cela à xn =nα , on a yn =2n x2n =2n (2n )α = 2n (2nα ) =2n(α+1) =(2α+1 )n . C’est
une série géométrique de raison 2α+1 . La conclusion est facile. c.q.f.d.
1
2.17 Proposition .(Critère de CAUCHY) Si lim |xn | n <1, la série [xn ]n est absolu-
n∞
1 1
ment convergente. Si lim
n∞
|xn | n >1, la série [xn ]n est divergente. Si lim
n∞
|xn | n =1, il faut voir
1 1
de plus près. Ce critère peut être amélioré en utilisant lim
n∞
|xn | n à la place de lim
n∞
|xn | n .
1
Preuve : Si lim |xn | n <1, c.à.d. lim βn =1−δ<1 (voir définition 2.8), alors d’après les
n∞ n∞
inégalités aux limites, on peut trouver n0 ∈ N, tel que pour n≥ n0 , βn < 1 − δ (proposition
1 1
1.8). Donc pour n≥ n0 , |xn | n < 1 −δ (car |xn | n ≤ βn ). Donc, |xn | ≤ (1−δ)n pour n≥ n0 . Et
comme la série [(1−δ)n ]n est une série géométrique de raison (1−δ)<1, donc convergente,
1 1
alors la série [|xn | n ]n≥n0 est aussi convergente. De manière analogue, si lim |xn | n >1, on
n∞
1
trouve une série géométrique minorante de [|xn | n ]n≥n0 divergente. Donc, elle est divergente.
c.q.f.d.
|xn+1 |
2.18 Proposition .(Critère de d’ALEMBERT) Si lim <1, la série [xn ]n est
n∞|xn |
|xn+1 | |xn+1 |
absolument convergente. Si lim >1, la série [xn ]n est divergente. Si lim =1,
n∞ |xn | n∞ |xn |
il faut voir de plus près.
|xn+1 |
Preuve : Si lim =1−δ < 1, comme précédemment on trouve que |xn+1 |<(1−δ)|xn |,
n∞ |x |
n
pour n≥ n0 et finalement |xn+1 |<(1−δ)n−n0 |xn0 | et on conclut comme pour la proposition
précédente. c.q.f.d.
2.19 Définition. (Somme et Produit de séries) Étant donné deux séries [xn ]n et
[yn ]n , on appelle série somme des deux séries la série de terme général [un ]n définie par
un =xn +yn . On note aussi [xn ]+[yn ]= [un ]. On appelle série produit de la série [xn ]n par
le scalaire λ ∈ R ou C selon, la série de terme général [vn ]n définie par vn =λxn . On note
[vn ]n =λ[xn ]n . On appelle série produit ou produit de Cauchy des deux séries la série de
n n
terme général [zn ]n définie par zn = xp yq = xn−k yk (ou xn−k yk si la série est définie
p+q=n k=0 k=1
à partir du rang n=1). On note aussi [xn ].[yn ]= [zn ]. On voit facilement que ce produit est
commutatif et distributif par rapport à la somme. On voit qu’il existe un élément neutre
pour ce produit (la série 1= [1, 0, 0, 0, ... ]), on peut voir même que l’ensemble des séries
est une algèbre sur R ou C selon le cas). Mais laissons cela car cela nous mènera loin.
Si l’on écrit les produits xp yq dans un tableau (une matrice) comme pour la représentation
n
de N × N, zn est la somme des éléments de la n-ième diagonale, et la somme partielle zr
r=0
est la somme des éléments sur les diagonales 0 à n (voir le procédé de dénombrement de
Cantor).
x0 y0 x1 y0 x2 y0 · · · xn y0 · · · x2n y0 · · ·
x0 y1 x1 y1 x2 y1 · · · xn y1 · · · x2n y1 · · ·
... ..
x0 y2 .
.. ...
. x1 yn−1 · · · xn yn−1 · · ·
x0 yn ··· xn yn x2n yn · · ·
.. .. ... ..
. . .
.. ..
. .
x0 y2n x1 y2n xn y2n · · · x2n y2n
.. .. .. .. ...
. . . .
2.20 Proposition . (j) La combinaison linéaire [wn ]n de deux séries [xn ]n et [yn ]n con-
vergentes (resp. absolument convergentes) est convergente (resp. absolument convergente)
vers la même combinaison linéaire de leur somme.
(jj) La série [zn ]n produit de deux séries convergentes [xn ]n et [yn ]n peut ne pas converger
mais la suite (sn )n des sommes partielles de [zn ]n converge en moyenne (au sens de Césaro)
∞ ∞ s0 + s1 + · · · + sn
vers le produit de leur somme xy ( xn =x et yn =y). C.à.d. lim =xy.
n=0 n=0 n∞ n+1
Corollaire : Si la série produit de deux séries convergentes [xn ]n et [yn ]n converge, elle
converge vers le produit de leur somme xy.
Preuve : (j) est évident et laissé à titre d’exercice. Nous admettrons (jj), car c’est un
n
peu plus long et difficile. Le corollaire en découle facilement, car si sn = zk et si sn −→n∞
s,
k=0
s0 + s1 + · · · + sn
alors lim =s. Donc s=xy. c.q.f.d.
n∞ n+1
2.21 Proposition . Le produit de deux séries absolument convergentes est absolument
convergent et converge vers le produit de leur somme.
Preuve : Il suffit de montrer qu’elle est convergente, car pour le reste on applique
n n
Preuve : Donnons une idée de la démonstration. Notons sn = xq , s′n = yp et
q=0 p=0
′′ n n
sn = zk , avec zn = xp yq = xn−k yk =xn y0 +xn−1 y1 + · · · +x1 yn−1 +x0 yn . Notons s′
k=0 p+q=n k=0
∞ n ∞
= |yp |, s′n = |yp | et s= xp . Alors s′′2n −sn s′n =[y0 (xn+1 +xn+2 +· · ·x2n )+y1 (xn+1 +xn+2 +
p=0 p=0 p=0
· · ·x2n−1 )+· · · +yn−1 xn+1 ]+[yn+1 (x0 +x1 + · · · +xn−1 )+yn+2 (x0 +x1 + · · · +xn−2 )+· · · +y2n x0 ]
= An +Bn avec An =[y0 (xn+1 +xn+2 + · · ·x2n )+y1 (xn+1 +xn+2 + · · ·x2n−1 )+· · · +yn−1 xn+1 ] et
Bn =[yn+1 (x0 +x1 + · · · +xn−1 )+yn+2 (x0 +x1 + · · · +xn−2 )+· · · +y2n x0 ]. Et l’on a : |An | ≤
[|y0 | |xn+1 + xn+2 + · · · + x2n |+|y1 | |xn+1 + xn+2 + · · · + x2n−1 |+· · · + |yn−1 | |xn+1 |] =
[|y0 | |s2n − sn |+|y1 | |s2n−1 − sn |+· · · + |yn−1 | |sn+1 − sn |] ,
et |Bn | ≤ [|yn+1 | |x0 + x1 + · · · + xn−1 |+|yn+2 | |x0 + x1 + · · · + xn−2 |+· · · + |y2n | |x0 |] =
[|yn+1 | |sn−1 |+|yn+2 | |sn−2 |+· · · + |y2n | |s0 |] .
Pour ε > 0 donné, |An | ≤ [|y0 |+|y1 |+· · ·+|yn−1 |] sup(|s2n − sn |,|s2n−1 − sn |, ..., |sn+1 − sn |)=
s′ sup(|s2n − sn |,|s2n−1 − sn |, ..., |sn+1 − sn |) ≤ s′ ε pour n suffisamment grand car la série
[xn ] est convergente, donc la suite (sn )n vérifie le critère de Cauchy. De même, |Bn | ≤
[|yn+1 |+|yn+2 |+· · · + |y2n |]sup( |sn−1 |,|sn−2 |, ..., |s0 |) ≤ ( s′2n − s′n )β, où β ≥ |sn | pour tout n
(la suite (sn )n est bornée car elle converge). Donc |Bn | ≤ εβ, pour n suffisamment grand.
Finalement, |s′′2n − sn s′n | ≤ ε(s′ + β). La même chose est vraie pour s′′2n+1 − sn+1 s′n+1 .
Comme sn s′n −→ n∞
xy, alors s′′2n et s′′2n+1 −→
n∞
xy, donc s′′n −→n∞
xy, on montre en effet que si une
suite (xn )n est telle que les deux sous-suites (x2n )n et (x2n+1 )n convergent vers une même
limite, alors la suite (xn )n elle-même est convergente vers cette limite. c.q.f.d.
2.23 Proposition .(Série alternée) Soit une série alternée [xn ]n∈N telle que la suite
(|xn |)n est décroissante vers 0. Alors la série converge. De plus, |Rn | ≤ |xn+1 | (Rn étant le
∞
reste d’ordre n, Rn = xk ).
k=n+1
2.24 Proposition .(Critère d’ABEL) La série [xn yn ]n converge si les trois conditions
suivantes sont vérifiées : (i) la série [|xn − xn+1 |]n converge, (ii) lim
n∞
xn =0, (iii) la suite
des sommes partielles de [yn ]n est bornée.
n k
(xk+1 −xk )Yk où Yk = yq , somme partielle de [yn ]n . On en déduit facilement que la
k=0 q=0
série [xn yn ]n vérifie le critère de Cauchy pour les séries. c.q.f.d.
La somme partielle d’une série représente une approximation de la somme à |Rn | près,
car |s − sn | = |Rn |. Une toute dernière remarque que tout étudiant apprend par cœur
est que “la convergence d’une série (ainsi que d’une suite) ne dépend pas des premiers
termes de la série”, ce qui signifie que si l’on supprime ou si l’on change un nombre fini
de termes dans une suite (xn )n ou dans une série [xn ]n , on ne change pas sa nature, si elle
était convergente la nouvelle suite ou série obtenue est encore convergente. Par contre, la
somme de la série n’est plus la même si l’on change certains de ses termes.
Maintenant, dans R, la partie entière d’un nombre x est aussi définie, [x] est le plus grand
entier (donc l’unique entier) n tel que n≤ x<n+1. Les formules x0 =[x] et xn =[pn x] −p.[pn−1 x]
sont donc bien définies, pour un x∈ R quelconque, pas nécessairement rationnel. De plus,
xn
il est facile de voir que la série [ n ]n vérifie le critère Cauchy, donc elle est convergente car
p
∞ xn
R est complet. Donc, il existe y∈ R, tel que y=x0 + n
.
n=1 p
xn 1 n 1 x1 xn 1
(1◦ ) Puisque n
= n [p x] − n−1 .[pn−1 x], on obtient : sn =x0 + + · · · + n = n [pn x].
p p p p p p
1 1 1
Et comme x− n < n [pn x] ≤x (car pn x−1< [pn x] ≤pn x), alors n [pn x] −→ x (Théorème
p p p n∞
∞ xn
du chariot), c.à.d. que x= n
. Donc x=y.
n=0 p
Ensuite, le développement x0 ,x1 x2 x3 ... d’un réel x est propre. Pour le voir,
souvenons-nous de l’algorithme ayant conduit à la formule xn = [pn x] −p. [pn−1 x]. En fait,
si l’on a une suite de bases (pn )n≥1 , pn ∈ N et ≥ 2, et si l’on définit par récurrence,
x′ =x−[x], x′′ =p1 x′ − [p1 x′ ], x′′′ =p2 x′′ − [p2 x′′ ], ..., x(n+1) =pn x(n) − [pn x(n) ], etc.. Alors
x′′ 1 x1 x′′
x0 =[x], xn = pn x(n) , etc.. Ainsi, x=x0 +x′ = x0 + + [p1 x′ ] =x0 + + =
p1 p1 p1 p1
x1 x′′′ 1 x 1 1 x ′′′
x 1 x2 x′′′
x0 + + + [p2 x′′ ] =x0 + + [p2 x′′ ] + =x0 + + + =
p1 p1 p2 p1 p2 p1 p1 p2 p1 p2 p1 p1 p2 p1 p2
x1 x2 xn x(n)
· · ·=x0 + + +··· + + . Lorsque la base p est fixée, pn =p pour
p1 p1 p2 p1 p2 ...pn p1 p2 ...pn
x1 x2 xn x(n) x(n) x(n)
tout n≥ 1. Alors, x=x0 + + 2 + · · · + n + n =sn + n . Donc, x−sn = n , c.à.d. 0≤
p p p p p p
x(n) 1
x−sn = n
< n (0≤ x(n) <1). Ceci empêche l’existence de n0 ∈ N tel que xn =p−1 pour
p p
∞ xk ∞ p−1 1
n≥ n0 , car x−sn0 = k
= k
= n0 . Donc le développement est bien propre.
k=n0 +1 p k=n0 +1 p p
(2◦ ) Soit maintenant (an )n une suite d’entiers tels que 0≤ an <p (pour n≥ 1) et telle
que pour tout n0 ∈ N, on peut toujours trouver un n≥ n0 tel que an <p−1. Et soit
∞ an
a=a0 ,a1 a2 a3 ... =a0 + n
. Soit aussi (xn )n la suite telle que x0 = [a] et xn =[pn a] −p. [pn−1 a]
n=1 p
pour n≥ 1. Il nous faut montrer que an =xn pour tout n. Pour le voir, donnons un critère
∞ an
pour que un nombre a0 ,a1 a2 a3 ... =a0 + n
soit inférieur à un nombre x0 ,x1 x2 x3 ...
n=1 p
∞ xn ∞ an ∞ xn
=x0 + n
, c.à.d. a 0 ,a 1 a 2 a 3 ... <x 0 ,x 1 x2 x3 ... ou encore a 0 + n
<x0 + n
, les deux
n=1 p n=1 p n=1 p
développements étant propres. C’est un ordre sur l’ensemble des développements pro-
∞ an n0 −1 an
pres. Remarquons d’abord que si, pour un certain n0 , an0 <p−1, alors n
= n
+
n=1 p n=1 p
an0 ∞ an n0 −1 p − 1 p − 1 ∞ p−1
n
+ n
< n
+ n
+ n
=1. Ainsi, si a0 <x0 , c.à.d. a0 ≤ x0 − 1,
p 0
n=n0 +1 p n=1 p p 0
n=n0 +1 p
∞ an ∞ xn ∞ an
alors a0 + <a 0 + 1<x 0 ≤ x 0 + (en effet, <1 puisqu’il existe an0 <p−1, le
n=1 pn n=1 pn n=1 pn
développement étant propre). Supposons que a0 =x0 , a1 =x1 , ..., an1 =xn1 , et an1 +1 <xn1 +1 ,
n 1 an ∞ an
c.à.d. an1 +1 ≤ xn1 +1 − 1. Le même raisonnement dit que a0 + n
+ <x0 +
n=1 p n=n1 +1 pn
n1 xn ∞ xn n1 an n1 xn ∞ an ∞ xn
n
+ n
(a 0 + n
=x 0 + n
, mais n
< n
).
n=1 p n=n1 +1 p n=1 p n=1 p n=n1 +1 p n=n1 +1 p
2012
Alain Ralambo
∞ an
En résumé, pour que un nombre a0 ,a1 a2 a3 ... =a0 + soit inférieur à un nombre
n=1 pn
∞ xn ∞ an
x0 ,x1 x2 x3 ... =x0 + n
, c.à.d. a0 ,a1 a 2 a 3 ... <x0 ,x1 x2 x3 ... ou encore a0 + n
<x0 +
n=1 p n=1 p
∞ xn
n
, les deux développements étant propres, il faut et il suffit qu’il existe n1 ∈ N tel
n=1 p
que a0 =x0 , a1 =x1 , ..., an1 =xn1 , et an1 +1 <xn1 +1 . Cet ordre est appelé l’ordre lexicographique,
celui du dictionnaire.
∞ an
En conséquence, puisque a=a0 ,a1 a2 a3 ... =a0 + et que si (xn )n est telle que x0 = [a]
n=1 pn
∞ xn
et xn =[pn a] −p. [pn−1 a] pour n≥ 1, alors a= x0 + n
d’après le (1◦ ) et que les deux
n=1 p
développements sont propres, alors an =xn pour tout n.
Ainsi, tout nombre réel x admet un développement unique propre et tout développement
propre correspond à un unique nombre réel.
Inversement, on peut très bien définir axiomatiquement R comme l’ensemble des dévelop-
pements propres x=x0 ,x1 x2 x3 ..., muni de la relation d’ordre définie précédemment, c.à.d.
R={x=x0 ,x1 x2 x3 ... / le développement x0 ,x1 x2 x3 ... est propre}, les xn étant des nombres en-
tiers entre 0 et p−1. C’est-à-dire, on posera par définition qu’un réel est un développement
propre x=x0 ,x1 x2 x3 .... Le seul problème que cela pose est l’opérationnalité du système.
Comment définir l’opération somme : (x0 ,x1 x2 x3 ...)+(y0 ,y1 y2 y3 ...) ? De même, comment
définir l’opération produit : (x0 ,x1 x2 x3 ...)·(y0 ,y1 y2 y3 ...) ? Si par exemple, x100 +y100 est
supérieur à p, il y aura une retenue, qui se propage sur la gauche, c.à.d. qu’elle doit être
ajoutée à x99 . Les résultats sur les séries (addition et produit) peuvent permettre de définir
ces opérations, mais cela pose des problèmes, on est obligé de travailler avec des valeurs
approchées (sommes partielles) comme le fait un ordinateur.
D’ailleurs, si l’on sait que, théoriquement, tout nombre réel x admet un développement
unique propre, c’est généralement la croix et la bannière pour trouver ce développement. Et
cette ignorance du développement de certain nombre célèbre comme π a permis à certains
mathématiciens de formuler des paradoxes.
Ce résultat permet toutefois de démontrer un résultat important.
Chapitre 2 : FONCTIONS
NUMÉRIQUES
RÉELLES.
Les mathématiques, c’est-à-dire les objets mathématiques et les représentations qu’on en
fait, ainsi que les principes et les idées qui se dégagent et se découvrent quand on les
étudie, servent souvent à aider les humains à prendre les décisions. Les nombres ont servi
et continuent de servir d’outil à la prise de décisions. Cependant, les fonctions ont dépassé
les nombres et sont devenues “le” principal outil de prise de décision, tant à l’intérieur
des mathématiques qu’à l’extérieur. Les fonctions ont envahi les sciences et les pseudo-
sciences, tout le monde utilise les fonctions à tort ou à raison, mais généralement à tort
et à travers. Il faut essayer de compter les mots en “ogramme” (en excluant les unités
de poids et le mot programme), électrocardiogramme, histogramme, etc., censés désigner
quelque fonction “scientifique” ! Un “spécialiste” (entre guillemets) regarde une courbe
(un graphe) et prétend prédire l’avenir : les prix vont augmenter, la terre va trembler, un
tsunami va se produire, etc.. Certains regardent un électrocardiogramme et vous disent
que votre ventricule gauche est malade, par une science empirique qui n’a rien à voir avec
les mathématiques et les fonctions.
Une fonction est un processus mental par lequel les mathématiciens décrivent
certaines relations entre certains faits ou états de fait ou certains états de choses et
d’autres qui sont ou peuvent être liés à eux, et les mathématiciens les “algébrisent”
(les mettent en “équation”) pour pouvoir en discuter plus facilement. Par exemple, la
(mesure de la) surface S d’un disque circulaire est reliée à la mesure r de son rayon, par la
formule S=πr2 , on dit que S est une fonction de r. Cet exemple part d’une considération
pratique, car la connaissance de la mesure de la surface d’un disque est certainement
très utile, et les mathématiciens ont d’ailleurs trouvé cette formule depuis très longtemps.
Mais les mathématiciens ne s’arrêtent pas à des considérations pratiques, la généralisation
a gagné l’âme des mathématiciens, ils ont inversé les choses et construisent des fonctions qui
n’ont aucune interprétation à √priori; ainsi si S=πr2 représente qoelque chose de très concret,
on peut étudier la quantité πr 29 qui représente on ne sait pas quoi mais qu’on peut étudier
pour le plaisir. Vu sous cette optique, la nature (la nature mathématique) est pleine de
fonctions qui cherchent des utilisations, des fonctions qu’on ne sait même pas représenter,
même si parfois elles ont des utilités évidentes. Mais la nature non mathématique aussi
est remplie de fonctions qu’on essaie de représenter par des formules mathématiques. Et,
essentiellement, c’est ce vers quoi tend toute l’analyse : “la recherche de fonctions usuelles
qui représentent de plus près (approximent) les phénomènes physiques”, les découvertes
majeures des sciences expérimentales reposent sur des formulations mathématiques ap-
proximatives des phénomènes, et cela marche. La théorie des fonctions que nous allons
étudier est élémentaire, mais elle est la base de toute l’analyse. Les notions essentielles de
la théorie sont la notion de limite, la continuité, la différentiation et l’intégration.
1 Généralités.
1.1 Définitions. Une fonction est un procédé d’appariement entre les éléments d’un
ensemble A et ceux d’un ensemble B. C’est là le processus mental dont nous parlions
précédemment dans notre petite introduction; dans notre exemple, A est l’ensemble des
disques circulaires ou des rayons de ces disques, et B est l’ensemble R+ des nombres réels
positifs ou nuls. Un élément r de A est mis en relation avec l’élément S=πr2 de R+ .
Pour étudier les fonctions, on les représente sur nos feuilles de papier par des signes
graphiques en leur donnant des noms et on utilise des variables. Ainsi, on appelle fonction
f d’un ensemble A dans un ensemble B tout procédé qui à un x∈A associe un y∈B unique,
x est appelé l’antécédent de y par la fonction f et y l’image de x par f, on écrit y=f(x)
et y est aussi appelé une valeur de f. A s’appelle l’ensemble de départ de la fonction et
B son ensemble d’arrivée. On note alors f : A−→B, x−→f(x)=y. Retenons la chose
importante suivante : quand on écrit y=f(x), x est une variable appelée l’argument de
la fonction f, et cela signifie que, pour trouver la valeur de f en un point donné x0 , on doit
remplacer l’argument x dans la définition de f(x) par le symbole x0 .
Parfois, on a une formule unique bien définie pour exprimer f(x) à l’aide de x, comme
S=πr2 exprime S à l’aide de r. Parfois, on est obligé de décrire la fonction par plusieurs
formules, comme f(x)=1 si x∈ Q et f(x)=−1 si x∈ R\Q. Parfois, on doit même la décrire
par plusieurs phrases. L’essentiel est que la description de la fonction soit bien définie,
comme toujours en mathématique 6 . Deux fonctions f et g sont égales si Df =Dg et si
f(x)=g(x) pour tout x∈Df (cf. définition de Df juste ci-après). Donc, f=g si Df =Dg ou si
Df =Dg mais on peut trouver x0 ∈Df tel que f(x0 )=g(x0 ).
Applications.
Parfois, on ne peut pas trouver d’élément de B à associer à certains x de A. Et à cause
de cela, on appelle domaine de définition de f la partie Df ⊂A telle que tout x∈Df a une
image. Et l’on appelle application toute fonction f telle que l’ensemble de départ A est
égal au domaine de définition Df . Il faut donc distinguer les fonctions et les applications 7 .
L’ensemble des applications de A dans B est noté F(A,B). Dans la suite, nous étudierons
des fonctions de la variable réelle ou de plusieurs variables réelles (ou de la variable com-
6
Ceci est la situation idéale, car il y a beaucoup plus de fonctions dont on n’a pas de formule pour les
exprimer que de fonctions exprimables par des formules. Certaines sont connues par leur graphe.
7
Cependant, parfois on fait un abus et on confond “application” et “fonction”.
2011
Alain Ralambo
Donnons quelques notions utiles dans l’étude des fonctions et dans leur représentation
graphique.
Fonctions paires et fonctions impaires.
Lorsque le domaine de définition Df est symétrique, c.à.d. lorsque −x∈Df chaque fois que
x∈Df , il est d’usage de comparer f(−x) et f(x). Si f(−x)=f(x) (resp. −f(x)) pour tout x∈Df ,
on dit que la fonction f est paire (resp. impaire). Pour une fonction paire, pour chaque
x∈Df , le point Mx =(x,f(x)) et le point M−x =(−x,f(−x))=(−x,f(x)) sont symétriques par
rapport à l’axe représentant B (le segment Mx M−x est coupé en son milieu par l’axe), sur
le graphe Γf , et en conséquence, Γf est symétrique par rapport à l’axe vertical représentant
B. L’étude d’une fonction paire se fait sur la moitié de Df , Df ∩ R+ par exemple. On a
un résultat analogue pour une fonction impaire g, excepté que le graphe Γg est symétrique
par rapport à l’origine O des axes, le segment Mx M−x est coupé en son milieu par O, pour
tout x∈Df .
Fonctions périodiques.
Lorsque le domaine de définition Df est tel que Df + ω=Df pour un certain ω ∈ R∗ et que
f(x+ω)=f(x) pour chaque x∈Df , on dit que la fonction f est périodique et que ω est une
période de f. L’ensemble des périodes d’une fonction f est un groupe, c.à.d. stable pour
l’addition et la soustraction (ω ± ω1 est aussi une période si ω et ω1 sont des périodes).
Par abus de langage, la plus petite période positive de f, si elle existe, est appelée la
période de f . Lorsque f est continue, cf. définition ci-après, la plus petite période positive
−−−−−→
existe si f est périodique. Le vecteur Mx Mx+ω , pour Mx =(x,f(x)) et Mx+ω =(x+ω,f(x+ω))
−
→
(=(x+ω,f(x))), est un vecteur Vω indépendant de x, parallèle à l’axe des x et de longueur
ω. En conséquence, il suffit de connaı̂tre le graphe de f, et donc d’étudier f, sur une portion
[0,ω[∩Df du domaine de définition Df pour connaı̂tre tout le graphe de f, en faisant une
−→
translation Vω autant de fois que nécessaire.
Fonctions bornées.
Lorsque l’image de f, f(Df ), est majorée (resp. minorée) dans B, on dit que f est majorée
(resp. minorée). Cela signifie qu’on peut trouver M∈ R (resp. m∈ R) tel que f(x)<M
(resp. f(x)>m) pour chaque x∈Df . On dit que f est bornée si elle est à la fois majorée
et minorée. Cela signifie que f(Df ) est contenu dans un certain [a,b]. Le graphe de f est
alors situé dans une bande horizontale limitéé par deux parallèles l’une passant par y=a
et l’autre par y=b.
2011
Alain Ralambo
Restriction, Prolongement.
Étant donné une fonction f : A−→B et une partie A1 ⊂A, on appelle restriction de f à A1 ,
notée f|A1 , la fonction définie sur A1 à valeur dans B telle que f|A1 (x)=f(x) pour x∈A1 . En
fait, f|A1 =f◦iA1 . Inversement, étant donné une fonction f : A−→B et une partie A2 ⊃A, on
appelle prolongement de f à A1 toute fonction g : A2 −→B telle que g|A =f.
Exemples.
- La fonction caractéristique d’une partie A⊂X est une application de X dans R, 1IA :
1IA (x)=0 si x ∈
/A
X−→ R définie par . Remarquer que c’est bien une fonction, et une
1IA (x)=1 si x ∈ A
seule fonction et non deux fonctions comme certains étudiants croient. Elle est bornée car
elle ne prend que deux valeurs.
- Le processus mental qui consiste à associer à un nombre x un nombre y tel que y2 =x
n’est pas une fonction car elle n’est pas bien définie. En effet, le domaine de définition
ne peut être que R+ ou une partie de R+ . Mais pour un x positif, il y a deux y tels que
y2 =x. Donc, il faut préciser quel y on doit prendre.
- La fonction cosinus définie sur R est une application périodique et paire comme tout le
monde le sait.
2 LIMITES.
2.1 Définition. (LIMITES) Dans les chapitres précédents, nous avons parlé d’une
suite (xn )n∈N d’éléments d’un ensemble E comme d’une application x : N −→E, à n∈ N
on associe x(n)=xn ∈E, et nous avons étudié la limite d’une suite (de nombres rationnels
ou réels ou complexes). Souvent, une fonction f : A−→B est aussi considérée comme une
famille d’éléments de B indexée par l’ensemble A, f est identifiée à la famille (fx )x∈A où
fx =f(x). Il est donc normal de parler aussi de limite pour les fonctions et, de ce point de
vue, le graphe d’une fonction donne une autre vision de la limite d’une suite. Nous allons
donner, pour mémoire, la définition usuelle de la limite d’une fonction en un point donné
mais ensuite nous utiliserons des suites. Mais auparavant, donnons une définition que nous
utiliserons dans la suite.
Étant donné une partie A⊂ R, on dit qu’un point a∈ R est adhérent à A, et l’on note
a∈ A, si l’on peut trouver au moins une suite (xn )n de points de A qui tend vers a. La
définition peut être étendue à a∈ R, et ainsi −∞ est adhérent à A s’il existe une suite de
1
points (xn )n de A qui tend vers −∞. Par exemple, 0 est adhérent à ]0,1] car la suite ( )n
n
est dans ]0,1] et elle tend vers 0. De même, tout nombre réel est adhérent à Q, car nous
savons que pour chaque réel α, il existe au moins une suite de nombres rationnels tendant
vers α.
Dans la suite de la définition, on fixe une fonction numérique réelle f, A⊂Df et a∈ A et
b∈ R.
On dit que f(x) tend vers b lorsque x tend vers a en restant dans A si à chaque ε>0, on
peut associer un δ>0 tel que pour x∈A vérifiant |x − a|<δ 8 on a |f(x) − b|<ε, δ dépend
de a et de ε.
On dit que f(x) tend vers +∞ (resp. vers −∞) lorsque x tend vers a en restant dans A si
à chaque ε>0, on peut associer un δ>0 tel que pour x∈A vérifiant |x − a|<δ on a f(x)>ε
(resp. f(x)<−ε).
Si a=−∞, on dit que f(x) tend vers b lorsque x tend vers a en restant dans A si à chaque
ε>0, on peut associer un δ>0 tel que pour x∈A vérifiant x<−δ on a |f(x) − b|<ε.
Si a=+∞, on dit que f(x) tend vers b lorsque x tend vers a en restant dans A si à chaque
ε>0, on peut associer un δ>0 tel que pour x∈A vérifiant x>δ on a |f(x) − b|<ε.
Si a=−∞, et b=−∞, on dit que f(x) tend vers b lorsque x tend vers a en restant dans A si
à chaque ε>0, on peut associer un δ>0 tel que pour x∈A vérifiant x<−δ on a f(x)<−ε.
Si a=−∞, et b=+∞, on dit que f(x) tend vers b lorsque x tend vers a en restant dans A
si à chaque ε>0, on peut associer un δ>0 tel que pour x∈A vérifiant x<−δ on a f(x)>ε.
On définit de manière analogue les cas a=+∞ et b=±∞.
Dans tous les cas, la notation est la même, on écrit b=lim
x→a
f(x) ou b==x→
lima f(x) en
A
x∈A
remplaçant a et b par leur valeur.
Lorsque A=Df , on dit simplement que f(x) tend vers b quand x tend vers a, sans préciser
“en restant dans Df ”, et l’on note b=lim
x→a
f(x) au lieu de b= x→a
lim f(x).
x∈Df
La définition de limite que nous avons donnée est celle d’une limite “conditionnée” 9 . Par
exemple, on aura b=lim
x→a
f(x) pour la “limite à droite de f(x) au point a” et b=lim
x→a
f(x) pour
x∈A x∈A
x>a x<a
la “limite à gauche”. Mais on peut avoir n’importe quelle condition qu’on veut, pourvu
que a soit adhérent à l’ensemble déterminant la condition.
Maintenant, donnons un théorème qui est équivalent à la définition et que nous utiliserons.
on sait qu’on peut trouver δ>0 tel que si x∈A et si |x − a| < δ, alors |f(x) − b| < ε. Main-
tenant, puisque (xn )n −→n∞
a, on peut trouver N1 ∈ N tel que si n≥N1 alors |xn − a| < δ.
Donc si n≥N1 , alors |f(xn ) − b| < ε, c.à.d. |yn − b| < ε. Il suffit de prendre Nε =N1 . c.q.f.d.
(ii) Il faut d’abord montrer que toutes les suites (yn )n convergent vers une même limite
b. Soient donc (yn )n et (y′n )n deux suites telles que yn =f(xn ) et y′n =f(x′n ) où (xn )n et (x′n )n
−→
n∞
a dans A. Par hypothèse, (yn )n −→ n∞
b1 et (y′n )n −→
n∞
b2 , il faut montrer que b1 =b2 .
On construit la suite (xn )n dans A telle que x2n =xn et x2n+1 =x′n , ce qui fera que (xn )n et
′′ ′′ ′′
(x′n )n sont respectivement la sous-suite des termes de rang pair et la sous-suite des termes
de rang impair de (x′′n )n . En conséquence, puisque (xn )n et (x′n )n −→ n∞
a, (x′′n )n −→
n∞
a aussi.
′′ ′′ ′′
Donc, par hypothèse, (yn )n −→ n∞
b3 , où yn =f(xn ). Mais (yn )n est la sous-suite des termes
′′
de rang pair de (yn )n , donc elle converge aussi vers b et, en exercice, on a vu que la limIte
d’une suite dans R est unique lorsqu’elle existe, donc b1 =b. On montre de même que b2 =b
en utilisant (y′n )n . Ensuite, il faut montrer que b=lim x→a
f(x). On raisonne par l’absurde.
x∈A
Si la limite de f(x) quand x→A a n’existe pas, donc f(x) ne tend pas vers b, nous traitons
seulement le cas a et b finis. Donc, on peut trouver un ε > 0 tel que pour chaque η > 0,
on peut trouver un xη ∈A avec |xη − a| < η mais |f(xη ) − b| ≥ ε. On a écrit la négation de
1
la définition de b=lim x→a
f(x). Prenant η= , et en écrivant xη =xn , on obtient une suite (xn )n
x∈A n
1
telle que xn ∈A avec |xn − a| < mais |f(xn ) − b| ≥ ε. Ce qui est contradictoire car (xn )n
n
−→
n∞
a et f(x n)
n∞
b. Au cas où a=+∞, on aurait pris xη > η à la place de |xη − a| < η, puis
on aurait eu la suite (xn )n −→ a=+∞ en prenant η=n. c.q.f.d.
n∞
1 1
par (x)= .
g g(x)
2011
Alain Ralambo
On appelle produit de f par le scalaire λ, la fonction notée λf, définie sur Dλf =Df , par
(λf)(x)=λf(x).
On appelle sup de f et de g la fonction notée sup (f,g) ou f∨g sur Dsup (f,g) =Df ∩Dg par [sup
(f,g)](x)=sup (f(x),g(x)), définition analogue pour inf (f,g) ou f∧g. On définit également
(sup fi )(x)=sup fi (x) sur Dfi et de manière analogue inf fi .
i∈I i∈I i∈I i∈I
Nous connaissons déjà la fonction composée de f par g, notée g◦f, définie sur Df , lorsque
f(Df )⊂Dg , par [g◦f](x)=g(f(x)).
On appelle valeur absolue de f la fonction notée |f| sur Df définie par |f|(x)=|f(x)|.
Ces opérations sur les fonctions sont aussi définies pour des fonctions complexes sauf pour
sup et inf.
2.6 Définition. L’ensemble des applications de l’ensemble X dans R (resp. dans C) est
noté F(X,R) (resp. F(X,C)). (F(X,R),+, .) est un anneau commutatif unitaire (de même
que (F(X,C),+, .)). (F(X,R),+, λ.) est un espace vectoriel sur R et (F(X,C),+, λ.) est un
espace vectoriel sur C, cf. définition en algèbre plus tard.
Pour deux fonctions f et g∈ F(X,R), on dit que f est inférieure ou égale à g, et l’on note
f≤g, si f(x)≤g(x) pour chaque x∈X. On dit que f est inférieure strictement à g, et l’on note
f<g, si f≤g et f=g c.à.d. que f(x)≤g(x) pour tout x∈X mais qu’on peut trouver au moins
un x0 ∈X tel que f(x0 )=g(x0 ).
(F(X,R),≤) est un treillis, ce qui signifie que pour deux fonctions f et g dans F(X,R),
sup (f,g)=f∨g et inf (f,g)= f∧g sont dans F(X,R). Un bon exercice est de tracer le graphe
de sup (f,g) et inf (f,g) sachant le graphe de f et de g.
(i) b 1 +b 2 = x→a
lim (f+g)(x)
x∈A
(ii) λb 1 = x→a
lim ( λf )(x)
x∈A
(iii) b 1 b 2 = x→a
lim (fg)(x)
x∈A
1 1 b2 g
(iv) Si b 1 = 0, = x→a
lim ( )(x) et donc = x→a
lim ( )(x)
b 1 x∈A f b 1 x∈A f
(v) |b 1 |= x→a
lim |f(x)|
x∈A
(vi) sup(b 1 ,b 2 )= x→a
lim sup(f,g)((x)
x∈A
(vii) inf (b 1 ,b 2 )= x→a
lim inf (f,g)(x)
x∈A
Preuve : La preuve se fait pour les cas b1 et b2 finis, mais la démonstration s’étend
facilement aux autres cas sauf pour les formes indéterminées bien connues. On applique le
théorème 2.2 et les résultats sur les limites de suites (cf. pr. 2.2.7) jusqu’à (iv). Pour (v) et
1
(vi), il suffit de montrer (v) car (vi) s’en déduit par les formules sup (f,g)= [(f+g)+ |f − g|]
2
1
et inf (f,g)= [(f+g)− |f − g|]. Mais (v) se déduit encore de l’application du th. 2.2 et
2
l’inégalité 0≤ ||f(xn )| − |b1 || ≤ |f(xn ) − b1 | et le théorème du chariot. c.q.f.d.
Remarques : Ce théorème s’étend comme on a dit aux autres cas, sauf les fameuses formes
0 ∞
indéterminées +∞ − ∞, 0.∞, , et 1∞ que nous laissons de côté pour le moment
0 ∞
puisqu’on n’a pas encore vu les exponentielles. Par contre, les résultats sur les suites de la
proposition 2.2.7 s’étendent aux fonctions en remplaçant xn par f(x) et yn par g(x). Laissé
à titre d’exercice.
2.8 Théorème. Soient deux fonctions f et g, A⊂D f , et telles que f(D f )⊂D g , a∈ A,
B=f(A), alors :
Si b= x→a
lim f(x) et b 1 = lim g(y), alors b 1 = x→a
lim (g◦f )(x).
y→b
x∈A y∈B x∈A
Preuve : Remarquons d’abord que b∈ B=f(A), c.à.d. b est adhérent à B, c.à.d. qu’on
peut trouver une suite (yn )n dans f(A) tendant vers b. En effet, soit (xn )n dans A tendant
vers a, une telle suite existe car a∈ A (par hypothèse). Il suffit de poser yn =f(xn ) et on
obtient la suite (yn )n cherchée (th. 2.2).
Ensuite, puisque (yn )n −→n∞
b et yn ∈B, alors g(yn ) −→
n∞
b1 (th. 2.2). C.à.d. g(f(xn )) −→
n∞
b1 . Ceci étant vrai pour toute suite (xn )n dans A tendant vers a, le théorème 2.2 nous dit
que b1 =lim
x→a
(g◦f)(x). c.q.f.d.
x∈A
2.11 Théorème. (du Chariot ou des gendarmes) Soient trois fonctions numériques
réelles f, g, h, A⊂D f ∩D g ∩D h , a∈ A. On suppose que b= x→a
lim f(x) et b= x→a
lim g(x).
x∈A x∈A
2.14 Proposition. Soient f une fonction numérique réelle, A⊂Df , a∈ R tel que a∈ P
où P=A∩]−∞,a[. On suppose que f est croissante au sens large sur P. Soit M=sup f(x).
x∈P
Alors x→a lim f(x)=M− , c.à.d. f(a−0)=M− sur A.
lim f(x)=M. Si M est fini, x→a
x∈A x∈A
x<a x<a
Preuve : Supposons M fini, c.à.d. que f est majorée sur P. Soit ε>0. Par la propriété
caractéristique de la borne supérieure (cf. le chapitre précédent), on peut trouver x0 ∈P
10
Et on peut même préciser que x tend vers a par valeurs supérieures ou inférieures dans A.
tel que M−ε<f(x0 )≤ M. On pose η=a−x0 (au cas où a=+∞, on prendra η=x0 ). Alors, si
lim f(x)=M− .
a−η=x0 <x<a, on a M−ε<f(x0 )≤ f(x)≤ M. Donc x→a
x∈A
x<a
Si M=+∞, pour un α>0, on peut trouver x0 ∈P tel que f(x0 )>α, car f n’est pas majorée
sur P. Donc si x∈A et x0 <x<a alors α<f(x0 )≤ f(x). C’est la définition de x→a
lim f(x)=+∞.
x∈A
x<a
c.q.f.d.
Remarque : On a des résultats analogues pour
a) f décroissante au sens large sur P (utiliser m=inf f(x))
x∈P
b) f croissante au sens large sur P′ =A∩]a,+∞[ (utiliser m= inf′ f(x))
x∈P
c) f décroissante au sens large sur P′ =A∩]a,+∞[ (utiliser M=sup f(x))
x∈P′
2.15 Corollaire. Soient f une fonction numérique réelle, A⊂Df . On suppose f crois-
sante au sens large sur A. Alors, pour tout point a∈ R tel que a est adhérent à A∩]−∞,a[,
f admet une limite à gauche en a (finie ou +∞) quand x tend vers a dans A. Si a∈A, cette
limite est finie et f(a−0)≤f(a).
De même, pour tout point tout point a∈ R tel que a est adhérent à A∩]a,+∞[, f admet
une limite à droite en a (finie ou −∞) quand x tend vers a dans A. Si a∈A, cette limite
est finie et f(a+0)≥ f(a).
Résultats analogues pour f décroissante. (L’étude se ramène à celle d’une fonction crois-
sante en utilisant −f ).
Remarques. Cas particuliers : A est un intervalle. Par exemple, sur A=[a,b], toute
fonction croissante (large) admet en tout point de ]a,b] une limite à gauche finie et en tout
point de [a,b[ une limite à droite finie. Etc..
On peut aussi dire que “une fonction croissante (large) sur [α,+∞[ converge vers une limite
finie quand x−→ +∞” ssi elle est majorée.
2.16 Remarque. Dans la définition 2.1, si l’on prend une fonction numérique complexe,
c.à.d. f à valeurs dans C, mais Df ⊂ R, on obtient la définition de b=lim
x→a
f(x) (b∈ C ici) en
x∈A
remplaçant là où il faut la valeur absolue par le module dans les quantités utilisées dans la
définition 2.1 (|f(x) − b| désigne donc le module de f(x)−b).
Si f=f1 +if2 où f et f sont des fonctions numériques réelles (partie réelle et partie imaginaire
de f) définies sur Df , et si b=b1 +ib2 , alors on obtient le résultat suivant : “b=lim x→a
f(x) ssi
x∈A
b1 =lim f (x) et b2 =lim
x→a 1
f (x)”. Nécessairement, les quantités b1 et b2 sont finies ici.
x→a 2
x∈A x∈A
On obtient alors les équivalents de tous les résultats précédents, sauf sur les fonctions
monotones.
3 CONTINUITÉ.
La continuité est l’application directe de la notion de limite. L’on verra par les exemples
l’origine du terme “continue”. Nous traiterons seulement les fonctions numériques réelles,
pour une fonction numérique complexe la continuité équivaut à la continuité de sa partie
réelle et de sa partie imaginaire, comme dans la dernière remarque de la section précédente.
3.1 Définition. Soient f une fonction numérique réelle, A⊂Df , a∈A. On dit que f
est continue en a (ou au point a) dans A si f(x) tend vers f(a) quand x tend vers a en
restant dans A, c.à.d. si f(a)=lim
x→a
f(x). Nous laissons à l’étudiant le soin de traduire cette
x∈A
définition en “langage ε − α” (C’est un très bon exercice qui est recommandé). On va
d’ailleurs traduire la plupart des résultats de la section précédente en termes de continuité,
mais retenons dès maintenant que f est continue en a (ou au point a) dans A si pour
chaque suite (xn )n dans A tendant vers a, la suite image (f(xn ))n tend vers f(a) (cf.
théorème 2.2).
Soit B⊂A. Si f est continue en tout point b∈B dans A, on dit que f est continue sur B (dans
A). Et si A=Df , c.à.d. si f est une application de A dans R, on dit tout simplement que f
est continue sur B. Dans la suite, on utilisera des applications pour commodité d’écriture,
mais il faut savoir que tout ce qui va suivre reste vrai si l’on se restreint à une partie A de
Df .
Si f est continue en tout point de Df , on dit que f est continue. Un point a où f est continue
est appelé “point de continuité de f” et un point où f n’est pas continue est appelé un
“point de discontinuité”. En général, l’ensemble Cf des points de continuité d’une fonction
f est plus petit que Df , c.à.d. Cf ⊂Df sans être égal.
On dit que f est continue à gauche (resp. à droite) en a (ou au point a) dans A si f(x) tend
vers f(a) quand x tend vers a par valeurs inférieures (resp. supérieures) en restant dans
A, c.à.d. si f(a)=lim
x→a
f(x)=f(a−0) (resp. f(a)=limx→a
f(x)=f(a+0)). Et on remarquera que f
x∈A x∈A
x≤a x≥a
existent mais f présente une discontinuité de 1ère espèce à gauche ou à droite ou des deux
1
côtés. On dit que la discontinuité de 1ère espèce est régulière si f(a)= [f(a+0)+f(a−0)].
2
Dans les autres cas, on dit que f présente en a une discontinuité de 2ème espèce.
Prolongement par continuité.
Si une fonction f n’est pas continue au point a (à gauche ou à droite ou les deux) mais
que la fonction g telle que Df ⊂Dg et g|Df =f, c.à.d. que g est un prolongement de f, est
continue au point a (à gauche ou à droite ou les deux), on dit que g est un prolongement
par continuité de f au point a (à gauche ou à droite ou les deux), et plus précisément, la
fonction f telle que f(x)=f(x) pour x =a et f(a)=g(a) est un prolongement par continuité
de f en a (à gauche ou à droite ou les deux). Si cela est vrai en tout point a∈Df , on dit
que g est un prolongement continu de f. Il est clair qu’on ne peut prolonger par continuité
en un point a une fonction f dont le saut en a est non nul.
1
Exemple. Considérons la fonction f telle que f(x)=0 si x<0, f(x)=1 si x>0 et f(0)= . Il
2
est facile de voir que f(0+0)=1, f(0−0)=0, et donc a=0 est un point de discontinuité de 1ère
espèce de f et même que c’est une discontinuité régulière. La fonction g telle que g(x)=0 si
x≤ 0 et g(x)=1 si x>0 est un prolongement de f par continuité en a à gauche. De même,
la fonction h telle que h(x)=0 si x<0 et g(x)=1 si x≥ 0 est un prolongement par continuité
de f en a à droite. Mais il est impossible de prolonger f par continuité en a.
Les résultats suivants sont des conséquences directes des résultats sur les limites.
3.4 Proposition. Soient f et g deux fonctions numériques réelles, telles que f est
continue au point a∈Df , g est continue au point b=f(a)∈Dg , alors g◦f est continue au point
a. (On suppose que f(]a−ε,a+ε[⊂Dg pour un certain ε > 0). (cf. th. 2.8)
3.5 Proposition. Soit f une fonction numérique réelle, continue au point a∈Df , telle que
f(a)>0. Alors, au moins pour x dans un petit intervalle ]a−ε,a+ε[, f(x)>0. (Conséquence
du th. 2.9)
3.8 Théorème. Si f est une application continue, l’image d’un intervalle est un
intervalle. C.à.d. si f ∈ C(I,R), où I est un intervalle (ouvert, fermé ou semi-ouvert),
alors f(I) est un intervalle, mais on ne sait pas à priori la nature de l’intervalle f(I) à
moins d’avoir des précisions sur l’application f.
Preuve : laissée à titre d’exercice.
On peut donner une équivalente à cette définition en terme de suites comme dans le
théorème 2.2, et la démonstration est analogue à celle du théorème 2.2. Une fonction
f est uniformément continue sur A ssi pour toutes suites (xn )n et (yn )n dans A telles que
(|xn − yn |)n tend vers 0 quand n tend vers +∞, la suite (|f(xn ) − f(yn )|)n tend aussi vers
0. L’application f(x)=x est ainsi uniformément continue sur R.
Remarque : Généralement, on donne en exercice aux étudiants la comparaison entre
“continuité de f sur A” et “continuité uniforme de f sur A”, en utilisant le langage ε − η,
nous les y encourageons. Mais faisons-le en terme de suites.
Dans la proposition précédente équivalente à la définition, les deux suites (xn )n et (yn )n
ne sont pas censées converger. Mais si elles convergent, c’est certainement vers la même
limite car (|xn − yn |)n tend vers 0, notons la a. Dans ce cas, si de plus f est uniformément
continue sur A, les suites (f(xn ))n et (f(yn ))n convergent aussi vers une même limite qui ne
peut être que f(a) (en prenant la suite constante (zn )n telle que zn =a). En conséquence,
d’après le théorème 2.2, f est continue en a. En résumé, si f est uniformément continue
sur A, elle est aussi continue sur A. Mais la réciproque n’est pas toujours vraie, comme le
montre la fonction f(x)=x2 sur R. Cependant, on a le théorème suivant.
3.10 Théorème (de HEINE). Pour a<b dans R, toute fonction f ∈ C([a,b],R) est
uniformément continue sur [a,b].
Preuve : Par l’absurde. Si f n’est pas uniformément continue sur [a,b], on peut trouver
ε > 0, t.q. pour chaque η>0, on peut trouver xη et yη ∈A tels que |x − y| < η alors
1
|f(x) − f(y)| ≥ ε. Prenons η = , on obtient deux suites (xn )n et (yn )n dans [a,b] telles
n
1
que |xn − yn |< et |f(xn ) − f(yn )| ≥ ε. D’après le théorème de Bolzano-Weierstrass, (xn )n
n
admet une sous-suite (xnp )p convergente vers α ∈[a,b]. Puis la suite (ynp )p admet une sous-
1
suite (ynpk )k convergeant vers β ∈[a,b]. Donc, xnpk − ynpk < et f(xnpk ) − f(ynpk ) ≥
npk
ε. Ce qui est impossible, car en faisant k−→ ∞, dans la première inégalité on obtient
|α − β|=0, c.à.d. α = β, tandis que dans la seconde inégalité on aurait |f(α) − f(β)| ≥ ε.
c.q.f.d.
Fonctions réciproques. Homéomorphismes.
Preuve : Posons m=inf f([a,b]) et M=sup f([a,b]). Alors, f([a,b])=[m,M] (théorème des
valeurs intermédiaires). Comme f est croissante, m=f(a) et M=f(b). De plus f est injective,
donc bijective de [a,b] sur f([a,b])=[f(a),f(b)].
On peut donc parler de fonction réciproque f−1 : [f(a),f(b)]−→[a,b]. On a la relation :
y∈[f(a),f(b)] et f−1 (y)=x ssi x∈[a,b] et y=f(x).
Si y1 <y2 dans [f(a),f(b)], avec y1 =f(x1 ) et y2 =f(x2 ), alors x1 <x2 (sinon f(x1 )≥f(x2 )). Donc
f−1 est aussi croissante.
Montrons que f−1 est continue. Soient β ∈ [f(a),f(b)] et α=f−1 (β). Soit ε > 0 tq α+ε <b
(en supposant que β <f(b)). Alors f(a)≤ β <f(α + ε)<f(b) (croissance de f). Soit (yn )n
une suite tendant vers β dans [f(a),f(b)] par valeurs supérieures à β, c.à.d. (yn )n −→ β et
n∞
yn ≥ β. On peut trouver Nε ∈ N tel que si n≥Nε , alors β ≤yn <f(α+ε). Donc, en repassant
dans [a,b], α ≤f−1 (yn )<α + ε. D’après le th. 2.2, f−1 (β + 0)=α, c.à.d. f−1 est continue à
droite en β. On montre de manière analogue qu’elle est continue à gauche. c.q.f.d.
Remarques. 1) Lorsque f est décroissante on a un résultat analogue, mais f−1 est alors
décroissante de [f(b),f(a)] sur [a,b].
2) On démontre le résultat suivant : “Pour f ∈ C(I,R), où I est un intervalle, f est
injective ssi f est monotone strictement”.
3.12 Théorème. Soient I un intervalle d’extrémités a<b, a,b∈ R,et f ∈ C(I,R), stricte-
ment monotone. Alors, f(I) est un intervalle de même nature que I, c.à.d. f(I) est ouvert
(resp. fermé, resp. semi-ouvert) si I l’est. Les extrémités de f(I) sont α= x→a
lim f(x) et β= lim
x→b
x>a x<b
f(x) ( α et β ∈ R).
De plus, f est une bijection de I sur f(I) et l’application réciproque f −1 de f(I) sur I est
continue et strictement monotone (dans le même sens que f ).
Preuve : Supposons par exemple que f est croissante. On sait déjà que f(I) est un intervalle
(th. 3.8), donc forcément d’extrémités m=inf f(I) et M=sup f(I) (croissance de f). Donc
m=α et M=β, toujours par la croissance de f (prop. 2.14). Par ailleurs, il est évident
que m∈f(I) ssi a∈I (de même M∈f(I) ssi b∈I). Donc les intervalles I et f(I) sont de même
nature. D’autre part, f étant injective est bijective de I sur f(I).
Soient y1 <y2 deux éléments de J=f(I). Donc y1 =f(x1 ) et y2 =f(x2 ). Et x1 <x2 , c.à.d.
f−1 (x1 )<f−1 (x2 ), donc f−1 est croissante sur J. De plus, f|[x1 ,x2 ] : [x1 ,x2 ]−→[y1 ,y2 ] est bi-
jective, continue et strictement monotone dont la réciproque est continue et strictement
monotone (dans le même sens), d’après le théorème précédent. Ceci étant vrai pour y1 et
y2 quelconques dans J mais tq y1 <y2 , f−1 est continue sur J. c.q.f.d.
Remarque. A titre d’exercice, montrer que si f : I−→ R est croissante au sens large et
telle que, pour tous les a et b∈I tq a<b, f prend toutes les valeurs entre f(a) et f(b), alors
f est continue. En déduire une démonstration plus simple de la continuité de f−1 dans les
théorèmes précédents.
12
Certains écrivent Arsin, Arcos, Artg , Arcotg.
π π
le cas, par exemple de la fonction sinus restreint à [− , ]; sinus est définie sur R mais
2 2
Arcsin est la réciproque de f=sin|[− π2 , π2 ] . Ce qui fait que Arcsin(sin x) n’est pas toujours
égal à x. La fonction Arcsin ◦ sin est périodique, puisque sin l’est.
Après qu’on aura traité des fonctions hyperboliques, on obtient les fonctions hyperboliques
inverses de manière analogue à celle utilisée ici.
3.15 Définition. Soient A⊂ R, a∈ A (a∈ R). On notera FA,a l’ensemble des fonctions
numériques f telles que on peut trouver un “voisinage” Uf de a tel que f est définie sur Uf ∩A,
c.à.d. Uf ∩A⊂Df (lorsque a∈ R, on peut prendre Uf de la forme ]a−ε,a+ε[, si a=+∞, on
peut prendre Uf de la forme ]β,+∞[ et si a=−∞, on peut prendre Uf de la forme ]−∞,α[).
En particulier, F(A,R)⊂ FA,a (a∈ A). Lorsque f∈ FA,a , on dira parfois que f est définie
dans A “au voisinage de a”. Lorsque A=Df , on notera simplement Fa au lieu de FA,a . Dans
toutes les définitions que nous donnons, on peut éventuellement, selon les besoins, exclure
le point a, c.à.d. on peut donner des définitions avec A\{a} au lieu de A.
Soient f et g∈ FA,a .
1) On dit que f est dominée par g ou que f est bornée devant g au voisinage de a (dans A)
si l’on peut trouver un “voisinage” V de a et une constante λ ∈ R tels que |f(x)| ≤ λ |g(x)|
pour x∈V∩A. On note alors f g (notation de Hardy) ou f=O(g) (notation de Landau
d’usage plus courant, à lire “f est un grand O de g). Remarquons que f=O(g) si dans un
f(x)
“voisinage” de a, f(x)=0 si g(x)=0 sinon ≤ λ (λ constante ne dépendant que de f
g(x)
et g). Noter bien qu’on écrit toujours f=O(g) et jamais O(g)=f. Certains auteurs écrivent
f∈O(g), c.à.d. O(g) désigne l’ensemble des fonctions bornées devant g au voisinage de a
dans A.
2) On dit que f est négligeable devant g au voisinage de a (dans A) si pour chaque ε > 0,
on peut trouver un “voisinage” U de a tel que |f(x)| ≤ ε |g(x)| pour x∈V∩A. Comme
f(x)
précédemment, cela signifie que si g(x)=0 alors f(x)=0 sinon ≤ ε, c.à.d.
g(x)
f(x)
lim
x→a g(x)
=0. On note f≺≺g (notation de Hardy) ou f=o(g) (Notation de Landau, lire f est
x∈A
g(x)=0
un petit o de g), toujours écrire f=o(g) et ne jamais écrire o(g)=f. Certains auteurs écrivent
f∈o(g), c.à.d. o(g) désigne l’ensemble des fonctions négligeables devant g au voisinage de
a dans A.
3) On dit que f est équivalente à g au voisinage de a (dans A) si f−g est négligeable devant
g c.à.d. f−g=o(g) au voisinage de a (dans A). L’on note f∼g. Comme précédemment, cela
f(x) f(x)
signifie que g(x)=0 ssi f(x)=0 et sinon − 1 ≤ ε, c.à.d. x→a
lim =1.
g(x) x∈A g(x)
g(x)=0
Preuve : On montre d’abord que si f−g=o(g) alors g=O(f) et f=O(g) (au voisinage de
a). En effet, ||f| − |g|| ≤ |f − g| ≤ ε |g|. Donc |g| − |f| ≤ ε |g| et (1−ε)|g| ≤ |f| ’en ayant
pris ε < 1). Donc g=O(f). D’un autre côté, f=f−g+g=o(g)+g=o(g)+O(g)=O(g).
f∼f évidemment. Si f∼g, f−g=o(g) et g=O(f), donc f−g=o(O(f))=o(f) ((iv) des remarques
précédentes), donc g−f=o(f), c.à.d. g∼f. Si f∼g et si g∼h alors f−g=o(g) et g−h=o(h).
Donc f−h=f−g+g−h=o(O(h))+o(h)=o(h). c.q.f.d.
3.17 Proposition. Soient f, g∈ FA,a telles que f∼g au voisinage de a et f(x)→b quand
x→a (x∈A). Alors x→a
lim g(x)=b.
x∈A
Preuve : Si b=0, g∼f∼b donc g∼b (on utilise la remarque (viii) précédente). Si b=o,
f=o(1) et comme g∼f, g=O(f), donc g=O(o(1))=o(1) (on utilise la remarque (vii) précédente).
c.q.f.d.
Remarque : Si f1 ∼f2 et g1 ∼g2 au voisinage de a, on n’a pas nécessairement f1 +g1 ∼f2 +g2 .
Contre exemple : f1 (x)=1+x, f2 (x)=1+x2 , g1 (x)=g2 (x)=−1, a=0, A=R+ ∗ . De même, si
f1 =o(f2 ) et g1 =o(g2 ), on n’a pas nécessairement f1 +g1 =o(f2 +g2 ).
f◦h∼g◦h.
DÉVELOPPEMENTS LIMITÉS.
3.21 Définition. Soient A⊂ R, a∈ R tel que a est adhérent à A\{a} (on dit aussi
que a est un point d’accumulation de A 13 )et f∈ FA,a . On dit que f admet (dans A) un
développement limité à l’ordre n, au voisinage de a, si l’on peut trouver un voisinage U
de a et un polynôme Pn de degré ≤ n tels que f(x)=Pn (x−a) +o((x−a)n ), ce qui signifie
que f(x)−Pn (x−a) est négligeable devant (x−a)n au voisinage de a (dans A). Parfois, on
écrit f(x)=Pn (x−a) +εn (x)(x−a)n , où la fonction εn (x)→ 0 quand x→a. Dans tout ceci, n
est un entier naturel fixé. Pn (x−a) est appelé le développement limité de f à l’ordre n au
voisinage de a.
Remarques.
1) La définition signifie que l’on peut trouver un intervalle ]a−ε,a+ε[ avec ε > 0, des réels
a0 , a1 , ..., an , et une fonction εn : ]a−ε,a+ε[−→ R tels que
(i) x→a
lim εn (x)=0,
x=a
13
Il en est ainsi si l’on peut trouver une suite (xn )n dans A telle que xn =a pour tout n, et lim xn =a.
n∞
1 xn+1
3.22 Exemples. 1) 1−xn+1 =(1−x)(1+x+ · · · +xn ). Donc = 1+x+ · · · +xn +
1−x 1−x
1
(x=1). Donc = Pn (x)+ o(x ) (O(x )) au voisinage de a=0. Pn (x)=1+x+ · · · +xn
n n+1
1−x
1
est donc le développement limité en 0 à l’ordre n (au sens fort) de f(x)= .
1−x
2) Soit P(x)=a0 +a1 (x−a)+· · · +ak (x−a)k (k∈ N∗ ). Si n≥k, P(x)=P(x)+0.(x−a)n (εn (x)=0),
et d◦ P=k≤ n, donc P(x) est le développement à l’ordre n de P au voisinage de a. Si n<k,
P(x)=a0 +a1 (x−a)+· · · +an (x−a)n +(x−a)n (an+1 (x−a)+an+2 (x−a)2 +· · · +ak (x−a)k−n ) =
a0 +a1 (x−a)+· · · +an (x−a)n +(x−a)n εn (x) avec εn (x)=an+1 (x−a)+an+2 (x−a)2 +· · · +ak (x−a)k−n
→ 0 quand x→a. Donc, Pn (x)=a0 +a1 (x−a)+· · · +an (x−a)n est le développement limité à
l’ordre n de P au voisinage de a.
3.25 Corollaire. Si f est une fonction paire (resp. impaire) admettant un développement
limité à l’ordre n au voisinage de 0 (a=0), ce développement ne contient que des termes
de degré pair (resp. impair).
Preuve : En effet, si f(x)=a0 +a1 x+· · · +an xn + εn (x)xn , alors f(x)=f(−x)=a0 −a1 x+· · · +
(−1)n an xn +εn (−x)(−1)n xn . Par unicité, a1 =−a1 , an =(−1)n an . Donc, a2k+1 =−a2k+1 , donc,
a2k+1 =0. c.q.f.d.
3.27 Proposition. Soient f∈ FA,a (a=0) et g∈ FB,b (b=0), tels que f et g sont
développables à l’ordre n au voisinage de 0 (dans A et dans B respectivement). On suppose
que g◦f∈ FA,a (f(A)⊂B) et que x→a lim f(x)=0 (0=b). Alors, g◦f est développable à l’ordre n
x∈A
x=a
au voisinage de 0 (dans A) et son développement à l’ordre n au voisinage de 0 s’obtient
en tronquant à l’ordre n le polynôme Pn (Qn (x)), c.à.d. en ne prenant que les monômes de
degré ≤ n.
Preuve : Soit h(x)=g(f(x)). Supposons que f(x)=Qn (x)+ε1,n (x).xn et g(y)=Pn (y)+ε2,n (y).yn
εk,n → 0 quand x→0 et qd y→0 respectivement. Qn (x)=ap xp +ap+1 xp+1 + · · · +an xn , avec
p∈ N, n≥ p≥ 1 car Qn (0)= x→alim f(x)=0. Pn (y)=b0 +b1 y+· · · +bn yn . Donc, h(x)=g(f(x)=
x∈A
x=a
Pn (f(x))+ε2,n (f(x)).(f(x))n = Pn (Qn (x)+ε1,n (x).xn )+ε2,n (f(x)).(f(x))n = Pn (Qn (x))+ε3,n (x).xn
+ε2,n (f(x)).(f(x))n et ε2,n (f(x)).(f(x))n =ε4,n (x).xn . Et on termine le raisonnement comme
pour le produit, par troncature à l’ordre n. c.q.f.d.
Pour terminer cette section, ajoutons que la théorie des développements limités au voisi-
nage de a est généralisée par celle des développements asymptotiques par rapport à une
échelle de comparaison au voisinage de a. Une échelle de comparaison est une famille
ou un ensemble de fonctions E ⊂ FA,a satisfaisant à certaines conditions que vérifie la
famille des monômes ((x−a)n )n∈N . Le but est de trouver une approximation de fonction
f∈ FA,a vérifiant certaines conditions par une combinaison linéaire d’éléments de E, ap-
pelée développement asymptotique de f au voisinage de a, exactement comme pour un
développement limité. C’est-à-dire qu’on cherche à décomposer f sous la forme f=λ0 ϕ0
+λ1 ϕ1 +· · · + λn ϕn +o(ψ) où les ϕ et ψ ∈ E et telles que ψ=o(ϕn ) et ϕk =o(ϕk−1 ). Nous
n’allons pas le faire. Mais sachons que, comme nous le disions au début de cette section,
c’est une généralisation de la décomposition d’un réel dans une base p, une application de
la division dans N, c.à.d. qu’on essaie de définir une “division euclidienne” dans FA,a (on
décompose f sous la forme f=ϕφ + ψ avec ψ=o(ϕ) faisant office de reste et φ jouant le rôle
du quotient de la division de f par ϕ).
4 DÉRIVATIONS ET APPLICATIONS.
La dérivation et la différentiation sont deux notions des plus importantes en analyse. Nous
ne saurions pas décrire ici toutes les applications de ces deux notions. Dans le paragraphe
précédent, nous disions qu’on essaie de définir une “division euclidienne” dans FA,a , la
dérivation est un procédé allant dans ce sens. A l’origine, les techniques utilisées dans la
dérivation proviennent de la physique avec ses “vitesse” et “accélération”, justement dans
le problème de la divisibilité du temps qui a intrigué tous les chercheurs depuis l’aube des
mathématiques, et le symbolisme de la physique est resté en usage.
Dans la suite, nous simplifions l’écriture mais toute la théorie peut se transposer dans la
même style que celui de la section précédente en utilisant des limites conditionnelles du
genre x→a
lim f(x). Nous traitons seulement le cas de fonctions numériques réelles, pour les
x∈A
x=a
fonctions complexes il faut décomposer les fonctions en partie réelle et partie imaginaire.
4.1 Définition. Soit f une fonction numérique réelle et a∈Df . On dit que f est dérivable
à droite (resp. à gauche) en a si Df contient un intervalle I=[a,a+η[ (resp. ]a−η,a]) (η < 0)
f(x) − f(a) f(x) − f(a)
et si x→a
lim [resp. x→a
lim ] existe et est finie. Elle est alors appelée la
x>a x−a x<a x−a
dérivée à droite (resp. à gauche) de f au point a et est notée f ′d (a) (resp. f ′g (a)). C.à.d.
f(x) − f(a) f(x) − f(a)
f ′d (a)=lim
x→a
et f ′g (a)=lim
x→a
.
x>a x−a x<a x−a
On dit que f est dérivable en a si Df contient un intervalle I=]at-η,a+η[ (η < 0) et
f(x) − f(a)
si x→a
lim existe et est finie. Elle est alors appelée la dérivée de f au point a et est
x=a x−a
f(x) − f(a)
notée f′ (a). C.à.d. f ′ (a)=lim
x→a
. Ce cas se produit ssi f est dérivable à droite et à
x=a x−a
De même, si l’on note y=f(x), en posant ∆x=x−a (appelé “variation de x”), ∆y= ∆f =
∆f ∆y
f(x)−f(a) = f(a+∆x)−f(a), on a aussi : f ′d (a)= lim = lim . Etc.. Et justement,
∆x→0 ∆x ∆x→0 ∆x
∆x>0 ∆x>0
df
on note aussi f ′ (a)= (a) 14 , le “∆” devient “d” après passage à la limite.
dx
Remarques.
f(x) − f(a) ′
1) Développement limité. En posant ε(x)= −fd (a) pour x=a et ε(a)=0, et en
x − a
notant α=f ′d (a) quand f est dérivable à droite en a, on obtient f(x)−f(a)=α(x−a)+ε(x).(x−a)
pour x>a. C.à.d. f admet un développement limité à l’ordre 1, à droite, au voisinage de a.
Et la fonction ψ(x)=ε(x).(x−a) est un o(x−a) car x→a lim ε(x) =0. On remarque là le schéma
x>a
de la “division euclidienne” dans FA,a qu’on essaie de définir : f(x)−f(a)=α(x−a)+ψ(x).
Et si l’on se réfère au mécanisme du développement d’un réel dans une base p, on devrait
ensuite “diviser” ψ(x) par (x−a), c’est (x−a) qui remplace la base p. C.à.d. calculer à
ε(x) − ε(a)
nouveau x→a
lim . Etc.
x>a x−a
14 d
On note aussi f(a).
dx
4.2 Théorème. Si une fonction f est dérivable (resp. à droite, resp. à gauche) en a,
alors f est continue (resp. à droite, resp. à gauche) en a.
f(x) − f(a)
Preuve : En effet, f(x)−f(a)= .(x−a) tend vers f ′ (a).0=0 qd x tend vers a.
x−a
c.q.f.d.
Remarques. 1) La réciproque n’est pas vraie en général : prendre f(x)=x pour x∈ Q et
f(x)=0 si x∈
/ Q, c.à.d. f=1IQ . Elle est continue en 0 mais non dérivable en 0.
2) Si f est dérivable à droite et dérivable à gauche, sans être dérivable, au point a, elle est
continue en a.
4.3 Définition. (Dérivées d’ordre supérieur) Soit f une fonction numérique réelle.
L’ensemble des x∈Df où f est dérivable est noté Df ′ . Lorsque Df ′ =Ø, on obtient l’application
f ′ : Df ′ −→ R, x−→f ′ (x), appelée la dérivée de f ou la dérivée première de f, dont le do-
maine de définition est justement Df ′ . On remarquera que Df ′ ⊂Cf ⊂Df .
Si f ′ est aussi dérivable en un point a∈Df ′ , sa dérivée en a (f ′ )′ (a) est appelée la dérivée
d2 f
seconde de f en a et notée f ′′ (a) ou f(2) (a) 15 ou (a) 16 . Et par récurrence, on définit,
dx2
quand c’est possible, la dérivée n-ième (ou d’ordre n) de f en a, c’est la dérivée de la dérivée
dn f d dn−1 f
(n−1)-ième de f en a, c.à.d. f(n) (a) 17 =(fn−1) )′ (a) ou n (a) = ( n−1 )(a). On voit tout
dx dx dx
de suite (par récurrence) que f(n) (a)=(f′ )(n−1) (a). Et l’on définit de manière analogue la
dérivée à droite d’ordre n de f en un point a.
Par conventon, f(0) =f, pour toute fonction f.
4.4 Définition. Soit p∈ N. On dit qu’une fonction numérique réelle f est de classe C p
sur un intervalle I si f(p) (x) existe pour chaque x∈I (à gauche ou à droite aux points où cela
est nécessaire) et si la dérivée f(p) est continue sur I (à gauche ou à droite aux points où
cela est nécessaire). Si f est de classe C p alors elle est de classe C k pour k≤p évidemment.
15
Lire “f seconde de a”.
16 d2 f(a)
On note aussi .
17
dx2
Lire “f n-ième de a”.
On dit que f est de classe C ∞ sur I si elle admet des dérivées de tout ordre sur I (cela
équivaut à dire que f est de classe C k pour tout k∈ N).
Preuve : Par récurrence. La formule est vraie pour n=0 et n=1. Supposons qu’elle est
n−1
vraie à l’ordre n−1, c.à.d. que (uv)(n−1) (x)= Cpn−1 .u(n−1−p) (x).v(p) (x).
p=0
n−1
Alors, (uv)(n) (a)= Cpn−1 .(u(n−p) (a).v(p) (a)+u(n−1−p) (a).v(p+1) (a))
p=0
18
Dérivée de Log (f) ou Ln (f).
n−1 n−1
= Cpn−1 .u(n−p) (a).v(p) (a) + Cpn−1 .u(n−1−p) (a).v(p+1) (a)
p=0 p=0
n−1 n
= Cqn−1 .u(n−q) (a).v(q) (a) + Cq−1
n−1 .u
(n−q)
(a).v(q) (a) (en posant q=p+1 dans la seconde
q=0 q=1
sommation)
n−1
= (Cqn−1 +Cq−1
n−1 ).u
(n−q) n−1 (0)
(a).v(q) (a) +Cn−1 .u (a).v(n) (a) + C0n−1 .u(n) (a).v(0) (a).
q=1
Et Cqn−1 +Cq−1 q n−1 n 0 0
n−1 =Cn , Cn−1 =Cn =Cn−1 =Cn =1.
n−1
Donc, (uv)(n) (a)= Cqn .u(n−q) (a).v(q) (a) +Cnn .u(0) (a).v(n) (a) + C0n .u(n) (a).v(0) (a),
q=1
n
c.à.d. (uv)(n) (a)= Cpn .u(n−p) (a).v(p) (a). La formule est donc vraie à l’ordre n. Donc, elle
p=0
est vraie pour tout n∈ N. c.q.f.d.
4.8 Proposition. (Fonction réciproque) Soit f une fonction numérique réelle bijec-
tive d’un intervalle I sur un intervalle J, dérivable en un point a∈I et telle que f ′ (a)= 0.
1
Alors, la fonction réciproque g=f−1 est dérivable en b=f(a) et g ′ (b)= ′ , ce qui s’écrit
f (a)
−1 ′ 1 −1 ′ 1
aussi (f ) (b)= ′ −1 (On résume par (f ) = ′ −1 ).
f (f (b)) f ◦f
g(y) − g(b)1 1 1
Preuve : = = = . Soit ϕ(x)=
y−b y−b f(g(y)) − f(g(b)) f(g(y)) − f(a)
g(y) − g(b) g(y) − g(b) g(y) − a
1 1 1 g(y) − g(b)
pour x=a et ϕ(a)= ′ . On a x→a lim ϕ(x) = ′ et = ϕ(g(y)).
f(x) − f(a) f (a) x=a f (a) y−b
x−a
g(y) − g(b) 1
Comme g est continue en b, −→ ϕ(g(b)) =ϕ(a) = ′ . c.q.f.d.
y−b y→b f (a)
Remarque. Il est vivement recommandé à l’étudiant de regarder ce qui se passe si l’on
remplace dans ces théorèmes le mot “dérivée” (ou dérivable) par “dérivée à droite” (ou
dérivable à droite), et de même “à gauche”. Par exemple, dans cette proposition-ci, si f
est croissante, on peut remplacer toutes les dérivées par de des dérvées à droite (ou par
des dérivées à gauche). Et si f est décroissante, l’existence de f′d (a) entraı̂ne l’existence de
(f−1 )′g (b).
DIFFÉRENTIELLES.
La notion de différentielle est surtout utile pour des fonctions de plusieurs variables réelles;
dans le cas d’une variable réelle, son intérêt réside dans la facilitation de la mémorisation
des résultats. La notion de différentielle utilise des notions algébriques que nous n’avons
pas encore abordées. Aussi, nous allons en donner une présentation simplifiée.
4.10 Définition.
Une application L : R −→ R est dite linéaire si elle est de la forme L(x)=αx où α ∈ R. Une
application H : R −→ R est dite affine si elle est de la forme H(x)=L(x)+β où L est linéaire
et β ∈ R, auquel cas L est appelée la partie linéaire de H. L’ensemble des applications
linéaires de R dans R est noté L(R,R). C’est une espace vectoriel de dimension 1 sur R
dont une base est constituée par le singleton formé par l’application identité idR (x−→x),
ce qui signifie que l’on peut écrire L=αL .idR pour chaque application linéaire L∈ L(R,R)
avec αL ∈ R (αL =L(1)).
Deux fonctions numériques réelles f et g, définies au voisinage de a∈ R, sont dites tangentes
en a si f−g=o(ϕ) au voisinage de a, où ϕ(x)=x−a (On peut définir aussi les notions de
tangence à droite ou à gauche et la tangence à un ordre supérieur). La relation ainsi définie
est une relation d’équivalence et lorsque f et g sont tangentes en a, alors f−g est continue
en a et f(a)=g(a).
est appelée la différentielle de f en a et notée da f ou (df)a (ou encore f ′ (a) quand aucune
confusion avec la dérivée de f en a n’est possible). On voit donc que (df)a (x)=f ′ (a).x
et on obtient une application df : Df ′ −→ L(R,R) qui à a∈Df ′ associe (df)a ∈ L(R,R),
df(a)=(df)a , appelée la différentielle 19 de f.
Lorsque f est une application linéaire L∈ L(R,R), L(x)=αx, tout le monde sait que
L ′ (x)=α. Donc (dL)x =L en tout point x∈ R, la différentielle de L en x est L elle-même.
En particulier, pour L=idR , L(x)=x. On note alors, pour un point a∈ R, (dL)a =L=idR
par dx (lorsque la variable utilisée, l’argument de la fonction L, est x) pour signifier que
c’est la différentielle en a de l’application x−→x. On devrait écrire (dx)a , mais comme
c’est indépendant de a (c’est L), on n’écrit pas l’indice “a”.
En conséquence, pour une application f différentiable en a, on a (df)a (x)=f ′ (a).x = f ′ (a).L(x)
= [f ′ (a).L](x) = [f ′ (a).dx](x), et donc (df)a =f ′ (a).dx (ce qui est cohérent avec ce que nous
disions, que (df)a =α(df)a .idR , ici idR =dx, α(df)a = f ′ (a)). C’est cette formule qu’on doit
retenir : (df)a =f ′ (a).dx.
Malheureusement, on note aussi dx la différentielle de l’application x−→x (quand la vari-
able utilisée est x). C’est-à-dire que le symbole “dx” dénote deux choses différentes : la
différentielle de l’identité idR en chaque point a∈ R (c.à.d. dx=(dϕ)a où ϕ=idR ) et la
différentielle de l’identité idR (c.à.d. dx=dϕ où ϕ=idR ). Mais il faut s’y faire ! Dans le
premier cas, on a : (df)a =f ′ (a).dx. Dans le deuxième, on a : df=f ′ .dx !!!
Règles de calcul.
(j) d(λu)=λdu (λ ∈ R, u fonction numérique)
(jj) d(u+v)=du +dv (u, v fonctions numériques)
(jjj) d(u.v)=[Link] + [Link] (u,v fonctions numériques)
u [Link] − [Link]
(jv) d( )=
v v2
(v) Pour la composée : avec z=g(x), y=f(z) (c.à.d. f(g(x))), g différentiable en a de
différentielle (dg)a et f différentiable en b=g(a) de différentielle (df)b . Alors (d(f◦g))a =(df)b ◦
(dg)a c.à.d. (d(f◦g))a =(df)g(a) ◦ (dg)a (composée de deux applications linéaires).
On note aussi (df)g(a) ◦ (dg)a par [g∗ (df)]a c.à.d. lorsqu’on a une différentielle df, l’application
a−→(df)g(a) ◦ (dg)a est notée [g∗ (df)] appelée image réciproque de df par g. C’est à dire
que, lorsque g est différentiable en un point a∈A, on a une application g∗ de l’ensemble
des différentielles Ω(A,R) dans lui-même qui à df associe g∗ (df).
Cette notation différentielle est utile en pratique dans les calculs et permet surtout de
retenir facilement certains résultats. Ainsi, pour la dérivation de la composée de deux
dy dy dz
fonctions, on a = pour y=y(z(x)), et pour la fonction réciproque (y=y(x) de
dx dz dx
dy 1
réciproque x=x(y)), on a = .
dx dx dy
19
La différentielle (df)a est une application linéaire (un élément de L(R,R)), la différentielle df est
une application (pas nécessairement linaire) à valeurs dans L(R,R) (df∈ F(A,L(R,R)). On appelle aussi
cette dernière une “forme différentielle” sur A. L’ensemble des formes différentielles sur A est parfois noté
Ω(A,R).
2) On voit qu’en fait, on a f ′d (a)≤ 0 si a est un maximum relatif pour f (si f ′d (a) existe).
Et si f ′g (a) et si a est un maximum relatif, f ′g (a)≥ 0.
4.14 Proposition. Si la fonction f est croissante (sens large) et si f ′d (a) (resp. f ′g (a),
resp. f ′ (a)) existe, alors f ′d (a) (resp. f ′g (a), resp. f ′ (a)) est ≥ 0.
f(a + h) − f(a)
En effet, ≥ 0 pour h>0 suffisamment petit.
h
4.15 Théorème. (de ROLLE) Soit f ∈ C([a,b],R) (a<b), dérivable sur ]a,b[ telle que
f(a)=f(b). Alors, on peut trouver au moins un c∈]a,b[ tel que f ′ (c)=0.
Preuve : Si f est constante, c’est évident car f ′ ≡ 0. Supposons donc f non constante. Soit
M= sup f(x) et m= inf f(x). Alors, m=f(a) ou M=f(a), car f n’est pas constante. Comme
x∈[a,b] x∈[a,b]
f est continue sur [a,b], on sait que m et M sont atteints par f. C.à.d. on peut trouver x0 et
x1 tels que f(x0 )=m et f(x1 )=M. Donc, au cas où M=f(a), x1 =a et x1 =b (ici f(a)=f(b)).
Donc, f ′ (c)=0 d’après la proposition 4.13. Idem au cas où m=f(a). c.q.f.d.
Remarque. Le théorème de Rolle sert souvent à montrer l’existence de zéros d’une fonc-
tion. Par exemple, si f est dérivable sur un intervalle I et si f admet n zéros sur I, alors f ′
admet dans I au moins n−1 zéros séparant les zéros de f.
f(b) − f(a)
Remarque. Justement, si g(a)=g(b), le résultat précédent s’écrit f ′ (c)=g ′ (c) .
g(b) − g(a)
f ′ (c) f(b) − f(a)
Si, de plus, g ′ (x)= 0 sur ]a,b[, alors = (appelé parfois formule de
g ′ (c) g(b) − g(a)
Cauchy).
4.18 Proposition. (cas a =±∞) On prend les mêmes hypothèses que la proposition
précédente mais avec a=−∞ (resp. a=+∞). Alors, on a les mêmes conclusions.
1 1
Preuve : On fait un changement de variables. On pose F(x)=f( ) et G(x)=g( ). Alors,
x x
F et G vérifient les conditions de la proposition précédente au voisinage de 0 à droite (resp.
′ 1 1 ′ 1
F ′ (x) f ( x )( − x2 ) f ( x ) F (x)
à gauche). ′ = = −→ λ qd x−→ 0. Donc −→ λ qd x−→ 0,
G (x) g ′ ( 1 )( − 1 ) g ′ ( 1 ) > G (x) >
x x2 x
1
f( )
c.à.d. x −→ λ qd x−→ 0, ou encore f (X) −→ λ qd X→ +∞. c.q.f.d.
1 > g (X)
g( )
x
Preuve : Nous faisons la démonstration pour λ fini. On peut supposer que g(x)>0 pour
x∈A. De plus, si x=x′ , g(x)=g(x′ ) (sinon Rolle dit qu’on peut trouver x tel que g′ (x)=0).
Soit ε>0. La fonction (1−δ)(λ − δ)−δ (resp. (1+δ)(λ + δ)+δ) tend vers λ quand δ
tend vers 0. Donc, on peut trouver δ > 0 (δ <1) tel que (1−δ)(λ − δ)−δ>λ − ε (resp.
(1+δ)(λ + δ)+δ<λ + ε).
f ′ (t)
Par hypothèse, on peut trouver un “voisinage” V de b tel que, pour t∈V, λ − δ < <
g ′ (t)
f (x ′ ) f (x) (g (x ′ ) − g(x)) (f (x ′ ) − f(x))
λ + δ. Soient x ∈V, et x ′ tel que x<x ′ . On a = +
g (x ′ ) g (x′ ) g (x ′ ) (g (x ′ ) − g(x))
f (x) g(x) f (x ′ ) − f(x)
= +(1− ) .
g (x ′ ) g (x ′ ) g (x ′ ) − g(x)
g(x)
Maintenant, en fixant x et en faisant tendre x′ vers b, g(x′ ) tend vers +∞, donc 1−
g (x′ )
f (x)
tend vers 1 et tend vers 0 . C’est-à-dire, on peut trouver un voisinage W de b tel
g (x′ )
g(x) f (x)
que pour x ′ ∈W (mais toujours >x), 1−δ<1− <1+δ et −δ< <δ.
g (x′ ) g (x′ )
f (x ′ ) − f(x)
D’après le théorème des accroissements finis, on peut trouver cx ′ ∈]x,x ′ [ tq
g (x ′ ) − g(x)
f ′ (cx ′ ) f ′ (cx ′ )
= . Donc, λ − δ < < λ + δ (car x∈V et x<cx ′ <x ′ entraı̂ne que cx ′ ∈V).
g ′ (cx ′ ) g ′ (cx ′ )
f (x ′ ) f (x ′ )
Finalement, (1−δ)(λ − δ)−δ< <(1+δ)(λ + δ)+δ. Donc, λ − ε< <λ + ε pour
g (x ′ ) g (x ′ )
f (x ′ )
x ′ ∈W. Donc, lim =λ. c.q.f.d.
x ′ →b g (x ′ )
4.21 Corollaire 1. Soit f∈ C(I,R) (I étant un intervalle) telle que f est dérivable en tout
point intérieur à I 20 . Alors, f est croissante (resp. décroissante) au sens large ssi f ′ ≥ 0
(resp. ≤ 0). Donc f est constante ssi f ′ ≡ 0.
Preuve : Supposons que f ′ ≥ 0 et soient u>v. D’après le théorème, on peut trouver
c∈]u,v[ tel que f(u)−f(v)=f ′ (c)(u−v)≥ 0. Donc f(u)≥ f(v). Donc f est croissante au sens
large. L’inverse est la proposition 4.14. c.q.f.d.
Remarques. 1) D’après la démonstration, on voit que si f ′ (x)>0 pour x intérieur à I,
4.26 Lemme. Soit g une fonction définie dans un voisinage de a∈ R telle que g(a)=0
et que les dérivées suivantes existent en a, et g ′ (a)=g ′′ (a)=· · ·=g(n) (a)=0 (n∈ N). Alors,
g(x)=o((x−a)n ) au voisinage de a.
Preuve : Pour simplifier, on suppose g définie sur [a,a+h[, que g(a)=0 et que gd ′ (a)=
(n)
gd ′′ (a)=· · · =g d (a)=0. Donc, g(n−1) est définie dans un intervalle [a,a+k[ (0<k<h) et
continue à droite en a. Donc, g ′ , g ′′ , ..., g(n−2) sont définies dans un intervalle [a,a+α[ (0 <
α <k) et continues. Pour x∈[a,a+α[, on peut trouver x1 ∈]a,x[ tq g(x)−g(a)=g′ (x1 )(x−a)
(th. des accroissements finis). De proche en proche, on a xp ∈]a,xp−1 [ tq
g(p−1) (xp−1 )−g(p−1) (a)=g(p) (xp )(xp−1 −a) (1≤ p≤ n−1). C.à.d. g(p−1) (xp−1 )=g(p) (xp )(xp−1 −a)
(1≤ p≤ n−1).
Donc, |g(x)|=|g′ (x1 )(x − a)| =|g′′ (x2 )(x1 − a)(x − a)| =· · ·
= g(n−1) (xn−1 )(xn−2 − a)(xn−2 − a)...(x1 − a)(x − a) .
g(x) g(n−1) (xn−1 ) xp − a g(n−1) (xn−1 )
Donc, ≤ car ≤ 1 pour chaque p∈[[1,n−1]]. Et ≤
(x − a)n x−a x−a x−a
g(n−1) (xn−1 ) xn−1 − a g(n−1) (xn−1 ) g(n−1) (xn−1 ) − g(n−1) (a)
(car ≤ 1). Et = . Puisque
xn−1 − a x−a xn−1 − a xn−1 − a
g(n−1) (xn−1 ) − g(n−1) (a) (n)
a<xn−1 <x, xn−1 →a lorsque x→a. Donc →gd (a)=0. On a bien
xn−1 − a
n (x − a)k (k)
4.28 Définition. Lorsque f admet une dérivée f(n) (a), le polynôme Pn (x)= f (a)
k=0 k!
(x − a)0
( = 1 et f (0) (a)=f(a)) est appelé le développement de Taylor à l’ordre n de f en a.
0!
Les théorèmes précédents servent généralement à donner les développements limités des
fonctions comme on l’aura deviné. Donnons auparavant, un résultat très utile.
+o((x−a)n ). Alors, f admet un développement limité à l’ordre n+1, f (x)= f(a) + a0 (x−a)+
(x − a)2 (x − a)n+1
a1 +· · · + an +o((x−a)n+1 ). ( On dit qu’on intègre le développement
2 (n+1)
limité de f′ terme à terme. Ce résultat se démontre aussi par les intégrales.)
n n (x − a)k+1
Preuve : On pose P(x)= ak (x−a)k et Q(x)=f(a) + ak . On a Q′ (x)=P(x)
k=0 k=0 (k+1)
et Q(a)=f(a). D’après l’hypothèse, f′ (x)−P(x)=o((x−a)n ) au voisinage a, c.à.d. que pour
ε > 0, on peut trouver η > 0 tq si |x − a| < η alors |f′ (x) − P(x)| ≤ ε |x − a|n . Sur [a,a+η],
d (x − a)n+1
|(f − Q)′ (x)| ≤ ε(x−a)n = (ε ) . D’après le théorème 4.22 (formule générale
dx (n+1)
(x − a)n+1
des accroissements finis), |(f − Q)(x) − (f − Q)(a)| ≤ ε , c.à.d. |f(x) − Q(x)| ≤
(n+1)
(x − a)n+1
ε . Cela est aussi vrai sur [a−η,a]. Donc pour x tq |x − a| ≤ η, |f(x) − Q(x)| ≤
(n+1)
(x − a)n+1
ε . On a montré que f−Q=o((x−a)n+1 ). c.q.f.d.
(n+1)
Remarques. 1) De même, on montre que si f ′ (x)= a0 + a1 (x−a) +· · · + an (x−a)n +O((x−a)n+1 )
(développement au sens fort). Alors, f admet un développement limité à l’ordre n+1, f (x)=
(x − a)2 (x − a)n+1
f(a) + a0 (x−a)+ a1 +· · · + an +O((x−a)n+2 ).
2 (n+1)
2) Par contre, on n’a pas le droit de dériver terme à terme un développement limité d’une
fonction et dire que c’est le dévelopement limité de sa dérivée, sauf si ce développement est
un développement de Taylor. En effet, si f(x)=Pn (x−a)+ε(x)(x−a)n , on n’est pas sûr que
ε(x)(x−a)n soit dérivable. Par contre, si le développement est de Taylor, f(x)=f(a)+(x−a)f ′ (a)
(x − a)2 ′′ (x − a)n (n)
+ f (a)+ · · · + f (a) +o((x−a)n ). Donc on peut appliquer Young à f ′ car
2 n!
(f ′ )(n−1) (a)=f(n) (a) existe. Par exemple, si f(x)=1+x+x2 +λ(x).x3 avec λ=1IQ, f est continue
en x=0 mais discontinue ailleurs (sinon λ serait continue ailleurs). Donc, f ′ (x) n’existe
qu’en x=0. Par contre, f ′ (0)=1. Mais f′′ n’est définie nulle part. Donc, le développement
n’est pas de Young. Cet exemple montre que l’existence de développement à l’ordre 1 de f
en a est équivalent à l’existence de f ′ (a), mais l’existence d’un développement à l’ordre n≥
2 n’entraı̂ne même pas l’existence de f′′ (a).
4.30 Applications.
(i) Young : avec a=0.
x3 x5 x2n+1
sin x= x − + +· · · +(−1)n +· · · +o(xp ) (xp ε(x)), ce o(xp ) est un O(x2k ) si
3! 5! (2n+1)!
p=2k. (sin est impaire)
x2 x4 x2n
cos x= 1 − + +· · · +(−1)n +· · · +o(xp ) (xp ε(x)), ce o(xp ) est un O(x2k ) si
2! 4! (2n)!
p=2k+1. (cos est paire)
α(α − 1) 2 α(α − 1)(α − 2) · · · (α − n + 1) n
(1+x)α = 1 +αx+ x +· · · + x +o(xn ). On note
2! (n)!
α α(α − 1)(α − 2) · · · (α − n + 1)
aussi = et quand α ∈ N, c’est Cnα .
n (n)!
(ii) Intégration terme à terme. (a=0)
2k+1
1 n n
k x
(Arctg)′ (x)= = (−1)k 2k
x +O(x2n+2
). D’où, Arctg(x)= (−1) +O(x2k+3 ),
1+x2 k=0 k=0 (2k+1)!
Arctg(0)=0.
1 2 − 12
n 1.3.5...(2k − 1)
(Arcsin)′ (x)= √ = (1−x ) =1+ .x2k +O(x2n+2 ). D’où, Arc-
1 − x2 k=0 2.4.6...(2k)
n 1.3.5...(2k − 1) x2k+1
sin(x)=x+ . +O(x2n+3 ).
k=0 2.4.6...(2k) 2k + 1
On obtient de la même façon les développements des fonctions Arg th et Arg sh, on y
reviendra.
4.31 Proposition.(Test intégral) Soient f une fonction dérivable sur ]a,+∞[ dont la
dérivée f ′ est positive et décroissante, et un =f ′ (n). Alors, la série [un ]n converge (resp.
diverge proprement vers +∞) ssi lim f(x) existe et est finie (resp. est égale à +∞).
x∞
up+1 ≤ f(p+1)−f(p)≤ up
up+2 ≤ f(p+2)−f(p+1)≤ up+1
···
un+1 ≤ f(n+1)−f(n)≤ un
On sait que la série à termes positifs [un ] converge ssi la suite des sommes partielles (Un )n
est majorée. Or, les relations (*) montrent que (Un )n est majorée ssi (f(n))n est majorée.
Et comme f est croissante (f ′ étant positive), la suite (f(n))n est majorée ssi f est majorée
(car [x]≤ x<[x]+1 entraı̂ne f([x])≤f(x)<f([x]+1)). Et, toujours parce que f est croissante,
f est majorée ssi lim f(x) existe et est finie. c.q.f.d.
x∞
Cette proposition s’applique aux séries de Riemann (un =nα ) et aux séries de Bertrand
(un =nα logβ (n)).
ex+h − ex eh − e0 eh − 1 eh − 1 1 ∞ hn
(ii) exp ′ (x)= lim = lim ex =ex . lim . Et, =
h→0
=
h h→0
=
h h→0
=
h h h n=1 n!
∞ h n−1 n−1 n−2 ∞ hn−2
h ∞ h h ∞ h h
= =1+ + = 1+ + h.( ) = 1+ + h.k(h) où k(h)= =
n=1 n! 2 n=3 n! 2 n=3 n! 2 n=3 n!
n
∞ h
qui est la somme d’une série absolument convergente. On vérifie que |k(h)| ≤
n=1 (n+2)!
n
∞ |h| eh − 1
. Lorsque h tend vers 0, |h| est majoré par un nombre α>0. Donc −1 ≤
n=1 (n+2)! h
1 1 ∞ αn eh − 1
|h|( + |k(h)|) ≤ |h|( + ) et, donc, quand h tend vers 0, lim = 1.
2 2 n=1 (n+2)! h→0
=
h
Donc exp ′ (x)=ex . Par conséquent, exp est continue (car dérivable) et croissante car exp ′
est posirive. C’est donc un homéomorphisme de R sur ]0,+∞[=R∗+ .
(i) Comme exp(x+y)=exp(x).exp(y), c’est un isomorphisme du groupe additif (R,+) sur
le groupe multiplicatif (R∗+ , .). c.q.f.d.
4.34 Théorème-Définition.
(1) L’homéomorphisme réciproque de exp de R∗+ sur R, isomorphisme du groupe multipli-
catif ( R∗+ , .) sur le groupe additif ( R,+), est appelé le logarithme népérien ou logarithme
de base e, et noté Log (ou Ln dans les manuels anglo-saxons), homéomorphisme croissant.
Log(x.x ′ )=Log(x)+Log(x ′ )
1
(2) Log ′ (y)= pour chaque y>0.
y
(3) lim Log(y)=+∞ et lim Log(y)=−∞.
y+∞ y→0
4.35 Remarque-Définition.
Partant de la formule exr =(ex )r pour r∈ Q, si l’on prend x=Log(a) (a>0), on obtient
erLog(a) =(eLog(a) )r =ar au sens usuel. D’où la définition : Pour a>0, a=1, on appelle expo-
nentielle de base a la fonction de R dans R∗+ , qui à x∈ R associe le nombre noté ax défini
par ax =exLog(a) . (Si a=1, ax ≡ 1)
(loga (x))β yβ yβ yβ
En effet, posons y= loga (x) c.à.d. x=ay et b=aα >1, alors = = = .
xα ayα (aα )y by
(loga (x))β
De plus, x → +∞ ssi y→ +∞. Donc, −→ 0 (d’après (2)).
xα x+∞
>
(4) Pour α > 0, xα loga (x)→ 0− quand x−→ 0.
1 > 1 1 −loga (X)
On pose X= , X→ +∞ ssi x−→ 0. Et xα loga (x)= α loga ( ) = α
→ 0− .
x X X X
α
est noté aussi appelé coefficient du binôme et qui n’est autre que Cnα lorsque
n
α ∈ N.
4.41 Définition.
ex − e−x
On appelle sinus hyperbolique la fonction notée sh, telle que sh x= .
2
ex + e−x
On appelle cosinus hyperbolique la fonction notée ch, telle que ch x= .
2
sh x ex − e−x
On appelle tangente hyperbolique la fonction notée th, telle que th x= = .
ch x ex + e−x
1 ch x
On appelle cotangente hyperbolique la fonction notée coth, telle que coth x= =
th x sh x
ex + e−x
= x (x= 0)
e − e−x
4.42 Propriétés.
1) sh, ch et th sont de classe C ∞ sur R et coth est de classe C ∞ sur R∗ , sh et th (ainsi que
coth) sont impaires, ch est paire.
1 −1
2) sh′ (x)=ch(x), ch′ (x)=sh(x), th′ (x)= 2 = 1−th2 x, coth′ (x)= 2 = 1−coth2 x.
ch (x) sh (x)
3) ex =ch x +sh x, e−x =ch x−sh x, d’où 1=ch2 x−sh2 x.
Graphes. Une étude simple donne les graphes suivants.
th(a) − th(b)
• th(a−b)=
1 − th(a)th(b)
• sh(2a)= 2 sh(a)ch(a)
• ch(2a)= ch2 (a)+sh2 (a) = 1+ 2sh2 (a) = 2ch2 (a)−1
2th(a)
• th(2a)=
1 + th2 (a)
x x x
x x x 2sh( )ch( ) 2th( )
• sh(x)= sh(2 )= 2sh( )ch( ) = 2 2 2
2 2 2 2
x 2
x = 2
x
ch ( ) − sh ( ) 1 − th ( )
2 x 2 2
2 x 2 2 x
x x ch ( ) + sh ( ) 1 + th ( )
• ch(x)= ch2 ( ) + sh2 ( )= 2 2 2
2 2 2
x 2
x = 2
x
ch ( ) − sh ( ) 1 − th ( )
2 2 2
x 2t 1 + t2 2t
• Donc, pour t=th( ), sh(x)= 2
, ch(x)= 2
, th(x)= .
2 1−t 1−t 1 + t2
1 1
Par ailleurs, Arg th est dérivable et l’on a : (Arg th)′ (x)= = .
1− th2 (Arg th(x)) 1 − x2
On laisse à l’étudiant le soin de tracer les graphes de ces fonctions.
5 FONCTIONS CONVEXES.
La notion de convexité est une des notions les plus utiles dans les applications des mathé-
matiques, notamment en mathématiques de la décision. Nous allons donner la partie la
plus élémentaire de l’analyse convexe.
Parties convexes de R2 . Une partie D⊂ R2 est dite convexe si, pour deux points
quelconques M et N de D, le segment fermé [M,N] est contenu dans D. On rappelle
que si M=(x,y) et N=(x ′ ,y ′ ), [M,N]={(xt ,yt )/xt =tx+(1−t)x′ et yt =ty+(1−t)y′ , t∈[0,1]}.
Lorsque x=x ′ , [M,N] est la portion de la droite passant par M et N, graphe de la fonction
y′ − y
t∈ R −→y+ ′ (t−x), portion pour t∈[x,x ′ ]. On appellera “pente de MN ” que l’on
x −x
y′ − y
notera p(MN) le nombre qui est la pente de la droite MN, c.à.d. la tangente de
x′ − x
l’angle l’axe des abcisses avec la droite MN. Lorsque x=x ′ , la pente est ±∞ selon que MN
est dirigé vers le haut ou vers le bas.
Fonctions convexes. Une fonction f∈ F(I,R), où I est un intervalle, est dite convexe si
epi f est convexe dans R2 . On dit que f est concave si −f est convexe.
Preuve :
Preuve : Supposons f convexe. Soient Mx et Mx ′ ∈epi f. Donc [Mx ,Mx ′ ]⊂epi f. Soient
z=αx+(1−α)x ′ , α ∈[0,1] et Nz le point (αx+(1−α)x ′ ,αf(x)+(1−α)f(x ′ )). Alors Nz ∈[Mx ,Mx ′ ].
Donc Nz ∈epi f. C.à.d. Nz est au-dessus de Mz ou f(αx +(1−α)x′ )≤ αf(x) + (1−α)f(x′ ).
Réciproquement, supposons que f vérife (C). Soient M(x,y) et M′ (x ′ ,y ′ )∈epi f et N=αM+(1−α)M′
(∈[M,M′ ]). On a xN =αx+(1−α)x ′ , yN =αy+(1−α)y ′ , f(x)≤ y et f(x ′ )≤ y ′ (car M et
M′ ∈epi f). Donc αf(x) + (1−α)f(x ′ )≤ yN . Donc, d’après (C), f(αx +(1−α)x ′ )≤ αf(x) +
(1−α)f(x ′ ). Donc, f(αx +(1−α)x ′ )≤ yN , c.à.d. f(xN )≤ yN ou N∈epi f. c.q.f.d.
Remarque. On vérifie facilement aussi que f est convexe ssi, pour x et x′ ∈I tels que x<x′ ,
et pour z tq x<z<x′ , le point Mz est au-dessous du segment Mx Mx ′ 23 (c’est la traduction
de (C) en utilisant l’équation du segment).
22
Cette inégalité est aussi appelée “inégalité de Jensen”. La condition (C) est souvent prise comme
définition de la convexité d’une fonction f.
23
Appelé aussi “corde” Mx Mx′ .
5.3 Définition. Une fonction f∈ F(I,R) (I intervalle) est dite strictement convexe si elle
vérifie la condition
(C′ ) f(αx +(1−α)x ′ )< αf(x) + (1−α)f(x ′ ), pour x et x ′ ∈I et α ∈]0,1[.
Ce qui équivaut à dire que, pour x et x ′ ∈I tels que x<x ′ , et pour z tq x<z<x ′ , le point
Mz est strictement au-dessous de la corde Mx Mx ′ .
On dit que f est strictement concave si −f est strictement convexe.
5.4 Lemme. Soient M(a,b), N(a,b), P(a,b) trois points de R2 tels que a<a ′ <a ′′ .
L.a.s.s.e. :
(i) N est au-dessous de MP
(ii) P est au-dessus de la droite MN
(iii) M est au-dessus de la droite NP
(iv) p(MN)≤ p(MP)
(v) p(MP)≤ p(NP)
(vi) p(NM)≤ p(NP)
Le lemme est encore vrai si l’on ajoute partout “strictement” et si l’on remplace les “≤”
par “<”.
(i) Si f est convexe (resp. strictement convexe), alors f est continue sur I et admet une
dérivée à droite en tout point de I différent de l’extrémité droite de I et une dérivée à
gauche en tout point différent de l’extrémité gauche de I.
Et, pour a, x 0 et b∈I tels que a<x 0 <b, on a :
f(x 0 ) − f(a) f(b) − f(x 0 )
≤ f ′g (x 0 )≤ f ′d (x 0 ) ≤
x0 − a b − x0
f(x 0 ) − f(a) f(b) − f(x 0 )
(resp. < f ′g (x 0 )≤ f ′d (x 0 ) < ).
x0 − a b − x0
De plus, f ′g et f ′d sont croissantes au sens large (resp. croissantes).
(ii) Réciproquement, si f est continue sur I et admet sur I (moins son extrémité droite) une
dérivée f ′d croissante au sens large (resp. croissante), alors f est convexe (resp. strictement
convexe).
Preuve : (i) Supposons a<x0 <b. On sait que px0 est croissante au sens large sur I\{x0 }.
f(x0 ) − f(x) f(y) − f(x0 )
Donc, pour x∈[a,x0 [ et y∈]x0 ,b], px0 (x)≤ px0 (y), c.à.d. ≤ (inégalité
x0 − x y − x0
stricte si f est strictement convexe). Donc, px0 est ր et majorée sur [a,x0 [ et minorée sur
]x0 ,b]. Donc, lim px0 (x) = f ′g (x0 ) existe (finie) et lim px0 (y) = f ′d (x0 ) existe (finie), et l’on
x→0 y→0
< >
f(x0 ) − f(x) f(y) − f(x0 )
a ≤ f ′g (x0 )≤ f ′d (x0 ) ≤ , pour x∈[a,x0 [ et y∈]x0 ,b] (après passage
x0 − x y − x0
aux limites). D’où la continuité de f en x0 (dérivable à droite et à gauche).
f(x1 ) − f(x0 )
Si x0 <x1 (avec x1 = extrémité gauche de I), on a f ′d (x0 ) ≤ ≤ f ′d (x1 ) (par la
x1 − x0
formule précédente), c.à.d. f ′d est ր au sens large. Au cas où f est strictement convexe, il
f(a) − f(x0 )
suffit d’intercaler a entre x0 et x1 c.à.d. x0 <a<x1 et l’on obtient f ′d (x0 ) ≤ <
a − x0
f(x1 ) − f(a)
≤ f ′d (x1 ), donc f ′d est croissante. On fait de même pour la dérivée à gauche.
x1 − a
c.q.f.d.
(ii) Réciproquement. Supposons f continue sur I et que f′d est définie sur I (moins éventuellement
l’extrémité droite de I) et ր au sens large. Soient x et x′ dans I avec x<x ′ et x ′ = extrémité
droite de I. Soit α ∈[0,1]. On pose g(y)= αf(x) + (1−α)f(y)−f(αx +(1−α)y), pour y∈[x,x ′ ]
(g(x)=0). Alors g est continue sur [x,x′ ], car f est continue sur I et g est la somme d’une con-
stante αf(x), de la fonction (1−α)f(y) et de la fonction −f(αx +(1−α)y). De plus, g ′d (y) =
(1−α)f ′d (y) −(1−α)f ′d (αx +(1−α)y) = (1−α)[f ′d (y) −f ′d (αx +(1−α)y)]. Et donc, g ′d (y)≥
0 (car f ′d est ր et y≥ αx +(1−α)y). Donc g est ր sur [x,x ′ ]. Donc g(x ′ )≥ g(x), c.à.d.
αf(x) + (1−α)f(x ′ )≥ f(αx +(1−α)x ′ ). Ce résultat reste vrai même si x ′ est l’extrémité
droite de I (par continuité de f). Donc f est bien convexe. Si f′d est ր strictement, g ′d (y)
est >0, donc g est croissante. On obtient f strictement convexe. c.q.f.d.
5.7 Corollaire1. Soit f dérivable sur un intervalle I. Alors f est convexe (resp. stricte-
ment convexe) sur I ssi f ′ est croissante au sens large (resp. croissante) dans I.
i2 , ..., ik }⊂[[1,n]] tel que i1 < i2 < · · ·< ik , on fixe les variables xi1 , xi2 , ..., xik aux valeurs ai1 ,
ai2 , ..., aik et on ne fait varier que les n−k variables restantes. On obtiendra la section de
f à la i1 -ème variable par ai1 , à la i2 -ème variable par ai2 , ..., à la ik -ème variable par aik ,
qu’on pourra noter par fi1 ; ai1 , i2 ; ai2 ,...,ik ; aik ou fJ;aJ où J={i1 , i2 , ..., ik } ensemble ordonné
naturellement et aJ =(ai1 , ai2 , ..., aik )∈ Rk , il n’y a pas de notation standard. Il y a 2n − 2
fonctions partielles en a, 2n étant le nombre de parties de [[1,n]], on enlève la partie Ø et
[[1,n]].
Toutes les notions que nous avons définies pour une fonction numérique d’une variable
s’étendent évidemment aux fonctions de plusieurs variables, avec les modifications évidentes
à faire s’il le faut. Par exemple, on appelle application toute fonction f dont le domaine
de définition Df coı̈ncide avec l’ensemble de départ A, et l’ensemble des applications de A
dans R est noté F(A,R).
Injections, surjections, bijections.
On dit encore que f est injective si f(x)=f(x′ ) pour x=x′ . Mais il faut faire attention, car
x=x′ signifie (x1 , x2 , ..., xn )=(x′1 , x′2 , ..., x′n ) qui est la négation de (x1 , x2 , ..., xn )=(x′1 ,
x′2 , ..., x′n ), qui veut dire que x1 =x′1 , x2 =x′2 , ..., xn =x′n . C.à.d. (x1 , x2 , ..., xn )=(x′1 , x′2 ,
..., x′n ) ssi on peut trouver un indice i∈[[1,n]] tel que xi =x′i . On dit que f est surjective
si tout y∈B admet un antécédent (x1 , x2 , ..., xn )∈Df , c.à.d. tel que f(x1 , x2 , ..., xn )=y.
Et f est bijective si elle est injective et surjective. Les applications bijectives de R2 dans
R existent théoriquement, les deux ensembles ayant le même cardinal, mais on n’a pas
de formule ou de règle explicite donnant une bijection entre les deux. Par contre, on a
des injections et des surjections qu’on a intérêt à connaı̈tre. Ainsi, l’application (x1 , x2 ,
..., xn )∈ Rn −→xi ∈ R est une surjection appelée la i-ème projection de Rn sur R, ou la
i-ème application coordonnée, notée pri 26 (i∈[[1,n]]). Pour a=(a1 , a2 , ..., an−1 ) fixé dans
Rn−1 , l’application ia : xn ∈ R −→(a1 , a2 , ..., an−1 , xn )∈ Rn est une injection dite injection
canonique de Rn−1 dans Rn , ia : R −→ Rn , et c’est valable si l’on avait pris un autre indice
à la place de l’indice n. On peut, de la même façon, injecter canoniquement Rp (p<n)
dans Rn , par ia : Rp −→ Rn , où a=(a1 , a2 , ..., an−p ) est fixé dans Rn−p , et ia (x1 , x2 , ...,
xp )=(a1 , a2 , ..., an−1 , x1 , x2 , ..., xp ).
Composition.
Soient f(x1 , x2 , ..., xn ) et g(y1 , y2 , ..., ym), où f est une fonction de n variables réelles et
g est une autre fonction de m variables réelles toutes indépendantes, et si h(x,y) est une
fonction des deux variables indépendantes x et y, alors, en remplaçant x par f(x1 , x2 , ...,
xn ) et y par g(y1 , y2 , ..., ym ), on obtient une fonction de n+m variables indépendantes,
k(x1 , x2 , ..., xn , y1 , y2 , ..., ym )=h(f(x1 , x2 , ..., xn ),g(y1 , y2 , ..., ym )).
Soient f(t) et g(t) où f et g sont une fonction d’une variable réelle, et si h(x,y) est une
fonction des deux variables indépendantes x et y, alors, en remplaçant x par f(t) et y par
g(t), on obtient une fonction d’une variable, k(t)=h(f(t),g(t)).
Si f : A−→B⊂ R est une fonction de n variables (f(x1 , x2 , ..., xn )) et g : B−→C⊂ R une
fonction d’une variable (g(y)), alors, g◦f : A−→C est une fonction des n variables (x1 , x2 ,
..., xn ), g(f(x1 , x2 , ..., xn )).
26
On la notera aussi dxi (cf. infra).
Graphe.
Le graphe Γf ou Gr(f) d’une fonction f : A−→B⊂ R, est Γf ={(x,f(x))∈ Rn × R/ x∈A}
={(x,y)∈ Rn × R/ y=f(x) et x∈A} (x est un point de Rn , de la forme (x1 , x2 , ..., xn )), c.à.d.
Γf ⊂ Rn+1 . Pour n=2, on obtient une “surface” dans R3 comme dans l’exemple suivant.
200
150
100
50
-4
-4 0 -2
-2
00
2 x y 2 4
4
f (x, y) = x2 + y 2 + 100
Attention cependant à des “surfaces” représentant des fonctions bizarres comme f(x,y)=1IQ (x).1IQ (y).
Parité. Symétrie.
Il y a encore les notions de fonctions paires et impaires, à condition que Df soit symétrique
par rapport à l’origine (0,0, ..., 0) de Rn , c.à.d. que −x=(−x1 , −x2 , ..., −xn )∈Df ssi x=(x1 ,
x2 , ..., xn )∈Df . Mais il y a d’autres notions de “symétrie” avec l’utilisation de la notion de
permutation de [[1,n]] et de la signature d’une permutation. Cependant, nous allons définir
une seule symétrie. On dit qu’une fonction de n variables f(x1 , x2 , ..., xn ) est symétrique si
la valeur f(x1 , x2 , ..., xn ) demeure inchangée si l’on échange deux variables quelconques (on
suppose que Df reste inchangé aussi par de telles transformations). On dit qu’une fonction
de n variables f(x1 , x2 , ..., xn ) est antisymétrique si la valeur f(x1 , x2 , ..., xn ) change en
son opposée si l’on échange deux variables quelconques. Ainsi, par exemple, f(x,y,z)=
x2
x2 +y2 +z2 est symétrique tandis que g(x,y,z)= 2 ne l’est pas, h(x,y)=x−y est
y + z2 + 1
antisymétrique.
Homogénéité.
On dit qu’une fonction de n variables f(x1 , x2 , ..., xn ) est homogène (resp. positivement
homogène) de degré p si la valeur f(λx1 , λx2 , ..., λxn )=λp f(x1 , x2 , ..., xn ) pour tout λ ∈ R∗ ,
p∈ R fixé, (resp. λ ∈ R∗+ , p∈ Z fixé). Le domaine de définition Df doit aussi être stable
par la multiplication par un scalaire λ. On dit πque C⊂ π
Rn est un cône si λx∈C pour x∈C
x + x2
et λ > 0. Ainsi, la fonction f(x1 , x2 , x3 , x4 )= 15 pour x53 +x54 = 0, et f(x1 ,x2 ,α,−α)=0
x3 + x54
pour α ∈ R, est homogène de degré π − 5 sur R4 .
Remarque.
L’on n’a plus les notions de fonctions croissantes ou décroissantes car il n’y a pas de relation
d’ordre standard dans Rn . La notion de fonction bornée est définie de la même manière
que pour les fonctions d’une variable. On peut éventuellement étendre aux fonctions de
plusieurs variables la notion de fonctions périodiques, mais hélas je n’ai pas trouvé beaucoup
2011
Alain Ralambo
Limites et continuités.
6.2 Définition. Soient A⊂ Rn , f : A−→ R une fonction de n variables, n∈ N, n≥2,
a=(a1 , a2 , ..., an ) un point de Rn , λ ∈ R (resp. λ ∈ R).
On dit que a est adhérent à A si l’on peut trouver une suite (āk )k∈N dans A telle que si
āk =(āk,1 , āk,2 , ..., āk,n ), la suite (āk,i )k∈N converge vers ai pour chaque i∈[[1,n]]. On note
alors a∈ A.
En supposant que a∈ A, on dit que f(x) tend vers λ quand x tend vers a, en restant
dans A, si pour chaque ε > 0, on peut trouver η > 0 (ne dépendant que de ε et de a)
tq si |x1 − a1 | < η et |x2 − a2 | < η et ... et |xn − an | < η où x=(x1 , x2 , ..., xn )∈A,
alors |f(x1 ,x2 ,...,xn ) − λ| < ε. On note alors xlim
→a
f(x1 , x2 , ..., xn )=λ ou, lorsqu’il n’y a
1 1
x2 →a2
..
.
xn →an
x∈A
“|f(x1 ,x2 ,...,xn ) − λ| < ε” par “f(x1 ,x2 ,...,xn )> ε” (resp. <−ε).
On remarquera que c’est la même définition que pour les fonctions d’une variable, sauf que
chaque point x∈ Rn possède n coordonnées et, donc, on en tient compte. La limite définie
ici est aussi appelée une “limite multiple” ou “limite jointe” car il y a aussi une notion
de “limite séparée” ou “limite successive” ou “limite répétée” dont nous parlons dans la
définition suivante. Lorsqu’on ne précise pas, c’est toujours d’une limite jointe qu’il s’agit.
Ainsi, par exemple, par application des résultats sur les limites de suites (cf. proposition
2.1.8), x→a
lim f(x,y)=a1 +a2 pour f(x,y)=x+y.
1
y→a2
6.3 Définition. Pour simplifier, nous allons donner cette définition avec deux variables.
Soient A⊂ R2 , f : A−→ R une fonction de 2 variables, a=(a1 ,a2 ) un point de R2 , avec
a∈ A, et λ ∈ R (resp. R). On dit que λ est la limite successive ou limite répétée de f(x,y)
lorsque x tend vers a1 et y tend vers a2 , (x,y) restant dans A, si les conditions suivantes
sont vérifiées :
(1) on peut trouver un ensemble Ya ⊂ R tel que a2 est adhérent à Ya et que, pour chaque
2011
Alain Ralambo
(2) y→a
lim ϕ(y)=λ.
2
y∈Ya
6.4 Proposition. Avec les hypothèses et notations des définitions précédentes (déf. 6.3
et 6.2),
si x→a
lim f(x,y)=λ et si ϕ(y)= lim f2;y (x)
x→a1
existe pour y voisin de a2 dans Ya ,
1
y→a2 x∈(A∩Df ) 2;y
x∈A
alors λ=y→a
lim (x→a
lim f(x,y)).
2 1
Preuve : Soit (yn )n dans Ya qui tend vers a2 . Il faut montrer que lim
n∞
ϕ(yn )=λ (ce qui
impliquera que y→a
lim ϕ(y)=λ). Mais yn ∈Ya pour chaque n, donc ϕ(yn ) est définie. Donc,
2
y∈Ya
1
puisque ϕ(yn )= lim
x→a
f(x,yn ), on peut trouver xn ∈ (A∩Df )2;yn tel que |a1 − xn |< et
x∈(A∩Df ) 2;yn
1 n
1
|ϕ(yn ) − f(xn ,yn )|< . Ainsi (yn )n −→ a2 et (xn )n −→ a1 , donc ((xn ,yn ))n −→ (a1 ,a2 ) dans
2
n n∞ n∞ n∞
R . Et, comme x→a lim f(x,y)=λ, on a lim f(xn ,yn )=λ. Comme |ϕ(yn ) − λ| ≤ |ϕ(yn ) − f(xn ,yn )|+
1 n∞
y→a2
x∈A
|f(xn ,yn ) − λ|, on voit que |ϕ(yn ) − λ| −→
n∞
0, c.à.d. (ϕ(yn )−λ)−→
n∞
0, ou ϕ(yn )−→
n∞
λ.
c.q.f.d.
Remarque. Attention ! L’existence de la limite multiple x→a
lim f(x,y) n’entraı̂ne pas
1
y→a2
x∈A
xy
l’existence des limites répétées, ni l’inverse. Par exemple, pour f(x,y)= , lim (lim
x2 +y2 y→0 x→0
f(x,y))= lim (lim f(x,y))=0. Mais lim f(x,y) n’existe pas car, si nous prenons (xn ,yn )n avec
x→0 y→0 x→0
y→0
1 1 1
xn =yn = , alors (xn ,yn )n −→ (0,0) mais f(xn ,yn )= , donc lim f(xn ,yn )= . Et si l’on prend
n n∞ 2 n∞ 2
′ ′ ′ 1 ′ 1 ′ ′ 2 ′ ′ 2
(x n ,y n )n avec x n = et y n = , f(x n ,y n )= , donc lim f(x n ,y n )= . On a donc trouvé deux
2n n 5 n∞ 5
suites (xn ,yn )n et (x ′n ,y ′n )n qui tendent vers (0,0) telles que lim f(xn ,yn )= lim f(x ′n ,y ′n ).
n∞ n∞
On peut également, mais c’est laissé à l’étudiant, introduire les notions de lim f(x1 ,x2 ,...,xn )
x1 →+∞
x2 →−∞
..
.
xn →an
et les limites partielles des mêmes types. Nous passons sur les opérations sur les limites,
les limites latérales (à gauche ou à droites), les inégalités aux limites qui sont laissées à
l’étudiant. Sur cette remarque, nous allons directement à la continuité de fonctions de
plusieurs variables.
n’est pas vraie.). De même, nous n’écrirons pas les opérations sur les continuités qui sont
les mêmes que pour les fonctions d’une variables.
Nous pouvons donner aussi la définitton de l’uniforme continuité. On dit que f est uni-
formément continue dans A si pour chaque ε > 0, on peut trouver δ > 0, tel que
pour x=(x1 , x2 , ..., xn ) et x ′ =(x ′1 , x ′2 , ..., x ′n )∈A, si |x1 − x ′1 | < δ, |x2 − x ′2 | < δ, ...,
|xn − x ′n | < δ, alors |f(x) − f(x ′ )| < ε. Alors, on a les deux propositions suivantes que nous
admettrons.
Différentiabilité.
La dérivation est définie pour étudier les variations de fonctions d’une variable. Pour une
fonction f de n variables, n≥ 2, les variations de f peuvent être regardées de plusieurs point
de vue. Rappelons que nous appelons variations de f les quantités du type ∆f(a)=f(b)−f(a),
a=(a1 , a2 , ..., an ) et b=(b1 , b2 , ..., bn )=(a1 + (b1 − a1 ), a2 + (b2 − a2 ), ..., an + (bn − an ))
=(a1 + ∆a1 , a2 + ∆a2 , ..., an + ∆an ). ∆f(a) est appelé aussi variation totale de f au point
a, et ∆ai est la variation de la variable ai . L’élément (∆a1 , ∆a2 , ..., ∆an )∈ Rn est noté
aussi ∆a, variation de a, c.à.d. ∆f(a)=f(a+∆a)−f(a). On remarquera que f est continue
en a ssi ∆f(a) tend vers 0 lorsque ∆a tend vers 0. Bien entendu, ∆f(a) dépend de ∆a. On
voudrait utiliser les résultats obtenus sur la dérivation des fonctions d’une variable. C’est
essentiellement l’objet de la différentiation que nous allons maintenant développer à un
niveau élémentaire. Dans la suite, pour simplifier l’écriture, nous n’allons plus traı̂ner la
condition “x∈A” et, même, nous allons laisser tomber l’ensemble A, c.à.d. que nous allons
prendre une fonction de plusieurs variables f sans préciser son domaine de définition, ce
sera à chacun de compléter comme il voudra.
6.9 Définition. Soit f(x1 , x2 , ..., xn ) une fonction numérique de n variables, a∈Df . Soit
u=(u1 , u2 , ..., un )∈ Rn fixé, u est un vecteur de Rn . Si ∆a=t.u =(tu1 , tu2 , ..., tun ), t∈ R,
on obtient une fonction de la seule variable t, h(t)=f(a+tu) et ∆f(a)=f(a+tu)−f(a). Ce
qui revient à faire varier l’argument de f sur la droite D={a+tu/t∈ R} passant par a et de
27
P=[a1 ,b1 ]×[a2 ,b2 ]× · · · ×[an ,bn ] est appelé un parallélotope ou simplement un pavé de dimension n,
fermé et borné.
direction u, ou du moins sur une partie de cette droite. Si h est dérivable en 0, c.à.d. si
h ′ (0) existe, on l’appelle dérivée de f suivant u et, lorsque u vérifie |u1 |+|u2 |+· · ·+|un |=1 28 ,
∂f ∂ f(a)
on la note (a) ou parfois , et alors on l’appelle dérivée de f dans la direction u.
∂u ∂u
∂f h(t) − h(0) f(a+tu) − f(a)
(a)= lim = lim
∂u t→o
=
t t→o
=
t
En particulier, lorsque u=ei =(0,0, ...,0,1,0,0, ...,0) où toutes les coordonnées sont
nulles sauf la i-ème qui vaut 1— on note aussi ei =(δ 1i ,δ 2i , ...,δ ni ) =(δ ji )j=1,n et δ ji s’appelle le
∂f ∂f
symbole de Kronecker qui symbolise 0 lorsque i=j et 1 lorsque i=j — (a) est noté (a)
∂ ei ∂ xi
et est appelée la dérivée partielle de f par rapport à x i au point a, si elle existe.
∂f f(a1 ,a2 , ...,ai−1 ,ai + t, ai+1 ,ai+2 , ...,an ) − f(a1 , a2 , ..., an )
On remarquera que (a)= lim
∂ xi t→o, t=0 t
f(a1 ,a2 , ...,ai−1 ,xi , ai+1 ,ai+2 , ...,an ) − f(a1 , a2 , ..., an )
= x lim
i →ai , xi − ai
=
6.10 Définition. Comme dans la définition 4.10, on dit que deux fonctions de plusieurs
variables f et g sont tangentes en a=(a1 , a2 , ..., an ) si f−g=o(ϕ) où ϕ(x)=|x1 − a1 | +
|x2 − a2 | + · · · + |xn − an |='x'1 (lire “norme 1 de x”) pour x au voisinage de a.
Une application numérique de n variables L à valeurs dans R est dite linéaire 29 et appelée
28
On dit alors que u est un vecteur normé ou unitaire. Le nombre |u1 | + |u2 | + · · · + |un | noté 'u'1 est
appelé la norme de u et un vecteur u tel que 'u'1 =1 est dit normé ou unitaire.
29
En Algèbre, une application L entre deux espaces vectoriels est dite linéaire si
L(αa+βb)=αL(a)+βL(b) pour deux vecteurs a et b et deux scalaires α et β.
une forme linéaire si l’on peut trouver α=(α1 , α2 , ..., αn )∈ Rn , tq L(x1 , x2 , ..., xn )=
α1 x1 + α2 x2 + · · · + αn xn , la forme linéaire L est alors identifiée à α=(α1 , α2 , ..., αn )∈ Rn .
′
L’ensemble des formes linéaires de n variables est noté L(Rn ,R) ou (Rn ) qui est donc
identifié à Rn .
On dit qu’une fonction numérique réelle f(x)= f(x1 , x2 , ..., xn ) de n variables réelles est
différentiable au point a=(a1 , a2 , ..., an )∈Df si l’on peut trouver une forme linéaire L
(=α=(α1 , α2 , ..., αn )∈ Rn ) telle que la fonction θ(x)=f(x)−f(a) soit tangente à l’application
θ1 (x)=L(x−a) =α1 (x1 −a1 )+ α2 (x2 −a2 )+ · · ·+αn (xn −an ), c.à.d. θ(x)−θ1 (x)=o(ϕ) au voisi-
nage de a. C.à.d.
f(x1 ,x2 ,...,xn ) − f(a1 , a2 ,..., an ) − [α1 (x1 − a1 ) + α2 (x2 − a2 ) + · · · + αn (xn − an )]
lim
x1 →a1
=0.
x2 →a2 |x1 − a1 | + |x2 − a2 | + · · · + |xn − an |
..
.
xn →an
Ce qu’on écrit parfois aussi, en posant h=x−a, c.à.d. h=(h1 , h2 , ..., hn ) avec hi =xi −ai ,
f(a+h)−f(a)−L(h)=o('h' 1 ) pour h tendant vers 0 (0=(0,0, ...,0)). Ou encore,
f(a1 + h1 ,a2 + h2 ,...,an + hn ) − f(a1 , a2 ,..., an ) − [α1 h1 + α2 h2 + · · · + αn hn ]
lim =0. (*)
h1 →0,h1 =0 |h1 | + |h2 | + · · · + |hn |
h2 →0,h2 =0
..
.
hn →0,hn =0
f(a1 + h1 ,a2 + h2 ,...,an + hn ) − f(a1 , a2 ,..., an ) − [α1 h1 + α2 h2 + · · · + αn hn ]
Ou lim =0.
h→0,h=0 'h'
Lorsque f est différentiable en a, la forme linéaire L est unique (en effet, on peut montrer
que si L′ et L′′ sont deux telles formes linéaires, alors (L′ −L′′ )(h)=o(h) pour h tendant vers
0 et on vérifie facilement que L′ =L′′ ). La forme linéaire L est alors appelée la différentielle
de f en a et notée dfa ou da f ou (df)a ou df(a) 30 ou, lorsqu’il n’y a pas risque de confusion,
f ′ (a). Et l’on écrit aussi parfois f ′ (a).x ou L.x ou dfa .x ou df(a).x au lieu de L(x) ou dfa (x)
ou df(a)(x). C.à.d. que l’on écrit aussi f(a+h)−f(a)−f ′ (a).h=o('h' 1 ) pour h tendant vers
0. On aura remarqué que cette dernière égalité est exactement celle qu’on a donnée pour
les fonctions d’une variable. Et la différentiabilité est la même que la dérivabilité pour une
fonction d’une variable, d’où la notation f ′ (a).
On définit ainsi une application appelée la différentielle de f, notée df ou aussi f ′ : Df ′ −→
′
L(Rn ,R) =(Rn ) , a−→f ′ (a)=df(a), où Df ′ est l’ensemble des points a∈ Rn tels que df(a)
ou f ′ (a) existe, lorsque de tels points existent.
Exemples (Importants).
Pour une forme linéaire L : Rn −→ R, pour un point a=(a1 , a2 , ..., an )∈ Rn , et h=(h1 ,
h2 , ..., hn )∈ Rn , L(a+h)=L(a)+L(h), donc L(a+h)−L(a)−L(h)=0 et 0=o('h'1 ) au voisi-
nage de n’importe quel point. Donc, L est différentiable en tout point a et dLa =L ′ (a)=L.
Donc, dL : Rn −→ L(Rn ,R) est constante (dL(a)=L, pour chaque a∈ Rn ).
En particulier, pour i∈[[1,n]], la i-ème application coordonnée (ou i-ème projection)
pri : Rn −→ R, (x1 , x2 , ..., xn )−→xi est une forme linéaire, donc dpri (a)=pri en tout point
30
On utilise parfois aussi des D majuscules.
a. Quand les variables utilisées sont (x1 , x2 , ..., xn ), il est d’usage de noter dxi l’application
pri surtout en calcul différentiel, cela signifie que dxi (h1 , h2 , ..., hn )=hi . La famille (dx1 ,
dx2 , ..., dxn ) est une base de L(Rn ,R), c.à.d. toute forme linéaire L s’écrit de manière
unique sous la forme L=α1 dx1 + α2 dx2 + · · · + αn dxn , ce qui signifie que L(h)=(α1 dx1 +
α2 dx2 + · · · + αn dxn )(h) =α1 dx1 (h)+ α2 dx2 (h)+ · · · + αn dxn (h) = α1 h1 + α2 h2 + · · · + αn hn .
L’on notera aussi que, si ψi (x1 , x2 , ..., xn )=fJ;aJ (xi ) =f(a1 , a2 , ..., ai−1 , xi , ai+1 , ai+2 ,
..., an ) (J={1,2, ..., i−1, i+1, i+2, ..., n} et aJ =(a1 , a2 , ..., ai−1 , ai+1 , ai+2 , ..., an )∈ Rn−1 ,
cf. notation des fonctions partielles, déf. 6.1), alors la différentielle dψi (a) = αi dxi =αi pri
en a=(a1 , a2 , ..., an ).
f(a1 , a2 , ..., ai−1 ,ai + hi , ai+1 , ai+2 ,...,an ) − f(a1 , a2 ,..., an ) − αi hi
D’autre part, 0 = lim
hi →0,hi =0 |hi |
(en prenant h=(0,0, ...,0,hi ,0,0, ...,0) dans (*) ci-dessus). Ce qui donne
f(a1 , a2 , ..., ai−1 ,ai + hi , ai+1 , ai+2 ,...,an ) − f(a1 , a2 ,..., an )
αi = lim (en considérant les li-
hi →0,hi =0 hi
∂f
mites à gauche et à droite). Donc, αi = (a)=∇i f(a), la i-ème dérivée partielle de f en a,
∂ xi
∂f
et pour cela (a)=∇i f(a) est aussi appelé la différentielle partielle 31 de f par rapport à
∂ xi
x i en a. Par ailleurs, f ′ (a).ei = L(ei )=αi , pour ei = (δ 1i ,δ 2i , ...,δ ni ) =(δ ji )j=1,n .
∂f
Finalement, si f est différentiable en a, toutes les dérivées partielles (a) existent pour
∂ xi
i=1,n, et l’on a :
n ∂f
f(a1 +h1 ,a2 +h2 ,...,an +hn )= f(a1 , a2 ,..., an )+ ( (a)hi ) +o(|h1 | + |h2 | + · · · + |hn |), ou
i=1 ∂ xi
n ∂f
f(a+h)= f(a)+( (a)dxi (h)) +o('h'1 ). Ce qu’on écrit aussi
i=1 ∂ xi
∂f
n
f(a+h)= f(a)+ (a)dxi (h) +o('h'1 ).
i=1 ∂ xi
∂f n
C’est-à-dire, df(a)=f ′ (a)= (a)dxi .
i=1 ∂ xi
La réciproque n’est pas vraie. C’est-à-dire qu’on peut trouver des fonctions dont les dérivées
partielles en un point existent toutes sans que la fonction soit différentiable en ce point.
6.11 Remarque. Logiquement, nous devons définir maintenant les différentielles
d’ordre supérieur. Pour une fonction numérique f : Rn −→ R, si, pour un i∈[[1,n]], une
∂f ∂f
dérivée partielle est définie au voisinage de a=(a1 , a2 , ..., an ), on a une fonction :
∂ xi ∂ xi
∂f ∂f
Rn −→ R, x−→ (x). Si la fonction admet en a une dérivée partielle par rapport
∂ xi ∂ xi
∂2 f ∂ 2 f(a)
à xj , j∈[[1,n]], on la note (a) ou et on l’appelle la dérivée partielle seconde
∂ xj ∂ xi ∂ xj ∂ xi
∂f
de f en a par rapport à x i et x j . Et si toutes les sont différentiables en a, on ob-
∂ xi
31
Appellation utilisée surtout pour des fonctions vectorielles
i=1,n (f ′ (g(b))∈ L(Rn ,R)). Finalement, f ′ (g(b))◦g ′ (b)∈ L(R,R) tq [f ′ (g(b)) ◦ g ′ (b)](t)=
n ∂f n ∂f n ∂f n ∂f dgi
(a)dxi (β1 t, β2 t, ..., βn t) = (a)βi t = t (a)βi = t (a) (b) .
i=1 ∂ xi i=1 ∂ xi i=1 ∂ xi i=1 ∂ xi dt
d(f ◦g) n ∂f dgi
C’est cette formule qu’on doit retenir : (b)= (g(b)) (b). Cette
dt i=1 ∂ xi dt
dg1
formule revient à appliquer f ′ (g(b)) au vecteur g ′ (b)= (g ′1 (b), g ′2 (b), ..., g ′n (b)) = ( (b),
dt
dg2 dgn
(b), ..., (b)). Ouf !!!
dt dt
2011
Alain Ralambo
n ∂f
La démonstration consiste à montrer que f(g(t))−f (g(b))− (t−b) (a)βi
i=1 ∂ xi
n ∂f
est négligeable devant (t−b) quand t tend vers b. Or, f(x)−f (g(b))− (a)dxi (x−g(b))
i=1 ∂ xi
n ∂f
=o('x − g(b)'1 ) (f différentiable en a=g(b)). C.à.d., f(x)−f (g(b))− (a)dxi (x − g(b))
i=1 ∂ xi
n ∂f
=o('x − g(b)'1 ), ou f(x)−f (g(b))− (a)((xi − gi (b)) =o('x − g(b)'1 ) [rappelons
i=1 ∂ xi
que x−g(b)=(x1 −g1 (b), x2 −g2 (b), ..., xn −gn (b))∈ Rn ]. D’un autre côté, gi (t)−gi (b)=βi (t−b)
+(t−b)εi (t), avec εi (t)→ 0 qd t→b, pour chaque i∈[[1,n]] (♣) (dérivabilité de gi en b). On
n ∂f
remplace (xi −gi (b) par gi (t)−gi (b), il vient f(x)−f (g(b))− (a)[βi (t − b)+(t − b)εi (t)]
i=1 ∂ xi
=o('g(t) − g(b)'1 ). Les relations (♣) montrent que 'g(t) − g(b)'1 = |g1 (t) − g1 (b)| +
|g2 (t) − g2 (b)| + · · · + |gn (t) − gn (b)|=O(t−b), ce qui fait que un o('g(t) − g(b)'1 ) est un
n ∂f n ∂f
o(O(t−b))=o(t−b). D’autre part, (a)(βi (t−b)+(t−b)εi (t))= (t−b) (a)βi +
i=1 ∂ xi i=1 ∂ xi
n∂f n ∂f
(t−b) (a)εi (t) . Et (a)εi (t) → 0 quand t→b car chaque εi (t) tend vers 0.
i=1 ∂ xi i=1 ∂ xi
n ∂f n ∂f
C.à.d. (t−b) (a)εi (t) =o(t−b). Finalement, f(x)−f (g(b))−(t−b) (a)βi =
i=1 ∂ xi i=1 ∂ xi
o(t−b). c.q.f.d.
dh
Pour (ii). D’abord, h : R −→ R est différentiable en c=f(a). Donc, (c)=h ′ (c)∈ L(R,R)
du
′ ′ h(u) − h(c)
et (h (c))(u)=αu pour u∈ R, h (c) est identifié au coefficient α ∈ R (α=lim ).
u→c u−c
n ∂f
Ensuite f : Rn −→ R est différentiable en a, c.à.d. f ′ (a)∈ L(Rn ,R), f ′ (a) = (a)dxi ,
i=1 ∂ xi
au point a=(a1 , a2 , ..., an ). Donc, notre formule dit que h◦f est différentiable en a avec
(h◦f) ′ (a)= h ′ (f(a))◦f ′ (a) ou [(h◦f) ′ (a)](x)=[h ′ (f(a))◦f ′ (a)](x)= [h ′ (c)](f ′ (a)(x))=α[f ′ (a)(x)]
n ∂f n ∂f
=α (a)dxi (x1 , x2 , ..., xn ) = α (a)dxi (x1 , x2 , ..., xn ) . C.à.d., puisque
i=1 ∂ xi i=1 ∂ xi
∂ (h ◦ f)
n ∂ (h ◦ f) ∂f ∂f
(h◦f) ′ (a)= (a)dxi , que (a)=α (a) =h ′ (f(a)) (a). On retient cette
i=1 ∂ xi ∂ xi ∂ xi ∂ xi
∂ (h ◦ f) dh ∂f
formule par (a)= (f(a)) (a). Cette dernière formule est évidente car c’est la
∂ xi df ∂ xi
dérivation de la composée de deux fonctions d’une variable réelle (h et une fonction partielle
∂ (h ◦ f)
fJ;aj ), mais elle montre seulement que (a) existe.
∂ xi
n ∂f
Il nous faut monter que (h(f(x))− (h(f(a))= α (a)(xi − ai ) +o('x − a'1 ) (x=(x1 ,
i=1 ∂ xi
x2 , ..., xn ) et a=(a1 , a2 , ..., an )). Or, h(u)−h(c)=α(u−c) +(u−c)ε(u) avec ε(u)→0 quand
u→c. Donc, h(f(x))−h(c)=α(f(x)−c) +(f(x)−c)ε(f(x)) = α(f(x)−f(a)) +(f(x)−f(a))ε(f(x)).
∂fn
Mais, f(x)−f(a)= f ′ (a).(x−a)+o('x − a'1 ) = (a)(xi − ai ) +o('x − a'1 ). Donc,
i=1 ∂ xi
n ∂f n ∂f
h(f(x))−h(c)=α (a)(xi − ai ) + α.o('x − a'1 ) + (a)(xi − ai ) ε(f(x)) +
i=1 ∂ xi i=1 ∂ xi
n ∂f
o('x − a'1 )ε(f(x)). Donc, h(f(x))−h(f(a))= α (a)(xi − ai ) + ε1 (x), avec ε1 (x)=
i=1 ∂ xi
n ∂f
α.o('x − a'1 ) + (a)(xi − ai ) ε(f(x))+ o('x − a'1 )ε(f(x)). On a bien α.o('x − a'1 )
i=1 ∂ xi
n ∂f
+ o('x − a'1 )ε(f(x))= o('x − a'1 ). On a aussi (a)(xi − ai ) =O('x − a'1 ), et
i=1 ∂ xi
n ∂f
comme ε(f(x))→ 0 si x→a (car f(x)→c et ε(u)→0 si u→c), (a)(xi − ai ) ε(f(x))=
i=1 ∂ xi
o('x − a'1 ). Finalement, ε1 (x)=o('x − a'1 ). c.q.f.d.
et appliquant la Formule générale des Accroissements Finis (cf. th. 4.22), on obtient
∂f
|ψ(h1 ,h2 ) − ψ(h1 ,0)| ≤ ε |h2 |. Ce qui s’écrit f(a1 +h1 ,a2 +h2 ) − f(a1 +h1 ,a2 ) − (a)h2 ≤
∂ x2
∂f
ε |h2 |. D’autre part, par définition de la dérivée partielle (a), on peut trouver η2 > 0
∂ x1
∂f
(η2 < η1 ) tq si |h1 | < η2 alors f(a1 +h1 ,a2 ) − f(a1 ,a2 ) − (a)h1 < ε |h1 |. Finale-
∂ x1
∂f ∂f
ment, si |h1 | < η2 et |h2 | < η2 alors f(a1 +h1 ,a2 +h2 ) − f(a1 ,a2 ) − (a)h1 − (a)h2 <
∂ x1 ∂ x2
ε(|h1 | + |h2 |).
32
C est un cône ouvert si C est un cône et si pour chaque a=(a1 , a2 , ..., an )∈C, on peut trouver ε > 0
tq ]a1 − ε,a1 + ε[×]a2 − ε,a2 + ε[× · · · ×]an − ε,an + ε[⊂C.
7 INTÉGRATION.
La méthode de Riemann n’en est pas très éloignée car elle se ramène à encadrer une fonction
par deux fonctions en escalier, comme nous verrons, pour calculer l’aire entre le graphe de
la fonction et l’axe des abcisses. Mais, la méthode de Riemann tient beaucoup plus du
calcul barycentrique, du calcul de moyennes — et nous verrons qu’il y aura une quantité
appelée valeur moyenne d’une fonction f — du calcul de poids avec utilisation de densité
(comme en physique). D’ailleurs, Archimède avait aussi utilisé la pesée pour calculer des
aires; il dessinait le domaine dont on doit mesurer l’aire sur une plaque de métal très mince
et de densité uniforme et le découpait puis il comparait son poids avec le poids de un
centimère carré (1 cm2 ) du même métal, le reste étant une question de mise à l’échelle.
Nous avons vu en TD la notion de moyenne arithmétique de n nombres (x1 , x2 , ..., xn )
a1 x1 + a2 x2 + · · · + an xn
affectés des coefficients (a1 , a2 , ..., an ), A= , c’est le barycentre des
a1 + a2 + · · · + an
(x1 , x2 , ..., xn ) comme l’étudiant l’a certainement déjà appris en terminales. La théorie de
la mesure a généralisé cette approche barycentrique. Et par ailleurs, il existe bien d’autres
intégrales. Mais cela est une autre histoire !!! Voyez sur le web !!!
33
Bernhard Riemann, 1826-1866.
34
Archimède, 287-212 av. J.C.
7.1 Définition. On appelle subdivision d’un intervalle [a,b] de R (a<b) une suite finie
et croissante de points de [a,b] σ=(x0 , x1 , x2 , ..., xn ) telle que x0 =a et xn =b, le nombre
n dépend de σ. Les intervalles [xi−1 ,xi ], i=1 à n, sont les intervalles de la subdivision σ
et le nombre h=h(σ)= sup (xi −xi−1 ) est le pas de la subdivision. La subdivision est dite
1≤ i≤n
b−a
régulière si la longueur (xi −xi−1 ) est constante (égale à ). Pσ ={x0 , x1 , x2 , ..., xn } est
n
l’ensemble des points de la subdivision σ.
On dit que la subdivision σ ′ est plus fine que 35 la subdivision σ si Pσ ⊃Pσ ′ . On obtient une
subdivision plus fine que σ en ajoutant des points à Pσ . La réunion de deux subdivisions
σ et σ ′ est une subdivision σ ′′ telle que Pσ ′′ = Pσ ∪Pσ ′ qu’on range de façon naturelle.
On dit qu’une fonction f : [a,b]−→ R est en escalier si l’on peut trouver une subdivision
σ de [a,b] telle que la restriction de f à ]xi−1 ,xi [ est constante pour chaque i∈[[1,n]], c.à.d.
f(x)=ξi pour x∈]xi−1 ,xi [ où ξi ∈ R. Donc, f est bornée car elle ne prend qu’un nombre fini
de valeurs (les ξi et les f(xi )). On dit qu’une subdivision est associée à f si f est constante à
l’intérieur des intervalles ouverts de la subdivision, et donc, une subdivision plus fine que
σ est aussi associée à f. On note Ea,b l’ensemble des fonctions en escalier sur [a,b].
Remarques. Ea,b est un espace vectoriel sur R muni de l’addition et de la multiplication
par un scalaire, c.à.d. que λf+µg∈ Ea,b pour f,g∈ Ea,b . Et même, Ea,b est un treillis (sup(f,g)
et inf(f,g)∈ Ea,b si f et g∈ Ea,b ). Si une fonction f est définie sur [a,b] et si f|[a,c] ∈ Ea,c et
f|[c,b] ∈ Ec,b , alors f∈ Ea,b (c∈[a,b]) et réciproquement.
7.2 Définition. (Intégrale d’une fonction en escalier) Soit f∈ Ea,b (a<b) et soit
σ=(x0 , x1 , x2 , ..., xn ) une subdivision associée à f. On appelle intégrale de f le nombre réel
n xi−1 +xi
I(f)= (xi −xi−1 )ξi où ξi =f(x) pour x∈]xi−1 ,xi [ (on peut prendre x= ).
i=1 2
On note I(f)= ab f ou I(f)= ab f(x)dx. Dans cette dernière notation, la lettre “x” dans f(x)dx
est une variable muette, c.à.d. qu’elle peut être remplacée par n’importe quel autre sym-
bole. I(f)= ab f(x)dx = ab f(t)dt = ab f( )d . On lit ab f en disant “intégrale de a à b de f”.
Le “f” sous le symbole intégral est parfois appelé aussi l’intégrande et le “f(x)dx” appelé
l’expression intégrale.36
35
On dit aussi “un raffinement” de σ.
36
Certains appellent intégrande (ou parfois intégrand) l’expression “f(t)dt” sous le signe .
Remarques. 1) I(f) est la somme algébrique des aires des rectangles, à côtés parallèles
aux axes, formés de façon naturelle à partir du graphe de f (voir la figure). Les aires des
zones au-dessus de l’axe des abscisses marquées de + sont comptées positivement et celles
au-dessous marquées du − sont comptées négativement dans le calcul de la somme.
2) I(f) ne dépend pas de la subdivision σ associée à f, c.à.d. que on obtient le même I(f)
quelle que soit la subdivision associée à f utilisée.
3) Si f et g∈ Ea,b , λ et µ ∈ R, ab (λf +µg) =λ b
af +µ b
af , c.à.d. que I est une forme linéaire
sur Ea,b , (I(λf+µg)=λI(f)+µI(g)).
b c b
4) (Relation de CHASLES). Si f|[a,c] ∈ Ea,c et f|[c,b] ∈ Ec,b , a≤ c≤ b, alors a f= a f+ c f.
tend vers ∞. Et on la note ab f = ab f(t)dt. Elle est aussi appelée intégrale définie de f sur
[a,b], on expliquera plus tard le sens du mot “définie”. Nous noterons I[a,b] l’ensemble des
fonctions intégrables au sens de Riemann sur [a,b].
On montre facilement que lorsqu’elle existe, ab f est bien définie, c.à.d. qu’elle ne depend
+ −
pas de la suite (un )n dans Ea,b (f) et de la suite (vn )n dans Ea,b (f) de la définition. Cela signifie
b b ′ b b ′ +
que lim a un =lim a un =lim a vn =lim a vn si (un )n et (u′n )n sont dans Ea,b (f) et (vn )n
n∞ n∞ n∞ n∞
′ − − b −
et (vn )n dans Ea,b (f) vérifient (♦). Et, en fait, si l’on pose Ia,b (f)=sup{ a v/v∈ Ea,b (f)},
+ b +
appelé intégrale inférieure de f sur [a,b], et Ia,b (f)=inf{ a u/u∈ Ea,b (f)}, appelé intégrale
supérieure de f sur [a,b], alors I− +
a,b (f)=Ia,b (f) si f est intégrable au sens de Riemann sur [a,b]
b
et réciproquement. Et alors I− +
a,b (f)=Ia,b (f)= a f. D’où la définition suivante, équivalente à
la précédente.
Une fonction f : [a,b]−→ R, est intégrable au sens de Riemann sur [a,b] si f est bornée et
b
si I− + − +
a,b (f)=Ia,b (f). Son intégrale est alors a f =Ia,b (f)=Ia,b (f).
Ces sommes de Darboux vérifient les propriétés suivantes (dont la démonstration est laissée
à titre d’exercice) : sσ ≤ sσ ′ ≤ Sσ ′ ≤ Sσ si σ ′ est plus fine que σ (examiner le cas où l’on
ajoute un point à σ) et sσ1 ≤ Sσ2 pour deux subdivisions σ1 et σ2 quelconques (conséquence
des relations précédentes en utilisant σ=σ1 ∪ σ2 ). On démontre alors facilement le résultat
(♭) suivant :
“f ∈ F([a,b],R), bornée, est Riemann intégrable ssi à chaque ε > 0, on peut associer une
subdivision σ de [a,b] telle que S σ −s σ ≤ ε”.
Moins évident est le théorème (de Darboux) suivant :
“f ∈ F([a,b],R), bornée, est Riemann intégrable ssi à chaque ε > 0, on peut associer un
δ > 0 tq pour une subdivision σ de [a,b], si h( σ) ≤ δ (le pas de σ), alors S σ −s σ ≤ ε”. On
l’admettra.
De ces deux résultats, on déduit que si f est Riemann intégrable sur [a,b], alors, pour toute
suite (σk )k de subdivisions de [a,b] telle que h(σk )−→0, sσk et Sσk convergent vers une
k∞
b b
même limite (qui est alors af ). La réciproque est aussi vraie. On a alors af = sup sσ
σ
=inf
σ
Sσ aussi.
7.9 Exemple de fonctions bornée non intégrable. Soit f : [a,b]−→ R, f=1IQ , c.à.d.
f(x)=1 si x∈ Q sinon f(x)=0. Alors f n’est pas intégrable, même si elle est bornée. En effet,
+ −
pour u∈ Ea,b (f) et v∈ Ea,b (f), avec v≤ f≤ u, si σ=(x0 , x1 , x2 , ..., xn ) est une subdivision
commune associée à u et v, alors u≥ 1 sur chaque intervalle de σ (car il y a toujours un
élément de Q dedans) et v≤ 0 (car il y a toujours un élément de R\Q dedans). Donc,
u−v≥ 1 et ab v−u≥ b−a. Donc, f n’est pas intégrable, d’après la définition même. En fait,
Sσ −sσ =b−a pour tout σ.
7.10 Interprétation de l’intégrale. Nous avons vu que, pour une fonction numérique
en escalier v sur [a,b], ab v est l’aire algébrique de l’ensemble Dv ={(x,y)∈ R2 /a≤ x≤ b
et 0≤ ε.y≤ ε.u(x), ε=sgn(v(x))} Aussi, l’on convient que, si f : [a,b]−→ R est intégrable
(au sens de Riemann), ab f désignera l’aire de Df ={(x,y)∈ R2 /a≤ x≤ b et 0≤ ε.y≤ ε.f(x),
ε=sgn(f(x))}.
Propriétés de l’intégrale.
Les propriétés des intégrales de fonctions en escalier que nous avons données, à la suite de
la définition 7.2, sont vraies pour les fonctions quelconques intégrables au sens de Riemann
sur [a,b], puisqu’on ne fait que des passages à la limite pour passer de l’intégrale de fonctions
en escalier à l’intégrale de Riemann. Rappelons-les.
f(c)
de Chasles ci-après) ou poser v(x)= pour x∈ [a1 ,b1 ] et v(x)=0 ailleurs auquel cas
2
f(c)
−
v∈ Ea,b (f), et ab v= (b1 −a1 ) > 0. c.q.f.d.
2
7.14 Théorème (de la moyenne). Soit f : [a,b]−→ R intégrable. Soient m= inf f(x)
x∈[a,b]
b
et M= sup f(x). Alors, on peut trouver k∈[m,M] tq af =k(b−a).
x∈[a,b]
b b b b b
Preuve : m≤ f≤ M donc a m≤ af ≤ a M, ou (b−a)m ≤ af ≤ (b−a)M. Donc, k= af
∈[m,M]. c.q.f.d.
b
7.15 Corollaire 1. Si f∈ C([a,b],R), on peut trouver c∈[a,b] tq af =f(c)(b−a) (appliquer
le théorème des valeurs intermédiaires).
b
7.16 Corollaire 2 (Formule de la moyenne). Si f∈ I[a,b] , alors a f ≤ (b−a) sup |f(x)|.
x∈[a,b]
b
En effet, a f =|k| |b − a| ≤ (b−a)sup(|m|,|M|) = (b−a) sup |f(x)|.
x∈[a,b]
b b
7.17 Proposition. Si f∈ I[a,b] , alors |f| ∈ I[a,b] aussi. Et, de plus, a f ≤ a |f|. Donc,
si f et g∈ I[a,b] , alors, sup (f,g) et inf (f,g)∈ I[a,b] .
Preuve : Remarquons d’abord que si l’on pose f+ =sup (f,0) et f− =sup (−f,0) =−inf (f,0).
Alors f =f+ −f− et |f|=f+ +f− . De plus, f− = (−f)+ et f=f+ ssi f≥ 0. Il suffit donc de
montrer que f+ ∈ I[a,b] si f∈ I[a,b] .
On montre facilement aussi que (f+g)+ ≤ f+ +g+ , pour deux fonctions f et g quelconques.
Soient alors ε > 0 et u∈ Ea,b +
(f) tq ab (u−f)≤ ε. Donc, 0≤ u−f et (u−f)+ = u−f. Donc,
u+ = (u−f +f)+ ≤ (u−f)+ +f+ ≤ u−f+f+ . Donc u+ −f+ ≤ u−f. Mais u≥ f , donc u+ ≥
f+ , c.à.d. u+ ∈ Ea,b+ −
(f+ ). On montre, de même, que si v∈ Ea,b (f) tq ab (f−v)≤ ε, alors,
−
v+ ∈ Ea,b (f+ ) et 0≤ f+ −v+ ≤ f−v. Donc, v+ ≤ f+ ≤ u+ et u+ −v+ ≤ u+ −f+ + f+ −v+ ≤
u−f+f−v =u−v. Donc, ab u+ −v+ ≤ ab u−v≤ 2ε. c.q.f.d.
INTÉGRALES ET PRIMITIVES.
7.24 Définition (Intégrale indéfinie). Soit f∈ I[a,b] (a<b). Nous savons que f est
intégrable sur tout [a,x]⊂[a,b]. On appelle intégrale indéfinie de f sur [a,b] la fonction
F : [a,b]−→ R tq pour x∈[a,b], F(x)= ax f = ax f(t)dt. La borne d’intégration supérieure
est variable, voilà pourquoi on dit “intégrale indéfinie” par opposition à “intégrale définie”
pour laquelle la borne supérieure de l’intégrale est fixée. Pour l’intégrale définie, l’intervalle
d’intégration est aussi un intervalle fermée, car il y aura l’intégrale généralisée que nous
verrons plus tard.
L’on remarquera que la borne supérieure de l’intégrale est x doit être différente de
la variable d’intégration t (dans f(t)dt), cela est conforme avec ce que nous disions,
la variable d’intégration est une variable muette de sommation qu’on ne peut pas sortir
du signe pour la mettre comme argument de F ( est un symbole abréviateur, on se
rappellera que ab f est une limite de sommes de Darboux ou de Riemann ou de sn du type
n
sn = (xi −xi−1 )f(ξi )).
i=1
Si f est une fonction sur un intervalle J de R telle que f∈ I[a,x] pour tout x∈J, a étant fixé,
[a,x] étant un segment orienté (x pouvant être ≤ a), la fonction F précédente est encore
définie sur J tout entier et s’appelle intégrale indéfinie de f sur J. Une telle fonction f est
dite localement intégrable sur J. La locale intégrabilité de f ne dépend d’ailleurs pas de
la borne a fixée, mais la fonction F dépend de a et devrait être notée Fa si l’on veut être
rigoureux. En faisant varier a dans J, il y a une infinité d’intégrales indéfinies Fa de f sur J,
′
tq Fa −Fa ′ = aa f (par la relation de Chasles) c.à.d. que Fa et Fa ′ diffèrent d’une constante.
7.25 Théorème. Soient f ∈ I[a,b] , a<b. Alors, l’intégrale indéfinie de f sur [a,b]
est lipschitzienne 37 de rapport k= sup |f(x )| c.à.d. |F(x) − F(x ′ )| ≤ k |x − x ′ |, pour x et
x∈[a,b]
x ′ ∈[a,b]. Donc, F est uniformément continue sur [a,b].
7.26 Théorème. Soient f ∈ I[a,b] , a<b. Alors, l’intégrale indéfinie F de f sur [a,b]
est dérivable à droite (resp. à gauche) et admet f(t+0) (resp. f(t−0)) en tout point t
de [a,b] où cette limite existe. C.à.d. F ′d (t)=f(t+0) pour t∈[a,b] tq f(t+0) existe (resp.
F ′g (t)=f(t−0) pour t∈[a,b] tq f(t−0) existe).
COROLLAIRE : Si f ∈ I[a,b] , a<b. Alors, l’intégrale indéfinie F de f sur [a,b] est
dérivable en tout point t de [a,b] où f est continue et F ′ (t)=f(t) pour t∈[a,b] où f est
continue.
Preuve : Soit x0 ∈[a,b[ tq α=f(x0 +0) = lim f(t) existe. D’après une remarque précédente,
t→x0
>
le changement des valeurs de f en un nombre fini de points de [a,b] ne modifie en rien la
fonction F(x)= ax f(t)dt. On va donc supposer que α=f(x0 ) même si ce n’est pas le cas. On
a donc, pour un ε > 0 donné, un δ>0 tq si x0 ≤ t≤ x0 +δ, alors α − ε <f(t) <α + ε. En
intégrant membre à membre, on obtient xx00 +h (α − ε)dt ≤ xx00 +h f(t)dt ≤ xx00 +h (α + ε)dt.
Or, F(x0 +h)−F(x0 )= ax0 +h f(t)dt− ax0 f(t)dt= xx00 +h f(t)dt. Donc, (α − ε)(x0 +h−x0 ) ≤
37
On dit qu’une fonction f est k-lipschitzienne si |f(x) − f(x ′ )| ≤ k|x − x ′ | pour x et x ′ ∈Df , k∈ R+ .
est une primitive de (f◦ϕ)ϕ ′ sur I. Ce que l’on formule souvent de la manière suivante :
“Si f(x)dx=F(x) + k, alors f( ϕ(t))ϕ ′ (t)dt= F( ϕ(t)) +k ” (formule de changement de
variable pour les primitives).
2) Dans le changement de variable, le symbole f(x)dx se comporte comme une différentielle
x
(et c’est bien la différentielle de ϕ(a) f(u)du). En pratique, on pose x=ϕ(t), donc dx=ϕ ′ (t)dt.
β b
Alors, α f(x)dx= a f(ϕ(t))ϕ ′ (t)dt, où b est un élément de ϕ−1 (β) et a∈ ϕ−1 (α). C’est une
des raisons pour lesquelles on garde la notation αβ f(x)dx, alors qu’il est plus simple d’écrire
β
α f.
3) Dans ces formules, on ne suppose pas ϕ bijective. Cependant, lorsque ϕ est bijective
et si, de plus, ϕ−1 est dérivable, alors la connaissance de G(t)= f(ϕ(t))ϕ ′ (t)dt permet de
dx
connaı̂tre f(x)dx en posant t=ϕ−1 (x), f(x)dx =G(ϕ−1 (x), (dt= ′ −1 ).
ϕ (ϕ (x))
a a 2 a 2et a 2u du
4) Exemple : 0 ch t dt = t0 −t
dt = 0 2t dt = 1e 2 obtenu en posant
e +e e +1 u +1 u
1
u=et ce qui équivaut à t= ϕ(u)= Log u. On remplace dt par Log ′ (u)du= du, a par ea
u
0 a 0 ea 2u du
et 0 par 1=e (quand t=a, u=e et quand t=0, u=e =1). Finalement, 0 2 =
u +1 u
ea 2 u=ea a
0 du =[2Arctg(u)]u=1 =2Arctg(e )−2Arctg(1) (Arctg u étant une primitive de
u2 + 1
1
2
)
u +1
7.30 Quelques cas particuliers utiles.
1) Soit f ∈ I[a,b] , a<b, on ne suppose pas que f est continue sur [a,b]. Alors, la fonction g :
[ −b,−a] −→ R définie par g(t)=f( −t) est intégrable, c.à.d. g∈ I[−b,−a] et ab f(t)dt= −b
−a
g(u)du.
En particulier, pour b>0 et f ∈ I[−b,b] : 0b f( −t)dt= −b
0 b
f(u)du et −b f(t)dt= 0b [f(t)+f( −t)]dt.
Ce résultat signifie qu’on peut faire le changement de variable t −t, même si f n’est
pas continue (mais seulement intégrable).
En effet, il y a une bijection entre les subdivisions σ=(x0 , x1 , x2 , ..., xn ) de [a,b] et −σ=(−xn ,
−xn−1 , ..., −x2 , −x1 , −x0 ) de [−b,−a] (comme dans un miroir). Ce qui induit, par exemple,
une égalité des sommes de Darboux supérieures de f et de g. De même pour les sommes
de Darboux inférieures. D’où le résultat.
a a
Cas particuliers. •) Soit f ∈ I[−a,a] , 0<a, tq f est paire. Alors, −a f(t)dt=2 0 f(t)dt.
a
••) Soit f ∈ I[−a,a] , 0<a, tq f est impaire. Alors, −a f(t)dt=0.
2) Soit f ∈ I[a,b] , a<b, on ne suppose pas que f est continue sur [a,b]. Alors, par un
raisonnement analogue, la fonction f α : [a−α,b−α] −→ R définie par f α (t)=f(t+α) est
b−α b−α
intégrable, c.à.d. f α ∈ I[a−α,b−α] et a−α f α (t)dt= a−α f(t+α)dt= ab f(u)du.
b b+T
En particulier, si f est périodique de période T et si f ∈ I[a,b] , alors : a f(t)dt= a+T f(t)dt.
Ce résultat signifie qu’on peut faire le changement de variable u=t+α, même si f n’est
pas continue (mais seulement intégrable).
Preuve : La dérivée de la fonction entre [ ] est u(x)v (n) (x)+(−1)n u (n) (x)v (x).
b (n)
Cas particulier : u(x)=P(x) où P est un polynôme de degré ≤ n−1, a u(x)v (x)dx =
n−1 x=b
p (p) (n−p) (n)
(−1) u (x)v (x) (car u = 0).
p=1 x=a
7.35 Primitives usuelles. Voici une liste des primitives usuelles. Nous donnons la
fonction et en vis-à-vis une primitive (on peut lire le tableau dans le sens inverse en pensant
à la dérivée)
f(x) −→ f(x)dx
1
xα , α = 1 −→ xα+1 +c
α
1
−→ Log |x| +c
x
sin x −→ −cos x +c
cos x −→ sin x +c
tg x −→ − Log |cos x| +c
1 x
−→ Log tg +c
sin x 2
1 x π
−→ Log tg ( + ) +c
cos x 2 4
cotg x −→ Log |sin x| +c
1
−→ tg x +c
cos2 x
1
−→ −cotg x +c
sin2 x
1
−→ Log |tg x| +c
sin x cos x
sh x −→ ch x +c
ch x −→ sh x +c
ex −→ ex + c
ax
ax −→ +c
Log a
1 x
−→ Log th +c
sh x 2
1
−→ 2Arctg ex +c
ch x
1
−→ Log |sh x| +c
th x
1
−→ Log |th x| +c
sh x ch x
1
−→ −coth x +c
sh2 x
1
−→ th x +c
ch2 x
1 1 x
2 2
−→ Arctg +c
x +a a a
1 1 x−a
−→ Log +c
x2 − a2 2a x+a
1 x
√ −→ Arcsin +c
2
a −x 2 |a|
1 x √
√ −→ Argsh +c = Log (x+ a2 + x2 )+ c ′
2
a +x 2 |a|
1 x √
√ −→ Argch +c = Log ( x+ x 2 − a2 + c ′
x2 − a2 a
1 x
3 −→ √ +c
(x2 + a) 2 a x2 + a
1 x
3 −→ √ +c
(a − x2 ) 2 a a − x2
1
u ′ (x)uα (x) (α = −1) −→ u1+α (x) +c
1+α
u ′ (x)
−→ Log |u(x)| +c
u(x)
p2 p2
On pose a= q − ou a= − q selon le cas.
4 4
p
p2 Mx+N Mt+(N − M ) t
Dans le premier cas, a= q − , dx= 2 dt = M dt
4 (x2 + px + q)k (t2 + a2 )k (t2 + a2 )k
p 1 t u′ 1
+(N−M ) dt . dt est de la forme tandis que Jk = dt
2 (t2 + a2 )k (t2 + a2 )k uk (t2 + a2 )k
se calcule par récurrence, primitivation par parties (chercher une relation entre Jk et Jk−1 ,
J1 est une primitive usuelle).
p2 Mx+N t p 1
Dans le deuxième cas, a= − q, 2 k
dx=M 2 2 k
dt+(N−M ) dt.
4 (x + px + q) (t − a ) 2 (t − a2 )k
2
t u′ 1
Comme précédemment, 2 2 k
dt est de la forme k
tandis que J ′k = dt
(t − a ) u (t − a2 )k
2
se calcule par récurrence, primitivation par parties.
7.37 Primitives de polynômes en sin et cos. (de même que pour des polynômes en
sinx, cosx, sin2x, cos2x, ..., sin(nx), cos(nx)).
Méthode générale : transformer les produits en sommes à l’aide des formules trigonomé-
triques et utiliser les primitives usuelles sin(ax+b)dx et cos(ax+b)dx.
Autre méthode : chercher les primitives du type cosp [Link] x dx, p,q∈ N. Pour p pair,
poser sinx =t (remarquer que cos2 x=1−sin2 x, on est ramené à sinm [Link] dx de la forme
um u′ ). Pour q impair, poser cos x=t (remarque analogue à la précédente). Si p et q
sont pairs, poser tg x=t. On peut se ramener ausi à calculer cosp x dx qu’on linéarisera
1
(cosx= (eix +e−ix ) et utiliser le binôme).
2
Méthodes analogues pour les polynômes en shx, chx, sh2x, ch2x, .... Il faut faire attention
aux conditions de changement de variable.
3) R(sinx,cosx)=R3 (tgx), où R3 est une fonction rationnelle d’une variable. On posera
dt R3 (t)dt
tgx=t (donc, dx= 2
) et on est ramené à dt. Un critère pour savoir qu’on
1+t 1 + t2
est dans ce cas est que R(sin(π+x),cos(π+x))=R(sinx,cosx) (à titre d’exercice aussi).
Lorsqu’on veut écrire R(sinx,cosx) sous la forme R3 (tgx), se souvenir que 1=cos2 x+sin2 x.
7.39 Primitives de fonctions rationnelles de ex . Calcul de R(ex )dx où R est une
dt
fonction rationnelle d’une variable. Changement de variable : ex =t, dx= , on est ramené
t
R(t)
à dt.
t
7.40 Primitives de fonctions rationnelles en sh et ch. (On peut ramener à ce
type les fonctions rationnelles en shx, chx, sh2x, ch2x, ..., sh(nx), ch(nx)). Étant donnée
une fraction rationnelle R(u,v), on cherche I= R(shx,chx)dx.
x dt 2t 1+t
Méthode générale : Poser th =t, dx=2 2
, shx= 2
, cosx= ,
2 1−t 1−t 1 − t2
2t 2t dt
I= R( , )2 , qui est une primitive de fonction rationnelle en t. On rem-
1 − t 1 − t 1 − t2
2 2
x
place ensuite t par th , mais il faut faire attention au domaine de définition de la primitive
2
(respecter les conditions de changement de variable, continuité, etc..). On peut également
dt
poser ex =t, dx= .
t
Cas particuliers. Analogues à ceux de 7.38. R(shx,chx)=R1 (chx).shx ssi R(shx,chx) est
impaire. Pour vérifier que R(shx,chx)=R2 (shx).chx, et que R(shx,chx)=R3 (thx), on peut
utiliser que sh(−iπ−x)=shx, ch(−iπ−x)=−chx, sh(−iπ+x)=−shx, ch(−iπ+x)=−chx,
th(−iπ+x)=thx. On peut aussi remplacer shx par [Link] x, chx par [Link] x (sh(ix)=[Link],
ch(ix)=[Link]), et appliquer les critères pour les circulaires. Se souvenir aussi que 1=ch2 x−sh2 x.
r r r
αx + β 1 αx + β 2 αx + β n
7.41 Primitives diverses. 1) R x, , ,···, dx,
γx + δ γx + δ γx + δ
où r1 , r2 , ..., rn ∈ Q et R est une fonction ratinnelle de n+1 variables. Changement de
1
αx + β m
variable : t=ϕ−1 (x)= où m=PPMC (q1 , q2 , ..., qn ) , qi étant le dénominateur
γx + δ
αx + β δtm − β
de ri (i=1,n). Donc, tm = c.à.d. x= =ϕ(t) (dx=ϕ ′ (t)dt). On est ramené
γx + δ α − γtm
à une fonction rationnelle. (ϕ−1 doit être dérivable)
√
2) R x, ax2 + bx + c dx, où R est une fonction rationnelle de 2 variables. On suppose
a= 0, et b2 −4ac= 0.
√ √ √
•) 1er cas : a>0. Poser t= ax2 + bx + c+ x a (1ère substitution d’Euler). Donc, t−x a=
√ √
√ t 2
− c √ t 2
a + bt + c a
ax2 + bx + c et x=ϕ(t) = √ (d’où dx), d’où ax2 + bx + c = √ .
b + 2t a √ b + 2t a
On√ est ramené à une fonction rationnelle. (On peut également poser t=√ ax2 + bx + c−
x √a). La 2ème 2
√ substitution d’Euler consiste au cas où c>0 à poser t= ax + bx + c= tx
+ c (ou − c) d’où l’on tire x=ϕ(t).
√
••) 2ème cas : a<0 (donc, b2 −4ac> 0), ax2 +bx+c=a(x−λ)(x−µ). Poser ax2 + bx + c=
t(x−λ), ce qui donne ax2 +bx+c= t2 (x−λ)2 = a(x−λ)(x−µ). Donc, a(x−µ) =t2 (x−λ) et
−aµ + λt2 √ a(λ − µ)t
x= 2
(d’où dx) et ax2 + bx + c= .
t −a t2 − a
Cette méthode s’applique même si a>0 pourvu que b2 −4ac> 0. La 3ème substitution
x−µ √
d’Euler consiste à faire a(x − λ)(x − µ)= |x − λ| a , donc, R x, ax2 + bx + c dx=
x−λ
x−µ
R x, a dx que l’on sait calculer.
x−λ
2
b 4ac − b2
3) Enfin, ax2 +bx+c= a x+ + et, selon le signe de 4ac−b2 , on posera
2a 4a2
2 2
b 4ac − b2 2 b b2 − 4ac 2
x+ = 2
ch (t) ou x+ = cos (t) et l’on est ramené à des fonc-
2a 4a 2a 4a2
tions rationnelles de ch(t) ou cos(t).
1
4) (Différentiel binômial) I= xm (a+bxn )p dx, m,n,p∈ Q. Poser z=xn (x=z n ), xm (a+bxn )p dx=
m+1
1 p
−1 m+1 1 1 a+bz p p+q
(a+bz) z n dz. Poser q= −1, donc I= (a+bz)p zq dz = ( ) z dz.
n p q
n np n z
Si q∈ N, (a+bz) z dz est de la forme R(z,(a+bz) )dz que l’on sait calculer. Si p+q∈ N,
a+bz p p+q
alors ( ) z dz est de la même forme. Si p∈ N, on donnera ci-après une méthode
z
a+bz p p+q 39
pour calculer (a+bz)p zq dz ou ( ) z dz .
z
5) Calcul de I= R(xα1 ,xα2 , · · ·,xαp )dx où R est une fonction rationnelle de p variables et
αi ∈ Q. Poser N=ppcm(d1 , d2 , ..., dp ) où di est le dénominateur de αi . Puis poser x=tN ,
on obtient I= R(tNα1 ,tNα2 , · · ·,tNαp )NtN−1 dt (primitive de fonction rationnelle).
√ √
6) Calcul de I= R x, ax + b, cx + d dx où R est une fonction rationnelle de 3 variables.
√ t2 − b ct2 + ad − bc 2t √
Poser t= ax + b (t>0). On obtient I= R( ,t, ) dt = R1 (t, αt2 + β)dt,
a a a
où R1 est une fonction rationnelle de 2 variables dont une méthode de calcul a été donnée
plus haut.
Voilà quelques recettes que l’on trouve dans les gros traités de calcul intégral (qui en
donnent d’autres) et où l’on peut trouver également les méthodes de décomposition des
fractions rationnelles de la variable réelle en éléments simples. L’étudiant est fortement
conseillé de rechercher de tels traités sur le web ou dans les librairies. Nous allons terminer
ce chapitre par l’intégrale généralisée ou intégrale impropre (au sens de Riemann).
39
TCHEBICHEV aurait montré qu’aucun des autres cas ne peut se ramener à une fonction élémentaire.
à l’intervalle.
Supposons maintenant que I=[a,b[, a<b avec éventuellement b=+∞. Et suppososn que f
est localement intégrable sur I. On dit que f est intégrable sur I=[a,b[ ou que l’intégrale
de f sur I est convergente si lim F(x) existe et est finie, où F(x)= ax f = ax f(t)dt. Dans
x→b
x b b
ce cas, λ=lim F(x) =lim af est noté af (ou a f(t)dt) et appelé l’intégrale généralisée
x→b x→b
(ou l’intégrale impropre) de f sur I. Dans le cas contraire, on dit que l’intégrale ab f est
divergente. On définit de manière analogue ab f au cas ]a,b], −∞ ≤ a<b<+∞. Par
1
exemple, 0+∞ e−t dt converge et 0+∞ e−t dt=1, tandis que 01 dt diverge. On utilise le
t
même vocabulaire que pour les séries car on verra qu’il y a un lien avec les séries.
Supposons maintenant que I=]a,b[, −∞ ≤ a<b≤ +∞. Et suppososn que f est localement
intégrable sur I. On dit que f est intégrable sur I=]a,b[ ou que l’intégrale de f sur I est
convergente si l’intégrale de f sur ]a,c] et l’intégrale de f sur [c,b[ sont convergentes pour
un c∈]a,b[. On pose alors ab f = ac f + cb f, appelé l’intégrale généralisée (ou l’intégrale
impropre) de f sur I. Dans le cas contraire, on dit que l’intégrale ab f est divergente. Cette
définition ne dépend pas du point c choisi, car, si l’on prend un point d>c, cx f = cd f + dx f
et lim cx f =lim dx f + cd f. C.à.d. les deux limites lim cx f et lim dx f existent (ou n’existent
x→b x→b x→b x→b
pas) en même temps. De même pour x→a lim cx f et x→a
lim dx f et l’on vérifie avec Chasles que ac f
1 1
+ cb f = ad f + db f. Par exemple, 0+∞ dt diverge, −∞ +∞
2
dt converge.
t t +1
Évidemment, si f : [a,b]−→ R, est intégrable, la restriction g=f|]a,b[ est intégrable sur ]a,b[
c.à.d. l’intégrale généralisée de g sur ]a,b[ est convegrente et, en fait, ab g = ab f. Cela
découle de la continuité de l’application F(x)= cx f où c∈]a,b[ et de la relation de Chasles
pour les intégrales définies. Et précisément, la relation de Chasles est aussi vraie pour les
intégrales généralisées avec la définition suivante.
On suppose maintenant f définie sur ]a,b[ sauf en un nombre fini de points (ci )i=1,n tq −∞ ≤
a< c1 <c2 < · · · <cn <b≤ +∞. Si f est localement intégrable sur ]a,c1 [, ]cn ,b[ et sur chaque
]ci ,ci+1 [ (i=1,n), et si les intégrales généralisées de f convergent sur ces intevalles, on dit
que f est intégrable sur ]a,b[ (ou que l’intégrale généralisée de f converge sur ]a,b[), et l’on
pose ab f = ac1 f + cc12 f + · · · + ccn−1
n
f + cbn f. Avec cette définition, on déduit facilement que
les intégrales généralisées vérifient aussi la relation de Chasles.
Remarque. Généralement, l’intégrale est vraiment généralisée si la fonction f n’est pas
bornée au voisinage de b ( lim f(x) =∞, avec b<+∞) ou si b=+∞ (de même pour l’autre
x→b
extrémité de l’intervalle). Dans le cas suivant, on a une fausse intégrale généralisée.
Si f : ]a,b[ −→ R, locallement intégrable, est bornée. Alors, l’intégrale généralisée de f sur
]a,b[ est convergente.
En effet, posons g(x)=f(x) pour x∈]a,b[ et g(a)=g(b)=0 (on prolonge f à [a,b]). Montrons
que g∈ I[a,b] , auquel cas, on applique une remarque précédente car f=g|]a,b[ . Soient M= sup
x∈]a,b[
f(x) = sup g(x) et m = inf f(x) = inf g(x). Soit ε > 0, prenons α et β ∈]a,b[ tq α < β,
x∈[a,b] x∈]a,b[ x∈]a,b[
ε ε
(α−a)(M−m)< et (b−β)(M−m)< . Comme f|[α,β] ∈ I[α,β] , on peut trouver u et v∈ Eα,β
4 4 ε
tq f|[α,β] ≤ u et v≤ f|[α,β] et αβ u−v≤ . On prolonge u et v à [a,b] en posant u(x)= M
2
et v(x)=m pour x[a,α[∪]β,b]. Alors, v≤ g≤ u, ab u= aα u+ αβ u+ βb u =M(α−a) + αβ u+
M(b−β), ab v=m(α−a) + αβ v+ m(b−β). Donc, ab u−v= (M−m)(α−a)+ (M−m)(b−β)
+ αβ u−v <ε. Donc, g∈ I[a,b] .
1
Ainsi, par exemple, 0 sin(Log(x))dx est convergente.
3) Le cas suivant peut se présenter : f∈ F(]a,b[,R), −∞ ≤ a<b≤ +∞, on a une suite (ci )i=1,n
de points de ]a,b[ tq −∞ ≤ a< c1 <c2 < · · · <cn <b≤ +∞, on posera c0 =a et cn+1 =b. On
suppose f continue sur chaque ]ci ,ci+1 [ (i=0,n). On applique (n+1) fois le résultat précédent
pour chaque ]ci ,ci+1 [ et la relation de Chasles pour les intégrales généralisées.
Cependant, si l’on suppose, de plus, que il existe une fonction CONTINUE F sur ]a,b[
telle que F ′ (t)=f(t) en tout point de chaque ]ci ,ci+1 [ (i=0,n), c.à.d. que F est une primitive
de f sur chaque ]ci ,ci+1 [ (i=0,n), que F ′ (ci ) n’existe pas, mais que F est CONTINUE sur
]a,b[. Alors, ab f = lim F(x)− x→alim F(x) quand cela existe. Attention, il faut que F soit
x→b
< >
continue sur ]a,b[ pour pouvoir appliquer ce résultat, autrement il faut utiliser
la remarque précédente. La preuve utilise d’ailleurs la remarque précédente (sauf en
c0 =a et cn =b, x→c
lim F(x)= x→c
lim F(x) =F(ci ) par continuité de F sur ]a,b[).
i i
< >
soit aussi de classe C 1 ( −∞ ≤ a<b≤ +∞, −∞ ≤ α<β ≤ +∞, ϕ est croissante ici). Soit f
: ] α,β[ −→ R, localement intégrable. Alors, l’intégrale de f sur ] α,β[ converge ssi l’intégrale
de (f ◦ϕ)ϕ ′ sur ]a,b[ converge auquel cas l’on a : αβ f(x)dx = ab (f( ϕ(t))ϕ ′ (t)dt. (Au cas où
ϕ est décroissante, il y a un changement évident dans cet énoncé.)
En effet, fixons c∈]a,b[ et γ ∈]α,β[. Posons F(X)= γX f(t)dt (X∈]α,β[) et G(x)= cx (f(ϕ(t))ϕ ′ (t)dt
(x∈]a,b[). On sait que F(ϕ(x))=G(x) (changement de variable dans les intégrales définies).
Comme ϕ −1 est aussi de classe C 1 , F(X)=G(ϕ −1 (X)) (changement de variable dans l’autre
sens). Par ailleurs, par homéomorphie, x→ a ssi X=ϕ(x)→ α et x→ b ssi X=ϕ(x)→ β.
Donc, lim G(x)= lim F(X) et lim G(x)= lim F(X) et ces limites existent simultanément
x→a X→α x→b X→β
(ou n’existennt pas). D’où le théorème.
5) Intégration par parties. La formule d’intégration par parties pour les intégrales
définies (cf. proposition 7.31) se transforme ainsi.
Soient u,v : ]a,b[ −→ R de classe C 1 ( −∞ ≤ a<b≤ +∞, −∞ ≤ α<β ≤ +∞) telles
que A= x→alim u(x)v(x) et B= lim u(x)v(x) existent et sont finies. la réciproque ϕ −1 :
x→b
> <
]α,β[ −→]a,b[ soit aussi de classe C 1 . Soit f : ] α,β[ −→ R, localement intégrable. Alors,
l’existence de l’une des intégrales suivantes équivaut à celle de l’autre : ab u ′ (x)v(x)dx et
b ′ b ′ b ′
a v (x)u(x)dx. Dans ce cas, on a a u (x)v(x)dx = (B −A)− a v (x)u(x)dx.
1 1
6) Exemples. (i) 01 α dx converge ssi α < 1 et diverge si α ≥ 1. Et (ii) 1+∞ α dx
x x
1
converge ssi α > 1 et diverge si α ≤ 1. En effet, si α = 1, α admet la primitive
x
1 1 ∗ 1
F(x)= continue sur R+ , si α=1, admet la primitive F(x)=Log(x) continue
1 − α xα−1 x
1 1 1
sur R∗+ . Alors, x1 α dt= [1− α−1 ] ou −Log(x) selon que α = 1 ou α = 1. D’où le
t 1−α x
résultat en prenant les limites x→ ∞ ou 0.
7.44 Proposition. Soit f : [a,b[−→ R+ (a<b≤ +∞), localement intégrable. Pour que
b x
a f converge, il faut, et il suffit, que l’on puisse trouver M>0 tq pour tout x∈[a,b[, a f ≤
M. Lorsque ab f diverge avec les hypothèses de la proposition (f≥ 0), on écrit ab f=+∞.
Corollaire : Soient f, g : [a,b[−→ R (a<b≤ +∞), localement intégrables, telles que pour
t≥ α >a, 0≤ f(t)≤ g(t). Alors, si ab g converge, il en est de même de ab f (c.à.d., par
contraposée, si ab f diverge, il en est de même de ab fg).
Preuve : En effet, l’integrale indéfinie de f, F(x)= ax f est croissante au sens large sur [a,b[.
Donc, elle converge quand x tend vers b ssi elle est majorée. c.q.f.d.
Remarque. Généralement, le problème de convergence d’une intégrale généralisée se pose
au voisinage des extrémités de l’intervalle d’intégration. Il suffit donc de l’étudier au
voisinage de tels points.
particulier, si une fonction f localement intégrable sur [a,b[ est absolument intégrable, elle
est intégrable.
Preuve : On applique le critère de Cauchy (pr. 7.46) qui est fait pour cela. En effet, pour
u<v, | uv f| ≤ uv |f| ≤ uv g. Donc, si g vérifie le critère de Cauchy, f le vérifiera aussi (ainsi
que |f|). c.q.f.d.
Remarque. En fait, il suffit que l’inégalité |f| ≤ g soit vraie au voisinage de b (puisque les
fonctions sont localement intégrables). C.à.d. il suffit que f soit dominée par g au voisinage
de b.
7.49 Proposition. Soient f, g : [a,b[−→ R+ (a<b≤ +∞), localement intégrables tq
f∼g au voisinage de b. Alors, les intégrales ab f et ab g sont de même nature (c.à.d. elles
sont convergentes ou divergentes simultanément).
1 1 3
En effet, au voisinage de b, |f(t) − g(t)| ≤ |g(t)| c.à.d. g(t)≤ f(t) ≤ g(t). Et on
2 2 2
applique la proposition précédente.
7.50 Proposition. Soient f, g : [a,b[−→ R, g : [a,b[−→ R+ (a<b≤ +∞), localement
f(x)
intégrables tq lim =k existe et est finie. Alors,
x→b g(x)
b b
a) si ag est convergente, af est absolument convergente.
b b
b) Si k= 0 et si ag est divergente, af est aussi divergente (k peut être éventuellement ∞
dans ce b)).
f(t)
Preuve : a) Au voisinage de b, − k ≤ 1, donc |f(t)| ≤ (1+ |k|) |g(t)|= (1+ |k|) g(t),
g(t)
g(x) 1
et on applique la proposition 7.48. b) Si k= 0, lim = , et, de plus, f(t) garde un signe
x→b f(x) k
b b
constant (celui de k) car g>0. Donc, si a f converge a |f| converge aussi. Et on applique
le a). c.q.f.d.
Remarque. On aura compris que l’on peut énoncer des résultats analogues pour un
intervalle ]a,b] ou ]a,b[.
1
7.51 Applications. On prend comme fonction de comparaison g(t)=.
tα
1) Soit f : [a,+∞[−→ R, localement intégrable tq lim xα f(x)=k existe et est finie. Alors,
x→+∞
b
a) si α > 1, af est absolument convergente.
b) Si k= 0 et si α ≤ 1, ab f est divergente (k peut être éventuellement ∞ dans ce b)).
lim (x−a)α f(x)=k existe et est finie. Alors,
2) Soit f : ]a,b]−→ R, localement intégrable tq x→a
a) si α < 1, ab f est absolument convergente.
b
b) Si k= 0 et si α ≥ 1, af est divergente (k peut être éventuellement ∞ dans ce b)).
7.53 Proposition. Soit f : [a,+∞[−→ R, localement intégrable. Pour que a+∞ f(t)dt
converge, il faut, et il suffit, que pour une suite quelconque (xn )n dans [a,+∞[ tendant vers
+∞, la série [un ]n telle que un = xxnn+1 f soit convergente.
n
xn+1 xn+1 x0
En effet : up = x0 f = a f − a f et l’on applique la proposition 7.45. En pratique,
p=0
+∞
ce résultat sert pour montrer que a f(t)dt diverge, en trouvant une suite (xn )n tendant
vers +∞ tq un diverge.
7.54 Proposition. Soit f : [a,+∞[−→ R+ , localement intégrable. Pour que a+∞ f(t)dt
converge, il faut, et il suffit, de trouver une suite (xn )n dans [a,+∞[ croissante et tendant
vers +∞, telle que la série [un ]n de terme général un = xxnn+1 f soit convergente.
n
En effet : un ≥ 0. Donc, si un converge la suite sn = up est majorée par une constante
p=0
M. Alors, F(x)= ax f = ax0 f + xx0 f ≤ ax0 f + xn
x0 f = x0
a f +sn ≤ x0
a f +M, c.à.d. F(x) est majorée.
Et l’on applique la proposition 7.44.
7.55 Proposition. Soit f : [a,+∞[−→ R+ , décroissante. Pour que a+∞ f(t)dt converge,
il faut, et il suffit, que la série [vn ]n≥a de terme général vn =f(n) soit convergente. En cas
de divergence, a+∞ f(t)dt =+∞.
En effet : D’abord, f étant ց est localement intégrable. On prend xn =n, (xn )n est ր +∞.
Posant un = xxnn+1 f, on a 0≤ vn+1 ≤ un ≤ vn (f(n+1)≤ f(t)≤ f(n) si t∈[n,n+1]). Donc, si
vn converge ssi un converge. Et un converge ssi ab f converge (proposition précédente).
Ce théorème est à rapprocher avec le “Test intégral” (cf. pr. 4.31). Application : séries de
1 1
Riemann α et séries de Bertrand α β .
n n log n
Il y a beaucoup de choses à dire sur les intégrales généralisées, surtout les relations entre
séries et intégrales généralisées, mais c’est du niveau de deuxième année de faculté. Voyez
sur le net ou dans les livres.
Math 102
Cours élémentaire
d’Analyse
Alain RALAMBO
2012