Fon tions onvexes
Fi he
12
I DÉFINITIONS ET PROPRIÉTÉS s’écrit
ϕ(x)−ϕ(t) 6 λ ϕ(u) − ϕ(t) = λ ϕ(u) − ϕ(x) + ϕ(x) − ϕ(t)
DÉFINITION 1 Soit I est un intervalle de R. Soit ϕ est une
fonction définie sur I et à valeurs dans R, on dit que ϕ est c’est-à-dire
une fonction onvexe si
(1 − λ) ϕ(x) − ϕ(t) 6 λ ϕ(u) − ϕ(x)
et donc, après simplification,
∀(x, y) ∈ I2 ∀λ ∈ ]0 ; 1[
ϕ(t) − ϕ(x) ϕ(u) − ϕ(x)
ϕ (1 − λ)x + λy 6 (1 − λ) ϕ(x) + λ ϕ(y). 6 .
t−x u−x
On dit que ϕ est stri tement onvexe si l’inégalité ci- u−t
• 3e cas : t < u < x On pose λ := de sorte que... etc.
dessus est stricte dès que x 6= y. x−t
On dit que ϕ est on ave si −ϕ est une fonction convexe.
Supposons maintenant la fonction px croissante, et ce pour
ϕ(u) toute valeur de x.
Soient x < y < z, on applique la croissance de px entre y
et z, ce qui montre l’inégalité de convexité cherchée.
On en déduit, pour toute fonction convexe, la double
inégalité des pentes illustrée ci-dessous : si x < y < z,
alors on a les inégalités des pentes p1 6 p2 6 p3 .
(1 − λ) f (x) + λ f (y)
f (z) ϕ(u)
u p2
x z y A
↑
= (1 − λ)x + λy p3
p1
B
z−x
LEMME 12.1 z = (1 − λ)x + λy ⇐⇒ λ = .
y−x x y z
u
1
Exemple pour λ = 3
: x z y Fig. 12.1 — A est au-dessus de B, donc p1 6 p2 d’une part,
et p2 6 p3 d’autre part.
I.a Cara térisation par la pente
THÉOREME 12.2 ϕ : I → R est convexe si, et seulement I.b Cara térisation par la dérivée
si, pour tout x ∈ I, la fonction px : I r {x} → R qui à t THÉOR EME 12.3 Soit ϕ : I → R une fonction dérivable.
associe la pente de la corde entre les points d’abscisses x Alors ϕ est convexe si et seulement si ϕ′ est croissante ;
et t : ϕ est strictement convexe si et seulement si ϕ′ est stricte-
ϕ(t) − ϕ(x)
px : t 7−→ ment croissante.
t−x
est croissante. Démonstration : Supposons ϕ convexe.
❏ Soient x < z dans I. Choisissons un point y tel que
Démonstration : Supposons ϕ convexe. Soient t < u ∈ I r {x}. x < y < z. Par inégalité de pentes puis passage à la limite,
t−x on obtient
• 1er cas : x < t < u On pose λ := de sorte que
u−x
ϕ(u)
t = (1 − λ) x + λu.
L’inégalité de convexité ϕ(t) 6 (1 − λ) ϕ(x) + λ ϕ(u) s’écrit
ϕ(t) − ϕ(x) 6 λ ϕ(u) − ϕ(x)
q
ou encore, en reprenant la définition de λ, p
ϕ(t) − ϕ(x) ϕ(u) − ϕ(x)
6
t−x u−x u
x y z
c’est-à-dire px (t) 6 px (u).
x−t ϕ′ (x) 6 p 6 q 6 ϕ′ (z). ❏
• 2e cas : t < x < u On pose λ := de sorte que
u−t Ainsi, ϕ′ est croissante.
u−x
1−λ = et Supposons ϕ strictement convexe. On obtient avec
u−t
les mêmes notations
x = (1 − λ) t + λu
ϕ′ (x) 6 p < q 6 ϕ′ (y)
L’inégalité de convexité
et donc la stricte croissance de ϕ′ .
ϕ(x) 6 (1 − λ) ϕ(t) + λ ϕ(u) Supposons ϕ′ croissante.
Fiches de Mathématiques, Math Spé MP** Walter Appel LaTeX/MP/Fiches/f-convexe.tex
fonctions convexes
❏ Soient x, z ∈ I et λ ∈ ]0 ; 1[. On pose y = λx + (1 − ϕ(u)
λ)z. Alors il existe c ∈ ]x ; y [ et d ∈ ]y ; z [ tels que
ϕ(y) − ϕ(x) ϕ(z) − ϕ(y)
= ϕ′ (c) et = ϕ′ (d)
y−x z−y
Puisque ϕ′ (d) > ϕ′ (c), on en déduit, toujours d’après la re- M
marque préliminaire, que
ϕ λx + (1 − λ)z 6 λϕ(x) + (1 − λ) ϕ(z). ❏ u
xM
Ainsi, ϕ est convexe.
THÉOREME 12.7 (Continuité) Toute fonction convexe est
COROLLAIRE 12.4 Si ϕ est deux fois dérivable, alors ϕ
continue en tout point qui n’est pas une extrémité de I.
est convexe si et seulement si ϕ′′ > 0.
LEMME 12.8 Soit f : I → R tel que ϕ 6 f 6 ψ, f (a) =
II INÉGALITÉS UTILES ϕ(a) = ψ(a), ϕ et ψ continues. Alors f est continue en a.
PROPOSITION 12.5 (Pentes) Soit f : I → R une fonction Démonstration : Immédiat avec un dessin, ou des ε.
convexe. Alors pour tous points x < y < z de I, on a Démonstration du théorème de continuité : ❏ Soit x un
point de I.
ϕ(y) − ϕ(x) ϕ(z) − ϕ(x) ϕ(z) − ϕ(y)
6 6 . Notons h : t 7→
ϕ(t) − ϕ(x)
: c’est une fonction croissante.
y−x z−x z−y t−x
On fixe maintenant deux réels y, z ∈ I tels que y < x < z
Si l’on note p1 , p2 et p3 les pentes des cordes correspon- (c’est possible car I est ouvert).
dantes, on a l’inégalité La fonction h est croissante sur I∩[y ; z ], majorée par h(z)
et minorée par h(y). On en déduit que, pour tout t ∈ [y ; z ],
p1 6 p2 6 p3 on a
ϕ(t) − ϕ(x)
h(y) 6 6 h(z)
et le graphe ci-dessous : t−x
soit
ϕ(u) (t − x) h(x) 6 ϕ(t) − ϕ(x) 6 h(x) (t − x).
Les deux membres de gauche tendent vers 0 lorsque t tend
vers x : le théorème d’encadrement montre alors que ϕ est
p2 continue en x. ❏
Ainsi, ϕ est continue en tout point intérieur à I.
p1 p3
On peut aller un peu plus loin :
u THÉOR EME 12.9 (Régularité (HP !)) Soit ϕ : I → R une
x y z
fonction convexe. Alors
i) ϕ est localement lipschitzienne sur l’intérieur de I ;
THÉOREME 12.6 (Tangentes et ordes) Soit ϕ une fonc- ii) ϕ est dérivable à droite et à gauche en tout point in-
tion convexe sur I. térieur à I ;
i) Soient A et B deux points du graphe de ϕ. Alors, le iii) les dérivées à gauche et à droite sont des fonctions
graphe est croissantes ;
iv) pour tout points x intérieur à I et tout h suffisamment
• au-dessous de la corde (AB) entre les abscisses xA
petit,
et xB ;
• au-dessus de la corde (AB) en dehors de l’inter- ϕ′d (x − h) 6 ϕ′g (x) 6 ϕ′d (x) 6 ϕ′g (x + h).
valle [xA ; xB ].
v) ϕ est dérivable en x intérieur à I si et seulement si
ϕ(u) ϕ′d est continue en x (de même avec ϕ′g ).
vi) L’ensemble des points en lesquels ϕ n’est pas dérivable
B est au plus dénombrable.
A
III INÉGALITÉS GÉNÉRALISÉE
u
THÉOR
xA xB
EME 12.10 (Inégalité dis r
ete de Jensen) Soit ϕ
ii) Soit M un point du graphe de f ; on suppose de plus une fonction convexe dfinie sur un intervalle I.
que f est dérivable en xA , ce qui signifie que son Pour tout n ∈ N tel que n > 2, pour tout n-uplet
n
graphe admet une tangente en M. Alors le graphe de f (x1 , . .n. , xn ) ∈ I et pour tout n-uplet (λ1 , . . . , λn ) ∈
est, partout, au-dessus de la tangente en M. ]0 ; 1[ tel que λ1 + · · · + λn = 1, on a
n
! n
X X
ϕ λi xi 6 λi ϕ(xi ).
i=1 i=1
Fiche 12 Cours de Mathématiques, Math Spé MP**
fonctions convexes
Démonstration : On démontre cette propriété par récurrence Si σn = (ξ0 , ξ1 , . . . , ξn ), on a alors
sur n. n
P
• La propriété au rang n = 2 est la définition de la n b−a g(ξk ) ρ(ξk )
X (n) k=0
convexité. λk g(ξk ) = n
·
b−a n
P
• Soit n ∈ N n > 2 et supposons la propriété établie k=0 n ρ(ξk )
aux rangs 2, . . . , n. k=0
n+1
Rb Z
P g(x) ρ(x) dx b
Soient λ1 , . . . , λn+1 des réels de ]0 ; 1[ tels que λ1 = 1. a
−−−−→ Rb = g(x) ρ(x) dx
n→∞
a ρ(x) dx
i=1 a
Posons
n
tandis que, de la même manière,
X
Λ := λi = 1 − λn+1 . n
X
Z b
(n)
i=1 λk ϕ g(ξk ) −−−−→ ϕ g(x) ρ(x) dx.
n→∞ a
k=0
Si Λ = 0 la propriété est triviale, sinon on pose
Composons le premier membre par ϕ et appliquons l’inégalité
n
1 X de Jensen discrète :
x= λi xi . !
Λ i=1 Xn Xn
(n) (n)
ϕ λk g(ξk ) 6 λk ϕ g(ξk ) .
On a alors k=0 k=0
n
!
X Par continuité de ϕ, on peut passer la limite, qui donne l’in-
ϕ λi xi + λn+1 xn+1 = ϕ (1 − λn+1 ) x + λn+1 xn+1
égalité voulue.
i=1
6 (1 − λn+1 ) ϕ(x) + λn+1 ϕ(xn+1 )
| {z } Deuxième méthode
=Λ
On commence par montrer un lemme technique :
d’après la propriété au rang 2, donc
n+1
! n
!
X 1 X onvexes) Soit
LEMME 12.12 (Cara térisation des fon tions
ϕ λi xi 6 Λ ϕ λi xi + λn+1 ϕ(xn+1 ) ϕ : I → R une fonction convexe sur un intervalle ouvert I.
i=1
Λ i=1
Si l’on note A l’ensemble des fonctions affines h : I → R
n
X λi vérifiant h 6 ϕ, alors A est non vide et
6Λ ϕ(xi ) + λn+1 ϕ(xn+1 )
i=1
Λ ∀t ∈ I ϕ(t) = sup h(t). (∗)
h∈A
n+1
X
= λi ϕ(xi )
En effet, en tout point t (intérieur à I par la force des choses),
i=1
une tangente à droite (ou à gauche, si vous préférez) existe,
d’après la propriété au rang n, ce qui établit la propriété au et fournit la fonction affine cherchée (la borne supérieure est
rang n + 1. donc en réalité un maximum).
• Le principe de récurrence permet de conclure que la On remarquera que la réciproque est vraie (mais inutile
propriété est vraie pour tout n > 2. ici) : une fonction vérifiant (∗) est toujours convexe : en effet,
le sup d’une famille de fonctions convexes est convexe.
Venons-en à la démonstration du théorème proprement
Cette inégalité se généralise au cas intégral, et admet dit.
également une interprétation probabiliste : Fixons momentanément h ∈ A. Alors h est de la forme
h : t 7→ at + b et, puisque ρ > 0 et h 6 ϕ
THÉOREME 12.11 (H.P. : Inégalité de Jensen intégrale) Z
Z
ϕ g(x) ρ(x) dx > h g(x) ρ(x) dx
Soit ϕ une fonction convexe sur un intervalle ouvert I. J J
Z
Soient ρ et g deux fonctions continues, définies sur un =
a g(x) + b ρ(x) dx
intervalle J de R et à valeurs réelles. R J
Z Z
On suppose que ρ est positive sur J, que J ρ(x) dx = 1 = a g(x) ρ(x) dx + b ρ(x), dx
(on dit que ρ est une fon tion de poids). On suppose de Z
J J
plus que g est à valeurs dans I. On a alors l’ inégalité de = a g(x) ρ(x) dx + b
Jensen généralisée : Z
J
Z Z =h g(x) ρ(x) dx .
J
ϕ g(x) ρ(x) dx 6 ϕ g(x) ρ(x) dx. | {z }
=:t
J J
Ceci étant vrai pour toute fonction h ∈ A, si l’on passe à
Démonstration : On propose deux méthodes, la première utli- la borne supérieure, et en utilisant la caractérisation (∗), on
sant des sommes de Riemann, la seconde une caractérisation obtient
remarquable des fonctions convexes. Z
Z
ϕ g(x) ρ(x) dx > ϕ g(x) ρ(x) dx ,
J J
Première méthode
ce qui est l’inégalité désirée.
On suppose ici que J = [a ; b] est un segment. (La géné-
ralisation à un intervalle quelconque est un peu technique
mais ne s’éloigne pas des idées contenues ici.) Par un simple THÉOREME 12.13 (Inégalité probabiliste de Jensen)
changement de variable affine, il suffit de montrer le résultat Soit X une variable aléatoire prenant un nombre fini ou
pour le cas J = [a ; b]. dénombrable de valeurs. Alors
On prend une suite de subdivisions (σ(n) )n∈N régulières.
ρ(ξi )
(n)
On pose λi = n , et on remarque que ϕ E(X) 6 E ϕ(X) .
P
ρ(ξk )
k=0 Démonstration : La caractérisation d’une fonction convexe
n−1
comme sup de fonctions affines est encore une fois redou-
P (n)
λi = 1. tablement efficace ici.
k=0
Cours de Mathématiques, Math Spé MP** mercredi er septembre
fonctions convexes
IV APPLICATION AU LOGARITHME
On retiendra que, la fonction ln étant concave (c’est-à-
dire que − ln est convexe), on a les formules suivantes.
Pour tout couple (x, y) ∈ (R∗+ )2 et tout λ ∈ ]0 ; 1[ :
ln λx + (1 − λ)y > λ ln(x) + (1 − λ) ln(y).
L’inégalité n’est une égalité que si x = y.
Le graphe de la fonction logarithme est situé sous sa
tangente au point (1, 0) ; notamment, pour tout x > −1,
ln(1 + x) 6 x.
0 x
0 1
−1
Enfin, l’inégalité de Jensen s’écrit : pour tous
x1 , x2 , . . . , xn strictement positifs, et pour tous
n
P
λ1 , λ2 , . . . , λn ∈ ]0 ; 1[ tels que λk = 1 :
k=1
n
! n
X X
ln λi xi > λi ln(xi ).
k=1 k=1
L’inégalité précédente n’est une égalité que si
x1 = · · · = xn .
En choisissant des poids équilibrés (λ1 = · · · = λn =
1/n), on obtient l’inégalité arithméti o-géométrique clas-
sique :
THÉOREME 12.14 (Inégalité arithméti o-géométrique)
Soient x1 , x2 , . . . , xn des réels strictement positifs. Alors
leur moyenne géométrique est inférieure à leur moyenne
arithmétique :
√ x1 + x2 + · · · + xn
n
x1 x2 · · · xn 6 .
n
Fiche 12 Cours de Mathématiques, Math Spé MP**