Gradient
opérateur différentiel représentant le champ vectoriel des variations d'une fonction vectorielle à valeurs scalaires
En mathématiques et en physique, le gradient d'une fonction de plusieurs variables est un
champ de vecteurs qui combine en chaque point les différentes dérivées partielles et donne ainsi
à la fois la direction de la variation la plus forte1 localement et l’intensité de cette variation. Pour
une fonction représentant l’altitude, il suit les lignes de plus grande pente (dans le sens de la
montée), avec une norme égale à cette pente. Lorsque la fonction ne dépend que d’une seule
variable réelle, le gradient se confond avec la dérivée usuelle, comme en météorologie où le
gradient de température est assimilé au taux de variation de la température selon l'altitude2.
Cet article ne cite pas suffisamment ses sources (juillet 2023).
Deux exemples de champs scalaires
représentés en tons de gris plus foncés
pour les valeurs les plus hautes, et les
gradients représentés par des flèches
bleues : chacune pointe dans la direction
où le champ scalaire croît le plus vite.
2
La fonction de deux variables f(x, y) = xe−(x
+ y 2)
est représentée ici par une carte
thermique montrant les valeurs les plus
élevées avec des couleurs chaudes, avec
son gradient représenté par les flèches
bleues : chacune pointe dans la direction
où la température croît le plus vite.
Le gradient d’une fonction f est noté grad(f) ou avec l’opérateur nabla , parfois avec des
flèches suscrites.
En chaque point où il est défini, le produit scalaire avec le gradient constitue la différentielle de la
fonction, c’est-à-dire la partie linéaire de son développement limité à l’ordre 1. Par exemple, pour
une fonction de trois variables admettant des dérivées partielles en un point a, pour une petite
variation h = (h1, h2, h3), on trouve
Cette méthode permet d'approcher localement une fonction de plusieurs variables par une forme
linéaire.
La notion s’étend aux fonctions réelles définies sur une variété riemannienne.
Le gradient est toujours orthogonal aux lignes de niveau ou aux isosurfaces. Il permet aussi
d’exprimer des conditions d’optimisation sous contrainte et intervient dans des méthodes
d’analyse numérique pour obtenir des suites minimisantes.
Motivation
En physique et en analyse vectorielle, le gradient est un vecteur indiquant comment une grandeur
physique varie dans l'espacea. Le gradient est d'une importance capitale en physique, qui
l'employa avant les autres disciplines. En théorie des variations, il est aussi fondamental dans le
domaine de l'optimisation ou de la résolution d'équations aux dérivées partielles.
En sciences de la Terre, le gradient est utilisé pour la variation dans toutes les directions d'un
paramètre de la lithosphère, de l'hydrosphère, de l'atmosphère, ou de la biosphère. Cependant, le
terme est souvent employé pour la composante dans une seule direction, comme dans le cas de
la dérivée verticale d'une grandeur physique, c.-à-d. sa dérivée par rapport à la coordonnée
(altitude ou profondeur). Par exemple, le gradient géothermique est la dérivée fois , où
est la température et un vecteur unitaire vertical.
Définition
Le champ scalaire f(x,y) = −(cos2x +
cos2y)2 est représenté par la nappe orange.
Le gradient de f est un champ vectoriel,
représenté par les flèches bleues ; chacune
pointe dans la direction où f croît le plus
vite.
Dans un système de coordonnées cartésiennes euclidien, le gradient d'une fonction f
différentiable au point est le vecteur noté de composantes les
(où i = 1, 2, ..., n)3, c.-à-d. les dérivées partielles de f par rapport aux coordonnées4,5, au
point a :
Dans un repère orthonormé, si le vecteur gradient n'est pas nul, alors il pointe dans la direction
où la fonction croît le plus rapidement, et sa norme est égale au taux de croissance dans cette
direction.
Les composantes du gradient de f sont les coefficients des variables dans l'équation réduite de
l'espace tangent au point a au graphe de f. Cette propriété lui permet d'être défini
indépendamment du choix du système de coordonnées, en tant que champ de vecteurs dont les
composantes se transforment lors du passage d'un système de coordonnées à un autre.
La généralisation du gradient aux fonctions différentiables de plusieurs variables et à valeurs
vectorielles (et aux applications différentiables entre espaces euclidiens) est la matrice
jacobienne. La généralisation aux fonctions entre espaces de Banach est la dérivée de Fréchet.
Notations
Notation vectorielle
La dérivée ou différentielle d'une fonction f en un point a est généralement notée :
f'(a) ou Df(a) ou ou ou
ou, abusivement puisqu'elle n'est pas infinitésimale :
df(a) ou ou
Le gradient d'une fonction f en un point a est généralement noté :
ou ou ou .
Le symbole ∇ est appelé nabla. Dans la littérature en anglais, ou parfois en français par
commodité typographique, on préfère mettre en gras le symbole du gradient pour signifier son
caractère vectoriel :
ou ∇f.
Notation tensorielle
En notation tensorielle, le vecteur position , contravariant, s'écrit (indice en position
supérieureb, variant de 1 au nombre de dimensions de l'espace). Le gradient d'un champ
scalaire , écrit en notation tensorielle, est covariant et s'écrit donc (indice en
position inférieure). La définition du gradient s'écrit alors6 :
Avec la convention de sommation d'Einstein, la variation infinitésimale de s'écrit :
Exemple : le gradient de température
Le gradient de température, ou gradient thermique, est le gradient de la température en tant que
fonction scalaire des coordonnées spatiales (lui est une fonction vectorielle de ces
coordonnées).
Gradient dans une seule direction (dérivée)
Supposons que l'on place une poutre rectiligne entre deux murs qui n'ont pas la même
température, le mur de gauche étant le plus froid. On observe que, sur la poutre, la température
varie dans le temps, et dans l'espace : elle augmente de la gauche vers la droite. À ce
phénomène thermodynamique, on associe un phénomène de flux de chaleur, lui-même lié à un
gradient de température, c.-à-d. à une variation de la température le long de la poutre (cf.
Conduction thermique, Loi de Fourier).
À un instant fixé, à chaque point M de la poutre, on attribue une abscisse x ; par exemple, à
l'extrémité gauche, l'abscisse x = 0, et à l'extrémité droite, l'abscisse x = L (longueur de la poutre).
En chaque point M(x) de la poutre, on considère la température T(x) ; autrement dit, T est
fonction de x.
Entre deux points distants d'une très petite longueur δx, on mesure un écart de température δT.
Au sens usuel, le gradient (de température) est le rapport entre ces deux grandeurs :
Au sens analytique (mathématique), on parle de gradient si ce rapport admet une limite quand δx
tend vers 0, limite notée :
On écrit la variation le long de x comme l'approximation (dite du premier ordre) :
où signifie que le terme qui reste est négligeable par rapport à
Propriétés
Le rapport a un signe, qui correspond à un sens. Dans notre poutre, la température
augmente de gauche à droite, donc le gradient est orienté vers la droite ; l'axe des x aussi est
orienté de gauche à droite, donc
En dimension 1, les notions de gradient et de dérivée sont équivalentes.
En physique, la norme de ce gradient est homogène à une température divisée par une
distance (mesurée en K·m−1, ou plus usuellement en °C·m−1).
Gradient de température dans l'espace à trois dimensions usuel
En réalité, la température d'un point de la poutre varie en fonction d'un déplacement dans
l'espace. On caractérise un point M de l'espace par ses coordonnées cartésiennes : M(x , y , z).
« Comme » précédemment, la température est fonction des coordonnées de M : T(x , y , z).
Pour chacune de ces directions, on peut écrire une variation, dite partielle. Si, tout en étant en 3D,
on ne se déplace que selon un axe, par exemple selon les ordonnées y, alors on peut réécrire la
même formule que précédemment sur l'accroissement de température. Cependant, pour noter la
variation, on passe par l'écriture en dérivée partielle (dite ronde) plutôt que par la dérivée
unidimensionnelle (dite droite). On écrit la variation le long de y comme l'approximation (dite du
premier ordre) :
où signifie que le terme qui reste est négligeable par rapport à
Plus généralement, on se déplace dans l'espace d'un point M(x , y , z) à un point M'(x + δx , y + δy ,
z + δz), et la température passe de T(x , y , z) à T(x + δx , y + δy , z + δz). En première
approximation, cette variation est une fonction linéaire de
, et s'exprime donc comme somme algébrique des
variations liées à chacune des composantes de
où signifie que le terme qui reste est négligeable par rapport à
Soit le vecteur gradient de
température. On peut alors réécrire la relation précédente sous la forme :
où « » désigne le produit scalaire usuel sur
Propriétés
Le gradient est un vecteur de même dimension que l'espace sur lequel porte la température
(ici ℝ3), alors que la température est à valeurs scalaires (c.-à-d. que la température en un point
est un nombre, pas un vecteur).
La direction du (vecteur) gradient définit de nouveau la direction du plus froid au plus chaud,
mais cette fois en 3D.
La norme du gradient de température est toujours homogène à K m−1.
Introduction par les éléments différentiels
Comme pour la différentielle dont il est une variante, le gradient peut être introduit avec le
vocabulaire des éléments différentiels. À titre d'exemple, examinons le problème de la variation
de l'aire d'un rectangle.
Dans le plan (xOy), considérons un rectangle de côtés x et y. Sa surface S est égale à xy ; elle
dépend donc des coordonnées du point M(x,y). En suivant une démarche intuitive, on convient de
noter par dx (resp. dy) une variation infinitésimale de la variable x (resp. y). Lorsque le point M
fait un déplacement infinitésimal, la surface varie de façon infinitésimale, et on peut écrire que :
On en déduit facilement que :
Une simple application numérique où x et y seraient des mètres et dx et dy des centimètres
illustre que dx dy est négligeable par rapport aux autres grandeurs.
On peut donner un statut mathématique précis aux notations dx et dy (qui sont des formes
différentielles), et à la quantité dx dy (qui est alors du second ordre). Le calcul précédent est en
fait un calcul de développement limité à l'ordre 1, faisant intervenir les dérivées premières de la
fonction xy par rapport à ses deux variables. En négligeant dx dy, on obtient donc :
où
Bien sûr, on peut utiliser des notations un peu différentes :
où
Lignes de niveaux 1 et 2 de la fonction
, avec les tangentes et les
gradients en (2;1/2) et (1;2). Les directions
des tangentes sont celles de variation
nulle ; les directions des gradients sont
celles de variation maximale.
L'intérêt d'introduire ces vecteurs pour exprimer la variation d'une fonction de plusieurs variables
est de montrer que :
la fonction varie le plus si le point se déplace dans la direction du vecteur gradient ;
elle ne varie presque pas s'il se déplace dans toute direction perpendiculaire au gradient.
En effet : « c.-à-d. »
En électrostatique, ceci donne les courbes de même potentiel : les « équipotentielles ».
En mathématiques pures
Gradient dans un espace euclidien
Contexte
Soient E un espace vectoriel euclidien, U un ouvert de E, et une fonction ,
différentiable en un point a de U. On note la différentielle en a de f ; c'est une forme linéaire
sur E. On note l'image par cette différentielle d'un vecteur h de E.
Existence et unicité
Si est muni d'un produit scalaire il existe, d'après le théorème de représentation de Riesz, un
unique vecteur A tel que pour tout vecteur h de E, , où désigne le
produit scalaire sur E.
Le vecteur A est appelé le gradient de f en a, et il est noté . Il vérifie donc :
Développement limité
Si une application est différentiable en un point a, alors on peut écrire le
développement limité de f du premier ordre au voisinage de a (avec la notation de Landau)7:
Expression canonique : avec dérivées partielles
Puisque le gradient est lui-même un vecteur de E, il est naturel qu'on cherche à l'exprimer dans
une base orthonormée de cet espace vectoriel. On démontre qu'il s'exprime à
l'aide des dérivées partielles sous la forme :
Par exemple, en dimension 3, on obtient :
Une propriété fondamentale
Le gradient de f désigne la direction où la pente de f est la plus grande. Précisément4 :
Soit un point tel que f est différentiable en a et que pour tout vecteur
tel que il existe tel que :
Gradient et dérivée directionnelle
Articles détaillés : Opérateur différentiel gradient et Dérivée directionnelle suivant un vecteur.
Changement de paramètres
Soit une fonction de classe C1. Un changement de paramètres
consiste à introduire un difféomorphisme , où n est la
dimension de E. On exprime alors le gradient de f dans une base de E, dite locale, formée des
vecteurs , les dérivées partielles étant celle de la fonction composée par rapport aux
. Si la base locale est orthogonale, on préfère généralement utiliser la base orthonormée
associée, obtenue en divisant chaque vecteur de la base locale par sa norme euclidienne.
C'est ainsi que le passage dans le plan en coordonnées polaires permet d'exprimer le gradient en
fonction des dérivées partielles de la fonction composée f(r,θ) par rapport à l'abscisse polaire (r)
et à l'argument (θ), la base utilisée étant constituée du vecteur radial unitaire et de son
orthogonal.
En dimension 3, on obtient ainsi les formules suivantes :
En coordonnées cylindriques (pour les coordonnées polaires, ne pas considérer la
composante en z) :
qu'on peut aussi noter :
tout dépend des notations utilisées. Voir :
En coordonnées sphériques :
les vecteurs de type sont utilisés en coordonnées polaires.
Gradient dans un espace de Hilbert
Soient un espace de Hilbert (de dimension finie ou non), U un ouvert de H, et une
application , différentiable en un point a de U. La différentielle Df(a) étant, par
définition, une forme linéaire continue sur H, il résulte du théorème de représentation de Riesz
qu'il existe un unique vecteur, noté , de H tel que :
Le vecteur est appelé le gradient de f en a.
Une propriété fondamentale
On montre que si , alors f croît strictement dans la direction de en passant
par a, c.-à-d. :
Il existe tel que pour tous s et t de
Gradient dans une variété riemannienne
On peut encore étendre cette définition à une fonction définie et différentiable sur une variété
riemannienne (M,g). Le gradient de f en a est alors un vecteur tangent à la variété en a, défini par :
Enfin, si f est un champ scalaire indépendant du système de coordonnées, c'est un tenseur
d'ordre 0, et sa dérivée partielle est égale à sa dérivée covariante :
En coordonnées contravariantes, on calcule le champ de vecteurs appelé gradient de f :
Cette formule permet, une fois établi le tenseur métrique, de calculer facilement le gradient dans
tout système de coordonnées.
Propriétés géométriques en dimension 2 ou 3
Classiquement, le gradient permet de définir la « normale aux courbes de niveau », ce qui se
traduit en 2D et en 3D par des propriétés géométriques intéressantes. La propriété de tangence
étant liée à la convexité/concavité, il est aussi intéressant de voir le lien qui existe entre gradient
et convexité, toujours en 2D ou 3D.
En dimension 2 : gradient normal à une courbe en un point, droite tangente
Soient une application continûment différentiable, et une courbe définie par
l'équation f(u) = k, où k est une constante. En un point v donné de cette courbe, si le gradient
existe et s'il n'est pas nul, alors il donne la direction de la normale en v à la courbe ; la droite
tangente en v à la courbe est alors orthogonale au gradient.
Application au traitement d'image
[à recycler]
Une image est en fait une fonction de deux variables, notée p(x,y) ; chaque couple de valeurs
entières de (x,y) constitue un pixel de l'image, et pour une image en noir et blanc, la valeur prise
p(x,y) est appelée "niveau de gris" du pixel. En pratique, il est indispensable d'estimer "la droite
tangente à la courbe", même si la fonction p n'est pas analytique (p est en général inconnue) et
n'est pas différentiable au point (pixel) d’intérêt. On calcule numériquement les deux gradients
notés gx et gy suivant x et y, par exemple avec les formules du 2e ordre, qui font appel à
seulement 2 pixels chacun pour le calcul et ne force [?donc pas?] à supposer alors qu'il n'y a pas
de bruit dans l'image.
La fonction p n'étant pas analytique et ses valeurs numériques étant connues uniquement en des
points discrets (les pixels voisins), on peut utiliser diverses formules pour estimer le mieux
possible ces gradients de l'image. Par exemple, le filtre de Prewitt permet, en utilisant la
proximité des autres pixels de l'image (3 par 3, soit 9 pixels en tout), d'évaluer les gradients gx et
gy du pixel d’intérêt, situé au centre par convention du filtre. [réf. souhaitée]
Ayant repéré dans une image donnée les pixels de forts gradients, on peut s'en servir d'amers,
c.-à-d. de points particuliers reconnaissables (notés dans une carte, par exemple) permettant de
se situer dans l'espace, donc de recaler sa navigation. Les gradients gx et gy sont les
composantes du vecteur gradient ; on peut calculer l'angle entre l'axe (Ox) et ce vecteur. Il est
alors possible de recaler des angles de prise de vue ; c'est très utile pour le pilotage/guidage des
drones aériens, par exemple.
En dimension 3 : gradient normal à une surface en un point, plan tangent
Soient une application continûment différentiable, et une surface définie par
l'équation f(u) = k, où k est une constante. En un point v donné de cette surface, si le gradient
existe et s'il n'est pas nul, alors il donne la direction de la normale en v à la surface ; le plan
tangent en v à la surface est alors orthogonal au gradient.
Gradient et convexité
Soient (par exemple, n = 2 ou n = 3), et une application continûment
différentiable. Si l'application est monotone (resp. strictement monotone),
alors f est convexe (resp. strictement convexe), c.-à-d., en utilisant la caractérisation par les
cordes :
Cette propriété est intéressante parce qu'elle reste valable même si f n'est pas deux fois
différentiable.
Si f est deux fois différentiable, le hessien est positif si et seulement si le gradient est monotone.
Cas de la dimension 1
La monotonie telle que définie ci-dessus permet de définir une fonction dérivée croissante ou
décroissante au sens usuel. Dans le premier cas, on parle de fonction convexe ; dans le second,
de fonction concave.
Si la fonction est deux fois dérivable, la croissance de la dérivée (donc du gradient) est assurée
par la positivité de la dérivée seconde (équivalent du hessien).
Relations vectorielles
Cette section ne s'appuie pas, ou pas assez, sur des sources secondaires ou tertiaires
indépendantes du sujet. Le texte peut contenir des analyses inexactes ou inédites de
sources primaires.
Pour l'améliorer, ajoutez-en, ou placez des modèles {{Source secondaire souhaitée}} ou
{{Source secondaire nécessaire}} sur les passages mal sourcés. (avril 2023)
En analyse vectorielle, le gradient peut être combiné à d'autres opérateurs : divergence (div),
rotationnel (rot), laplacien (Δ). Soit f une fonction décrivant un champ scalaire, que l'on suppose
de classe C2 par rapport à chaque paramètre ; alors :
Notes et références
Notes
a. Autrement dit, quand une grandeur physique dépend aussi de variables non spatiales (par
exemple, le temps), on ne tient compte dans le calcul du gradient que des variables
spatiales.
b. Malgré cette position supérieure, il s'agit bien d'un indice et non d'un exposant. Il n'y a
généralement pas de confusion possible mais, en cas de besoin, toute expression élevée à
une puissance est mise entre parenthèses.
Références
1. « Gradient ([Link] [archive] », sur [Link] (consulté le
3 août 2023)
2. « Gradient ([Link] [archive] », sur
[Link]
3. Nathalie Mayer, « Définition | Gradient | Futura Sciences ([Link]
ciences/definitions/physique-gradient-15141/) [archive] », sur Futura (consulté le 3 août 2023)
4. « Gradient ([Link]
l) [archive] », sur [Link] (consulté le 3 août 2023)
5. (en) « Gradient | Definition & Facts | Britannica ([Link]
nt-mathematics) [archive] », sur Encyclopædia Britannica, 23 juin 2023 (consulté le 3 août 2023)
6. (en) Leonard Susskind et André Cabannes, General Relativity. The Theoretical Minimum, New
York, Basic Books, janvier 2023, 373 p. (ISBN 9781541601772 et 9781541601796), p. 43-44.
7. Jacqueline Lelong-Ferrand et Jean-Marie Arnaudiès, Cours de mathématiques : Analyse, t. 2,
Dunod, 1977, p. 181
Voir aussi
Bibliographie
(en) Serge Lang, Fundamentals of Differential Geometry, Springer
(en) Barrett O'Neill, Elementary Differential Geometry, 2e éd. révisée (ISBN 9780120887354)
Articles connexes
Nabla
Algorithme du gradient
Analyse vectorielle
Dérivée directionnelle
Gradient projeté
Opérateur laplacien
Théorème du gradient
Portail de l'analyse