Gradient

Le gradient d'une fonction de plusieurs variables en un certain point est un vecteur qui caractérise la variabilité de cette fonction au voisinage de ce point. Défini en tout point où la fonction est différentiable, il définit un champ de vecteurs, également dénommé gradient. Le gradient est la généralisation à plusieurs variables de la dérivée d'une fonction d'une seule variable.

Représentation du gradient d'un champ scalaire. Les gradients sont les flèches bleues qui indiquent là où la fonction croit le plus. Les valeurs vont du blanc (valeur faible) à noir (valeur élevée).

Le gradient de la fonction à deux variables f(x, y) = xe^{−(x² + y²)} est représenté par les flèches bleues. La fonction représente une température (bleu = valeur faible = froid, rouge = valeur élevée = chaud). Les flèches vont là où ça chauffe le plus.

Motivation

En physique et en analyse vectorielle, le gradient est un vecteur indiquant comment une grandeur physique varie dans l'espace[alpha 1]. Le gradient est d'une importance capitale en physique, où il fut d'abord employé. Utilisé en théorie des variations, il est aussi fondamental dans le domaine de l'optimisation ou de la résolution d'équations aux dérivées partielles. Il peut être intéressant d'en voir certains exemples avant d'en donner une définition plus mathématique.

En sciences de la Terre, le gradient est utilisé pour la variation dans toutes les directions d'un paramètre de la lithosphère, de l'hydrosphère, de l'atmosphère ou de la biosphère. Cependant, par un abus de langage, le terme est souvent utilisé pour la composante dans une seule direction comme dans le cas de la dérivée verticale d'une grandeur physique, c'est-à-dire sa dérivée par rapport à la coordonnée $z$ (altitude ou profondeur). Le gradient géothermique, par exemple, se confond avec la dérivée $\partial T/\partial z$ (où $T$ désigne la température).

Définition

Le gradient de la fonction f(x,y) = −(cos²x + cos²y)² représenté dans le plan du bas.

Dans un système de coordonnées cartésiennes, le gradient d'une fonction $f(x_{1},x_{2},\dots ,x_{n})$ est le vecteur de composantes $\partial f/\partial x_{i}\ (i=1,2,\dots ,n)$ , c'est-à-dire les dérivées partielles de $f$ par rapport aux coordonnées.

$\nabla f={\begin{bmatrix}{\frac {\partial f}{\partial x_{1}}}\\\vdots \\{\frac {\partial f}{\partial x_{n}}}\end{bmatrix}}$

Dans un repère orthonormé, le vecteur gradient pointe dans la direction où la fonction croît le plus rapidement, et son module est égal au taux de croissance dans cette direction.

Les composantes du gradient sont les coefficients des variables dans l'équation de l'espace tangent au graphique. Cette propriété lui permet d'être défini indépendamment du choix du système de coordonnées, en tant que champ de vecteurs dont les composantes se transforment lors du passage d'un système de coordonnées à un autre.

La généralisation du gradient aux fonctions de plusieurs variables à valeur vectorielle et aux cartes différentiables entre espaces euclidiens, est la matrice jacobienne. La généralisation aux fonctions entre espaces de Banach est la dérivée de Fréchet.

Notation

Le gradient d'une fonction $f$ est généralement noté ${\overrightarrow {\mathrm {grad} }}~f$ ou ${\overrightarrow {\nabla }}f$ (nabla $f$ ).

Dans la littérature en anglais, ou en français par commodité typographique, on préfère souvent mettre en gras le symbole du gradient pour afficher son caractère vectoriel : $\mathbf {grad} ~f$ ou $\nabla f$ .

Gradient de température

Le gradient de température, ou gradient thermique, est le gradient de la température, fonction des coordonnées spatiales.

Gradient dans une seule direction (dérivée)

Supposons que l'on place une poutre rectiligne entre deux murs qui n'ont pas la même température, le mur de gauche étant le plus froid. On observe que la température de la poutre n'est pas constante et qu'elle varie de façon croissante de la gauche vers la droite. À ce phénomène thermodynamique, on associe un phénomène de flux de chaleur, lui-même lié à un gradient de température, c'est-à-dire à une variation le long de la poutre de la température, cf. Conduction Thermique, loi de Fourier.

Si on part de l'extrémité gauche de la poutre avec une abscisse $x$ = 0 et qu'on atteint l'autre extrémité de la poutre pour une abscisse $x = L$ (la longueur de la poutre), on définit la température en un point $x$ qu'on écrit $T (x)$ . La température $T$ est dite fonction de $x$ .

Entre deux points très proches, distants d'une longueur $δ x$ , on mesure un écart de température $δ T$ . Au sens usuel, le gradient (de température) est justement le rapport entre ces deux grandeurs

{\overrightarrow {\operatorname {grad} }}\ {T}={\frac {\delta T}{\delta x}}{\vec {i}}.

Au sens analytique (mathématique), on parle de gradient si cette grandeur admet une limite quand $δ x$ tend vers 0, limite notée

{\overrightarrow {\nabla }}T(x)=T'(x){\vec {i}}={\frac {\mathrm {d} T}{\mathrm {d} x}}(x){\vec {i}}.

Propriétés

Le rapport ${\tfrac {\delta T}{\delta x}}$ a un signe, ce qu'on traduit par un sens. Dans le cas qui nous intéresse, il fait plus froid à gauche de la poutre qu'à droite, donc le gradient est orienté vers la droite puisqu'on parcourt aussi la poutre de gauche à droite par l'abscisse $x$ .
En dimension 1, il y a convergence de la notion de gradient et de dérivée.
En physique, la norme de ce gradient est homogène à une température divisée par une distance (mesuré en K·m^-1), ou plus usuellement en °C·m^-1.

Gradient de température dans l'espace à trois dimensions usuel

En réalité, la température de la poutre varie en fonction d'un déplacement dans l'espace. On caractérise un point de l'espace, $M$ , en fonction de ses coordonnées $M=(x,y,z)$ . De même que précédemment, on décrit la température comme fonction : $T (x, y, z)$ .

Pour chacune de ces directions, on peut écrire une variation, dite partielle. Si, tout en étant en 3D, on ne se déplace que selon un axe, par exemple selon les ordonnées $y$ , alors on peut réécrire la même formule que précédemment sur l'accroissement de température. Cependant, pour marquer la variation, on passe par l'écriture en dérivée partielle (dite "ronde") plutôt que par la dérivée unidimensionnelle (dite droite). On écrit par exemple la variation le long de $y$ ainsi l'approximation (dite du premier ordre) :

T(x,y+\delta y,z)=T(x,y,z)+{\frac {\partial T}{\partial y}}\delta y.

On se déplace dans la poutre d'un point $M$ à un point $M'$ tels qu'ils définissent le vecteur :

{\vec {h}}={\overrightarrow {\mathrm {MM'} }}=(h_{x},h_{y},h_{z})

.

De $M$ à $M'$ , la température passe de la $T (x, y, z)$ à $T (x + h x, y + h y, z + h z)$ . En première approximation, cette variation est une fonction linéaire de ${\vec {h}}$ et s'exprime comme somme des variations liées à chacune des composantes de ${\vec {h}}$

T(x+h_{x},y+h_{y},z+h_{z})=T(x,y,z)+{\frac {\partial T}{\partial x}}(x,y,z)h_{x}+{\frac {\partial T}{\partial y}}(x,y,z)h_{y}+{\frac {\partial T}{\partial z}}(x,y,z)h_{z}.

On crée alors un vecteur appelé gradient de température

{\overrightarrow {\mathbb {\nabla } }}T(x,y,z)=\left({\frac {\partial T}{\partial x}}(x,y,z),{\frac {\partial T}{\partial y}}(x,y,z),{\frac {\partial T}{\partial z}}(x,y,z)\right).

Notez que c'est bien un vecteur. Dans ce cas, on peut réécrire la relation précédente sous la forme

T(M+{\vec {h}})=T(M)+{\overrightarrow {\mathbf {\nabla } }}T(M)\cdot {\vec {h}}+o({\vec {h}}),

où " $\cdot$ " est le produit scalaire usuel de $\mathbb {R} ^{3}$ et le symbole $o({\vec {h}})$ signifie que le terme qui reste est négligeable par rapport à ${\vec {h}}$ .

Propriétés

Le gradient est un vecteur de même dimension que l'espace sur lequel porte la température (ici ℝ³) alors que la température est fonction de support à trois dimensions mais à valeur réelle scalaire (i.e. la température en un point est un nombre, pas un vecteur).
La direction du (vecteur) gradient définit de nouveau la direction du plus froid au plus chaud, mais cette fois en 3D.
La norme du gradient de température est toujours homogène à K.m⁻¹.

Introduction par les éléments différentiels

Comme pour la différentielle dont il est une variante, le gradient peut être introduit avec le vocabulaire des éléments différentiels. À titre d'exemple on examine le problème de la variation de l'aire d'un rectangle.

Considérons dans le plan ( $x O y$ ) un rectangle de côté $x$ et $y$ . Sa surface est égale à $xy$ et dépend des coordonnées $x$ et $y$ du point M. En suivant une démarche intuitive, on convient de noter par $d x$ une très petite variation de la variable $x$ . Lorsqu'on fait subir au point $M$ un déplacement très faible, la surface va changer et on peut écrire que :

S+\mathrm {d} S=(x+\mathrm {d} x)(y+\mathrm {d} y)=xy+x\;\mathrm {d} y+y\;\mathrm {d} x+\mathrm {d} x\;\mathrm {d} y

On en déduit facilement que

\mathrm {d} S=y\;\mathrm {d} x+x\;\mathrm {d} y+\mathrm {d} x\;\mathrm {d} y

Une simple application numérique où $x$ et $y$ seraient des mètres et $d x$ et $d y$ des centimètres illustre que $d x d y$ est négligeable par rapport aux autres grandeurs.

On peut donner un statut mathématique précis aux notations $d x$ et $d y$ (qui sont des formes différentielles), et à la quantité $d x d y$ qui est alors du second ordre. Le calcul précédent est en fait un calcul de développement limité à l'ordre 1, faisant intervenir les dérivées premières de la fonction $xy$ par rapport aux deux variables.

On écrit donc :

\mathrm {d} S=(x+\mathrm {d} x)(y+\mathrm {d} y)-xy=y\;\mathrm {d} x+x\;\mathrm {d} y=(y,x)\cdot (\mathrm {d} x,\mathrm {d} y)={\overrightarrow {\nabla }}S\cdot \mathrm {d} {\overrightarrow {\mathrm {OM} }}

{\overrightarrow {\nabla }}S\cdot \mathrm {d} {\overrightarrow {\mathrm {OM} }}=(y\;{\vec {i}}+x\;{\vec {j}})\cdot (\mathrm {d} x\;{\vec {i}}+\mathrm {d} y\;{\vec {j}})=\left({\frac {\partial (xy)}{\partial x}}{\vec {i}}+{\frac {\partial (xy)}{\partial y}}{\vec {j}}\right)\cdot (\mathrm {d} x\;{\vec {i}}+\mathrm {d} y\;{\vec {j}})

.

Toutes ces égalités sont différentes façons d'écrire un produit scalaire de deux vecteurs :

\mathrm {d} S=(x+\mathrm {d} x)(y+\mathrm {d} y)-xy=y\;\mathrm {d} x+x\;\mathrm {d} y=\mathrm {\overrightarrow {\mathrm {grad} }} (xy)\cdot \mathrm {d} {\overrightarrow {\mathrm {OM} }}={\overrightarrow {\nabla }}(xy)\cdot \mathrm {d} {\overrightarrow {\mathrm {OM} }}

où

{\overrightarrow {\mathrm {grad} }}(xy)=(y,x)

.

L'intérêt de l'introduction de ces vecteurs pour exprimer la variation d'une fonction de plusieurs paramètres est de visualiser le fait que la fonction va varier le plus dans la direction du vecteur gradient et qu'elle ne va pas varier pour tout changement des paramètres dans une direction perpendiculaire au gradient.

(y\;{\vec {i}}+x\;{\vec {j}})\cdot (\mathrm {d} x\;{\vec {i}}+\mathrm {d} y\;{\vec {j}})=0

pour :

y\;\mathrm {d} x+x\;\mathrm {d} y=0

dans notre exemple du rectangle.

Tracé du gradient de surface et d'une courbe d'isosurface.

Ceci donnera en électrostatique les courbes de même potentiel : les « équipotentielles ».

Définition mathématique

Contexte

Soit $E$ un espace vectoriel euclidien et soit $U$ un ouvert de $E$ . Soit $f:U\to \mathbb {R}$ une fonction différentiable. Soit $a$ un élément de $U$ . On note alors ${\mathcal {D}}_{a}f$ la différentielle en $a$ , qui est une forme linéaire sur $E$ . On note $({\mathcal {D}}_{a}f,u)$ l'image par cette différentielle d'un vecteur $u$ de $E$ .

Existence et unicité

Il existe un unique vecteur $A$ tel que pour tout vecteur $u$ de $E$ , $({\mathcal {D}}_{a}f,u)=\langle A\mid u\rangle$ , où l'on a noté $\langle \cdot \mid \cdot \rangle \,\!$ le produit scalaire dans $E$ .

Le vecteur $A$ est appelé gradient de $f$ en $a$ , et il est noté $\nabla _{a}f$ . Il vérifie donc :

\forall u\in E,\langle \nabla _{a}f\mid u\rangle =({\mathcal {D}}_{a}f,u).

Expression canonique (dérivées partielles)

Puisque le gradient est lui-même un vecteur de $E$ , il est naturel qu'on cherche à l'exprimer dans une base orthonormée $(\mathbf {e} _{1},\;...,\;\mathbf {e} _{n})$ de cet espace vectoriel. On démontre qu'il s'exprime à l'aide des dérivées partielles sous la forme

\nabla _{a}f=\sum _{i=1}^{n}\left[{\frac {\partial f}{\partial x_{i}}}\left(a\right)\mathbf {e} _{i}\right]

Par exemple, en dimension 3, on obtient :

\nabla _{a}f={\frac {\partial f}{\partial x_{1}}}(a)\mathbf {e} _{1}+{\frac {\partial f}{\partial x_{2}}}(a)\mathbf {e} _{2}+{\frac {\partial f}{\partial x_{3}}}(a)\mathbf {e} _{3}

Changement de base

Lors d'un changement de base, au travers d'un C¹-difféomorphisme de $E$ , l'écriture du gradient suit les règles usuelles des changements de base.

Attention, il ne faut pas confondre changement de base pour l'expression d'une fonction écrite en notations cartésiennes (canoniques) et écriture du gradient adaptée à une notation autre. Par exemple pour une fonction exprimée en coordonnées polaires on calcule l'écriture « polaire » du gradient en partant d'une fonction explicitée en fonction de l'abscisse polaire ( $r$ ) et de l'argument ( $θ$ ) $f (r,θ)$ .

coordonnées cylindriques (pour les coordonnées polaires, ne considérez pas la composante en $z$ )

\nabla f={\frac {\partial f}{\partial \rho }}\mathbf {e} _{\rho }+{\frac {1}{\rho }}{\frac {\partial f}{\partial \theta }}\mathbf {e} _{\theta }+{\frac {\partial f}{\partial z}}\mathbf {e} _{z}

qu'on peut aussi noter

\nabla f={\frac {\partial f}{\partial \rho }}\mathbf {e} _{\rho }+{\frac {1}{\rho }}{\frac {\partial f}{\partial \phi }}\mathbf {e} _{\phi }+{\frac {\partial f}{\partial z}}\mathbf {e} _{z}

Tout dépend des notations utilisées. Se référer au paragraphe suivant

coordonnées sphériques

\nabla f={\frac {\partial f}{\partial r}}\mathbf {e} _{r}+{\frac {1}{r}}{\frac {\partial f}{\partial \theta }}\mathbf {e} _{\theta }+{\frac {1}{r\sin \theta }}{\frac {\partial f}{\partial \phi }}\mathbf {e} _{\phi }

les vecteurs de type $\mathbf {e} _{r}$ sont des vecteurs propres aux coordonnées polaires

On prendra ici les notations classiques des physiciens (voir Coordonnées sphériques)

Gradient et espace de Hilbert

Soient $(H,\langle \cdot ,\cdot \rangle )$ un espace de Hilbert (de dimension finie ou non), $U$ un ouvert de $H$ et $f$ une application de $U$ dans ℝ, différentiable en un point $a$ de $U$ . La différentielle ${\mathcal {D}}_{a}f$ étant, par définition, une forme linéaire continue sur $H$ , il résulte alors du théorème de représentation de Riesz qu'il existe un (unique) vecteur de $H$ , noté $\nabla f(a)$ , tel que

\forall h\in H:\quad {\mathcal {D}}_{a}f(h)=\langle \nabla f(a),h\rangle .

Le vecteur $\nabla f(a)$ est appelé le gradient de $f$ en $a$ .

On montre que si $\nabla f(a)\neq 0$ , alors $f$ croît strictement dans la direction $\nabla f(a)$ , c'est-à-dire que pour tout $t>0$ suffisamment petit, $f(a+t\nabla f(a))>f(a)$ .

Gradient et variété riemannienne

On peut encore étendre cette définition à une fonction différentiable définie sur une variété riemannienne $(M, g)$ . Le gradient de $f$ en $a$ est alors un vecteur tangent à la variété en $a$ , défini par

\forall h\in \mathrm {T} _{a}\mathrm {M} \qquad \mathrm {d} f(a)\left(h\right)=g\left(\nabla f{\big |}h\right)

.

Enfin, si $f$ est un champ scalaire indépendant du système de coordonnées, c'est un tenseur d'ordre 0, et sa dérivée partielle est égale à sa dérivée covariante : $(\nabla f)_{i}=\partial _{i}f=f_{,i}=f_{;i}$ . En coordonnées contravariantes, on calcule le champ de vecteurs appelé gradient de $f$ :

(\nabla f)^{i}=g^{ij}~f_{;j}

Cette formule permet, une fois établi le tenseur métrique, de calculer facilement le gradient dans un système de coordonnées quelconque.

Développement limité

Si une application admet un gradient en un point, alors on peut écrire ce développement limité du premier ordre

f(x+h)=f(x)+\langle \nabla f(x)\mid h\rangle +o(h)\ {\text{    ou    }}f(x-h)=f(x)-\langle \nabla f(x)\mid h\rangle +o(h)

Numériquement, il est très intéressant de faire ensuite la demi-différence des deux développements pour obtenir la valeur du gradient et on note que celui-ci ne dépend pas en fait de la valeur de la fonction au point x : $f (x)$ . Cette formule a l'avantage de tenir compte des gradients du 2^e ordre et est donc beaucoup plus précise et numériquement robuste. L'hypothèse est, en pratique, de connaitre les valeurs "passé" et "futur" de la fonction autour d'un petit voisinage du point x.

Propriétés géométriques en dimension 2 ou 3

Classiquement, on sait que le gradient permet de définir la « normale aux courbes de niveau », ce qui se traduit en 2D et en 3D par des propriétés géométriques intéressantes. La propriété de tangence étant liée à la convexité/concavité, il est aussi intéressant de voir le lien qui existe entre gradient et convexité, toujours en 2D ou 3D.

Dimension 2 : gradient normal à une courbe en un point, droite tangente

On considère $f:\mathbb {R} ^{2}\to \mathbb {R}$ continûment différentiable. Soit une courbe définie par l'équation $f (u)= k$ , où $k$ est une constante. Alors, en un point $v$ donné de cette courbe, le gradient s'il existe et n'est pas nul, donne la direction de la normale à la courbe en ce point $v$ . La droite tangente à la courbe est alors orthogonale au gradient et passe par $v$ .

Application au traitement d'image

Une image est en fait une fonction à deux variables noté p(x,y), chaque valeur entière de x et y constitue un pixel de l'image et la valeur prise p(x,y) est appelé "niveau de gris" du pixel pour une image en noir et blanc. Il est indispensable en pratique d'estimer "la droite tangente à la courbe" même si la fonction p n'est pas analytique (p est en général inconnue) et n'est peut-être pas différentiable au point (pixel) d’intérêt. On calcule numériquement les deux gradients notés gx et gy suivant x et y par exemple avec les formules du 2^e ordre, qui font appel à seulement 2 pixels chacun pour le calcul et ne force à supposer alors qu'il n'y a pas de bruit dans l'image.

La fonction p n'étant pas analytique et de valeur numérique connue uniquement en des points discrets (les pixels voisins), on peut utiliser diverses formules pour estimer le mieux possible ces gradients de l'image. On cite par exemple le filtre de Prewitt qui permet, utilisant la proximité des autres pixels de l'image (3 par 3 soit 9 pixels et tout) d'évaluer les gradients gx et gy du pixel d’intérêt situé au centre par convention du filtre.^{[réf. souhaitée]}

Repérant dans une image donnée les pixels ayant des forts gradients, ceux-ci peuvent servir d'amers, c'est-à-dire des points particuliers reconnaissables (notés dans une carte par exemple) permettant de se situer dans l'espace, autrement dit de recaler sa navigation. Les gradients gx et gy forment une direction (c'est en fait un vecteur) et on a aussi une information angulaire : il est possible de recaler des angles de prise de vue, très utile pour le pilotage guidage des drones aériens par exemple.

Dimension 3 : gradient normal à une surface en un point, plan tangent

Soit une application $f:\mathbb {R} ^{3}\to \mathbb {R}$ continûment différentiable. Soit une surface définie par l'équation $f (u)= k$ , où $k$ est une constante. Alors, en un point $v$ donné de cette surface, le gradient s'il existe et n'est pas nul, donne la direction de la normale à la surface en ce point $v$ : le plan tangent à la surface est alors orthogonal au gradient et passe par $v$ .

Gradient et convexité

Soit une application $f:\mathbb {R} ^{n}\to \mathbb {R}$ ( $n\in \{2,3\}$ par exemple) continûment différentiable. Si l'application $\mathbf {\nabla } f:\mathbb {R} ^{n}\to \mathbb {R} ^{n}$ est monotone (resp. strictement monotone), alors $f$ est convexe (resp. strictement convexe). C'est-à-dire, en utilisant la caractérisation par les cordes :

\forall (u,v)\in \left(\mathbb {R} ^{3}\right)^{2},\mathbf {\nabla } _{u}f\cdot \mathbf {\nabla } _{v}f\geq 0\Rightarrow \forall (u,v,\lambda )\in \mathbb {R} ^{3}\times \mathbb {R} ^{3}\times [0,1],f(\lambda u+(1-\lambda )v)\leq \lambda f(u)+(1-\lambda )f(v)

Cette propriété est intéressante parce qu'elle reste valable même quand $f$ n'est pas deux fois différentiable.

Si $f$ est deux fois différentiable, le hessien est positif si et seulement si le gradient est monotone.

Cas de la dimension 1

La monotonie telle que définie ci-dessus permet de définir une fonction croissante ou décroissante au sens usuel. Dans le premier cas, on parle de fonction convexe, dans le second de fonction concave.

Si la fonction est deux fois dérivable, la croissance de la dérivée (donc du gradient) est assurée par la positivité de la dérivée seconde (équivalent du hessien).

Relations vectorielles

En analyse vectorielle, le gradient peut être combiné à d'autres opérateurs. Soit $f$ une fonction décrivant un champ scalaire, que l'on suppose de classe C² par rapport à chaque paramètre, alors :

{\frac {\partial }{\partial t}}\left(\nabla f\right)=\nabla {\frac {\partial f}{\partial t}}

;

\mathrm {div} \left({\overrightarrow {\mathrm {grad} }}f\right)=\Delta f

;

{\overrightarrow {\mathrm {rot} }}\left({\overrightarrow {\mathrm {grad} }}f\right)={\overrightarrow {0}}

.

Notes et références

Autrement dit, quand une grandeur physique dépend aussi de variables non spatiales (par exemple le temps), on ne tient compte dans le calcul du gradient que des variables spatiales.

Voir aussi

Sources

(en) Serge Lang, Fundamentals of Differential Geometry, Springer
(en) Barrett O'Neill, Elementary Differential Geometry, 2^e éd. révisée (ISBN 9780120887354)

Articles connexes

Portail de l'analyse

Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.

[1] Autrement dit, quand une grandeur physique dépend aussi de variables non spatiales (par exemple le temps), on ne tient compte dans le calcul du gradient que des variables spatiales.