Point col
En mathématiques, un point-selle (en anglais : saddle point) d'une fonction f définie sur un produit cartésien X × Y de deux ensembles X et Y est un point tel que :
- atteint un maximum en sur Y ;
- et atteint un minimum en sur X.
Pour les articles homonymes, voir col.
Certains auteurs inversent les maximum et minimum ( a un minimum en et a un maximum en ), mais cela ne modifie pas qualitativement les résultats (on peut revenir au cas présent par un changement de variables).
Le terme point-selle fait référence à la forme de selle de cheval que prend le graphe de la fonction lorsque X et Y sont des intervalles de . On utilise aussi l'appellation point col, en renvoyant alors à l'image du col de montagne.
La notion de point-selle intervient :
- en optimisation, comme concept permettant d'énoncer des conditions assurant l'existence de solution primale-duale ;
- en théorie des jeux ;
- pour déterminer des solutions particulières de certaines équations qui ne sont pas des minima ou des maxima de fonctionnelle d'énergie.
Définition
Voici une définition assez générale de la notion de point-selle d'une fonction définie sur un produit cartésien d'ensembles. Aucune structure n'est requise sur ces ensembles. La fonction doit par contre prendre ses valeurs dans l'ensemble des réels (ou plus généralement dans la droite réelle achevée ).
Point-selle — Soient X et Y deux ensembles et une fonction pouvant prendre les valeurs . On dit que est un point-selle de f sur X × Y si
Dans les conditions ci-dessus, est appelée la valeur-selle de f.
Autrement dit, atteint un maximum en sur Y et atteint un minimum en sur X. Rien n'est requis en dehors de la croix , si bien que l'image de la selle ou du col peut être trompeuse comme lorsque est définie par f(x,y)=x2y2 (tous les points de l'axe des ordonnées sont des points-selles).
On pourra souvent se ramener à la définition précédente par un changement de variable. Par exemple, le point n'est pas un point-selle de la fonction , au sens de la définition ci-dessus, mais le devient localement après le changement de variable et .
Résultat d'existence
Le résultat d'existence de point-selle ci-dessous[1] rappelle celui de Weierstrass sur l'existence d'un minimiseur de fonction, mais requiert une hypothèse de convexité-concavité de f. Sans cette dernière hypothèse, pas de point-selle garanti comme le montre l'exemple de la fonction
Existence de point-selle — Supposons que X et Y soient des convexes compacts non vides d'espaces vectoriels de dimension finie et que
- pour tout y ∈ Y, f(•,y) est convexe semi-continue inférieurement,
- pour tout x ∈ X, f(x,•) est concave semi-continue supérieurement.
Alors f a un point-selle dans X × Y.
Ce résultat généralise l'identité de von Neumann qui traite du cas où f est bilinéaire et les ensembles X et Y sont des simplexes de dimension finie.
Propriétés
Le résultat suivant est fondamental dans la théorie de la dualité en optimisation, dans laquelle on définit un problème primal par
et le problème dual associé par
On dit alors qu'il n'y a pas de saut de dualité si
l'inégalité ≤ dite de dualité faible étant toujours garantie.
Caractérisation des points-selles — Un couple de points est un point-selle de f sur X × Y si, et seulement si, est solution du problème primal (P), est solution du problème dual (D) et il n'y a pas de saut de dualité.
L'ensemble des points-selles d'une fonction a une structure très particulière, comme le montre le résultat suivant : c'est un produit cartésien. On y a noté Sol(P) l'ensemble des solutions du problème primal (P) et Sol(D) l'ensemble des solutions du problème dual (D).
Produit cartésien des points-selles — Supposons que la fonction ait un point-selle. Alors
- l'ensemble des points-selles de f est le produit cartésien Sol(P) × Sol(D),
- la fonction f prend une valeur constante sur Sol(P) × Sol(D), disons ,
- on a
Point-selle en calcul différentiel
Utilisation de la hessienne
Pour déterminer si un point critique d'une fonction de classe C2 de n variables à valeurs réelles f(x1,...,xn) est un point-selle on calcule la matrice hessienne en ce point. Si la forme quadratique définie par la hessienne est non dégénérée et de type (p,q) avec p > 0, q > 0 (ce qui, pour n=2, revient à dire que le déterminant de la matrice hessienne est strictement négatif), on a un point-selle après changement et regroupement des variables (selon le lemme de Morse).
Par exemple, le gradient et la hessienne de la fonction f(x,y)=x2-y2 s'écrivent
Le gradient est donc nul en (0;0) (c'est un point critique) et la hessienne a une valeur propre strictement positive (2) et une valeur propre strictement négative (-2). Par conséquent, (0;0) est un point-selle.
Ce critère ne donne pas de condition nécessaire : pour la fonction , le point (0;0) est un point-selle mais la hessienne en ce point est la matrice nulle. Donc la hessienne n'a pas de valeur propre strictement positive et négative.
Annexes
Note
- Voir Maurice Sion (1958) et le théorème 1.1 chez Brezis (1973).
Articles connexes
Bibliographie
- H. Brézis (1973), Opérateurs Maximaux Monotones et semi-groupes de contractions dans les espaces de Hilbert. Mathematics Studies 5. North-Holland, Amsterdam. (ISBN 978-0-7204-2705-9).
- (en) M. Sion (1958), « On general minimax theorems », Pacific Journal of Mathematics 8, 171-176.
- Portail de l'analyse