Théorie de Sturm-Liouville
En mathématiques, la théorie de Sturm-Liouville étudie le cas particulier des équations différentielles linéaires scalaires d'ordre deux de la forme
Cet article concerne les équations différentielles. Pour les fonctions polynomiales, voir Théorème de Sturm.
dans laquelle le paramètre λ fait partie comme la fonction y des inconnues. La fonction w(x) est souvent appelé fonction "poids" ou "densité". Cette équation est fréquemment posée sur un segment [a,b] et accompagnée de conditions aux limites reliant les valeurs , , et . Les solutions λ et y du problème apparaissent alors comme valeur propre et vecteur propre de l'opérateur autoadjoint :
dans un espace de Hilbert L2([a, b], w(x) dx) des fonctions de carré sommable sur l'intervalle [a,b], muni de la mesure w(x)dx et du produit scalaire défini par :
- .
Le résultat principal de la théorie est l'existence d'une base hilbertienne de vecteurs propres associés à des valeurs propres formant une suite strictement croissante.
Cette théorie porte le nom des mathématiciens Charles Sturm (1803-1855) et Joseph Liouville (1809-1882) qui travaillèrent conjointement à sa mise en forme.
Forme de Sturm-Liouville pour une équation homogène
Propriétés générales
De façon générale une équation différentielle linéaire d'ordre deux, scalaire, homogène, de forme générale :
- ,
peut être mise sous la forme dite de Sturm-Liouville, avec une fonction p à valeurs strictement positives, soit:
- ,
λ étant en général une variable réelle (ou plus généralement complexe) pouvant prendre plusieurs valeurs, et w(x) une fonction régulière à valeurs positive appelée « fonction poids ».
Toutes les équations différentielles linéaires homogènes d'ordre deux ne se mettent pas nécessairement de façon évidente sous la forme de Sturm-Liouville, en général il faut pour cela utiliser un facteur intégrant. En l'occurrence, après division par A(x), l'équation précédente se met sous la forme :
- ,
il s'agit alors de trouver une fonction qui permette de la mettre sous la forme de Sturm-Liouville. Or après multiplication on a:
- ,
ce qui implique par identification que p(x) doit être telle que , par suite il suffit de prendre formellement[N 1]:
pour obtenir le résultat désiré (la fonction p est par construction à valeurs positives). Le terme d'ordre 0 se met alors sous la forme , qu'il est toujours possible d'écrire, sans perte de généralité, sous la forme .
Remarque: il peut aussi arriver que la fonction « poids » w(x) apparaisse lorsque l'on cherche à transformer le facteur devant la dérivée seconde de façon que l'équation puisse être mise sous la forme de Sturm-Liouville directement, ou encore pour que le facteur intégrant puisse être effectivement évalué analytiquement[N 2].
Cette technique ne peut pas être généralisée aux équations vectorielles. Toutefois, elle peut être utilisée pour les équations aux dérivées partielles, en se ramenant à des équations différentielles ordinaires par la méthode de séparation des variables. Dans l'article original de Liouville sur la question, l'équation de la chaleur était d'ailleurs donnée en exemple introductif.
Exemples
Voici pour quelques équations classiques, la forme de Sturm-Liouville correspondante :
- , ici .
- ici .
- Exemple faisant intervenir un facteur intégrant: soit l'équation telle que
- , avec a constante réelle,
- qui correspond à , , et , après division par et par multiplication par le facteur intégrant:
- ,
- forme de Sturm-Liouville s'écrit
- ,
- il est possible de poser , pour se ramener à la forme générale de Sturm-Liouville.
Le théorème de comparaison de Sturm
Le théorème donne un lien entre les solutions de deux équations différentielles de Sturm-Liouville
On suppose que pour tout élément , et .
Alors si y1 est une solution non triviale de l'équation différentielle E1 et si y2 est solution de E2, entre deux zéros de y1 se trouve un zéro de y2.
Problème de Sturm-Liouville
L'association de la forme de Sturm-Liouville avec des conditions aux limites sur l'intervalle [a,b] permet d'envisager une situation particulière, appelée problème de Sturm-Liouville.
Position du problème
Le problème est constitué de l'équation différentielle (1) et des conditions aux limites (supposées non triviales)
Ces conditions aux limites sont dites séparées, car elles portent chacune sur une extrémité de l'intervalle [a,b].
L'opérateur de Sturm-Liouville associé est l'opérateur différentiel
Avec ces notations, l'équation différentielle se met sous la forme d'une équation aux valeurs propres :
L'espace L2([a,b]) des fonctions de carré sommable sur l'intervalle [a,b][N 3] est muni du produit scalaire[N 4] suivant :
- .
Dans cette définition, la fonction w(x) apparaît comme une "pondération" dans le produit scalaire, d'où le nom de "fonction poids" qui lui est souvent donné. Il s'agit en fait de la densité de la mesure définie sur l'espace L2([a,b]) , qui avec ce produit scalaire constitue un espace de Hilbert[N 5]
Résultats
Dans ce cas, le problème de Sturm-Liouville peut être résolu, avec les résultats suivants :
- les valeurs propres , associées aux fonctions propres solutions de l'équation différentielles sont réelles, discrètes, et peuvent être ordonnées[N 6]: ;
- les fonctions propres sont orthogonales, et peuvent être normalisées à l'unité pour former une base de Hilbert de l'espace ;
- chaque fonction propre possède exactement n zéros sur l'intervalle [a,b].
Les deux premières propriétés découlent pour l'essentiel du fait que l'opérateur de Sturm-Liouville est autoadjoint : . La dernière se démontre à partir du théorème de comparaison de Sturm précédent.
Il est important de souligner que le caractère infiniment dénombrable des valeurs propres possibles est directement lié au fait que l'intervalle considéré est fini, et ce sont les conditions aux limites qui imposent que ces valeurs propres soient discrètes. Ceci à d'importantes conséquences en physique, par exemple dans l'étude des modes propres de vibration d'une corde vibrante, ou encore en mécanique quantique (quantification des niveaux d'énergie), où les équations correspondantes peuvent se mettre sous la forme de Sturm-Liouville avec des conditions aux limites de la même forme que le problème envisagé.
Décomposition sur la base des fonctions propres - Polynômes orthogonaux
Comme les fonctions propres forment une base de Hilbert de l'espace , il est toujours possible par normalisation d'obtenir une base orthonormée de fonctions propres, telles que .
Ceci a pour première conséquence que toute solution y(x) du problème de Sturm-Liouville peut être décomposée sur l'intervalle [a,b] en une série de fonctions propres normalisées :
- ,
avec .
Ceci correspond à une généralisation du développement en séries de Fourier, et est également à la base des développements de fonctions sur les bases de polynômes orthogonaux, très souvent utilisés en mathématiques ou en physique.
Problème de Sturm-Liouville "inhomogène"
Il est aussi possible de généraliser le problème de Sturm-Liouville au cas "inhomogène", c'est-à-dire au cas de l'équation avec second membre:
- ,
où est l'opérateur de Sturm-Liouville, et f(x) une fonction définie sur l'intervalle [a,b], avec les mêmes conditions aux limites que précédemment sur y(x). Il s'agit alors d'une généralisation du problème précédent.
Les solutions y(x) de cette équation peuvent alors se décomposer sur la base des fonctions propres normalisées du problème homogène associé , avec[1]:
- si , il existe une solution de la forme ;
- si n0 donné, il existera une solution si , avec , avec c constante déterminée par les conditions aux limites du problème.
Notes et références
Notes
- Bien entendu la primitive dans l'intégrale est définie à une constante additive près, qui se traduit par une constante multiplicative (positive) dans la fonction p(x). Celle-ci ne change rien puisque toute l'équation va être multipliée par ensuite.
- On peut préciser ce point en prenant l'exemple de l'équation différentielle des polynômes de Tchebychev de première espèce (n entier). Formellement il est possible de diviser l'ensemble par et de prendre pour facteur intégrant , toutefois il n'est pas possible d'évaluer analytiquement p(x). Il est préférable de diviser d'abord l'équation par qui devient alors avec . Si l'on pose il est évident que et la forme de Sturm-Liouville est alors évidente: .
- Si cet espace est muni de l'opération interne habituelle de somme de deux fonctions, et de l'opération externe sur de multiplication par un scalaire, i.e. , il est facile de vérifier qu'il a alors une structure d'espace vectoriel sur .
- S'agissant d'un espace vectoriel réel un produit scalaire est une forme bilinéaire, symétrique et définie positive sur l'espace considéré, et il est facile de vérifier que ces propriétés sont bien respectées avec cette définition.
- Plus précisément, l'espace muni de ce produit scalaire lui donne une structure d'espace préhilbertien. Ceci permet aussi de définir une norme associée par . Il est alors possible de montrer que l'espace I muni de cette norme est complet et donc constitue un espace de Hilbert.
- Il existe donc une plus petite valeur propre, mais pas de maximum.
Références
- Cf. par exemple X. Bagnoud, Méthodes mathématiques de la physique, pp. 39s., disponible à http://physics.unifr.ch/admin/dbproxy.php?table=fuman_filepool&column=content&id=784 .
Liens externes
- Article de 1836 de Liouville sur le problème de Sturm-Liouville, en ligne et commenté sur le site BibNum.
- Cours vidéo sur les problèmes de Sturm-Liouville
- Portail de l'analyse