Méthode de Monte-Carlo

Le terme méthode de Monte-Carlo, ou méthode Monte-Carlo, désigne une famille de méthodes algorithmiques visant à calculer une valeur numérique approchée en utilisant des procédés aléatoires, c'est-à-dire des techniques probabilistes. Le nom de ces méthodes, qui fait allusion aux jeux de hasard pratiqués au casino de Monte-Carlo, a été inventé en 1947 par Nicholas Metropolis[1], et publié pour la première fois en 1949 dans un article coécrit avec Stanislaw Ulam[2].

Pour les articles homonymes, voir Monte-Carlo (homonymie).

Ne doit pas être confondu avec algorithme de Monte-Carlo.

Les méthodes de Monte-Carlo sont particulièrement utilisées pour calculer des intégrales en dimensions plus grandes que 1 (en particulier, pour calculer des surfaces et des volumes). Elles sont également couramment utilisées en physique des particules, où des simulations probabilistes permettent d'estimer la forme d'un signal ou la sensibilité d'un détecteur. La comparaison des données mesurées à ces simulations peut permettre de mettre en évidence des caractéristiques inattendues, par exemple de nouvelles particules.

La méthode de simulation de Monte-Carlo permet aussi d'introduire une approche statistique du risque dans une décision financière. Elle consiste à isoler un certain nombre de variables-clés du projet, telles que le chiffre d'affaires ou la marge, et à leur affecter une distribution de probabilité. Pour chacun de ces facteurs, un grand nombre de tirages aléatoires est effectué dans les distributions de probabilité déterminées précédemment, afin de trouver la probabilité d'occurrence de chacun des résultats. À titre d'exemple, le choix de mode de gestion d'une collectivité territoriale dans le cadre d'un partenariat public-privé (PPP) s'analyse via la méthode de Monte-Carlo, afin de prendre en compte la répartition des risques entre acteurs publics et privés. On parle alors de "risques valorisés" ou "valeurs à risque".

Le véritable développement des méthodes de Monte-Carlo s'est effectué sous l'impulsion de John von Neumann et Stanislaw Ulam notamment, lors de la Seconde Guerre mondiale et des recherches sur la fabrication de la bombe atomique. Notamment, ils ont utilisé ces méthodes probabilistes pour résoudre des équations aux dérivées partielles dans le cadre de la Monte-Carlo N-Particle transport (MCNP).

Théorie


Méthode Monte Carlo

Supposons qu'il existe une expression de l'espérance mathématique d'une fonction g de la variable aléatoire X, résultant du théorème de transfert, selon lequel

fX est une fonction de densité de X sur le support [a , b]. Il est fréquent de prendre une distribution uniforme sur [a , b] :

Ceci peut être étendu aux probabilités discrètes en sommant grâce à une mesure ν discrète, de type Dirac.

L'idée est de produire un échantillon (x1 ,x2,...,xN) de la variable aléatoire X (donc d'après la densité fX si X est continue ou suivant la loi de X si X est discrète) sur le support [a , b], et de calculer un estimateur de G dit de Monte-Carlo, à partir de cet échantillon.

La loi des grands nombres suggère de construire cet estimateur à partir de la moyenne empirique[3] :

qui se trouve être, par ailleurs, un estimateur sans biais de l'espérance.

Ceci est l'estimateur de Monte-Carlo. Nous voyons qu'en remplaçant l'échantillon par un ensemble de valeurs prises dans le support d'une intégrale, et de la fonction à intégrer, nous pouvons obtenir une approximation de sa valeur, construite statistiquement.

Cette estimation est sans biais, dans le sens où

Il faut aussi quantifier la précision de cette estimation, via la variance de qui s'exprime à l'aide de la variance de .

Si l'échantillon est supposé iid, cette dernière est estimée à l'aide de sa variance empirique

D'après le théorème central limite, on sait que la variable :

qui est centrée et réduite, suit approximativement la loi normale centrée réduite , ou loi de Gauss. Il est alors possible de construire des intervalles de confiance, ce qui permet d'encadrer l'erreur commise en remplaçant G par . Si cette erreur est dénotée eN, alors pour un niveau de risque donné, on a :

avec probabilité 1–α. Le réel est le quantile de la loi normale centrée réduite. Par exemple, au niveau de risque , on trouve dans les tables et l'erreur est majorée par . Cette méthode permet donc de quantifier l'erreur commise, à condition d'estimer σg par sa contrepartie empirique

On voit ainsi que l'erreur est de l'ordre de . Par exemple, multiplier la taille de l'échantillon par 100 permet de diviser par 10 l'erreur d'estimation.

Il est à noter qu'en pratique, σg n'est pas connu et doit être estimé ; comme précisé plus haut, on peut utiliser sa contrepartie empirique. Diverses méthodes, dites techniques de réduction de la variance, permettent d'améliorer la précision — ou de diminuer le temps de calcul — en remplaçant g(X) par une autre variable aléatoire. Ces techniques entrent en général dans l'une des classes suivantes : l'échantillonnage préférentiel, les variables de contrôle, la variable antithétique, la stratification et le conditionnement.


Méthodes accélérées

Le nombre de simulations nécessaires pour atteindre une marge d'erreur voulue est parfois trop important avec la méthode Monte-Carlo. En effet lorsqu'on veut atteindre une marge d'erreur faible, il faut que donc est très grand quand est petit. Pour remédier à ce problème il existe des méthodes dites de "réduction de variance" ou de "Monte-Carlo accélérées" qui demandent moins de simulations pour atteindre le même niveau de précision. Parmi ces méthodes on distingue deux grands types de méthodes : les méthodes d'échantillonnage préférentiel et les méthodes particulaires.

Exemples

Détermination de la valeur de π

Cette méthode est proche de l'expérience de l'aiguille de Buffon.

Soit un point M de coordonnées (x, y), où 0<x<1 et 0<y<1. On tire aléatoirement les valeurs de x et y entre 0 et 1 suivant une loi uniforme. Le point M appartient au disque de centre (0,0) de rayon R=1 si et seulement si x2+y2≤1. La probabilité que le point M appartienne au disque est π/4, puisque le quart de disque est de surface σ=π R2/4=π/4, et le carré qui le contient est de surface S=R2=1 : si la loi de probabilité du tirage de point est uniforme, la probabilité de tomber dans le quart de disque vaut σ/S=π/4.

En faisant le rapport du nombre de points dans le disque au nombre de tirages, on obtient une approximation du nombre π/4 si le nombre de tirages est grand.

Représentation du calcul de la valeur de π par rapport du nombre de points aléatoires étant contenus dans un quart de cercle, l'ensemble des possibles étant un carré de côté R.

Détermination de la superficie d'un lac

Cet exemple est un classique en vulgarisation de la méthode de Monte-Carlo. Soit une zone rectangulaire ou carrée dont les côtés sont de longueur connue. Au sein de cette aire se trouve un lac dont la superficie est inconnue. Grâce aux mesures des côtés de la zone, on connaît l'aire du rectangle. Pour trouver l'aire du lac, on demande à une armée de tirer X coups de canon de manière aléatoire sur cette zone. On compte ensuite le nombre N de boulets qui sont restés sur le terrain ; on peut ainsi déterminer le nombre de boulets qui sont tombés dans le lac : XN. Il suffit ensuite d'établir un rapport entre les valeurs :

Par exemple, si le terrain fait 1 000 m2, que l'armée tire 500 boulets et que 100 projectiles sont tombés dans le lac, alors une estimation de la superficie du plan d'eau est de : 1000×100÷500 = 200 m2.

Estimation de la surface du lac grâce à des tirs d'artillerie aléatoires

La qualité de l'estimation s'améliore (lentement) en augmentant le nombre de tirs et en s'assurant que les artilleurs ne visent pas toujours le même endroit mais couvrent bien la zone, de manière uniforme. Cette dernière remarque est à mettre en parallèle avec la qualité du générateur aléatoire qui est primordiale pour avoir de bons résultats dans la méthode de Monte-Carlo. Un générateur biaisé est comme un canon qui tire toujours au même endroit : les informations qu'il apporte sont réduites.

Recouvrement de courbes et méthode contrainte-résistance

Méthode contrainte-résistance : la fréquence de défaillance correspond à l'aire sous l'intersection des courbes rouge et bleue (haut).

La méthode de Monte-Carlo peut être utilisée pour déterminer l'aire sous l'intersection de deux courbes, qui n'est qu'une surface particulière.

Les courbes peuvent être les courbes représentatrices des densités de probabilité de deux lois. C'est par exemple utilisé dans la méthode contrainte-résistance :

  • un système est soumis à une contrainte — une sollicitation quelle qu'elle soit (effort mécanique, variation de température, passage de courant électrique, …) — dont l'intensité est une variable aléatoire S ;
  • le système est conçu pour résister à cette contrainte, sa résistance est exprimée par une valeur, une variable aléatoire R ;
  • le système est validé si la résistance est supérieure à la contrainte — R > S — dans un certain nombre de cas (typiquement 99 % ou 99,9 %).

La probabilité complémentaire — les cas de défaillance, celle pour laquelle R ≤ S — est l'aire sous l'intersection des deux courbes représentant les lois.

On peut déterminer la probabilité P(R > S) en faisant des tirages aléatoires sur R et S et en dénombrant les cas pour lesquels « R > S » est vrai.

Estimation de la valeur d'un coup au go

Aux échecs, comme dans beaucoup de jeux de plateau, il est possible de mesurer la valeur d'une position, et donc des coups y conduisant, en évaluant quantitativement la position obtenue : nombre de pièces sur l'échiquier, valeurs des pièces (1 point par pion, 5 par tour...), position relative des pièces entre elles, et en pondérant la valeur trouvée par les libertés, les protections des pièces, etc. Cette évaluation basée sur l'analyse et l'expertise est d'autant plus rapide à mesurer qu'on avance dans la partie, car le nombre de pièces diminue.

Dans le jeu de go, l'évaluation d'une position globale reste très difficile avec des méthodes d'analyses classiques du fait de l’enchevêtrement et de la complexité des positions locales et du nombre quasi infini de suites de coups possibles. En 2006, le mathématicien Rémi Coulom a fait progresser de manière très sensible cette fonction d'évaluation et l’efficience des logiciels de jeu de go en utilisant la méthode de Monte-Carlo : on joue "au hasard" un grand nombre de fins de parties réalistes à partir de la position "en cours d'évaluation" et on comptabilise la proportion de parties gagnantes/perdantes. Cette estimation statistique s'affine en biaisant le hasard par élimination de coups a priori stupides. Cette méthode s'avère très efficace[4],[5]. Elle est utilisée en particulier par les programmes AlphaGo et AlphaZero[6].

Estimation de la valeur d'un coup aux échecs

Parfois, pour savoir si un coup ambigu doit être fait (échange de pièces par exemple), lorsqu'on manque d'information, ou pour choisir entre plusieurs coups menant tous à des pertes de matériel, il est possible de lancer plusieurs parties rapides au hasard, pour savoir quelle est la moins mauvaise ou la meilleure des solutions.

Probabilité de la performance en bourse

Selon l'hypothèse des marchés efficients, les performances boursières sont aléatoires et suivent une loi normale. Dans ces conditions, il est possible de réaliser des milliers de tirages aléatoires pour déterminer les probabilités d'atteindre certaines performances boursières dans le futur[7]. Cette caractéristique des marchés financiers permet d'utiliser la méthode de Monte-Carlo pour valoriser des options, ou encore des SPAC.

Notes et références

  1. Nicholas Metropolis, « The Beginning of the Monte Carlo Method », Los Alamos Science, no 15, , p. 125-130 (lire en ligne).
  2. Nicholas Metropolis et Stanislaw Ulam, « The Monte Carlo Method », Journal of the American Statistical Association, vol. 44, no 247, , p. 335-341 (DOI 10.2307/2280232, lire en ligne).
  3. (en) Eric C. Anderson, « Monte Carlo Methods and Importance Sampling », Lecture Notes for Stat 578C Statistical Genetics, , p. 1 (moyenne empirique) (lire en ligne).
  4. « le jeu de go, le seul jeu où l'ordinateur ne bat pas l'homme », sur http://www.slate.fr, (consulté le ).
  5. « le jeu de go et la révolution de monte-carlo », sur https://interstices.info, (consulté le ).
  6. (en) David Silver et Demis Hassabis, « AlphaGo: Mastering the ancient game of Go with Machine Learning », sur Google Research Blog, .
  7. Edouard Petit, « PRÉVOIR LA BOURSE ET VOTRE PATRIMOINE GRÂCE AUX SIMULATIONS DE MONTE-CARLO », sur Epargnant 3.0, (consulté le ).

Voir aussi

Bibliographie

Articles connexes

Codes de simulation utilisant des méthodes de Monte-Carlo

Liens externes

  • Portail des probabilités et de la statistique
  • Portail de la physique
  • Portail de la finance
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.