Réseau bayésien dynamique

Un réseau bayésien dynamique ou temporel (souvent noté RBD, ou DBN pour Dynamic Bayesian Network) est un modèle statistique et stochastique qui étend la notion de réseau bayésien. À la différence de ces derniers, un réseau bayésien dynamique permet de représenter l'évolution des variables aléatoires en fonction d'une séquence discrète, par exemple des pas temporels[1]. Le terme dynamique caractérise le système modélisé, et non le réseau qui lui ne change pas.

Réseau bayésien dynamique de 3 variables.

Intuition

Réseau bayésien de 3 variables qui évoluent sur 3 pas de temps (identiques).

Un réseau bayésien est un modèle graphique probabiliste qui, à partir de variables aléatoires structurées en un graphe orienté acyclique, permet de calculer des probabilités conditionnelles liées à ces variables. Les réseaux bayésiens dynamiques étendent ce processus en prenant en compte l'évolution des variables aléatoires, généralement dans le temps.

Un exemple de réseau bayésien serait, dans le diagnostic médical, de déterminer la probabilité pour un patient d'avoir une maladie en fonction de ses symptômes. Ce système peut ensuite être rendu « dynamique » en y intégrant le fait que la probabilité d'être malade au temps t dépend également de la probabilité passée. Intuitivement, cela signifie que le risque évolue dans le temps. La variable modélisant le risque d'avoir une maladie donnée est dite dynamique, temporelle ou persistante.

Réseau bayésien dynamique simplifié. Les variables qui n'ont pas de dépendance dans le temps t-1 n'ont pas besoin d'être dédoublées (ici A). Elles sont par défaut défini dans le temps t. Elle reste cependant dynamique et les probabilités sur leurs affections évoluent dans le temps.

Définition

Il convient de rappeler d'abord brièvement la définition d'un réseau bayésien : un réseau bayésien est un graphe orienté acyclique G = (V, E), avec V l'ensemble des nœuds et E l'ensemble des arcs reliant les nœuds. Une distribution de probabilité conditionnelle est associée à chaque nœud x, et la probabilité jointe factorisée sur l'ensemble de V est (avec pa(x) l'ensemble des parents de x)[2] :

\mathrm {P} (V)=\prod _{x\in V}\mathrm {P} {\big (}x\,{\big |}\,\operatorname {pa} (x){\big )}

Formellement, un réseau bayésien dynamique se définit comme un couple $(B_{1},B_{2d}$ ). $B_{1}$ est un réseau bayésien classique représentant la distribution a priori (ou initiale) des variables aléatoires ; dit plus intuitivement, il s'agit du temps 0. $B_{2d}$ est un réseau bayésien dynamique a deux pas de temps décrivant la transition du pas de temps t-1 au pas de temps t, c'est-à-dire $P(x_{t}\,{\big |}\,x_{t-1})$ pour tout nœud x appartenant à V, dans un graphe orienté acyclique G=(V, E) comme introduit plus haut. La probabilité jointe d'un pas de temps s'écrit alors[3]^,[4] :

P(V_{t}\,{\big |}\,V_{t-1})=\prod _{x\in V}P(x_{t}\,{\big |}\,\operatorname {pa} (x_{t}))\,

Les parents d'un nœud, notés $\operatorname {pa} (x_{t})$ , peuvent ainsi être soit un parent direct dans le réseau au temps t, soit un parent direct au temps t-1.

La loi de probabilité jointe factorisée se calcule en « déroulant » le réseau sur la séquence temporelle, à condition de connaître sa longueur, que l'on va noter ici T. Formellement, si $P(V_{0})$ est la probabilité jointe du réseau initial $B_{1}$ , donc au pas de temps 0, on peut écrire[3]^,[4] :

P(V_{0:T})=P(V_{0})\times P(V_{1:T})=\prod _{x\in V}P(x_{0}\,{\big |}\,\operatorname {pa} (x_{0}))\times \prod _{t=1}^{T}\prod _{x\in V}P(x_{t}\,{\big |}\,\operatorname {pa} (x_{t}))

Un réseau bayésien dynamique respecte ainsi la propriété de Markov, qui exprime que les distributions conditionnelles au temps t ne dépendent que de l'état au temps t-1 dans un processus stochastique. Les réseaux bayésiens dynamiques sont une généralisation des modèles probabilistes de séries temporelles de type modèle de Markov caché, filtre de Kalman[4]...

Annexes

Articles connexes

Références

(en) Thomas Dean et Keiji Kanazawa, « A model for reasoning about persistence and causation », Computational Intelligence, vol. 5, n^o 2,‎ 1989, p. 142-150 (lire en ligne)
Jean-Jacques Boreux, Éric Parent et Jacques Bernier, Pratique du calcul bayésien, Paris/Berlin/Heidelberg etc., Springer, 2009, 333 p. (ISBN 978-2-287-99666-5, lire en ligne), p. 38-39
(en) Kevin Patrick Murphy, Dynamic Bayesian Networks : Representation, Inference and Learning, université de Californie à Berkeley, 2002 (lire en ligne), p. 14-15 (thèse)
Roland Donat, Philippe Leray, Laurent Bouillaut et Patrice Aknin, « Réseaux bayésiens dynamiques pour la représentation de modèles de durée en temps discret », Journées francophone sur les réseaux bayésiens,‎ 2008 (lire en ligne)

Portail des probabilités et de la statistique
Portail de l’informatique

Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.

[1] (en) Thomas Dean et Keiji Kanazawa, « A model for reasoning about persistence and causation », Computational Intelligence, vol. 5, n^o 2,‎ 1989, p. 142-150 (lire en ligne)

[2] Jean-Jacques Boreux, Éric Parent et Jacques Bernier, Pratique du calcul bayésien, Paris/Berlin/Heidelberg etc., Springer, 2009, 333 p. (ISBN 978-2-287-99666-5, lire en ligne), p. 38-39

[Murphy_p14-3] (en) Kevin Patrick Murphy, Dynamic Bayesian Networks : Representation, Inference and Learning, université de Californie à Berkeley, 2002 (lire en ligne), p. 14-15 (thèse)

[Donat08-4] Roland Donat, Philippe Leray, Laurent Bouillaut et Patrice Aknin, « Réseaux bayésiens dynamiques pour la représentation de modèles de durée en temps discret », Journées francophone sur les réseaux bayésiens,‎ 2008 (lire en ligne)