Automate de Parikh
En informatique théorique, et notamment en théorie des automates, un automate de Parikh est un automate fini non déterministe dont les transitions comportent des vecteurs d’entiers naturels qui permettent de tester si la somme des vecteurs d'un calcul satisfait une contrainte semi-linéaire. L'intérêt de cette famille d'automates est qu'elle possède d'autres caractérisations équivalentes, sous forme de machine de Turing et sous une forme plus algébrique, dite RCM.
Description informelle
Un automate de Parikh est un automate fini dont les transitions sont étiquetées par des couples , où est une lettre de l’alphabet d’entrée et est un vecteur de , pour un entier . Un chemin est une suite
de transitions qui calcule le mot et le vecteur , où la somme est faite composante par composante. La condition d’acceptation est donnée par un ensemble d’états terminaux et un ensemble semi-linéaire. Un chemin est un calcul réussi si, partant de l’état initial, il atteint un état final et si son vecteur appartient à l’ensemble semi-linéaire donné.
Les automates de Parikh ont été introduits en 2003 dans l’étude de la logique du second ordre[1]. Ces automates acceptent les mêmes langages formels que les machines de Turing à compteurs à renversements bornées (en anglais « reversal bounded »)[2]. Cette famille coïncide à son tour avec une classe définie par Massazza sous le nom de classe RCM[3].
Exemple
L’automate de l'introduction[4], avec la contrainte , accepte l’ensemble des mots sur l’alphabet qui commence et finissent par un , et tels que . `
Automates de Parikh
Ensemble semi-linéaire
Un sous-ensemble de est linéaire s'il est de la forme
pour des vecteurs . C'est donc l'ensemble des combinaisons linéaires, à coefficients entiers naturels, d'un ensemble fini de vecteurs de , auxquels est ajouté le vecteur . Par exemple, pour , l'ensemble est un ensemble linéaire très simple.
Un sous-ensemble de est semi-linéaire s'il est une union finie de parties linéaires. Tout ensemble semi-linéaire possède une représentation inambigue, où les unions sont disjointes et où les écritures comme combinaisons linéaires sont uniques.
Définition des automates
Un automate de Parikh de dimension est un tuple , où
- est l'alphabet,
- est l'ensemble d'états
- est l'état initial
- est l’ensemble des états terminaux
- est l'ensemble des contraintes semi-linéaires
- est la relation de transition.
Un chemin dans l'automate est une suite
où, pour , le triplet est dans . L'étiquette de ce chemin est le couple . Le chemin est réussi ou acceptant si , et si de plus le vecteur est dans . Dans ce cas, le mot est accepté ou reconnu par l'automate . Le langage reconnu par est noté .
Automates inambigus
Un automate de Parikh est faiblement inambigu[4] si, pour tout mot, il existe au plus un chemin réussi[5]. L'automate de la figure ci-contre est faiblement inambigu. Il a pour ensemble semi-linéaire de contraintes l'ensemble . Si on oublie la partie semi-linéaire, l'automate sous-jacent, qui reconnait le langage , est en revanche un automate fini ambigu.
La famille des langages reconnus par des automates de Parikh faiblement inambigus est fermée par intersection ; la fermeture par union ou par complémentation est une question encore ouverte[4]. Il existe des langages inhéremment faiblement inambigus au sens que tout automate de Parikh les reconnaissants est faiblement ambigu[4].
Caractérisation par machines de Turing
Une machine de Turing à compteurs est une machine de Turing qui possède, en plus de ses attributs usuels, un ensemble de compteurs[2]. La machine, dans l'état et en lisant une lettre sur sa bande d'entrée, peut examiner ses compteurs, et incrémenter ou décrémenter certains de ses compteurs. La machine ne connaît pas la valeur de ses compteurs mais sait tester s'ils sont nuls ou non. Une machine de Turing est à renversements bornés (en anglais « reversal bounded ») si sa tête de lecture ne peut changer de direction qu'un nombre borné de fois ; plus précisément, elle est -bornée si elle peut changer de direction au plus fois, et si chaque compteur ne peut alterner l'incrémentation et la décrémentation au plus fois. Une machine de Turing, à compteurs et -bornée est inambigue si, de plus, chaque mot possède au plus un calcul acceptant.
Théorème — Les automates de Parikh reconnaissent les mêmes langages que les machines de Turing à compteurs et à renversements bornés[6],[1].
L'égalité de ces familles de langages n'est plus vraie dans le cas déterministe[6]. En revanche, la version inambigue est valide :
Théorème — Les automates de Parikh faiblement inambigus reconnaissent les mêmes langages que les machines de Turing à compteurs et à renversements bornés inambigus[4].
Langages RCM
Paolo Massazza[3] a introduit en 1993 une famille de langages appelée RCM[7]. La construction rappelle, mais de loin, la représentation des langages algébriques par langages de Dyck. Ces langages sont définis comme suit.
On se donne un alphabet totalement ordonné avec . À tout ensemble semi-linéaire de dimension on associe le langage . Ce langage est l'ensemble des mots dont les nombres d'occurrences de chaque lettre satisfont les contraintes de . Si par exemple et l'alphabet est , le langage est l'ensemble de tous les mots sur ces 4 lettres qui ont autant d'occurrences de que de et autant de que de .
Par définition, un langage sur un alphabet appartient à la famille RCM s'il existe un langage rationnel sur , un ensemble semi-linéaire et un morphisme préservant la longueur qui est injectif sur tels que
- .
Par exemple, le langage est dans la famille RCM parce qu'il s'écrit sous la forme , où est l'ensemble semi-linaire défini ci-dessus et identifie et respectivement et .
Le lien entre les langages RCM est les automates de Parikh est le résultat suivant :
Théorème — Les automates de Parikh faiblement inambigus reconnaissent exactement les langages de la famille RCM[4].
Notes et références
- Klaedtke et Rueß 2003.
- Ibarra 1978.
- Massazza 1993.
- Bostan et al. 2020.
- Il existe aussi une notion d'automate de Parikh inambigu, définie dans (Cadilhac, Finkel et McKenzie 2013) mais qui est strictement plus forte. La définition ci-dessus correspond à la notion usuelle.
- Cadilhac, Finkel et McKenzie 2012
- Le nom vient de que ces langages sont définis à l'aide de langages réguliers, de contraintes semi-linéaires et de morphismes.
Bibliographie
- Alin Bostan, Arnaud Carayol, Florent Koechlin et Cyril Nicaud, « Weakly-unambiguous Parikh automata and their link to holonomic series », 47th International Colloquium on Automata, Languages, and Programming, , p. 114:1-114:16 (DOI 10.4230/LIPIcs.ICALP.2020.114, lire en ligne, consulté le ).
- Michaël Cadilhac, Alain Finkel et Pierre McKenzie, « Affine Parikh automata », RAIRO Theor. Inf. and Applic., vol. 46, no 4, , p. 511-545 (DOI 10.1051/ita/2012013).
- Michaël Cadilhac, Alain Finkel et Pierre McKenzie, « Unambiguous constrained automata », Int. J. Found. Comput. Sci., vol. 24, no 7, , p. 1099-1116 (DOI 10.1142/S0129054113400339).
- Giusi Castiglione et Paolo Massazza, « On a class of languages with holonomic generating functions », Theoretical Computer Science, vol. 658, , p. 74–84 (DOI 10.1016/j.tcs.2016.07.022).
- Thomas Colcombet, « Unambiguity in automata theory », dans Jeffrey Shallit et Alexander Okhotin, Descriptional Complexity of Formal Systems - 17th International Workshop, Springer, coll. « LectureNotes in Computer Science » (no 9118), (DOI 10.1007/978-3-319-19225-3_1), p. 3–18.
- Oscar H. Ibarra, « Reversal-bounded multicounter machines and their decision problems », Journal of the ACM, vol. 25, no 1, , p. 116-133 (DOI 10.1145/322047.322058).
- Felix Klaedtke et Harald Rueß, « Monadic second-order logics with cardinalities », dans Automata, Languages and Programming, 30th International Colloquium, Springer, coll. « LectureNotes in Computer Science » (no 2719), (DOI 10.1007/3-540-45061-0_54), p. 74–84.
- Paolo Massazza, « Holonomic functions and their relation to linearly constrained languages », RAIRO - Informatique Théorique et Applications, vol. 27, no 2, , p. 149-161 (DOI 10.1051/ita/1993270201491).
Articles liés
- Portail de l'informatique théorique