Diacritiques de l'alphabet latin

L'alphabet latin a connu, d'abord dans le monde occidental puis après les différentes périodes de colonisation, partout dans le monde, une extension géographique considérable : tout au long de son histoire, il a été conservé ou emprunté par de nombreux peuples qui s'en sont servis pour noter leur langue. À l'origine destiné à la langue des Romains, qu'il ne transcrivait déjà pas très fidèlement, son nombre réduit de lettres en a montré les limites : les langues l'utilisant ont dû, pour étendre les possibilités d'une transcription plus fidèle, soit façonner de nouvelles lettres, soit créer de nouvelles unités au moyen de plusieurs signes (comme les digrammes) soit, enfin, modifier des lettres existantes au moyen de diacritiques.

Les signes obtenus peuvent être considérés comme de nouveaux graphèmes (ils sont dans ce cas inclus dans l'alphabet de la langue), ou comme des variantes du graphème fondamental qui les porte (ils ne sont alors pas répertoriés dans l'alphabet). Cette distinction est très importante pour le classement alphabétique des mots d'un dictionnaire, par exemple. Ainsi, en espagnol, la lettre diacritée ñ (n tildé) est considérée comme une lettre indépendante, classée à la suite de n, tandis qu'en français aucune des variantes diacritées de e (soient é, è, ê et ë) n'est classée autrement que si elle ne portait aucun diacritique. En espagnol, toujours, á, é, í, ó, ü et ú ne sont cependant pas considérées comme des graphèmes mais comme des variantes. A contrario, en espéranto les lettres diacritées sont des graphèmes à part entière.

L'alphabet phonétique international fait grand usage de diacritiques ; ceux qui lui sont propres seront aussi traités dans cette série d'articles. Enfin, les diacritiques utilisés en français font l'objet d'articles supplémentaires.

Introduction

L'utilisation de diacritiques s'est avérée très féconde et le mouvement s'est accéléré au XVIIIe siècle quand il s'est agi de transmettre rigoureusement des textes ou des énoncés de langues lointaines qu'on découvrait : les transcriptions et translittérations en lettres latines, c'est-à-dire la romanisation, a nécessité l'utilisation en nombre important de diacritiques. Les divers alphabets phonétiques, issus des recherches nouvelles en phonétique et phonologie, ont eux aussi eu recours à ce procédé pour étendre leur nombre de caractères. Sachant, enfin, que de nombreuses langues ne sont pas écrites ou depuis peu, c'est maintenant presque exclusivement en alphabet latin étendu qu'elles sont notées par les linguistes, au moyen d'outils comme l'alphabet phonétique international. L'alphabet pan-nigérian est à cet égard représentatif.

Apex et i long latins

Dans les premiers temps de l'alphabet latin, il n'existait aucune ponctuation (si l'on exclut l'usage sporadique du point médian séparateur de mots), aucun diacritique. Cependant, dès la fin du IIe siècle av. J.-C., apparaît un premier diacritique, dit apex (en latin : « pointe »), qui n'est pas d'usage systématique, tant s'en faut, ni toujours utilisé à « bon » escient, si son rôle est bien d'indiquer la présence de voyelles longues. Il est assez courant sous l'Empire romain. L'apex, qui ressemble à un accent aigu, ne se place cependant pas sur la lettre I qui, elle, est tracée plus grande que la normale. L'apex est légèrement décalé sur la droite de la voyelle qui le porte et que l'i long dépasse en hauteur mais ne descend pas sous la ligne de base.

Dans les images ci-dessus, on lit :

  • CORVꟾNUS et SꟾLANUS (à gauche) ;
  • FÉCIT (au centre) ;
  • RÓMVLVS·MÁRTIS·FꟾLIVS·VRBEM·RÓMAM (à droite ; noter les points médians séparateurs).

Dans les ouvrages didactiques, on marque la quantité longue des voyelles latines au moyen du macron, signe inventé par les grammairiens grecs : on aurait dans ce cas Corvīnus, fēcit, Rōmulus Mārtis fīlius Urbem Rōmam.

L'apex et l'i long apportent des informations importantes sur la phonologie latine : en effet, outre par la connaissance de la phonétique historique de cette langue, c'est très souvent par la scansion des vers latins qu'on connaît les quantités vocaliques des mots. Or, la scansion ne révèle que la quantité des syllabes : pour la métrique latine, /mar/, dans Martis, est une syllabe longue (car fermée) quelle que soit la quantité du /a/. L'apex sur la lettre A indique ici que la syllabe longue est composée d'une voyelle longue.

Signes abréviatifs et éditoriaux devenus des diacritiques

L'apex et le i long ne se sont pas suffisamment répandus pour être passés dans les usages postérieurs et se limitent au seul latin (si l'on excepte le tchèque, le slovaque et le hongrois, qui utilisent l'apex jusque dans leur version moderne). Ce qui, en revanche, a pris une ampleur importante depuis les débuts de l'alphabet latin, ce sont les marques indiquant des abréviations présentes en épigraphie puis, et surtout, dans les manuscrits.

Au départ, les signes et procédés utilisés pour signaler de telles abréviations ne sont certes pas des diacritiques au sens réel du terme mais, changeant de fonction au fil des années, ils ont pu par la suite (généralement au Moyen Âge) le devenir, les scribes étant de plus en plus souvent confrontés au problème de la notation de leur langue natale par un alphabet qui s'y prête mal. En effet, la langue latine, après la chute de l'Empire romain, avait cessé d'être – pour ainsi dire – la seule qui fût écrite.

Parmi les signes abréviatifs réutilisés, on compte le titulus titre » ; le mot est devenu tilde), trait suscrit (devenu ensuite un trait ondulé) utilisé pour indiquer qu'une lettre, le plus souvent une nasale, a été omise pour des raisons d'économie de place (ou de matériau). Par exemple, annu(m) a pu être écrit an̅u dans les manuscrits espagnols pour devenir enfin año, « an », en castillan, puisque /nn/ latin est passé à /ɲ/ (de gnon) dans cette langue.

Des lettres suscrites ou souscrites sont aussi utilisées dans une fonction diacritique ; c'est le cas du z qui, d'abord placé après un c pour signaler qu'il devait se prononcer /ts/ (maintenant /s/) devant des voyelles comme a, o et u, a été finalement écrit au-dessous du c. Ce z souscrit, nommé zedilla en castillan, soit « petit z », est devenu notre cédille (voir aussi Lettre diacritique). Il a cependant existé, avant la cédille, un diacritique graphiquement proche (ou proche d'un ogonek) attesté dès le VIe siècle en onciale sous le e, dit alors E caudata e doté d'une queue »), remplaçant parfois le digramme ae (écrit parfois æ, coutume qui s'est étendue par la suite) servant à noter le plus souvent un /ɛ/ ouvert. Il est notable que cette lettre, qu'on peut représenter ici par ę (avec un ogonek) ou ȩ (avec une cédille), ait été conservée dans la transcription des romanistes alors que c'est le digramme ae (maintenant présenté sous la forme liée æ et nommée ash) qui l'ait été dans la transcription des langues germaniques (sachant que ę était aussi utilisé dans les manuscrits en vieil anglais de l'onciale insulaire).

Enfin, des symboles éditoriaux plus généraux (servant à indiquer des erreurs du copiste, par exemple) ont aussi pu accéder au statut de diacritiques ; le cas se présente avec le punctum delens point effaçant »), très fréquent dans les manuscrits irlandais, qui signale que la lettre le portant est une erreur et ne doit pas se faire entendre. Par extension, il signale ensuite les lettres muettes issues d'une mutation consonantique puis toutes les mutations consonantiques ; ainsi en gaélique mo ḟele, « mon incantation », mo ċú, « mon chien » (écrits actuellement mo fhele, mo chú). Consulter Point suscrit pour plus de détails.

Certains de ces signes ont donné des symboles typographiques, comme le croisillon (#), ancien N surmonté d'un titulus, abréviation pour numerus, « numéro ».

Liste des diacritiques

Différents diacritiques utilisés par l’alphabet latin.

Inscrits

Les diacritiques inscrits sont placés à travers la lettre qu'ils modifient :

Dans la majorité des cas, la lettre ainsi modifiée est perçue comme différente dans l’alphabet qui l’utilise (cette lettre modifiée ayant sa propre codification dans Unicode, considérée comme distincte de la combinaison de la lettre de base et du diacritique).

Suscrits

Les diacritiques suscrits sont placés au-dessus de la lettre qu'ils modifient. Ils sont divisés en deux sous-catégories :

Des diacritiques adscrits sans attachement (voir ci-dessous) se rencontrent aussi parfois en lieu et place de certains diacritiques suscrits sans attachement, lorsque la lettre de base est capitale et l’interlignage est serré, reproduisant ainsi le même procédé habituellement utilisé avec l’alphabet grec, car cela facilite leur différenciation visuelle. Une autre solution rencontrée fréquemment est de permettre l’attachement de ces diacritiques suscrits à la lettre de base.

Souscrits

Les diacritiques souscrits sont placés en dessous de la lettre qu'ils modifient. Ils sont divisés en deux sous-catégories :

Adscrits

Les diacritiques adscrits sont placés sur le côté de la lettre qu'ils modifient. Ils sont divisés en trois sous-catégories :

  • les diacritiques adscrits à droite avec attachement :
  • les diacritiques adscrits à gauche sans attachement:
  • les diacritiques adscrits à droite sans attachement :
    •  : apostrophe (en remplacement du háček avec les minuscules t, d, l et la majuscule L) ;
    • ŀ : point médian (utilisé en catalan pour marquer la gémination du L (ŀl) et la distinguer du digramme ll, il marque aussi une coupure syllabique au milieu d'un morphème, c’est une forme différente du trait d’union qui ne sépare que des morphèmes distincts ; il est également utilisé en arpitan et en occitan gascon).

Tableau récapitulatif

Le tableau suivant dresse, pour les diacritiques les plus fréquents, une liste des lettres latines utilisées portant un seul diacritique pouvant être représentées avec Unicode (précomposés ou non) :

AÆɅBCDEƐƏƎFGƔHIƖJKLλMNOƆPQRSTÞUƱVƲWXYZƷʕ
Accent aigu ÁǼⱭ́Ʌ́ĆÉƐ́Ə́Ǝ́ǴÍƖ́ĹŃÓƆ́ŔŚÚƲ́ÝŹƷ́
Accent circonflexe ÂÆ̂Ɑ̂Ʌ̂ĈÊƐ̂Ə̂Ǝ̂ĜĤÎĴÔƆ̂ŜÛŴŶ
Accent circonflexe souscrit
Accent grave ÀÆ̀Ɑ̀Ʌ̀ÈƐ̀Ə̀Ǝ̀ÌƖ̀ǸÒƆ̀ÙƲ̀
Apostrophe
Barre ȺɃȻ, Đ[1]Ǥ, ĦƗɈ, , , Ł, ȽƛƟ, , Ø, , Ɍ, Ŧ, Ⱦ, Ʉ, ɎƵ
Brève ĂĔĞĬŎŬ
Brève inversée ȂȆȊȎȒȖ
Brève souscrite
Brève inversée souscrite
Caron ǍⱭ̌ČĎĚƐ̌Ə̌Ǝ̌ǦȞǏǨĽŇǑƆ̌ŘŠŤǓŽǮ
Cédille ÇȨƐ̧Ə̧ĢĶĻŅƆ̧ŖŞŢ
Corne ƠƯ
Crochet ƁƇƊƓƘƤƬƳ
Double accent aigu ŐŰ
Macron ĀǢĒƐ̄Ə̄Ǝ̄ĪŌƆ̄ŪȲ
Macron souscrit Ɔ̱
Ogonek ĄĘĮǪƆ̨Ų
Ogonek suscrit A᷎E᷎I᷎O᷎U᷎Y᷎
Point souscrit Þ̣
Point suscrit ȦĊĖĠİȮŻ
Rond en chef ÅŮ
Rond souscrit
Tilde ÃÆ̃Ʌ̃Ɛ̃Ə̃ĨƖ̃ÑÕƆ̃Ũ
Tilde souscrit
Tréma ÄÆ̈Ʌ̈ËƐ̈ÏÖƆ̈ÜŸ
Tréma souscrit
Virgule souscrite ȘȚ
Virgule suscrite Ɣ̓ʕ̓

Lettres latines avec deux diacritiques :

12345678910111213141516
Point en chef1·ṥ Ṥṧ Ṧǡ Ǡ
ȱ Ȱ
ṩ Ṩ
Accent aigu2ṥ Ṥ·ắ ẮḉḈấ Ấ
ế Ế
ố Ố
ḯ Ḯ
ǘ Ǘ
ḗ Ḗ
ṓ Ṓ
ǻ Ǻǿ Ǿṍ Ṍ
ṹ Ṹ
ớ Ớ
ứ Ứ
Brève3ắ Ắ·ḝ Ḝằ Ằẵ Ẵẳ Ẳặ Ặ
Caron4ṧ Ṧ·ǚ Ǚ
Cédille5ḉ Ḉḝ Ḝ·
Accent circonflexe6ấ Ấ
ế Ế
ố Ố
·ầ Ầ
ề Ề
ồ Ồ
ẫ Ẫ
ễ Ễ
ỗ Ỗ
ẩ Ẩ
ể Ể
ổ Ổ
ậ Ậ
ệ Ệ
ộ Ộ
Tréma7ḯ Ḯ
ǘ Ǘ
ǚ Ǚ·ǜ Ǜǟ Ǟ
ȫ Ȫ
ǖ Ǖ
ṏ Ṏ
Accent grave8ằ Ằầ Ầ
ề Ề
ồ Ồ
ǜ Ǜ·ḕ Ḕ
ṑ Ṑ
ờ Ờ
ừ Ừ
Macron9ǡ Ǡ
ȱ Ȱ
ḗ Ḗ
ṓ Ṓ
ǟ Ǟ
ȫ Ȫ
ṻ Ṻ
ḕ Ḕ
ṑ Ṑ
·ǭ Ǭȭ Ȭḹ Ḹ
ṝ Ṝ
Ogonek10ǭǬ·
Rond en chef11ǻ Ǻ·
Barrés12ɟǿ Ǿ·
Tilde13ṍ Ṍ
ṹ Ṹ
ẵ Ẵẫ Ẫ
ễ Ễ
ỗ Ỗ
ṏ Ṏȭ Ȭ·ỡ Ỡ
ữ Ữ
Cornu14ớ Ớ
ứ Ứ
ờ Ờ
ừ Ừ
ỡ Ỡ
ữ Ữ
·ở Ở
ử Ử
ợ Ợ
ự Ự
Crochet15ẳ Ẳẩ Ẩ
ể Ể
ổ Ổ
ở Ở
ử Ử
·
Point souscrit16ṩ Ṩặ Ặậ Ậ
ệ Ệ
ộ Ộ
ḹ Ḹ
ṝ Ṝ
ợ Ợ
ự Ự
·

Diacritiques en français

Le français utilise les diacritiques suivants (les liens renvoient vers des articles spécifiques à l'utilisation de ces diacritiques dans la langue française et non aux articles généraux) :

  • l'accent aigu, sur la lettre e (é) ;
  • l'accent grave, sur les lettres a (à), e (è) et u (ù). C'est à l'initiative de Corneille que cet accent a été introduit en français, afin de faire la différence entre la voyelle ouverte (è) et la voyelle fermée (é), qui étaient jusque-là notées de la même manière (é ou e) ;
  • l'accent circonflexe, sur les lettres a (â), e (ê), i (î), o (ô) et u (û), d'un usage relativement complexe ;
  • le tréma, sur les lettres e (ë) et i (ï), o (ö) et u (ü) pour des mots empruntés à d'autres langues, pour forcer la prononciation d'une voyelle normalement muette parce qu'utilisée dans un digramme (maïs, aigüe...), ou encore sur y (ÿ) dans de très rares cas de noms propres ;
  • la cédille au-dessous du c (ç).
  • le tilde (~), utilisé pour quelques rares mots de la langue française pour les hispanismes. Dans le Petit Robert[2], on trouve 'cañon' ou 'canyon'. On y trouve 'señorita' qui désigne alors un petit cigare mais pas 'seniorita'. Le TLFi possède des entrées pour 'cañon'[3] et 'señor'[4] et mentionne aussi 'doña'[5].
    • le tilde était aussi couramment utilisé pour les abréviations dans les manuscrits du Moyen Âge (bõ pour bon, pour que, etc.).

Notes et références

Voir aussi

Articles connexes

  • Portail de l’écriture
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.