Table des caractères Unicode/U0E00
Table des caractères Unicode U+0E00 à U+0E7F.
Thaï
Lettres, signes voyelles ou de ton, chiffres, signes de ponctuation et symbole monétaire utilisés pour l’écriture thaïe.
Les caractères U+0E31, U+0E34 à U+0E3A, U+0E47 à U+0E4E sont des signes diacritiques se combinant avec le caractère qu’ils suivent ; ils sont combinés ici avec la lettre thaïe ko kaï (ka) « ก » (U+0E01) à des fins de lisibilité.
Noter que les 5 voyelles antéposées suivantes :
- U+0E40 (เ) LETTRE THAÏE SARA É
- U+0E41 (แ) LETTRE THAÏE SARA Ë
- U+0E42 (โ) LETTRE THAÏE SARA O
- U+0E43 (ใ) LETTRE THAÏE SARA AÏ MAÏMOUAN
- U+0E44 (ไ) LETTRE THAÏE SARA AÏ MAÏMALAÏ
sont des exceptions à la règle Unicode usuelle de codage dans l’ordre logique des caractères : ils sont codés dans les textes avant la lettre de base, bien qu’ils se prononcent après elle (ils sont aussi à gauche de cette lettre de base). Ces exceptions sont liées à la compatibilité avec des normes antérieures à Unicode. On doit en tenir compte aussi dans la délimitation linguistique des grappes de graphèmes insécables. Dans la table ci-dessous, ces caractères sont montrés associés avec la lettre thaïe ko kaï (ka) « ก » (U+0E01), codée après chacun de ces caractères.
Voir aussi
Liens externes
- (en) [PDF] Thai, tableau dans le site Unicode
Articles connexes
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Grec et copte
- Arménien
- Hébreu
- Arabe
- Syriaque
- N’ko
- Samaritain
- Mandéen
- Arabe étendu – B
- Dévanâgarî
- Bengalî
- Cingalais
- Thaï
- Tibétain
- Birman
- Géorgien
- Éthiopien
- Syllabaires autochtones canadiens
- Ogam
- Runes
- Hanounóo
- Khmer
- Mongol
- Limbou
- Bouguis
- Taï tham (ou lanna)
- Balinais
- Batak
- Lepcha
- Ol tchiki
- Extensions védiques
- Ponctuation générale
- Exposants et indices
- Symboles techniques divers
- Casseau
- Symboles mathématiques divers – A
- Symboles mathématiques divers – B
- Copte
- Tifinaghe
- Ponctuation — supplément
- Symboles et ponctuation CJC
- Katakana
- Lissou
- Vaï
- Cyrillique étendu – B
- Bamoun
- ’Phags pa
- Saurachtra
- Dévanâgarî étendu
- Kayah-li
- Rejang
- Javanais
- Cham
- Taï viêt
- Meitei mayek
- Formes de présentation arabes – A
- Formes verticales
- Formes de compatibilité CJC
- Petites variantes de forme
- Formes de demi et pleine chasse
- Nombres égéens
- Ougaritique
- Vieux perse
- Araméen impérial
- Phénicien
- Lydien
- Kharochthî
- Sud-arabique antique
- Avestique
- Brâhmî
- Kaïthî
- Multanais
- Cunéiforme – nombres et ponctuation
- Mrou
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Arabe
- N’ko
- Dévanâgarî
- Bengalî
- Gourmoukhî
- Goudjarâtî (ou gujrâtî)
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Kannara
- Malayâlam
- Thaï
- Lao
- Tibétain
- Birman
- Éthiopien
- Khmer
- Mongol
- Limbou
- Nouveau taï-lue
- Khmers – symboles
- Taï tham (ou lanna)
- Balinais
- Soundanais
- Lepcha
- Ol tchiki (ou santâlî)
- Exposants et indices
- Formes numérales
- Alphanumériques délimités
- Casseau
- Ponctuation CJC
- Kanboun
- Lettres et mois CJC délimités
- Compatibilité CJC
- Vaï
- Bamoun
- Formes numériques communes indiennes
- Saurachtra
- Dévanâgarî étendu
- Kayah-li
- Javanais
- Cham
- Meitei mayek
- Formes de demi et pleine chasse
- Nombres égéens
- Nombres grecs antiques
- Italique antique
- Gotique
- Vieux perse
- Osmanya
- Araméen impérial
- Phénicien
- Kharochthî
- Ancien sud-arabique
- Parthe des inscriptions
- Pehlevi des inscriptions
- Hanifi
- Chiffres rûmîs
- Brahmî
- Sora sompeng
- Chakma
- Charada
- Tâkrî
- Cunéiforme – nombres et ponctuation
- Mrou
- Chiffres-bâtonnets chinois
- Symboles mathématiques alphanumériques
- Alphanumériques délimités – supplément
Nouveaux blocs ajoutés :
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Latin étendu – A
- Latin étendu – B
- Latin étendu – alphabet phonétique international
- Lettres modificatives avec chasse
- Diacritiques
- Grec et copte
- Cyrillique
- Arménien
- Hébreu
- Arabe
- Dévanâgarî
- Bengalî
- Gourmoukhî
- Gudjarâtî
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Kannara
- Malayâlam
- Thaï
- Laotien
- Géorgien
- Hangûl – jamos
- Latin étendu – supplément
- Pavés
- Lettres et mois CJC délimités
- Zone à usage privée : 1re partie, 2e partie
- Caractères spéciaux
- ...
Notes et références
- DerivedAge.txt, base de données sur le site Unicode.
- Portail de l’informatique
- Portail de l’écriture