UTF
La norme Unicode définit plus de cent mille caractères. Chaque caractère abstrait est identifié par un nom unique (un en anglais et un en français) et associé à un nombre entier positif appelé son point de code (ou position de code).
Sigles de 2 caractères |
► Sigles de 3 caractères |
Sigles de 4 caractères |
Sigles de 5 caractères |
Sigles de 6 caractères |
Sigles de 7 caractères |
Sigles de 8 caractères |
UTF (pour Unicode Transformation Format en anglais) désigne les méthodes de conversion possibles pour le transport informatique de ces nombres :
- UTF-1 (en), une méthode de conversion annulée et remplacée par UTF-8, son objectif était de maximiser la compatibilité avec ISO/CEI 2022 ;
- UTF-7, une méthode de conversion considérée comme obsolète, n'a jamais fait partie de la norme Unicode, initialement décrite dans le RFC 1642 ;
- UTF-8, conversion par une suite de codes de 8 bits ;
- UTF-EBCDIC, conversion similaire à UTF-8 mais conçu pour être compatible avec l’EBCDIC ;
- UTF-16, conversion par une suite de codes de 16 bits ;
- UTF-32, conversion par une suite de codes de 32 bits.
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.