Codage zeta
Le codage zeta ou codage de Boldi-Vigna est un codage entropique inventé par Paolo Boldi et Sebastiano Vigna en 2003 et utilisé essentiellement en compression de graphes.
Principe
Le codage zeta d'un entier naturel dépend d'un paramètre et se fait en deux étapes :
- le codage de l'exposant de la plus grande puissance de inférieure ou égale à avec un codage unaire ;
- le codage de la différence entre et cette plus grande puissance avec un codage binaire tronqué.
Mathématiquement, pour coder un entier , on code d'abord en unaire, puis en binaire tronqué avec un alphabet de taille
On appelle la fonction associant à un entier naturel son code zeta paramétré par .
Le codage zeta de paramètre 1 (utilisant la fonction ) est équivalent au codage gamma et produit exactement les mêmes codes.
Codage des entiers relatifs
Comme pour les codages gamma, delta et omega, il est possible de coder des entiers relatifs avec le codage zeta en utilisant une bijection pour transformer les nombres négatifs ou nul en nombres strictement positifs avant le codage à proprement parler. Après le décodage, l'opération inverse doit être effectuée pour retrouver les entiers relatifs d'origine.
Longueur du code
Partie en code binaire tronqué
Le nombre codé en binaire tronqué nécessite un alphabet de taille . Il peut être divisé en groupes de symboles. Si bits de poids faible sont nécessairement écrits, l'indice du premier groupe peut-être tronqué à bits de poids fort. Les indices suivants sont exprimés avec bits de poids fort.
Le nombre appartient au premier groupe si :
avec le reste de la division entière .
Partie en code unaire
Le nombre est codé sur bits.
En récapitulatif, le nombre N est codé sur bits, avec et définis par la division entière .
Exemples
Décimal | Binaire | Code gamma | Code zeta k = 1 |
Code zeta k = 2 |
Code zeta k = 3 |
Code zeta k = 4 |
---|---|---|---|---|---|---|
1 | 00001 | 0 | 0 | 0 0 | 0 00 | 0 000 |
2 | 00010 | 10 0 | 10 0 | 0 10 | 0 010 | 0 0010 |
3 | 00011 | 10 1 | 10 1 | 0 11 | 0 011 | 0 0011 |
4 | 00100 | 110 00 | 110 00 | 10 000 | 0 100 | 0 0100 |
5 | 00101 | 110 01 | 110 01 | 10 001 | 0 101 | 0 0101 |
6 | 00110 | 110 10 | 110 10 | 10 010 | 0 110 | 0 0110 |
7 | 00111 | 110 11 | 110 11 | 10 011 | 0 111 | 0 0111 |
8 | 01000 | 1110 000 | 1110 000 | 10 1000 | 10 00000 | 0 1000 |
Voir aussi
Bibliographie
- Paolo Boldi, Sebastiano Vigna, « The WebGraph Framework II: Codes for the World-Wide Web », Proceedings of the Data Compression Conference, pp. 528, .