Somme des différences absolues transformées

La Somme des différences absolues transformées ou SATD pour Sum of absolute transformed differences est un mesure très utilisée en compression vidéo pour évaluer la qualité vidéo d'un bloc pendant l'exécution de l'estimation de mouvement. Cette étape constitue avec la compensation de mouvement l'encodage d'une image par prédictions inter ou prédictions temporelles. En résumé, l'estimation de mouvement permet de chercher dans une image de référence les blocs similaires au bloc à encoder (bloc source) afin de profiter des redondances temporelles et d'encoder seulement le mouvement à partir du vecteur qui les relie et la différence de contenu entre le bloc source et le meilleur de blocs recherchés. Le choix du meilleur bloc est réalisé à partir d'une mesure d'évaluation telle que la SATD. En général, le bloc choisi est celui dont la distorsion avec le bloc source est minimale.

La SATD est calculée à partir d'un bloc de résidus qui correspond à la différence de pixel entre le bloc choisi et le macrobloc source, auquel on applique une transformée dans le domaine fréquentiel, souvent une transformée de Hadamard. Chaque composante du bloc résiduel ainsi transformé est additionnée en valeur absolue afin d'obtenir la SATD. La transformée en elle-même est souvent exécutée à partir de petits blocs plutôt qu'au niveau du macrobloc entier pour des raisons de performances temporelles. Par exemple, dans le codec x264, des séries de blocs 4x4 sont transformées plutôt que réaliser une transformée au niveau bloc 16x16 bien trop gourmande en CPU.

Comparaison avec d'autres mesures

La SATD est plus lente que la plupart des mesures dont la somme des différences absolues (SAD), à la fois à cause de sa plus grande complexité et du fait que des instructions MMX et SSE2 spécifiques à la SAD existent permettant d'être plus rapide que la SATD qui n'en possède pas. Cependant, la SATD peut également être optimisé considérablement avec des instructions de type SIMD sur des CPUs plus modernes. L'avantage majeur de la SATD est sa qualité de prédiction plus précise à la fois sur des critères d'un point de vue objectif (PSNR ou SSIM) que d'un point de vue subjectif comme l'œil humain. Ainsi, elle est souvent utilisée par des encodeurs vidéo, comme une manière d'estimer la distorsion explicitement, tel que l'encodeur de Theora (depuis la version 1.1 alpha2), mais aussi en tant que mesure optionnelle pour la recherche étendue de mouvement, que l'on trouve dans l'encodeur VC-1 de Microsoft. En x264, elle permet d'établir une précision des vecteurs de mouvement au sous-pixel : demi-pixel ou quart de pixel.

Références

(en) E. G. Richardson, H.264 and MPEG-4 Video Compression: Video Coding for Next-generation Multimedia, Chichester, John Wiley & Sons Ltd., septembre 2003 (ISBN 0-470-84837-5)
(en) Thomas Wiegand, Gary J. Sullivan, « “Overview of the H.264/AVC Video Coding Standard », sur http://ip.hhi.de, IEEE, 2003 (consulté le 19 janvier 2011)

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Sum of absolute transformed differences » (voir la liste des auteurs).

Annexes

Articles connexes

Liens externes

Portail de l’informatique
Portail de l’imagerie numérique

Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.