Guerre du volume

La guerre du volume (en anglais, loudness war), aussi appelée la course au volume, décrit en la critiquant une pratique de l'industrie du disque et des stations de radio et de télévision tendant à réduire la dynamique sonore d'une chanson pour augmenter la sensation subjective de volume sonore (sonie) tout en gardant le même niveau maximal lors du mastering des albums et de leur diffusion radiodiffusée ou télévisuelle.

La tendance à l'augmentation du volume, par exemple, sur le titre Something des Beatles au fur et à mesure des 4 CD sortis depuis 1983.

Cinq facteurs suffisent pour expliquer cet état de fait :

  1. le niveau maximal ne peut dépasser les capacités du média ;
  2. le fait que très peu d'artistes et de producteurs sonores acceptent de « sonner » moins fort que les autres ;
  3. grâce aux appareils portables, on écoute désormais la musique dans des environnements bruyants (transports en commun avec les baladeurs, automobile) où la dynamique sonore possible est réduite ;
  4. une partie du public utilise la musique, la radio ou la télévision uniquement pour masquer les autres bruits (musique d'ascenseur) ;
  5. l'industrie électronique a produit les instruments pour comprimer la dynamique et augmenter la sonie automatiquement.

Les deux premiers facteurs existent depuis l'origine de l'enregistrement musical commercial. Les deux derniers sont intervenus avec l'évolution technique, dont certains développements, comme les compresseurs de dynamique et autres processeurs finaux découlent des deux tendances de fond[1].

La fabrication des sons forts à faible dynamique

La préférence pour le son fort

Si l'on présente à des personnes prises au hasard deux enregistrements identiques au volume sonore près, il est probable que le plus bruyant soit perçu comme « sonnant » mieux. La psychoacoustique a montré que plus le son est fort, plus il retient notre attention, et que nous le préférons pour de courtes périodes d'exposition[2]. Les artistes, comme les auditeurs en général, ont tendance à exiger que la sonie de leurs enregistrements soit au moins égale à celles de leurs concurrents[1].

La sonie, c'est-à-dire la perception de la force d'un son, dépend de la pression acoustique (ou du signal électrique qui la représente), mais n'est pas identique. L'oreille réagit différemment aux sons selon leur fréquence, leur intensité et leur durée. Si deux composantes sonores se trouvent dans la même bande de fréquence ou si elles se trouvent dans deux bandes différentes, leur contribution à la sonie est différente. Le niveau du signal représente très mal l'impression sonore[3],[4]. Deux signaux possédant le même niveau maximal peuvent avoir des sonies très différentes. Les limites techniques des médias obligeant à limiter le niveau maximal ne garantissent donc pas à elles seules des sonies comparables. Au contraire, elles stimulent un art de faire plus fort avec les mêmes limites de niveau.

L'écoute dans des environnements bruyants

Comme les sons forts masquent les sons faibles, lorsqu'on écoute de la musique dans des environnements tels qu'en voiture, dans un train, en avion, dans une cuisine ou une rue animée, les parties faibles du son deviennent difficiles à percevoir. Quand les gens écoutaient la musique principalement sur leur électrophone ou à la radio qui trônait dans le salon, donc dans une ambiance calme, les producteurs de radio et de musique enregistrée avaient intérêt à augmenter la qualité expressive de leurs programmes et disques avec une assez grande dynamique. Mais depuis bien longtemps[évasif], les producteurs de musique de dance, destinée à être diffusée dans l'ambiance plus bruyantes des fêtes et réunions sociales, ont cherché à fabriquer des enregistrements plus « chauds ». De même, les radios destinées aux automobilistes compriment le signal pour pouvoir être entendues malgré le bruit.

Avec l'augmentation de la consommation de biens électroniques, on trouve des radios sur les lieux de travail et dans les cuisines. La popularisation du baladeur dans les années 1980 rend générale la consommation de la musique dans des ambiances bruyantes, et avec un système peu capable de reproduire les basses et d'isoler les auditeurs des sons graves se trouvant dans l'ambiance sonore environnante. Ces auditeurs sont susceptibles de préférer un son à faible dynamique, quel que soit le niveau sonore auquel ils choisissent de l'écouter. Ceci aboutit à une intensification de la « guerre du volume » en raison de la compétition à laquelle se livrent les stations de radio pour attirer des auditeurs, et les studios d'enregistrement pour attirer des clients.

L'utilisation de nouvelles machines de traitement de signal

Répondant à la demande des stations de radio, les fabricants de matériel électronique ont d'abord produit des appareils capables d'empêcher le signal audio arrivant aux émetteurs de dépasser les limites admissibles (limiteurs), puis des compresseurs qui suivent automatiquement les variations du signal électrique pour en augmenter progressivement le niveau aux moments où il est plus faible que le maximum, puis des dispositifs plus sophistiqués capable de le faire en privilégiant les bandes de fréquences donnant une plus grande sonie.

L'introduction de la technologie numérique a à la fois durci la limite maximale du signal, qu'il n'est absolument plus possible de dépasser[évasif], même pour un millième de seconde[pas clair], et permis des traitements plus élaborés[Quoi ?][évasif]. Ces nouveaux outils rendent accessibles des traitements qui auraient été soit impossibles, soit très longs et coûteux autrefois. Ils sont désormais utilisés de façon quotidienne et routinière, et une musique peut passer à travers plusieurs de ces processeurs avant d'arriver aux oreilles du public.

Les inconvénients de la faible dynamique

Si personne ne veut sonner moins fort que ses voisins, un son fort en permanence, avec une faible dynamique (peu de différence entre les passages les plus bruyants et les plus calmes), finit par lasser, et par causer une fatigue auditive. Selon le producteur David Bendeth (en), cité par Robert Levine du magazine musical Rolling Stone, ce type d'enregistrement est fatigant pour l'auditeur et manque de puissance émotionnelle[5].

La « course au volume » a aussi pour conséquence d'ébranler les jugements de valeur sur la qualité acoustique et musicale. Non seulement la dynamique et les effets dramatiques qu'elle permettait se trouvent dévalorisés, mais la recherche de la sonie maximale renverse le jugement sur la distorsion. Un enregistrement de niveau si élevé que le signal dépasse fréquemment le niveau maximal du média, aboutissant à une distorsion par écrêtage clipping, « sonne » plus fort qu'un enregistrement identique et au même niveau moyen, mais dont le niveau élevé aurait été produit par un système sans écrêtage, parce que cette distorsion crée des composantes harmoniques dans la région où l'oreille est la plus sensible. Si l'on prend comme critère dominant la sonie, il faut renoncer à la Hi-Fi. Cela n'arrive pas sans polémiques dans le milieu professionnel.

Comme ni les systèmes de son dans les voitures, ni les baladeurs voire les téléphones cellulaires servant de nos jours à écouter de la musique n'ont de conditionneur intégré qui permette d'adapter la dynamique au niveau du bruit environnant, on produit les musiques avec un seul mixage, pour toutes les circonstances. Ce mixage recherche la sonie maximale, et entraînera des modifications irréversibles du son. Ainsi, dans les cas où une ambiance calme pourrait faire préférer un mixage plus expressif avec plus de dynamique (comme dans une voiture à l'arrêt ou lors d'une écoute au casque chez soi, tard le soir), on reste avec la même version dynamiquement déficiente.

La résolution du problème

Les entreprises de télévision ont pris des mesures réglementaires pour contrôler la « course au volume ».

Bob Orban et Frank Foti, des experts sonores, ont déjà montré que les mixages trop optimisés pour le volume sont dégradés plus que les autres quand ils passent à travers des conditionneurs des radios[6]. La même chose pourrait se produire si les appareils domestiques étaient équipés de systèmes comparables, les mixages plus dynamiques deviendraient plus attrayants. Les formats de diffusion générale comprennent déjà les métadonnées nécessaires pour informer les appareils sur le niveau maximal du programme, permettant d'effectuer le traitement au niveau de l'auditeur[7].

Histoire

Exemples d'albums concernés

Voici une liste de quelques-uns des albums critiqués pour leur qualité sonore (du fait d'une compression dynamique excessive générant de la distorsion) :

AnnéeArtisteAlbumCommentaires
1999Red Hot Chili PeppersCalifornication[8],[9]
2002Queens of the Stone AgeSongs for the Deaf (2002)[9]
2002RushVapor Trails[10]
2005Depeche ModePlaying the Angel[11]
2006Christina AguileraBack to Basics[8]
2006Lily AllenAlright, Still[5]
2006Arctic MonkeysWhatever People Say I Am, That's What I'm Not[9]
2006The Flaming LipsAt War with the Mystics a reçu un Grammy Award dans la catégorie Best Engineered Album, Non-Classical[9]
2006Los Lonely BoysSacred (2006)[8]
2007Paul McCartneyMemory Almost Full (2007)[12]
2008MetallicaDeath Magnetic[13]
2008AC/DCBlack Ice[14]
2009Miranda LambertRevolution[15],[16]
2009Alice in ChainsBlack Gives Way to Blue[17]
2009 Dead End Metamorphosis
2010Kanye WestMy Beautiful Dark Twisted Fantasy

Les recommandations ITU BS. 1770 - UER R 128

En 2006, l'Union internationale des télécommunications (UIT, ITU en anglais), un organisme de coordination de l'industrie audiovisuelle, a produit après des études particulières sur la sensation de volume sonore à la réception de la télévision un système d'évaluation de la sonie des programmes, simplifié et libre de droits de propriété industrielle (au contraire du système CBS existant depuis 1981)[18].

La mesure selon cette nouvelle méthode aboutit à un indice dit LUFS (Loudness Unit re. Full Scale, unité de sonie relativement à la pleine échelle numérique). Pour un son pur et continu, un LUFS vaut un dB. Cet indice caractérise chaque programme, qu'il dure une minute comme une publicité ou une heure. Tous les programmes doivent atteindre le même niveau de sonie (LUFS). À l'intérieur du programme, les niveaux peuvent varier instantanément et à court terme[18].

En 2011, l'Union européenne de radio-télévision (UER, EBU en anglais) a repris cette recommandation, en y apportant des changements mineurs et en intégrant des objectifs de dynamique sonore[19].

En normalisant la sonie des programmes selon ces recommandations et non plus seulement le niveau maximum du signal, les entreprises de télévision adhérentes à ces organismes espèrent mettre fin aux plaintes des spectateurs sur les différences de volume entre chaîne et, dans la même chaîne, entre programmes, notamment les publicités. L'égalisation de la sensation de volume sonore devrait mettre fin à la supériorité de programmes qui auraient abandonné toute variation expressive du niveau pour se trouver en permanence au maximum.

Ces recommandations ne s'adressent pas aux entreprises de radio et d'édition de disques.

Points de vue alternatifs

En , Emmanuel Deruty publie un article dans le magazine spécialisé anglais Sound on Sound, dans lequel il défend le point de vue selon lequel la « Loudness War » n’a pas entraîné de réduction des nuances dans la musique moderne[20]. Cet argument est approfondi dans un article du Journal of the Audio Engineering Society écrit par Deruty et Damien Tardieu, et paru en [21].

Deruty et Tardieu critiquent un article de Suhas Sreedhar paru en 2007 dans IEEE Spectrum[22], dans lequel l'auteur décrit le facteur de crête d'un titre musical comme la différence entre les pics et la puissance RMS, appelle ce descripteur "dynamic range", puis explique qu'une faible valeur de "dynamic range" résulte en un contenu similaire à un locuteur humain qui crierait constamment, ce en quoi il ne décrit plus le facteur de crête mais la variabilité dynamique au sens des nuances musicales (de pianissimo à fortissimo).

Selon les auteurs, cette confusion entre deux grandeurs qui décrivent deux phénomènes bien distincts est un facteur déterminant dans ce qu'ils défendent s'avérer être une incompréhension fondamentale du phénomène de la « Loudness war ». Deruty et Tardieu recommandent d'abandonner le terme « dynamic range », dans la mesure où celui-ci désigne simultanément deux phénomènes différents.

Deruty et Tardieu s'emploient dans la suite de l'article à mesurer les évolutions parallèles du facteur de crête et du descripteur LRA recommandé par l’Union européenne de radio-télévision[23], qu'ils considèrent être à même de mesurer les nuances d'un titre musical. Ils observent que si le facteur de crête diminue significativement entre 1985 et 2010, il n'en est pas de même en ce qui concerne le LRA. Ils en concluent que la variabilité macro-dynamique, qu'ils équivalent à la notion de nuance musicale, n'a pas été affectée par la « Loudness war ». Cette conclusion, parue la première fois dans l'édition de de Sound on Sound[20], a été corroborée en par Joan Serrà, dans un article paru dans Nature's Scientific Reports[24].

Les points de vue de Deruty, Tardieu et Serrà ont été remis en question par Ian Shepherd et Bob Katz, qui considèrent que les évolutions dynamiques à petite échelle, ou micro-dynamiques, sont plus à même de mesurer le « dynamic range » que les évolutions dynamiques à grande échelle, ou macro-dynamiques[25],[26]. Il s'agit cependant d'un point de vue sujet à caution, dans la mesure où Esben Skovenborg publie en un article dans lequel il met en garde contre l'utilisation du facteur de crête dans la mesure de la dynamique, lui préférant le LRA utilisé par Deruty, Tardieu et Serrà[27].

En , le point n'est pas tranché de manière définitive. Dans un article publié en 2010, Jon Boley, Michael Lester et Christopher Danner échouent à montrer qu'aucun des deux descripteurs ne soit corrélé à la perception des nuances dans la musique[28]. Par ailleurs, il n'est pas prouvé que le public soit sensible à la compression dynamique, comme le suggère un article publié en par Jens Hjortkjær et Mads Walther-Hansen, dans lequel les auteurs échouent à montrer qu'un panel d'auditeurs considère comme dégradé ou de moins bonne qualité un signal musical de plus en plus compressé[29].

Notes et références

  1. (en) Sarah Jones, « The Big Squeeze: Mastering engineers debate music's loudness wars », Mix,
  2. (en) Mark Donahue, « The Loudness War », Performer Magazine.
  3. (en) « Loudness is not simply sound intensity », sur hyperphysics.phy-astr.gsu.edu.
  4. (en) « Loudness curves », sur hyperphysics.phy-astr.gsu.edu.
  5. (en) Robert Levine, « The Death of High Fidelity », Rolling Stone,
  6. (en) Bob Orban et Frank Foti, « What Happens to My Recording When it's Played on the FM Radio », dans Bob Katz, Mastering Audio, New York, Focal Press, , 2e éd., p. 288-293
  7. (en) Bob Katz, Mastering Audio : The Art and the Science, New York, Focal Press, , 2e éd., p. 181
  8. (en) Joe Gross, « Everything Louder Than Everything Else »(Archive.orgWikiwixArchive.isGoogle • Que faire ?), Austin American-Statesman,
  9. (en) Nick Southall, « Imperfect Sound Forever », Stylus Magazine,
  10. (en) Rip Rowan, « Over the Limit »,
  11. (en) Brian Stagg, « Depeche Mode - Playing The Angel - Another victim of the loudness race »
  12. (en) Tim Anderson, « Will the loudness wars result in quieter CDs? », The Guardian,
  13. (en) « Metallica Face Criticism Over Sound Quality of “Death Magnetic” », Rolling Stone,
  14. (en) Steve Jelbert, « The Big CD: AC/DC - Black Ice », The Times,
  15. (en) Chris Neal, « Everything Louder Than Everything Else »(Archive.orgWikiwixArchive.isGoogle • Que faire ?), sur The9513.com,
  16. (en) Chris Neal, « Miranda Lambert - Revolution », Country Weekly,
  17. (en) Michael Bogart, « 10 great albums of 2009 », sur Examiner.com,
  18. Recommandations ITU BS. 1770-1 et ITU BS. 1770-2
  19. (en) recommandation EBU R 128, accompagnée par la (en) note technique EBU sur la mesure, tandis que la (en) Note technique EBU 3342 définit la dynamique Loudness Range.
  20. (en) Emmanuel Deruty, « Dynamic Range' & The Loudness War », Sound on Sound, (lire en ligne, consulté le )
  21. (en) Emmanuel Deruty, Damien Tardieu, « About Dynamic Processing in Mainstream Music », Journal of the Audio Engineering Society, (consulté le )
  22. (en)The Future of Music: Tearing Down the Wall of Noise
  23. (en) European Broadcasting Union, « EBU Tech 3342: Loudness Range: A measure to supplement loudness normalization in accordance with EBU R 128 », European Broadcasting Union, (consulté le )
  24. (en) Joan Serrà, Álvaro Corral, Marián Boguñá, Martín Haro et Josep Ll. Arcos, « Measuring the Evolution of Contemporary Western Popular Music », Scientific Reports, vol. 2, (DOI 10.1038/srep00521, lire en ligne)
  25. (en) Ian Shepherd, « Why the Loudness War hasn't reduced 'Loudness Range' », sur productionadvice.co.uk (consulté le )
  26. (en) Jason Victor Serinus, « Winning the Loudness Wars », sur Stereophile (consulté le )
  27. (en) Esben Skovenborg, « Loudness Range (LRA) – Design and Evaluation », AES 132nd Convention,
  28. (en) Jon Boley, Michael Lester and Christopher Danner, « Measuring Dynamics: Comparing and Contrasting Algorithms for the Computation of Dynamic Range », AES 129th Convention,
  29. (en) Jens Hjortkjær, Mads Walther-Hansen, « Perceptual Effects of Dynamic Range Compression in Popular Music Recordings », Journal of the Audio Engineering Society,

Articles connexes

Liens externes

Ressources en français
  • Portail de la musique
  • Portail de la physique
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.