Musique de jeu vidéo

La musique de jeu vidéo est la bande son ou tout morceau musical composé pour un jeu vidéo. Son histoire, qui remonte aux années 1970, est notamment marquée par un accroissement continu de la qualité sonore des jeux vidéo, grâce aux progrès techniques et surtout à l'augmentation de la mémoire disponible. Auparavant limitées à des sonorités minimalistes, ces musiques peuvent aujourd'hui être enregistrées par de véritables orchestres, même si les compositeurs continuent à avoir recours à des synthétiseurs pour leurs travaux, par choix ou pour limiter les coûts de production.

Wataru Hokoyama dirigeant l'enregistrement d'une de ses compositions en 2009.

Certains compositeurs tels que Nobuo Uematsu, Koji Kondo, Kōichi Sugiyama, Jeremy Soule ou encore David Wise se sont fait un nom dans cette discipline. Certaines musiques sont commercialisées, et sont jouées en concert, en particulier au Japon.

Caractéristiques

La musique de jeu vidéo a longtemps été composée sous diverses contraintes qui lui procurent des caractéristiques distinctives.

Limites technologiques

Les limites techniques des premiers supports de jeux vidéo ne permettent pas de contenir de la musique pré-enregistrée. Celle-ci était donc synthétisée par l’ordinateur (ou la console de jeu). La qualité sonore dépendait grandement des capacités techniques du support sur lequel elles étaient interprétées.

Les faibles capacités techniques des supports de jeu ont longtemps été la cause de la mauvaise qualité (sonore et non pas musicale) de la musique de jeu vidéo. Celle-ci se traîne donc une réputation de sous-musique en raison de son caractère accessoire et de ses sonorités dépouillées[réf. nécessaire].

Ces contraintes techniques disparaissent depuis la fin des années 1990, où les jeux commencent à intégrer des bandes-son d'une qualité de type CD.

Les sonorités des jeux anciens deviennent vintage. Elles nécessitent d'avoir recours à du matériel ancien ou à des émulations spécifiques. Le format SPC (Sound Processing Core) permet par exemple l’émulation du processeur SPC700 intégré à la Super Nintendo.

Interactivité

Les compositeurs travaillent sur des musiques capables de s'adapter à l'action, le déroulement du jeu étant variable[1].

Histoire

Machines 8 bits et puces sonores

Dans les années 1970, quand les jeux vidéo commencèrent à être perçus comme une forme de divertissement, la musique était stockée de manière analogique, sur des supports comme les cassettes audio et les disques phonographiques. De tels composants étaient chers et enclins au cassage en cas d’utilisation intensive, les rendant inadaptés aux fonctionnements des bornes d’arcade. Ils n’étaient employés que dans quelques rares jeux, comme Journey. L’autre méthode, plus accessible, utilisait des moyens numériques. Par le biais d’une puce électronique spécifique, transformant les impulsions électriques du code de programmation en ondes sonores analogiques, les sons étaient acheminés jusqu’aux haut-parleurs instantanément. Les effets sonores de la plupart des jeux étaient générés de cette façon.

Bien qu’il fût possible d’intégrer de la musique dans les jeux d’arcade de cette époque, c’était en général des morceaux monophoniques, utilisés en mode répété, ou lors de la transition d’un niveau vers un autre, ou bien encore au début d’une nouvelle partie, comme c’est le cas dans Pac-Man ou dans Pole Position. La décision d’inclure le moindre morceau de musique dans un jeu vidéo signifiait, qu’à un certain moment, il devait être transcrit en code de programmation par un développeur, sans prendre en compte si celui-ci disposait d’une expérience musicale ou non. Quelques morceaux étaient originalement composés, et d’autres étaient tirés de morceaux connus tels que les chansons folkloriques. La console de salon Atari 2600, par exemple, était capable de générer seulement deux tonalités simultanément. Quelques exceptions, comme les jeux d’arcade développés par Exidy, anticipèrent l’utilisation de sons numérisés ou échantillonnés.

Cette approche s’est poursuivie dans le développement des jeux vidéo dans les années 1980. Le progrès de l’industrie du silicium, et la chute des coûts de la technologie a fait naître une nouvelle et dernière génération de machines d’arcade et de consoles de salons. Dans le cas de l’arcade, les machines basées sur les processeurs Motorola 68000 et les puces Yamaha YM ont vu croître leur nombre de tonalités, quelquefois de huit ou plus encore. Les consoles de salon, quant à elles, ont vu un progrès notable dans leurs capacités sonores en commençant par la Colecovision, mise sur le marché en 1982, qui était capable de produire quatre tonalités. Cependant, le plus notable est le lancement japonais de la Famicom en 1983 qui sera, ultérieurement en 1985, connue aux États-Unis en tant que NES, et qui est capable d’un total de huit tonalités. L’ordinateur familial Commodore 64, lancé en 1982, est capable de générer des formes rudimentaires d’effets de filtrage, et différents types de sons Wave. Son coût relativement bas et la possibilité d’utiliser un téléviseur comme moniteur en a fait une alternative populaire aux autres ordinateurs familiaux.

Le développement de musiques de jeux à cette époque utilisait généralement des méthodes de génération de notes simples et/ou de synthèse FM pour simuler des instruments mélodiques, et des « canaux de bruit » pour simuler les percussions. La première utilisation d’échantillons PCM dans ce domaine se limitait à des courts extraits sonores (Monopoly), ou bien constituait une autre façon de simuler les percussions (Super Mario Bros 3). Dans les consoles domestiques, la musique devait souvent partager les canaux disponibles avec les autres effets sonores. Par exemple, si un vaisseau spatial envoyait un rayon laser, et que le laser utilisait une tonalité de 1 400 Hz, alors quel que soit le canal utilisé pour la musique, celui-ci devait arrêter de jouer la musique pour jouer l’effet sonore.

La fin des années 1980 a vu la création d’un grand nombre de programmes destinés à ces plateformes, dont les musiques étaient composées par des personnes ayant une plus grande expérience musicale que précédemment. La qualité des compositions en fut notablement améliorée, et la prise de conscience à cette époque de l’importance de la musique se ressent toujours aujourd’hui. Parmi les compositeurs qui se sont fait un nom dans le domaine figurent Koji Kondo (Super Mario Bros., The Legend of Zelda), Kōichi Sugiyama (Dragon Quest), Rob Hubbard (Monty On the Run), Hirokazu Tanaka (Metroid et Kid Icarus), Martin Galway (Times of Lore), Hiroshi Miyauchi (Out Run), Nobuo Uematsu (Final Fantasy), Yuzo Koshiro (Ys). Vers la fin de l’existence de la Famicom, certaines cartouches de jeu incluaient des puces destinées à la génération de sons, ce qui permettant d’augmenter le nombre de canaux utilisables. Cela démontre qu’une plus grande attention était portée aux sons et à la musique, puisque ces nouvelles fonctionnalités entraînaient bien sûr un surcout côté développement.

La future génération des consoles d’arcade ou de salon, et des ordinateurs personnels modifiera radicalement l’ancienne approche de la musique dans les jeux vidéo.

Synthèse numérique et échantillonnage

Le premier ordinateur qui utilisa l’échantillonnage comme traitement numérique du signal était le Commodore Amiga en 1985. La puce sonore de cet ordinateur gérait à la base quatre convertisseurs numérique-analogique de 8 bits. Au lieu de simplement générer un signal analogique qui sonnait comme un simple « bip », comme en synthèse FM, ce système permettait de faire jouer par la puce des échantillons sonores pré-enregistrés dans la mémoire. Cela permit aux développeurs d’utiliser de courts extraits sonores de certains instruments aussi bien que n’importe quel son désiré, avec une bien meilleure qualité et fidélité que ce qu’il aurait été possible précédemment. Ce système fut sans doute le prédécesseur de ce qui allait plus tard être appelé wavetable ou SoundFont. Étant à la fois bon marché et précurseur dans le domaine, l’Amiga restera un outil clé aux débuts de la composition sonore échantillonnée, spécialement en Europe.

Le principal concurrent de l’Amiga, l’Atari ST, utilisait le générateur de sons programmable (PSG) Yamaha YM2149, qui était limité par rapport à la puce SID du Commodore 64. C’est pourquoi la restitution du son en numérique demandait des techniques de programmation gourmandes en ressources du processeur, ce qui en rendait l’utilisation impossible dans les jeux vidéo. Grâce à des ports MIDI intégrés, l’Atari ST était utilisé par de nombreux musiciens professionnels comme un appareil de programmation MIDI.

Les clones de l’IBM PC en 1985 n’ont pas contribué de manière significative au développement du multimédia, et l’échantillonnage n’a pas réellement percé dans le domaine du jeu avant plusieurs années. Malgré une réelle avancée dans le réalisme sonore, l’espace mémoire nécessaire à stocker les échantillons était encore trop important pour en faire une technique rentable. À cette époque, le moindre kilooctet d’espace mémoire des périphériques de stockage (cartouches, disquettes ou autres) coûtait encore cher. La musique synthétisée par des puces sonores, quant à elle, ne nécessitait que quelques lignes de code bien plus simples, et surtout n’occupait que très peu de cette précieuse mémoire.

L’approche hybride mentionnée ci-dessus (échantillonnage et puce), employée dans la troisième génération de consoles, continuera à exister dans la quatrième génération de consoles de salons (16-bit) avec la Mega Drive en 1988. La Mega Drive supportait des graphismes meilleurs que ceux de la NES et un son de meilleure qualité, mais s’appuyait toujours sur la même approche de la synthèse sonore. Dix canaux de tonalités, dont un attribué aux échantillons PCM, étaient disponibles en stéréo au lieu des six canaux mono de la NES. Comme précédemment, l’échantillonnage était souvent utilisé pour les sons de percussions (ou « drum kits » - voir Sonic 3). Attention de ne pas confondre la mention 16-bit qui fait référence au processeur avec les échantillons sonores de 16 bits. La Mega Drive ne gérait pas des échantillons 16-bits. Le système sonore était quand même toujours considéré comme assez restrictif par la plupart des musiciens et obligea a déployer des trésors d’ingéniosité pour créer une atmosphère sonore attrayante à partir de la seule synthèse FM.

Avec la diminution du coût de l’espace mémoire grâce à l’utilisation de disquettes, la musique dans les jeux Amiga (et le développement des musiques de jeux en général) a fini par évoluer vers la technique de l’échantillonnage. Il a fallu quelques années aux créateurs de jeux Amiga avant d’utiliser vraiment les effets sonores digitaux (exception faite de la musique principale du jeu de fiction interactive The Pawn en 1986). Dans le même temps, l’ordinateur et la musique de jeux vidéo avaient aussi acquis leur identité propre, et de nombreux compositeurs s’étaient volontairement lancés dans la production d’une musique ressemblant à ce que l’on pouvait entendre sous Commodore 64, ce qui créera le genre musical appelé chiptune.

La sortie d’un programme libre appelé Ultimate Soundtracker par Karsten Obarski en 1987 marqua le début de l’ère du format MOD qui permettait à n’importe qui de produire facilement de la musique à partir d’échantillons numérisés. Les fichiers « MOD » étaient produits par des programmes appelés trackers, eu égard au logiciel d’Obarski. Cette utilisation des « MOD » et des trackers s’est propagée aux ordinateurs PC dans les années 1990. On trouve de bon exemples de jeux utilisant des échantillons musicaux numérisés sur Amiga avec les bandes originales de Shadow of the Beast par David Whittaker, Turrican II par Chris Hülsbeck et les accords de Laser Squad par Matt Furniss. Richard Joseph a également composé certain thèmes musicaux contenant du chant avec des paroles pour les jeux développés par Sensible Software, dont les plus connus sont Cannon Fodder en 1992 avec la chanson « War Has Never Been So Much Fun » et Sensible World of Soccer en 1994 avec la chanson « Goal Scoring Superstar Hero ». Ces chansons utilisaient de longs échantillons de voix.

Comme sous Amiga, cette approche du développement des effets sonores et musicaux commença à apparaitre dans certaines révisions des plates-formes d’arcade. En 1991, des jeux comme Street Fighter II sous le CP System utilisaient de manière intensive des échantillons de voix parallèlement aux effets sonores. Le système Neo-Geo MVS supportait également un puissant environnement sonore qui incluait souvent le son dit « Surround ».

L’évolution a aussi eu lieu sur les consoles de jeux de salon, l’exemple de la Super Nintendo sortie en 1991 étant le plus évident. Cette console était dotée d’une puce Sony spécialisée à la fois dans le rendu sonore et l’accélération matérielle. Elle pouvait supporter 8 canaux de sons échantillonnés d’une résolution allant jusqu’à 16 bits, et possédait un éventail impressionnant d’effets dont un type d’enveloppe ADSR utilisés habituellement uniquement dans les tout derniers synthétiseurs de l'époque, et un son entièrement stéréo. Cela a permis des expérimentations acoustiques dans les jeux vidéo, dont des effets musicaux (d’abord dans des jeux comme Caslevania IV, F-Zero, Final Fantasy IV, Gradius III, puis dans Chrono Trigger), directionnels (Star Fox) voire spatiaux (le système Dolby Pro-Logic fut utilisé dans certains jeux comme King Arthur’s World ou Jurassic Park), ou même des effets soulignant l’environnement du jeu (Zelda III, Secret of Evermore). De nombreux jeux ont aussi fait une utilisation massive des possibilités d’échantillonnage haute définition (Super Star Wars, Tales of Phantasia). La seule réelle limitation était encore une fois le coût en mémoire.

On peut reconnaître à d’autres consoles de la même génération des possibilités comparables. La console de salon Neo-Geo pouvait supporter des traitements d’échantillonnage puissants, mais était beaucoup plus cher que ses concurrentes. Chez Sega, le périphérique additionnel Mega-CD pour la Mega Drive avait ajouté des canaux PCM multiples, mais très peu de titres les utilisèrent, préférant à la place jouer directement la musique au format « Red Book » à partir du CD.

La popularité de la Super NES resta cependant limitée dans les régions du monde où le standard pour la télévision était le NTSC. En partie à cause de la différence de taux de rafraîchissement avec les équipements à la norme PAL, de nombreux titres ne furent jamais adaptés et tournaient bien plus lentement qu’ils ne le devaient à la base, ou ne furent simplement pas sortis sur cette console. Cela entraîna une divergence importante entre les pays sous la norme PAL ou NTSC du point de vue des musiques des jeux vidéo connus, et on peut encore en observer les effets aujourd’hui. Cette différence sera atténuée avec le lancement des consoles de cinquième génération et lorsque Commodore laissera progressivement la place aux PC et Mac.

Stockage sur CD

Bien que les accessoires tels que le Mega-CD (pour Mega Drive), et dans une plus grande mesure la console PC-Engine au Japon, aient rapidement donné aux joueurs un aperçu de l'inclination future de la musique des jeux pour la lecture en continu (streaming), l'utilisation de musique échantillonnée et séquencée est toujours répandue dans les consoles de jeux actuelles. L'immense avantage en termes de stockage de données que permet le média optique sera alors utilisé avec des périphériques de rendu audio de plus en plus puissants et des échantillons sonores de meilleure qualité dans les consoles de 5e génération. En 1994, la PlayStation équipée d'un lecteur de CD-ROM pouvait supporter 24 canaux d'échantillons 16-bits à une fréquence allant jusqu'à 44,1 kHz, atteignant ainsi la qualité audio d'un CD. Elle supportait également quelques effets sonores matériels comme la réverbération. De nombreux titres de l'éditeur Squaresoft continuèrent à utiliser de la musique échantillonnée : ce fut le cas de Final Fantasy 7, Legend of Mana et Final Fantasy Tactics. La Saturn équipée aussi d'un lecteur CD supportait 32 canaux PCM à la même résolution que la PSX. En 1996 la Nintendo 64, utilisant pourtant toujours des cartouches de jeu, supportait en fait un moteur sonore intégré capable de gérer pas moins de 100 canaux PCM à une fréquence relevée à 48 kHz. Cependant, à cause du coût encore élevé de la mémoire flash, les jeux de N64 furent généralement dotés d'échantillons de moindre qualité que ses deux concurrentes, et la musique tendait à être plus simpliste.

La musique de jeux vidéo s'orienta cependant, pour les jeux sur CD, vers la lecture en continu ou streaming au détriment de l'interactivité[1]. Les bandes-son des jeux vidéo sont commercialisées aux côtés des musiques de cinéma, et sont jouées en concert, en particulier au Japon.

Compositeurs célèbres

Musiciens et groupes connus

Notes et références

  1. Léopold Tobisch, « Comment composer pour les jeux vidéo ? », sur France Musique, (consulté le )

Voir aussi

Bibliographie

  • Rémi Lopez, Original Sound Track : 100 albums indispensables de jeux vidéo, Pix'n Love, , 240 p.
  • Damien Mecheri, Video Game Music : Histoire de la musique de jeu vidéo, Pix'n Love, , 296 p.
  • Aurélien Simon, Symphonie pour Pixels : Une histoire de la musique de jeu vidéo, Omaké Books, 2020, 223 p.

Articles connexes

Liens externes

  • Portail du jeu vidéo
  • Portail de la musique
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.