LA CHAÎNE DE FABRICATION
Mixage & intégration
Intégration au moteur
C’est probablement l’étape la plus technique de la fabrication des voix. Une fois qu’elles ont été enregistrées, les fichiers sont récupérés par l’équipe audio et intégrées au jeu via un moteur son, un programme informatique qui va permettre la lecture et le mixage dynamique des éléments sonores, et qui communique avec le moteur principal du jeu (qui rassemble et fait le lien entre tous les éléments constitutifs du jeu).
On trouve trois types de moteur son :
• Intégré au moteur du jeu (Unity, Unreal Engine, CryEngine…).
• Middleware (FMOD, Wwise…).
• Propriétaire (créé par et pour un studio de développement).
L’intégration consiste à créer des events (évènements), dans lesquels les sons seront placés. Ces events comportent un certain nombre de paramètres (volume, pitch, durée, effet, etc.) qu’il est possible de faire varier automatiquement et aléatoirement, ou via des commandes envoyées depuis le moteur principal.
Pour un bruit de pas par exemple, quelques enregistrements de pas seront placés dans un event, puis seront lus aléatoirement avec des variations de pitch pouréviter d’entendre toujours la même son.
La lecture de ces évènements peut être lancée de deux façons : soit directement par le programmeur qui indique l’appel d’évènement dans son script (ex : une musique se lance en début de partie), soit en plaçant un marqueur d’évènement directement sur une animation (ex : le joueur se déplace, l’animation de mouvement de son personnage se déclenche et lance en même temps l’event du bruit de pas).
Pour les voix, Julien Koechlin m’a expliqué qu’elles peuvent ainsi se répartir en deux catégories, dont l’intégration sera traitée différemment :
• Les voix systémiques: Les voix liées à un système ou un gameplay, génériques, et dont l’intégration se fera plutôt en collaboration avec les gameplay programmers.
• Les voix scriptées : Les voix qui nourrissent l’histoire du jeu, qui ne dépendent pas de l’IA des personnages et qui sont plus ponctuelles (cinématiques, cinés in-game, etc.). Ce sont parfois les level designers qui les intègrent eux-mêmes pour avoir le contrôle sur les scènes scriptées et les cinématiques de leur niveau.
L’équipe audio n’attend pas d’avoir tous les assets (les fichiers audios) pour créer la structure hiérarchique des events (musique, ambiances et bruitages, voix…) et ils travaillent en amont avec des place holders (fichiers témoins). Pour les voix, dont la quantité de fichiers est multiplié par le nombre de versions localisées, l’emploi de logiciels tiers comme Oasis chez Ubisoft s’avère très utile. Ce dernier fonctionne comme un middleware et communique directement avec le moteur son grâce à un identifiant (ID) attribué à une ligne de dialogue et un event, quipermet d’y affecter le son associé. Un tag est ensuite inscrit dans le code du jeu pour faire appel à l’architecture de la langue sélectionnée (VO, VF, etc.).
L’intégration est une étape longue qui demande de la rigueur et une bonne connaissance des outils informatiques. Les bugs peuvent être nombreux et leur origine difficilement identifiable : moteur du jeu, moteur son, script, marqueur d’évènement, etc.
Mixage des sources
À part pour la création d’effets sonores spéciaux (SFX), les sons sont peu retouchés avant leur intégration au moteur. C’est ce dernier qui va gérer dynamiquement le mixage des sources en fonction des différents paramètres pilotés par le moteur du jeu.Par exemple si le joueur s’éloigne d’un PNJ qui entrain delui parler, le moteur va mettre sa position à jour en temps réel et indiquer cette évolution au moteurs on qui spatialisera la voix du PNJ, réduira son volume et accentuera sa reverb. C’est la raison pour laquelle les voix doivent être enregistrées de la manière la plus neutre possible et peu traitées car tout sera géré par les algorithmes du moteur son. Le rôle de l’équipe audio est d’ajuster ces paramètres pour que la bande-son ait le bon équilibre et s’intègre parfaitement aux décors et à l’ambiance du jeu.
Pour les cinématiques la méthode peut être différente si les sons sont préalablement mixés de manière traditionnelle. Dans ce cas le moteur son lance un seul event dont l’audio contient l’ensembledessons de la scène et dont les paramètres sont réglésmanuellement.
Le mixage d’un jeu vidéo n’est donc pas simple et dépend du support. Si autrefois on jouait dans des salles d’arcades bruyantes, aujourd’hui nos consoles et nos ordinateurs utilisent les mêmes dispositifs de diffusion que nous utilisons pour regarder des films ou écouter de la musique. La différence se situe maintenant entre les consoles portables (dont font partie les smartphones & tablettes) et les consoles de salon/ordinateurs. Pour un jeu destiné à un support mobile, les sons seront généralement mixés plus forts et avec moins de dynamique afin d’être audibles dans des environnements bruyants comme les transports en commun. Le mixage de référence est alors réalisé au casque, à l’inverse des jeux de console ou il sera habituellement fait sur des enceintes de monitoring.
Enfin il faut savoir que, comme tous les éléments du jeu, le son prend de la place sur le support final (DVD, Blu-Ray, cartouches et CD-Rom pour les vieilles consoles), et même si c’est de plus en plus rare, il arrive que les voix localisées soient davantage compressées pour libérer de l’espace mémoire (avec parfois une fréquence d’échantillonnage inférieure à 32 kHz!). Cette inégalité dans la compression peut donc avoir une vraie influence sur la qualité de la bande-son qui sera proposée au public étranger. Notons toutefois que sur PC cette pratique est rare puisque l’espace de stockage est un moindre problème.
Le joueur et la voix
La voix du jeu
Le joueur est le dernier maillon de la chaîne de fabrication de la voix, mais ce serait réducteur de le considérer comme un simple récepteur de celle-ci. D’abord parce que c’est pour lui que toutes les étapes précédentes existent et que son opinion compte, ensuite parce qu’il peut avoir un vrai rôle à jouer dans la manière dont il va recevoir la voix : il peut choisir de jouer en VO, en VF, avec ou sans les soustitres, etc.
La plupart des jeux intègrent également des options audio dans lesquelles le joueur peut ajuster l’équilibre des différents sons du jeu (musique, bruitages, dialogues…). Dans le sondage que j’ai réalisé, 85% des participants déclarent avoir déjà diminué le volume de certains éléments sonores afin de mieux entendre les voix (41% disent le faire régulièrement et 45% rarement), preuve de leur importance dans la bande-son d’un jeu et du désir des joueurs de les entendre correctement. Ces statistiques sont toutefois assez surprenantes quand les mêmes personnes déclarent accorder davantage d’importance à la musique (44,5%) et aux bruitages ou sons d’ambiances (40,5%), et que seulement 15% d’entre eux mettent les voix en tête de liste. On note donc, comme au cinéma, une tendance au vococentrismedéfini par Michel Chion dans La Voix au Cinéma comme le fait de structurer l’espace sonore autour de la voix. Un être humain cherchera ainsi, consciemment ou non, à isoler les voix de son environnement sonore afin d’enperce voir parfaitement l’essence et les message qu’elles peuvent véhiculer.
Certains jeux offrent aussi parfois la possibilité de sélectionner la voix de son avatar dans une banque de voix, voire d’importer ses propres kits de voix. Cette feature qu’on retrouve surtout dans les jeux de rôle, contribue à la personnalisation de son personnage et à l’immersion du joueur. Mais si les dialogues n’ont pas été doublés avec toutes les voix possibles, il en ressort une situation hybride dans laquelle son personnage réagit aux actions du jeu avec des répliques génériques (cris, douleur, provocations, etc.)mais reste muet durant les phases de dialogue. De plus, la voix choisie peut être en décalage avec la personnalité du personnage dictée par l’écriture des dialogues.
La synthèse vocale
La synthèse vocale a connu son heure de gloire au début du jeu vidéo, lorsqu’il n’était pas possible de reproduire efficacement du son ou de le stocker sur les supports des jeux (bornes d’arcades et cartouches). Les innovations technologiques ayant ensuite permis une vraie restitution sonore, les voix de synthèse ont peu a peu disparu du paysage vidéoludique.
LES ENJEUX INDUSTRIELS
La voix, un argument commercial ?
Les jeux vidéos touchent à présent un public de plus en plus large et sont parfois réalisés comme de véritables films. Dès lors il n’est plus possible de reléguer les dialogues, le casting, le doublage et la localisation au second plan. Véritable argument commercial, la voix est aujourd’hui l’un des points forts de certaines grosses productions.
La starification des castings
De l’écran au jeu vidéo
L’utilisation de stars du cinéma ou du petit écranpour incarner des personnages de jeux vidéo n’est pas nouvelle. En 2000 déjà, Leonard Nimoy (l’interprète de Spockdans Star Trek ) était le narrateur de la version américaine de Seamanet Michael Clarke Duncan (Armageddon , Dardevil …) prêtait sa voix au personnage de Hawkdans Soldier of Fortune. Mais si la pratique est ancienne, on a pourtant l’impression d’observer une starification de plus en plus importante dans les castings de jeu vidéo. En voici les raisons :
• Les comédiens de cinéma sont de plus en plus nombreux à participer à des jeux vidéo, et leur participation fait l’objet de plus de communication(interviews, bandes-annonces, making-of…).
• Le doublage, et plus spécifiquement le doublage de jeu vidéo, a meilleure réputation, en partie grâce à l’essor du cinéma d’animation et à la popularisation du jeu vidéo qui touche aujourd’hui un public beaucoup plus vaste et hétérogène qu’il y a quelques années.
• La motion capture, et tout particulièrement la face capture(capture des mouvements du visage) se démocratise et permet de modéliser les comédiens directement dans le jeu, ce qui leur donne plus de visibilité. Même un joueur qui ne joue pas en VOpourra profiter d’une partie de l’interprétationde ces acteurs.
• Les joueurs jouent davantage en version originale, tout comme ils regardent davantage leurs films et leurs séries en VO. En outre, les VO des jeux n’étaient pas toujours disponibles faute d’espace mémoire, et l’arrivée de nouveaux supports (Blu-Ray, disques durs…) permet aujourd’hui de profiter de toutes les versions disponibles d’un jeu, et donc du casting original. Certaines licences comme Grand Theft Auto ou Call of Dutysont des habituées du genre et ont régulièrement embauché des comédiens d’Hollywood pour doubler leurs personnages : Samuel L. Jackson, William Fichtner, Peter Fonda, Ray Liotta, Tom Sizemore, Burt Reynolds, Michael Madsen, Ed Harris, Michael Keaton, Gary Oldman, Dennis Hopper, Danny Trejo, etla liste est encore longue…
Mais embaucher une star pour son jeu peut présenter certains inconvénients. D’abord pour les scénaristes, qui comme au cinéma, sont parfois obligés de remanier leur script en fonction du comédien qui incarnera le personnage. Ensuite pour des contraintes techniques : un excellent comédien d’image peut s’avérer médiocre en doublage en raison du dispositif technique (surtout quand il n’y a aucune image de référence) et le temps d’enregistrement peut lourdement en pâtir. Enfin, leur coût est relativement élevé et leur participation ne fait pas nécessairement l’objet d’une bonne communication, ce qui peut réduire l’impact marketing et la valeur commerciale d’un tel investissement.
Les versions françaises
À moins de jouer en VO ou que les comédiens aient été modélisés dans le jeu, il est difficile pour les joueurs étrangers de profiter de ces castings exceptionnels. C’est pourquoi au moment de la localisation, le client ou le studio de localisation peut choisir de faire appel aux voix officielles des comédiens originaux.
Dans Call of Duty Advanced Warfarepar exemple, c’est Gabriel Le Doze, la voix française régulière de KevinSpacey, qui doublait Jonathan Irons dans la version française du jeu.
Encore mieux, pour les jeux issus de franchises ayant été portées à l’écran, le casting VF est souvent mieux loti que le casting original. Par exemple dans La Terre du Milieu : L’Ombre du Mordor , les joueurs ont eu le plaisir d’entendre la même voix françaisepour Gollum(Sylvain Caruso) que dans les films de Peter Jackson , alors qu’il est doublé en VO par Liam O’Brien (au lieu d’Andy Sikis qui incarnait le personnage dans sa version cinéma). On comprend aisément que les voix françaises des personnages sont moinsonéreuses que les comédiens originaux et les équipes marketing des éditeurs en tirent intelligemment profit.
Et certains directeurs artistiques n’hésitent pas à faire appel à des voix officielles même lorsque leur comédien (ou personnage) original n’est pas dans le jeu. Mais comme le public est habitué à ces voix, il les associera immédiatement à leurs (faux) propriétaires. Dans la série de jeux Splinter Cellc’est ainsi Daniel Beretta, la voix régulière d’Arnold Schwarzenegger,qui prête sa voix à la version française du protagoniste principal Sam Fisher. Le joueur ayant l’habitude d’entendre cette voix dans des films d’action, il aura plus de facilité à identifier son avatar comme un héros sur entrainé et disposé à sauver le monde. Mais il y a aussi le risque qu’il ait juste l’impression d’entendre Arnold Schwarzenegger alors qu’il ne voit pas l’acteur à l’écran, et que ce décalage le fasse sortir du personnage. De plus il faut avoir conscience qu’une voix officielle est plus chère qu’un comédien ordinaire et généralement moins disponible.
Les versions françaises peuvent également assurer une certaine continuité au sein d’une franchise.
Par exemple, le personnage de Jason Hudsondans Call of Duty : Black Ops est doublé en version originale par Ed Harris puis par Michael Keaton dans le 2ème volet . En VF, pas de star du grand écran ou de voix officielle, mais le comédien de doublage Bruno Magne. La question est donc de savoir si un joueur préfère une voix connue, quitte à ce qu’elle change d’un jeuà l’autre, ou un personnage identique et cohérent tout au long de la série. Malheureusement la question lui est rarement posée…
Cibler son public
Le marché des langues
Les versions originales sont principalement anglaises, coréennes et japonaises. Laure Bouffard, de
Synthesis France, me disait que la plupart des jeux étaient aujourd’hui localisés dans une dizaine de langues, voire une vingtaine pour certains projets. Mais toutes les langues ne bénéficient pas d’une localisation complète incluant un doublage (d’autant plus qu’un jeu ne contient pas forcément de voix parlées, comme c’est le cas de la plupart des jeux mobiles par exemple).
Actuellement, le doublage concerne principalement quelques marchés ciblés, mais qui suffisent à toucher un très large public :
• Marché anglais (Etats-Unis, Canada, Angleterre, Australie…).
• Marché asiatique (chinois, coréen, japonais…).
• Marché espagnol(Espagne, Amérique latine…).
• Marché français(France, Belgique, Luxembourg, Suisse, Canada, Afrique du nord…).
• Autres marchés européens (Allemagne, Italie…).
On constate que certaines langues les plus prisées pour le doublage de jeu vidéo sont proches de celles de l’industrie cinématographique et audiovisuelle. En France par exemple, 80% de l’exploitation de longs-métrages étrangers se fait en version doublée , et les espagnols et les sud-américains sont également réputés pour leur culture du doublage.
Etonnamment, certains gros marchés comme l’hindi (Inde) ou le portugais sont rarement concernés par le doublage localisé et doivent le plus souvent se contenter des versions anglaises. D’autres marchés émergent en revanche ces dernières années, comme ceux des langues slaves et scandinaves. Le marché arabe connaît également une forte expansion, notamment en raison du développement économique et de l’augmentation du pouvoir d’achat dans les pays arabophones . Enfin, même si toutes ces langues suffisent à toucher un large public, il reste le problème des dialectes : l’espagnol d’Espagne et d’Amérique latine n’est pas tout à fait le même, tout comme l’anglais diffère en Angleterre, aux Etats-Unis ou en Australie, et de même pour le portugais du Brésil et celui du Portugal. C’est parfois un casse-tête pour les éditeurs et les studios de localisation qui doivent alors fournir des versions les plus neutres possibles des différentes langues.
|
Table des matières
MÉTHODOLOGIE
INTRODUCTION
I – LA CHAÎNE DE FABRICATION
1. Écriture
2. Traduction
3. Doublage
4. Mixage & intégration
5. Le joueur et la voix
II – LES ENJEUX INDUSTRIELS
1. Historique de la voix dans le jeu vidéo
2. La voix, un argument commercial ?
3. Localisation & internationalisation
III – LES ENJEUX IMMERSIFS
1. Qualité & immersion
2. La voix et les personnages
3. La voix, entre atmosphère et narration
4. La voix et l’information
CONCLUSION
ANNEXES
Annexe 1 (Sondage)
Annexe 2 (Recording Sheet)
BIBLIOGRAPHIE
CONTACTS