Formats/supports de lecture Questions & débats

Intelligence artificielle et production de livres audio : le développement des voix de synthèse

17/12/202117/12/2021 Nausicaa Plas 30446 Views acteurs, audiobooks, éditeurs, format audio, IA, intelligence artificielle, livres audio, maisons d'édition, production, synthèse vocale, voix, voix de synthèse, voix synthétique

La production de livres au format audio s’avérant lente et onéreuse, les intelligences artificielles de parole se développent pour faciliter leur création.

Le livre audio, un succès grandissant

Ces cinq dernières années, les livres audio ont progressivement gagné le cœur des lecteurs, que ce soit dans l’Union européenne ou à l’étranger, et leur popularité ne fait qu’augmenter. Les jeunes générations sont notamment sensibles à ce format qui permet d’écouter un ouvrage tout en ayant les mains libres. Beaucoup admettent qu’ils n’auraient pas lu au format papier ou numérique le livre qu’ils écoutent en ce moment au format audio.

Toutefois, créer un livre audio est une tâche plus complexe qu’il n’y paraît. En effet, pour une heure de lecture, il faut en moyenne deux heures d’enregistrement avec des acteurs professionnels. Le fait qu’il n’y ait pas d’image oblige à retranscrire les émotions seulement par la voix, ce qui peut s’avérer complexe.

L’intelligence artificielle comme solution ?

L’idée d’une automatisation des services fait son chemin dans de nombreux domaines et le livre audio n’y échappe pas. L’idée serait ici de réussir à créer une intelligence artificielle capable de reproduire une voix humaine, avec ses respirations et les émotions qu’elle transmet.

À l’heure actuelle, il est généralement aisé de reconnaître une voix humaine d’une voix de synthèse. Cette dernière a souvent une diction assez saccadée et prononce certains mots d’une façon non naturelle (prenez par exemple la voix d’un GPS ou de Siri).

Néanmoins, les progrès en la matière sont rapides et plusieurs multinationales telles que Google ou Apple travaillent activement sur le sujet. Dans les années à venir, le but serait simplement qu’un individu non avisé ne soit pas capable de distinguer une voix robotique d’une voix humaine. Bien sûr, des détails permettront encore à l’oreille aiguisée de faire la différence.

Ces évolutions pourraient notamment être bénéfiques aux petites maisons d’édition qui ne peuvent actuellement pas se permettre de produire des livres audio du fait des moyens nécessaires, et doivent laisser la place aux géants comme Amazon ou Audible.

Toutefois, la généralisation de la synthèse vocale risque de faire perdre un bon nombre d’opportunités professionnelles aux acteurs qui prêtent leurs voix aux personnages des livres. Une solution serait d’indiquer de façon claire si le livre audio est lu par une voix synthétique ou par un comédien, afin de valoriser le travail de ces derniers et fidéliser les lecteurs.

Finalement, il faudra suivre ces développements dans les années à venir pour éviter d’être trompé par une voix de synthèse plus vraie que nature.

Ailleurs sur Lettres Numériques :

Retrouvez Lettres Numériques sur Twitter, Facebook et LinkedIn.

— Nausicaa Plas

You May Also Like

Rakuten-Kobo devra bientôt fermer sa librairie numérique

Réunions de présentation de Librel.be

L’intelligence artificielle GPT-3 doit encore progresser