Chine : Des voix d’auteurs pour la lecture de livres audio

Le moteur de recherche chinois Sogou va numériser la voix de plusieurs auteurs chinois à succès. Des intelligences artificielles utiliseront ensuite ces voix numérisées pour développer un large éventail de mots afin d’enregistrer des livres audio.

Sogou, la filiale de Tencent, va utiliser les possibilités offertes par l’intelligence artificielle pour procéder à la lecture d’audiobooks. Pour cela, la société compte numériser la voix de plusieurs auteurs chinois populaires. Les machines seront ainsi capables de prononcer les phrases d’un livre exactement comme si son auteur en faisait la lecture. Cette initiative sera réalisée en partenariat avec Zhangyue Technology.

En Chine, le succès des livres audio n’est plus à démontrer. Les analystes pointent les perspectives positives de ce marché : selon iiMedia, le marché devrait plus que doubler entre 2016 et 2020 et atteindre 7,8 milliards de yuans, soit près de 983 millions d’euros. La synthèse vocale n’est plus jugée suffisante pour satisfaire les lecteurs. Ces derniers veulent une véritable voix humaine.

Une technologie bluffante

Avec cette technologie de machine learning et toutes les archives audiovisuelles à disposition, numériser la voix de Jean Rochefort pour lui donner à lire des milliers de livres jeunesse pourrait bien être un jeu d’enfant.

L’intelligence artificielle de Sogou devrait permettre d’adapter en audiobook deux romans des auteurs Yue Guan et Bu Xin Tian Shang Diao Xian Bing qui serviront de premiers essais à découvrir sur l’application. Les voix numériques de ces deux auteurs prendront ainsi en charge la lecture.

S’il était déjà simple d’utiliser des voix numérisées, les solutions qu’offre le machine learning deviennent plus réalistes que jamais. La société Lyrebird s’est spécialisée dans le sujet. Elle présente deux exemples d’enregistrements où les voix de Barack Obama et Donald Trump, numérisées, ont été passées par ces machines.

Appliquer l’intelligence artificielle au livre audio permettra d’améliorer la qualité de la lecture. La plupart des liseuses proposent en effet déjà une option de synthèse vocale, mais la qualité laisse à désirer. La possibilité d’écouter les voix d’auteurs, d’acteurs ou d’autres personnalités attire davantage de lecteurs. Cela dit, le coût nécessaire à la création d’audiobooks lus par des professionnels est important, sans compter le temps que cela prend. La synthétisation de leur voix par une IA est une solution plus économe et qui peut être appliquée à grande échelle.

Sogou élargit son offre

Le deuxième moteur de recherche de Chine s’était déjà servi d’une technologie similaire par le passé afin de produire des premiers modèles liés à l’information, en partenariat avec l’agence de presse gouvernementale Xinhua. Sogou a ainsi introduit en 2018 deux présentateurs télé virtuels, dotés de voix et d’expressions proches de celles d’êtres humains et qui officient encore régulièrement sur le site internet de Xinhua.

En juin, la société a créé le premier juge virtuel au monde, qui permet de résoudre des litiges en ligne en temps réel. Une animatrice virtuelle, Xin Xiaomeng, participera quant à elle en octobre aux célébrations du 70e anniversaire de la fondation de la République populaire de Chine. Sogou travaille également avec Abu Dhabi Media pour lancer le premier présentateur virtuel parlant l’arabe.

Sogou collabore avec Zhangyue Technology, le développeur de iReader, un outil associant lecteur de livres numériques et application. La société a lancé iReader Ebooks, iReader Comics, iReader Magazine et d’autres produits de la série, contenant des lectures mobiles de sujets variés.

Ailleurs sur Lettres Numériques :

Retrouvez Lettres Numériques sur TwitterFacebook et LinkedIn.

— Cynthia Prévot

Share Button