L’intelligence artificielle au service de la traduction automatique de contenus
La traduction automatique est un secteur en constante progression, soutenue par le développement de l’intelligence artificielle. Une technologie en particulier semble être appelée à connaître un développement important à l’avenir : la traduction à partir de réseaux neuronaux. Une firme japonaise, Media Do, a d’ailleurs récemment mis cette technologie en pratique. Lettres Numériques vous embarque dans un tour d’horizon des tendances existantes et des progrès en cours.
Il existe de nombreux outils de traduction automatique, sur lesquels plusieurs entreprises travaillent, notamment les géants Microsoft et Google mais également des entreprises françaises comme Systran (dont vous pouvez déjà admirer les progrès via la version bêta de son logiciel) et Lingua et Machina. Si les deux premières s’adressent avant tout aux utilisateurs lambda, Systran vise plutôt les entreprises, tandis que Lingua et Machina se consacre principalement à la traduction de contenus complexes dans le domaine de la recherche. Un communiqué récemment publié sur le site de Lingua et Machina, qui comprend notamment une interview d’Étienne Monneret, son Chef de Projets et Développements Informatiques, nous éclaire sur le sujet.
Trois modèles de traduction
Les modèles de traduction automatique peuvent être classés selon trois approches.
La traduction à base de règles fonctionne grâce à l’application de règles à divers niveaux d’analyse linguistique (lexicale, syntaxique et grammaticale). Elle intègre la gestion d’un très grand nombre de cas particuliers et d’exceptions. Les textes ainsi produits sont cohérents, mais finalement peu adaptés à des éléments trop spécialisés.
La traduction statistique se base quant à elle sur une analyse statistique d’un grand volume d’exemples déjà traduits. Elle identifie les transformations de groupes de mots, d’une langue vers une autre, pour reproduire celles estimées les plus probables sur les nouvelles phrases à traduire. La traduction par ce modèle est adaptée à des contenus spécifiques, mais s’avère peu fluide.
Enfin, la traduction neuronale (ou neurale) repose sur des algorithmes neuronaux. L’idée principale de ce troisième système est de ne plus fonctionner par mot ou expression, comme c’est le cas pour les deux autres modes de traduction, mais de considérer chaque phrase comme un bloc à traduire. La formulation des phrases ainsi traduites est plus naturelle, et les erreurs de grammaire et de syntaxe sont bien moins courantes. Concrètement, pour déterminer le sens de la phrase, l’outil passe par chaque mot, puis en pondère le sens pour choisir la traduction la plus juste et les réorganiser pour produire une phrase cohérente dans la langue désirée. Le moteur utilise ainsi l’intelligence artificielle et apprend, toujours à partir d’un grand volume d’exemples, à traduire par le biais d’un réseau neuronal.
De nombreux avantages…
C’est ce dernier modèle de traduction automatique que prône la société Lingua et Machina. D’après Étienne Monneret, la firme a très vite perçu l’intérêt de cette approche. « Grâce à la complémentarité de nos technologies, les performances de la traduction automatique s’améliorent à mesure qu’elle est alimentée avec de nouveaux contenus […]. Plus le nombre de traductions réalisées augmente, plus la qualité et la fluidité se rapprochent de la qualité d’une traduction humaine. » L’autre avantage de cette technologie réside dans les économies substantielles en termes de coût et de temps : « un traducteur professionnel peut travailler jusqu’à deux à trois fois plus vite en maintenant une haute qualité de traduction. »
La traduction neuronale est aussi le modèle plébiscité par Google, Microsoft et Systran. La première étant convaincue que son avenir est dans l’intelligence artificielle, elle cherche à intégrer cette technologie dans beaucoup de ses projets. C’est ainsi que fin 2016, Google annonçait dans un communiqué l’usage d’un système de réseau neuronal pour la traduction de huit langues vers et depuis l’anglais dans Google Traduction.
… mais une technologie encore balbutiante
Cependant, tout n’est pas encore parfait, et Google le reconnaît, comme le rapporte le site Nextinpact. « Google Neural Machine Translation (GNMT) est toujours capable d’erreurs importantes qu’un traducteur humain ne ferait jamais, comme oublier des mots, mal traduire des noms propres ou des mots inhabituels, ou encore traduire une phrase de manière isolée plutôt qu’en l’incluant dans le contexte du paragraphe ou de la page ».
Du côté de Microsoft, la technologie et ses résultats sont également qualifiés de balbutiants, même si la firme de Redmond assure que les réseaux neuronaux fournissent une qualité beaucoup plus élevée ainsi qu’une production plus humaine que les autres technologies de traduction, comme le relaie le site zdnet.
Une récente mise en pratique au Japon
Deux entreprises basées à Tokyo sont également spécialisées dans la traduction de contenus par l’intelligence artificielle : l’Internet Research Institute et Ai Squared. C’est donc via un partenariat avec ces deux firmes que le distributeur d’ebooks japonais Media Do se lance dans la traduction automatique de contenus. D’ici la fin de l’année, la firme nippone prévoit ainsi la mise en place sur sa librairie numérique d’un service de résumé automatique, en langue japonaise. L’année prochaine, ce résumé pourra être traduit automatiquement en anglais. L’objectif à terme est la traduction automatique d’ebooks entiers du japonais vers l’anglais.
En proposant ces nouveaux services, Media Do espère élargir son marché à l’international et dynamiser le marché du livre numérique au Japon, où l’édition traditionnelle ne se porte pas très bien.
Les progrès de l’intelligence artificielle permettent un développement dans de nombreux secteurs, et la traduction automatique ne fait pas exception, comme en témoigne l’enthousiasme des différentes entreprises qui y travaillent. La traduction neuronale semble ainsi promise à un bel avenir. De multiples usages sont en effet envisageables pour cette technologie, on imagine par exemple l’outil très avantageux qu’elle pourrait constituer pour le monde de l’édition, comme l’illustre le cas de Media Do.
Le développement de l’intelligence artificielle ne manque par ailleurs pas de soulever des questions quant à la place toujours plus réduite qu’elle accorde à l’humain. Pour l’heure, la supervision de l’homme est toujours nécessaire mais la traduction automatique pourrait-elle un jour remplacer le travail d’un traducteur humain ? Au-delà des progrès techniques de ces technologies, l’importance d’une réflexion sur ces interrogations éthiques pourrait donc se faire sentir.
Retrouvez Lettres Numériques sur Twitter et Facebook.
Raphaël Dahl
— Rédaction