Emma Identity, la première intelligence artificielle capable de déterminer la paternité d’une œuvre
Cette semaine, nous avons pris le temps de nous intéresser à Emma Identity, un logiciel totalement inédit qui permet d’identifier l’auteur d’une œuvre en se basant sur son style d’écriture. La particularité de ce programme est qu’il va plus loin que la simple détection de plagiat : il vise à véritablement établir la paternité d’une œuvre, un objectif encore jamais atteint avec succès. Les auteurs seraient-ils désormais amenés à ne plus écrire sous un nom d’emprunt au risque d’être immédiatement repérés ?
La technologie au service de la littérature
Emma Identity est basé sur le principe du self-learning technology, qui fonctionne grâce à l’apprentissage de données ou à la reconnaissance de modèles. Cette technologie se perfectionne sans cesse avec le temps. Elle est rendue possible grâce à l’intelligence artificielle et plus précisément au machine learning, qui permet aux machines de progresser à l’aide de processus systématiques et d’algorithmes. En pratique, une étude de la manière dont le texte est écrit lui permet de mettre en évidence la paternité d’une œuvre. Il suffit de 5000 mots au programme pour pouvoir détecter un plagiat.
Tout type de documents peut être téléchargé sur Emma, comme des .pdf ou des .txt et il est important de lui en soumettre assez. Effectivement, suffisamment alimenter une intelligence artificielle (IA) en information est essentiel afin de détecter le style d’écriture de l’auteur d’un texte. Déterminer si un nouveau travail est écrit par le même auteur ou non devient alors très simple pour l’IA.
Pas moins de cinquante paramètres mathématiques lui sont nécessaires afin de déterminer le style d’écriture de l’auteur d’un texte. Un algorithme est créé en fonction de cette base de données lui permettant d’analyser les ressemblances entre différentes parties minimales de textes inconnus en leur attribuant des appréciations positives ou négatives.
La particularité d’Emma : déterminer la paternité d’une œuvre
Des centaines de travaux issus de multiples auteurs ont été testés lors de la phase d’élaboration. Emma Identity s’est révélé performant à raison de 85 %. D’après le CEO, Aleksandr Marchenko, ce taux de réussite n’aurait jamais été atteint précédemment par des ingénieurs. En effet, les autres programmes de détection de plagiat se bornent à mettre en évidence les ressemblances de textes afin de relever les copies ou les plagiats retravaillés par l’imitateur. Ces outils ne favorisent pas la mise en exergue de la paternité d’une œuvre. Emma Identity a pour ambition de faciliter cette détection.
Quelle utilité ?
De nombreux publics peuvent trouver un intérêt à Emma Identity, les écrivains et les journalistes, bien entendu, mais aussi les avocats, les éditeurs ou les historiens, qui pourront ainsi reconnaître les auteurs de textes anciens. Les politologues et même le FBI pourront respectivement déterminer l’auteur d’un discours politique ou l’initiateur de notes de chantage !
Évidemment, Emma est également utile aux professeurs, leur facilitant la traque aux devoirs universitaires copiés. Actuellement, les travaux de fin d’études sont déjà soumis à ce genre de test dans de nombreuses universités. À terme, d’autres travaux pourraient donc être testés grâce à ce type de programmes.
Pour l’instant, la version bêta disponible depuis juin 2017 ne permet que l’analyse de textes en anglais. Nul doute toutefois que cet outil sera bientôt ouvert aux autres langues. Il semblerait néanmoins que l’application soit encore très ludique. Il est évident qu’une fois suffisamment entraînée, elle permettra d’analyser toutes sortes de textes très rapidement. N’hésitez pas donc à soumettre des textes à l’outil afin de garantir son développement !
Iris Thunus
Ailleurs sur Lettres Numériques :
- L’intelligence artificielle au service de la traduction automatique de contenus
- De nouvelles manières de promouvoir le livre numérique sur Facebook
Retrouvez Lettres Numériques sur Twitter et Facebook.
— Rédaction