L’IA GPT-3 : un générateur de texte puissant qui imite le langage humain
La dernière version de l’intelligence artificielle GPT développée par OpenAI, la société d’Elon Musk, est un générateur de texte qui a pour vocation d’imiter le langage humain. Elle pourrait être commercialisée sous la forme d’une interface de programmation d’application (API) d’ici la fin de l’année. Microsoft, pour sa part, s’est déjà assuré un accès unique au code sous-jacent du GPT-3 en élargissant son partenariat avec OpenAI.
Qu’est-ce que l’IA GPT-3 ?
Il s’agit de la troisième version logicielle du générateur de texte créé par la société OpenAI, fondée par Elon Musk en 2015 : un outil destiné à rédiger des textes qui ressemblent à ce qui peut être écrit par des humains. GPT-3 est en effet un modèle de traitement du langage naturel (TLN) qui utilise l’apprentissage automatique pour analyser et générer du texte. Le traitement du langage naturel peut être défini comme « la capacité pour un programme informatique de comprendre le langage humain tel qu’il est parlé » (LeMagIT).
Un immense corpus, comparé à GPT-2
Cette intelligence artificielle a la particularité d’être entraînée à partir d’un immense corpus de textes, le plus grand jamais enregistré, issu du Web et de livres numérisés. Pour donner un ordre de grandeur, l’intégralité des ressources de Wikipédia en anglais, qui représente 6 millions d’articles, ne constitue que 0,6 % des données ayant permis à l’IA de s’entraîner.
Nous vous présentions son prédécesseur, GPT-2, sur Lettres Numériques en 2019. La principale différence entre les deux versions est donc sa puissance : GPT-2 comporte 1,5 milliard de paramètres, contre 175 milliards pour GPT-3. Autre point de divergence à souligner : GPT-2 n’avait également pas été rendue publique, par crainte d’utilisation à des fins malveillantes : transformée depuis en « société à but lucratif plafonné », l’entreprise a pris la direction inverse en juin 2020 et a ouvert un accès commercial.
Comment cette IA fonctionne-t-elle ?
L’utilisateur commence une phrase et la machine la termine ou continue même le texte. L’outil GPT-3, dont l’acronyme signifie Transformateur Génératif Pré-entraîné, peut par exemple inventer la suite d’un dialogue entre deux personnages, continuer une série de questions-réponses ou poursuivre un poème dans un style choisi.
« Il est capable de générer des phrases très naturelles et vraisemblables. C’est impressionnant de voir à quel point le modèle est capable de s’approprier le style littéraire, même s’il y a des répétitions », s’enthousiasme Bruce Delattre, spécialiste de l’intelligence artificielle (IA) au sein du cabinet Artefact, interrogé par l’AFP.
GPT-3 est capable de trouver des réponses précises, comme le nom d’une maladie à partir d’une description des symptômes, ou encore donner la solution de certains problèmes mathématiques ou s’exprimer dans plusieurs langues. « Ça fonctionne grâce à des régularités statistiques », précise Bruce Delattre. « Le modèle sait que tel mot (ou expression) a plus ou moins de chances de suivre tel autre. »
Microsoft s’assure l’exclusivité de GPT-3
Si les deux firmes étaient déjà liées par le contrat de Cloud Computing Azure, Microsoft vient d’élargir son partenariat avec OpenAI. Le but de ce partenariat pour la firme de Redmond est de s’assurer l’exclusivité de GPT-3. « Nous voyons cela comme une opportunité incroyable d’étendre notre plateforme d’IA basée sur Azure afin de démocratiser l’IA, permettre l’émergence de nouveaux produits, services et expériences, et augmenter l’impact positif de l’IA à grande échelle », précise Kevin Scott de Microsoft sur le blog de l’entreprise.
De son côté, OpenAI rassure ses utilisateurs en expliquant que cet « accord n’a aucun impact sur l’accès continu au modèle GPT-3 par l’intermédiaire de l’API d’OpenAI ». Plus encore, la firme affirme que les « utilisateurs actuels et futurs de ce modèle » pourront continuer à construire leurs applications.
Interrogé par The Verge, un porte-parole de la firme de Redmond a ainsi expliqué que cette fameuse licence exclusive donne à Microsoft un accès unique au code sous-jacent du GPT-3, qui contient des avancées techniques qu’il espère intégrer dans ses produits et services. Autrement dit, si d’autres entreprises et chercheurs peuvent accéder au GPT-3 via l’API d’OpenAI, seul Microsoft pourra profiter de toutes les avancées en matière d’IA qui ont permis de faire de ce programme un outil aussi sophistiqué.
Quels types de textes peut générer GPT-3 ?
L’IA GPT-3 peut revêtir différents rôles : traducteur, poète, auteur… et même programmeur. Des chercheurs ont pu la tester lors de sa sortie en version bêta privée, en générant de nombreux types de textes différents :
- des ouvrages de fiction, des essais ou de la poésie ;
- des articles scientifiques ;
- des diagnostics médicaux ;
- des recettes de cuisine ;
- des paroles de chanson ;
- des tweets ;
- un chatbot qui faisait dialoguer des personnages historiques ;
- des manuels d’informatique ;
- des lignes de code en HTML ou dans d’autres langages de programmation.
Le modèle peut donc générer du texte de nombreuses façons, mais aussi le modifier pour le traduire dans d’autres langues ou encore le simplifier. Si GPT-3 peut comprendre les interrogations en langage naturel, il est aussi capable de générer des réponses argumentées et correctes du point de vue de l’orthographe et de la grammaire. Il pourrait donc faciliter l’exécution de tâches spécifiques et répétitives de certains métiers, comme la rédaction de documents légaux par les juristes, qui ont toujours la même structure et contiennent un même champ sémantique.
Cela dit, ce nouvel outil d’intelligence artificielle n’est pas parfait et fait l’objet de nombreuses critiques depuis sa sortie en juillet dernier. Nous vous invitons à consulter le décryptage complet du média Les Numériques ou encore l’article de France tv pour en savoir plus à ce sujet.
Most Recommended Books
Anurag Ramdasan et Richard Reis ont fondé Most Recommended Books, un portail qui s’appuie justement sur l’IA baptisée GPT-3. L’objectif de cet outil est de vous recommander des livres en fonction de votre humeur. Leur algorithme serait capable de vous conseiller le bon livre au bon moment en fonction de votre état d’esprit.
Toutefois, GPT-3 ne propose qu’un livre pour chaque requête et la recherche ne peut se faire qu’avec des mots-clés anglais.
Ailleurs sur Lettres Numériques :
- GPT-2, une IA génératrice de textes mise en quarantaine
- Un outil de machine learning passe des ouvrages au Tamis
- Quand l’IA s’invite dans les médias
Retrouvez Lettres Numériques sur Twitter, Facebook et LinkedIn.
— Cynthia Prévot