Rencontre avec Philippe Gambette, acteur du développement des bases de données littéraires en ligne et de l’analyse de texte

Philippe Gambette est maître de conférences en informatique à l’université Paris-Est-Marne-la-Vallée depuis 2011. Il travaille, en collaboration avec des chercheurs en sciences humaines et sociales, sur des problématiques d’analyse de textes assistée par ordinateur en proposant des outils de visualisation de textes et de nouvelles méthodologies d’analyse textométrique. Il participe également à un projet associatif et un projet de recherche tous deux articulés autour de la revalorisation des femmes de lettres. Nous l’avons rencontré à l’occasion de son intervention lors des 7e rencontres de l’édition et du numérique qui se sont déroulées le 16 mai dernier à Tourcoing, et dont nous vous faisions le compte-rendu ici.

Lettres Numériques : Pour commencer, pourriez-vous vous présenter en quelques mots ? Comment avez-vous commencé à vous intéresser à la visualisation de contenus littéraires ?

Philippe Gambette : Je suis enseignant-chercheur en informatique à l’université Paris-Est Marne-la-Vallée. À la suite d’une collaboration avec des romanistes, je me suis intéressé à l’analyse, assistée par ordinateur, de textes du XIXe siècle dans le cadre du programme de recherche Bibliographes, en 2016. Avec ma collègue Nadège Lechevrel, nous avons créé des visualisations des mots les plus fréquents dans un texte pour observer leurs occurrences dans des textes d’écrivains ou de scientifiques.

Pour cela, nous avons aussi utilisé la numérisation partielle de la Revue des Deux Mondes sur Wikisource. Cette revue permet d’étudier la vulgarisation scientifique au XIXe siècle, y compris le transfert des savoirs biologiques vers la littérature. Dans un premier temps, nous avons donc surtout travaillé à la collecte d’articles pertinents, ensuite nous avons commencé à apporter des contributions en corrigeant d’autres textes de la Revue des Deux Mondes, toujours sur Wikisource.

En quoi consiste le projet de recherche « VisiAutrices », auquel vous participez ?

Il s’agit d’un projet issu de discussions avec ma collègue Caroline Trotot, pendant une séance de travail sur la métaphore chez Ronsard. Nous avons remarqué que peu d’autrices étaient étudiées de nos jours, et en voyant en 2017 qu’il y avait justement un Hackathon (événement de programmation informatique collaborative) qui portait sur l’égalité homme-femme et qui s’inscrivait dans la dynamique lancée par le plan mixité numérique, j’ai proposé cette thématique. Avec l’équipe réunie pendant l’événement, nous avons tenté de trouver des solutions pour améliorer cette égalité en aidant les professeurs à trouver et partager des extraits de textes écrits par des femmes, pour les étudier avec leurs élèves.

Notre projet, nommé « George, le deuxième texte », était l’un des trois à être primé lors de ce Hackathon. Nous avons donc bénéficié d’un accompagnement pour pérenniser le projet, qui nous a permis d’identifier un appel à projets du CNRS sur le genre et le numérique.

Wikimédia Commons, George2etexte, licence CC-BY-SA 4.0
Atelier Wikisource Autrices du 25 mai 2019 à l’espace contributeurs et contributrices de Wikimédia France à Paris ; Wikimédia Commons, George2etexte, licence CC-BY-SA 4.0

Le financement obtenu nous a permis de réaliser une étude sur les raisons pour lesquelles les femmes sont moins étudiées en cours de français dans l’enseignement secondaire et supérieur. Il s’agissait du premier volet du projet de recherche « VisiAutrices » : avoir des chiffres sur la présence des autrices de manière large, autant dans les programmes que les manuels, les prix littéraires, etc.

Le deuxième volet est plus littéraire. Nous nous sommes demandé, par exemple, pourquoi et comment les professeurs aux États-Unis arrivent à étudier davantage les écrivaines. Nous avons aussi développé des approches pour connaître quelles sont les femmes présentes dans les relevés statistiques et celles qui ne le sont pas ou beaucoup moins, ainsi que pour distinguer les grands genres littéraires dans lesquels les femmes sont le plus étudiées. Les autrices sont étudiées dans les genres romanesques, par exemple, mais beaucoup moins en poésie et en théâtre, des domaines auxquels elles avaient moins accès pour des raisons financières ou bien dont elles ont été plus rapidement oubliées ou effacées.

Et que permet le moteur de recherche « Deuxième texte », auquel vous avez également contribué ?

Le « Deuxième texte » est le prototype préparé pour l’Hackathon de 2017, qui est toujours en construction. Il permet, en insérant le nom d’un auteur dans la barre de recherche, de trouver les noms d’autrices contemporaines à cet écrivain. Cette plateforme web a été réalisée en utilisant des données de Wikidata et de data.bnf. Il s’agit d’un projet associatif qui vise à fournir des outils aux professeurs, et qui contient déjà à ce jour plus de 100 extraits de textes d’autrices utilisés en classe.

Qu’est-ce que ces deux projets, « George, le deuxième texte » et « VisiAutrices », vous ont permis de faire et quels sont leurs développements à venir ?

Ces deux projets nous ont permis de créer des ateliers Wikisource. Wikisource permet de constituer, à la manière des fiches de Wikipédia, une bibliothèque en ligne libre d’accès, à laquelle chacun peut contribuer. Et donc depuis un an et demi, nous y avons chargé plus de 50 textes scannés écrits par des femmes dans le domaine public : nous les importons en ligne avant de les corriger et mettre en page pour permettre d’en faire de réels livres numériques dans lesquels il est possible de faire des recherches facilement, d’apporter des annotations, etc. Si un ouvrage d’une autrice est par exemple uniquement disponible dans une seule bibliothèque en France, nous le scannons et nous corrigeons le texte afin de le partager sous forme d’ebook au format ePub.

Wikimédia Commons,  Nattes à chat, licence CC-BY-SA 4.0
Atelier Wikisource : Opération de numérisation du livre de Clémentine de Como par FreeCorp ; Wikimédia Commons, Nattes à chat, licence CC-BY-SA 4.0

En avril 2019, nous avons aussi lancé le défi #JeLaLis, qui a aussi pour objectif de pallier le manque de visibilité des autrices en incitant tout un chacun à choisir une femme de lettres que l’on souhaite marrainer, seule ou en équipe. La grande majorité des personnes inscrites sont pour le moment des participantes. Celles et ceux qui ne savent pas quelle autrice choisir peuvent, sur le site du défi, trouver une femme de lettres qui porte leur prénom, qui partage leur date de naissance ou qui a vécu dans leur ville. Après inscription, les lecteurs peuvent trouver des informations sur elle (biographie, actes civils, contexte historique, etc.), lire ses œuvres, faire un post sur les réseaux sociaux, la dessiner, la jouer, l’incarner, etc. Toutes les idées sont bonnes, l’important est de faire découvrir ou d’apprendre à mieux connaître cette autrice et ses livres.

Retrouvez Lettres Numériques sur TwitterFacebook et LinkedIn.

— Cynthia Prévot

Share Button