Métadonnées et mots-clés… du succès?

Elles intéressent bibliothécaires comme entrepreneurs, et pour cause : elles peuvent permettre de mettre en avant de l’information sur la toile!


Les métadonnées sont des données au sujet des données. Ces marqueurs peuvent être introduits dans le langage XML. Ce sont en fait toutes les informations que l’on ajoute sur et, à l’âge numérique, dans le document, qu’il soit fait de texte, de son ou d’images. Lorsque les informations sont déplacées (téléchargées par exemple), les métadonnées continuent à en faire partie. Par leur nature-même, elles apportent des informations quant au contenu des textes. Les fiches cartonnées qui serv(ai)ent au classement dans les bibliothèques papiers permett(ai)ent aux bibliothécaires comme aux usagers de localiser, de gérer et de traiter les données dont ils avaient besoin. De la même façon, le balisage par les métadonnées permet d’établir de l’ordre et un classement dans les résultats des recherches internet. En les prenant en compte, les moteurs de recherche sont capables de répondre plus précisément aux requêtes des utilisateurs. Les algorithmes des moteurs de recherche des sites internet recourent donc à ces métadonnées, de même que les annuaires de site, de moins en moins utilisés.

Ce sont donc ces balises de métadonnées, et les mots-clés qui y sont repris, qu’on a dit si stratégiques pour tous ceux qui veulent arriver en tête des recherches internet. Leur utilité est maintenant discutée : Google, et un de ses ingénieurs, Matt Cuts, expliquent sur ce blog que Google ne lit pas les mots-clés intégrés dans le code source via la balise Meta Keywords. Celle-ci peut cependant servir à la recherche dans le cadre du classement interne du site.

Des générateurs de mots-clés, du type Google Adwords ou Microsoft Adcenter ou encore Ubersuggest, aident à trouver les mots-clés les plus susceptibles de coller aux recherches lancées par les internautes. Notons au passage qu’Ubersuggest a la particularité de travailler avec Google Autocomplete, donc avec les mots suggérés par Google aux internautes lorsque ceux-ci entrent une requête.  Ces mots peuvent apparaître sur la page de résultats via le titre SEO, ou metatitle – celui qui apparaîtra dans l’onglet et dans les résultats de recherche Google – comme dans l’URL et dans le contenu du site. En fait, ces mots, s’ils sont sélectionnés adroitement, guideront l’internaute vers le site en question.

Afin de pouvoir générer une connaissance commune à partir de l’ensemble des données présentes sur le Web – selon l’idéal du web sémantique -, les métadonnées doivent suivre certains standards. Le Dublin Core, par le Dublin Core Metadata Initiative, est un schéma organisant les métadonnées et permettant ainsi leur standardisation. La Bibliothèque nationale de France (BnF) l’a adopté pour sa bibliothèque numérique, dans le cadre du projet data.bnf.fr. Elle souhaite ainsi s’inscrire «dans une démarche d’ouverture des données sur le Web, y compris hors de la communauté des bibliothèques».

La Digital Library Foundation, avec le soutien de la Bibliothèque du Congrès aux États-Unis, a également mis au point un format, le METS, codé sous format XML. Celui-ci vise à  « exprimer des métadonnées de nature diverse portant sur un document numérique, dans le but de faciliter son échange, sa gestion et sa préservation », selon la formulation de la BnF qui a adopté ce système pour le projet SPAR, un entrepôt de préservation d’archives numériques. Le METS a une grande qualité : sa flexibilité. Le format est composé de sept sections, qui dissèquent les différents aspects du document. Une seule de ces sections doit obligatoirement être remplie, ce qui laisse une marge de manœuvre à l’heure de s’exprimer sur le contenu d’un document. Le revers de la médaille, c’est que les utilisateurs doivent poser plus de choix et les résultats finaux sont donc susceptibles d’être plus divers.

Le Graal – un standard pour tous les documents – n’est pas encore là. Le souhaite-t-on même vraiment, vu la variété de contenus auxquels les métadonnées s’appliquent ? Peut-être suffit-il simplement de savoir que les métadonnées nous conduisent aux contenus les plus pertinents… à condition de les utiliser à bon escient!

Ailleurs sur la toile:

Le site du consortium World Wide Web, qui promeut la compatibilité des technologies telles qu’HTML et XML ainsi que l’interopérabilité.

La BnF qui explique son projet lié au Web sémantique.

À lire dans notre numéro spécial Archivage :

Retrouvez Lettres Numériques sur Twitter et Facebook.

— Sibylle Greindl

Share Button