ONIX, OPF, ISNI, CLIL : Parlez-vous métadonnées du livre ? (Partie 2)
Les métadonnées sont essentielles pour la promotion des catalogues des éditeurs. 94 % des éditeurs seraient en tout cas de cet avis, d’après le SNE (Syndicat National de l’Édition). Dans le même temps, ils seraient 77 % à ne pas savoir comment améliorer ces métadonnées. Deuxième partie du retour sur la formation aux métadonnées, donnée au PILEn (Partenariat Interprofessionnel du Livre et de l’Édition numérique) par Stéphane Leroy par l’entremise d’Edinovo.
Classifications thématiques du livre : à chaque livre son (ses) rayon(s)
Si vous voulez que votre livre numérique ou votre livre papier vendu sur Internet soit correctement distribué, il faut penser aux métadonnées ; à la différence d’une vente en librairie où c’est le libraire qui choisit de placer votre livre dans un rayon plutôt qu’un autre, la présence de votre livre dans telle ou telle catégorie d’un site web de revendeur sera automatisée. Une autre différence avec la librairie traditionnelle est que votre livre a le don d’ubiquité : il peut figurer dans plusieurs rayons à la fois. Vos métadonnées doivent donc être bien complétées, en particulier les classifications thématiques.
Les classifications thématiques identifient la ou les thématiques de votre livre selon une arborescence à plusieurs niveaux. Par exemple : littérature > roman historique > roman historique médiéval. Plusieurs classifications existent, notamment :
- CLIL (Commission de Liaison interprofessionnelle du Livre) : utilisée par les distributeurs, distributrices et libraires francophones. 1 300 entrées thématiques réparties dans 24 sections ;
- BISAC (Book Industry Standards And Communication) : utilisée par les distributeurs, distributrices et libraires américains. 4 000 entrées thématiques réparties dans 53 sections ;
- THEMA de EDItEUR : une classification plus internationale. 2 500 entrées thématiques réparties dans 20 sections.
De vraies différences culturelles existent entre ces classifications thématiques. Par exemple, la BISAC compte environ 400 entrées pour les ouvrages traitant de religion, en raison du nombre important de communautés religieuses aux États-Unis. En fonction d’où vous voulez vendre votre livre (en France, aux États-Unis, etc.), votre recours à ces classifications thématiques sera différent.
Open Package Format, Dublin Core, ONIX : métadonnées de l’ePub
Les métadonnées d’un ePub sont stockées dans un fichier interne nommé content.opf. OPF est l’acronyme d’Open Package Format, un référentiel de métadonnées au même titre que DC (Dublin Core). Open Package Format propose des métadonnées propres aux ePub. Dublin Core propose des métadonnées pour décrire succinctement toute ressource culturelle : livre, image, film, musique, etc. Dans un fichier content.opf, on retrouve habituellement des métadonnées utilisant les référentiels OPF et DC, pouvant être complétées d’autres référentiels, comme iBooks par exemple. Il est aussi possible d’attacher une notice ONIX complète aux métadonnées de l’ePub. Des référentiels de métadonnées qui se présentent tous sous la forme du langage à balises XML.
Les possibilités de décrire et relier son livre grâce aux métadonnées sont quasi infinies. Ceci étant, seules quatre métadonnées sont obligatoires pour l’ePub :
- le champ « Identification » (via l’ISBN/EAN par exemple) ;
- le champ « Titre » ;
- le champ « Langue » ;
- le champ « Dernière modification de la fiche ».
De grands revendeurs et distributeurs en ligne peuvent imposer le remplissage de métadonnées supplémentaires.
OPF, DC, ONIX et autres : les référentiels de métadonnées, parfois également appelés espaces de noms, utilisés apparaissent nommément – on parle de déclaration – dans le fichier XML. Chacun de ces référentiels a un préfixe qui lui est propre. Exemple : pour déclarer l’usage du référentiel Open Package Format (OPF) et du référentiel Dublin Core (DC), on écrira dans le fichier XML :
<dc:identifier opf:scheme= »ean »>9782123456789<dc:identifier>
Des logiciels comme Calibre ou Sigil permettent de rendre ces XML plus lisibles.
Catalogue en ONIX 3.0 : quelles métadonnées de diffusion et quels outils ?
Vous êtes éditeur ou éditrice et vous souhaitez que votre livre soit bien référencé auprès des libraires et revendeurs. Vous avez peut-être une base de données, mais celle-ci n’est pas communicable en tant que telle aux libraires et revendeurs. Vous avez besoin de créer un fichier XML, qui sera le véhicule de vos données vers la base de données des libraires et revendeurs.
Mais quelles métadonnées retenir pour votre livre ?
- Identité du livre (un ISBN par exemple, et ce par version comme évoqué plus haut : livre papier, ePub, édition illustrée, prêt numérique en bibliothèque, etc.).
- Description du livre (titre, sous-titre, résumé, pagination, collection, thématique CLIL/BISAC/THEMA, mots-clés, copyright).
- Dates du livre (date de mise en vente et de première édition).
- Contributeurs du livre (pour chaque contributeur : rôle, prénom, nom, pays, site web, biographie, etc.).
- Prix du livre (pour chaque pays : devise et prix par version).
Pour gérer et éditer un catalogue en ONIX, il existe des outils professionnels tels que Onix Edit ou Onix Suite. Vous êtes un auteur ou une autrice autoédité ? Vous êtes une maison d’édition avec un petit catalogue ? Si votre production n’est pas assez importante pour justifier un investissement dans ce type d’outils, les distributeurs en ligne mettent généralement à votre disposition des interfaces de saisie des métadonnées à travers des formulaires en ligne. Ces interfaces se chargeront ensuite de générer les fichiers XML ONIX correspondants pour les revendeurs. Dans tous les cas de figure, il peut être utile de consulter des guides de bonnes pratiques du langage ONIX avant de se lancer.
Retrouvez ce compte-rendu ainsi que d’autres billets sur le blog du PILEn.
Ailleurs sur Lettres Numériques :
- ONIX, OPF, ISNI, CLIL : Parlez-vous métadonnées du livre ? (Partie 1)
- Métadonnées commerciales : un enjeu crucial pour les éditeurs
- Métadonnées et mots-clés… du succès ?
Retrouvez Lettres Numériques sur Twitter, Facebook et LinkedIn.
— Gilles Simon