Découvrabilité et traçabilité : Les métadonnées, une passerelle essentielle

À l’heure où la découverte de contenus passe par de puissants algorithmes, l’utilisation des métadonnées – ces données qui permettent d’identifier un contenu – devient cruciale pour les créateurs et producteurs. Voici une analyse des principaux standards d’indexation mis en place pour assurer la traçabilité d’une œuvre dans l’univers numérique.

Il n’y a pas de doute, la dématérialisation des produits culturels est bien entamée dans l’industrie de la vidéo comme celui de la musique. En 2016, 53% de la population mondiale utilisait Internet et 38% utilisait un téléphone intelligent. La même année, 317.3 millions de personnes visionnaient du contenu vidéo par l’entremise d’un service de télévision par contournement (OTT) et plus de 51 millions d'œuvres musicales enregistrées étaient disponibles en écoute en continu.

La diffusion en continu propose pour la première fois de l'histoire l'écoute de listes de contenu à la carte personnalisée pour chaque consommateur. Ce changement de paradigme constitue une révolution culturelle dont les effets sont encore difficiles à mesurer, mais il est certain qu'il a des répercussions immenses sur l'offre, la demande et sur les problématiques de gestion de cette offre et de cette demande.

Désormais les vitrines de l'offre culturelle sont des entreprises du secteur des technologies de l'information et de la communication. Pour ces entreprises, le modèle d'affaires repose sur la valorisation des informations et des comportements et non sur la marchandisation d'objets culturels, comme la vente de musique, de film et de livre. Comme l’affirme le mathématicien britannique Clive Humby «Data is The New Oil». La donnée est le nouveau carburant économique.

Dès 2006, Chris Anderson, théoricien des environnements numériques, affirme dans son ouvrage «The Long Tail: Why the Future of Business Is Selling Less of More» que dans le nouveau contexte d'hyperchoix, une force «qui aide les gens à trouver ce qu’ils veulent au sein de cette surabondance nouvelle» est devenue nécessaire. La notion de découvrabilité est née.

Elle s'incarne notamment dans les outils de recherche et de recommandation. L'efficacité de ces outils repose indéniablement sur le recours de données qui décrivent les données qu’elles accompagnent, c’est-à-dire des métadonnées descriptives. Nul n'ignore désormais le rôle clé que jouent les algorithmes dans les recherches et les recommandations de contenus. Or, sans les données, les algorithmes sont muets.

L’importance des métadonnées

Les métadonnées constituent la fiche d'identité d'un contenu culturel numérisé. Ce sont les informations descriptives perdues lors du passage au numérique : le livret, les crédits... Ainsi une métadonnée associée à une ressource, à une œuvre d'art, permet de la décrire et de la tracer dans les réseaux numériques. C'est un univers complexe qui englobe aussi des métadonnées légales ou contractuelles, des identifiants uniques ISO, des données d'usage, et des microdonnées permettant le moissonnage et l'affichage automatique d'informations par les robots de recherche.

La multiplication exponentielle des usages nous oblige maintenant à mettre en place des processus automatisés basés sur les métadonnées. La traçabilité et l'identification appropriée des contenus permettent d'automatiser les processus de reddition de comptes, de rémunération des créateurs, producteurs et contributeurs associés, et de renouvellement de l'offre par une chaîne d'acteurs professionnels. La traçabilité des contenus culturels recèle une grande valeur, à l'instar de la capacité à tracer n'importe quel autre bien dans une chaîne de distribution donnée.

Pour permettre une exploitation des contenus en ligne, l’existence de métadonnées descriptives est devenue aussi importante que le contenu lui-même. Par contre, jusqu'à maintenant, l’ajout de métadonnées, une tâche dont sont responsables les producteurs et les créateurs de contenus, a été laissé au bon vouloir de chacun.

Il faut dire qu’elle est répétitive: les entreprises doivent procéder à la saisie des informations dans de multiples interfaces en ligne pour les agrégateurs, les sociétés de gestion collective, le dépôt légal, les paroles de chansons, etc. De plus, les possibles erreurs humaines et l'absence de cohérence dans la saisie provoquent des dysfonctionnements dans la chaîne de mise en marché.

Le moment est donc venu pour les industries culturelles de s'appliquer à définir des schémas de traitement de contenus - ou objets médiatiques et culturels numériques (OMCN) - pour permettre d'enrichir ceux-ci avec les métadonnées nécessaires ; de se donner des méthodes à la fois simples, mais aussi systématiques pour faire ce travail.

Tour d’horizon des standards mis en place pour identifier un objet numérique

Divers standards d'indexation des informations existent. Ces standards sont d'autant plus nécessaires à respecter qu'ils doivent être lus, compris et exploités par les machines, pour faire émerger les contenus. C’est aux acteurs industriels d’évaluer ces standards pour en adopter certains et les gouvernements peuvent les accompagner dans cette quête.

De tels standards, comme ceux proposés par le consortium DDEX, sont déjà utilisés par les grands acteurs globalisés tels qu’Amazon, Apple et Google. Il semble donc important que les producteurs de contenus et créateurs canadiens s'alignent sur ces standards mondiaux. Les standards DDEX permettent de transmettre les contenus et de recevoir les chiffres de ventes selon des normes qui automatisent la chaîne de distribution - un peu comme les schémas EDI ou GDSN utilisés par Walmart.

De son côté, l'Organisation internationale de normalisation (ISO) encadre la définition des standards et identifiants uniques pour de nombreux secteurs industriels et économiques, y compris les industries culturelles. Son comité technique ISO TC46/SC 9 s'occupe de 24 normes pour les secteurs culturels. Ces identifiants sont de plus en plus connus. Il s'agit des ISBN, ISRC, ISWC, ISAN et plusieurs autres.

Finalement, d'autres normes comme le UN-LOCODE de la Commission économique européenne des Nations-Unies permettent de situer un lieu géographique et c'est là un élément important à ajouter aux métadonnées afin de cadrer l'origine d'un bien numérique ou le lieu d'établissement d'un producteur.

Je crois qu’il devient désormais urgent que les industries culturelles canadiennes adoptent des pratiques d'affaires qui respectent les normes mondiales d'indexation des contenus numérisés et qu'elles s'engagent, aux côtés des instances gouvernementales concernées, dans la définition en constante évolution de celles-ci.


Jean-Robert Bisaillon
Jean-Robert Bisaillon est un spécialiste des métadonnées descriptives du secteur culturel. Il codirige le Laboratoire de recherche sur la découvrabilité et les transformations des industries culturelles à l’ère du commerce électronique (LATICCE) de l’UQAM. Il assume également le développement du projet logiciel TGiT qui permet l’indexation des métadonnées pour l’industrie de la musique, le conditionnement et l’exportation de celles-ci selon les standards internationaux, leur mise en valeur dans le Web des données et les technologies de chaînage de blocs (blockchain).
En savoir plus