Découvrabilité, données ouvertes et liées | mythes et réalités

La percée de l'idée qu'il soit possible de facilement mettre à contribution les technologies du Web sémantique pour accroître la découvrabilité des contenus culturels en ligne fait actuellement des ravages. Si ces approches sont souhaitables afin de mutualiser les efforts et économiser des deniers publics alloués sous forme de subventions, leur mise en place est beaucoup plus complexe que ne le laissent croire plusieurs mythes qui ont actuellement cours.

conception d’une base de données structurées, ouvertes et liées sur la transmission des savoirs technologiques dans les arts... la base de données se servira des identifiants uniques Wikidata pour mieux placer son contenu dans les algorithmes de recommandation, dans le Web.

Le passage qui précède a été repiqué sur un site culturel québécois. Il est symptomatique de la dérive à laquelle nous devons prendre garde. Nous devons recadrer ce que semblable effort implique.

Il faut tout d'abord rétablir une vérité un peu malmenée : activer la découvrabilité de propositions culturelles en utilisant les annotations sémantiques et les principes d'inter-opérabilité représente un effort extrêmement complexe. Ce n'est pas simple. Cela représente beaucoup de travail et demande des ressources. Les plus beaux projets qui vont déjà en ce sens ont encore des efforts considérables à engager : que l'on parle du projet Wikidata des arts de la scène de CAPACOA, de la vitrine en ligne des collections du Musée national des beaux arts du Québec ou encore des projets du Réseau canadien d'information sur le patrimoine , tous ont plus de trois ans d'efforts engagés et poursuivent leur développement avec acharnement. Il en va de même pour les projets industriels de mutualisation comme MétaMusique , Scène Pro ou La Culture Crée . Ces choses là ne se font pas par magie.

Cet article n'entrera pas dans l'explication détaillée du travail qui doit être engagé dans un chantier de données liées, mais nous lançons néanmoins une liste des grands jalons à considérer afin de sonner la fin de la pensée magique et engager la réflexion. Voici selon moi la liste des étapes à mettre en œuvre pour harnacher le potentiel des données ouvertes et liées en culture.

  1. Établir des consensus sectoriels sur les termes et métadonnées des métiers, la sémantique usuelle - définir des scénarios d'usage et des parcours utilisateur pour y parvenir;
  2. Traduire les termes métiers vers des ontologies normées exprimées en langage machine
  3. Associer les termes métiers à des concepts décrits en ligne de façon pérenne par des URI hiérarchiques ou opaques
  4. Associer les ressources consignées dans les bases de données à des identifiants uniques stables
  5. Arrimer ensemble divers thésaurus et ontologies composées de triplets sujet-propriété-objet
  6. Préparer et faire signer les cessions de droits pour les artefacts et médias à publier
  7. Déposer des données dans les communs numériques comme Wikidata et Wikimedia Commons
  8. Publier des données dans des bases en graphes offrant des points d'accès SPARQL
  9. Lier entre elles des bases de données, automatiser leur synchronisation
  10. Publier des données sur des portails, des interfaces consultables ou interrogeables par l'humain
  11. Ajouter des microdonnées lisibles par les machines dans les interfaces et les pages Web
  12. Assurer la gouvernance collective de données provenant de sources diverses et agrégées

Vos commentaires, critiques et questions auront pour tous un grand intérêt, j'en suis certain.

Un article qui constitue un suivi à celui-ci a été publié le 19 avril 2021 : Jalons pour activer la découvrabilité des donnees ouvertes et liées en culture

Pour poursuivre cette réflexion nous recommandons la lecture des publications produites dans le cadre de la feuille de route stratégique « Métadonnées culturelles et transition web 3.0 » du Ministère de la culture et des communications (France) et ce, malgré leur publication il y a déjà 6 ans...

Aliacar, R., Bermès, E., Briatte, K., Cabrera, F. M., Davoigneau, J., Peyrard, S., … Vignaud, L. (2015, décembre). Identifiants pérennes pour les ressources numériques : Vade-mecum pour les producteurs de données . Paris : Ministère de la culture et des communications. Récupéré de https://www.culture.gouv.fr/Sites-thematiques/Innovation-numerique/Donnees-publiques/Identifiants-perennes-pour-les-ressources-numeriques

Grimaud, F., Alim, N., Briatte, K., Choppe, C. et Defrance, J.-P. (2015, décembre). Référentiel de formation Web sémantique, web des données. Ministère de la culture et des communications. Récupéré de https://www.culture.gouv.fr/Sites-thematiques/Innovation-numerique/Donnees-publiques/Web-semantique-Web-des-donnees-Sensibilisation-et-formation-des-acteurs-culturels

LIRIS, MAEDI et MCC. (2015, décembre). Traçabilité des données numériques - Quels modèles pour la provenance des données numériques? État de l’art . Paris : Ministère de la Culture et de la Communication. Récupéré de https://www.culture.gouv.fr/Sites-thematiques/Innovation-numerique/Donnees-publiques/Tracabilite-des-donnees-numeriques

Troncy, R., Antipolis, S. et Bailly, R. (2016, décembre). Application des technologies 3.0 à la description des événements culturels . Paris : Ministère de la Culture et de la Communication. Récupéré de https://www.culture.gouv.fr/Sites-thematiques/Innovation-numerique/Donnees-publiques/Application-des-technologies-3.0-a-la-description-des-evenements-culturel

Référentiel de formation Web sémantique, web des données Traçabilité des données numériques - Quels modèles pour la provenance des données numériques? État de l’art Application des technologies 3.0 à la description des événements culturels Identifiants pérennes pour les ressources numériques : Vade-mecum pour les producteurs de données


Commentaires importés

Jerry Espada - 15 février 2021 à 7:42 :
La magie de la recherche (des efforts) n'est-elle pas le contraire du proverbe "Tant va la cruche à l'eau qu'à la fin elle se brise"? Autrement dit, à force d'efforts on trouve. Ce que je veux dire, c'est que les efforts des dernières années ne sont pas en vain. Certes, on ne sait pas quand ils porteront fruits, mais ce n'est pas comme si on s'était intéressé au sujet à la fin 2020. Nous sommes peut-être arrivés proche d'un dénouement, non?

Véronique Marino - 15 février 2021 à 9:31 :
Je trouve la liste plus haut très juste mais j'ajouterai un point. Nous devrions faire un effort sur ce qui donnera du sens à tous ces efforts : developper une culture de la stratégie! La découvrabilité et tout son cortège d'efforts, d'arrimage et de mise en relation ou en miroir n'a de sens que lorsque l'on sait quels sont les objectifs PRÉCIS poursuivis. Il faut être capable de l'évaluer donc de la monitorer et pour ce faire il faut la comparer à des objectifs quantifiables. Ce sont ces objectifs qui vont conditionner les gestes à poser. CAPACOA a des objectifs, chiffrés précis, au-delà du meta message. Les activités méta, que j'assimilerais à la "culture de la donnée" sont une base fondamentale mais là encore quelle donnée ? Je crois que nombre de projets aujourd'hui tendent à construire des petits morceaux de ce grand ensemble mais ce qui doit être insufflé c'est la culture de la stratégie sinon faire tous ces efforts ne serviront à rien. Une donnée seule ne parle pas, des données liées et structurées apportent une création de sens interprétable mais pour que ce sens s'exprime, il faut l'activer par des leviers coordonnés. La découvrabilité est bicéphale : d'abord dire qui l'on est de la manière la plus détaillée et universelle possible, puis déterminer pourquoi nous sommes là et quels objectifs nous poursuivons par notre présence. Et la beauté c'est que nos objectifs sont infinis et divers et temporaire donc on peut les réévaluer en fonction de nos besoins mais encore faut-il les définir. Les moyens de faire "parler" les données sont multiples et les machines ne peuvent pas determiner nos objectifs. Nous devons assimiler que les machines sont manipulables et sortir de cet asservissement mental qu'elles ne font QUE nous manipuler. Soyons stratégique et choisissons dans notre palette que représente les plateformes, les bonnes cordes pour permettre à notre flèche de rencontrer sa cible. Identifions le travail juste et nécessaire pour canaliser nos énergies.

Jean-Robert Bisaillon - 15 février 2021 à 12:09 :
Merci Véro, Jerry,
Véronique, tu soulèves bien évidemment LA question. Celle de la finalité. C'est ce qui manque à la plupart des projets qui agitent la nécessité de mettre en place des bases de données ouvertes et liées, mais ne savent ni à quelles fins, ni au prix de quels efforts. Ce serait bien que tu nous dises quelle est la finalité, nous présente en section privée (sous les catégories #Formation #Activation #ArtsdelaScène) l'initiative de CAPACOA et invite Frédéric Julien à nous en dire un mot. C'est un projet qui doit créer l'exemple dans la mesure où il démontre le sérieux nécessaire à appliquer si l'on veut modéliser sémantiquement un secteur disciplinaire, dans ce cas précis, celui des arts de la scène.
Quant à la culture de la stratégie dont tu parles, elle est déjà manifeste, selon moi, dans le cadre de stratégie d'action commun de la Mission France-Québec. C'est pour en matérialiser la réflexion que j'ai créé l'actuel espace et pour que nous ne passions pas tout droit que j'ai publié l'actuel article. Je suis trop d'accord avec toi. Il faut s'assurer que tous ces financements et tous ces efforts servent la finalité qui est la préservation même de nos souverainetés identitaires et culturelles en contexte numérique.
Pour les lecteurs de Passerelles témoins de cet échange public et qui souhaiteraient poursuivre l'échange avec nous, n'hésitez pas à adhérer à l'actuelle communauté de pratique.

Jean-Robert Bisaillon - 15 février 2021 à 15:50 :
Certains fruits seront récoltables cette année, mais d'autres sont toujours bien verts!

Tammy Lee - 15 février 2021 à 17:37 :
Merci d'avoir écrit cet article

Jean-Robert Bisaillon - 16 février 2021 à 13:07 :
Merci Tammy! Tu pourrais aller ajouter La Culture Crée dans le formulaire de recensement des initiatives? https://forms.gle/YUsACz7vWoKmndt49 Vous pourriez aussi ajouter un article qui décrit ce que vous faites actuellement et le taguer par les catégories #ArtsdelaScène et #Activation. La présente communauté se prépare à jouer un rôle actif au printemps 2021 et ce serait bien que vous y soyez bien visible. Au plaisir. JR

Frédéric Julien - 3 mars 2021 à 16:49 :
Très bon billet. Les étapes 1-3 sont en effet très importantes. Le projet Performing Arts Information Representation Community Group (https://www.w3.org/community/pair-cg/) s'y attaque d'ailleurs, mais en commençant d'abord par la collecte de "user stories". Pour ma part, l'une des activités les plus importantes est la 2: c'est par l'interopérabilité sémantique que nous allons rendre possible ou non une réutilisation des données. L'attribution d'URI aux entités nommées est aussi très importante - c'est pour ça que j'investis autant d'efforts dans la saisie d'informations dans Wikidata.

Auteur·trice(s) de note

forumContacter l’auteur·trice

Communauté liée

Découvrabilité

Communauté Passerelles

Profil En commun

forumDiscuter de la note

Publication

13 février 2021

Modification

28 avril 2023 11:12

Historique des modifications

Licence

Attention : une partie ou l’ensemble de ce contenu pourrait ne pas être la propriété de la, du ou des auteur·trices de la note. Au besoin, informez-vous sur les conditions de réutilisation.

Visibilité

lock_open public