Parcours de la donnée : un commun méthodologique pour faciliter l'ouverture des données en mobilité

Le "Parcours de la donnée" a émergé dans le cadre des travaux de La Fabrique des Mobilités dans le volet mobilité de Montréal en commun, plus précisément au sein de la partie portant sur la gouvernance des données. Celle-ci vise à soutenir les différents acteurs et projets dans la valorisation et la standardisation des données pour favoriser une gouvernance ouverte de la mobilité durable.

Hypothèse et objectifs

Au croisement de nos travaux de mobilisation de l’écosystème et de collecte de données en mobilité, nous avons lancé une initiative de vulgarisation du “parcours de la donnée”, c’est-à-dire  le chemin que parcourent nos données en mobilité depuis le moment où elles sont créées, enregistrées, jusqu'aux utilisations successives qui les rendent “utiles”.

L’objectif ici est de donner à voir le parcours de la donnée de sa création à son utilisation dans l'optique de faciliter et démocratiser son usage comme levier de déploiement de nouvelles mobilités (format de données, occurrence de mise à jour, outils de visualisation et de croisement de données,...). L’idée était donc également de doter les parties prenantes actives sur le terrain et la communauté mobilisée par Montréal en commun d'une capacité de gestion du parcours de la donnée ouverte en mobilité.

Avancements et défis rencontrés

La première étape a été d'identifier quels étaient les acteurs, sujets et étapes essentiels à une bonne vulgarisation du parcours de la donnée ouverte. Notre démarche constitue donc également un travail de pédagogie sur les données ouvertes et leur utilité, au fur et à mesure des rencontres avec les partenaires (arrondissement de Rosemont Petite-Patrie, le LIUM, Jalon et Savoir-Faire Linux).

Nous avons commencé avec une étude de cas avec les données de SIGNALEC (cf. article de blogue dédié).

Ensuite, nous avons réalisé des entretiens avec 4 experts sur le sujet, intervenant sur la création et le stockage des données ouvertes de bordure de rue :

Il a été possible d'identifié certains enjeux liés au parcours de la donnée. Voici un extrait des entretiens avec les éléments les plus pertinents recueillis :

  • « L’un des premiers enjeux qu’on a compris, en rencontrant différents acteurs de la mobilité intéressés par l’utilisation des données de mobilité de stationnement, c’est la non-consistance de la structure des données. Les données sont sous des formats différents, ne sont pas à jour, ne sont parfois pas disponibles. Il y a aussi l’absence d’un écosystème qui permet aux différents acteurs de suivre les bonnes pratiques dans la création, l’organisation, la mise à jour ou le suivi de ces données. » Larbi Gharib
  • « Le premier frein, c’est la qualité de la donnée. Toutes les données ne sont pas structurées, comme on disait au départ, de la même façon. Et même dans certains fichiers, par exemple le fichier des données de stationnement de la ville de Montréal, les données de signalisation, les dates utilisées pour désigner le type, les périodes de réglementation, par exemple de lundi à vendredi, du 1er décembre au 1er mars, la façon d’écrire ces réglementations n’est pas la même. Et cette information-là crée dans notre travail un frein pour avancer. Il nous faut déterminer quelles sont toutes les formes d’écriture de ces réglementations-là pour pouvoir avoir une donnée à la sortie qui soit structurée et vraie. » Larbi Gharib
  • « Le deuxième frein, c’est la méconnaissance des différentes sources de données, des contacts. On ne sait pas toujours à qui s’adresser. »
  • « Le but est de créer un cercle vertueux entre les gens qui partagent leurs données et les mettent à disposition, qu’ils puissent se servir des données d’autres personnes qui partagent aussi leurs données, afin de faire avancer la mobilité durable. » Carole Philibien
  • « La culture de la donnée ouverte est peu mise en avant, surtout dans les entreprises privées parce que, pour elles, leurs données sont leur business donc il n’y a pas de raison qu’elles les partagent, voire c’est risqué de les partager. S’ajoutent à ça tous les enjeux de sécurité et d’anonymisation des données, éviter que des croisements de données permettent l’identification d’une personne, par exemple. Donc il y a tout un côté business, contractuel, mais il y a aussi tout un côté vraiment sécuritaire pour protéger l’individu et éviter que les données et les individus soient retracés. Et ça reste encore quand même un domaine assez complexe à allier. Les uns et les autres se contredisent presque. D’un côté, vouloir plus de transparence et, de l’autre, ne pas vouloir montrer les données. » Carole Philibien
  • «  En général, on essaie d’apporter le moins de changements possibles dans les données qu’on rend disponibles. Le but est de ne pas créer d’effort supplémentaire. Ceci dit, il y a quand même un niveau de détail dans nos données qui n’est pas nécessairement pertinent. Donc on essaie de penser en amont à l’utilisation qui va être faite de l’autre côté par l’utilisateur, et de trouver le juste équilibre qui nous permet de dire qu’effectivement on n’est pas en train de trop manipuler la donnée afin que des gens puissent en faire ce qu’ils en veulent. Ceci dit, en termes de gouvernance, il y a quand même plusieurs étapes qu’on doit suivre pour être en mesure de rendre la donnée disponible. Il y a plusieurs cas de figure. Certaines données, souvent les moins sensibles, vont être sur des systèmes informatisés avec une interface à partir de laquelle on peut facilement les extraire. D’autres jeux de données ne sont pas sur des systèmes automatisés et doivent être ouverts de façon manuelle. Ce que nous souhaitons, évidemment, c’est que la majorité de nos données soient sur des systèmes informatisés pour qu’on puisse les mettre à jour de façon automatique et régulière et  s’assurer que la donnée disponible sur le site Web est pertinente, et surtout qu’elle ne dépende pas d’une unique personne pour la mise à jour. Par contre, selon le niveau de sensibilité, de criticité de la donnée, des coûts sont reliés à la gestion de la donnée. Donc, on ne peut pas se permettre de les avoir toutes sur des systèmes informatisés, même si c’est vers ça qu’on veut tendre pour la suite. » Philippe Fortin
  • « C’est la beauté de la chose avec les données; on est en mesure d’en faire d’autres utilisations, mais ça crée certaines limitations » (parlant de l’usage de données secondaires) Philippe Fortin
  • « Il y a aussi l’aspect de la protection de la vie privée. Quand on parle de données ouvertes, si on collecte une donnée très sensible, il faut quand même se poser des questions après pour la rendre disponible publiquement. Pour qu’elle ait un impact aussi, pour qu’elle puisse être utilisée par nos partenaires, il faut quand même s’assurer qu’elle respecte la Charte des données numériques. » Philippe Fortin
  • « L’une des grandes difficultés qu’on rencontre est justement de connaître qui sont les utilisateurs de nos données. Notre politique de données ouvertes est très très large. N’importe qui peut utiliser nos données ouvertes, et la seule chose qu’ils ont à faire est de citer la Ville de Montréal comme la source de ces données-là. Ce n’est pas qu’on a des attentes démesurées, mais on aime quand même être en mesure de savoir si on a un impact, et, surtout, d’adapter notre offre de services et les données qu’on rend disponibles. Ceci dit, la mobilité est l’un des domaines où on a le plus de retours et le plus de demandes, donc c’est quand même un peu plus facile d’avoir un portrait. Dans les grands utilisateurs, il y a des universités: des chaires de recherche à l’UQAM, à la Polytechnique, à Concordia même, se penchent sur des questions de mobilité. On a des organismes à but non lucratif qui réutilisent ces données-là, soit en termes de mobilité ou même d’espace bâti pour répondre à la clientèle locale, pour savoir ce qu’il y a en termes d’offres de services. Après, il y a toutes les applications de transport qui facilitent l’accès à différents services. Transit, par exemple, qui est une fierté montréalaise, se base en grande partie sur les données ouvertes. Il y a aussi les entreprises privées, comme la compagnie montréalaise Local Logic, tous les indices de potentiel piétonnier ou autre qu’on rencontre par exemple sur Centris, qui se basent sur les données ouvertes. Et évidemment, il y a certaines données, via d’autres services, comme les cartes interactives, dont les citoyen.ne.s  sont les utilisateurs finaux si on veut. Puis il y a les journalistes : énormément d’articles sont sortis en termes de mobilité, sur le REV dans les dernières années, mais aussi sur les comptages, sur les parcs, donc les achalandages. Et il ne faut pas oublier non plus qu’en termes de transparence, les données ouvertes sont très importantes. Et comme la mobilité est très sensible et très présente à l’intérieur de la vie des gens, ça a un gros impact. » Philippe Fortin
  • « Pour le citoyen, l’ouverture des données est une bonne chose, car c’est de l’information qui peut lui être pertinente. En revanche, je m’interroge sur la façon dont l’information lui est livrée. C’est quand même encore complexe d’aller chercher de l’information compréhensible, il faudrait la rendre plus lisible. » Valérie Legris

La prochaine consistait à élaborer plusieurs outils de vulgarisation et de sensibilisation aux enjeux sur le parcours de la donnée ouverte en mobilité.

Outil de cartographie des acteurs par cas d'usage

Dans le but de sensibiliser les organisations autant avec une maturité numérique moins développée qu'avancée, une première version d'un outil visuel de cartographie des acteurs a été créé par la Fabrique des Mobilités Québec. Cet outil vise en premier lieu à permettre d'identifier les acteurs, ainsi que les liens de collaboration entre ceux-ci, tout en pointant les risques et enjeux, les opportunités et les responsabilités de chacun. Ci-dessous se trouve le gabarit du schéma utilisé qui peut être quelque peu modifié en fonction du cas d'usage :

Outil de vulgarisation et de questionnement

La Fabrique de Mobilités Québec est aussi en conception d'un outil qui permettra à quelconque acteur de l'écosystème de données ouvertes de visualiser les étapes récurrentes du parcours de la donnée, en plus d'avoir à porter de main les questions pertinentes à se poser pour chacune des étapes dans le but de valider le niveau de maturité numérique de son organisation.

Voici les étapes à envisager pour chaque acteur concerné :

  1. Conception du projet (rédiger un plan de gestion des données)
  2. Créer et collecter les données (et les métadonnées descriptives)
  3. Traiter (nettoyer, formater, adapter) les données
  4. Analyser les données
  5. Conserver/archiver (structurer et organiser les jeux de données et leurs métadonnées)
  6. Diffuser/Valoriser (données accès aux données communicable via le moyen le plus adapté)
  7. Réutiliser les données

Voici les questions qui permettent de déterminer le niveau de maturité de l'acteur :

Concernant la consommation de données (étapes 1 à 4):

  • Si nécessaire, une entente a-t-elle été contractualisée pour l’usage des données?
  • Le choix juridique de partage (FUS, licence, etc.) est-il défini?
  • Le type d’usage des données est-il indiqué ?
  • La documentation des données et métadonnées à utiliser est disponible?
    • Le schéma choisi est un format standard?
    • Le format des données est indiqué ?
    • La temporalité de mise à jour des données est indiquée ?
    • La durée de vie des données est indiquée ?
  • Un canal de communication est défini pour suivre les modifications ?
  • Comment les données sont communiquées (entrepôts ? catalogue ? article ?)
  • Si nécessaire, une solution technique de partage a été définie (API, Depot de fichier, Entrepôt de données) pour permettre l’utilisation de données?
  • La sensibilité des données a-t-elle été validée ?
  • Le niveau de sécurité et d’accès aux données en fonction de leur sensibilité tant pour les individus que pour la propriété intellectuel (par exemple) est déterminée pour permettre son utilisation?
  • Les donnés doivent-elles été traités (préparation des données brutes, vérification, validation, nettoyage) ?
  • Quelles données vont être utilisées dans les analyses?
    • La loi de protection des renseignement personnels est-elle respectée dans ce sens ?

Concernant la production de données (étapes 5 à 7):

  • Si nécessaire, une entente est-elle prête pour contractualiser l’usage des données. ?
  • Le choix juridique de partage (FUS, licence, etc.) est-il choisi?
  • Le type d’usage des données par le consommateur est-il choisi ?
  • La documentation des données et métadonnées à partager est disponible?
    • Le schéma choisi est un format standard?
    • Le format des données est précisé ?
    • La temporalité de mise à jour des données est précisée ?
    • La durée de vie des données est précisée ?
  • Un canal de communication est défini pour permettre aux futurs consommateurs de suivre les modifications ?
  • Comment veut-on communiquer les données (entrepôts ? catalogue ? article ?)
  • Si nécessaire, une solution technique de partage a été définie (API, Depot de fichier, Entrepôt de données) pour permettre le partage de données?
  • La sensibilité des données a-t-elle été déterminée ?
  • Le niveau de sécurité et d’accès aux données en fonction de leur sensibilité tant pour les individus que pour la propriété intellectuel (par exemple) est déterminée pour permettre le partage?
  • Est-il possible d’évaluer la réutilisation des données (nb de téléchargements, de citations…)
  • Quelles données et métadonnées à conserver et combien de temps?
    • La loi de protection des renseignement personnels est-elle respectée dans ce sens ?

Les prochaines étapes de cette expérimentation seront d'intégrer les étapes et les questions à se poser au sein d'un schéma interactif, en plus de proposer des outils, des ressources ou des collaborateurs pour chacune des étapes selon les réponses aux questions pertinentes identifiées.

Evénements liés au projet

Webinaire Nord Ouvert - 25 mai 2022

Ce printemps, la Fabrique des Mobilités Québec a participé à la conférence de Nord Ouvert sur la durabilité des modèles de gouvernance des données. Lors de cet événement, les différentes verticales de Montréal en commun ont été présentées (mobilité, alimentation, réglementation et données).

Nous avons insisté sur les bénéfices de l’innovation ouverte afin de dérisquer des projets touchant la gouvernance des données, notamment ceux cherchant à développer des outils durables dans ce domaine.

Journée des Fabriques des mobilités à Montréal - 8 juin 2022

Au premier semestre de 2022, nous avons également eu l’occasion d’organiser une rencontre avec la Fabrique des Mobilités France à Montréal, le matin du 8 juin à la Cité des Hospitalières (espace de travail partagé par les partenaires de Montréal en commun). L’organisation de la rencontre fut, en soi, une riche source d’apprentissages, en particulier sur nos canaux de communication et mobilisation et sur la quantité de préparation en amont nécessaire quand on prépare un événement de ce type.

Nous avons pu accueillir Ghyslain Delabie (directeur de la Fabrique des Mobilités France), Julie Braka (cheffe de projet “standardisation du MaaS”) ainsi que Julien de Labaca (expert en mobilité durable).

L’objectif était de favoriser la transmission des apprentissages et expériences entre les initiatives françaises et québécoises sur la mobilité durable et innovante, notamment à travers l’échange des bloquants et perceptions respectifs. Pour cela, nous avons choisi de mobiliser l’écosystème autour du vaste thème de la “mobilité intégrée”, tant dans sa version technique (MaaS, mobility as a service) que sur des modes de transport spécifiques (covoiturage, transport à la demande).

Différents points ont été discutés : les barrières pour la mise en place d’un MaaS (notamment l’attractivité), l’importance des standards pour réduire certaines d’entre elles, la nécessité d’une direction claire (et donc de coordination avec les pouvoirs publics). Les intervenants ont également pu apporter des exemples d’initiatives dans d’autres pays et villes afin d’enrichir les échanges (Monaco, Madrid, Nantes, etc.). La qualité attendue des échanges était au rendez-vous.

Nous avons aussi pris le parti d’un “double mode” : en effet, les discussions avec nos invité.e.s étaient retransmises en direct et nous avons mis les enregistrements à libre disposition sur YouTube. Cet événement a également été l’opportunité de produire une nouvelle version d’une  vidéo de présentation de la Fabrique des Mobilités Québec.

diversity_3Organisation(s) reliée(s)

padding Carnet(s) relié(s)

file_copy 17 notes
Fabrique des Mobilités Québec
file_copy 17 notes
person
Intégré par Fabrique Des Mobilités Québec, le 20 novembre 2023 15:05
category
Méthodologie & accompagnement, Cycle de vie des communs, Fiche d'expérimentation, Pôle et valorisation des données en mobilité

Auteur·trice(s) de note

forumContacter l’auteur·trice

Communauté liée

Montréal en commun

Profil En commun

Communauté Passerelles

Carnets Praxis

forumDiscuter de la note

Publication

20 novembre 2023

Modification

14 mars 2024 13:56

Historique des modifications

Visibilité

lock_open public