Les données : définition et court lexique pour s'y retrouver

Référez-vous à cette note pour mieux comprendre ce qu'est une donnée. Vous y trouverez un court lexique présentant une brève définition pour 8 différents types de données dont il peut être question dans le cadre d'une démarche de transition numérique.

Photo : Claudio Schwarz, Unsplash

 

Qu'est-ce qu'une donnée?

Les données peuvent être des chiffres, des observations ou des enregistrements qui peuvent se présenter sous forme d’images, de sons, de textes ou de mesures physiques (distance, poids, longueur d’onde, etc.). Les données sont construites et mobilisées pour mieux comprendre un phénomène particulier, tirer des conclusions et guider la prise de décision.

 

Les types de données

🔵 Données agrégées : Ensemble de données dans lequel un enregistrement est un résumé de plusieurs unités d’observation permettant de répondre à des questions de recherche portant sur des populations ou des groupes d’organismes. Les données au niveau de l’enregistrement sont compilées à un niveau garantissant que l’identité des personnes ou des organismes ne pourra pas être établie au moyen d’une méthode raisonnablement prévisible.

Données anonymisées : Selon la Loi modernisant des dispositions législatives en matière de protection des renseignements personnels (Loi 25), un renseignement concernant une personne physique est anonymisé lorsqu’il ne permet plus, de façon irréversible, d’identifier directement ou indirectement cette personne. En pratique, l’anonymisation a ses limites. Dans certains cas d’utilisation, les procédés d’anonymisation permettent toujours d'identifier à nouveau les personnes physiques concernées avec un degré de précision élevé notamment en croisant certaines données.

Données dépersonnalisées : Selon la Loi modernisant des dispositions législatives en matière de protection des renseignements personnels (Loi 25), un renseignement personnel est dépersonnalisé lorsqu’il ne permet plus d’identifier directement la personne concernée. Cependant, il est possible que la personne concernée soit d'identifier à nouveau indirectement notamment en croisant certaines données.

🟡 Données non structurées : Ces données sont représentées ou stockées sans format prédéfini. Elles sont typiquement constituées de documents textes ou multimédias (image, vidéo), mais peuvent également contenir des dates, des nombres et des faits.

🟤Données structurées : Il s'agit de données (mots, signes, chiffres…) organisées en éléments prédéfinis, chacun correspondant à un concept ou à un élément d’information précis (ce qui permet l’organisation en rangées et en colonnes des données dans un tableur).

🟢 Données ouvertes : Il s'agit de données structurées, directement exploitables par un ordinateur, qui sont partagées gratuitement et qui peuvent être utilisées sans restriction.

🟣 Données personnelles : Tous renseignements relatifs à une personne physique identifiée ou qui peut être identifiée, directement ou indirectement, par référence à un numéro d’identification ou à un ou plusieurs éléments qui lui sont propres.Données sensibles : Pour une organisation, les données correspondent à des informations confidentielles, secrètes ou un actif informationnel ayant une valeur stratégique dont la fuite, l’altération, la suppression ou l’utilisation frauduleuse lui seraient grandement préjudiciables (par exemple vos états financiers).

🔴 Données personnelles et sensibles : Selon la Loi 25, un renseignement personnel est sensible lorsque, par sa nature ou en raison du contexte de son utilisation ou de sa communication, il suscite un haut degré d’attente raisonnable en matière de vie privée. Ainsi pour un individu, ses données personnelles, soit des informations qui révèlent sa prétendue origine raciale ou ethnique, ses opinions politiques, ses convictions religieuses ou philosophiques ou son appartenance syndicale. Il peut aussi s’agir du traitement des données génétiques, des données biométriques aux fins d’identifier une personne physique de manière unique, des données concernant la santé ou des données concernant la vie sexuelle ou l’orientation sexuelle d’une personne physique.

🟠 Données ventilées : Données réparties selon des caractéristiques personnelles, comme le sexe, l’âge, l’ethnicité, le revenu et le niveau d’éducation. Ces données sont intéressantes pour bien comprendre une situation, par exemple, pour mieux identifier si des populations ou des personnes sont plus impactées que d’autres. Toutefois des données ventilées apportent des risques plus grands d’identification des personnes et pour la protection de la vie privée.

Explorer ce thème

🧰 Des outils gratuits pour mieux comprendre et s'adapter à la loi 25.
📃 Comment élaborer une politique de partage de données au sein d’un projet partenarial?
📊 Étude de cas sur le stockage, le traitement et la visualisation de données.
Qu'est-ce que la gouvernance des données?
🚃 Découvrir le parcours de la gouvernance des données.

☝ Cette note a été rédigée par Nord Ouvert dans le cadre du projet Virage communautaire. Les savoirs présentés proviennent du programme DATAide, une initiative de Centraide du Grand Montréal.

noteNotes liées

bookmarkTermes reliés

paddingCarnet qui inclut cette note

Qu'est-ce que la cybersécurité et pourquoi c'est important?
file_copy 3 notes
person
Intégré par Hervé Boudou, le 6 novembre 2024 17:39

Auteur·trice de note

forumContacter l’auteur·trice

Communauté liée

Virage communautaire

Profil Passerelles

Carnets Praxis

forumDiscuter de la note

Publication

6 novembre 2024

Modification

25 février 2025 11:28

Historique des modifications

Visibilité

lock_open public

Pour citer cette note

Hervé Boudou. (2024). Les données : définition et court lexique pour s'y retrouver. Praxis (consulté le 13 juin 2025), https://praxis.encommun.io/n/hLblhO6lmU0Uiw9dd_nCP2zbs5A/.

shareCopier