Skip links

Où se retrouvent nos données culturelles?

10 janvier 2020 | Blogue

Par Gisèle Henne, ADN, numerique@culturelaurentides.com

Une donnée peut être définie comme une entrée alphanumérique dans un champ. Le sens de ce champ est attribué par la métadonnée. Il existe trois grandes divisions numériques où on retrouve les données: SOUS le Web, SUR le Web et DANS le Web. Très largement, on pourrait dire que les métadonnées permettent à nos données culturelles d’être découvertes par les robots qui les analysent SUR et DANS Web. Pour que, ultimement, les internautes puissent trouver les contenus culturels des organismes et des artistes.
Voir le glossaire plus bas pour les mots en gras.

Culture Laurentides, où se situent les données?

 

Il existe, au premier niveau, les données HORS du Web ou SOUS le Web. Il s’agit de nos bases de données internes, nos chiffriers Excel, nos répertoires de clients ou de membres, notre intranet. Ces données, qui sont sous le Web, ne sont pas accessibles en ligne. Elles sont enregistrées sur nos ordinateurs ou nos serveurs internes. L’idée ici est de rendre accessible ce qui est pertinent pour le partage et l’avancement des connaissances, vers le niveau 3.

Au deuxième niveau, on retrouve ensuite des données SUR le web. Il s’agit de nos sites Web un peu dépassés et de nos publications éparpillées. On parle des calendriers en ligne d’événements locaux, des répertoires de membres, ou encore des catalogues de produits. Ces données sur le Web sont accessibles par tous mais ne sont pas liées dans des métadonnées communes à la sémantique du Web actuel. Par exemple, pour une donnée de spectacle dans un village, si la métadonnée de l’endroit est nommée «lieu» à la place de «location» (de Schema), cette donnée de spectacle ne sera pas répertoriée par Google. Elle passe donc sous le radar de la découverte.

Et il y a enfin le troisième niveau des données DANS le Web. Il s’agit des données structurées, ouvertes et liées. À ce niveau, les données sont liées entre elles et enrichies d’hyperliens qui en améliorent le sens (pour les machines). Elles sont ouvertes, donc accessibles à tous, et réutilisables. L’exemple le plus facile à comprendre reste l’univers Wikidata. Sur cette plateforme, les données ouvertes et liées deviennent des outils pour les algorithmes qui décortiquent le vaste internet. C’est dans ce troisième niveau que se planifie l’architecture du Web. On réfléchit à la sémantique de l’information. On construit des graphes de connaissances, c’est-à-dire des répertoires de répertoires de données, pour optimiser le travail de recherche des moteurs.

Il va sans dire que nous nous devons d’atteindre le troisième niveau pour nos données culturelles. Et le premier pas dans cette direction est de bien comprendre les enjeux de la découvrabilité des contenus. Besoin d’un plan de match?

 

___

Qu’est-ce que la donnée? Il s’agit de l’expression simple d’une entrée alphanumérique sur le Web.

Qu’est-ce que la métadonnée? Il s’agit de la structuration de la donnée, qui la rend repérable aux algorithmes d’intelligence artificielle qui parcourent le Web.

Qu’est-ce que la donnée liée? Il s’agit d’une sorte d’hyperlien entre deux données de différentes plateformes, un pont entre deux données de différentes pages.

Qu’est-ce que la donnée ouverte? Il s’agit d’un statut d’utilisation libre de droits de la donnée. L’utilisation de cette donnée est offerte à tous librement, pour le bien commun et le développement des intelligences.

Qu’est-ce que la donnée structurée? Il s’agit de l’expression qu’utilise Google pour désigner des balises qui sont encodées dans une structure hiérarchique propre à sa plateforme de recherche, soit la disposition de l’espace supérieur droit de l’interface de recherche qui répertorie les données les plus importantes. Toutefois, toute donnée entrée dans un format prédéfini est «structurée», même s’il ne s’agit pas de l’architecture de Google.

Qu’est-ce que le Web sémantique? Il s’agit d’une extension du web: une technologie en soi. Les moteurs de recherche n’exploitent pas vraiment de données ouvertes et liées.

Qu’est-ce qu’un graphe de connaissances? Il s’agit d’un répertoire graphique des relations entre certains concepts d’un même domaine de connaissances. Ce répertoire tisse mathématiquement les liens (et représente les ponts) entre chaque concept pour renforcer la signification des données, leur valeur, leur pertinence.

Pour en savoir plus, voici un glossaire plus complexe rédigé par l’Observatoire de la culture des communications du Québec. Une vulgarisation plus accessible de ce lexique est présentée par Culture NumériQC.

À propos

Actualités

Services

Ressources

Événements

Membres

X