Cours ouvert de Seth van Hooland - "Le web de données dans le contexte du pat... - 0 views
-
antoinef on 16 Mar 16"Le hype autour du web des données a permis d'attirer notre attention sur la problématique de la qualité des données. La publication de données venant d'horizons divers sur le web met en évidence, une fois de plus, les problèmes d'interopérabilité sémantique auxquels le secteur culturel se heurte depuis la création des premières bases de données dans les années 1970. Cette présentation a pour objectif de démystifier le web des données, en retraçant l'historique de quatre modèles de données. A l'aide d'exemples, les possibilités et limites de chaque modèle pour la gestion des données dans le secteur culturel seront exposées. Afin de rendre la thématique concrète, la présentation donnera dans un deuxième temps un aperçu du logiciel libre OpenRefine. Cet outil interactif de transformation permet à la fois de diagnostiquer des problèmes de qualité, d'appliquer une série de corrections, ainsi que d'enrichir un set de données via la réconciliation à l'aide du LCSH et l'extraction d'entités nommées."