CR par Pierre Mounier
L’animateur de l’atelier se présente comme un ingénieur. C’est donc à partir de ce point de vue qu’il développe ses questions à propos de la qualité de l’information : comment fait-on techniquement pour l’assurer ?
3 thèmes doivent être abordés :
- Les critères de qualité de l’information (publiée) sont-ils très larges et très partagés ? Sur quel socle technologique peut-on les établir ? quelle est l’importance des métadonnées ?
- Maintien collaboratif des ontologies : l’enjeu est d’être capable d’établir un langage commun, d’obtenir une cohérence sans pour autant que la communauté soit écrasée et stérilisée par des contraintes trop fortes. L’exemple de Wikipedia qui impose et maintient sa structuration propre sans règles trop lourdes est intéressant. Par ailleurs, une attention particulière doit être accordée à des systèmes de synonymie qui établissent des liens entre les systèmes de représentation qui gardent leur autonomie sans devoir fusionner.
- Infrastructures mutualisées : quels sont les coûts de ces infrastructures ? quelle en est la gouvernance ? doivent-elles s’intégrer dans des cyberinfrastructures ?
La discussion s’est structurée autour de deux axes :
1. Les bases de données : l’ensemble des critères qui permettent d’établir une bonne qualité de l’information sont rarement respectés. Par exemple les procédures de travail et le mode de constitution de la base sont rarement explicitées. La documentation de la modélisation de la base est stratégique, en particulier, parce qu’elle permet d’établir des mappings entre les bases. C’est à cette condition seulement que l’on peut éviter les grandes bases centralisées qui sont trop contraignantes. Dans ces conditions, la formation des chercheurs à la modélisation de base de données est très importante.
2. Le sourçage de l’information : bien souvent, le passage de la publication imprimée à la base de données numérique se traduit en histoire par exemple par une véritable régression en terme d’information : des informations aussi simples et indispensables que la cote d’archive d’où vient l’information peuvent disparaître au moment de la constitution des bases… Le passage au numérique s’accompagne donc dans certains cas, d’une baisse de qualité de l’information historique qui n’est plus sourcée ! Cette question pourrait faire l’objet d’une recommandation.