vendredi 16 janvier 2015

La BnF expérimente le crowdsourcing




Depuis le 24 novembre 2014, la BnF a lancé une expérimentation de production participative (crowdsourcing) suite à mise en ligne de la plateforme Correct.

Cette plateforme expérimentale est le fruit d’un projet de recherche réunissant 9 partenaires : Orange (pilote du projet), BnF, Jamespot, Urbilog, I2S, ISEP, INSA de Lyon, Université Lyon 1, Université Paris 8. Elle vise à améliorer la qualité du mode texte issu de l’OCR des documents numérisés provenant de Gallica, en proposant à ses usagers de corriger les textes de manière collaborative.
En effet, lors de la numérisation de documents, les systèmes de reconnaissance optique de caractères (OCR) laissent trop d’imperfections pour obtenir un document conforme à l’original. Le seul moyen d’y parvenir est de passer par une phase de correction manuelle. Correct est une plateforme où peuvent collaborer différents utilisateurs pour détecter, analyser et corriger les erreurs restantes et ainsi participer à l’amélioration des documents.
 

Mode ligne à ligne de l’éditeur de correction de Correct 



D’autres bibliothèques ont déjà fait l’expérience de projet de crowdsourcing pour la correction de l’OCR. Le plus fameux est celui de la Bibliothèque nationale d’Australie mis en place depuis 2008 au sein de son site Trove. Mais l’originalité de Correct d’avoir adossé à l’éditeur de correction un réseau social dédié afin de créer du lien entre les contributeurs, de favoriser l’entraide et de faciliter l’organisation de la correction collaborative. Une autre innovation est de permettre un travail collaboratif en temps réel car plusieurs utilisateurs peuvent corriger la même page du même document en même temps. Cette approche nécessite une fusion des corrections pour valider les corrections similaires et lancer un processus de levée de doute pour les corrections en conflit.

Ce projet de recherche a deux enjeux techniques principaux :
-       mettre à la disposition des outils intuitifs pour corriger facilement les documents
-      déployer des outils automatiques pour superviser la fusion des corrections, l’analyse de la cohérence et le contrôle de la qualité de ces corrections.

Aujourd’hui, la BnF réalise une étude d’usage de Correct notamment par une enquête en ligne afin d’évaluer la plateforme expérimentale, d’explorer les attentes des utilisateurs et de mesurer comment les pratiques communautaires et collaboratives peuvent s’intégrer dans l’écosystème de Gallica.

Si vous n’avez pas encore testé Correct, rendez-vous sur la plateforme, vous pourrez ensuite nous donner votre avis.