Depuis le 24 novembre 2014, la BnF a lancé
une expérimentation de production participative (crowdsourcing) suite à mise en ligne de la plateforme Correct.
Cette plateforme expérimentale est le fruit d’un
projet de recherche réunissant 9 partenaires : Orange (pilote du projet), BnF,
Jamespot, Urbilog, I2S, ISEP, INSA de Lyon, Université Lyon 1, Université Paris
8. Elle vise à améliorer la qualité du mode texte issu de l’OCR des documents
numérisés provenant de Gallica, en
proposant à ses usagers de corriger les textes de manière collaborative.
En effet, lors de la numérisation de
documents, les systèmes de reconnaissance optique de caractères (OCR) laissent
trop d’imperfections pour obtenir un document conforme à l’original. Le seul
moyen d’y parvenir est de passer par une phase de correction manuelle. Correct
est une plateforme où peuvent collaborer différents utilisateurs pour détecter,
analyser et corriger les erreurs restantes et ainsi participer à l’amélioration
des documents.
Mode
ligne à ligne de l’éditeur de correction de Correct
D’autres bibliothèques ont déjà fait l’expérience de
projet de crowdsourcing pour la
correction de l’OCR. Le plus fameux est celui de la Bibliothèque nationale
d’Australie mis en place depuis 2008 au sein de son site Trove. Mais l’originalité de Correct d’avoir adossé à l’éditeur de correction un
réseau social dédié afin de créer du lien entre les contributeurs, de favoriser
l’entraide et de faciliter l’organisation de la correction collaborative. Une
autre innovation est de permettre un travail collaboratif en temps réel car plusieurs
utilisateurs peuvent corriger la même page du même document en même temps.
Cette approche nécessite une fusion des corrections pour valider les
corrections similaires et lancer un processus de levée de doute pour les
corrections en conflit.
Ce projet de recherche a deux enjeux techniques
principaux :
- mettre à la disposition des outils intuitifs pour corriger facilement les
documents
- déployer des outils automatiques pour
superviser la fusion des corrections, l’analyse de la cohérence et le contrôle
de la qualité de ces corrections.
Aujourd’hui, la BnF réalise une étude d’usage
de Correct notamment par une enquête
en ligne afin
d’évaluer la plateforme expérimentale, d’explorer les attentes des utilisateurs
et de mesurer comment les pratiques communautaires et collaboratives peuvent
s’intégrer dans l’écosystème de Gallica.
Si vous n’avez pas encore testé Correct, rendez-vous sur la plateforme, vous
pourrez ensuite nous donner votre avis.
|