vendredi 16 janvier 2015

La BnF expérimente le crowdsourcing

0 commentaires



Depuis le 24 novembre 2014, la BnF a lancé une expérimentation de production participative (crowdsourcing) suite à mise en ligne de la plateforme Correct.

Cette plateforme expérimentale est le fruit d’un projet de recherche réunissant 9 partenaires : Orange (pilote du projet), BnF, Jamespot, Urbilog, I2S, ISEP, INSA de Lyon, Université Lyon 1, Université Paris 8. Elle vise à améliorer la qualité du mode texte issu de l’OCR des documents numérisés provenant de Gallica, en proposant à ses usagers de corriger les textes de manière collaborative.
En effet, lors de la numérisation de documents, les systèmes de reconnaissance optique de caractères (OCR) laissent trop d’imperfections pour obtenir un document conforme à l’original. Le seul moyen d’y parvenir est de passer par une phase de correction manuelle. Correct est une plateforme où peuvent collaborer différents utilisateurs pour détecter, analyser et corriger les erreurs restantes et ainsi participer à l’amélioration des documents.
 

Mode ligne à ligne de l’éditeur de correction de Correct 



D’autres bibliothèques ont déjà fait l’expérience de projet de crowdsourcing pour la correction de l’OCR. Le plus fameux est celui de la Bibliothèque nationale d’Australie mis en place depuis 2008 au sein de son site Trove. Mais l’originalité de Correct d’avoir adossé à l’éditeur de correction un réseau social dédié afin de créer du lien entre les contributeurs, de favoriser l’entraide et de faciliter l’organisation de la correction collaborative. Une autre innovation est de permettre un travail collaboratif en temps réel car plusieurs utilisateurs peuvent corriger la même page du même document en même temps. Cette approche nécessite une fusion des corrections pour valider les corrections similaires et lancer un processus de levée de doute pour les corrections en conflit.

Ce projet de recherche a deux enjeux techniques principaux :
-       mettre à la disposition des outils intuitifs pour corriger facilement les documents
-      déployer des outils automatiques pour superviser la fusion des corrections, l’analyse de la cohérence et le contrôle de la qualité de ces corrections.

Aujourd’hui, la BnF réalise une étude d’usage de Correct notamment par une enquête en ligne afin d’évaluer la plateforme expérimentale, d’explorer les attentes des utilisateurs et de mesurer comment les pratiques communautaires et collaboratives peuvent s’intégrer dans l’écosystème de Gallica.

Si vous n’avez pas encore testé Correct, rendez-vous sur la plateforme, vous pourrez ensuite nous donner votre avis.

vendredi 12 décembre 2014

Mais comment faire pour repérer l’offre légale ?

0 commentaires

Il faut savoir qu’aujourd’hui en France la majorité des nouveautés publiées sont disponibles en numérique. Bien souvent, ces livres sont moins chers que la version papier, environ 30% en moyenne, ce qui commence à devenir intéressant pour le lecteur. 



La Haute Autorité pour la diffusion des œuvres et la protection des droits sur internet (Hadopi) a mis en ligne un site dédié aux offres légales des produits culturels (ebooks, jeux, films, musique). Ce site permet de repérer facilement les plateformes proposant des livres numériques à lire gratuitement ou à acheter en toute légalité. 186 offres concernant le livre sont disponibles actuellement.


Sur ce site il est possible de faire des choix :  par type de lecture (téléchargement ou lecture en streaming), avec ou sans DRM (verrous numériques), par type d’oeuvres (format court, BD, autoédition, par type d’accès (gratuit, payant, abonnement etc.)


Parmi ces plateformes proposant de la lecture numérique légale, on trouve divers acteurs : Igomatik pour lire de la BD en dehors des sentiers battus, StoryPlayr qui est dédié aux enfants ou encore ABU la bibliothèque universelle.
Bien entendu, bons nombres de librairies indépendantes proposent également des livres numériques à télécharger en toute légalité comme Decitre, Le Divan, le Furet ou leslibraires.fr

Autre point intéressant, si vous êtes à la recherche d’un livre numérique à télécharger légalement et que vous ne le trouvez pas, il existe un service (à contacter ici) qui vous aidera à le repérer parmi l'offre légale disponible.

Dès que vous soumettez votre demande, vous êtes informés au fur et à mesure de l’investigation : statut gris = Enquête en cours, statut orange = l’œuvre est effectivement introuvable et les raisons sont indiquées, statut vert = l’œuvre a été trouvée  Si le livre n’est pas disponible, l’organisme peut contacter l’éditeur afin de l’informer de la demande.