jeudi 14 février 2013

La lecture par synthèse vocale

Le retour des conteurs ?

La “synthèse vocale” consiste à transformer le texte écrit en une version phonétique qu’un appareil numérique peut transformer en son audible. Cette technique est disponible depuis le début des années 90. La “transcription phonétique” est propre à chaque langue. Ainsi un logiciel de synthèse vocale anglais fera une lecture abominable d’un texte français.
Les serveurs vocaux intelligents sont un usage courant de la synthèse vocale : ils nous permettent de commander par téléphone des taxis, billets d’avion, etc.

Les dispositifs de lecture actuels, liseuses et tablettes, permettent une lecture par synthèse vocale grâce à leurs hauts parleurs intégrés. Les ouvrages doivent pour cela être disponibles sous forme de texte (HTML, ePub, ou autre) et non sous forme d’image, comme c’est parfois le cas avec les manuscrits.

Le premier usage historique de la synthèse vocale est la lecture pour les aveugles et mal voyants.
Il est ainsi aussi de créer un “conteur numérique”, selon la métaphore des conteurs qui racontaient des épopées à une audience toutes ouïe dans le passé.
Le conteur numérique intéressera tout particulièrement les enfants. Il est aussi pertinent dans diverses situations où l’on ne peut garder les yeux sur un livre : au volant, pendant un travail manuel (cuisine, menuiserie, etc.)

Les outils de synthèse vocale 

La synthèse vocale est proposée par certaines liseuses, mais pas par la majorité d’entre elles.
Il semble que les concepteurs de liseuses les destinent plutôt à des lecteurs qui ont un usage normal de la lecture.
Par contre, la synthèse vocale est une fonction native dans les tablettes, smartphones et ordinateurs. Elle est proposée avant tout dans le cadre de l’accessibilité. Et elle peut être utilisée pour la lecture de livres.

Il existe aussi des appareils exotiques capables de faire de la synthèse vocale : le lapin Wifi Nabaztag est capable de lire le “Petit Chaperon Rouge” ou le “Chat Botté” grâce à des livres équipées de marqueurs RFID.

La question de la qualité de la synthèse vocale

la question de la qualité est au coeur de la synthèse vocale. Vous pouvez faire un test en ligne sur ce site, par exemple en collant la “Chanson d'automne” de Verlaine. Vous verrez que l’émotion ne passe pas.
En effet les outils disponibles ont souvent le syndrome de la voix monocorde et froide.
La voix numérique manque d’accentuation, d’expressivité, d’émotion. On peut la comparer à celle d’une personne stressée qui fait sa première conférence devant un parterre nombreux.

Néanmoins les outils les plus avancés proposent des options :

  • changement de ton
  • rapidité du débit de la voix
  • voix masculine ou féminine


Malgré tout , la synthèse vocale est encore peu utilisé pour la lecture. Et les applications pour les enfants reposent plutôt sur des enregistrement de voix de comédiens.