Compte-rendu reunion BigLux du 15/1/2005

(Courriels de diversion: <caries@kidnappa-enumere.com> <degelerais@depouilla-restitues.com> <teintees@peristyles-faitout.com> <garde-cotes@crochetent-disputeront.com> <blasonner@hissais-obstines.com> <commemorerez@abrutissions-discuterent.com> <tantieme@remilitariser-decapitez.com> <abat@degrisaient-epanouissiez.com> <vilipenderont@releguerent-parades.com> <efforciez@deflation-banniraient.com> )
To: ML biglux <biglux@culte.org>
Subject: Compte-rendu reunion BigLux du 15/1/2005
From: philsfree <philsfree@free.fr>
Date: Tue, 18 Jan 2005 00:22:28 +0100

Phil's Free a écrit :
> 
> Si vous pensez que le projet BigLux lancé il y a 4 ans par le CULTe pour 
> la promotion des logiciels libres pour les malvoyants peut être utile et 
> vous offrir l'opportunité de vous épanouir en y participant
> (ne serait-ce qu'en l'aidant à se ressourcer),
> vous êtes cordialement invités à nous rejoindre
>       samedi 15/1/2005 à 15 heures
> à la Maison des Associations de Ramonville
> pour une réunion exceptionnelle de bilan et orientation.


AUDIENCE, MOTIVATIONS
:::::::::::::::::::::

Le moins que l'on puisse dire, c'est que la mobilisation n'a pas été
très forte.

On peut toutefois se féliciter de la motivation des 5 présents :
FAVDB (initiateur du projet BigLux avec Nath),
Guilhem (administrateur du serveur CVS de LLiaPhon chez Gna!),
Jean-Michel (le petit nouveau qui fonce),
Phil (aiguillon du projet pour la synthèse vocale),
Roger (unique développeur de FranFest).

Vu l'audience, il est apparu clairement que certains objectifs initiaux
de BigLux devaient passer en sommeil faute de ressources et de demande
locale actuelle.
Il s'agit globalement de l'aide au passage sous Linux d'une personne ne
pouvant pas utiliser l'interface visuelle. Par exemple, nous n'avons
plus à Toulouse depuis le départ de Nath ni les compétences pratiques, 
ni le matériel pour démontrer l'utilisation d'une tablette Braille.

Nous nous retrouvons donc à ce jour entre développeurs qui ont envie de
mettre compétences en développement informatique et bonne volonté à 
contribution pour l'avènement d'une chaîne logicielle entièrement libre 
de transformation du texte (numérisé) français en signal audio.
Nous avons l'habitude de l'appeler LAO (Lecture Assistée par Ordinateur)
  ou TTS (Text-To-Speech).

Ceci nous apparaît constituer une partie de réponse importante à la
problématique posée par BigLux dès sa création : favoriser l'accès à 
l'outil de communication informatique par des personnes se heurtant à 
des difficultés d'appréhension visuelles.

> 
> Au programme :
> 
> - BigLux pour Qui ?
>   * aveugles ?
>   * mal-voyants ?
>   * utilisateurs de voix humaine synthétisée

ORIENTATION TECHNIQUE
:::::::::::::::::::::

Comme présenté ci-dessus, à ce jour, nous nous orientons selon nos plus
fortes motivations vers l'axe de la synthèse de la parole.
Cela concerne la chaîne complète de traitement entre le texte écrit
(inaccessible dans sa représentation visuelle pour certaines personnes
handicapées) vers un son intelligible auquel une telle personne peut
accéder.

2 grandes parties de cette chaîne se distinguent :
1- la lecture virtuelle du texte pour le décomposer dans la
représentation symbolique d'une suite des plus petits éléments sonores
imaginés pour une langue donnée : les phonèmes
2- la synthèse vocale, transformant la représentation symbolique des
phonèmes en un son intelligible.

Le maillon manquant le plus cruellement dans une version entièrement
libre de cet ensemble est le dernier. Nous souhaitons désormais au plus
tôt nous affranchir définitivement du dernier logiciel non libre fut-il
gratuit dont nous avons encore besoin pour compléter la chaîne de
lecture assistée par ordinateur en français.

Pour résoudre cette question, nous avons besoin d'approfondir nos
connaissances en traitement du signal sonore.
D'une part, nous avons besoin de savoir isoler un son élémentaire
(phonème, diphone, ...) à partir d'un enregistrement de qualité d'une
voix humaine.
D'autre part, nous devons savoir générer des déformations maîtrisées
d'un tel élément de base (voix plus ou moins aigue ou rapide).

Notre but final sur ce thème technique est de produire :
- au moins une base de données sonore de qualité contenant un nombre
suffisant d'éléments réutilisables ;
- un moteur de transformation et de concaténation de ces éléments pour
générer un son proche de celui d'une lecture humaine à partir
d'un texte français quelconque traduit en représentation phonétique.

Par les moyens que nous pensons utiliser, il nous semble que ce travail
peut intéresser (au-delà des handicapés visuels et de ceux qui veulent
les aider) des personnes qui ont envie de mieux comprendre ou expliquer
comment on traite numériquement le son et en particulier la voix humaine.
Il est aussi nécessaire dans ce but de reconnaître par des moyens qui
tendrons à s'automatiser une série de phonèmes parmi un enregistrement
de voix numérisée (avant de savoir en reproduire de voisins,
déformés/adaptés mathématiquement). Le lien est ainsi patent entre
synthèse et reconnaissance vocales. La dernière peut d'ailleurs
probablement susciter plus d'intérêt que la première et leur coopération
apparaît d'un grand intérêt.

> - BigLux avec Qui ?
>   * le CULTe (+ des individualités toulousaines) ?
>   * Oralux (et les parisiens Nath, Sylvie et Gilles notamment) ?
>   * FreeDesktop ?
>   * anarchiquement avec tout l'internet ? (la fin de BigLux ?)
>   * seul ? (en association indépendante ?)
> 
> - BigLux, on continue ?

ACTIONS
:::::::
Oui, nous continuons.
Dans l'immédiat, plus comme développeurs que comme support 
d'utilisateurs. Mais nous avons fortement envie de pousuivre,
avec plus de concentration sur un sujet principal, tout en conservant
les objectifs initiaux à plus long terme.

Finalement, Roger reste momentanément le seul à s'occuper de la partie
initiale (qu'on pourrait appeler linguistique) de la chaîne de LAO, en
travaillant sur un phonétiseur tel que LLiaPhon ou FranFest.
A ce propos, Roger nous a annoncé une prochaine version de FranFest
(pour le printemps) incluant des données élaborées en vue de la
convergence entre les 2 phonétiseurs ; FranFest, dérivé de Festival se
positionnerait plutôt comme outil de travail sur la LAO, profitant de
tous les développements de Festival réalisés dans cette optique;
LLiaPhon resterait la version plus légère du TTS en français.

FAVDB ayant déjà investi de son énergie sur l'outil RSynth qui assure la
fonction de synthèse vocale (à franciser) qui nous manque comme dernier
maillon de la chaîne TTS, il nous propose une présentation de ses
travaux le samedi 29/1/2005 au CULTe.
Au passage, FAVDB a rappelé que le nombre de diphones est de l'ordre de
20 fois supérieur à celui des phonèmes (quelques dizaines) en français ;
d'où l'intérêt selon lui de persévérer avec RSynth qui traite de TTS à
partir de phonèmes.

Roger se propose pour regarder d'ici le 29/1 comment Festival traite
cette question de bases de données vocales et de leur exploitation.

Phil se charge d'investiguer (de nouveau, plus en profondeur) du côté de
Praat.

Jean-Michel, également intéressé, a en outre accepté de rénover et
maintenir les pages du projet BigLux sur le site web du CULTe.
Nath, merci de lui faire passer les coordonnées nécessaires pour assurer
cette tâche.
Avec cette mise à jour, ce site web devrait présenter sensiblement :
     * grand public
       + pages d'historique
       + pages d'accueil pour (futur) utilisateur motivé
    * à destination des développeurs
       + pages de liens, notamment vers Gna!
       + pages d'informations techniques

Le moteur de synthèse vocale sera quant à lui spécifié puis développé
sur le serveur CVS Gna! sous le projet existant de LLiaPhon.
Guilhem continue d'administrer ce projet.

SUPPORT DU CULTE (autres)
:::::::::::::::::::::::::

Le CULTe apporte à BigLux un support logistique fondamental :
outre le site Web statique déjà évoqué ci-dessus, rappelons la
mailing-list (dont nous profitons ici).

Les nouvelles fonctionnalités (dynamiques ?) que proposera la nouvelle
version du site web du CULTe peuvent vivement nous intéresser, notamment
par rapport à la panne prolongée de network42.org qui hébergeait notre
espace Wiki.
Nous serions donc particulièrement sensibles à une offre en matière
d'hébergement Wiki, voire de Forum (genre PHPBB) ou encore par un
support SPIP.
Toutes ces hypothèses techniques ont pour but d'optimiser efficacité et 
ouverture de notre communication la moins formelle.

La machine Solaria fournie par le CULTe reste une machine de
démonstration à la disposition du groupe Biglux.
Vu la direction de développement qui a été choisie, cet objectif de
démonstration semble moins prioritaire pour le moment faute de ressource
humaine suffisante.

COLLABORATIONS EXTERNES
:::::::::::::::::::::::

La synthèse vocale est intéressante essentiellement si elle est intégrée 
dans des applicatifs, afin de permettre par exemple de lire de courriel 
ou de site en ligne.
Par ailleurs, BigLux a probablement un grand intérêt à collaborer avec
d'autres projets libres autour du thème qu'il a choisi.
Il est par conséquent souhaitable que les interfaces (API) que nous
utiliserons soient compatibles avec celles d'autres projets.

A ce titre l'utilisation d'utf-8 et de ssml est envisagée (cf. les
spécifications en cours d'élaboration par FreeDesktop).

Roger a aussi signalé l'intérêt de s'inscrire dans un mouvement de 
packaging (tel que Debian).


Fin du long résumé des débats d'environ 2 heures du 15/1/2005.
-- 
Phil avec le soutien de Jean-Michel
Follow-Ups:
- Re: Compte-rendu reunion BigLux du 15/1/2005
  - From: Nath <utilisateur-masqué@CULTe.org>
- Re: Compte-rendu reunion BigLux du 15/1/2005
  - From: patrick <letux@free.fr>