(Courriels de diversion: <caries@kidnappa-enumere.com> <degelerais@depouilla-restitues.com> <teintees@peristyles-faitout.com> <garde-cotes@crochetent-disputeront.com> <blasonner@hissais-obstines.com> <commemorerez@abrutissions-discuterent.com> <tantieme@remilitariser-decapitez.com> <abat@degrisaient-epanouissiez.com> <vilipenderont@releguerent-parades.com> <efforciez@deflation-banniraient.com> )
Phil's Free a écrit : > > Si vous pensez que le projet BigLux lancé il y a 4 ans par le CULTe pour > la promotion des logiciels libres pour les malvoyants peut être utile et > vous offrir l'opportunité de vous épanouir en y participant > (ne serait-ce qu'en l'aidant à se ressourcer), > vous êtes cordialement invités à nous rejoindre > samedi 15/1/2005 à 15 heures > à la Maison des Associations de Ramonville > pour une réunion exceptionnelle de bilan et orientation. AUDIENCE, MOTIVATIONS ::::::::::::::::::::: Le moins que l'on puisse dire, c'est que la mobilisation n'a pas été très forte. On peut toutefois se féliciter de la motivation des 5 présents : FAVDB (initiateur du projet BigLux avec Nath), Guilhem (administrateur du serveur CVS de LLiaPhon chez Gna!), Jean-Michel (le petit nouveau qui fonce), Phil (aiguillon du projet pour la synthèse vocale), Roger (unique développeur de FranFest). Vu l'audience, il est apparu clairement que certains objectifs initiaux de BigLux devaient passer en sommeil faute de ressources et de demande locale actuelle. Il s'agit globalement de l'aide au passage sous Linux d'une personne ne pouvant pas utiliser l'interface visuelle. Par exemple, nous n'avons plus à Toulouse depuis le départ de Nath ni les compétences pratiques, ni le matériel pour démontrer l'utilisation d'une tablette Braille. Nous nous retrouvons donc à ce jour entre développeurs qui ont envie de mettre compétences en développement informatique et bonne volonté à contribution pour l'avènement d'une chaîne logicielle entièrement libre de transformation du texte (numérisé) français en signal audio. Nous avons l'habitude de l'appeler LAO (Lecture Assistée par Ordinateur) ou TTS (Text-To-Speech). Ceci nous apparaît constituer une partie de réponse importante à la problématique posée par BigLux dès sa création : favoriser l'accès à l'outil de communication informatique par des personnes se heurtant à des difficultés d'appréhension visuelles. > > Au programme : > > - BigLux pour Qui ? > * aveugles ? > * mal-voyants ? > * utilisateurs de voix humaine synthétisée ORIENTATION TECHNIQUE ::::::::::::::::::::: Comme présenté ci-dessus, à ce jour, nous nous orientons selon nos plus fortes motivations vers l'axe de la synthèse de la parole. Cela concerne la chaîne complète de traitement entre le texte écrit (inaccessible dans sa représentation visuelle pour certaines personnes handicapées) vers un son intelligible auquel une telle personne peut accéder. 2 grandes parties de cette chaîne se distinguent : 1- la lecture virtuelle du texte pour le décomposer dans la représentation symbolique d'une suite des plus petits éléments sonores imaginés pour une langue donnée : les phonèmes 2- la synthèse vocale, transformant la représentation symbolique des phonèmes en un son intelligible. Le maillon manquant le plus cruellement dans une version entièrement libre de cet ensemble est le dernier. Nous souhaitons désormais au plus tôt nous affranchir définitivement du dernier logiciel non libre fut-il gratuit dont nous avons encore besoin pour compléter la chaîne de lecture assistée par ordinateur en français. Pour résoudre cette question, nous avons besoin d'approfondir nos connaissances en traitement du signal sonore. D'une part, nous avons besoin de savoir isoler un son élémentaire (phonème, diphone, ...) à partir d'un enregistrement de qualité d'une voix humaine. D'autre part, nous devons savoir générer des déformations maîtrisées d'un tel élément de base (voix plus ou moins aigue ou rapide). Notre but final sur ce thème technique est de produire : - au moins une base de données sonore de qualité contenant un nombre suffisant d'éléments réutilisables ; - un moteur de transformation et de concaténation de ces éléments pour générer un son proche de celui d'une lecture humaine à partir d'un texte français quelconque traduit en représentation phonétique. Par les moyens que nous pensons utiliser, il nous semble que ce travail peut intéresser (au-delà des handicapés visuels et de ceux qui veulent les aider) des personnes qui ont envie de mieux comprendre ou expliquer comment on traite numériquement le son et en particulier la voix humaine. Il est aussi nécessaire dans ce but de reconnaître par des moyens qui tendrons à s'automatiser une série de phonèmes parmi un enregistrement de voix numérisée (avant de savoir en reproduire de voisins, déformés/adaptés mathématiquement). Le lien est ainsi patent entre synthèse et reconnaissance vocales. La dernière peut d'ailleurs probablement susciter plus d'intérêt que la première et leur coopération apparaît d'un grand intérêt. > - BigLux avec Qui ? > * le CULTe (+ des individualités toulousaines) ? > * Oralux (et les parisiens Nath, Sylvie et Gilles notamment) ? > * FreeDesktop ? > * anarchiquement avec tout l'internet ? (la fin de BigLux ?) > * seul ? (en association indépendante ?) > > - BigLux, on continue ? ACTIONS ::::::: Oui, nous continuons. Dans l'immédiat, plus comme développeurs que comme support d'utilisateurs. Mais nous avons fortement envie de pousuivre, avec plus de concentration sur un sujet principal, tout en conservant les objectifs initiaux à plus long terme. Finalement, Roger reste momentanément le seul à s'occuper de la partie initiale (qu'on pourrait appeler linguistique) de la chaîne de LAO, en travaillant sur un phonétiseur tel que LLiaPhon ou FranFest. A ce propos, Roger nous a annoncé une prochaine version de FranFest (pour le printemps) incluant des données élaborées en vue de la convergence entre les 2 phonétiseurs ; FranFest, dérivé de Festival se positionnerait plutôt comme outil de travail sur la LAO, profitant de tous les développements de Festival réalisés dans cette optique; LLiaPhon resterait la version plus légère du TTS en français. FAVDB ayant déjà investi de son énergie sur l'outil RSynth qui assure la fonction de synthèse vocale (à franciser) qui nous manque comme dernier maillon de la chaîne TTS, il nous propose une présentation de ses travaux le samedi 29/1/2005 au CULTe. Au passage, FAVDB a rappelé que le nombre de diphones est de l'ordre de 20 fois supérieur à celui des phonèmes (quelques dizaines) en français ; d'où l'intérêt selon lui de persévérer avec RSynth qui traite de TTS à partir de phonèmes. Roger se propose pour regarder d'ici le 29/1 comment Festival traite cette question de bases de données vocales et de leur exploitation. Phil se charge d'investiguer (de nouveau, plus en profondeur) du côté de Praat. Jean-Michel, également intéressé, a en outre accepté de rénover et maintenir les pages du projet BigLux sur le site web du CULTe. Nath, merci de lui faire passer les coordonnées nécessaires pour assurer cette tâche. Avec cette mise à jour, ce site web devrait présenter sensiblement : * grand public + pages d'historique + pages d'accueil pour (futur) utilisateur motivé * à destination des développeurs + pages de liens, notamment vers Gna! + pages d'informations techniques Le moteur de synthèse vocale sera quant à lui spécifié puis développé sur le serveur CVS Gna! sous le projet existant de LLiaPhon. Guilhem continue d'administrer ce projet. SUPPORT DU CULTE (autres) ::::::::::::::::::::::::: Le CULTe apporte à BigLux un support logistique fondamental : outre le site Web statique déjà évoqué ci-dessus, rappelons la mailing-list (dont nous profitons ici). Les nouvelles fonctionnalités (dynamiques ?) que proposera la nouvelle version du site web du CULTe peuvent vivement nous intéresser, notamment par rapport à la panne prolongée de network42.org qui hébergeait notre espace Wiki. Nous serions donc particulièrement sensibles à une offre en matière d'hébergement Wiki, voire de Forum (genre PHPBB) ou encore par un support SPIP. Toutes ces hypothèses techniques ont pour but d'optimiser efficacité et ouverture de notre communication la moins formelle. La machine Solaria fournie par le CULTe reste une machine de démonstration à la disposition du groupe Biglux. Vu la direction de développement qui a été choisie, cet objectif de démonstration semble moins prioritaire pour le moment faute de ressource humaine suffisante. COLLABORATIONS EXTERNES ::::::::::::::::::::::: La synthèse vocale est intéressante essentiellement si elle est intégrée dans des applicatifs, afin de permettre par exemple de lire de courriel ou de site en ligne. Par ailleurs, BigLux a probablement un grand intérêt à collaborer avec d'autres projets libres autour du thème qu'il a choisi. Il est par conséquent souhaitable que les interfaces (API) que nous utiliserons soient compatibles avec celles d'autres projets. A ce titre l'utilisation d'utf-8 et de ssml est envisagée (cf. les spécifications en cours d'élaboration par FreeDesktop). Roger a aussi signalé l'intérêt de s'inscrire dans un mouvement de packaging (tel que Debian). Fin du long résumé des débats d'environ 2 heures du 15/1/2005. -- Phil avec le soutien de Jean-Michel