(Courriels de diversion: <allient@recrimine-cachetteriez.com> <blagueuse@decollement-exceptant.com> <frileux@etheres-suppliciee.com> <tenables@coïncidents-ombragee.com> <pardonnons@malthusiennes-arche.com> <designeriez@cabale-sifflerais.com> <decotes@precede-heteroclites.com> <selliers@decervelage-decapotable.com> <fructifiaient@compatissions-deminerait.com> <prejugez@valoriserions-hypothecaires.com> )
Bonsoir, Dans un premier temps, je vous adresse : - tout d'abord, mes remerciements à l'assistance nombreuse qui a manifesté de l'intérêt envers ce projet à l'occasion de notre réunion de LUG de cet après-midi - mes amicales pensées à ceux qui n'ont pas pu être présents en raison de leur éloignement géographique mais ont déjà apporté leur soutien à notre démarche - à Pierre Brua qui avait superbement juste avant moi attiré et capté l'attention d'un public nombreux pour sa superbe conférence sur les clusters et qui a fini la réunion des (9) plus intéressés présents et disponibles (jusqu'à 29 heures) en nous promettant outre ses investigations sur GnuSpeech un site d'hébergement de nos développements présents et futurs (avec serveur CVS) - à Patrick Labatut et Jean-Marc Harang qui avait eu la bonne idée d'organiser une bonne bouffe ce soir et ainsi rameuter encore plus les foules - à Nath qui a vaincu sa modestie pour rappeler brièvement les motivations de BigLux ... et qui est notre constant aiguillon sans lequel on se bougerait sûrement moins ;-) - à Roger dont le superbe travail sur Festival n'a pas été assez justement et longuement démontré (matériel sous-dimensionné pour la salle + inévitable effet démo) Bref, pour ce soir et pour conclure cet après-midi très encourageant, je vous joins ci-dessous la partie textuelle des points essentiels que j'ai pu vous exposer ce samedi après-midi ... en attendant quelques pages web dans les jours qui viennent. Pour faire lire un texte par un ordinateur, il faut 3 éléments principaux : - un transformateur de symboles - un phonétiseur - une synthèse vocale 1- transformateur de symboles (tokenizer) : Traite les nombres, les chiffres romains, les numéros de téléphone, les sigles, les abréviations, ... 2- un phonétiseur : En français, environ quarante phonèmes sont utilisés. FranParler est ma tentative de création d'un ensemble de règles de phonétisation automatique. A ce jour, c'est un script Perl qui contient un peu plus de quatre-cents règles de substitutions et moins de six-cents exceptions (et leurs dérivés). Son taux de fiabilité est de l'ordre de 95% (d'après un lexique de plus de 100 000 mots). Côté Festival, Roger a introduit un lexique de plus de cent-vingt-mille mots (formes fléchies). Ce lexique contient pour chaque mot sa phonétisation et également une identification grammaticale. Cette dernière peut être utilisée dans des règles de liaison ou d'intonation (prosodie). 3- synthèse vocale : Pour chaque phonème, il faut déclarer une durée et une hauteur (modulation). De telles informations sont nécessaires à exploiter une base de diphones : enregistrements de l'articulation de 2 phonèmes. FranParler est très simpliste sur cet aspect et ne gère pas du tout l'intonation. Il se contente de fournir une durée fixe moyenne à chaque phonème. Roger a commencé à mettre en oeuvre ces aspects prosodiques du français dans Festival. Rappel : Festival développé à l'origine par l'Université d'Edimbourg est à ce jour la chaine de traitement de parole (TTS) la plus aboutie et en GPL. Festival peut utiliser la plus célèbre des bases de diphones téléchargeable gratuitement pour usage personnel (mais n'est pas libre) qui s'appelle MBrola. Développée par l'Université de Mons, soutenu par l'union européenne, MBrola a le mérite de fournir de nombreuses voix dans plusieurs dizaines de langues alors que les synthèses (bases de diphones ou autres) libres utilisables par Festival sont à ce jour anglophones, castillane ou galloise. Restrictions de FranParler et de Festival en français : - une entrée en français correct (éviter les fôtes d'ortograf, les abréviations, ne pas omettre les accents, ...) Atouts de FranParler et de Festival en français : - liberté (sauf Mbrola) - extensibilité A faire : - peaufiner la phonétisation automatique de FranParler et la rendre plus portable - intégrer ces règles de phonétisation automatique dans Festival - développer et intégrer des règles de tokénisation - maîtriser la parallélisation et le tamponnage (bufferisation) de la synthèse vocale - améliorer les règles de prosodie - maîtriser les commandes et le flux Emacspeak - créer des procédures d'installation - publier : site web à mettre à jour - étudier Flite (prononcer Flight) - rejoindre le Gnome Accessibility Project - internationaliser Emacs (messages) - faire des propositions d'extensions du Speech Synthesis Markup Language (SSML du W3C) - étudier des alternatives libres à Mbrola - résister aux sirènes propriétaires et à l'éparpillement A+ -- Phil --------------------------------------------------------------------- To unsubscribe, e-mail: biglux-unsubscribe@savage.iut-blagnac.frFor additional commands, e-mail: biglux-help@savage.iut-blagnac.fr