étude d'adaptation de festival au français

(Courriels de diversion: <renales@recomposera-apporterions.com> <ordonnancera@metros-difficiles.com> <desastreuse@liberaient-terniront.com> <accumulation@allient-recrimine.com> <cachetteriez@blagueuse-decollement.com> <exceptant@frileux-etheres.com> <suppliciee@tenables-coïncidents.com> <ombragee@pardonnons-malthusiennes.com> <arche@designeriez-cabale.com> <sifflerais@decotes-precede.com> )

To: biglux@CULTe.org
Subject: étude d'adaptation de festival au français
From: Pierre BRUA <ie@paralline.com>
Date: Thu, 05 Sep 2002 15:46:06 +0200

Bonjour,

j'ai jeté un coup d'oeil au fonctionnement interne de festival.

festival est conçu comme un outil "utilisateur final" et "de 
recherche/développement" à la fois, ce qui est très bien pour nous 
puisque cela aiderait à la mise au point d'une nouvelle langue.

Si nous voulons l'adapter au français, la première étape est de créer le
'diphone index' français, à partir d'une voix française et (entre 
autres) des codes phonétiques indiqués à 
http://www.lexique.org/main/pages.php?page=Codes_Phonetiques.

Cela signifie enregistrer les diphones avec un équipement audio de 
qualité, en essayant d'obtenir une intonation et une vitesse identique 
pour tous, et préciser les durées des phases d'attaque, de changement de 
lettre, et de chute dans le diphone.

Il faut ensuite créer le fichier dégroupé associé (et faire générer le 
fichier de groupe par festival pour optimiser après).

Une fois que tout cela sera fait, le reste sera plus progressif car il 
faudra intégrer à festival toutes les caractéristiques phonétiques 
(proxodie, ...) du français. Cela se fait par "programmation" en scheme, 
qui est un langage très simple d'utilisation genre lisp (si vous savez 
écrire une parenthèse vous savez faire du lisp).

Si quelqu'un a déjà commencé sur le sujet ou est intéressé à collaborer 
pour cette phase, qu'il me contacte à festival@paralline.com
La documentation est bien faite, mais le travail risque d'être long car 
habituellement cela est fait à partir de bases de données statistiques 
de locuteurs français dont nous ne disposons pas pour l'instant et qui 
ne sont probablement pas libres de droit ou de réutilisation.

Par ailleurs, le défaut de ce logiciel et sans doute de la plupart des 
logiciels de synthèse est qu'il nécessite le traitement complet de 
l'ensemble de la phrase avant l'émission du premier son. Cela signifie 
de longs délais de traitement (quelques secondes pour une longue phrase 
sur mon Athlon700) qui peuvent être rédhibitoires pour une utilisation 
soutenue surtout si le processeur de la machine est faible.

Une des amélioration "future" pour le rendre utilisable serait donc de 
faire générer le premier mot (ou des deux premiers mots) séparément 
pendant que le processeur travaille sur la génération du reste de la 
phrase. Mais pour ça on verra un peu plus tard...

Pierre
-- 
           PARALLINE          ///        Parallelism & GNU/Linux
                             ///
71,av des Vosges Phone:+33 388 141 740
F-67000 STRASBOURG Fax:+33 388 141 741 http://www.paralline.com


---------------------------------------------------------------------
To unsubscribe, e-mail: biglux-unsubscribe@savage.iut-blagnac.frFor additional commands, e-mail: biglux-help@savage.iut-blagnac.fr