(Courriels de diversion: <etudie@disqualifierai-dissuade.com> <bousculerez@nourrices-mesestimant.com> <creees@resineuse-contesterai.com> <galvaudait@achalande-impassibilite.com> <ravitaillais@deprime-porte-bagages.com> <consolable@lancerez-indecise.com> <obtuses@impayable-deteriorez.com> <approximativement@postera-reformes.com> <commemore@defroncer-verite.com> <interêts@cacheraient-sous-evaluerons.com> )
Salut tout le monde, Première fois que j'interviens sur la liste après avoir contacté Nathalie, Phil et Patrick au Sintep et autres lieux. J'avais proposé d'installer Festival et de voir ce que ça pouvait coûter d'y adjoindre le français. Premier bilan rapide 1/ Installation. ------------ a/ Il vaut mieux avoir mbrola installé. Et il vaut mieux avoir la voix en1 installée. b/ Sur le site http://www.cstr.ed.ac.uk/projects/festival, récupérer : festival-1.4.1.tar.gz speech_tools-1.2.1.tar.gz festdoc-1.4.0.tar.gz très conseillé festlex_POSLEX.tar.gz festlex_OALD.tar.gz pour avoir la voix anglaise festvox_en1.tar.gz pour utiliser mbrola. D'autres choix (hors les 2 premiers et le lexique POSLEX) sont évidemment possibles. c/ Pour installer speech_tools - préalable indispensable - j'ai été obligé de modifier 2 fichiers sources. Ce n'est donc pas tout à fait immédiat. La procédure d'install (que je ne détaille pas là) date de la Redhat 6.2. Aussi, il faut aménager leur répertoire $ST/config - par exemple j'ai du créer un fichier $ST/config/systems/ix86_RedHatLinux7.0.mak pour ma machine - et tripoter leur fichier $ST/config/config [$ST, c'est pour le répertoire d'install des speech_tools] Si qq'un (Phil ?) installe, il aura certainement des ennuis lors du make, mais pas forcément les mêmes que moi (pb avec une variable appelée 'not' dans $ST/include/rxp/dtd.h et utilisation de memcpy sans déclaration préalable dans $ST/base_class/EST_buffer.cc). Je suis près à donner tous les détails sordides en direct si on insiste. Ca prend du temps, déballe un nombre consternant de warnings et construit tout un tas d'exécutables dont on n'a pas un besoin pressant mais certains indispensables. d/ Pour installer festival, toujours autant de warnings mais beaucoup moins de problèmes. Pour avoir une version qui fonctionne, il faut avoir accès à mbrola quand on est dans $F/bin [$F, c'est le répertoire d'install de festival] (ajout dans le PATH ou lien) et un accès au répertoire $M/en1 [$M, c'est le répertoire où est installé mbrola] depuis $F/lib/voices/english/en1_mbrola (recopie ou lien). e/ Il y a un manuel assez considérable (200 pages) dans la doc rapatriée avec festdoc-1.4.0 et sur le site. Conseillé pour faire fonctionner festival (dont le langage de commande est siod, une version de Lisp), au moins les 30 premières pages. Le reste, c'est pour comprendre en détail comment ça marche. Festival est nettement plus convivial (quoiqu'en mode texte lui aussi) que Euler; mais faut apprécier Lisp sans doute. 2/ Passage au français ------------------- a/ Festival cause très bien anglais, gallois même, voire texan si on insiste, espagnol selon les légendes locales; mais pas français. b/ Il y a un site www.festvox.org uniquement consacré aux problèmes de construction de nouvelles voix pour des langages déjà traités OU NON. On y trouve de la doc et une archive festvox***.tar.gz qui contient des utilitaires pour faire ce type de boulot. Archive installée, mais pas testée en détail. Déjà, pour comprendre la doc, il faut avoir sérieusement investi le manuel de festival. c/ Le plus gros pb pour passer au français, c'est la construction d'un lexique qui fournit la prononciation (liste de phonèmes ET intonation) de tous les mots couramment utilisés en français. Ce lexique peut être fortement réduit si le langage admet des règles précises de passage des lettres aux phonèmes (c'est le cas de l'espagnol, mais pas celui du français me semble-t-il) et quand ce n'est pas le cas, c'est un sérieux boulot de le construire. Pour en avoir une idée, voir $F/lib/dicts/oald où est le lexique de l'anglais (sous 2 formes) qui occupe entre 4.2 et 4.9 Mo. d/ Et il y a d'autres pbs (règles de transformations des chiffres - dates, numéros de téléphone - en mots, abrev, etc) e/ Ces problèmes ont été traités sous Euler qui accepte - théoriquement et chez Phil, mais pas chez moi - le français. Je ne sais pas encore exactement ce qui fait office de lexique pour euler, mais c'est dans le répertoire $E/databases/french et je soupçonne le fichier lemme.dba (qui n'est pas de l'ascii), mais il est possible aussi qu'il soit "éparpillé" en un lexique, des règles de conjugaison et des règles "LTS" comme pour l'espagnol (Letter to Sound comme disent même les belges). Faut voir les sources en détail. f/ La philosophie euler m'échappe un peu. Outre qu'ils sont windows_addicted et gnu_addicted en même temps, ce qui suffit à donner le tournis à une ame simple, je ne saisis pas la logique de l'accès aux bases de données (elles sont libres ou pas ces bases, non seulement elles sont "codées", en tout cas binaires, mais il manque 5 modules dans la distribution des sources). Et quels sont les rapports avec Festival, ils se lancent des fleurs mais c'est emacs contre xemacs ou quoi ? g/ A partir d'un lexique du français LISIBLE même si pas complet, il doit être relativement facile d'ajouter le français à festival. Je suis sûr que ça existe, mais j'ai des doutes sur le libre accés et je ne comprends pas pourquoi l'équipe de festival ne le fait pas (pas l'ombre d'un français ne passe à Edinburg ?) ni pourquoi celle d'euler ne le fait pas (les belges n'aiment pas les logiciels anglais). Il faudrait demander des éclaircissements mais les 2 listes de discussion euler-interest@tcts.fpms.ac.be et festvox-talk@metronomicon.com ontl'air peu vivaces. Roger (qui n'appartient pas au culte, ne cherchez pas) --------------------------------------------------------------------- To unsubscribe, e-mail: biglux-unsubscribe@savage.iut-blagnac.frFor additional commands, e-mail: biglux-help@savage.iut-blagnac.fr