(Courriels de diversion: <etudie@disqualifierai-dissuade.com> <bousculerez@nourrices-mesestimant.com> <creees@resineuse-contesterai.com> <galvaudait@achalande-impassibilite.com> <ravitaillais@deprime-porte-bagages.com> <consolable@lancerez-indecise.com> <obtuses@impayable-deteriorez.com> <approximativement@postera-reformes.com> <commemore@defroncer-verite.com> <interêts@cacheraient-sous-evaluerons.com> )


Salut tout le monde,

Première fois que j'interviens sur la liste après avoir contacté
Nathalie, Phil et Patrick au Sintep et autres lieux.

J'avais proposé d'installer Festival et de voir ce que ça pouvait coûter
d'y adjoindre le français. Premier bilan rapide

1/ Installation.
   ------------

a/ Il vaut mieux avoir mbrola installé. Et il vaut mieux avoir la voix
en1 installée. 

b/ Sur le site http://www.cstr.ed.ac.uk/projects/festival, récupérer :

	festival-1.4.1.tar.gz
	speech_tools-1.2.1.tar.gz
	festdoc-1.4.0.tar.gz               très conseillé
	festlex_POSLEX.tar.gz
	festlex_OALD.tar.gz                pour avoir la voix anglaise
	festvox_en1.tar.gz                 pour utiliser mbrola.

D'autres choix (hors les 2 premiers et le lexique POSLEX) sont
évidemment possibles.

c/ Pour installer speech_tools - préalable indispensable - j'ai été
obligé de modifier 2 fichiers sources. Ce n'est donc pas tout à fait
immédiat.

La procédure d'install (que je ne détaille pas là) date de la Redhat
6.2. Aussi, il faut aménager leur répertoire $ST/config - par exemple
j'ai du créer un fichier $ST/config/systems/ix86_RedHatLinux7.0.mak pour
ma machine - et tripoter leur fichier $ST/config/config [$ST, c'est pour
le répertoire d'install des speech_tools]

Si qq'un (Phil ?) installe, il aura certainement des ennuis lors du
make, mais pas forcément les mêmes que moi (pb avec une variable appelée
'not' dans $ST/include/rxp/dtd.h et utilisation de memcpy sans
déclaration préalable dans $ST/base_class/EST_buffer.cc). Je suis près à
donner tous les détails sordides en direct si on insiste.

Ca prend du temps, déballe un nombre consternant de warnings et
construit tout un tas d'exécutables dont on n'a pas un besoin pressant
mais certains indispensables.

d/ Pour installer festival, toujours autant de warnings mais beaucoup
moins de problèmes.

Pour avoir une version qui fonctionne, il faut avoir accès à mbrola
quand on est dans $F/bin [$F, c'est le répertoire d'install de festival]
(ajout dans le PATH ou lien) et un accès au répertoire $M/en1 [$M, c'est
le répertoire où est installé mbrola] depuis
$F/lib/voices/english/en1_mbrola (recopie ou lien).

e/ Il y a un manuel assez considérable (200 pages) dans la doc rapatriée
avec festdoc-1.4.0 et sur le site. Conseillé pour faire fonctionner
festival (dont le langage de commande est siod, une version de Lisp), au
moins les 30 premières pages. Le reste, c'est pour comprendre en détail
comment ça marche.

Festival est nettement plus convivial (quoiqu'en mode texte lui aussi)
que Euler; mais faut apprécier Lisp sans doute.

2/ Passage au français
   -------------------

a/ Festival cause très bien anglais, gallois même, voire texan si on
insiste, espagnol selon les légendes locales; mais pas français.

b/ Il y a un site www.festvox.org uniquement consacré aux problèmes de
construction de nouvelles voix pour des langages déjà traités OU NON. On
y trouve de la doc et une archive festvox***.tar.gz qui contient des
utilitaires pour faire ce type de boulot. 

Archive installée, mais pas testée en détail. Déjà, pour comprendre la
doc, il faut avoir sérieusement investi le manuel de festival.

c/ Le plus gros pb pour passer au français, c'est la construction d'un
lexique qui fournit la prononciation (liste de phonèmes ET intonation)
de tous les mots couramment utilisés en français. Ce lexique peut être
fortement réduit si le langage admet des règles précises de passage des
lettres aux phonèmes (c'est le cas de l'espagnol, mais pas celui du
français me semble-t-il) et quand ce n'est pas le cas, c'est un sérieux
boulot de le construire. Pour en avoir une idée, voir $F/lib/dicts/oald
où est le lexique de l'anglais (sous 2 formes) qui occupe entre 4.2 et
4.9 Mo.

d/ Et il y a d'autres pbs (règles de transformations des chiffres -
dates, numéros de téléphone - en mots, abrev, etc)

e/ Ces problèmes ont été traités sous Euler qui accepte - théoriquement
et chez Phil, mais pas chez moi - le français. Je ne sais pas encore
exactement ce qui fait office de lexique pour euler, mais c'est dans le
répertoire $E/databases/french et je soupçonne le fichier lemme.dba (qui
n'est pas de l'ascii), mais il est possible aussi qu'il soit "éparpillé"
en un lexique, des règles de conjugaison et des règles "LTS" comme pour
l'espagnol (Letter to Sound comme disent même les belges). Faut voir les
sources en détail.

f/ La philosophie euler m'échappe un peu. Outre qu'ils sont
windows_addicted et gnu_addicted en même temps, ce qui suffit à donner
le tournis à une ame simple, je ne saisis pas la logique de l'accès aux
bases de données (elles sont libres ou pas ces bases, non seulement
elles sont "codées", en tout cas binaires, mais il manque 5 modules dans
la distribution des sources). Et quels sont les rapports avec Festival,
ils se lancent des fleurs mais c'est emacs contre xemacs ou quoi ?

g/ A partir d'un lexique du français LISIBLE même si pas complet, il
doit être relativement facile d'ajouter le français à festival. Je suis
sûr que ça existe, mais j'ai des doutes sur le libre accés et je ne
comprends pas pourquoi l'équipe de festival ne le fait pas (pas l'ombre
d'un français ne passe à Edinburg ?) ni pourquoi celle d'euler ne le
fait pas (les belges n'aiment pas les logiciels anglais). Il faudrait
demander des éclaircissements mais les 2 listes de discussion
euler-interest@tcts.fpms.ac.be et festvox-talk@metronomicon.com ontl'air peu vivaces.

	Roger (qui n'appartient pas au culte, ne cherchez pas)

---------------------------------------------------------------------
To unsubscribe, e-mail: biglux-unsubscribe@savage.iut-blagnac.frFor additional commands, e-mail: biglux-help@savage.iut-blagnac.fr