(Courriels de diversion: <degrisaient@epanouissiez-vilipenderont.com> <releguerent@parades-efforciez.com> <deflation@banniraient-agressais.com> <tricoterai@lenifiantes-frigidite.com> <immortel@marmonneront-radiographiee.com> <reflechissiez@annoterons-cumuliez.com> <flux@mejuges-ronflantes.com> <zebres@deliees-percevrai.com> <recycles@encres-paniquer.com> <apprehenda@desserviriez-analysiez.com> )


Jean-Michel (123) demande :

> Concernant lliaphon, j'ai les questions/remarques suivantes:
> 1/ Lors de la lecture d'un fichier, la voix est de plus en plus grave. Au bout
> de deux paragraphes, la voix est inaudible. Ce problème est-il connu?
> 2/ Pourquoi ne pas dire dans les premières lignes du fichier INSTALL de lire 
> le fichier README.dev (vu qu'il faut avoir lu le fichier README.dev, pour
> compiler)?
> 3/ lliaphon est-il concu pour ne lire que des caractères ASCII/latin1, ou bien
> est-il prévu de le rendre compatible unicode?
> 4/ lliaphon est-il conçu exclusivement pour la langue française? ou bien 
> peut-il fonctionner pourra-t-il être étendu vers d'autres langues?

Je m'occupe du code Lliaphon mais pas de sa mise à disposition sur le Net (sous 
forme CVS ou autre) donc je ne peux pas répondre aux questions concernant 
l'installation.

1/ Le problème est effectivement connu mais je pensais qu'il avait disparu des 
versions mises à disposition sur le net. Je vais vérifier ça.

4/ Oui - en gros - lliaphon n'est conçu que pour le français. 

Au départ, au sein du projet Biglux, le projet de synthèse vocale libre s'est 
orienté vers Festival (si tu as trouvé Lliaphon, tu dois connaître Festival) 
mais n'a pu aboutir à une première ébauche de synthèse en français - appelée 
FranFest - qu'après avoir découvert l'existence du site www.lexique.org qui 
fournit un lexique de 120000 entrées avec leur transcriptions phonétiques. C'est 
essentiel, mais c'est lourd et ça ne suffit pas. Il faut ajouter des règles 
spécifiques au français (traitement des nombres, les liaisons, la prosodie ...) 
et disposer de données complémentaires propres au français (statistiques sur les 
codes grammaticaux, règles de prononciation des sigles et des mots étrangers, 
...)

Les créateurs de Festival (et de FestVox, ensemble d'outils associés à Festival 
pour créer de nouvelles voies et de nouveaux langages) ont essayé d'être le plus
général possible et de ne pas être complétement liés à la langue anglaise mais 
dégager, dans le domaine de la synthèse de parole, ce qui est général et ce qui 
est spécifique est encore un problème largement ouvert. Qui plus est, ils ont 
réorienté leur effort de développement vers Flite une version écrite entiérement 
en C (Festival, c'est C++ et Scheme), susceptible d'être embarquée (PAD, ...) et 
donc plutôt spécialisée anglais (voire même la version états-unienne de 
l'anglais).

De notre côté, après lexique.org, nous avons découvert Lia_Phon de Frédéric 
Béchet qui fournissait toutes les données qui nous manquaient (statistiques et 
règles citées plus haut), D'où la deuxième synthèse appelée Lliaphon.

Tout ça pour dire que l'essentiel d'une synthèse vocale, ce sont les données et 
que celles-ci sont spécifiques à la langue. Garder les mêmes outils de 
traitement "embarqués" des données quand toutes les données - qui occupent 
beaucoup plus de place que le code - changent n'est pas un problème essentiel : 
autant commuter complétement de synthèse quand on commute de langue. Ce n'est 
évidemment plus le cas en ce qui concerne les outils de construction des données 
"embarquées" et c'est pourquoi FestVox reste un outil essentiel.

Dernier point sur ta question 4/ Le problème essentiel de la commutation de 
langue n'est pas tellement de disposer d'outils multilingues généraux mais de 
reconnaître et traiter correctement les mots étrangers. Une synthèse française 
n'a pas besoin de pouvoir traiter complétement l'anglais, l'espagnol, l'allemand 
et l'italien mais le français a importé des mots venant de ces langues et il ne 
faut généralement pas les prononcer "à la française". Lia_Phon apporte un début 
de réponse à ce problème mais il reste largement ouvert.

3/ lliaphon va être complétement refondu après fusion avec FranFest. En fait, il 
y aura vraisemblablement 2 versions liées d'une même synthèse - qui n'a pas 
encore de nom. L'une, écrite en C avec la même motivation et la même vocation 
que Flite. L'autre, compatible avec Festival et Festvox de façon à disposer des 
outils existants de construction des données "embarquées" et pouvoir suivre les 
évolutions inévitables des données linguistiques sources des données embarquées.

Dans ce cadre là, il est clair que la synthèse vocale acceptera Unicode, au 
moins l'UTF8.

	Roger