(Courriels de diversion: <degrisaient@epanouissiez-vilipenderont.com> <releguerent@parades-efforciez.com> <deflation@banniraient-agressais.com> <tricoterai@lenifiantes-frigidite.com> <immortel@marmonneront-radiographiee.com> <reflechissiez@annoterons-cumuliez.com> <flux@mejuges-ronflantes.com> <zebres@deliees-percevrai.com> <recycles@encres-paniquer.com> <apprehenda@desserviriez-analysiez.com> )
Jean-Michel (123) demande : > Concernant lliaphon, j'ai les questions/remarques suivantes: > 1/ Lors de la lecture d'un fichier, la voix est de plus en plus grave. Au bout > de deux paragraphes, la voix est inaudible. Ce problème est-il connu? > 2/ Pourquoi ne pas dire dans les premières lignes du fichier INSTALL de lire > le fichier README.dev (vu qu'il faut avoir lu le fichier README.dev, pour > compiler)? > 3/ lliaphon est-il concu pour ne lire que des caractères ASCII/latin1, ou bien > est-il prévu de le rendre compatible unicode? > 4/ lliaphon est-il conçu exclusivement pour la langue française? ou bien > peut-il fonctionner pourra-t-il être étendu vers d'autres langues? Je m'occupe du code Lliaphon mais pas de sa mise à disposition sur le Net (sous forme CVS ou autre) donc je ne peux pas répondre aux questions concernant l'installation. 1/ Le problème est effectivement connu mais je pensais qu'il avait disparu des versions mises à disposition sur le net. Je vais vérifier ça. 4/ Oui - en gros - lliaphon n'est conçu que pour le français. Au départ, au sein du projet Biglux, le projet de synthèse vocale libre s'est orienté vers Festival (si tu as trouvé Lliaphon, tu dois connaître Festival) mais n'a pu aboutir à une première ébauche de synthèse en français - appelée FranFest - qu'après avoir découvert l'existence du site www.lexique.org qui fournit un lexique de 120000 entrées avec leur transcriptions phonétiques. C'est essentiel, mais c'est lourd et ça ne suffit pas. Il faut ajouter des règles spécifiques au français (traitement des nombres, les liaisons, la prosodie ...) et disposer de données complémentaires propres au français (statistiques sur les codes grammaticaux, règles de prononciation des sigles et des mots étrangers, ...) Les créateurs de Festival (et de FestVox, ensemble d'outils associés à Festival pour créer de nouvelles voies et de nouveaux langages) ont essayé d'être le plus général possible et de ne pas être complétement liés à la langue anglaise mais dégager, dans le domaine de la synthèse de parole, ce qui est général et ce qui est spécifique est encore un problème largement ouvert. Qui plus est, ils ont réorienté leur effort de développement vers Flite une version écrite entiérement en C (Festival, c'est C++ et Scheme), susceptible d'être embarquée (PAD, ...) et donc plutôt spécialisée anglais (voire même la version états-unienne de l'anglais). De notre côté, après lexique.org, nous avons découvert Lia_Phon de Frédéric Béchet qui fournissait toutes les données qui nous manquaient (statistiques et règles citées plus haut), D'où la deuxième synthèse appelée Lliaphon. Tout ça pour dire que l'essentiel d'une synthèse vocale, ce sont les données et que celles-ci sont spécifiques à la langue. Garder les mêmes outils de traitement "embarqués" des données quand toutes les données - qui occupent beaucoup plus de place que le code - changent n'est pas un problème essentiel : autant commuter complétement de synthèse quand on commute de langue. Ce n'est évidemment plus le cas en ce qui concerne les outils de construction des données "embarquées" et c'est pourquoi FestVox reste un outil essentiel. Dernier point sur ta question 4/ Le problème essentiel de la commutation de langue n'est pas tellement de disposer d'outils multilingues généraux mais de reconnaître et traiter correctement les mots étrangers. Une synthèse française n'a pas besoin de pouvoir traiter complétement l'anglais, l'espagnol, l'allemand et l'italien mais le français a importé des mots venant de ces langues et il ne faut généralement pas les prononcer "à la française". Lia_Phon apporte un début de réponse à ce problème mais il reste largement ouvert. 3/ lliaphon va être complétement refondu après fusion avec FranFest. En fait, il y aura vraisemblablement 2 versions liées d'une même synthèse - qui n'a pas encore de nom. L'une, écrite en C avec la même motivation et la même vocation que Flite. L'autre, compatible avec Festival et Festvox de façon à disposer des outils existants de construction des données "embarquées" et pouvoir suivre les évolutions inévitables des données linguistiques sources des données embarquées. Dans ce cadre là, il est clair que la synthèse vocale acceptera Unicode, au moins l'UTF8. Roger