(Courriels de diversion: <aspergera@etaleras-rime.com> <contractualiserais@desorganisa-pratiquantes.com> <budgetaire@inconstitutionnalite-mordillees.com> <enseveliraient@assagie-dispersait.com> <aimants@soldee-necrologiques.com> <belligerante@emulee-montgolfieres.com> <deliberant@aviserai-emergeriez.com> <impartiaux@inacceptation-collera.com> <guerissable@recipiendaires-coopteras.com> <renouvellerai@sacraliser-denoncerez.com> )
bonsoir, j'ai un peu les pieds emmellés dans les fils de discussions, j'espère que ce message arrivera au bon endroit... je ne connais pas trop le projet et certains termes m'échappent : (je vais essayer de plus me documenter sur lexique.org et essayer liaphone) > En partant de l'une des différentes base (Surface) on devrait > pouvoir élaborer un corpus. Le seul bémol c'est que le codage phonétique est > du VoCodex et non du SAMPA, mais ce n'est pas vraiment ni important ni > bloquant > ... > - il faut élaborer un système de base vocale (sous forme séquenciel indexé des > sons segmentés indexés par les diphones), création et lecture Cependant, > On a fait tout ça aujourd'hui à la main, y'a pu qu'à... comme dit l'autre. Allons-y ! > - on a praat comme outil d'enregistrement et de segmentation D'accord, c'est une partie longue et fastidieuse, mais faite une fois pour toute, encore faut-il définir une "rêgle" de segmentation. Y en a-t-il une ? Laquelle (lesquelles) sont appliquées dans les logiciels existants et dans les recherches linguistiques ? -> doc... > - il faut élaborer le moteur de concaténation des diphones pour créer le wav > de sortie C'est à dire ? Praat peut être appelé à partir du shell pour lire des sons : j'ai enregistré les sons suivants : sy_tu.wav, sy_as.wav, sy_vu.wav, sy_le.wav et sy_chat.wav. j'ai créé 5 "scripts" praat identiques, sauf le nom du fichier wav à jouer. Ces 5 scripts sont enregistrés sous : a_tu.pra, a_as.pra, a_vu.pra, a_le.pra et a_chat.pra. voici le script "a_chat.pra" : Read from file... /home/blaise/log/datas_praat/sy_chat.wav Play Remove maintenant, sans ouvrir le logiciel praat, je tape dans une console : ./praat datas_praat/a_tu.pra (je suis dans le répertoire où se trouve l'exe de praat et mes scripts praat et les sons sont dans un sous répertoire /datas_praat . et j'entend le son "tu". Donc, je fais le petit fichier texte suivant : ./praat datas_praat/a_tu.pra ./praat datas_praat/a_as.pra ./praat datas_praat/a_vu.pra ./praat datas_praat/a_le.pra ./praat datas_praat/a_chat.pra j'enregistre ce fichier, le rend exécutable et l'exécute et j'entend : "tu as vu le chat" . . . Ma question à : > - il faut élaborer le moteur de concaténation des diphones pour créer le wav > de sortie praat ne peut-il pas le faire ? Ou plutôt un script shell appelant praat, ou mieux, un logiciel appelant praat en temps réel ? Ayant du m'absenter l'année dernière, je n'ai pas pu suivre jusqu'au bout les excelents cours de shell d'Alain. Mais je vais m'y remettre pour écrire un script faisant ceci (ou faisons le puisque vous devez bien mieux maitriser le shell que moi) : - lire un fichier (syllabes prémachées) - pour chaque syllabe, appeler praat avec la syllabe comme paramètre de nom de fichier. Si ce script fonctionne, on pourra essayer de l'interfacer avec un programme, (script ?) pour obtenir du temps réel (avec les stdin, stdout et les pipes ? ? ?) Je pense, (à discuter ensemble), que pour réaliser rapidement une démo, il vaudrait mieux s'orienter vers une "règle" de découpage des sons assez "large", c'est à dire couvrant une syllabe entière, plutôt q'une règle plus "étroite" qui décompose le son "chat" en deux ou trois échantillons. Cette méthode est sans doute, ?, de moins bonne qualité, mais je pense qu'elle est plus rapide à mettre en oeuvre. Dans ce cas là (découpage par syllabe entière), combien et quelles syllabes faut-il ? (je vais aller chercher mon dictionnaire pour commencer...) J'attends vos remarques et suggestions. Je pense qu'une telle démo peut marcher d'ici 15 jours, il faut : - enregistrer toutes (...) les syllabes possibles (combien, lesquelles ?) - faire un script shell qui lit un fichier (de syllabes) et lance praat avec la syllabe comme paramètre de fichier wav à jouer. N'hésitez pas à m'envoyer le script shell, sinon, je vais le trouver. Si vous avez une liste de syllabe "officielle", je suis également preneur, mais sinon, je vais chercher. Si vous faites la même démo, entendons nous sur les syllabes et les noms de fichier pour que nous puissions échanger nos voix ! un éventuel bémol à vérifer, dans l'option "règle de découpage étroite : ma séquence "tu as vu le chat" n'est pas trop "hachée" ou alors ce sont mes échantillonages qui contiennent des blancs, mais surtout j'ai échantilloner des syllabes. Il faudrait tester si la séquence "challe" décomposée en 2 ou 3 sons n'est pas hachées par des "chtic-pop" entre chaque appel de traap (à partir du shell). Blaise