(Courriels de diversion: <enumere@degelerais-depouilla.com> <restitues@teintees-peristyles.com> <faitout@garde-cotes-crochetent.com> <disputeront@blasonner-hissais.com> <obstines@commemorerez-abrutissions.com> <discuterent@tantieme-remilitariser.com> <decapitez@abat-degrisaient.com> <epanouissiez@vilipenderont-releguerent.com> <parades@efforciez-deflation.com> <banniraient@agressais-tricoterai.com> )
FaVdB a écrit : > philsfree wrote: > > >>J'ai survolé index_mot.txt. >> >>Pourquoi prendre des mots discutables que les parisiens de Lexique.org >>ne prononcent pas comme notre Nathalie ... si elle n'a pas encore perdu >>l'accent de notre midi ? >>etc... > > > Bien je vais donc explicité ce qui m'a poussé à faire lexicon. Je voulais: > 1-obtenir une liste "réelle" des diphones possibles. J'aurais pu le faire > sans être obligé de faire un programme (nb_phonèmes au carré). > 2-obtenir une évaluation du nombre de mots associés. Ca c'est plus difficile > de le réaliser à la main. > La base de lexique.org, adapté par Roger, me semble une bonne référence > (128000 mots alors que traditionnellement on dit que notre vocabulaire se > limite à 5000 mots environ). Je comprends bien ces louables motivations. > > En plus, ceux qui jetteront un oeil sur le source verront que j'avais > imaginé de pouvoir améliorer l'index produit de manière manuelle en > rejetant les propositions de mots. Ce serait à faire pour éliminer les mots > "discutables". OK. > > Maintenant si lexicon n'est pas une bonne idée, pas de problème on oublie. > > Concernant le choix des mots sans signification, pour les raisons invoquées > par AWB, pourquoi pas? Comment réaliser ces mots? En plus, il faudra là > aussi éliminer les diphones impossibles. Lesquels? Qui nous développe > quelque chose dans cette optique? C'est vrai que l'élimination des diphones imprononçables est a priori peu évidente. On retrouve là un intérêt de Lexicon. Ma remarque était surtout liée à l'idée de suivre au plus prêt la méthode préconisée par Festvox pour profiter de leur expérience et de leurs outils dont un certain : diphone-gen-list cf. notamment le chapitre 18 de BSV. -- Phil