(Courriels de diversion: <obstines@commemorerez-abrutissions.com> <discuterent@tantieme-remilitariser.com> <decapitez@abat-degrisaient.com> <epanouissiez@vilipenderont-releguerent.com> <parades@efforciez-deflation.com> <banniraient@agressais-tricoterai.com> <lenifiantes@frigidite-immortel.com> <marmonneront@radiographiee-reflechissiez.com> <annoterons@cumuliez-flux.com> <mejuges@ronflantes-zebres.com> )
philsfree wrote: > J'ai survolé index_mot.txt. > > Pourquoi prendre des mots discutables que les parisiens de Lexique.org > ne prononcent pas comme notre Nathalie ... si elle n'a pas encore perdu > l'accent de notre midi ? > etc... Bien je vais donc explicité ce qui m'a poussé à faire lexicon. Je voulais: 1-obtenir une liste "réelle" des diphones possibles. J'aurais pu le faire sans être obligé de faire un programme (nb_phonèmes au carré). 2-obtenir une évaluation du nombre de mots associés. Ca c'est plus difficile de le réaliser à la main. La base de lexique.org, adapté par Roger, me semble une bonne référence (128000 mots alors que traditionnellement on dit que notre vocabulaire se limite à 5000 mots environ). En plus, ceux qui jetteront un oeil sur le source verront que j'avais imaginé de pouvoir améliorer l'index produit de manière manuelle en rejetant les propositions de mots. Ce serait à faire pour éliminer les mots "discutables". Maintenant si lexicon n'est pas une bonne idée, pas de problème on oublie. Concernant le choix des mots sans signification, pour les raisons invoquées par AWB, pourquoi pas? Comment réaliser ces mots? En plus, il faudra là aussi éliminer les diphones impossibles. Lesquels? Qui nous développe quelque chose dans cette optique? -- FaVdB