(Courriels de diversion: <motion@verrouille-tourmenter.com> <garrotter@delectera-talonnait.com> <sanctionnerez@fractionnera-tentateurs.com> <orientais@digits-regressa.com> <detachees@detourne-exciteraient.com> <apparierions@chiropracteurs-apitoieront.com> <relayant@bareme-lutin.com> <representa@alourdit-disposeraient.com> <plaisanter@accepta-degivres.com> <cotelee@insulaire-sabrer.com> )
> Ce serait utile pour concevoir un document unique, mais aussi des > documents compagnons ie traitant d'un même sujet mais destinés à des > publics différents. Bonjour Kevin, Ce que tu décris n'est rien de moins que le problème fondamental du bibliothécaire ou du documentaliste : Soit un corpus de textes, comment les classer et les ordonner afin de pouvoir extraire à la demande ceux relatifs à un sujet donné. A la main, la solution connue consiste à "indexer" les documents en s'appuyant sur des listes de mots clés organisés hiérarchiquement et que l'on nomme "thésaurus" ou "vedettes matières". Depuis le développement de l'usage des ordinateurs, de nombreuses recherches ont été conduites pour automatiser ce travail. Cela aboutit en particulier aux moteurs de recherche actuels mais aussi à toutes sortes de produits destinés à organiser la gestion et la circulation des documents dans les entreprises (cf "GED": gestion électronique des documents). Ces produits, s'appuient sur des techniques plus ou moins sophistiquées (lexiques, usage de "champs sémantiques", statistiques et/ou topologiques). Mis à part les plus simples (indexations lexicales comme le fait htdig) tu trouveras peu de chose "en libre". Il existe par contre de nombreuses "briques" éparses que tu peux utiliser si tu n'as pas peur de "mettre les mains dans le cambouis" : dictionnaires, analyseurs lexicaux et syntaxiques, calculs de "distances" inter-textuelles et outils de génération de documents (souvent à l'aide des technologies XML). Ils n'existe pas à ma connaissance d'outils "génériques" car malgré toutes les ruses employées, on se heurte vite à la complexité des langages naturels. Si tu as lu le mail de jdd concernant la traduction automatique et que tu as regardé le détail de la traduction proposée, tu as certes pu constater les progrès réalisés mais aussi tout le chemin qu'il reste à parcourir! Hal 9000 de "2001 Odyssée de l'espace" et la machine infernale de Irobots ne sont pas d'actualité! (Il est aussi possible qu'un jour, un émule de Türing ou de Gödel nous démontre que ce n'est tout simplement pas possible!). jpn -------------------------------------------------------------------- Les listes de diffusion occultes: <URL:http://www.CULTe.org/listes/>