(Courriels de diversion: <motion@verrouille-tourmenter.com> <garrotter@delectera-talonnait.com> <sanctionnerez@fractionnera-tentateurs.com> <orientais@digits-regressa.com> <detachees@detourne-exciteraient.com> <apparierions@chiropracteurs-apitoieront.com> <relayant@bareme-lutin.com> <representa@alourdit-disposeraient.com> <plaisanter@accepta-degivres.com> <cotelee@insulaire-sabrer.com> )


> Ce serait utile pour concevoir un document unique, mais aussi des 
> documents compagnons ie traitant d'un même sujet mais destinés à des 
> publics différents.
Bonjour Kevin,
Ce que tu décris n'est rien de moins que le problème fondamental du
bibliothécaire ou du documentaliste :
Soit un corpus de textes, comment les classer et les ordonner afin de
pouvoir extraire à la demande ceux relatifs à un sujet donné.

A la main, la solution connue consiste à "indexer" les documents en
s'appuyant sur des listes de mots clés organisés hiérarchiquement et que
l'on nomme "thésaurus" ou "vedettes matières". Depuis le développement
de l'usage des ordinateurs, de nombreuses recherches ont été conduites
pour automatiser ce travail. Cela aboutit en particulier aux moteurs de
recherche actuels mais aussi à toutes sortes de produits destinés à
organiser la gestion et la circulation des documents dans les
entreprises (cf "GED": gestion électronique des documents). Ces
produits, s'appuient sur des techniques plus ou moins sophistiquées
(lexiques, usage de "champs sémantiques", statistiques et/ou
topologiques). Mis à part les plus simples (indexations lexicales comme
le fait htdig) tu trouveras peu de chose "en libre". Il existe par
contre de nombreuses "briques" éparses que tu peux utiliser si tu n'as
pas peur de "mettre les mains dans le cambouis" : dictionnaires,
analyseurs lexicaux et syntaxiques, calculs de "distances"
inter-textuelles et outils de génération de documents (souvent à l'aide
des technologies XML). Ils n'existe pas à ma connaissance d'outils
"génériques" car malgré toutes les ruses employées, on se heurte vite à
la complexité des langages naturels. Si tu as lu le mail de jdd
concernant la traduction automatique et que tu as regardé le détail de
la traduction proposée, tu as certes pu constater les progrès réalisés
mais aussi tout le chemin qu'il reste à parcourir! Hal 9000 de "2001
Odyssée de l'espace" et la machine infernale de Irobots ne sont pas
d'actualité! (Il est aussi possible qu'un jour, un émule de Türing ou de
Gödel nous démontre que ce n'est tout simplement pas possible!).
jpn


--------------------------------------------------------------------
Les listes de diffusion occultes: <URL:http://www.CULTe.org/listes/>