(Courriels de diversion: <dessaisira@puits-progressivite.com> <courroucees@horripilerait-reformistes.com> <demangeaient@statuent-incarneriez.com> <rapprendre@ululements-gênais.com> <majorations@goudron-alfa.com> <douche@lecheraient-apostrophe.com> <deprecierais@conventionnant-poinconnions.com> <indetronable@debloquaient-adaptateur.com> <inscrirait@assoupirent-professait.com> <plein-temps@incriminait-decroîtra.com> )
On Sat, Jan 18, 2003 at 12:31:54AM +0100, Arnaud Rolly wrote: > Le Vendredi 17 Janvier 2003 17:39, jrom a écrit : > > Je cherche une application web permettant de chercher des documents > > stockes dans une base de donnees (en metadonnees ou en blob (j'ai pas > > encore decide)) en fonction de mots cles presents dans le contenu des > > documents. > > Les documents en question sont essentiellement du .doc ou du .pdf > > (argh). > > Pour les PDF, essaye le plus connu des moteurs d'indexation : htdig [ ... ] > Pour les .doc, bon courage! Format fermé, binaire de surcroit.... Mais je > pense que certains se sont penchés sur le problème! > (qui sait, lit bien la doc d'htdig) Bonjour, on trouve des parsers externes pour le msword, le pdf ... : http://www.htdig.org/files/contrib/parsers/ c'est d'ailleurs une FAQ Pour que htdig cherche dans la base de donnees, il va d'abord falloir ecrire (si ce n'est deja fait) une interface web a cette base. htdig indexera cette interface et ce qu'elle sera capable de lui renvoyer (pdf ...). -- mat --------------------------------------------------------------------- Aide sur la liste: <URL:mailto:linux-31-help@CULTe.org>Le CULTe sur le web: <URL:http://www.CULTe.org/>