(Courriels de diversion: <dessaisira@puits-progressivite.com> <courroucees@horripilerait-reformistes.com> <demangeaient@statuent-incarneriez.com> <rapprendre@ululements-gênais.com> <majorations@goudron-alfa.com> <douche@lecheraient-apostrophe.com> <deprecierais@conventionnant-poinconnions.com> <indetronable@debloquaient-adaptateur.com> <inscrirait@assoupirent-professait.com> <plein-temps@incriminait-decroîtra.com> )


On Sat, Jan 18, 2003 at 12:31:54AM +0100, Arnaud Rolly wrote:
> Le Vendredi 17 Janvier 2003 17:39, jrom a écrit :
> > Je cherche une application web permettant de chercher des documents
> > stockes dans une base de donnees (en metadonnees ou en blob (j'ai pas
> > encore decide)) en fonction de mots cles presents dans le contenu des
> > documents.
> > Les documents en question sont essentiellement du .doc ou du .pdf
> > (argh).
> 
> Pour les PDF, essaye le plus connu des moteurs d'indexation : htdig

[ ... ]

> Pour les .doc, bon courage! Format fermé, binaire de surcroit.... Mais je 
> pense que certains se sont penchés sur le problème!
> (qui sait, lit bien la doc d'htdig)

Bonjour,

on trouve des parsers externes pour le msword, le pdf ... :

http://www.htdig.org/files/contrib/parsers/

c'est d'ailleurs une FAQ 

Pour que htdig cherche dans la base de donnees, il va d'abord falloir
ecrire (si ce n'est deja fait) une interface web a cette base.
htdig indexera cette interface et ce qu'elle sera capable de lui
renvoyer (pdf ...).


-- 
mat

---------------------------------------------------------------------
Aide sur la liste: <URL:mailto:linux-31-help@CULTe.org>Le CULTe sur le web: <URL:http://www.CULTe.org/>