(Courriels de diversion: <accumulation@allient-recrimine.com> <cachetteriez@blagueuse-decollement.com> <exceptant@frileux-etheres.com> <suppliciee@tenables-coïncidents.com> <ombragee@pardonnons-malthusiennes.com> <arche@designeriez-cabale.com> <sifflerais@decotes-precede.com> <heteroclites@selliers-decervelage.com> <decapotable@fructifiaient-compatissions.com> <deminerait@prejugez-valoriserions.com> )
Je profite de ce message croisé sur la liste Debian pour vous signaler que j'ai fais également des essais d'OCR avec gocr il y a quelques jours. Mes résultats sont assez similaires à ce qu'on peut lire dans le message. Bonne reconnaissance générale. Mauvaise reconnaissance des caractères accentués. Pas de reconstitution des mots césurés. En plus, pour obtenir ce niveau de reconnaissance, il faut jouer sur les paramètres du scanner ou effectuer un post traitement sur l'image, ce qui prend pas mal de place quand on scanne à 600 dpi. Je comptais justement chercher un peu plus comment ces traitements peuvent s'automatiser pour un handicapé. Cela n'est pas évident, car ils doivent dépendre largement de la qualité du papier, donc varier d'un document à l'autre. Il faudra qu'on en parle à l'occasion. Un autre point qui doît faire l'objet d'attention est l'alignement du texte. Le scan doit être bien droit pour obtenir un taux de reconnaissance important. A+ CPHIL ---------- Message transmis ---------- Subject: Re: OCR Date: Sun, 26 May 2002 14:18:27 +0200 From: sylvain Debeux <sylvain.debeux@free.fr>To: debian-user-french@lists.debian.org On Sun, 26 May 2002 13:03:47 +0200 Adeimantos <delange@imaginet.fr> wrote:> Existe t-il un bon système de reconnaissance de caractères [OCR] sous > Debian? J'ai 300 pages à saisir et à mettre en pages dans un ordre > différent (ça s'appelle fabriquer un bouquin). Il me faut ainsi: > > a) un bon scanner > b) un bon logiciel > c) du temps > > Des idées? Merci > > JP salut alors, je suis arrivé à qqe chose avec gocr : scan du texte en 600 dpi, enregistrement en tiff, conversion en pnm avec gimp ; je n'ai pas fait de traitement de l'image; donc pires conditions pour un essai : mon scanner est un bete snapscan 1212 USB le resultat brut sans options particulieres (gocr fonctionne en ligne de commande) donne ceci: """" Le domaine de 1a securite informatique est un sujet des plus complexes, mais reste incontournable. L'eventualité de dysfonctionnements dans les programmes est plutót connue maintenant, mais il est egalement possible de creer des problèmes de sécurite en combinant des logi- ciels qui f_nctionnent << sans erreur >>. Des environnements et des tâches complexes reQuierent des systemes d'information eux-mêmes plutôt complexes et obscurs. Sans 1imitation des acces, les données peuvent être alte- rees frauduleusement en secret. Ce type de probleme devient tangible 1orsqu'on imagine des hôpitaux infor- matisés, par exemple. L'op.posé, a savoir une limitation """ ce qui me semble un resultat des plus interessant vu les conditions de l'experience. une retouche luminosité-contraste simple va donner ceci en brit """""Le domaine de 1a securité informatique est un sujet des plus complexes, mais reste incontournable. L'eventualité de dysfonctionnements dans 1es programmes est plutot connue maintenant, mais il est également possible de creer des problèmes de securite en combinant des 1ogi- ciels Qui fonctionnent << sans erreur >>. Des environnements et des tâches complexes requièrent des systëmes d'information eux-memes plutôt complexes et obscurs. Sans 1imitation des accès, 1es donnees peuvent être alte- rees frauduleusement en secret. Ce type de problème devient tangible lorsqu'on imagine des hôpitaux infor- matises, par exemple. L'oppose, a savoir une limitation """""" j'ai trouvé aussi gocr-tk qui permet de piloter tout ca via une interface (notamment scanner directement) voila, je vais poursuivre les essais j'ai aussi essayé clara mais je n'arrive pas à produire un format qu'il puisse lire amicalement -- ================================================= Sylvain DEBEUX (Sylvain.Debeux@free.fr)ICQ:3985176 Proteus http://sylvain.debeux.free.fr/ ================================================= -- To UNSUBSCRIBE, email to debian-user-french-request@lists.debian.orgwith a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org ------------------------------------------------------- -- Je veux rester tel un sou neuf, l'hurluberlu qui sort de l'œuf Je veux demeurer tout fou Toutou tout fou-fou-ou -- Richard Gotainer "Tout foufou" --------------------------------------------------------------------- To unsubscribe, e-mail: biglux-unsubscribe@savage.iut-blagnac.frFor additional commands, e-mail: biglux-help@savage.iut-blagnac.fr