[Linux-31] Analyse d'un fichier texte

peterpan31 at free.fr peterpan31 at free.fr
Mar 24 Jan 00:48:51 CET 2017


Bonsoir,

Problème complexe :
Je souhaite connaître le taux de réussite après une passe OCR appliquée à une page en FR.

Evidemment ce taux est relatif puisqu'il ne peut que  s'appliquer sur le résultat de l'OCR, qui lui-même peut être plus ou moins erronné.

Pour calculer ce taux relatif, j'imagine calculer le rapport entre le nombre de mots reconnus dans un dictionnaire et le nombre de mots total de la sortie de l'OCR.
Mais cette vue est très simpliste... car des cas complexes existent.

Ca existerait un outil qui pourrait renseigner sur ce  taux ???
--
pierre



Plus d'informations sur la liste de diffusion Linux-31