Dominique Meeùs
Dernière modification le   
retour à la table des matières — à l’index — à ma page de départ

À travers OCRopus

Il y a des travaux sur un logiciel de reconnaissance de caractères, OCRopus, en Python : OCRopy. Il y a quelques mois ou années, l’installation d’OCRopus était du genre PITA. Maintenant (juillet 2015) installer ORopy se fait sans problème en suivant le fichier README.md. Au début, OCRopus utilisait Tesseract comme moteur de reconnaissance, mais a maintenant son propre moteur. Il me semble que Tesseract est toujours meilleur, à moins de créer soi-même (train) des modèles de langue. En fait, il s’agit pas d’un logiciel destiné à l’utilisation courante. Le module dit binarization pourrait être intéressant pour transformer un image scannée de qualité en gris en image bitonale meilleure qu’un scan en noir et blanc, mais il y a d’autres commandes qui le font.

Dominique Meeùs . Date: 2011… 2017