Re: [Toulibre] OCR

Le J Sun, 04 Sep 2011 10:08:14 -0700

Bonsoir,

Si vous ne connaissez pas, Il existe aussi l'utilitaire en ligne de commande
"pdftotext <http://en.wikipedia.org/wiki/Pdftotext>" pour extraire du texte
d'un pdf. Je ne l'ai pas trop utilisé mais je viens de le tester sur


> http://lucien.dodin.org/luciendodin-free/feuilles_volantes/feuilles0003.PDF
>
et il a l'air de donner le même résultat que okular, avec l'avantage d'être
facilement scriptable et plus léger que "tesseract" (qui est utilisé par
gimagereader et qui donne de meilleurs résultats).

Le J.

_______________________________________________
Toulouse-ll mailing list
Toulouse-ll@toulibre.org
http://toulibre.org/cgi-bin/mailman/listinfo/toulouse-ll

Re: [Toulibre] OCR

Répondre à