Bonsoir, Si vous ne connaissez pas, Il existe aussi l'utilitaire en ligne de commande "pdftotext <http://en.wikipedia.org/wiki/Pdftotext>" pour extraire du texte d'un pdf. Je ne l'ai pas trop utilisé mais je viens de le tester sur
> http://lucien.dodin.org/luciendodin-free/feuilles_volantes/feuilles0003.PDF > et il a l'air de donner le même résultat que okular, avec l'avantage d'être facilement scriptable et plus léger que "tesseract" (qui est utilisé par gimagereader et qui donne de meilleurs résultats). Le J.
_______________________________________________ Toulouse-ll mailing list Toulouse-ll@toulibre.org http://toulibre.org/cgi-bin/mailman/listinfo/toulouse-ll