Re: [Toulibre] OCR

2011-09-04 Par sujet Philippe Masson
Le 04/09/2011 15:59, Guillaume Betous a écrit : http://lucien.dodin.org/luciendodin-free/feuilles_volantes/feuilles0003.PDF alors là au temps pour moi, il est clair que c'est bien okular (celui que j'ai sous la main) qui fait de l'OCR ! et en plus c'est instantané ! on n'arrête plus le

[Toulibre] Linux sur Netbook ACER ASPIRE ONE 522

2011-09-04 Par sujet Pascal Wijsbroek
Bonjour à tous, Est-ce que quelqu'un a déjà installé une distrib Linux sur l'ACER Aspire One 522 ? Et si oui la vraie question est : laquelle ? J'ai installé Ubuntu 11.04, ça marche... puis ça ne marche plus. Bon déjà c'est assez lent à l'usage, mais passons. Le vrai problème c'est que la veille

Re: [Toulibre] OCR

2011-09-04 Par sujet Le J
Bonsoir, Si vous ne connaissez pas, Il existe aussi l'utilitaire en ligne de commande "pdftotext " pour extraire du texte d'un pdf. Je ne l'ai pas trop utilisé mais je viens de le tester sur > http://lucien.dodin.org/luciendodin-free/feuilles_volantes/feuil

Re: [Toulibre] OCR

2011-09-04 Par sujet Guillaume Betous
> http://lucien.dodin.org/luciendodin-free/feuilles_volantes/feuilles0003.PDF > alors là au temps pour moi, il est clair que c'est bien okular (celui que j'ai sous la main) qui fait de l'OCR ! et en plus c'est instantané ! on n'arrête plus le progrès ;) gUI -- Pour la santé de votre ordinateur

Re: [Toulibre] OCR

2011-09-04 Par sujet jdd
Le 04/09/2011 15:40, jdd a écrit : c'est justement ca que je viens de faire, d'où mon étonnement http://lucien.dodin.org/luciendodin-free/feuilles_volantes/feuilles0003.PDF ouvrir dans okular, outils, sélection de texte - c'est pas terrible, mais lm'original est exécrable!: Lçs figures q

Re: [Toulibre] OCR

2011-09-04 Par sujet Jérôme
Sun, 04 Sep 2011 15:40:39 +0200 jdd a écrit: > c'est justement ca que je viens de faire, d'où mon étonnement L'imprimante de mon (ex-)boulot a cette fonctionnalité. Donc on scanne au choix - en .jpg - en .jpg (ou autre image, j'y ai pas regardé de près) dans un .pdf - OCR -> texte -> .pdf Ca vi

*****SPAM***** Re: [Toulibre] OCR

2011-09-04 Par sujet jdd
Spam detection software, running on the system "lolut.org", has identified this incoming email as possible spam. The original message has been attached to this so you can view it (if it isn't spam) or label similar future email. If you have any questions, see the administrator of that system for

Re: [Toulibre] OCR

2011-09-04 Par sujet jdd
Le 04/09/2011 15:32, Guillaume Betous a écrit : quand le pdf vient du scan d'un document de 1880, quelque part si! je suis d'accord (je disais qu'on peut insérer des images, et c'est ce que font les logiciels de scan en général), mais précisément sur ces pdf là, je doute fort que tu fasses

Re: [Toulibre] OCR

2011-09-04 Par sujet Guillaume Betous
> > quand le pdf vient du scan d'un document de 1880, quelque part si! > je suis d'accord (je disais qu'on peut insérer des images, et c'est ce que font les logiciels de scan en général), mais précisément sur ces pdf là, je doute fort que tu fasses de la sélection de texte. tu peux vérifier ? j'e

Re: [Toulibre] OCR

2011-09-04 Par sujet jdd
Le 04/09/2011 15:23, Guillaume Betous a écrit : donc sélectionner un texte ne relève pas de la magie de l'OCR, pas plus que de rechercher un texte à l'intérieur du document. quand le pdf vient du scan d'un document de 1880, quelque part si! jdd -- http://www.dodin.net http://www.youtube.com

Re: [Toulibre] OCR

2011-09-04 Par sujet Guillaume Betous
> > je viens juste de remarquer que tous mes lecteurs pdf (aussi bien libres > que non libres) ont un ocr incorporé, puisqu'on peutsélectionner du texte et > le recopier ailleurs. > juste comme ça, le PDF n'est pas du tout un format d'image (meme si on peut toujours intégrer des images dans un fic

Re: [Toulibre] OCR

2011-09-04 Par sujet jdd
Le 04/09/2011 12:38, Sylvain a écrit : Bonjour, Si d'une quelconque utilité, pour passer du PDF au TIF: je viens juste de remarquer que tous mes lecteurs pdf (aussi bien libres que non libres) ont un ocr incorporé, puisqu'on peutsélectionner du texte et le recopier ailleurs. les versions l

Re: [Toulibre] OCR

2011-09-04 Par sujet Sylvain
La plupart des scanners produisent malheureusement par défaut du JPG 150dpi dans l'encapsulation PDF. Certains sont paramétrables pour produire un format bitmap (BMP, TIF, PNG) donc sans pertes. Ces formats, en 300dpi ou plus, sont mieux que le JPG pour conserver les documents (hors photos), s

Re: [Toulibre] OCR

2011-09-04 Par sujet jdd
Le 04/09/2011 12:11, momo a écrit : je sais c'est pour ça que je viens de demmarrer avec gscan2pdf, je nage encore dans l'inconnu, mon experience a deux heures où j'ai commencé a installer , j'ai des fichiers .pnm dans tmp que je sais pas quoi en faire, voila je commence juste à apprendre, je pe

Re: [Toulibre] OCR

2011-09-04 Par sujet momo
Le 04/09/2011 12:11, momo a écrit : Le 04/09/2011 12:03, jdd a écrit : peux-tu détailler comment tu fais pour faire de l'ocr sur un pdf, mon tesseract me réclame du tif merci jdd pour l'instant , j'ai converti les pdf en tiff avec gscan2pdf, c'est tout ce que j'ai avançé, la dessus je va

Re: [Toulibre] OCR

2011-09-04 Par sujet Sylvain
Bonjour, Si d'une quelconque utilité, pour passer du PDF au TIF: pdftoppm -r 300 PDF-file PDF-root donne des pages PDF-file-XXX.ppm en résolution 300dpi. convert PDF-file-XXX.ppm PDF-file-XXX.tif transforme le ppm en tif. Plein d'autres possibilités de conversion et montage avec les paquets i

Re: [Toulibre] OCR

2011-09-04 Par sujet momo
Le 04/09/2011 12:03, jdd a écrit : peux-tu détailler comment tu fais pour faire de l'ocr sur un pdf, mon tesseract me réclame du tif merci jdd je sais c'est pour ça que je viens de demmarrer avec gscan2pdf, je nage encore dans l'inconnu, mon experience a deux heures où j'ai commencé a in

Re: [Toulibre] OCR

2011-09-04 Par sujet jdd
Le 04/09/2011 11:54, momo a écrit : bonjour j'ai un paquet de pdf, (bien fait), jz voudrai les transformer en .doc ou .rtf j'ai installé Tesseract et gscan2pdf , j'ai lancé la reconnaissance de caractère, mais ça met un temps fou et mon cpu est a 99 % les ventilos tournent à fond . J'ai un pentiu

Re: [Toulibre] OCR

2011-09-04 Par sujet Xavier Besnard
Bonjour A tout hasard, tu peux regarder là pour la reconnaissance optique de caractères: http://doc.ubuntu-fr.org/ocr Merci pour le retour, si cela t'a aidé. Bon courage. Xavier Le 04/09/2011 11:54, momo a écrit : bonjour j'ai un paquet de pdf, (bien fait), jz voudrai les transformer en .d

[Toulibre] OCR

2011-09-04 Par sujet momo
bonjour j'ai un paquet de pdf, (bien fait), jz voudrai les transformer en .doc ou .rtf j'ai installé Tesseract et gscan2pdf , j'ai lancé la reconnaissance de caractère, mais ça met un temps fou et mon cpu est a 99 % les ventilos tournent à fond . J'ai un pentium R 4 à 3.4GHz, je pense que ça de