>
> Maybe a bit out of topic but I manage to obtain incredible result with the
> couple ScanTailor / Imagemagick.
>
Here is the simple code :
#!/usr/bin/sh
# you need to have Scantailor and mogrify (from Imagmagic) in the path
set -x
. tess.ini
< import these
IMG_DIR=/opt/T
IMG_DIR_ST=/opt/T/st
IMG_DIR_ST_OUT=/opt/T/st/out
ST=/cygdrive/c/app/ocr/ScanTailor/scantailor-cli.exe
convert alias to /cygdrive/c/app/ocr/ImageMagick/convert.exe
>
while [ -n "$1" ]
> do
> case $1 in
> -b1 ) black=2 ; white=2 ;;
> -b ) black=$2 ; shift ;;
> -w ) white=$2 ; shift ;;
> esac
> shift
> done
> if [ ! -d $IMG_DIR_ST_OUT ] ;then
> mkdir $IMG_DIR_ST_OUT
> fi
> black=${black:-0}
> white=${white:-0}
> cd $IMG_DIR_ST
> LST=`find . -maxdepth 1 -type f`
> $ST -v \
> --layout=1.5 \
> --dpi=300 \
> --output-dpi=300 \
> --margins-top=5 --margins-bottom=5 --margins-left=10
> --margins-right=10 \
> --threshold=13 \
> --picture-shape=rectangular \
> --enable-page-detection \
> --white-margins \
> --enable-fine-tuning \
> --normalize-illumination=true \
> --color-mode=color_grayscale \
> --despeckle=off --start-filter=3 $LST $CYG_IMG_DIR_ST_OUT
> #--color-mode=color_grayscale \
> cd $IMG_DIR_ST_OUT
> for f in `ls`
> do
> if [ -f $f ];then
> #$RAD=`echo $f | sed 's/.tif//'`
> if [ $black -gt 0 -o $white -gt 0 ];then
> convert $f -type GrayScale -contrast-stretch
> ${black}%x${white}% $f
> else
> convert $f -type GrayScale -normalize $f
> fi
> # set to A4
> #mogrify -resize 2130x3767 $f
> fi
> done
source Image:
<https://lh4.googleusercontent.com/-wWuRDplFSbs/UxMUkpre-SI/AAAAAAAAABY/Hq2uHkmJZZo/s1600/b0.jpg>
standard result of the script:
<https://lh5.googleusercontent.com/-rywDJJ8bZKU/UxMUvDpRF6I/AAAAAAAAABg/3OuLz-4RRfg/s1600/b1.jpg>
Darkened result (when using option -b1) :
<https://lh4.googleusercontent.com/-KlMStJD3XXg/UxMU1ogC4yI/AAAAAAAAABo/hEVOa3TgkhI/s1600/b2.jpg>
The resulting scan (tesseract 3.03 on cygwin is:
ses caractères généraux, le mouton etbaï se rapproche étroite-
> ment de l'espèce a large queue; mais il s’en distingue par une
> queue mince, longue et toull‘ue, et par quelques détails (le la
> robe. Celle—ci, qui n’est pas laineuse, se compose simplement
> d'un poil long, droit et ternie; elle est presque toujours entie—
> reinent blanche, excepté, et c'est lz‘i le [n‘incipal caractère de la
> race, excepté. aux chevilles et a la bouche, qui sont revêtues de
> noir.
> Dans le pays, le prix courant de ces montons ne dépasse ja-
> mais un dollar; un jeune agneau n’a que la moitié «le cette va—
> leur.
> (in ne rencontre de vaches que dans les environs (le, Souakin
>
>
> Mouton des Bicharines.
> et sur la route- du Taka, plus méridionale que la nôtre. Sur la
> ligne que nous suivions, la pluie est moins abondante, et les
> bétes bovines n’auraient pas toute l’année, comme dans les patu—
> rages de la Barka, la nourriture nécessaire a leur entretien.
> Sortis de l’Ameht, nous traversâmes, dans le district suivant,
> un plateau élevé que déchiraient de nombreux vallons, se diri-
> geant au sud-ouest, et creusés profondément au milieu (les
> pierres et de la rocaille. Le plus important de ces larges ravins,
> aux cours d’eau périodiques, est l’ouadi Arab; son lit desséché
> nous opposa des berges de trente à quarante pieds de hauteur,
> dont les pentes abruptes soumirent nos chameaux a une rude
> épreuve.
I am still working on getting a blank page but up to now I could not manage
it without altering too much the images.
On the translation side, still working on tweak the FRA langage.
--
--
You received this message because you are subscribed to the Google
Groups "tesseract-ocr" group.
To post to this group, send email to [email protected]
To unsubscribe from this group, send email to
[email protected]
For more options, visit this group at
http://groups.google.com/group/tesseract-ocr?hl=en
---
You received this message because you are subscribed to the Google Groups
"tesseract-ocr" group.
To unsubscribe from this group and stop receiving emails from it, send an email
to [email protected].
For more options, visit https://groups.google.com/groups/opt_out.