On 2011.10.19 at 19:11:26 +0400, Иван Лох wrote: > On Wed, Oct 19, 2011 at 06:45:46PM +0400, Victor Wagner wrote: > > Правда, пока что попытки совместить это дело с дистрибутивном > > cuneiform-ом у меня к хорошим результатам не привели. > > ocrodjvu --engine cuneiform --language rus -o bookocr.djvu book.djvu
В теории нет разницы между теорией и практикой. А на практике - есть. Ну попробуй, например вот это http://freebsd.over.ru/oppel_1917.djvu черед ocrodjvu пропустить. Ни у меня (под Debian-ом) ни у Поволоцкого (под freebsd) добиться чтобы cuneiform на этом тексте не падал в кору, не получилось. Если получится, можно отправить файл tarkhil-у, и все историки военной медицины скажут за это большое человеческое спасибо. Особенно если удастся проделать то же самое с остальными редкостями, которые Поволцкий в djvu сосканировал. > $ djvutxt book.djvu |wc -l > 0 > $ djvutxt bookocr.djvu |wc -l > 11522 > > > $ apt-cache policy cuneiform ocrodjvu > > cuneiform: > Установлен: 1.1.0+dfsg-1 > Кандидат: 1.1.0+dfsg-1 > Таблица версий: > *** 1.1.0+dfsg-1 0 > 500 http://ftp.fi.debian.org/debian/ sid/non-free i386 Packages > 100 /var/lib/dpkg/status > > ocrodjvu: > Установлен: 0.4.6-4 > Кандидат: 0.4.6-4 > Таблица версий: > 0.6.1-1 0 > 101 ftp://ftp.fi.debian.org/debian/ experimental/main i386 Packages > *** 0.4.6-4 0 > 500 http://ftp.fi.debian.org/debian/ sid/main i386 Packages > 100 /var/lib/dpkg/status > > > -- > To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org > with a subject of "unsubscribe". Trouble? Contact listmas...@lists.debian.org > Archive: http://lists.debian.org/20111019151126.gb14...@nano.ioffe.rssi.ru > -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of "unsubscribe". Trouble? Contact listmas...@lists.debian.org Archive: http://lists.debian.org/20111020092634.ga30...@wagner.pp.ru