On 2004.06.09 at 10:47:55 +0500, Dmitry-T wrote: > > > Стоит Debian Woody. Через iconv -l можно увидеть кодировку UNICODELITTLE > > > которая очень нужна для поиска в вордовских и экселевских файлах > > > grep`ом, при этом хочется чтоб неучитывался регистр букв. Пытаюсь > > > создать локаль и получаю кучу ошибок... Кто-нибудь может объяснить как > > > создать эту локаль - очень нужно... > > > > По-моему ты подходишь к проблеме не с той стороны. Grep - утилита для > > работы с ТЕКСТОВЫМИ файлами и для работы с вордовыми и экселовскими > > файлами попросту не предназначен. Поэтому для поиска по этим файлам их > > следует сначала пропустить через фильтр (catdoc, wvHtml, xls2csv, > > xlhtml). > > У меня несколько специфичная задача (экспертиза) - поиск по ключевым > словам файлов на приносимых HDD независимо от кодировки, то есть найти > надо буквально всё. Неужели лучше будет пропускать каждый файл через > catdoc и потом через xls2csv? Самым удобным сейчас видиться, просто > написать 3 варианта ключевого слова (ААА, Ааа, ааа) и по ним искать с > учётом регистра.
Есть такая добрая программа file. Нужно сначала с её помощью определить тип файла, потом пропустить через соответствующий конвертер, и только потом искать. А то же может быть файл зажат, скажем gzip-ом. И хрен ты что там найдешь. Или будет он в формате OpenOffice. > Тут ещё один вопрос встаёт: как распознавать архивы? > > > Наличие кодировки в списке iconv ещё не означает возможности создания > > локали. Вот если бы в /usr/share/i18n/charmaps был файлик UNICODELITTLE > > - тогда другое дело. > > А его самому можно сделать? > > > -- > To UNSUBSCRIBE, email to [EMAIL PROTECTED] > with a subject of "unsubscribe". Trouble? Contact [EMAIL PROTECTED] >