Nicholas -> debian-russian@lists.debian.org  @ Fri, 28 May 2010 13:54:04 +0000:

 N> Задача - проверить все файлы в катологе на предмет "сохранен ли он в
 N> кодировке utf8". При том что внутри файлов только английский текст.

 N> Имеет ли такая постановка вопроса смысл и, если да, как это сделать ?

Имеет, но довольно специфический.  Проверить файл на наличие нулевых байтов.

Разъяснение: во всех реально применяемых однобайтовых кодировках и в
UTF-8 английский текст кодируется одинаково.  Из мультибайтовых
кодировок, если ты не работаешь с китайцами, реально можно наткнуться,
помимо UTF-8, только на UTF-16.  В которой английский текст будет
кодироваться по два байта на символ, один из которых - все тот же самый
ASCII-код, что и во всех остальных кодировках, а другой - нулевой.

-- 
Любой инструмент, используемый не по назначению, имеет свойство
превращаться в грабли.
        Andrey Sverdlichenko


-- 
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmas...@lists.debian.org
Archive: http://lists.debian.org/28601...@wizzle.ran.pp.ru

Ответить