on 四, 2009-02-19 at 09:06 +0800, Dongsheng Song wrote: > 我不明白,为什么还死抱着 GB2312/Big5 不放手,直接使用 UTF-8 不好吗? > sc <=> tc 应该只转换内容,不应该多此一举的转换到过时的编码。 >
假设一个用户要对 index.wml 文件贡献一些翻译条目,例如 "Debian 是什麼",目前的 处理方式由于所提交的 index.wml 是 BIG5 编码的,通过 iconv 可以直接把 "Debian 是什麼" 转换成 "Debian 是什么",那么简/繁各自的 HTML 文件都能正确显示。 如果把 index.wml 文件由 BIG5 编码转换成 UTF-8 编码,并且假设最终生成的 HTML 文 件也使用 UTF-8 编码,问题是如何在简体 HTML 文件中显示 "Debian 是什么",而在繁 体 HTML 文件中显示 "Debian 是什麼"。 另外考虑一下 UTF-8 编码格式的 index.wml 文件,如果简繁用户先后贡献了两条翻译条 目,并且他们所录入的文字,使用的都是各自习惯的文字系统(简体/繁体)。这时 index.wml 文件同时保存着简体中文和繁体中文两种系统的文字,如何把 wml 文件向 html 文件以正确的文字系统对应关系进行转换呢? 举例来说,一个简体用户在 index.wml 的第6行贡献了一个翻译条目 "<h2>Debian 是什 么</h2>",若干月之后一个繁体用户在 index.wml 的第23行贡献了一个条目 "<h2>現在 開始</h2>"。有什么办法可以实现: * 将 index.wml 文件转换成 index.zh-cn.html 时, 把第23行的内容转换成 "<h2>现在开始</h2>"。 第6行的内容保持不变 * 将 index.wml 文件转换成 index.zh-tw.html/index.zh-hk.html 时, 把第6行的内容转换成 "<h2>Debian 是什麼</h2>"。 第23行的内容保持不变 解决了这个问题,就可以实现 wml 文件格式从 BIG5 向 UTF-8 迁移了。 -- Vern 2009-02-19
signature.asc
Description: Digital signature