At (linux-br) Unicode & e-mails (was (admin-linux-br) Re: Descadastramento),
Jorge Godoy <[EMAIL PROTECTED]> wrote:
> > Estava falando da linux-br e admin-linux-br...
>
> Eu sei. Só que você sabe como sou mala, né?? :-))
Como sou muito educado, vou dizer que não :P
> >> > Posso mandar mensagens em japonês para a lista? :P
> >>
> >> Depende da lista. :-))
> >
> > As citadas acima...
>
> Acho que o povo não ia gostar... Dos 2500 não sei se 1% sabe ler
> japonês...
Detalhes, Godoy, detalhes...
> >> UTF-16 deveria resolver teu problema. Ele pode mostrar todos esses
> >> encodings ao mesmo tempo.
> >
> > 1) Sim, mas não existe módulo para o XEmacs;
>
> Hmmmmm... Mas acho que tem para o Emacs.
Ops, quis dizer módulo de e-mail para o XEmacs, que reconheça
automagicamente o charset usado e que responda no charset
correto.
> > 2) E os americanos iriam reclamar que o tamanho das mensagens
> > ficariam duplicadas, congestionando a Net;
>
> :-))
> Na verdade não. Só quando você precisasse. O restante você poderia
> mandar como iso-8859-1.
Estava falando de usar o Unicode para tudo...
Na verdade, pelo que eu entendi do Unicode, o UTF-8 verifica se
são necessários 16bits para a mensagem ou não, e se não precisar
manda com 8bits. Acho que era isso.
> > 3) Me parece que ocorrem alguns problemas quando se mistura
> > japonês, coreano e chinês;
>
> Bem... aí já não é minha praia. :-)
>
> > 4) O UTF-16 é compatível com o ASCII, provavelmente compatível
> > com o ISO8859-1, mas não é compatível com o ISO2022-JP, se não
> > me engano.
>
> Você diz o número do caractere? Não sei... Mas isso é indiferente. Se
> o cidadão tiver uma fonte Unicode (16), ele vai conseguir ler.
Não só o número de caracteres, mas o código usado nos caracteres.
Por exemplo, se você abrir um texto escrito com ASCII num editor
Unicode, ele vai aparecer direito. Se abrir um texte escrito com
ISO8859-1 com Unicode, se não me engano aparece tudo certo.
Mas se você abrir um texto escrito em japonês (com qualquer um dos
3 (eca!!!) charsets existentes), vai sair tudo errado. E acho que
acontece o mesmo com cirilico e outros charsets que não sejam o
ISO8859-1.
Isto é, um baita problema de compatibilidade...
Claro que isso vai ter que ocorrer algum dia, mas por enquanto
as vantagens de se usar o Unicode (na minha opinião) são ainda
limitados.
Outro detalhe: os fontes (de caracteres) TrueType para caracteres
japoneses tem uns 3MB de tamanho. Já imagina como ficaria uma
fonte para Unicode? Só se fosse possível separar em diversos
arquivos... Mas acho que isso é meio complicado.
E não existe fonte livre de alta qualidade para o japonês!!!
E provavelmente o mesmo para chinês, etc.
Esse é um problema gravíssimo...
--
Ricardo Yassuo Igarashi
E-mail: [EMAIL PROTECTED]
Linux HP: http://web.that.com.br/~iga/
Assinantes em 25/03/2001: 2171
Mensagens recebidas desde 07/01/1999: 106557
Historico e [des]cadastramento: http://linux-br.conectiva.com.br
Assuntos administrativos e problemas com a lista:
mailto:[EMAIL PROTECTED]