On 3/15/16, Alexis Ojitos Díaz <alex...@la.ma.rimed.cu> wrote:
>
[...]
>
> Gran parte de los modelos de teléfono
> móvil comercializados en los últimos meses por distintos fabricantes
> están programados para funcionar con los símbolos del llamado alfabeto
> GSM 3.38, que consta de 138 símbolos distintos y permite escribir
> mensajes de hasta 160 caracteres.

Para ser claros los datagramas pueden llegar a tener 182 caracteres si
se envían por USSD .

> Pero si se utiliza algún símbolo que no está en este alfabeto, el móvil
> pasa automáticamente a funcionar con el sistema Unicode, que limita a 70
> caracteres la longitud de cada mensaje.

Esa es la variantes d UCS-2 . Como expliqué en un mensaje anterior hay
otra posibilidad q consiste en enviar mensajes crudos (raw) d 8 bits y
codificarlos con e.g. UTF-8 y así enviar hasta 160 caracteres ASCII
por datagrama .

> Por este motivo, si un usuario
> apura los 160 caracteres que cree tener en un SMS, pero escribe en él
> letras con acento u otros caracteres no incluidos en el alfabeto GSM
> 3.38, se le factura por mensajes de 70 caracteres.

Casi sí ... o a veces no ... leer más abajo ;)

> Y un único mensaje de
> 160 caracteres se le factura como tres mensajes (dos de 70 más uno de
> 20).
>

Definitivamente sí , esto es pq 3 datagramas se encadenan con un
encabezado y número d secuencia para armar un "mensaje d texto" largo
.

> El problema no afecta a todas las letras con acento ni a todas las
> diéresis. Así, se pueden escribir los símbolos é, è, ì, ò y ù (aunque no
> sus mayúsculas correspondientes) sin que el móvil conmute al modo
> Unicode.

No exactamente , pues depende d lo q haga el software del móvil . Sin
problemas se puede utilizar los caracteres é y É pq están en la tabla
d base [1]_ . Aquellos teléfonos q tengan el coraje y la valentía d
implementar las extensiones d GSM 3.38 , pudieran activar el "national
language shift table" del español [2]_ para representar todas las
otras vocales con 14 bits (e.g. ú = 0x1B + 0x75 )

> Pero el alfabeto GSM 3.38 no incluye otros caracteres más
> habituales en español y catalán como á, à, í o ú.
>

Todas las vocales con <fr>accent aigú</fr> están en la tabla básica d
GSM 03.38 e.g. el caracter à es 0x7F [1]_ . <joke> ¿Uds se piensan q
los franceses q inventaron eso son bobos? </joke>

> Un problema similar se da con las diéresis. Con ä, ö y ü se puede llegar
> a 160 caracteres,

+1

> pero una ë y una ï hacen pasar al sistema Unicode.
>

... aplica el mismo comentario anterior acerca d mensajes crudos d 8 bits .

> En cuanto a la letra ñ, se puede escribir con alfabeto GSM 3.38 en
> minúscula, pero salta a Unicode en mayúscula.
>

La Ñ ( 0x6D ) está en la tabla de base [1]_ del GSM 03.38 .

[...]

.. [1] 
https://en.wikipedia.org/wiki/GSM_03.38#GSM_7-bit_default_alphabet_and_extension_table_of_3GPP_TS_23.038_.2F_GSM_03.38

.. [2] 
https://en.wikipedia.org/wiki/GSM_03.38#Spanish_language_.28Latin_script.29

-- 
Regards,

Olemis - @olemislc

Apache™ Bloodhound contributor
http://issues.apache.org/bloodhound
http://blood-hound.net

Brython committer
http://brython.info
http://github.com/brython-dev/brython

Blog ES: http://simelo-es.blogspot.com/
Blog EN: http://simelo-en.blogspot.com/

Featured article:


______________________________________________________________________
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l

Responder a