On 3/15/16, Alexis Ojitos Díaz <alex...@la.ma.rimed.cu> wrote: > [...] > > Gran parte de los modelos de teléfono > móvil comercializados en los últimos meses por distintos fabricantes > están programados para funcionar con los símbolos del llamado alfabeto > GSM 3.38, que consta de 138 símbolos distintos y permite escribir > mensajes de hasta 160 caracteres.
Para ser claros los datagramas pueden llegar a tener 182 caracteres si se envían por USSD . > Pero si se utiliza algún símbolo que no está en este alfabeto, el móvil > pasa automáticamente a funcionar con el sistema Unicode, que limita a 70 > caracteres la longitud de cada mensaje. Esa es la variantes d UCS-2 . Como expliqué en un mensaje anterior hay otra posibilidad q consiste en enviar mensajes crudos (raw) d 8 bits y codificarlos con e.g. UTF-8 y así enviar hasta 160 caracteres ASCII por datagrama . > Por este motivo, si un usuario > apura los 160 caracteres que cree tener en un SMS, pero escribe en él > letras con acento u otros caracteres no incluidos en el alfabeto GSM > 3.38, se le factura por mensajes de 70 caracteres. Casi sí ... o a veces no ... leer más abajo ;) > Y un único mensaje de > 160 caracteres se le factura como tres mensajes (dos de 70 más uno de > 20). > Definitivamente sí , esto es pq 3 datagramas se encadenan con un encabezado y número d secuencia para armar un "mensaje d texto" largo . > El problema no afecta a todas las letras con acento ni a todas las > diéresis. Así, se pueden escribir los símbolos é, è, ì, ò y ù (aunque no > sus mayúsculas correspondientes) sin que el móvil conmute al modo > Unicode. No exactamente , pues depende d lo q haga el software del móvil . Sin problemas se puede utilizar los caracteres é y É pq están en la tabla d base [1]_ . Aquellos teléfonos q tengan el coraje y la valentía d implementar las extensiones d GSM 3.38 , pudieran activar el "national language shift table" del español [2]_ para representar todas las otras vocales con 14 bits (e.g. ú = 0x1B + 0x75 ) > Pero el alfabeto GSM 3.38 no incluye otros caracteres más > habituales en español y catalán como á, à, í o ú. > Todas las vocales con <fr>accent aigú</fr> están en la tabla básica d GSM 03.38 e.g. el caracter à es 0x7F [1]_ . <joke> ¿Uds se piensan q los franceses q inventaron eso son bobos? </joke> > Un problema similar se da con las diéresis. Con ä, ö y ü se puede llegar > a 160 caracteres, +1 > pero una ë y una ï hacen pasar al sistema Unicode. > ... aplica el mismo comentario anterior acerca d mensajes crudos d 8 bits . > En cuanto a la letra ñ, se puede escribir con alfabeto GSM 3.38 en > minúscula, pero salta a Unicode en mayúscula. > La Ñ ( 0x6D ) está en la tabla de base [1]_ del GSM 03.38 . [...] .. [1] https://en.wikipedia.org/wiki/GSM_03.38#GSM_7-bit_default_alphabet_and_extension_table_of_3GPP_TS_23.038_.2F_GSM_03.38 .. [2] https://en.wikipedia.org/wiki/GSM_03.38#Spanish_language_.28Latin_script.29 -- Regards, Olemis - @olemislc Apache™ Bloodhound contributor http://issues.apache.org/bloodhound http://blood-hound.net Brython committer http://brython.info http://github.com/brython-dev/brython Blog ES: http://simelo-es.blogspot.com/ Blog EN: http://simelo-en.blogspot.com/ Featured article: ______________________________________________________________________ Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba. Gutl-l@jovenclub.cu https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l