Hola,
he leido de todo y nada me ha gustado. Como convertís un string utf8 a
un string con carácteres html? o sea, que los accentos se transformen
a codificación html?
En este pequeño código, convertimos á é í ó ú ñ -> a htm entities.
Pero falta mayúsculas, ç (catalán),
import re
value u'C
Según la documentación oficial:
http://docs.python.org/library/htmllib.html#module-htmlentitydefs
2012/6/5 Raimon Esteve
> Hola,
>
> he leido de todo y nada me ha gustado. Como convertís un string utf8 a
> un string con carácteres html? o sea, que los accentos se transformen
> a codificación ht
El día 5 de junio de 2012 14:00, Raúl Cumplido
escribió:
> Según la documentación oficial:
>
> http://docs.python.org/library/htmllib.html#module-htmlentitydefs
correcto, pero tienes que ir carácter por carácter del string. No hay
nada más "limpio"?
--
Si us plau, NO adjunti arxius a les seves
Realmente lo que viene siendo es un diccionario con todas las entities a
substituir:
htmlentitydefs.codepoint2name
{8704: 'forall', 8194: 'ensp', 8195: 'emsp', 8709: 'empty', 8711: 'nabla',
8712: 'isin', 8201: 'thinsp', 8715: 'ni', 8204: 'zwnj', 8205: 'zwj', 8206:
'lrm', 8719: 'prod', 8721: 'sum',
No soy experto ni mucho menos en Python, pero, has pensado en mirar con
expresiones regulares el tema? Me refiero, busca una coincidencia de una
tilde, por ejemplo, y reemplázala con un tilde formateado en HTML. Esto lo
puedes hacer con una herramienta de Linux llamada sed (que es lo que uso
yo) o
2012/6/5 Raúl Cumplido :
> probablemente con regular expressiones sería más rápido, pero vas a tener
> que meter todas las posibilidades que tienes en el diccionario.
Siempre puedes escribir código que te genere todo ese código en re.
___
Python-es maili
otra opcion:
1) expresión regular que te saque la lista ordenada de los caracteres
a transformar
2) sustituir los caracteres a transformar por %s
3) mapear una funcion de traduccion a la lista del punto 1
4) texto_del_pto_2 % lista_pto_3
2012/6/5 Daπid :
> 2012/6/5 Raúl Cumplido :
>> probablemente
Yo creo que no hay que darle muchas vueltas al tema, puede que escrito
quede más "bonito", pero la expresion regular, dentro de lo que cabe,
seguirá recorriendo todo el string, incluso lo tendras que recorrer mas
veces, una por cada substitución.
Van a ser de la misma complejidad, O(n), o incluso l
El día 5 de junio de 2012 15:59, Rock Neurotiko
escribió:
> Yo creo que no hay que darle muchas vueltas al tema, puede que escrito quede
> más "bonito", pero la expresion regular, dentro de lo que cabe, seguirá
> recorriendo todo el string, incluso lo tendras que recorrer mas veces, una
> por cada
Tienes razon, por eso digo "incluso lo tendras que recorrer", porque una de
dos, o te haces el pedazo de expresion regular con todos los casos, o las
vas haciendo mas pequeñas.
De todas formas, se supone que Python debería ser legible, y para mi las
expresiones regulares muy crípticas (la que has
El día 5 de junio de 2012 13:53, Raimon Esteve
escribió:
> Hola,
>
> he leido de todo y nada me ha gustado. Como convertís un string utf8 a
> un string con carácteres html? o sea, que los accentos se transformen
> a codificación html?
>
> En este pequeño código, convertimos á é í ó ú ñ -> a htm en
Y no se podría hacer algo con maketrans y translate de string?
___
Gonzalo Fernández Hernández
[email protected]
Avda. Montes de Oca, 1
28703 San Sebastián de los Reyes-Madrid
Telf. 91 659 86 00 / 8205
___
El día 5 de junio de 2012 22:29, FERNANDEZ HERNANDEZ GONZALO
escribió:
> Y no se podría hacer algo con maketrans y translate de string?
>
>
Claro que se puede hacer. El que quiera reinventar la rueda, que
traduzca: http://www.w3.org/TR/html4/sgml/entities.html
Saludos,
-- luismiguel (@lmorilla
Recordamos que esta abierto el llamado a propuestas de actividades
para la 4º Conferencia Nacional del Lenguaje Python, a realizarse
entre el 12 y 17 de Noviembre de 2012 en la Universidad Nacional de
Quilmes, Buenos Aires, Argentina:
http://ar.pycon.org/2012/conference/proposals
Este año se prop
14 matches
Mail list logo