Mille grazie a tutti per gli spunti di soluzione che mi avete dato. Li provo uno ad uno.
Ho provato ora questa: def remove_accent(self, input_str): nfkd_form = unicodedata.normalize('NFKD', unicode(input_str)) return u"".join([ch for ch in nkfd_form if not unicodedata.combining(c)]) self.extracted_text_u = self.remove_accent(self.extracted_text_u) File "extract_sentences.py", line 34, in remove_accent nfkd_form = unicodedata.normalize('NFKD', unicode(input_str)) UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 16: ordinal not in range(128) _______________________________________________ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python