Le 17 février 2012 10:37, Hélène PETIT <h...@free.fr> a écrit :
> Le 16/02/2012 06:49, Vincent de Chateau-Thierry a écrit :
>
>> Les accents qui t'embêtent sont où : dans le XML des Presets ? Dans les
>> champs de saisie ? Propose ton fichier en test au cas où.
>
>
> Les deux, mon général. Car, dans le xml, on peut assigner une valeur par
> défaut à un champ de saisie. Ainsi "cadastre-dgi-fr source : Direction
> Générale des Impôts - Cadastre. Mise à jour : 2011", chaîne qui apparaît
> bourrées de losanges.
> le fichier xml (source en fin de ce message), encodé en ansi, fait des
> losanges ; encodé en utf8 ou en utf16 il est refusé par josm au chargement.

C'est FAUX !

JOSM les charge justement mais ne reconnait pas le codage parce ces
données ont été enregistrées dans la base sous une forme mal encodée
qui n'est pas conforme à UTF-8, justement par des utilisateurs de
Potlatch ou rawedit, depuis un navigateur bogué ou incompatible avec
les normes (IE6 sous Windows, toutes les versions d'IE qui existaient
sur MacOS).

Le problème est correctement détecté et traité par JOSM qui remplace
ces codes UTF-8 incorrect par le caractère Unicode approprié à ce cas
: U+FFFD. Si on revalide avec JOSM, il enregistrera ce caractère
Unicode valide. Mais il n'y a strictement aucun moyen fiable pour
déterminer dans quel encodage s'est fait le stockage de la donnée qui
est actuellement dans la base OSM quand elle n'est pas conforme en
UTF-8 (était-ce du Windows-1252 ? était-ce du MacRoman ? était-ce la
page de code 850 ?)

JOSM n'a aucun problème par lui-même car ce n'est pas sa faute si des
caractères sont mal codés, ce n'est pas lui qui a créé ces données
erronées qui sont présentes dans la base OSM.

_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr

Répondre à