Si on garde la clé c'est pour qu'elle soit vérifiable (et l'algo de calcul est simplissime) et éviter les erreurs de saisie "à la volée". Ce qui aurait mérité alors de garder le code division (là où il est encore utile et non nul, donc pas dans les départements 75, 92, 59 et 13) : la validation de la clé est alors immédiate et on repère immédiatement les inversions de chiffres. Là on se contente juste d'un test de longueur, et d'un controle à posteriori via le rapprochement BANO-OSM d'Osmose (ce qui n'aide pas du tout les premiers contributeurs).
Ce serait donc bien de promouvoir ce contrôle à priori (dès la saisie ou dans le validateur de données avant l'envoi à OSM) et non à posteriori (d'autant qu'il y a encore des tas de lieux à référencer et rapprocher de façon plus intelligente qu'un simple rapprochement de nom qui est bourré de pièges). Ces références FANTOIR pourtant accélèrent considérablement à mon avis les rapprochements et lèvent pas mal d'ambiguités, et fonctionnent encore pour détecter les changements de noms et les expliquer. Peut-être qu'on pourrait s'en sortir en délimitant les zones de direction dans les 4 départements concernés, afin que la validation puisse déduire le code manquant pour valider la clé. pour les autres départements on sait que le code direction est 0, donc la validation est possible et à mon avis il reste alors recommandé de garder la lettre clé finale dans les données OSM. C'est une solution simple: 4 zones à créer pour Paris, 2 zones pour chacun des 3 départements (à priori des communes entières, sauf si depuis des communes ont fusionné entre deux zones à cheval, sans forcément changer les codes FANTOIR qui risquent fort d'attendre encore 1 an ou plus avec leur ancien code commune et leur ancien code direction). Cela permettrait ensuite de faire le point avec la DGFIP pour que finalement elle voit que les codes direction ne sont plus nécessaires et peuvent être unifiés à "0" sans avoir même besoin de le préciser, quitte à changer les lettres clés dans les 4 départements pour tenir compte du changement implicite de code direction à 0, puis finalement même retirer ce code direction obsolète du fichier FANTOIR de la DGFIP. Et tant qu'à faire ce changement pour les 4 départements, rationaliser à nouveau la typologie (les codes voie à 4 chiffres peuvent tous passer à 1 lettre plus 3 chiffres, puisque toutes les lettres ne sont pas utilisées). LE code final en serait plus lisible sous la forme générale: 5 chiffres (code commune)+1 lettre de type+3 chiffres (rang dans le type)+lettre clé calculée sur les 9 premiers caractères (sans besoin de changer l'algo de calcul qui reste simple: une substitution des lettres par un chiffres puis un calcul similaire au LUHN, et un modulo mappé sur une lettre finale). Ou bien tout en gardant 10 caractères, passer à un code avec 5 chiffres (code commune)+2 lettres (type+sous-collection du type sans le 0, le I et le L pour éviter la confusion avec les chiffres en ignorant la casse non significative) +2 chiffres (rang dans le type+collection)+lettre clé (avec un nouvel algo possible: une simple somme des chiffres, pondérés chacun par plusieurs facteurs distincts 1,2,3,5,7,11,13,17,19 en fonction de leur rang, puis un modulo égal à un autre nombre premier comme 23, conduisant à mapper une clé d'une lettre parmi 23, sans le I et le O). Le sous-code "collection" peut être utilisé pour les transitions millésimées dues aux fusions/scissions de communes (on a le choix parmi les 23x23 lettres, quand actuellement on n'utilise que les chiffres 00 à 99 et souvent beaucoup moins, et 1 lettre parmi 3 suivi d'un chiffre parmi 9). Au pire, on définit ça comme notre nouveau "code FANTOIR-OSM" remplaçant le "code FANTOIR-RIVOLI" historique et capable aussi de représenter d'autres champs du FANTOIR (exemple: public contre privé, provisoire/chantier/projet/voie déclassée ou fermée mais qui pourrait être reclassée à l'avenir). Et ce nouveau code n'a pas non plus obligation à n'être que pour les communes si la compétence échoie à une agglomération ou un département (dans ce cas on peut jouer sur les 5 premiers chiffres ou lettres), ou à un grand gestionnaire foncier privé ou para-public (exemple: agences de bassin, parcs naturels, portuaires/aéro-portuaire, armée, forêts, zones internationales...) Le lun. 16 déc. 2019 à 13:08, Vincent de Château-Thierry <osm.v...@free.fr> a écrit : > > > De: "Yves P." <yves.prat...@gmail.com> > > > Concernant la clé de contrôle, est-ce nécessaire de la garder sachant > > qu’il peut manquer le code div pour la recalculer ? > > Si j’ai bien compris, tu as la base DGFiP complète sur un serveur et > > un outil de contrôle qualité qui peut vérifier la cohérence entre > > ref:FR:FANTOIR et les données brutes « FANTOIR ». > > Du coup elle devient inutile ? > > Oui, le fichier FANTOIR est pris ici : > > https://www.data.gouv.fr/fr/datasets/fichier-fantoir-des-voies-et-lieux-dits/ > et fait partie intégrante du processus BANO, car cette longue liste est > (sur le papier) la plus exhaustive pour nous permettre de comparer le > contenu d'OSM. C'est un peu la clé de voûte de BANO ce fichier. > > Concernant le format du ref:FR:FANTOIR, on peut s'interroger sur la > pertinence du format à 10 positions, mais je ne vois pas ce qu'apporterait > maintenant d'enlever la clé de contrôle, pour passer à un code sur 9 > positions. Ca occasionnerait un gros chantier de mise à jour OSM, ça > casserait momentanément tous les outils développés autour de BANO. Et, > cerise sur le gâteau, ça casserait l'interopérabilité vis-à-vis des autres > bases de données qui s'appuient sur la même structure de clé, comme l'a > rappelé Christian. Bilan : beaucoup d'inconvénients et 0 valeur ajoutée. Je > disais la même chose pour ne pas inclure le code Direction, les arguments > sont les mêmes ici. > > Après, on peut s'amuser, pour la gymnastique intellectuelle, à trouver le > bon algo pour calculer la clé, etc. Mais dans notre contexte je ne vois pas > ce que ça apportera concrètement à OSM, dès lors que, plus que le respect > d'un algo, on cherche à respecter une intégrité référentielle vis-à-vis > d'un fichier public qui fait autorité. > > vincent > > _______________________________________________ > Talk-fr mailing list > Talk-fr@openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-fr >
_______________________________________________ Talk-fr mailing list Talk-fr@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-fr