Le 23/08/2015 11:30, Aurélien .... a écrit : > Bonjour, > > Je m'intéresse de près à la BANO pour le moment spécifiquement dans le > Nord-Pas-De-Calais et à coups de requêtes dans tous les sens et j'ai > pu sortir des "différences" entre les données BANO et les données OSM. >
As tu regardé la dernière analyse Osmose que j'ai ajouté qui fait justement le croisement BANO/OSM ? C'est une version "osmose" du rouge du rendu BANO, plus simple à utiliser pour faire les corrections les unes après les autres. http://osmose.openstreetmap.fr/fr/errors/?item=7170 classes 30 à 33 > J'en ai catalogué différents types : > > 1) BANO : "La rue des Mésanges" - OSM : "Rue des mésanges" > 2) BANO : "L'Arbre de Guise" - OSM : "Rue de l'Arbre de Guise" > 3) BANO : "Rue de l'Escalier Royal" - OSM : "Escalier Royal" > > Ce n'est pas bien méchant mais peut-être que nous pouvons établir un > ensemble de règles syntaxiques afin de créer un process de correction > automatique ? > Et comment déterminer qui est correct ? Les données BANO issues du cadastres peuvent comporter des erreurs... le cadastre n'est pas parfait et n'est pas une source d'autorité (c'est uniquement la commune qui l'est). > Il y a un quatrième type de différence qui est plus inquiétant, le > résultat ressemble à ça : > > - BANO : "Rue de la Fontaine Al Tuerie" - OSM : "Rue de la Fontaine à > l'Tuerie" => hein est bien din ch'nord lô > - BANO : "Rue du Vieux Chemin de Fourmie"" - OSM : "Rue du Vieux > Chemin de Fourmies" > - BANO : "Rue Hector Sandrart" - OSM : "Rue Hector Sandrard" > - BANO : "Rue du Maréchal Leclerc" - OSM : "Rue du Maréchal Leclercq" > Certaines erreurs peuvent être éliminées en croisant avec encore plus de données, typiquement sur les noms de personnes... Il n'y a pas de "Général ou Maréchal Leclercq", Clemenceau ne comporte pas d'accent, etc... J'ai commencé à explorer cette piste, par l'extraction de tout les mots uniques afin de créer un dictionnaire. Là aussi le dictionnaire aura besoin d'être validé, le tout automatique me semble hasardeux. Il y a déjà un dictionnaire utilisé par l'analyse osmose sur les name, mais on pourrait reduire encore plus celui-ci en le spécialisant. > En tout le nombre de "différences" sur la région s'élève à 1137 (en > comptant les "faux positifs") sur 110.000 rues. > > Est-ce que ça vous intéresserait d'avoir un listing groupé par commune > sur l'ensemble de la métropole afin d'avoir une base supplémentaire de > nettoyage ? > > Si c'est le cas, comment puis-je vous transmettre des fichiers CSV ? > > Je continue mes investigation pour checker s'il n'y aurait pas des > rues présentes dans la BANO et absentes dans OSM. > > Pardon par avance s'il y a déjà des outils qui existent pour faire ça. > > A bientôt > Comment procèdes-tu pour sortir ce CSV ? -- Christian Quest - OpenStreetMap France
_______________________________________________ Talk-fr mailing list Talk-fr@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-fr