Le 31 mars 2015 10:52, Vincent Frison <vincent.fri...@gmail.com> a écrit :

> Dans ma zone de test il y a donc un peu plus de 34% de bâtiment ayant un
> import dont le score est d'au moins 90%.
>
> Je vais essayer d'implémenter l'astuce décrite dans mon précédent mail :
> pour chacun des bâtiments OSM regrouper les imports par nombre d'étages
> pour voir si je peux les "cumuler" afin d'atteindre le bon score minimal.
>

J'ai refait quasiment tout mon programme afin d'être bien générique (il
peut travailler sur n'importe quel tag de n'importe quel élément et non pas
simplement sur le nombre d'étage des bâtiments) et surtout pour avoir ce
"cumul" des scores des imports.

Voici donc les stats avec l'ancienne et la nouvelle méthode : pour chaque
bâtiment l'ancienne méthode ne considère que l'import avec le meilleur
score alors que la nouvelle méthode regroupe les imports ayant le même
nombre d'étages pour additionner leur score ce qui permet d'avoir des
résultats légèrement meilleurs.

 INFO === Statistics ===
 INFO *** Statistics with the old matching method ***
 INFO Number of matched elements: 2568
 INFO Number of updatable elements: 0
 INFO Number of updated elements: 0
 INFO Repartition by matching scores:
 INFO - between 0% and 10% : 37 (1%) elements including 0 that have been
updated (0 were updatable)
 INFO - between 10% and 20% : 62 (2%) elements including 0 that have been
updated (0 were updatable)
 INFO - between 20% and 30% : 136 (5%) elements including 0 that have been
updated (0 were updatable)
 INFO - between 30% and 40% : 220 (8%) elements including 0 that have been
updated (0 were updatable)
 INFO - between 40% and 50% : 275 (10%) elements including 0 that have been
updated (0 were updatable)
 INFO - between 50% and 60% : 270 (10%) elements including 0 that have been
updated (0 were updatable)
 INFO - between 60% and 70% : 176 (6%) elements including 0 that have been
updated (0 were updatable)
 INFO - between 70% and 80% : 201 (7%) elements including 0 that have been
updated (0 were updatable)
 INFO - between 80% and 90% : 302 (11%) elements including 0 that have been
updated (0 were updatable)
 INFO - between 90% and 100% : 889 (34%) elements including 0 that have
been updated (0 were updatable)
 INFO *** Statistics with the new matching method ***
 INFO * Statistics for the updatable tag building:levels
 INFO Number of matched elements: 2550
 INFO Number of updatable elements: 0
 INFO Number of updated elements: 0
 INFO Repartition by matching scores:
 INFO - between 0% and 10% : 31 (1%) elements including 0 that have been
updated (0 were updatable)
 INFO - between 10% and 20% : 23 (0%) elements including 0 that have been
updated (0 were updatable)
 INFO - between 20% and 30% : 50 (1%) elements including 0 that have been
updated (0 were updatable)
 INFO - between 30% and 40% : 150 (5%) elements including 0 that have been
updated (0 were updatable)
 INFO - between 40% and 50% : 263 (10%) elements including 0 that have been
updated (0 were updatable)
 INFO - between 50% and 60% : 265 (10%) elements including 0 that have been
updated (0 were updatable)
 INFO - between 60% and 70% : 202 (7%) elements including 0 that have been
updated (0 were updatable)
 INFO - between 70% and 80% : 209 (8%) elements including 0 that have been
updated (0 were updatable)
 INFO - between 80% and 90% : 335 (13%) elements including 0 that have been
updated (0 were updatable)
 INFO - between 90% and 100% : 1022 (39%) elements including 0 that have
been updated (0 were updatable)
Avec la nouvelle méthode la tranche des 90%->100% passe ainsi de 34% à 39%,
c'est toujours ça de pris.

Personnellement j'aimerais bien qu'on prenne également la tranche des
80%->90% car il faut bien voir que le découpage d'OSM est vraiment grossier
par rapport à celui d'OpenDataParis et qu'il y a forcément des différences
de surfaces assez importantes. Si on se dit que ma zone de test dans le 12e
arrondissement est assez représentative (on aura à peu près les mêmes
pourcentages sur l'ensemble de Paris) et qu'on accepte cette tranche de
80%->90% cela permettrait de mettre à jour plus de la moitié des immeubles
parisiens (39 + 13 = 52%). Mais je comprends tout à fait que cela puisse
vous gêner et que vous préfériez ne rien mettre à jour plutôt que de mettre
à jour des données "fausses" (même si pour moi elles ne sont pas fausses
mais juste légèrement simplistes en raison des données existantes ;p).

Voila j'attends vos retours avant de me lancer mon programme sur le serveur
live.

++ Vincent.
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr

Répondre à