Le 1 mai 2015 21:14, Vincent Frison <vincent.fri...@gmail.com> a écrit :
>
> Merci pour vos réponses, notamment Philippe pour ton mail très instructif.
>
> Et donc s'il faut résumer cette licence BY-NC-ND empêche toute extraction
de donnée vers OSM, c'est vraiment dommage.
>
> Je vais quand même essayer de leur demander si une autorisation spéciale
pour OSM serait envisageable, sait on jamais...

Bon à priori ça devrait pouvoir se faire, ils m'ont même donné un export de
leur base en XML ! :)

L'export contient :
- la hauteur de l'immeuble
- l'URL vers la fiche de l'immeuble sur leur site
- et évidemment les coordonnées

Le fichier contient 43 188 bâtiments et non pas 47 636 comme indiqué sur
leur site car ils ont déjà filtré les bâtiments qui sont en projet ou
détruit (ça tombe bien car ils ne nous intéressent pas).

Maintenant il faudrait que je leur fournisse un document autorisant
explicitement l'import de ces données dans OSM puis qu'ils le signent. Si
quelqu'un a un modèle je suis preneur...

J'ai fait tourner mon programme sur cet export et voici quelques
statistiques :
Total of loaded imports: 43188
Total of matched imports: 33059
Number of matched elements: 31789
Number of updatable elements: 31756
Number of updated elements: 0
Repartition by matching scores:
- score between 0% and 10% : 972 (3%) elements <= 0 updated (970 were
updatable)
- score between 10% and 20% : 0 (0%) elements <= 0 updated (0 were
updatable)
- score between 20% and 30% : 0 (0%) elements <= 0 updated (0 were
updatable)
- score between 30% and 40% : 0 (0%) elements <= 0 updated (0 were
updatable)
- score between 40% and 50% : 0 (0%) elements <= 0 updated (0 were
updatable)
- score between 50% and 60% : 0 (0%) elements <= 0 updated (0 were
updatable)
- score between 60% and 70% : 0 (0%) elements <= 0 updated (0 were
updatable)
- score between 70% and 80% : 0 (0%) elements <= 0 updated (0 were
updatable)
- score between 80% and 90% : 0 (0%) elements <= 0 updated (0 were
updatable)
- score between 90% and 100% : 30817 (96%) elements <= 0 updated (30786
were updatable)

Quelques remarques :
- sur les 43 188 buildings PSS seulement 33059 correspondent à au moins un
bâtiment OSM => environ 10000 buildings PSS sont écartés (soit parce qu'ils
ont des coordonnées placées légèrement à côté du bâtiment soit parce que le
bâtiment n'existe tout simplement pas dans OSM)
- cela fait que 31789 buildings OSM correspondent avec au moins un building
PSS :
  * 972 correspondent à plus d'un seul building PSS et dans ce cas là je
préfère mettre un score global à 0% (et donc ne rien faire) car ça veut
dire que le découpage de ces bâtiments OSM n'est pas assez précis.
  * 30817 correspondent qu'à un seul building PSS et parmi ceux ci 30786
sont "updatables", les autres ne le sont pas car ils avaient déjà un tag
height.

Il faut bien comprendre que le souci comparé à mon import des bâtiments
parisiens c'est qu'ici on a pas la surface des buildings, or je me basais
justement sur celle ci pour calculer les scores de correspondance. Du coup
un building PSS dont ses coordonnées sont à l'intérieur d'un building OSM a
forcément un score de correspondance à 1.0 (ie. le score max). Par contre
s'il y en a plus qu'un seul building PSS qui matche un building OSM
(environ 3% des cas) alors je met le score "global" du building OSM à 0%
afin de ne rien faire. Cela évitera pas mal de situations problématiques
mais pas le cas où un building OSM correspond dans la réalité à plusieurs
buildings de hauteur différente. C'est surtout vrai pour Paris mais ça peut
aussi arriver hors de Paris même si c'est de manière beaucoup plus
marginale de ce que j'ai vu. Mais ce que je pourrais éventuellement faire
c'est avoir une bounding box d'exclusion afin de ne pas toucher à Paris et
sa petite couronne. Ou sinon j'ai vu sur leur site que certains buildings
avaient une surface de terrain. S'ils pouvaient la rajouter export je
pourrais calculer des scores comme je le faisais pour l'import sur Paris.
Sauf que cette notion de surface de terrain ne correspond pas forcément à
l'empreinte du bâtiment (par ex. pour les résidences avec plusieurs
immeubles ça peut être la surface totale de la résidence) et en plus cette
info n'est pas présente à chaque fois. Au final il y aurait donc beaucoup
moins que 30k buildings updatables mais au moins ça serait plus sûr, bref
c'est à creuser...

Sinon ça serait bien chouette s'ils pouvaient également nous rajouter dans
leur export un ou deux champs supplémentaires, comme par exemple le nom ou
l'année de construction mais bon c'est déjà assez classe qu'ils nous
autorisent déjà utiliser la hauteur malgré leur vilaine licence BY-NC-ND.
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr

Répondre à