Bonjour,
Merci François pour cette information.

L'étude semble intéressante. Le résumé est prometteur en tout cas.

Je pense qu'il faut dépasser l'idée que l'approche de l'IGN est 
partiale. Elle l'est, nécessairement. And so what?
Tout d'abord, le COGIT a assez d'autonomie pour ne pas avoir autant la 
tête dans le guidon que la direction commerciale de l'IGN. Les remarques 
qui sont faites sont des constatations. Même si la méthode était 
discutable (ce qui reste à démontrer), les ordres de grandeur sont 
éloquents. Et la raison principale évoquée, à savoir le manque de 
cadrage à la saisie est absolument vrai. Actuellement, on peut faire à 
peu près ce que l'on souhaite lorsqu'on fait une contribution, notamment 
en terme de modèle de données et de topologie.
Les pistes de réflexion proposées par le COGIT semblent pertinentes et 
les actions évoquées, à savoir "Le COGIT étudie des méthodes permettant 
de définir des spécifications au sein de systèmes de saisie 
collaborative", ne sont pas à prendre à la légère et sont à encourager, 
au contraire. Ce laboratoire regroupe de vrais experts sur la qualité 
des données géographiques, et, au lieu de nuire au projet OSM, leur 
approche pourrait être au contraire bénéfique. Prêtons nous à rêver, et 
envisageons la complémentarité, à terme, entre une communauté libre et 
un institut national, qui aurait retrouvé ses missions de service 
public. Vu comme ça, où est la concurrence? Par contre, il faudrait que 
cette utopie devienne un peu plus concrète un jour ou l'autre. Or, le 
terme même de "service public" passe de moins en moins...

Pour en revenir aux problèmes de qualité liés spécifiquement aux 
libertés trop importantes de saisie, d'une part, et à la relative 
faiblesse des métadonnées d'autre part, je livre en prime time des 
extraits d'un document sur lequel GAIAGO travaille depuis quelques mois, 
en interaction avec le CERTU (autre expert de la qualité des données 
s'il en est).
Ce document est intitulé: "LA PROBLEMATIQUE DE LA QUALITE DES DONNEES 
GEOGRAPHIQUES COLLABORATIVES, Cas d'OpenStreetMap, pistes de solutions".

Cas de l'utilisateur Néophyte (chapitre "La déprofessionnalisation des 
producteurs")

Situation :
Ce contributeur, par définition, n’y connaît à priori rien en 
géomatique, en production de données et en cartographie, même s’il peut 
par ailleurs connaître parfaitement bien la zone qu’il cartographie.
Problème potentiel :
La probabilité est forte que ce néophyte produise des données fausses et 
non conformes aux spécifications en terme de structuration. Les données 
sont alors inexploitables en l’état et peuvent conduire à l’avenir 
l’utilisateur à de mauvais résultats.
Il est de plus incapable de documenter sa production au travers de 
métadonnées.
Pistes de solution:
(...)
3) Ergonomie encadrée : l’utilisateur ne doit pas avoir la possibilité 
de produire les données n’importe comment :
- Contrôle à la volée de la topologie,
- Modèle de données simple et figé pour les néophytes (seuls les experts 
peuvent ajouter de nouveaux champs aux objets, par exemple)
Cas d’OSM :
- Actuellement, la topologie peut être contrôlée par certains outils 
(...). Ce contrôle n’est pas réalisé à la volée, mais par une action 
volontaire du contributeur.
- La création d’un nouvel attribut (tag) est réalisée en concertation 
avec les autres contributeurs actifs de la communauté (actif étant un 
statut empirique, non défini). Un contributeur peut néanmoins inventer 
de nouvelles valeurs possibles de ces attributs sans consulter personne, 
s’il le souhaite. S’il ne justifie pas sa démarche en associant un 
commentaire à l’objet comportant une nouvelle valeur pour un attribut 
donné, il prend le risque de voir cette valeur supprimée un peu plus 
tard par un autre membre, plus « avancé » de la communauté (ou remplacé 
par la valeur qui existe déjà et que le contributeur n’a pas pris la 
peine de chercher). Exemple : un contributeur renseigne un tronçon de 
voie avec l’attribut highway ayant la valeur « voie piétonne », alors 
que cette distinction existe déjà, sous la forme « footway » 
(highway=footway). Un autre contributeur, plus au fait, peut remplacer 
sans prévenir « voie piétonne » par « footway ». Le risque est encore 
plus grand que la donnée reste telle quelle, non "normalisée" donc 
inexploitable.

4) Métadonnées obligatoires (en règle générale, on ne devrait pas 
pouvoir valider et enregistrer une quelconque saisie sans avoir rempli 
une série de métadonnées incontournables). Cette pratique marche aussi 
pour tous les types de producteurs qu’ils soient ou non néophytes.
Cas d’OSM :
Actuellement ,lorsqu’on crée un objet, renseigner la source n’est pas 
obligatoire. Il faudrait non seulement la rendre obligatoire, mais 
imposer les éléments suivants :
·    Estimation de la précision géométrique de la source,
·    Date de la source,
·    Estimation de l’échelle de la source (dans le cas d’une 
numérisation à partir d’une photographie aérienne ou d’une source 
vectorielle existante),
·    Estimation de la précision sémantique de la source (pour les 
valeurs des attributs),
·    Droits d’utilisation de la source (type de licence).

J'arrête là l'extrait.
L'ensemble du document sera bientôt mis en ligne dans notre rubrique 
ressources (http://www.gaiago.fr). Je ferai un message lorsque ce sera 
le cas.

Serge Mang
GAIAGO

François Van Der Biest a écrit :
> Bonjour,
>
> A la conférence SAGEO 2009 [1] ("SPATIAL ANALYSIS AND GEOMATICS", 
> Paris, 25-27 novembre 2009), il y aura un poster sur le travail 
> de Guillaume Touya et Jean-François Girres du laboratoire COGIT de 
> l'IGN. Ils se sont intéressés à l'évaluation de la qualité des données 
> libres d'OpenStreetMap en France.
>
> Je les ai contactés, et ils m'ont transmis un résumé PDF de leurs 
> travaux, disponible en [2].
> Un article est en cours de soumission à une revue à comité de lecture, 
> et je n'ai donc pas pu accéder au détail de l'étude.
>
> Extraits :
> "La comparaison des thèmes linéaires routiers montre des écarts
> maximaux moyens très supérieurs (Distance de Hausdorff moyenne de 
> 13.57 mètres)
> à la précision de la base de données de référence (Erreur moyenne 
> quadratique de 2
> mètres) mais surtout une très forte hétérogénéité dans la distribution 
> des valeurs, du
> fait du manque de spécifications de saisie précises.
> L’étude des carrefours des thèmes routiers a permis d’estimer une 
> erreur de
> position moyenne trois fois supérieure (distance moyenne de 6.65 
> mètres) à celle
> garantie par la BD TOPO®."
>
> Pour une saisie manuelle sur fond de traces GPS, ces chiffres me 
> semblent en bon accord avec la précision attendue.
> Ce qui me semble plus grave, c'est la précision sémantique pas 
> terrible, notamment entre routes "résidentielles" et "tertiaires".
>
> On attend la suite des travaux avec impatience ...
>
> Cordialement,
> F.
>
> [1] http://sageo09.univ-pau.fr/
> [2] http://dl.free.fr/ohUh3LLVh
> ------------------------------------------------------------------------
>
> _______________________________________________
> Talk-fr mailing list
> Talk-fr@openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-fr
>   

_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr

Répondre à