2009/11/17 Serge Mang GAIAGO <s.m...@gaiago.fr>

> A Denis: J'ai bien aimé la comparaison avec les pièces d'une habitation.
>
> A Emilie: Oui, je suis d'accord sur le fait qu'une application trop
> contraignante ferait fuir les contributeurs, et donc tuerait le projet.
> L'idée était de partir de la théorie, pour lancer le débat. Apparemment,
> les réactions n'ont pas trainé et prouvent la réactivité de la communauté.
> Il faut réflechir ensemble à des spécifications qui permettraient de
> vérouiller un peu plus la topologie et le modèle de données, et qui
> permettraient d'augmenter la quantité de métadonnées, sans pour autant
> contraindre le contributeur.
>
> Et c'est possible, selon moi.
>
> Pour les métadonnées, il faut au moins forcer le renseignement de la (ou
> des) source(s). Si on n'a pas d'informations sur la précision
> géométrique de la source, il faut pouvoir donner à ceux qui souhaitent
> en savoir plus les moyens de retrouver cette information. En indiquant
> qu'on a utilisé un GPS standard, on indique déjà quelque chose
> (précision de +/- 10 m voire pire en milieu urbain dense ou avec couvert
> végétal). En indiquant qu'on s'est basé sur la photo aérienne de Yahoo,
> en tel endroit, on dit aussi des choses, sans forcément connaître
> soi-même la précision altimétrique de l'ortho en cet endroit (mais
> quelqu'un qui veut retrouver l'info pour compléter le peut, et ce, sur
> une granulométrie plus large que le seul objet saisi). En indiquant
> qu'on a utilisé le cadastre, là, on ne donne aucune information de
> précision géométrique, car cette dernière est très hétérogène d'une zone
> à l'autre.
>
> Lorsqu'il y a plusieurs sources, ou lorsqu'on modifie un objet déjà
> produit avec une source A pour le préciser à l'aide d'une source B,
> alors intervient la notion très importante de généalogie de l'objet (un
> peu comme la traçabilité d'une barquette de côtes d'agneau). Cette
> notion doit être approfondie.
>
> On pourrait donc simplement demander le renseignement de la source de la
> contribution (donc cette information serait portée non plus par l'objet
> mais par l'historique de ses modifications) parmi une liste de valeurs
> FIXEE (GPS, french cadastre, aerial photography, local knowledge,
> other...).  Mais là, j'ouvre un autre débat: qui a le droit de fixer et
> d'étendre cette liste de valeurs? Comme dans Wikipédia, la notion des
> différents niveaux d'écriture se fait jour, d'une manière ou d'une
> autre. La validation de la saisie (ou de la modification) ne serait
> acquise que lorsque la source serait renseignée.
>
> D'autres informations, qui dépendent de la valeur précédemment rentrée
> et du lieux pourraient être affectées automatiquement (on sait que sur
> Toulouse, l'ortho a telle précision en EMQ, on sait que les droits
> d'utilisation du cadastre sont restreints, etc...).
>
> Je pense que les métadonnées doivent au maximum descendre au niveau le
> plus bas de granularité, quand cela est possible, et quand cela ne
> risque pas de faire fuir le contributeur.
>
> J'attire l'attention sur la notion de responsabilité d'un producteur de
> données, quelles qu'elles soient (critiques sur Allociné, article sur
> Moïse dans Wikipédia, container à verre dans OSM, article dans Rue89,
> etc...). En tant que contributeur citoyen, il n'est pas sensé écrire, ou
> produire, n'importe quoi. Son action peut avoir des conséquences
> immenses, et il est sensé le savoir, et l'assumer. Le Web 2.0 n'est pas
> qu'une fenêtre ouverte sur le monde sans garde corps, et OSM n'échappe
> pas à cette règle. Si on s'investit pour comprendre Potlatch, JOSM et
> les outils annexes, si on passe ses soirées et ses week end à
> représenter le monde autour de chez soi, ce n'est pas pour le faire par
> dessus la jambe, même si c'est un loisir. Il y a un principe de
> responsabilité auquel on ne peut pas échapper.
> Dans ce cadre, il est normal de qualifier l'information qu'on fournit,
> notamment ses sources, et de s'efforcer à tendre vers un certain niveau
> de qualité, qui qu'on soit, quel que soit son niveau, à partir du moment
> où on est Internaute 2.0
> OSM n'aurait pas le succès qu'il a si - en majorité - les contributeurs
> n'étaient pas dans cet état d'esprit. Les données seraient purement et
> simplement fantaisistes et donc inexploitables.
> Les contributeurs ont déjà cette notion de responsabilité. Leur demander
> une ou deux métadonnées supplémentaires ne ferait que renforcer ce
> sentiment, je ne pense pas qu'ils s'enfuiraient en courant, dans la
> mesure où le cadrage resterait raisonnable.
>
> Pour finir, les données non qualifiées n'ont que peu d'usages possibles.
> L'importance des métadonnées est encore mal perçue, mais même ce
> phénomène évolue assez vite.
>
> Merci à tous pour vos réactions.
>
>
je suis désolée pour ma réponse un peu cassante, mais je ne suis pas
convaincue par l'argumentation globale. Je suis pour une meilleure gestion
de la qualité mais j'ai un peu de mal a voir comment procéder d'une manière
raisonnable avec une communauté qui dans l'ensemble ne veut pas de
contraintes. Le récent débat sur la largeur des rues est vraiment un exemple
parfait de cette attitude. On a des gens qui ont de grandes idées sur
comment améliorer OSM, et au final, c'est une note dans la marge de
l'histoire de OSM.

Ma propre théorie sur la responsabilité des gens sur OSM est plutôt lié a la
pression sociale du projet. Tout le monde veut produire des données de
qualité car s'il y a des données de qualité médiocre, ça sera montré du
doigt ou vu par quelqu'un d'autre. Oui les gens ne sont pas sensés faire de
choses stupides en règle générale, mais ça n'a jamais empêché les gens de
faire cela. Après tout, chaque année, on peut se "régaler" avec les Darwin
Awards. Il y a autant de raisons de suivre les règles que de ne pas les
suivre. On pourrait parler du problème du vandalisme en prenant comme
exemple les griefers dans les jeux massivement multi-joueurs. Peut on dire
qu'ils font partie de la communauté ou pas? Je pense que ces personnes même
si leur action est nocive sont utiles pour un projet, car leur liberté
d'action permet de trouver généralement une solution a des problèmes qui ne
sont pas forcement évidents. C'est a cause d'un utilisateur anglais que la
liste de modération a été crée et que des idées apparaissent pour suivre
d'éventuels vandalismes. Ce sont généralement ces gens qui ont une grande
maîtrise des outils afin de provoquer le maximum de dégâts :) Il y a un
certain plaisir a gagner en sachant que tu sabotes une carte et que tu
bloques du monde.

L'argumentation concernant Wikipedia n'est pas nouveau et a fait débat il y
a quelques temps sur la mailing list principale. La thématique est doit on
empêcher les nouvelles personnes de contribuer sans quelqu'un regarde ce
qu'ils ont fait afin de s'assurer de la qualité de leur travail. La réponse
globalement a été que non on ne doit pas forcer ce genre de contraintes sur
les utilisateurs car ça réduirait le nombre de personnes qui
participeraient. Je pense qu'a mesure que la base de donnée va s'améliorer,
c'est un débat qui va revenir mais je ne suis pas convaincue de la nécessité
de source comme sur Wikipedia, car il est très difficile de vérifier si le
travail est bon même en ayant la source. La partie qui a été revue peut être
de bonne qualité mais il se peut que la suite ne soit pas très bon. On ne
peut pas forcer les gens a vérifier les résultats d'une autre personne. Je
le fais dans ma ville et les environs mais c'est parce que je le veux bien.
J'ai récemment corrigé un certain nombre de problèmes dans le monde pour le
coastline, mais je ne ferais pas ça en permanence. Ça prend du temps et ce
n'est pas forcement très excitant comme travail. Dans une société, excitant
ou pas, le travail doit être fait, mais tu rémunères les gens pour faire ce
travail. Dans le cadre d'un projet bénévole, il devient beaucoup plus dur de
faire cela a part être chanceux et d'avoir quelqu'un qui veut faire ce
travail.

Oui, utiliser les cartes Yahoo permet de déduire certaines informations sur
la précision. Maintenant, je ne sais pas ou chercher cette information et
ces informations doivent varier selon l'endroit et de la série de photos et
ce parfois de manière très subtile. Pour les puces GPS, tu montres toi même
que la qualité information est hautement contextuelle (cf mon précèdent post
sur le sujet). Doit on aussi inclure s'il a plu ou pas? Je comprends le
besoin de précision car ça permet de déterminer la qualité de l'information
(ou pas). De plus, cette notion de source est très fluctuante a mes yeux. Il
y a des gens capables de produire d'excellentes données et d'autres
personnes capables de produire des résultats très mauvais a partir de la
même source. Je pense maintenant produire de meilleures rues et routes sur
ma ville car je commence a comprendre comment le cadastre réagit après avoir
fait de nombreuses modifications et vérifier sur Yahoo si ça avait un sens.
Pour le cas d'une mesure physique (GPS), on se rend compte que même dans le
meilleur des cas, on peut passer au même endroit plusieurs fois et obtenir
des traces différentes. Ce ne sont pas des mesures déterministiques du fait
d'élément comme la position des satellites dans le ciel, la vitesse
angulaire, et d'autres éléments qui ne peuvent être facilement contrôlées.
J'ai au SOTM pose la question a des gens de TA sur comment ils qualifiaient
la précision de leur carte. On m'a répondu qu'il y avait des gens
spécialisés dans cela et que je n'avais pas a m'inquiéter de ce genre de
choses car c'était fait par des professionnels (sic). C'est le genre de
réponse qui me fait froid dans le dos, car ça ne veut rien dire. Dois je
estimer que tous les programmes venant de sociétés "pros" sont bons parce
que justement c'est fait par des professionnels?
Bref, mon intuition est que ces paramètres supplémentaires n'apportent pas
grand chose au final. Mais je peux me tromper dans mon evaluation. Je suis
loin d'avoir la science infuse surtout dans un domaine qui n'est pas le mien
originellement.

Maintenant, l'historique des données est un problème car actuellement il
n'est pas facilement possible de récupérer les données historiques sans tuer
la base de donnée. Ça implique donc une stratégie bien particulière pour
extraire ces données et surtout beaucoup de temps, sans parler que la base
de donnée évolue très rapidement. C'est un point qui a été noté
précédemment. De plus, je pense qu'au final ça n'a vraiment de sens que si
on se trouve dans une logique de comparaison avec une source établie. Or
nous n'avons pas de sources établies que nous pouvons utiliser. Chicken and
egg problem. Pour reprendre mon argument sur la source en elle même, la
tracabilité c'est bien a condition d'avoir des conditions déterministiques.
Doit on alors classer l'utilisateur Melaskia en fonction du temps car
l'historique montre qu'avec le temps, elle s'est amélioré (sur quel critère
d'ailleurs) dans l'édition des sources qu'elle a utilisé? Je pourrais bien
sur pousser le raisonnement a outrance mais ça ne servirait a rien.

Emilie Laffray
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr

Répondre à