Emilie Laffray <emilie.laff...@gmail.com> a �crit :

> Je vais regarder d'un peu plus pres les pages webs. Je pense qu'il doit etre
> assez facile d'ecrire un scraper pour les pages webs s'il y a un moyen
> d'acceder a une liste.

Je pense que le serveur ftp peut permettre de constituer une liste.  
Pour la géodésie, à chaque site est associée une fiche en pdf (stocké  
dans un zip/tar). Le nom du fichier pdf correspond au numéro du site.  
Ensuite, deux voies:
- on arrive à extraire le contenu du pdf et on l'analyse (j'ai déjà  
fait ce genre de chose sous windows avec xpdf je crois) pour extraire  
tous les repères du site.
- on déduit l'adresse de la page web du site géodésique. On analyse la  
page web. On suit les liens en milieu de page pour arriver à la page  
web de chaque repère. On analyse cette dernière page.


Sinon, à regarder de nouveaux les fiches, j'ai vu quelques autres détails:
- les sites ont un nom (en plus de leur numéro). Ca serait bien de le  
récupérer.
- les différents repères d'un site sont considérés comme des "Points  
du site". Ils sont désignés par une lettre, un chiffre ou rien  
(repères disparus). C'est différent du numéro du site. Idem si c'est  
possible à récupérer.
- les numéros de point des différents repères d'un site ne sont ni  
dans l'ordre, ni tous attribués.
Exemple : http://geodesie.ign.fr/fiche_geodesie.asp?num_site=7630701
comporte dans l'ordre les points 2, 3, 1 5 et 7.
- les "Points d'un site" n'ont pas de nom mais une désignation.
"Chateau : Clocheton : Centre du renflement"

Eric


_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr

Répondre à