Emilie Laffray <emilie.laff...@gmail.com> a �crit : > Je vais regarder d'un peu plus pres les pages webs. Je pense qu'il doit etre > assez facile d'ecrire un scraper pour les pages webs s'il y a un moyen > d'acceder a une liste.
Je pense que le serveur ftp peut permettre de constituer une liste. Pour la géodésie, à chaque site est associée une fiche en pdf (stocké dans un zip/tar). Le nom du fichier pdf correspond au numéro du site. Ensuite, deux voies: - on arrive à extraire le contenu du pdf et on l'analyse (j'ai déjà fait ce genre de chose sous windows avec xpdf je crois) pour extraire tous les repères du site. - on déduit l'adresse de la page web du site géodésique. On analyse la page web. On suit les liens en milieu de page pour arriver à la page web de chaque repère. On analyse cette dernière page. Sinon, à regarder de nouveaux les fiches, j'ai vu quelques autres détails: - les sites ont un nom (en plus de leur numéro). Ca serait bien de le récupérer. - les différents repères d'un site sont considérés comme des "Points du site". Ils sont désignés par une lettre, un chiffre ou rien (repères disparus). C'est différent du numéro du site. Idem si c'est possible à récupérer. - les numéros de point des différents repères d'un site ne sont ni dans l'ordre, ni tous attribués. Exemple : http://geodesie.ign.fr/fiche_geodesie.asp?num_site=7630701 comporte dans l'ordre les points 2, 3, 1 5 et 7. - les "Points d'un site" n'ont pas de nom mais une désignation. "Chateau : Clocheton : Centre du renflement" Eric _______________________________________________ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr