Le vendredi 12 juin 2009, Eric Sibert a écrit : > Emilie Laffray <emilie.laff...@gmail.com> a �crit : > > Je vais regarder d'un peu plus pres les pages webs. Je pense qu'il doit > > etre assez facile d'ecrire un scraper pour les pages webs s'il y a un > > moyen d'acceder a une liste. > > Je pense que le serveur ftp peut permettre de constituer une liste. > Pour la géodésie, à chaque site est associée une fiche en pdf (stocké > dans un zip/tar). Le nom du fichier pdf correspond au numéro du site. > Ensuite, deux voies: > - on arrive à extraire le contenu du pdf et on l'analyse (j'ai déjà > fait ce genre de chose sous windows avec xpdf je crois) pour extraire > tous les repères du site. > - on déduit l'adresse de la page web du site géodésique. On analyse la > page web. On suit les liens en milieu de page pour arriver à la page > web de chaque repère. On analyse cette dernière page. > > > Sinon, à regarder de nouveaux les fiches, j'ai vu quelques autres détails: > - les sites ont un nom (en plus de leur numéro). Ca serait bien de le > récupérer. > - les différents repères d'un site sont considérés comme des "Points > du site". Ils sont désignés par une lettre, un chiffre ou rien > (repères disparus). C'est différent du numéro du site. Idem si c'est > possible à récupérer. > - les numéros de point des différents repères d'un site ne sont ni > dans l'ordre, ni tous attribués. > Exemple : http://geodesie.ign.fr/fiche_geodesie.asp?num_site=7630701 > comporte dans l'ordre les points 2, 3, 1 5 et 7. > - les "Points d'un site" n'ont pas de nom mais une désignation. > "Chateau : Clocheton : Centre du renflement" > > Eric
Jeudi suite à mon mail j'avais commencé à travailler sur les fiches pdf. Résultat j'ai déjà téléchargé toutes les fiches (3Go). Et extrait les données depuis les pdf. J'ai (quasiment) un fichier cvs avec les données (5Mo). Je met ça à dispo dès que j'ai le temps de finir, en fait il me reste à bosser sur les départements d'outre mer. A+ Fred
signature.asc
Description: This is a digitally signed message part.
_______________________________________________ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr