Le 26 février 2010 16:07, Guillaume Audirac <guillaume.audi...@gmail.com> a écrit :
> Ouahou ! Et ça inclut aussi la correction du bug sur les communes avec > article placé postérieurement ? > Exemple dans la Manche: > DEZERT (LE) > PERRON (LE) > etc... > > Car ces communes là n'étaient pas extraites auparavant. > Bon j'ai essayé d'améliorer les choses en modifiant le script "rcc-list.sh". Voici ce que ça donne: Avant (extrait du fichier 050-liste.csv pour la Manche): DEZERT,LE,50620,'KK161' PERRON,LE,50160,'KK398' LA LANDE D'AIROU,50800,KL262,VECT [...] Après: DEZERT (LE),50620,KK161,VECT PERRON (LE),50160,KK398,VECT LA LANDE D'AIROU,50800,KL262,VECT [...] Il y a 28 communes dans ce format (via le site du cadastre) dans la Manche. Bien sûr, le patch marche aussi avec les communes sans article entre parenthèses ;-) Le seul problème restant concerne les apostrophes (39 en ascii). J'ai joué du echo -e "\039" combiné avec sed mais sans succès. Ça me semble être le seul bug restant. J'ai essayé un autre département en lançant un diff sur les fichiers csv, tout à l'air bon. Voici le script "rcc-list.sh" modifié: ====================== # 033, 020, ... sur 3 chiffres departement=$1 curl -c tmp/cookies-1 "http://www.cadastre.gouv.fr/scpc/rechercherPlan.do" > tmp/page-1.html curl -b tmp/cookies-1 -c tmp/cookies-2 " http://www.cadastre.gouv.fr/scpc/listerCommune.do?codeDepartement=${departement}&libelle=&keepVolatileSession=&offset=5000" > tmp/page-2.html [ -f "${departement}-liste.csv" ] && mv "${departement}-liste.csv" "${departement}-liste-$$.csv" cat tmp/page-2.html | \ sed "s/<table/\n<table/g" | grep 'class="resultat"' | sed 's/.*<strong>\(.*\) <\/strong>.*ajoutArticle\(.*\)title="Ajouter.*/\1\2/' | \ sed 's/ *)(/,/g' | sed 's/ *(\([0-9][0-9][0-9][0-9][0-9]\)/,\1/' | cut -d, -f1,2,3,4 | sed "s/'//g" > ${departement}-liste.csv ====================== Cordialement, -- Guillaume
_______________________________________________ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr