Le 26 février 2010 16:07, Guillaume Audirac <guillaume.audi...@gmail.com> a
écrit :

> Ouahou ! Et ça inclut aussi la correction du bug sur les communes avec
> article placé postérieurement ?
> Exemple dans la Manche:
> DEZERT (LE)
> PERRON (LE)
> etc...
>
> Car ces communes là n'étaient pas extraites auparavant.
>

Bon j'ai essayé d'améliorer les choses en modifiant le script "rcc-list.sh".
Voici ce que ça donne:
Avant (extrait du fichier 050-liste.csv pour la Manche):
DEZERT,LE,50620,'KK161'
PERRON,LE,50160,'KK398'
LA LANDE D&#039AIROU,50800,KL262,VECT
[...]
Après:
DEZERT (LE),50620,KK161,VECT
PERRON (LE),50160,KK398,VECT
LA LANDE D&#039;AIROU,50800,KL262,VECT
[...]

Il y a 28 communes dans ce format (via le site du cadastre) dans la Manche.
Bien sûr, le patch marche aussi avec les communes sans article entre
parenthèses ;-)
Le seul problème restant concerne les apostrophes (39 en ascii). J'ai joué
du echo -e "\039" combiné avec sed mais sans succès. Ça me semble être le
seul bug restant.

J'ai essayé un autre département en lançant un diff sur les fichiers csv,
tout à l'air bon.
Voici le script "rcc-list.sh" modifié:

======================
# 033, 020, ... sur 3 chiffres
departement=$1

curl -c tmp/cookies-1 "http://www.cadastre.gouv.fr/scpc/rechercherPlan.do"; >
tmp/page-1.html
curl -b tmp/cookies-1 -c tmp/cookies-2  "
http://www.cadastre.gouv.fr/scpc/listerCommune.do?codeDepartement=${departement}&libelle=&keepVolatileSession=&offset=5000";
> tmp/page-2.html

[ -f "${departement}-liste.csv" ] && mv "${departement}-liste.csv"
"${departement}-liste-$$.csv"

cat tmp/page-2.html | \
sed "s/<table/\n<table/g" | grep 'class="resultat"' | sed
's/.*<strong>\(.*\) <\/strong>.*ajoutArticle\(.*\)title="Ajouter.*/\1\2/' |
\
sed 's/ *)(/,/g' | sed 's/ *(\([0-9][0-9][0-9][0-9][0-9]\)/,\1/' | cut -d,
-f1,2,3,4 | sed "s/'//g" > ${departement}-liste.csv
======================

Cordialement,
-- 
Guillaume
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr

Répondre à