Ciao Simone (F.), ti ho mandato a questa pull request: https://github.com/simone-f/wikipedia-tags-in-osm/pull/1
Che aggiunge un sistema di inferenza delle coordinate dalle voci di Wikipedia (basato su una analisi dell'abstract). Questo poi altro non è che "le cose su cui [Cristian] sta lavorando" che Maurizio diceva all'inizio di questo thread e che ho presentato a State of the Map [0]. Il risultato è che c'è qualche icona JOSM in più (nel momento in cui scrivo 571 in più, ma sto generando il file), si veda un esempio qui: http://img18.imageshack.us/img18/3734/igzv.png Gli articoli da scansionare sono questi: * articles_to_scan.txt 6.0 MB [1] questo file si genera lanciando lo script con l'opzione "-c" ovvero "--show_link_to_wikipedia_coordinates" e questi sono invece quelli con le coordinate ricavate: * nuts4nuts_it_coords.txt 41 KB [2] questo file si può generare anche separatamente lanciando: python nuts4nuts_infer.py per altro lo script è pure interrompibile quindi si possono generare le coordinate "un po' alla volta"[*]. Ovviamente ci mette un bel po' a ricavarele coordinate perché deve chiamare due servizi esterni: http://nuts4nutsrecon.spaziodati.eu/ e poi http://www.geonames.org/export/web-services.html Una miglioria sarebbe quella di fare restituire direttamente a http://nuts4nutsrecon.spaziodati.eu/ anche le coordinate (e non solo il nome del comune) in modo da evitare la seconda chiamata a geonames. Ciao, C [0] http://www.slideshare.net/CristianCantoro [1] https://mega.co.nz/#!LckgTIjC!LGBqF0t6oHxq441yM3uD6RphN8wwpyVgSh1Dw0xo8Nk [2] https://mega.co.nz/#!GIEQTZQb!fz9sCC9xlzkZZX5hI7qkAFQCZxUrotWaA1MipRp4zQw [*] quando si interrompe lo script (con Ctrl+C) tira un errore perché non trova un file temporaneo, non è un grosso problema, ma lo trovo fastidioso. Se qualcuno è esperto del modulo multiprocessing di python <docs.python.org/2/library/multiprocessing.html> mi faccia un fischio _______________________________________________ Talk-it mailing list Talk-it@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-it