Buongiorno :) A proposito di controlli di qualità, sto mettendo a punto una nuova procedura che risolva qualche problema di quella attuale, il principale è che di solito non è possibile controllare una città intera perché l'elenco dei nomi è diviso tra più persone e questo l'ho risolto (però qualche strada appare in due Comuni anche se è tutta compresa in uno solo, devo verificare se è sbagliata la mia query o se è danneggiato il confine).
Nella nuova procedura ho caricato solo la Toscana (aggiornata al 2 marzo perché è l'ultimo estratto disponibile su http://download.gfoss.it/osm/osm/regioni/) e qui non si possono segnalare le parole come giuste o sbagliate, però si può continuare a farlo nell'altra perché questa usa il suo database per controllare l'ortografia: http://www.forsi.it/osm/spellcheck/highway/boundary/ la ricerca trova anche parti di nomi e i pigri possono inserire _ per ottenere l'elenco completo (questo probabilmente lo limiterò a qualche decina di risultati) Segue un po' di spiegazione e di numeretti. Al momento sono caricati 17661 nomi distinti di strade che si trovano in 289 Comuni toscani e che usano 11394 parole distinte di cui 4039 sono sconosciute alla nuova procedura, che si riducono a 2456 usando i dati della vecchia procedura; su queste parole sconosciute potrei provare l'estrazione di nomi e cognomi da dbpedia di cui si parlava tempo fa; per chi le vuol guardare per farsi un'idea, le 2456 parole sono qui: www.forsi.it/osm/spellcheck/highway/unknown-words.txt Nell'elenco dei nomi (limitato a un massimo di 2000 nomi), la prima colonna ha il collegamento per Remote Control che carica tutte le way interessate, la seconda mostra il nome evidenziando le parole sconosciute, la terza spiega quali sono i problemi individuati, cioè: Ortografia da controllare. Sono le parole sconosciute al correttore ortografico e all'altra procedura (quella divisa per utente); ci sono tanti falsi positivi, specialmente sui cognomi. Punti, virgole o altra punteggiatura non ammessa. Si riferisce principalmente alle abbreviazioni, ma anche a punti interrogativi e altri caratteri diversi da numeri e lettere. Parola singola. Il nome è composto da una parola sola. Non inizia con Via, Piazza, ecc. La prima parola non è una di quelle conosciute (ne ho aggiunte 5 e ora siamo a 147, non vorrei aggiungerne altre se non si riferiscono a strade importanti) Errore maiuscole/minuscole. Questo indica i soliti errori della pagina di Groppo perché uso la stessa espressione regolare. Spazi iniziali. Spazi finali. Doppi spazi. Il nome contiene spazi non significativi. -- Daniele Forsi _______________________________________________ Talk-it mailing list Talk-it@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-it