Il 09/03/2013 12:58, Daniele Forsi ha scritto:
Buongiorno :)

A proposito di controlli di qualità, sto mettendo a punto una nuova
procedura che risolva qualche problema di quella attuale, il
principale è che di solito non è possibile controllare una città
intera perché l'elenco dei nomi è diviso tra più persone e questo l'ho
risolto (però qualche strada appare in due Comuni anche se è tutta
compresa in uno solo, devo verificare se è sbagliata la mia query o se
è danneggiato il confine).

Nella nuova procedura ho caricato solo la Toscana (aggiornata al 2
marzo perché è l'ultimo estratto disponibile su
http://download.gfoss.it/osm/osm/regioni/) e qui non si possono
segnalare le parole come giuste o sbagliate, però si può continuare a
farlo nell'altra perché questa usa il suo database per controllare
l'ortografia:
http://www.forsi.it/osm/spellcheck/highway/boundary/
ok
la ricerca trova anche parti di nomi e i pigri possono inserire _ per
ottenere l'elenco completo (questo probabilmente lo limiterò a qualche
decina di risultati)

Segue un po' di spiegazione e di numeretti.

Al momento sono caricati 17661 nomi distinti di strade che si trovano
in 289 Comuni toscani e che usano 11394 parole distinte di cui 4039
sono sconosciute alla nuova procedura, che si riducono a 2456 usando i
dati della vecchia procedura; su queste parole sconosciute potrei
provare l'estrazione di nomi e cognomi da dbpedia di cui si parlava
tempo fa; per chi le vuol guardare per farsi un'idea, le 2456 parole
sono qui: www.forsi.it/osm/spellcheck/highway/unknown-words.txt
Not found

Nell'elenco dei nomi (limitato a un massimo di 2000 nomi), la prima
colonna ha il collegamento per Remote Control che carica tutte le way
interessate,
la seconda mostra il nome evidenziando le parole sconosciute,
la terza spiega quali sono i problemi individuati, cioè:

Ortografia da controllare.
Sono le parole sconosciute al correttore ortografico e all'altra
procedura (quella divisa per utente); ci sono tanti falsi positivi,
specialmente sui cognomi.

Punti, virgole o altra punteggiatura non ammessa.
Si riferisce principalmente alle abbreviazioni, ma anche a punti
interrogativi e altri caratteri diversi da numeri e lettere.

Parola singola.
Il nome è composto da una parola sola.

Non inizia con Via, Piazza, ecc.
La prima parola non è una di quelle conosciute (ne ho aggiunte 5 e ora
siamo a 147, non vorrei aggiungerne altre se non si riferiscono a
strade importanti)

Errore maiuscole/minuscole.
Questo indica i soliti errori della pagina di Groppo perché uso la
stessa espressione regolare.

Spazi iniziali. Spazi finali. Doppi spazi.
Il nome contiene spazi non significativi.



_______________________________________________
Talk-it mailing list
Talk-it@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-it

Rispondere a