Il giorno mer 20 giu 2018 alle ore 10:57 Lidrie ha scritto:

>  Se due comuni contigui hanno una strada (sia la stessa fisica, o due diverse)
> dedicate allo stesso personaggio, per me valgono due occorrenze.

per estrarre questa informazione in modo affidabile devi calcolare
anche la lunghezza della strada, perché se la mappatura è stata
imprecisa una way ti risulta in due comuni se un pezzo anche
cortissimo attraversa il confine

> non devo fare una fotografia totale di tutti i nomi presenti in Italia, ma
> partendo da singoli campioni scelti vedere la distribuzione caso per caso

abbiamo a disposizione l'estrazione dei nomi già divisi per Comune per
il controllo dell'ortografia [1] sul server messo a disposizione da
Wikimedia Italia, in quelle pagine appaiono solo i nomi che devono
essere controllati, ma nel database ci sono tutti e posso aggiungere
un modo per fare le tue ricerche e creare un file di testo con 3
colonne separate da tabulazioni, ad esempio: parola cercata<TAB>nome
del Comune<TAB>nome della strada

Penso che ci dovrò mettere dei limiti piuttosto bassi, tipo 50 righe
di input e 10000 di output perché la mia tabella non è ottimizzata per
le ricerche di testo, vediamo come si comporta.
Quante parole devi cercare e quante volte e per quanto tempo? Cerchi
solo parole intere? Cioè se cerchi "roma" non vuoi anche romagna,
romano, ecc.?

[1] https://osmit3.wmflabs.org/stradario/
--
Daniele Forsi

_______________________________________________
Talk-it mailing list
Talk-it@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-it

Rispondere a