Il giorno mer 20 giu 2018 alle ore 10:57 Lidrie ha scritto: > Se due comuni contigui hanno una strada (sia la stessa fisica, o due diverse) > dedicate allo stesso personaggio, per me valgono due occorrenze.
per estrarre questa informazione in modo affidabile devi calcolare anche la lunghezza della strada, perché se la mappatura è stata imprecisa una way ti risulta in due comuni se un pezzo anche cortissimo attraversa il confine > non devo fare una fotografia totale di tutti i nomi presenti in Italia, ma > partendo da singoli campioni scelti vedere la distribuzione caso per caso abbiamo a disposizione l'estrazione dei nomi già divisi per Comune per il controllo dell'ortografia [1] sul server messo a disposizione da Wikimedia Italia, in quelle pagine appaiono solo i nomi che devono essere controllati, ma nel database ci sono tutti e posso aggiungere un modo per fare le tue ricerche e creare un file di testo con 3 colonne separate da tabulazioni, ad esempio: parola cercata<TAB>nome del Comune<TAB>nome della strada Penso che ci dovrò mettere dei limiti piuttosto bassi, tipo 50 righe di input e 10000 di output perché la mia tabella non è ottimizzata per le ricerche di testo, vediamo come si comporta. Quante parole devi cercare e quante volte e per quanto tempo? Cerchi solo parole intere? Cioè se cerchi "roma" non vuoi anche romagna, romano, ecc.? [1] https://osmit3.wmflabs.org/stradario/ -- Daniele Forsi _______________________________________________ Talk-it mailing list Talk-it@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-it