Le mardi 24 février 2009, Etienne Chové a écrit :
> Marc SIBERT a écrit :
> > En parlant de dictionnaire, pouvez-vous le diffuser ce fameux
> > dictionnaire afin que je regarde s'il est possible de l'intégrer dans MS
> > BOT ; Envoyez-le à mon adresse personnelle par exemple ou mettez-le en
> > ligne pourquoi pas.
>
> Je mettrait ça en ligne demain. Cependant je suis contre l'intégration
> dans MS BOT. Chaque modification étant souvent unique et devant être
> vérifié avant de la faire. Sinon je les aurait faites en automatique.
>
> Pour information, les dictionnaires originaux sont les dictionnaires de
> Wiktionnary et Wikipedia et de aspell. On y rajoute un dictionnaire
> perso. Tout mot d'un name absent de ces dictionnaires lève une erreur.
> Ces mots sont rentrés à la main dans le dictionnaire perso ou dans le
> dictionnaire de corrections s'il sont faux (il en reste 14000 à trier)
> ou automatiquement s'il s'agit de problèmes d'accentuation ou de lettre
> doublé.
Il doit être possible d'aller encore plus loin, mais il faut faire très 
attention. J'avais testé l'utilisation de soudex et soudex2 pour ça. Mais la 
typographie la plus courtante n'est pas forcement la bonne, ou deux 
typographies prochent peuvent exister toutes les deux.

http://f.rodrigo.free.fr/tmp/osm-check/typo-soundex-name.php.html
http://f.rodrigo.free.fr/tmp/osm-check/typo-soundex2-name.php.html
(attention pages non régénères depuis longtemps)
Les sources sont dipos sur la page d'accueil.

Fred

Attachment: signature.asc
Description: This is a digitally signed message part.

_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr

Répondre à