Le mardi 24 février 2009, Etienne Chové a écrit : > Marc SIBERT a écrit : > > En parlant de dictionnaire, pouvez-vous le diffuser ce fameux > > dictionnaire afin que je regarde s'il est possible de l'intégrer dans MS > > BOT ; Envoyez-le à mon adresse personnelle par exemple ou mettez-le en > > ligne pourquoi pas. > > Je mettrait ça en ligne demain. Cependant je suis contre l'intégration > dans MS BOT. Chaque modification étant souvent unique et devant être > vérifié avant de la faire. Sinon je les aurait faites en automatique. > > Pour information, les dictionnaires originaux sont les dictionnaires de > Wiktionnary et Wikipedia et de aspell. On y rajoute un dictionnaire > perso. Tout mot d'un name absent de ces dictionnaires lève une erreur. > Ces mots sont rentrés à la main dans le dictionnaire perso ou dans le > dictionnaire de corrections s'il sont faux (il en reste 14000 à trier) > ou automatiquement s'il s'agit de problèmes d'accentuation ou de lettre > doublé. Il doit être possible d'aller encore plus loin, mais il faut faire très attention. J'avais testé l'utilisation de soudex et soudex2 pour ça. Mais la typographie la plus courtante n'est pas forcement la bonne, ou deux typographies prochent peuvent exister toutes les deux.
http://f.rodrigo.free.fr/tmp/osm-check/typo-soundex-name.php.html http://f.rodrigo.free.fr/tmp/osm-check/typo-soundex2-name.php.html (attention pages non régénères depuis longtemps) Les sources sont dipos sur la page d'accueil. Fred
signature.asc
Description: This is a digitally signed message part.
_______________________________________________ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr