Le 25/11/2020 à 10:32, Rpnpif via Talk-fr a écrit :
Le 24/11/2020 à 20:37, Jean-Marc Liotier a écrit :
On 11/24/20 6:22 PM, Frédéric Rodrigo wrote:
Ce n'est pas aussi facile que ça pour faire une emprise mondiale. Il
est nécessaire d'écrire des adaptateurs pour chaque langue ou pays
pour traiter les particularités.
Je découvre donc:
- La phonemicization:
https://github.com/addok/addok-fr/blob/master/addok_fr/utils.py
- Les particularités Françaises:
https://github.com/addok/addok-france/blob/master/addok_france/utils.py
On comprend vite qu'il sera compliqué d'accepter une recherche sans
connaître dans quel zone administrative et linguistique elle s'inscrit...
La « phonemicization » ressemble à une sorte de phonétisation
simplifiée, non ?
Pourquoi n'avoir pas pris de bibliothèques de phonétisation qui sont
beaucoup plus complètes et plus adaptables à la zone de recherche,
comme celles des moteurs de recherche ?
Trop lourdes ?
Oui, librairie souvent lourdes et souvent très anglophones. Le but n'est
pas non plus d'obtenir une traduction phonétique, mais une
simplification pour ajouter du flou à la recherche.
On floute à l'aide de quelques regexp très rapides, on cherche dans
l'index, puis on trie en comparant les libellés non floutés.
--
Christian Quest - OpenStreetMap France
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr