Le 21/07/2017 à 17:12, marc marc a écrit :
ne serrais-ce pas plus efficace que l'overpass api français (ou
n'importe quel autre) exporte un minute-diff filtré ?
Le 21. 07. 17 à 16:53, Christian Quest a écrit :
  > Pourquoi toujours mettre overpass dans la boucle ?

Parce que le filtre serrait plus économe en ressource s'il était situé
proche (au sens réseau) d'un serveur qui récupère déjà les diffs

Encore plus logique de remonter d'un cran et de prendre les diff à leur source... ils sont produits pour cela et les télécharger prend la même bande passante mais quasiment 0 ressource en CPU (les fichiers sont statiques).

Un hourly-diff mondial c'est quelques Mo, les plus gros font dans les 5 à 6Mo: http://planet.openstreetmap.org/replication/hour/000/042/

Car à nouveau télécharger les diffs mondiales pour après filtre n'en
garder que l'un ou l'autre consomme plus de ressource que de faire
l'inverse (filtrer en amont et ne télécharger que le résultat)

Pour filtrer, c'est de la ressource locale qu'on consomme et donc on assume avec ses propres ressources ses choix de filtrage.
Filtrer quelques Mo chaque heure c'est pas méchant.

Ceci dit un téléchargement d'un diff globale est de toute façon déjà un
gain gigantesque par rapport à un query global
et il a l'avantage d'être réalisable à court terme (créer un overpass
api local, un script d'appel au filtre, changer l'url de l'api dans le
mécanisme de syncro de la db), le reste restant inchangé.
Le mieux est peut-être de commencer par là.
La localisation du filtre est quasi un détail.

Oui et non, enfin ça dépend si on parle bien de la même chose...

Requêter overpass pour n'avoir que certaines infos, c'est une forme de filtre mais on profite de ressources externes, partagées et donc à un moment ça sature...

Récupérer les diff et les filtrer soit même ça bouffe un peu plus de bande passante, mais quasiment pas de CPU autre que le nôtre... c'est plus scalable.


  > Les diff sont produits en daily, hourly et minute au niveau osm.org
  > (planet)
  > On a des diff dispo en daily sur les extraits régionaux proposés par
  > geofabrik
En passant, lors du bug osmose, j'ai appris que osm-fr utilisait ceux de
geofabrik au moins en partie.
il y a une raison à utiliser geofabrik au lieu du planet pour osm-fr ?

C'est pour osmose que ça tourne comme ça, car les analyses osmose sont faites sur un cluster de backends qui traitent une zone à la fois et les extraits de geofabrik sont parfaits pour ça. Chaque backend récupère par exemple un pays, applique les règles dessus (qui peuvent du coup être spécifiques au pays). Le découpage est déjà fait par géofabrik et il n'est fait qu'une fois. La bande passante pour récupérer les données par extraits est similaire à celle pour récupérer le planet qu'on redécouperait... on n'y gagnerait rien au final, bilan quasi nul.

Pour les serveurs de tuiles, ce sont les diff monde qui sont récupérés toutes les 5mn, car leur couverture est mondiale. Ce sont des flux/usages totalement différents.

--
Christian Quest - OpenStreetMap France


_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr
  • R... François Lacombe
    • ... marc marc
    • ... François Lacombe
    • ... Christian Quest
    • ... François Lacombe
    • ... marc marc
    • ... François Lacombe
    • ... marc marc
    • ... Christian Quest
    • ... marc marc
    • ... Christian Quest
    • ... marc marc
    • ... Christian Quest
    • ... François Lacombe
    • ... marc marc
    • ... HELFER Denis (SNCF RESEAU / SIEGE SNCF RESEAU / DT GE APPUI PERFORMANCE)
  • R... Rodolphe Pelloux-Prayer
  • R... marc marc
    • ... Rodolphe Pelloux-Prayer
    • ... Stéphane Péneau
    • ... Florian LAINEZ

Répondre à