Re: [Talk-de] seek (perl) in osm dateien

Frederik Ramm Wed, 28 Jul 2010 04:32:39 -0700

Hallo,

Jacques Nietsch wrote:

Jeder Algorithmus der mit Blöcken arbeitet ist fehlerbehaftet, da mit
gewisser Wahrscheinlichkeit eine Blockgrenze mitten in einen Tag fällt.

Du musst einfach nur Blocks lesen, die mindestens zweimal so gross wiedie groesste Zeile sind, und dann den den naechsten Zeilenwechsel in demBlock finden.

1: Eine Indexdatei erstellen, die die Positionen der Zeilenanfänge enthält.
Das kann man mit Perl oder f(lex) machen und sollte sehr schnell gehen.

Wir machen doch den ganzen Eiertanz nur, weil wir eben nicht die ganzeDatei durchlesen wollen. "Sollte sehr schnell gehen"... der folgendeCode, der *nichts* mit den Daten macht:


#!/usr/bin/perl

open(P, "planet.osm");
while(<P>)
{
   # nix
}
close(P)

braucht bereits eine gute halbe Stunde. Wenn man einfach nur die Stellefinden will, an der die erste Relation oder der erste Way auftauchen,dauert das mindestens 20 Minuten. Mit der binaeren Suche und seek() istdas in Sekunden erledigt.


Bye
Frederik

_______________________________________________
Talk-de mailing list
[email protected]
http://lists.openstreetmap.org/listinfo/talk-de

Re: [Talk-de] seek (perl) in osm dateien

Antwort per Email an