Moinsen Stefan,
mit Optimierungen am MySQL-Server kann man schon noch ein wenig
rausholen, insofern man die Möglichkeit dazu hat.
Trotzdem klingt natürlich ein externer Indexer viel verlockender und ist
sehr wahrscheinlich auch bedeutend schneller. Wie gesagt, können wir
hier nicht so wirklich umschwenken aber für die Zukunft interessiert
mich schon noch folgendes. Kann denn die kesearch mittlerweile auch
externe Dokumente wie pdf, doc & xls indizieren? Wird der Index aus den
Inhalten direkt aus der DB erzeugt und setzt also voraus, dass die
Inhalte mittels bspw. Crawler bereits indiziert in der DB liegen? Und
was würde eine PREMUIM-Version von kesearch im kommerziellen Einsatz kosten?
Gruß, Stephan
Am 18.07.2011 14:02, schrieb Stefan Frömken:
Mahlzeit Stephan,
alles was Dir Speed bringen würde hast Du uns verboten in unsere Antwort
mit aufzunehmen. Also: Nein.
Mit 150.000 Datensätzen wird der Index für index_word entsprechend groß.
Problem bei MySQL: Der FULLTEXT-Index ist langsam und selbst wenn Du auf
MATCH AGAINST umsteigen würdest, so kannst Du dann nur noch nach "...%"
suchen.
Wir entwickeln ke_search und können aus Erfahrung sagen, dass MySQL ab
einer bestimmten Datenmenge Dank seinem FULLTEXT-Index einen
Flaschenhals aufweist, den man dann gerne auf externe Indexer auslagert.
Wir verwenden z.B. Sphinx für unsere PREMUIM-Version von ke_search. Das
ist ne Sache von knapp 10-15 Minuten diesen Sphinx-Index auf Deinem
Server zu installieren.
Ich könnte mir vorstellen, dass man noch knapp 20% mehr Speed rausholen
könnte, wenn man indexed_search auf Basis von Prepared-Statements
umbauen würde. <ein Haufen Arbeit und not tested!!!>
Stefan
Am 18.07.2011 13:41, schrieb Stephan Vidar:
Hallo zusammen,
in einem Intranet haben wir die Indexed Search im Einsatz.
Mittels Crawler werden auch externe Dokumente (hauptsächlich PDF)
indiziert. Die Menge an Dateien (ca. 800) schlägt natürlich nun auch mit
entsprechend großen Index-Tabellen zu Buche (z.B. index_rel: 500.000
Einträge; index_word: 150.000 Einträge) was die Suche nun mit
Antwortzeiten von ca. 10 Sekunden und mehr gewaltig ausbremst.
Der Root-Server läuft unter Linux ist dediziert und eigentlich ganz
ordentlich ausgestattet. Die Suche nach Teilstrings via LIKE '%...%' ist
außerordentlich wichtig und kann nicht abgeschaltet werden. Auch sind
andere Lösungen wie Solr, mnoGoSearch oder kesearch innerhalb dieses
Projektes derzeit nicht gewünscht und greifbar. Sieht hier jemand
trotzdem Möglichkeiten, das Ganze zumindest ein wenig zu optimieren?
Gruß, Stephan
_______________________________________________
TYPO3-german mailing list
TYPO3-german@lists.typo3.org
http://lists.typo3.org/cgi-bin/mailman/listinfo/typo3-german