johannes weber|medienlounge schrieb:
Hallo Forum,
ich versuche eine funktionierende Konfiguration für typo3 mit crawler
und indexed search zu finden.
mein Problem:
1. Indexed search
erster Test - disableFrontendIndexing und useCrawlerForExternalFiles
nicht angehakt.
Ergebnis: Über Web -> Info werden Seiten indiziert und auch PDF
Dokumente gefunden.
Dort kann ich mit Klick auf den Dokumentennamen auch die Keywords sehen.
Daher sollten die pdftotext usw Tools richtig funktionieren und die
Dateien richtig parsen.
Problem ist nun das die Suche keines der Keywords ausgibt.
Konfiguration im Template:
# Konfiguration der Indizierten Suche
config.index_enable = 1
config.index_externals = 1
Frage ist nun - muß ich noch bezügl Sprache oder sonstigem konfigurieren?
der nächste Versuch:
2. Crawler.
Hier gibt es einige Anleitungen - vieles sehr veraltert und daher
dieser neue Thread.
Änderungen in der Indexed Search:
disableFrontendIndexing und useCrawlerForExternalFiles jetzt angehakt
Crawler installiert und konfiguriert.
Dann im Backend einen User _cli_crawler anlegen - war früher auch mal
_cli_lowlevel.
Wenn das funktioniert kann man über ssh auf dem Server das Skript
php /pfad/zum/www/typo3/cli_dispatch.phpsh crawler
bzw gibt zumindest keine Fehlermeldungen aus.
Den angeblichen Konfigurationsrecord kann ich zwar über Typo3 anlegen,
aber so richtig funktioniert er nicht.
Daher mein Workaround (empfohlen über wiki.typo3.)
tx_crawler.crawlerCfg.paramSets.test =
tx_crawler.crawlerCfg.paramSets.test {
cHash = 1
procInstrFilter = tx_indexedsearch_reindex,
tx_indexedsearch_crawler,tx_cachemgm_recache
baseUrl = [url]http://192.168.1.99/crawler/[/url]
}
#set up a crawl for users who have group id of 1
tx_crawler.crawlerCfg.paramSets.grp1 <
tx_crawler.crawlerCfg.paramSets.test
tx_crawler.crawlerCfg.paramSets.grp1{
userGroups = 1
}
Hiermit kann ich eine der beiden Konfigurationen auswählen, ich
bekomme dann auch über
Web ->Info den Punkt Crawler, kann mich hier durchklicken und bekomme
eine Liste mit den zu crawlenden Seiten, und wenn ich dort bei jeder
manuell auf das "refresh icon" klicke, dann "tut sich" da etwas.
Nur von erfolg ist die Suche auch nicht.
Bin mittlerweile etwas ratlos und hoffe auf Tipps.
noch etwas, der Crawler in der Version 3.0.5 hat meines Erachtens nach
auch einen Bug:
[url]http://bugs.typo3.org/view.php?id=13703[/url]
Mit dem angegebenen Workaround scheint es zu funktionieren.
Nur generell noch keine Vernünftige Such bzw Ergebnisausgabe.
Letzte Anmerkung:
habe zur Ausgabe auf einer Seite den Seiteninhalt Search form
angelegt, Ziel die selbe Seite.
Sollte ja auch richtig sein, nachdem er ja manches findet, aber
einfach nicht Inhalte von pdf Dokumenten ausgeben will.
_______________________________________________
TYPO3-german mailing list
TYPO3-german@lists.typo3.org
http://lists.typo3.org/cgi-bin/mailman/listinfo/typo3-german
Hallo,
so habe das mal an laufen gebracht.
Im extension-manager > Indexsearch "Doppelklick" haken entfernt. Use
"crawler" extension to index ex....
Ich setzte Debian Lenny ein, auf der Seite
http://www.debian.de/distrib/packages konnte ich die Packete finden, die
ich für Debain benötige.
apt-get install xpdf-reader
apt-get install emacspeak
apt-get install xpdf-utils
apt-get install xpdf-reader
apt-get install gworkspace-apps-wrappers
apt-get install xpdf-reader
ich gehe mal davon aus, dass evtl. nicht alle Packete installiert sind.
http://www.paeps.technik.uni-landau.de
Suchwort "rasmus"
Wenn es Dir etwas bringt, richte ich Dir einen Zugang auf dem Typo3
Server ein.
--
Mit freundlichen Grüssen
Jochen Graf
Universität Koblenz-Landau / Campus Landau
Arbeitstelle Multimedia/Technik-Administration
Thomas-Nast-Str. 44
76829 Landau
mail: g...@uni-landau.de
fon: 06341-990-224
http://www.uni-koblenz-landau.de/landau
http://www.paeps.uni-landau.de
http://www.paeps.technik.uni-landau.de/
http://www.wulv.uni-landau.de
http://www.ueberlebenmitklips.uni-landau.de/
_______________________________________________
TYPO3-german mailing list
TYPO3-german@lists.typo3.org
http://lists.typo3.org/cgi-bin/mailman/listinfo/typo3-german