Hallo,

ich habe nun den Crawler zum laufen gebracht.

Debian 5.0.4
mysql  Ver 14.12
PHP 5.2.6-1+lenny6
Typo3 4.2.3


macina_searchbox  2.2.0
crawler  2.1.0
Indexed_search  2.12.0

PHP auf der Kommandozeile
zum Aufruf von PHP Scripte musste ich  das Packet  php5-cli installieren.

habe einen backend user angelegt
_cli_lowlevel

Dann im Listenmodul "auf der RootSeite"

eine neue Indexierungseinstellungen angelegt.
http://www.paeps.technik.uni-landau.de/fileadmin/Indexierungseinstellungen.JPG

Im Setup

config {
index_enable = 1
index_externals = 1
}

###########
plugin.tx_indexedsearch {
#### Standard-CSS-Styles löschen
 _CSS_DEFAULT_STYLE >
#### Anzahl der ausgegebenen Suchergebnisse auf einer Seite
 _DEFAULT_PI_VARS.results = 10
#### Suchworte kennzeichnen
 forwardSearchWordsInResultLink = 1
##############################
 blind {
#### settings: 0=aktiv (sichtbar), -1 inaktiv (nicht sichtbar)
#### Vergleichs-Typ (Ganzes Wort, Wortteil,etc)
   type=-1
#### type default option (und /oder)
   defOp=0
#### Bereich(e) der website
   sections=0
#### Suche in Medientypen (erweiterungen)
   media=1
#### Sortierung
   order=-1
#### Ansicht (Sektionshierachie / Liste)
   group=-1
#### Ansicht: Erweiterte Vorschau
   extResume = -1
#### Sprachwahlbox
   lang=-1
#### Aufsteigend absteigend
   desc=-1
#### Ergebnisse (Anzahl der Treffer pro Seite)
   results=0
 }
 show {
#### settings: 1=aktiv (sichtbar), 0 inaktiv (nicht sichtbar)
#### Zeige Kurzanleitung
   rules=0
#### Erstellungsinformationen des Hash
   parsetimes=1
#### Zweite Ebene im Bereichs-dropdown anzeigen
   L2sections=1
#### Erste ebene im Bereichs-dropdown anzeigen
   L1sections=1
#### Alle "nicht im menü" oder "im menü verstecken" in Suche einbeziehen
   LxALLtypes=0
#### Leeren des Suchfeldes nach der Suche
#### VORSICHT: Wenn eingeschaltet, funktioniert der Seitennavigator nicht mehr
   clearSearchBox = 0
#### Aktuelles Suchwort zu den bisherigen hinzufügen (Checkbox)
   clearSearchBox.enableSubSearchCheckBox=0
 }
 search {
#### Wird nur benötigt, wenn es mehr als eine Root-Page im Seitenbaum gibt.
#### ansonsten leer lassen.
   #rootPidList = 1
 }
}
#################




macina_searchbox

page.10.marks.SUCHE  < plugin.tx_macinasearchbox_pi1
page.10.marks.SUCHE {

#Seite mit dem Plugin index-search
  pidSearchpage = 43
  templateFile = fileadmin/template/searchbox/template.htm
}



IM TSCONFIG


// Nicht vergessen: nur gecachte Seiten können indexiert werden
// Daher config.no_cache = 0 im TypoScript-Setup
tx_crawler.crawlerCfg.paramSets {
 language = &L=[|_TABLE:pages_language_overlay;_FIELD:sys_language_uid]
 language.procInstrFilter = tx_indexedsearch_reindex, tx_cachemgm_recache
 language.baseUrl = http://www.paeps.technik.uni-landau.de/
}



Auf der Console als root

cd /www/web/www.paeps.technik.uni-landau.de/typo3

php -f cli_dispatch.phpsh crawler_im 1 -d 99 -proc tx_indexedsearch_reindex -n 1000 -o queue

[10-03 07:26:00] ?id=2
[10-03 07:26:00] ?id=44
[10-03 07:26:00] ?id=59
[10-03 07:26:00] ?id=55
[10-03 07:26:00] ?id=46
[10-03 07:26:00] ?id=69
[10-03 07:26:00] ?id=45
[10-03 07:26:00] ?id=52
[10-03 07:26:00] ?id=70
[10-03 07:26:00] ?id=57
[10-03 07:26:00] ?id=58
[10-03 07:26:00] ?id=56
[10-03 07:26:00] ?id=53
[10-03 07:26:00] ?id=65
[10-03 07:26:00] ?id=51
[10-03 07:26:00] ?id=61
[10-03 07:26:00] ?id=62
[10-03 07:26:00] ?id=63
[10-03 07:26:00] ?id=64
[10-03 07:26:00] ?id=66
[10-03 07:26:00] ?id=54
[10-03 07:26:00] ?id=67
[10-03 07:26:00] ?id=29
[10-03 07:26:00] ?id=30
[10-03 07:26:00] ?id=26
[10-03 07:26:00] ?id=4
[10-03 07:26:00] ?id=7
[10-03 07:26:00] ?id=8
[10-03 07:26:00] ?id=9
[10-03 07:26:00] ?id=11
[10-03 07:26:00] ?id=10
[10-03 07:26:00] ?id=25
[10-03 07:26:00] ?id=23
[10-03 07:26:00] ?id=24
[10-03 07:26:00] ?id=12
[10-03 07:26:00] ?id=21
[10-03 07:26:00] ?id=13
[10-03 07:26:00] ?id=22
[10-03 07:26:00] ?id=5
[10-03 07:26:00] ?id=6
[10-03 07:26:00] ?id=19
[10-03 07:26:00] ?id=20
[10-03 07:26:00] ?id=17
[10-03 07:26:00] ?id=14
[10-03 07:26:00] ?id=15
[10-03 07:26:00] ?id=16
[10-03 07:26:00] ?id=43
[10-03 07:26:00] ?id=31


Im Modul > WEB > unter Info "Indexsuche auswählen" bei Indexsuche Words an Content,
da sieht man auch, welche PDF Dateien Indiziert wurden.

http://www.paeps.technik.uni-landau.de/fileadmin/suche.JPG


Um auch das durchsuchen der PDF Dokumente zu ermöglichen, musste ich folgende Packete installieren.

apt-get install xpdf-reader
apt-get install emacspeak
apt-get install xpdf-utils
apt-get install gworkspace-apps-wrappers


Es werden allerdings nur verlinkte PDFS durchsucht, hatte mal den mocfilemanager installiert und PDF Dateien hochgeladen, da werden keine PDF Dateien durchsucht.

http://www.paeps.technik.uni-landau.de/index.php?id=67

.
Mein CSS

/* ##############################
** ### tx_indexedsearch #########
** ##############################
*/
tx-indexedsearch .tx-indexedsearch-searchbox INPUT.tx-indexedsearch-searchbox-button {width:100px;} tx-indexedsearch .tx-indexedsearch-searchbox INPUT.tx-indexedsearch-searchbox-sword {width:150px;} tx-indexedsearch .tx-indexedsearch-whatis P .tx-indexedsearch-sw {font-weight:bold; font-style:italic;} tx-indexedsearch .tx-indexedsearch-whatis {margin-top:10px; margin-bottom:5px;} tx-indexedsearch P.tx-indexedsearch-noresults {text-align:center; font-weight:bold;} tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-title {background:#eeeeee;} tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-title P {font-weight:bold;} tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-title P.tx-indexedsearch-percent {font-weight:normal;} tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-descr P {font-style:italic;} tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-descr P tx-indexedsearch-redMarkup {} tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-info {background:#E0E7F5;} tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-secHead {margin-top:20px; margin-bottom:5px;} tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-secHead H2 {color:#006699; margin-top:0px; margin-bottom:0px; background:transparent;} tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-secHead TABLE {background:#cccccc;} tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-secHead TD {vertical-align:middle;}
tx-indexedsearch .tx-indexedsearch-res .noResume {color :#666666;}
tx-indexedsearch-sw, .csc-sword, .tx-indexedsearch-redMarkup { font-family:monospace; font-style:normal; padding:0 0.3em 0 0.3em; background:#ffff88; border:1px #ccd solid;}



--
Mit freundlichen Grüssen

Jochen Graf

Universität Koblenz-Landau / Campus Landau
Arbeitstelle Multimedia/Technik-Administration

Thomas-Nast-Str. 44
76829 Landau

mail: [email protected]
fon: 06341-990-224

http://www.uni-koblenz-landau.de/landau

http://www.paeps.uni-landau.de
http://www.paeps.technik.uni-landau.de/


http://www.wulv.uni-landau.de
http://www.ueberlebenmitklips.uni-landau.de/


_______________________________________________
TYPO3-german mailing list
[email protected]
http://lists.typo3.org/cgi-bin/mailman/listinfo/typo3-german

Antwort per Email an