SiteSearch 1.1
© 2000 -2005 SDW Software
Download
| Demo
für Windows & Unix
SiteSearch 1.1 ist eine Suchmaschine für kleinere bis mittlere
Websites. Das Programm ist in Perl geschrieben und läuft unter Windows
und Unix ohne spezielle Anpassungen vornehmen zu müssen. Einzig die Pfade
und die Schalter sind zu Konfigurieren.
SiteSearch 1.1 besteht aus den Dateien:
- sitesearch.pl oder sitesearch.plx - das Programm
- sitesearch.htm - das Formular
- sitesearch.css - Formatierungen für die HTML-Seiten
Die im ZipFile vorhandenen Dateien sitesearch.pl und sitesearch.plx sind im Programm genau gleich. Sie
unterscheiden sich lediglich in der Art der Pfadangabe auf dem
Server.
Dieses Programm ist Freeware! Wenn Ihr es benutzt und es gefällt Euch,
dann schickt mir doch ein Mail mit der Url wo es läuft. Und lasst doch
einen Urhebervermerk drin stehen. Vorschläge und Spenden sind auch
willkommen :)
Features:
Das Eingabe-Interface erlaubt eine Volltext-Suche über die ganze oder
in einem selbst definierbaren Teilbereich einer Website. Per Einstellungen im Kopf
des Programmquelltextes lassen sich die unten aufgelisteten Optionen
einstellen. Die Optionenfelder in der Formularseite können auch
weggelassen werden. Es ist dazu lediglich folgendes im Formular
einzutragen <input type="hidden" name="suchbegr"
value="vollsuche">. Als Value kann auch der Name eines
einzelnen Ordners stehen der durchsucht werden soll.
Windows:
Damit die Suchmaschine optimal läuft, wird für Windows die
Perl-Distribution von ActiveState benötigt <www.activestate.com>,
welche unter anderem auch die Perl-DLL 'perliis.dll' enthält. Die
Dateiendung für die Suchmaschine ist *.plx und muss, wenn nicht schon
geschehen als Filehandler auf dem Server eingerichtet werden. Dies lässt
sich in der Managementkonsole unter "Website -> Eigenschaften
-> Basisverzeichnis -> Konfiguration" einstellen. Es wird nicht
empfohlen das Programm mit der 'perl.exe' laufen zu lassen (Dateiendung *.pl
auf Windows)!
Unter Windows läuft das Script in jedem Verzeichnis mit Ausführungsberechtigung. Die
beiden anderen Dateien müssen mindestens lesbar sein.
Unix :
Für Unix ist die Dateiendung des Scripts auf *.pl oder *.cgi zu ändern
und ins cgi-bin zu legen und mit "chmod 755" ausführbar zu
machen. Die beiden anderen Dateien müssen mindestens "chmod
644" sein und können irgendwo in der Website sein. Der Pfad ist
entsprechend zu ändern.
Einen Teilbereich durchsuchen:
Um einen Teilbereich der Website durchsuchen zu können, geben Sie im
Optionenfeld auf der Formularseite die Bezeichnung für den Teilbereich z.
Bsp. "Fotolabor durchsuchen" und den Wert "fotolabor"
für den Namen des Ordners der durchsucht werden soll. Der Name des
Optionenfeldes ist immer 'suchbegr' und sollte nicht geändert werden. Die
Unterscheidung in Teilbereiche wird mit der Ordnerstruktur auf der Website
festgelegt. Es kann nur ein Ordner mit allen darin enthaltenen
Unterverzeichnissen als Teilbereich durchsucht werden. Geben Sie in der
Konfiguration weiter unten die Bezeichnung (so wie sie im Optionenfeld
erscheint) und den dazugehörigen Ordnernamen an. Für einzelne Seiten die
nicht durchsucht werden sollen, reicht es als erste Zeile den
HTML-Kommentar
<!-- Dokument nicht durchsuchen --> reinzuschreiben. (Achten Sie auf
die Leerzeichen)
Und Oder?
Die Suchabfrage lässt sich variieren. Generell wird nach genau den
Begriffen gesucht, so wie Sie sie eingeben. Geben Sie "historische
aufzeichnungen" ein so wird genau nach dem Vorkommen von
"historische aufzeichnungen" gesucht. Möchten Sie nach beiden Wörtern
suchen so geben Sie "historische OR aufzeichnungen" ein. Im
Suchergebnis erscheinen die Treffer der Wörter "historische"
und "aufzeichnungen". Die Gross- und Kleinschreibung spielt
generell keine Rolle. Weitere Verfeinerungen sind in kommenden Versionen
geplant.
Anpassen der Pfade:
Unter Windows sehen Pfade so aus:
H:\\www\\webserver\\kunde\\cgi-bin\\sitesearch.plx
Unter Unix so:
/www/webserver/kunde/cgi-bin/sitesearch.pl
Achten Sie auf die beiden Backslashes im Windowspfad.
Die Pfade in der Datei sitesearch.htm müssen auch angepasst werden.
Verwenden Sie immer absolute Pfadnamen, da das Formular zuerst vom
Programm gelesen wird und dann die Scriptadresse als Location erhält. Passen Sie die CSS-Datei sitesearch.css nach Ihren
Bedürfnissen an.
Anpassen der Templatedatei
Das Programm benötigt zur Ausgabe eine vorbereitete Datei. Dazu
Verwenden Sie sitesearch.htm oder eine andere Datei. Sie benötigen aber
die Zeile "<!-- Hier Suchergebnis einfuegen -->" Dorthin wird
das Suchergebnis in Form einer Tabelle geschrieben. Die Zeile lässt sich
auch in eine bestehende Tabelle einfügen. Achten sie aber darauf, dass
die Zeile keinen Zeilenumbruch enthält. Sie können die Seite Ihren
Wünschen entsprechend anpassen. Wenn Sie CSS oder JavaScripts von extern
einbinden wollen, geben sie den absoluten Pfad an.
Das Suchfeld kann, wie oben dargestellt, überall auch in anderen Seiten
benutzt werden, als Ergebnisseite fungiert dann die erstellte Datei oder
sitesearch.htm
Optionen zur Konfiguration:
$os = "win";
Einstellen des Betriebssystems. "win" für Windows und
"unix" für die UNixen.
$html_codiert = 1;
Umlaute in der Website sind codiert. Falsch codierte Seiten können das
Suchergebnis negativ beeinflussen.
1=ja (bsp. - ä) oder nicht 0=nein (bsp. - ä).
$show_infos = 1;
Sollen zusätzliche Informationen zur Suche angezeigt werden (Datum,
Anzahl Dokumente, Suchzeit etc.) Wenn $show_infos auf 0 steht wird nichts
angezeigt.
Beispiel = 1:
"Es wurden 16 Dokumente in weniger als 1
Sekunde durchsucht.
9 Dokumente enthielten mindestens einen Treffer
Das Ergebnis der Suche nach film
im Bereich Foto:"
1=ja 0=nein
$show_description = 1;
Soll die Meta-Tag description als Beschreibung der gefundenen HTML-Seite
auf der Ergebnisseite angezeigt werden?
1=ja 0=nein
$show_keywords = 1;
Sollen die Schlüsselwörter des Meta-Tags 'keywords' auf der
Ergebnisseite angezeigt werden?
1=ja 0=nein
$show_treffer = 1;
Soll die Anzahl der Treffer auf der Ergebnisseite angezeigt werden?
1=ja 0=nein
$show_numero = 1;
Sollen die aufgelisteten Titel nummeriert werden?
1=ja 0=nein
$htmlform = "H:\\InetPub\\Nts\\Wwwroot\\fujifilm\\suche\\sitesearch.html";
Pfad zum Html Suchformular Template (\\) Doppelbackslash für
Win32 (/) Slash für UNixen.
$such_pfad = "H:\\InetPub\\Nts\\Wwwroot\\fujifilm";
Pfad zur Documentroot der Website. (\\) Doppelbackslash für Win32
(/) für UNixen
$hosturl = "http://ntsrv/fujifilm";
Url der Website von wo aus gesucht wird. Mit Protokoll.
$scripturl = "http://ntsrv/fujifilm/cgi-bin/sitesearch.pl";
Name dieses Scripts.
@exklusiv = ("_vti_","images","_private","cgi-bin","fr","test");
Von der Suche ausgeschlossene Verzeichnisse. Auch für Unterverzeichnisse
nur den Ordnernamen und nicht den ganzen Pfad angeben. ("_vti_"
und "_private" ist zum Filtern vom Microsofts Frontpage Erweiterungen)
Die Themen werden angezeigt wenn $show_info auf 1 steht.
@optionen{"vollsuche"} = ("ganze Website");
@optionen{"foto"} = ("Foto");
@optionen{"industrial"} = ("Industrial");
@optionen{"medical"} = ("Medical");
@optionen{"color_labor"} = ("Color Labor");
@optionen{"fujifilm_ch"} = ("FUJIFILM Schweiz");
@optionen{"news"} = ("News");
Übergabewerte (Ordnernamen) und Namen (Angezeigt) des
Select-Optionenfeldes im Suchformular ($htmlform).
|