Volltextsuche - das Eichsfeld hat jetzt eine Suchmaschine!

der freie Webkatalog für das Eichsfeld

Moderator: Eichsfeld.net

Benutzeravatar
niels
Site Admin
Beiträge: 2321
Registriert: Freitag 22. März 2002, 16:15
PLZ: 37075
voller Name: Niels Dettenbach
Wohnort: Göttingen
Kontaktdaten:

Volltextsuche - das Eichsfeld hat jetzt eine Suchmaschine!

Ungelesener Beitrag von niels »

Hallo EIC-Search Benutzer,

wie Ihr vielleicht unscheinbar auf der Titelseite bemerkt habt, stehen nun über 14.000 Webseiten aus der Region für eine Volltextsuche bereit.

EIC-Search Version 1.79

Der Indexer gräbt sich derzeit einmal monatlich durch die in EIC-Search gemeldeten Seiten und indiziert alle zu findenden Textinhalte für die Datenbank. Die Volltextsuche basiert auf dem Code des Harvest-Brokers und wurde um einige für uns wichtige Funktionen ergänzt.

das Eichsfeld hat nun eine echte eigene Suchmaschine ! :wink:

Probiert's aus...
Zuletzt geändert von niels am Samstag 19. Oktober 2002, 01:25, insgesamt 2-mal geändert.
Benutzeravatar
niels
Site Admin
Beiträge: 2321
Registriert: Freitag 22. März 2002, 16:15
PLZ: 37075
voller Name: Niels Dettenbach
Wohnort: Göttingen
Kontaktdaten:

Volltextsuche die 2.

Ungelesener Beitrag von niels »

Die Volltextsuche von EIC-Search habe ich weiter optimiert.

EIC-Search Version 1.84

Sie enthält nun sage und schreibe über 18.000 Seiten und Dokumente. Ab sofort sind nun auch PDF (Acrobat), MSWord und RTF Dokumente vollständig indiziert.

:arrow: Beispiel - klick auf folgenden Link zeigt Ihnen alle Dokumente, in denen der Ort "Beuren" vorkommt:

http://eic-search.de/Harvest/cgi-bin/se ... ery=beuren

Wie man z.T. sehr gut erkennen kann, vergessen viele eichsfelder Webmaster ihre Webseiten korrekt zu betiteln - solche Seiten werden von den großen Suchdiensten meist erst gar nicht erfasst. EIC-Search geht mit diesen Daten jedoch tolerant um und versucht einen eigenen Titel für den Treffer einzusetzen. Probleme gibt es mit vielen Java(-script) bedienbaren Seiten, da diese von Suchrobotern nicht korrekt/gar nicht erfasst werden können. Diese Unsitte ist unschön und verhilft den Seitenbetreibern nicht zu den erwünschten Klicks über die Suchmaschinen. Da ist weniger oft mehr...

Wer nicht die kompletten Dokumente herunterladen möchte, kann sich eine einfache Textansicht der jeweiligen Datei über "Textinhalt" zeigen lassen. Unter "Archiv" finden Sie nun umfangreiche Informationen zu den Dokumenten bzw. wie diese in unserer Datenbank erfasst sind. Entgegen der Informationspolitik kommerzieller Suchmaschinen stellen wir Ihnen alle gespeicherten Daten transparent zur Verfügung.

Die Suchausgabe und Sortierfunktionen (sog. "Ranking") wurden nachgestimmt. Einige kleinere Fehler, welche sich in die Programmlogik einschlichen - wurden behoben.

:idea: Weitere geplante Funktionen:

- Verbesserung der Suchgeschwindigkeit (RAM ist teuer?!?...)
- Blindenhilfe: Texte von Webseiten automatisch vorlesen lassen
- gewichtetes Ranking über Querlinks von anderen Webseiten (a la google)
- Implementierung der Volltextsuche in die Katalogsuche (nach Katalogtreffern werden gleichzeitig Volltexttreffer angezeigt )
- Bessere Filter gegen Suchmaschinen-Spam (das sind künstlich erzeugte, überhöhte Rankings durch "austricksen" der Suchmaschine)

Weitere Verbesserungen und Feinabstimmungen werde ich zukünftig entwickeln.
:?: Bei Vorschlägen oder Fehlermeldungen stehe ich wie immer gern zur Verfügung.

Viel Spaß und Erfolg,

Niels Dettenbach 8O
Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 20 Gäste