Suchmaschinenlabor an der Uni Hannover
Derek Daniel
Introduktion
1998 - Hotbot erfaßt 34% 1999 - nur noch 11% alle zusammen 42%
1999
Metasuchmaschinen
Metacrawler SavvySearch MetaGer
Themen
MetaGer Forschungsportal Andere Projekte
MESA de.* HannUFind
MetaGer
1995 angefangen Deutschsprachig 400,000+ Anfragen am Tag ca. 90,000 externen Links auf
MetaGer 25 Suchmaschine abfragbar AND, OR, String Syntax
MetaGer Kriterien
1. Parallele Suche (keine all-in-one Forms)
2. Ergebnis-Merging 3. Doubletten-Eleminierung 4. mindestens AND und OR Operatoren 5. Übernahme Kurzbeschreibung 6. Searchengine hiding 7. Möglichkeit vollständige Suche
Suchen
standardmäßig “AND” “OR” möglich String in Titel “NOT” und “NEAR” nicht möglich Stopwörter Doubletten zusammengefaßt
Ranking
Eigenes Rankingsystem Zusätzliche Überprüfung Spamfilterung Zeitliches Ranking Server Clustern Test auf Existenz
QuickTips
vor Suchergebnisse ausgegeben 2 Sorten
selbst ausgesucht von Menschen D-N-S Quicktip gibt Domainnamen
zurück arbeitet weiter im Hintergrund
Beschleuniger
Statt QuickTips, Beschleuniger Vorteil: viel schneller Nachteil: möglicherweise veraltet
Qcheck (Quickcheck)
Existenz- und Inhaltsprüfung Filtert Suchmaschinenbetrüger
Probleme
Geänderte Ausgaben Korrekte Syntax Ziele der Einzelsuchmaschinen
Werbung Überlastung
Hardware
Verteilte System Sun Enterprise E450 mit Solaris
4 CPUs 1.6GB RAM 155Mbit/s Anschluß bis 5 weitere Sun/Linux Servers
Themen
MetaGer Forschungsportal Andere Projekte
MESA de.* HannUFind
Forschungsportal
Besonders für Forschung Problem des Deepwebs lösen
folge jedes Link besonders der Art:
www.anyurl.dom/path?parameters 2000 Benutzer am Tag 8 Millionen Pages
Beispiele
Typische wissenschaftliches Dokument: www.evl.uic.edu/spiff/casa/
andere Forschungssuchmaschinen www.tt.uni-hannover.de/UniForKat/
suchen.cfm www.uni-kassel.de/forschungsbericht/
(Suche: “Identifying and Evaluating Successful Changes in Work Design and Corporate Organisation”)
Beispiele
Typische wissenschaftliches Dokument: www.evl.uic.edu/spiff/casa/
andere Forschungssuchmaschinen www.tt.uni-hannover.de/UniForKat/
suchen.cfm www.uni-kassel.de/forschungsbericht/
(Suche: “Identifying and Evaluating Successful Changes in Work Design and Corporate Organisation”)
Suchen
2 Arten von Suchen Textsuche Einrichtungssuche
Operatoren: + - | _ “” ()
Ranking
Nach Institution Anzahl der Hits Adressen Institution wichtiger als Dokument?
Suche auf einzelne Institution
Einschränkungen
Statische Links auf dem Inhalt http Regelung Browser lesbar
Weitere Feature
Forschungslandkarten Hochschulen Max-Planck-Gesellschaft Frauenhofer Gesellschaft …
Themen
MetaGer Forschungsportal Andere Projekte
MESA de.* HannUFind
Andere Projekte: MESA
Meta E-mail Search Agent Eingabe Name, Ausgabe e-mail
Adresse Fragt 7 e-mail Suchmaschinen ab
Andere Projekte: de.*
Newsgroup Suchmaschine Wird eingestellt wegen Google/Deja
Andere Projekte: HannUFind
Volltextsuche aller Webserver der Uni Hannover
Über 100 Webserver ca. 100,000 HTML Seiten pro Woche
erfaßt
Quellen
MetaGer Homepage meta.rrzn.uni-hannover.de/suma.html
Internet Information Retrieval www.uni-hannover.de/inet98/paper.html
Forschungsportal forschungsportal.net metager.de/cris2002/
FUnktioniert das FUnkLAN?
Beispiel: suche nach “hamster futter”
Beispiel: suche nach “identifying changes corporate ekkehart frieling” google, altavista, metacrawler,
metager, forschungsportal Beispiel: suche nach “solar cells”