Suchmaschinenlabor an der Uni Hannover Derek Daniel

Preview:

Citation preview

Suchmaschinenlabor an der Uni Hannover

Derek Daniel

Introduktion

1998 - Hotbot erfaßt 34% 1999 - nur noch 11% alle zusammen 42%

1999

Metasuchmaschinen

Metacrawler SavvySearch MetaGer

Themen

MetaGer Forschungsportal Andere Projekte

MESA de.* HannUFind

MetaGer

1995 angefangen Deutschsprachig 400,000+ Anfragen am Tag ca. 90,000 externen Links auf

MetaGer 25 Suchmaschine abfragbar AND, OR, String Syntax

MetaGer Kriterien

1. Parallele Suche (keine all-in-one Forms)

2. Ergebnis-Merging 3. Doubletten-Eleminierung 4. mindestens AND und OR Operatoren 5. Übernahme Kurzbeschreibung 6. Searchengine hiding 7. Möglichkeit vollständige Suche

Suchen

standardmäßig “AND” “OR” möglich String in Titel “NOT” und “NEAR” nicht möglich Stopwörter Doubletten zusammengefaßt

Ranking

Eigenes Rankingsystem Zusätzliche Überprüfung Spamfilterung Zeitliches Ranking Server Clustern Test auf Existenz

QuickTips

vor Suchergebnisse ausgegeben 2 Sorten

selbst ausgesucht von Menschen D-N-S Quicktip gibt Domainnamen

zurück arbeitet weiter im Hintergrund

Beschleuniger

Statt QuickTips, Beschleuniger Vorteil: viel schneller Nachteil: möglicherweise veraltet

Qcheck (Quickcheck)

Existenz- und Inhaltsprüfung Filtert Suchmaschinenbetrüger

Probleme

Geänderte Ausgaben Korrekte Syntax Ziele der Einzelsuchmaschinen

Werbung Überlastung

Hardware

Verteilte System Sun Enterprise E450 mit Solaris

4 CPUs 1.6GB RAM 155Mbit/s Anschluß bis 5 weitere Sun/Linux Servers

Themen

MetaGer Forschungsportal Andere Projekte

MESA de.* HannUFind

Forschungsportal

Besonders für Forschung Problem des Deepwebs lösen

folge jedes Link besonders der Art:

www.anyurl.dom/path?parameters 2000 Benutzer am Tag 8 Millionen Pages

Beispiele

Typische wissenschaftliches Dokument: www.evl.uic.edu/spiff/casa/

andere Forschungssuchmaschinen www.tt.uni-hannover.de/UniForKat/

suchen.cfm www.uni-kassel.de/forschungsbericht/

(Suche: “Identifying and Evaluating Successful Changes in Work Design and Corporate Organisation”)

Beispiele

Typische wissenschaftliches Dokument: www.evl.uic.edu/spiff/casa/

andere Forschungssuchmaschinen www.tt.uni-hannover.de/UniForKat/

suchen.cfm www.uni-kassel.de/forschungsbericht/

(Suche: “Identifying and Evaluating Successful Changes in Work Design and Corporate Organisation”)

Suchen

2 Arten von Suchen Textsuche Einrichtungssuche

Operatoren: + - | _ “” ()

Ranking

Nach Institution Anzahl der Hits Adressen Institution wichtiger als Dokument?

Suche auf einzelne Institution

Einschränkungen

Statische Links auf dem Inhalt http Regelung Browser lesbar

Weitere Feature

Forschungslandkarten Hochschulen Max-Planck-Gesellschaft Frauenhofer Gesellschaft …

Themen

MetaGer Forschungsportal Andere Projekte

MESA de.* HannUFind

Andere Projekte: MESA

Meta E-mail Search Agent Eingabe Name, Ausgabe e-mail

Adresse Fragt 7 e-mail Suchmaschinen ab

Andere Projekte: de.*

Newsgroup Suchmaschine Wird eingestellt wegen Google/Deja

Andere Projekte: HannUFind

Volltextsuche aller Webserver der Uni Hannover

Über 100 Webserver ca. 100,000 HTML Seiten pro Woche

erfaßt

Quellen

MetaGer Homepage meta.rrzn.uni-hannover.de/suma.html

Internet Information Retrieval www.uni-hannover.de/inet98/paper.html

Forschungsportal forschungsportal.net metager.de/cris2002/

FUnktioniert das FUnkLAN?

Beispiel: suche nach “hamster futter”

Beispiel: suche nach “identifying changes corporate ekkehart frieling” google, altavista, metacrawler,

metager, forschungsportal Beispiel: suche nach “solar cells”

Recommended