37
Suchmaschinenlabor an der Uni Hannover Derek Daniel

Suchmaschinenlabor an der Uni Hannover Derek Daniel

Embed Size (px)

Citation preview

Page 1: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Suchmaschinenlabor an der Uni Hannover

Derek Daniel

Page 2: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Introduktion

1998 - Hotbot erfaßt 34% 1999 - nur noch 11% alle zusammen 42%

1999

Page 3: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Metasuchmaschinen

Metacrawler SavvySearch MetaGer

Page 4: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Themen

MetaGer Forschungsportal Andere Projekte

MESA de.* HannUFind

Page 5: Suchmaschinenlabor an der Uni Hannover Derek Daniel

MetaGer

1995 angefangen Deutschsprachig 400,000+ Anfragen am Tag ca. 90,000 externen Links auf

MetaGer 25 Suchmaschine abfragbar AND, OR, String Syntax

Page 6: Suchmaschinenlabor an der Uni Hannover Derek Daniel

MetaGer Kriterien

1. Parallele Suche (keine all-in-one Forms)

2. Ergebnis-Merging 3. Doubletten-Eleminierung 4. mindestens AND und OR Operatoren 5. Übernahme Kurzbeschreibung 6. Searchengine hiding 7. Möglichkeit vollständige Suche

Page 7: Suchmaschinenlabor an der Uni Hannover Derek Daniel
Page 8: Suchmaschinenlabor an der Uni Hannover Derek Daniel
Page 9: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Suchen

standardmäßig “AND” “OR” möglich String in Titel “NOT” und “NEAR” nicht möglich Stopwörter Doubletten zusammengefaßt

Page 10: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Ranking

Eigenes Rankingsystem Zusätzliche Überprüfung Spamfilterung Zeitliches Ranking Server Clustern Test auf Existenz

Page 11: Suchmaschinenlabor an der Uni Hannover Derek Daniel

QuickTips

vor Suchergebnisse ausgegeben 2 Sorten

selbst ausgesucht von Menschen D-N-S Quicktip gibt Domainnamen

zurück arbeitet weiter im Hintergrund

Page 12: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Beschleuniger

Statt QuickTips, Beschleuniger Vorteil: viel schneller Nachteil: möglicherweise veraltet

Page 13: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Qcheck (Quickcheck)

Existenz- und Inhaltsprüfung Filtert Suchmaschinenbetrüger

Page 14: Suchmaschinenlabor an der Uni Hannover Derek Daniel
Page 15: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Probleme

Geänderte Ausgaben Korrekte Syntax Ziele der Einzelsuchmaschinen

Werbung Überlastung

Page 16: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Hardware

Verteilte System Sun Enterprise E450 mit Solaris

4 CPUs 1.6GB RAM 155Mbit/s Anschluß bis 5 weitere Sun/Linux Servers

Page 17: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Themen

MetaGer Forschungsportal Andere Projekte

MESA de.* HannUFind

Page 18: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Forschungsportal

Besonders für Forschung Problem des Deepwebs lösen

folge jedes Link besonders der Art:

www.anyurl.dom/path?parameters 2000 Benutzer am Tag 8 Millionen Pages

Page 19: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Beispiele

Typische wissenschaftliches Dokument: www.evl.uic.edu/spiff/casa/

andere Forschungssuchmaschinen www.tt.uni-hannover.de/UniForKat/

suchen.cfm www.uni-kassel.de/forschungsbericht/

(Suche: “Identifying and Evaluating Successful Changes in Work Design and Corporate Organisation”)

Page 20: Suchmaschinenlabor an der Uni Hannover Derek Daniel
Page 21: Suchmaschinenlabor an der Uni Hannover Derek Daniel
Page 22: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Beispiele

Typische wissenschaftliches Dokument: www.evl.uic.edu/spiff/casa/

andere Forschungssuchmaschinen www.tt.uni-hannover.de/UniForKat/

suchen.cfm www.uni-kassel.de/forschungsbericht/

(Suche: “Identifying and Evaluating Successful Changes in Work Design and Corporate Organisation”)

Page 23: Suchmaschinenlabor an der Uni Hannover Derek Daniel
Page 24: Suchmaschinenlabor an der Uni Hannover Derek Daniel
Page 25: Suchmaschinenlabor an der Uni Hannover Derek Daniel
Page 26: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Suchen

2 Arten von Suchen Textsuche Einrichtungssuche

Operatoren: + - | _ “” ()

Page 27: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Ranking

Nach Institution Anzahl der Hits Adressen Institution wichtiger als Dokument?

Suche auf einzelne Institution

Page 28: Suchmaschinenlabor an der Uni Hannover Derek Daniel
Page 29: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Einschränkungen

Statische Links auf dem Inhalt http Regelung Browser lesbar

Page 30: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Weitere Feature

Forschungslandkarten Hochschulen Max-Planck-Gesellschaft Frauenhofer Gesellschaft …

Page 31: Suchmaschinenlabor an der Uni Hannover Derek Daniel
Page 32: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Themen

MetaGer Forschungsportal Andere Projekte

MESA de.* HannUFind

Page 33: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Andere Projekte: MESA

Meta E-mail Search Agent Eingabe Name, Ausgabe e-mail

Adresse Fragt 7 e-mail Suchmaschinen ab

Page 34: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Andere Projekte: de.*

Newsgroup Suchmaschine Wird eingestellt wegen Google/Deja

Page 35: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Andere Projekte: HannUFind

Volltextsuche aller Webserver der Uni Hannover

Über 100 Webserver ca. 100,000 HTML Seiten pro Woche

erfaßt

Page 36: Suchmaschinenlabor an der Uni Hannover Derek Daniel

Quellen

MetaGer Homepage meta.rrzn.uni-hannover.de/suma.html

Internet Information Retrieval www.uni-hannover.de/inet98/paper.html

Forschungsportal forschungsportal.net metager.de/cris2002/

Page 37: Suchmaschinenlabor an der Uni Hannover Derek Daniel

FUnktioniert das FUnkLAN?

Beispiel: suche nach “hamster futter”

Beispiel: suche nach “identifying changes corporate ekkehart frieling” google, altavista, metacrawler,

metager, forschungsportal Beispiel: suche nach “solar cells”