69
Dr. Harald Sack Hasso-Plattner-Institut für Softwaresystemtechnik Universität Potsdam 13. Verbundkonferenz des GBV Hamburg, 09. September 2009 „Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben“ Paradigmenwechsel in der (Web)Suche

Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

Embed Size (px)

DESCRIPTION

Keynote zur 13. Verbundkonferenz des GBV am 09.09.2009 in Hamburg

Citation preview

Page 1: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

Dr. Harald SackHasso-Plattner-Institut für SoftwaresystemtechnikUniversität Potsdam13. Verbundkonferenz des GBVHamburg, 09. September 2009

„Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben“Paradigmenwechsel in der (Web)Suche

Page 2: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

■ Promotion Uni Trier, 2002: formale Verifikation

■ 2002-2008: PostDoc FSU Jena

■ 2007-2009: Gastwissenschaftler am HPI

■ 2009- : Senior Researcher am HPI

■ Forschungsschwerpunkte:

□ Semantic Web Technologien

□ Multimedia Retrieval

■ Videosuchmaschine yovisto.com

■ Projekt MEDIAGLOBE/THESEUS

2

Dr. Harald Sack

Page 3: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

3

Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben

•Das Dilemma der Schlüsselwort-basierten Suche

• klassisches Information Retrieval

• Suchmaschinen im World Wide Web

• Suche in Audiovisuellen Daten

•Semantische Suchtechnologien

• Semantic Web Technologie

• Semantisch unterstütztes Information Retrieval

• Explorative Suche in Audiovisuellen Daten

Page 4: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Das „Google Paradigma“4

• Eingabe einer Suchphrase

• Boolesche Verknüpfung einzelner Suchbegriffe• Volltextsuche

• Normalisierung (Stemming)

Das Dilemma der Schlüsselwort-basierten SucheDas „Google-Paradigma“

Page 5: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Das „Google Paradigma“5

Das Dilemma der Schlüsselwort-basierten SucheDas „Google Paradigma“

Page 6: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Das „Google Paradigma“5

Das Dilemma der Schlüsselwort-basierten SucheDas „Google Paradigma“

Page 7: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Das „Google Paradigma“6

• Erzeugung einer linearen (nach Relevanz gewichteten) Ergebnisliste

• TFIDF / PageRank

• Personalisierung (Logdatenanalyse)

Das Dilemma der Schlüsselwort-basierten SucheDas „Google Paradigma“

Page 8: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Das „Google Paradigma“6

• Erzeugung einer linearen (nach Relevanz gewichteten) Ergebnisliste

• TFIDF / PageRank

• Personalisierung (Logdatenanalyse)

Das Dilemma der Schlüsselwort-basierten SucheDas „Google Paradigma“

Page 9: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

7

Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben

•Das Dilemma der Schlüsselwort-basierten Suche

•klassisches Information Retrieval

• Suchmaschinen im World Wide Web

• Suche in Audiovisuellen Daten

•Semantische Suchtechnologien

• Semantic Web Technologie

• Semantisch unterstütztes Information Retrieval

• Explorative Suche in Audiovisuellen Daten

Page 10: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

8

Das Dilemma der Schlüsselwort-basierten Sucheklassisches Information Retrieval

“Information-Retrieval Systeme • verarbeiten Dateien mit Informationsressourcen und

Informationsanfragen, • identifizieren und liefern aus diesen Dateien bestimmte

Informationsressourcen als Antwort auf eine Informationsanfrage. • Das Finden (Retrieval) bestimmter Ressourcen hängt von der

Ähnlichkeit der Ressourcen und den Anfragen ab, gemessen am Vergleich bestimmter Attributwerte.”

(nach Salton,G., McGill, M.J.: Introduction to Modern Information Retrieval. McGraw-Hill, New York 1983)

Menge von Anfragen

informationrequests

Menge von Dokumenten

files of records

Indexierungs-sprache

similarityIndexierungAnfrage-

formulierung

Page 11: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Information Retrieval Modelle9

Dominik Kuropka: Modelle zur Repräsentation natürlichsprachlicher Dokumente. Ontologie-basiertes Information-Filtering und -Retrieval mit relationalen Datenbanken, Advances in Information Systems and Management Science, Bd. 10, Logos Verlag, Berlin, 2004.

Das Dilemma der Schlüsselwort-basierten Sucheklassisches Information Retrieval

Page 12: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Information Retrieval Modelle

• Boolean Retrieval

• Vector Space Model

• Probabilistic Model

10

A B

C(A ∧ ¬B) ∧ C

• verwendet Aussagenlogik als Retrievalsprache• erlaubt Selektion und Verknüpfung beliebiger

Dokumentenmengen aus einer einer Dokumentenkollektion• mit Hilfe Boolescher Junktoren (Suchoperatoren) • einfache Implementierung• keine differenzierte Termgewichtung möglich• keine Rangreihenfolge der Ergebnisse (Ranking)

Das Dilemma der Schlüsselwort-basierten Sucheklassisches Information Retrieval

Page 13: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Information Retrieval Modelle

• Boolean Retrieval

• Vector Space Model

• Probabilistic Model

11

Deskriptor1

Deskriptor2

Deskriptor3

Dokument = (2,4,2)Suchabfrage = (1,0,0)

Dokument

Suchanfrage

2

2

4

Bsp.: n = 3

ρ

• Dokumente und Anfragen werden als Punkte in einem hochdimensionalen, metrischen Vektorraum repräsentiert

• Zum Retrieval wird die Distanz zwischen Suchanfrage- und Dokumentenvektor verwendet

• Relevanzbewertung (Ranking) erfolgt nach der ermittelten Distanz

• Differenzierte Termgewichtung möglich• lineare Termanordnung im Dokument geht

verloren • mangelnde semantische Sensitivität

(Vokabularabhängigkeit)G. Salton, A. Wong, C. S. Yang: "A Vector Space Model for Automatic Indexing," Communications of the ACM, vol. 18, nr. 11, pp. 613–620, 1975.

Das Dilemma der Schlüsselwort-basierten Sucheklassisches Information Retrieval

Page 14: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Evaluation von Information Retrieval Systemen12

relevante Dokumente gefundene Dokumente

relevante Dokumente, die gefunden wurden

R P

Recall=| R ∩ P |

|R|

Precision=| R ∩ P |

|P|

Das Dilemma der Schlüsselwort-basierten Sucheklassisches Information Retrieval

Page 15: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

13

Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben

•Das Dilemma der Schlüsselwort-basierten Suche

• klassisches Information Retrieval

•Suchmaschinen im World Wide Web

• Suche in Audiovisuellen Daten

•Semantische Suchtechnologien

• Semantic Web Technologie

• Semantisch unterstütztes Information Retrieval

• Explorative Suche in Audiovisuellen Daten

Page 16: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

• World Wide Web ist ein verteiltes Hypermediasystem

• multimediale Dokumente

• über Hyperlinks miteinander vernetzt

• WWW-Suchmaschinen sind Information Retrieval Systeme mit folgenden Aufgaben

• Erstellung und Pflege eines Indexes (Web Crawler + Indexing)

• Verarbeitung von Suchabfragen (Retrieval + Ranking)

• Aufbereitung der Ergebnisse (Visualisierung)

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

14

Das Dilemma der Schlüsselwort-basierten SucheSuchmaschinen im WWW

Page 17: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

15 Das WWW ist „ziemlich groß“•ca. 25 x 109 in Suchmaschinenindizierte Dokumente (TNL Blog: Google has 24 billion items index, considers MSN search nearest competitor, September 2005)

•Web Crawler: > 1012 Dokumente(The Official Google Blog: We knew the Web was Big....., Juli 25, 2008)

•DeepWeb (Darkweb) schätzungsweise bis zu 550 mal größer als das Surface Web (Bergman, 2001)

Probleme:• Aktualität des Suchmaschinenindex• syntaktische / semantische Inkonsistenzen im Suchmaschinenindex• Skalierbarkeit der Suchmaschinenanwendung• kann man der Information auch trauen...?

Das Dilemma der Schlüsselwort-basierten SucheSuchmaschinen im WWW

Page 18: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

16 Problemfeld 1: Informationssuche

•Keyword-Suche führt zu vielen nicht relevanten Ergebnissen•Bedeutungsunterschiede•Homonyme•unterschiedlicher Kontext

•Keyword-Suche findet nichtalle relevanten Ergebnisse•Synonyme• fehlende Kontextpräzisierung

Suchbegriff: „Golf“

Das Dilemma der Schlüsselwort-basierten SucheSuchmaschinen im WWW

Page 19: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

16 Problemfeld 1: Informationssuche

•Keyword-Suche führt zu vielen nicht relevanten Ergebnissen•Bedeutungsunterschiede•Homonyme•unterschiedlicher Kontext

•Keyword-Suche findet nichtalle relevanten Ergebnisse•Synonyme• fehlende Kontextpräzisierung

Suchbegriff: „Golf“

Das Dilemma der Schlüsselwort-basierten SucheSuchmaschinen im WWW

Page 20: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

17 Problemfeld 2: Informationsextraktion• kann nur von menschlichem

“Agenten“ korrekt durchgeführt und bewertet werden

•heterogene Anordnung von Information

•Software-Agent verfügt nicht über• Kontextwissen• Weltwissenum Informationen aus der Text-/Bilddarstellung zu lösen

• implizites Wissen, muss durch logische Schlussfolgerungenaus der Kombination vorhandener Informationen ermittelt werden

bild.de

Das Dilemma der Schlüsselwort-basierten SucheSuchmaschinen im WWW

Page 21: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

18

Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben

•Das Dilemma der Schlüsselwort-basierten Suche

• klassisches Information Retrieval

• Suchmaschinen im World Wide Web

•Suche in Audiovisuellen Daten

•Semantische Suchtechnologien

• Semantic Web Technologie

• Semantisch unterstütztes Information Retrieval

• Explorative Suche in Audiovisuellen Daten

Page 22: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

19 Wie findet man etwas in einem audiovisuellen Archiv?

Das Dilemma der Schlüsselwort-basierten SucheSuche in audiovisuellen Daten

• Damit audiovisuelle Daten einer computergestützten gezielten Suche zugänglich werden, müssen Beschreibungen, Schlüsselwörter, etc. üblicherweise Textform vorliegen.

Page 23: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

19 Wie findet man etwas in einem audiovisuellen Archiv?

Das Dilemma der Schlüsselwort-basierten SucheSuche in audiovisuellen Daten

• Damit audiovisuelle Daten einer computergestützten gezielten Suche zugänglich werden, müssen Beschreibungen, Schlüsselwörter, etc. üblicherweise Textform vorliegen.

Manuelle Analyse und Annotation

Page 24: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

20 Retrieval in Audiovisuellen (zeitabhängigen) Daten

automatische inhaltliche Analyse ist • schwierig und• berechnungs-/speicheraufwändig

© Friedrich Wilhelm Murnau Stiftung, DFI

Das Dilemma der Schlüsselwort-basierten SucheSuche in audiovisuellen Daten

Page 25: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

20 Retrieval in Audiovisuellen (zeitabhängigen) Daten

automatische inhaltliche Analyse ist • schwierig und• berechnungs-/speicheraufwändig

© Friedrich Wilhelm Murnau Stiftung, DFI

Das Dilemma der Schlüsselwort-basierten SucheSuche in audiovisuellen Daten

Page 26: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

20 Retrieval in Audiovisuellen (zeitabhängigen) Daten

automatische inhaltliche Analyse ist • schwierig und• berechnungs-/speicheraufwändig

© Friedrich Wilhelm Murnau Stiftung, DFI

Das Dilemma der Schlüsselwort-basierten SucheSuche in audiovisuellen Daten

Page 27: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

20 Retrieval in Audiovisuellen (zeitabhängigen) Daten

automatische inhaltliche Analyse ist • schwierig und• berechnungs-/speicheraufwändig

Marlene Dietrich

© Friedrich Wilhelm Murnau Stiftung, DFI

Das Dilemma der Schlüsselwort-basierten SucheSuche in audiovisuellen Daten

Page 28: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

20 Retrieval in Audiovisuellen (zeitabhängigen) Daten

automatische inhaltliche Analyse ist • schwierig und• berechnungs-/speicheraufwändig

Marlene Dietrich ????

© Friedrich Wilhelm Murnau Stiftung, DFI

Das Dilemma der Schlüsselwort-basierten SucheSuche in audiovisuellen Daten

Page 29: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

20 Retrieval in Audiovisuellen (zeitabhängigen) Daten

automatische inhaltliche Analyse ist • schwierig und• berechnungs-/speicheraufwändig

Marlene Dietrich ????????

© Friedrich Wilhelm Murnau Stiftung, DFI

Das Dilemma der Schlüsselwort-basierten SucheSuche in audiovisuellen Daten

Page 30: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

20 Retrieval in Audiovisuellen (zeitabhängigen) Daten

automatische inhaltliche Analyse ist • schwierig und• berechnungs-/speicheraufwändig

Marlene Dietrich ????????

„...ich bin von Kopf bis Fuß...“

{

© Friedrich Wilhelm Murnau Stiftung, DFI

Das Dilemma der Schlüsselwort-basierten SucheSuche in audiovisuellen Daten

Page 31: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

yovisto.com• Videosuchmaschine mit dem Schwer-

Punkt akademischer Lehrveranstaltungen

• aktuell mehr als 5.000 Vorlesungen undwissenschaftliche Vorträge aus der ganzen Welt

• automatische Segmentierung und Videoanalyse

• benutzergenerierte Co-Annotation

• Social Tagging

• Diskussionen

• Rezensionen

• Wikis

• Lernmaterialien

• Zielgenauer Zugriff auf gesuchte Videoinhalte

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

21

Das Dilemma der Schlüsselwort-basierten SucheYovisto.com - Akademische Videosuche

www.yovisto.com

Page 32: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Inhaltsbezogene Videoanalyse■ Ergebnis: Videosegmente mit zugeordneten, zeitbezogenen

Metadaten

■ Metadaten setzen sich zusammen aus kombinierten Low Level/ High Level Deskriptoren

■ Metadaten als Basis für traditionelles Information Retrieval

22

ZeitMetadaten

Metadaten

Metadaten

Metadaten Metadaten

Metadaten

Das Dilemma der Schlüsselwort-basierten SucheYovisto.com - Akademische Videosuche

Page 33: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

23 Automatische Metadatenextraktion

Das Dilemma der Schlüsselwort-basierten SucheYovisto.com - Akademische Videosuche

Page 34: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

23

ICR / OCR

Automatische Metadatenextraktion

Das Dilemma der Schlüsselwort-basierten SucheYovisto.com - Akademische Videosuche

Page 35: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

23

ICR / OCR

ASR

Automatische Metadatenextraktion

Das Dilemma der Schlüsselwort-basierten SucheYovisto.com - Akademische Videosuche

Page 36: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

23

ICR / OCR

ASR

Dic

tiona

ry

Keyterm Spotting

Automatische Metadatenextraktion

Das Dilemma der Schlüsselwort-basierten SucheYovisto.com - Akademische Videosuche

Page 37: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

24 Benutzergenerierte Metadaten□ automatische Analyse nur begrenzt leistungsfähig

□mangelnde Genauigkeit / Vollständigkeit

□ Benutzergenerierte Metadaten können qualitativ zuverlässiger sein

□ autoritative Metadaten

□ strukturierte Daten

□ unstrukturierte (textuelle) Daten

□ nicht-autoritative Metadaten

□ Tags

□ Kommentare

□ Diskussionen

□ Rezensionen

□ Feedback

Das Dilemma der Schlüsselwort-basierten SucheYovisto.com - Akademische Videosuche

Page 38: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

25

Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben

•Das Dilemma der Schlüsselwort-basierten Suche

• klassisches Information Retrieval

• Suchmaschinen im World Wide Web

• Suche in Audiovisuellen Daten

•Semantische Suchtechnologien

• Semantic Web Technologie

• Semantisch unterstütztes Information Retrieval

• Explorative Suche in Audiovisuellen Daten

Page 39: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

26 Die ursprüngliche Vision des World Wide Web

„The Web was designed as an information space, with the goal that it should be useful not only for human-human communication, but also that machines would be able to participate and help… “

Voraussetzung:• Inhalte können maschinell gelesen und korrekt

interpretiert (= verstanden) werden

Tim Berners-Lee, Semantic Web Roadmap, Sept 1998

Wie kann das funktionieren?

Semantische SuchtechnologienSemantik Web Technologien

Page 40: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

27 Inhalte im Web maschinell „verstehen“•um Inhalte im Web maschinell „verstehen“ zu können werden zwei unterschiedliche Ansätze verfolgt

Natural Language Processing• Natürliche Sprache soll mit

Techniken der Linguistik und Statistik analysiert werden

• Die Bedeutung (Semantik) soll implizit (oder auch explizit) daraus erschlossen werden

• Techniken kommen im klassischen Information Retrieval (WWW-Such-maschinen) zum Einsatz

Semantic Web• (Natürlichsprachliche) Web-

Inhalte werden explizit mit Hilfe von semantischen Metadaten annotiert

• semantische Metadaten tragen die Bedeutung (Semantik) der Web-Inhalte und lassen sich maschinell lesen und korrekt interpretieren

Semantische SuchtechnologienSemantik Web Technologien

Page 41: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

28 Inhalte im Web maschinell „verstehen“

Text: „Diego zu Bayern?“

Diego Ribas da Cunha (Instanz)

Fußballspieler

ist ein

(Klasse)

Person

ist eine

(Klasse)

Superklasse

Subklasse

ist eine

Klassen-zugehörigkeit

Entitäten-zuweisung

• Die Bedeutung (Semantik) der Klassenmuss ebenfalls explizit definiert werden.

• Bedeutung wird über geeignete Wissens-repräsentationen (Ontologien) kodiert

Semantische SuchtechnologienSemantik Web Technologien

Page 42: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

29 Ontologien als Wissensrepräsentation

Symbol Gegenstandsteht für

„Golf“Ogden, Richards, semiotisches Dreieck, 1923

Konzept

ruft hervor referenziert

verwendengemeinsames Konzept

Semantische SuchtechnologienSemantik Web Technologien

Page 43: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

30 Ontologien als Wissensrepräsentation

„Philosophische Disziplin, die sich primär mit dem Sein, dem Seienden als solchem und mit den fundamentalen Typen von Entitäten beschäftigt…“ (wikipedia)

"An ontology is an explicit, formal specification of a shared conceptualization. The term is borrowed from philosophy, where an Ontology is a systematic account of Existence. For AI systems, what ‘exists’ is that which can be represented.“

(Thomas R. Gruber, 1993)

Konzeptualisierung: abstraktes Modell (Domäne, identifizierte relevante Begriffe, Beziehungen)Explizit: Bedeutungen aller Begriffe definiertFormal: maschinenverstehbarGemeinsam: Konsens bzgl. Ontologie

Semantische SuchtechnologienSemantik Web Technologien

Page 44: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Das Semantic Web - Datenzentrierte Verarbeitung •Die Bedeutung der Informationen (Semantik) wird durch standardisierte Wissensrepräsentationen (Ontologien) explizit formalisiert (strukturiert)

• Damit wird es möglich,

•die Bedeutung der Informationen maschinell zu verarbeiten

•unterschiedliche (heterogene) Daten miteinander in Beziehung zu setzen

•implizite (nicht offensichtliche) Information aus der vorhandenen (offensichtlichen) Information automatisch zu folgern

31

Das Semantic Web ist eine Art globaler Datenbank, dieein universales Netz semantischer Aussagen bereit hält

Semantische SuchtechnologienSemantik Web Technologien

Page 45: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Das Semantic Web - Architektur32

URI / IRI

XML / XSDData Interchange: RDF

RDFS

Ontology: OWL Rule: RIF

Query:SPARQL

Proof

Unifying Logic

Cry

pto

Trust

Interface & Application

Semantische SuchtechnologienSemantik Web Technologien

Page 46: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Das Semantic Web - Architektur32

URI / IRI

XML / XSDData Interchange: RDF

RDFS

Ontology: OWL Rule: RIF

Query:SPARQL

Proof

Unifying Logic

Cry

pto

Trust

Interface & Application

Current Research

Semantische SuchtechnologienSemantik Web Technologien

Page 47: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Linked Data - Datenzentrierte Verarbeitung •Ziel des Semantic Web: ...to create a ,Web of Data‘

33

Semantische SuchtechnologienSemantik Web Technologien

Page 48: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Linked Data - Datenzentrierte Verarbeitung •Ziel des Semantic Web: ...to create a ,Web of Data‘

33

Semantische SuchtechnologienSemantik Web Technologien

Page 49: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

34

Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben

•Das Dilemma der Schlüsselwort-basierten Suche

• klassisches Information Retrieval

• Suchmaschinen im World Wide Web

• Suche in Audiovisuellen Daten

• yovisto.com - Akademische Videosuche

•Semantische Suchtechnologien

• Semantic Web Technologie

•Semantisch unterstütztes Information Retrieval

Page 50: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

35 Semantisch unterstütztes Information Retrieval• Semantische Annotationen ermöglichen eine Verbesserung der

traditionellen Schlüsselwort-basierten Suche durch

• Erweiterung / Präzisierung der Suchergebnisse

• Herleitung von impliziten Informationen

• Herstellung von Querverweisen

• Nutzung von semantischen Beziehungen zur

• Visualisierung und

• Navigation durch den Suchraum (Explorative Suche)

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval

Page 51: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

36 Erweiterung der Suchergebnisse• Keyword-basierte Suche liefert nicht alle inhaltlich relevanten

Suchergebnisse zu einer Suchphrase, da Synonyme, Metaphern und Umschreibungen den gesuchten Inhalt mit anderen Termen beschreiben.

• Erweiterung der ursprünglichen Suchphrase (Query Refinement)• Nutzung von Wörterbüchern und Thesauri

• Synonyme, Ober- und Unterbegriffe

• Nutzung von Domain Ontologien

• Meronyme, Holonyme, Assoziationen

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval

Page 52: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

36 Erweiterung der Suchergebnisse• Keyword-basierte Suche liefert nicht alle inhaltlich relevanten

Suchergebnisse zu einer Suchphrase, da Synonyme, Metaphern und Umschreibungen den gesuchten Inhalt mit anderen Termen beschreiben.

• Erweiterung der ursprünglichen Suchphrase (Query Refinement)• Nutzung von Wörterbüchern und Thesauri

• Synonyme, Ober- und Unterbegriffe

• Nutzung von Domain Ontologien

• Meronyme, Holonyme, Assoziationen

Suchphrase: Bank

Mögliche Erweiterung: Bank ∨ Kreditanstalt ∨ Sparkasse ∨ ... Bank ∨ Konto ∨ Kredit ∨ ... Bank ∨ Santander ∨ Raiffeisen ∨ ...

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval

Page 53: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

37 Präzisierung der Suchergebnisse• Keyword-basierte Suche liefert zu viele inhaltlich nicht relevante

Suchergebnisse zu einer Suchphrase, da Suchbegriffe mehrere Bedeutung und in unterschiedlichem Kontext/Pragmatik genutzt werden.

• Verfeinerung der ursprünglichen Suchphrase (Query Refinement)• Nutzung von Wörterbüchern und Thesauri

• Homonyme mit Hilfe von Ober- und Unterbegriffen disambiguieren

• Nutzung von Domain Ontologien

• Meronyme, Holonyme

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval

Page 54: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

37 Präzisierung der Suchergebnisse• Keyword-basierte Suche liefert zu viele inhaltlich nicht relevante

Suchergebnisse zu einer Suchphrase, da Suchbegriffe mehrere Bedeutung und in unterschiedlichem Kontext/Pragmatik genutzt werden.

• Verfeinerung der ursprünglichen Suchphrase (Query Refinement)• Nutzung von Wörterbüchern und Thesauri

• Homonyme mit Hilfe von Ober- und Unterbegriffen disambiguieren

• Nutzung von Domain Ontologien

• Meronyme, Holonyme

Suchphrase: Bank

Mögliche Erweiterung: Bank ∧ Kreditanstalt oder Bank ∧ Sitzgelegenheit oder Bank ∧ Sediment

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval

Page 55: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

38 Herstellung von Querverweisen□ Bereitstellung von Suchergebnissen, die zwar den Suchbegriff nicht

notwendigerweise enthalten, aber mit diesem in inhaltlichem Zusammenhang stehen

□ Nutzung von Domain Ontologien

□ Nutzung von Thesauri und Kookurrenzanalysen repräsentativer Dokumentenkorpora

Suchphrase: Hemingwayermittelter Oberbegriff zu Hemingway: amerikanischer AutorAusweitung der Suche auf andere amerikanische Autoren

dbpedia:Ernest_Hemingway

dbpedia:AmericanNovelists

rdf:type

Hemingway

Instanzerkennung

dbpedia:Edgar_Allen_Poe

rdf:type

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval

Page 56: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Explorative Suche• Abkehr vom „Google Paradigma“

• Visualisierung von Querverbindungen zwischen

• Suchbegriffen (Ontologieebene)

• Suchergebnissen (Instanzebene)

• Ermöglicht es dem Benutzer

• Suchergebnisse „zufällig“ zu entdecken, die er eigentlich gar nicht gesucht hat (Serendipity)

• einen besseren Überblick über den Suchraum / Ergebnisraumzu gewinnen

39

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval

Page 57: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Explorative Suche - ein einfaches Beispiel• Suche im Grunddatenbestand nach ,Ernest Hemingway‘

• Identifikation einer Entität dbpedia:Ernest_Hemingway

• Bestimmung gleichartiger Entitäten

40

dbpedia:Ernest_Hemingway foaf:name “Ernest Hemingway“ .dbpedia:Ernest_Hemingway rdfs:type dbpedia:class/yago/AmericanNovelist .

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval

Page 58: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Explorative Suche - ein einfaches Beispiel• Suche im Grunddatenbestand nach ,Ernest Hemingway‘

• Identifikation einer Entität dbpedia:Ernest_Hemingway

• Bestimmung gleichartiger Entitäten

40

dbpedia:Ernest_Hemingway foaf:name “Ernest Hemingway“ .dbpedia:Ernest_Hemingway rdfs:type dbpedia:class/yago/AmericanNovelist .

Finde weitere Ressourcen vom selben Typ, d.h.(1) finde weitere amerikanische Autoren(2) finde Ressourcen (z.B. Videos) mit weiteren amerikanischen Autoren

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval

Page 59: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Explorative Suche - ein einfaches Beispiel• Suche im Grunddatenbestand nach ,Ernest Hemingway‘

• Identifikation einer Entität dbpedia:Ernest_Hemingway

• Bestimmung eines geeigneten ,Properties‘

41

dbpedia:Ernest_Hemingway foaf:name “Ernest Hemingway“ .dbpedia:Ernest_Hemingway rdfs:type dbpedia:class/yago/AmericanNovelist ....dbpedia:Ernest_Hemingway dbpedia:ontology/influences dbpedia:Ezra_Pound .dbpedia:Ezra_Pound rdfs:type dbpedia:class/yago/AmericanNovelist ....dbpedia:J._D._Salinger dbpedia:ontology/influences dbpedia:Ernest_Hemingway .dbpedia:J._D._Salinger rdfs:type dbpedia:class/yago/AmericanNovelist .

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval

Page 60: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Explorative Suche - ein einfaches Beispiel• Suche im Grunddatenbestand nach ,Ernest Hemingway‘

• Identifikation einer Entität dbpedia:Ernest_Hemingway

• Bestimmung eines geeigneten ,Properties‘

41

dbpedia:Ernest_Hemingway foaf:name “Ernest Hemingway“ .dbpedia:Ernest_Hemingway rdfs:type dbpedia:class/yago/AmericanNovelist ....dbpedia:Ernest_Hemingway dbpedia:ontology/influences dbpedia:Ezra_Pound .dbpedia:Ezra_Pound rdfs:type dbpedia:class/yago/AmericanNovelist ....dbpedia:J._D._Salinger dbpedia:ontology/influences dbpedia:Ernest_Hemingway .dbpedia:J._D._Salinger rdfs:type dbpedia:class/yago/AmericanNovelist .

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval

Page 61: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Explorative Suche - ein einfaches Beispiel• Suche im Grunddatenbestand nach ,Ernest Hemingway‘

• Identifikation einer Entität dbpedia:Ernest_Hemingway

• Bestimmung eines geeigneten ,Properties‘

42

dbpedia:Ernest_Hemingway foaf:name “Ernest Hemingway“ .dbpedia:Ernest_Hemingway rdfs:type dbpedia:class/yago/AmericanNovelist ....dbpedia:Ernest_Hemingway dbpedia:ontology/influences dbpedia:Ezra_Pound .dbpedia:Ezra_Pound rdfs:type dbpedia:class/yago/AmericanNovelist ....dbpedia:J._D._Salinger dbpedia:ontology/influences dbpedia:Ernest_Hemingway .dbpedia:J._D._Salinger rdfs:type dbpedia:class/yago/AmericanNovelist .

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval

Page 62: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Explorative Suche - ein einfaches Beispiel• Suche im Grunddatenbestand nach ,Ernest Hemingway‘

• Identifikation einer Entität dbpedia:Ernest_Hemingway

• Bestimmung eines geeigneten ,Properties‘

43

dbpedia:Ernest_Hemingway foaf:name “Ernest Hemingway“ .dbpedia:Ernest_Hemingway rdfs:type dbpedia:class/yago/AmericanNovelist ....dbpedia:Ernest_Hemingway dbpedia:ontology/influences dbpedia:Ezra_Pound .dbpedia:Ezra_Pound rdfs:type dbpedia:class/yago/AmericanNovelist ....dbpedia:J._D._Salinger dbpedia:ontology/influences dbpedia:Ernest_Hemingway .dbpedia:J._D._Salinger rdfs:type dbpedia:class/yago/AmericanNovelist .

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval

Page 63: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

Explorative Suche - ein einfaches Beispiel• Suche im Grunddatenbestand nach ,Ernest Hemingway‘

• Identifikation einer Entität dbpedia:Ernest_Hemingway

• Bestimmung eines geeigneten „Properties“

•Nutzung des Properties zur Navigation/Visualisierung

• Erweitere Suche mit asoziierten Entitäten

44

dbpedia:ontology/influences dbpedia:ontology/influences

Ezra Pound Ernest Hemingway J.D. Salinger

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval

Page 64: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

45

Waitelonis, Sack: Augmenting Video Search with Linked Open Data, in Proc. I-Semantics , Graz 2009.

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval

29

Page 65: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

45

Waitelonis, Sack: Augmenting Video Search with Linked Open Data, in Proc. I-Semantics , Graz 2009.

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval

29

Page 66: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

45

Waitelonis, Sack: Augmenting Video Search with Linked Open Data, in Proc. I-Semantics , Graz 2009.

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval

29

history

Page 67: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

45

Waitelonis, Sack: Augmenting Video Search with Linked Open Data, in Proc. I-Semantics , Graz 2009.

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval

29

history

search term

Page 68: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

45

Waitelonis, Sack: Augmenting Video Search with Linked Open Data, in Proc. I-Semantics , Graz 2009.

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval

29

history

search term

related resources with properties

Page 69: Gbv09 Keynote Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben - Paradigmenwechsel in der (Web)Suche

•Das Dilemma der Schlüsselwort-basierten Suche

• klassisches Information Retrieval

• Suchmaschinen im World Wide Web

• Suche in Audiovisuellen Daten

• yovisto.com - Akademische Videosuche

•Semantische Suchtechnologien

• Semantic Web Technologie

• semantantisch unterstütztes Information Retrieval

13. Verbundkonferenz des GBV, Hamburg, 09.-10.09.2009, Dr. Harald Sack, HPI Potsdam

46

Vielen Dank für Ihre Aufmerksamkeit !Fragen....?

Links:• HPI Homepage: http://www.hpi.uni-potsdam.de/meinel/sack.html• Yovisto: www.yovisto.com• Blogs: http://moresemantic.blogspot.com/ http://yovisto.blogspot.com/

Semantische SuchtechnologienSemantisch unterstütztes Information Retrieval