11
15.04.13 1 Neue Entwicklungen im Suchmaschinenbereich und deren Relevanz für Bibliotheken Prof. Dr. Dirk Lewandowski [email protected] http://www.bui.haw-hamburg.de/lewandowski.html @Dirk_Lew Semantik? „Semantic Web“ – Idee, dass durch semantische Auszeichnungen alle Inhalte des Web miteinander verbunden werden und von Maschinen verstanden werden können. – Alternative Ansätze: Linked Open Data, ... „Low Level Semantics“ – Faktenextraktion aus „chaotischen“ Dokumenten – Einfache Auszeichnungen durch Website-Betreiber (Eigeninteresse bedienen) Verstehen der Dokumente vs. Verstehen der Suchanfragen

Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

1

Neue Entwicklungen im Suchmaschinenbereich und deren Relevanz für Bibliotheken

Prof. Dr. Dirk Lewandowski [email protected] http://www.bui.haw-hamburg.de/lewandowski.html @Dirk_Lew

Semantik?

•  „Semantic Web“ –  Idee, dass durch semantische Auszeichnungen alle Inhalte des Web miteinander

verbunden werden und von Maschinen verstanden werden können.

–  Alternative Ansätze: Linked Open Data, ...

•  „Low Level Semantics“ –  Faktenextraktion aus „chaotischen“ Dokumenten

–  Einfache Auszeichnungen durch Website-Betreiber (Eigeninteresse bedienen)

•  Verstehen der Dokumente vs. Verstehen der Suchanfragen

Page 2: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

2

Semantische Annotation von Dokumenten

•  Semantische Annotationen können in der Suche ausgenutzt werden, um •  die Ergebnisqualität zu verbessern •  die Trefferdarstellung („Snippets“) zu verbessern

•  Das Problem von „echten“ Semantic-Web-Anwendungen ist die Komplexität in der Erstellung.

•  Die großen Suchmaschinen haben sich auf ein gemeinsames Format für semantische Annotationen geeignet, das in HTML umgesetzt wird.

Beispiel Google Knowledge Graph

Page 3: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

3

Suchanfragen verstehen

•  bbl •  vatikan •  stockbrot •  motonetix •  nedcom •  fußball •  drehscheibe •  frauentausch •  seelenfarben •  kachelmannwetter •  osterei •  wie ich •  wgt

Page 4: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

4

Suchanfragen im Kontext

Beispiel: Navigationsorientierte Suchanfragen anhand von Klicks bestimmen

(Lewandowski, Drechsler & von Mach, 2012)

Page 5: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

5

Semantische Suche

•  Verbesserung der Qualität der Suchergebnisse durch –  Verstehen der Suchanfrage –  Kontextsensitive Vorschläge zur Verbesserung der Suchanfrage –  Verstehen der Dokumente, dadurch besserer Abgleich mit der Suchanfrage –  Semantische Anreicherung der Ergebnisbeschreibungen („Snippets“), dadurch

besser fundierte Entscheidung der Nutzer? –  Präsentation von aus Dokumenten zusammengestellten Ergebnissen (auf den

Seiten der Suchmaschine)

Soziale Suche

•  Problem des bisherigen Rankings: Qualität wird vor allem durch Popularität (Links/Klicks) gemessen

•  Populär bei der Masse

•  Populär in einer bestimmten Nutzergruppe

•  Populär bei einem bestimmten Nutzer (Personalisierung)

•  Das Versprechen des „Social Ranking“:

•  Von Bekannten empfohlene Suchergebnisse sind relevanter und vertrauenswürdiger.

•  Problem: Im Gegensatz zu Linkdaten aus dem freien Web handelt es sich bei Sozialen Netzwerken um geschlossene Netzwerke, auf die die Suchmaschinen nicht per Crawling zugreifen können.

Page 6: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

6

Bing und Facebook

•  Vereinbarung über die Nutzung von Facebook-Daten in Bing –  Anmeldung in Bing mit dem Facebook-Account –  Bislang nur in den USA verfügbar –  Bing-Websuche in Facebook integriert

•  Anreicherung der Suchergebnisse durch Daten aus Facebook –  Hervorhebung von Suchergebnisse durch Empfehlungen von Freunden –  Höheres Ranking von empfohlenen Ergebnissen –  Möglichkeit, Suchergebnisse in Facebook zu posten –  Diskussion mit Facebook-Freunden auf den Bing-Ergebnisseiten

12 | Dirk Lewandowski

•  x

Page 7: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

7

Google und Google+

•  Aufbau eines eigenen sozialen Netzwerks durch Google –  Integration in alle Google-Dienste –  Bislang allerdings nicht besonders erfolgreich

•  Anreicherung der Suchergebnisse –  Hervorhebung von Suchergebnisse durch Empfehlungen von Freunden –  Höheres Ranking von empfohlenen Ergebnissen

•  Weiterer Nutzen von Google+ –  „Klarnamen-Pflicht“ –  Kombination mit anderen Profilen im Web (Twitter, etc.) –  Verbindung mit Daten zur Autorschaft (rel=author)

à Dadurch „Vertrauens-Graph“ als weitere Komponente des Rankings

Fazit Soziale Suche

•  Soziale Suche vielschichtig (kollaborative Suche, ...), wichtigster Punkt ist aber das Einbeziehen von Daten aus sozialen Netzwerken in das Ranking und die Ergebnispräsentation.

•  Beide großen Suchmaschinen haben Ansätze, solche Daten zu integrieren. –  Vorteil Bing: Daten aus dem Netzwerk, in dem tatsächlich etwas los ist. –  Vorteil Google: Tiefere Integration möglich, da es sich um ein eigenes Netzwerk

handelt.

Page 8: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

8

15 |

•  x

Anzeigen

Nachrichten

Bilder

Videos

Blogbeiträge

Zusammenstellung der Suchergebnisse

•  Das Suchanfragevolumen ist sehr ungleichmäßig verteilt.

•  Treffer auf den vorderen Plätzen werden sehr stark bevorzugt.

•  Durch entsteht ein großer Einfluss von Suchmaschinen (Google) auf das, was Nutzer zu sehen bekommen.

1.  Dürfen die Suchmaschinen ihre eigenen Angebote / die Angebote von Partnern in der Ergebnisdarstellung bevorzugen?

2.  Tun sie das?

•  „Such-Neutralität“ bedeutet, dass eine Suchmaschine alle Dokumente im Index nach gleichen Kriterien in das Ranking mit einbezieht.

Page 9: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

9

17 | Dirk Lewandowski

•  x

18 | Dirk Lewandowski

•  x

Page 10: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

10

19 | Dirk Lewandowski

•  x

Problemfelder

•  Bevorzugung eigener Angebote –  In den organischen Ergebnissen –  In den Universal-Search-Ergebnissen

•  Aufnahme in den Index –  Bsp. Paid Inclusion bei Google Shopping: Eintragungen sind kostenpflichtig –  Folgen weitere Dienste (Places, ...)?

à Kennzeichnung als eigenes Angebot bzw. Partnerangebot als Lösung?

Page 11: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

11

Vielen Dank für die Aufmerksamkeit.

Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg, Department Information

http://www.bui.haw-hamburg.de/lewandowski.html

[email protected] @Dirk_Lew