Upload
dirk-lewandowski
View
63
Download
1
Embed Size (px)
DESCRIPTION
15.04.13
1
Neue Entwicklungen im Suchmaschinenbereich und deren Relevanz für Bibliotheken
Prof. Dr. Dirk Lewandowski [email protected] http://www.bui.haw-hamburg.de/lewandowski.html @Dirk_Lew
15.04.13
2
Inhalt
1. Der Suchmaschinenmarkt: Wo stehen wir heute? 2. Das Ranking der Suchmaschinen
3. Ergebnispräsentation
4. Anfragetypen
5. Aktuelle Entwicklungen – Semantische Suche
– Soziale Suche
– Suchneutralität
• Suchmaschinen und Bibliotheken – Handlungsfeld Bibliothekarische Informationssysteme
– Handlungsfeld Informationskompetenz
Der Suchmaschinenmarkt: Wo stehen wir heute?
• Suchmaschinen sind der Zugang zum Wissen im Web • (Quasi-)Monopol in der Web-Suche, Vielfalt in anderen Bereichen
• Suche bleibt ein weitgehend unterschätzter Bereich
15.04.13
3
Suchmaschinen
E-Commerce
15.04.13
4
Site-intern und andere Datenbestände
Masse
• In Deutschland in einem Monat 5,6 Milliarden Suchanfragen („Kern-Suche“).
• Pro Tag: >180 Millionen
• Pro Stunde: 7,5 Millionen
• Pro Minute: 125.448
• Pro Sekunde: 2.091
15.04.13
5
Web search: „Always different, always the same“
http://web.archive.org/web/19961023234631/http://altavista.digital.com/
Modell der Websuche
15.04.13
6
Kernkomponenten einer Suchmaschine
(Risvik & Michelsen 2002)
15.04.13
7
Gruppen von Rankingfaktoren bei Suchmaschinen
• Textstatistik – „Wie gut passen Anfrage und Dokument zusammen?“ – Worthäufigkeiten, Position der Suchbegriffe im Dokument, ...
• Popularität – „Wie wahrscheinlich ist es, dass der Nutzer bei seiner Web-Navigation auf dieses
Dokument treffen würde?“ – Linkpopularität (linktopologisches Modell), Klickpopularität (Nutzungsmodell).
• Aktualität – „Sollen für diese Anfrage aktuelle Dokumente ausgegeben werden?“ – Datumsangaben, Linkstruktur, ...
• Lokalität (=Nutzermodell/Standort) – „Welche Dokumente passen zur ‚Umgebung‘ des Nutzers?“ – Länderinterfaces
Im Detail: Lewandowski 2005, Kap. 6
Gruppen von Rankingfaktoren bei Suchmaschinen
• Textstatistik – „Wie gut passen Anfrage und Dokument zusammen?“ – Worthäufigkeiten, Position der Suchbegriffe im Dokument, ...
• Popularität – „Wie wahrscheinlich ist es, dass der Nutzer bei seiner Web-Navigation auf dieses
Dokument treffen würde?“ – Linkpopularität (linktopologisches Modell), Klickpopularität (Nutzungsmodell).
• Aktualität – „Sollen für diese Anfrage aktuelle Dokumente ausgegeben werden?“ – Datumsangaben, Linkstruktur, ...
• Lokalität (=Nutzermodell/Standort) – „Welche Dokumente passen zur ‚Umgebung‘ des Nutzers?“ – Länderinterfaces
vor 1998
1998
2001
2004
Im Detail: Lewandowski 2005, Kap. 6
15.04.13
8
Popularität als Hilfskonstruktion zur Messung von Glaubwürdigkeit
���
&UHGLELOLW\�LQ�:HE�6HDUFK�(QJLQHV
E��� &OLFN�%DVHG�0HDVXUHV��8VLQJ�FOLFN�EDVHG�PHDVXUHV� WR�GHWHUPLQH�TXDOLW\�KDV�WKH�DGYDQWDJH�WKDW�VXFK�PHDVXUHV�DUH�DYDLODEOH�DOPRVW�LPPHGLDWHO\��ZKLOH�OLQN�EDVHG�PHDVXUHV� UHTXLUH� WLPH� WR�EXLOG�XS��7KH�GUDZEDFN��KRZHYHU��LV�WKDW�LQ�VHDUFK�HQJLQHV��PRVW�XVHUV�RQO\�FOLFN� RQ� WKH� UHVXOWV� SUHVHQWHG� ILUVW��WKHUHIRUH�� FOLFN�EDVHG� PHDVXUHV� DUH�KHDYLO\�ELDVHG��DV�QRW�HYHU\�GRFXPHQW�HYHQ�KDV�WKH�RSSRUWXQLW\�WR�EH�VHOHFWHG�
F��� 6RFLDO�6LJQDOV��,Q�WKH�FRQWH[W�RI�VRFLDO�PHGLD��H[SOLFLW� UDWLQJV�RI�GRFXPHQWV�DUH�XELTXLWRXV���7KHVH�MXGJPHQWV�FDQ�EH�H[SORLWHG�IRU�UDQNLQJ��DVVXPLQJ�WKDW�WKH� VHDUFK�HQJLQH�KDV�DFFHVV� WR�GDWD�IURP�D�VRFLDO�QHWZRUN�
���� )UHVKQHVV��7KH�HYDOXDWLRQ�RI�IUHVKQHVV�LV�LPSRUWDQW� IRU�:HE� VHDUFK� HQJLQHV� LQ� WZR�UHVSHFWV��)LUVWO\��LW�LV�D�PDWWHU�RI�ILQGLQJ�WKH�DFWXDO� RU� UHODWLYH� SXEOLFDWLRQ� DQG� UHIUHVK�GDWHV��$FKDU\D�HW�DO����������6HFRQGO\��WKH�TXHVWLRQ�FRQFHUQV�ZKLFK�VLWXDWLRQV�LW�LV�XVH�IXO�WR�GLVSOD\�IUHVK�GRFXPHQWV�SUHIHUHQWLDOO\�
���� /RFDOLW\��.QRZLQJ� WKH� ORFDWLRQ�RI� DQ� LQ�GLYLGXDO�XVHU�LV�RI�JUHDW�XVH�IRU�SURYLGLQJ�UHOHYDQW�UHVXOWV��7KLV�QRW�RQO\�KROGV�WUXH�LQ�D�PRELOH�FRQWH[W��EXW�DOVR�IRU�GHVNWRS�XVH�
���� 3HUVRQDOL]DWLRQ��7KH�DLP�WR�SURYLGH�XVHUV�ZLWK� WDLORUHG� UHVXOWV� LV� UHIHUUHG� WR� DV�SHU�
VRQDOL]DWLRQ�DQG�FRPELQHV�PHDVXUHV�IURP�WKH� XVHU¶V� RZQ� EHKDYLRU� �WKURXJK� TXHULHV�HQWHUHG��UHVXOWV�VHOHFWHG��UHDGLQJ�WLPH��ZLWK�PHDVXUHV�IURP�RWKHU�XVHUV¶�EHKDYLRU��IRFXV�LQJ�RQ�WKH�RQH�KDQG�RQ�DOO�XVHUV��DQG�RQ�WKH�RWKHU�KDQG�RQ�WKH�XVHUV�VRFLDOO\�FRQQHFWHG�WR� WKH�XVHU� LQ�TXHVWLRQ���DQG�ZLWK�JHQHUDO�PHDVXUHV��IUHVKQHVV�DQG�ORFDOLW\��
)URP�WKLV�VKRUW�H[SODQDWLRQ�RI�VHDUFK�HQJLQH�UDQNLQJ�VLJQDOV��ZH�FDQ�FRQFOXGH� WKDW�SRSXODU�LW\� OLHV� DW� WKH� KHDUW� RI� WKHVH� V\VWHPV�� ZKHWKHU�VXFK�SRSXODULW\�H[LVWV�ZLWK�DOO�WKH�:HE¶V�FRQWHQW�SURGXFHUV��ZKR�VHW�OLQNV�WR�RWKHU�SDJHV�DQG�WKXV�GHWHUPLQH� WKHLU�SRSXODULW\���ZLWK�D�FHUWDLQ�XVHU�JURXS��H�J���WKH�FRQWDFWV�RI�DQ�LQGLYLGXDO�XVHU���RU�ZLWK�DQ�LQGLYLGXDO�XVHU��WKURXJK�KLV�FOLFNV�DQG�YLHZLQJ�SDWWHUQV��
7KH�TXHVWLRQ�WKDW�DULVHV�IURP�WKH�GLVFXVVLRQ�RI�UDQNLQJ�VLJQDOV�LV�KRZ�VHDUFK�HQJLQHV�DUH�DEOH�WR�VKRZ�FUHGLEOH�UHVXOWV�ZLWKRXW�H[SOLFLWO\�FRQVLGHU�LQJ�FUHGLELOLW\�LQ�WKH�GRFXPHQWV��:KHQ�ORRNLQJ�DW�FUHGLELOLW\�RU��PRUH�JHQHUDOO\��LQIRUPDWLRQ�TXDOLW\�IUDPHZRUNV��.QLJKW��%XUQ��������:DQJ��;LH��� *RK�� ������ ;LH��:DQJ�� � *RK�� ������� ZH�FDQ�VHH�WKDW�WKH�FULWHULD�JHQHUDOO\�PHQWLRQHG�DUH�QRW� HDVLO\� DSSOLFDEOH� WR� DOJRULWKPV��7KHUHIRUH��³ZRUNDURXQGV´�PXVW�EH�IRXQG�
,Q�7DEOH����PHDVXUHV�XVHG� WR�GHWHUPLQH� WKH�FUHGLELOLW\�RI�GRFXPHQWV�DUH�VKRZQ��&UHGLELOLW\�
7DEOH����,PSOLFLW�PHDVXUHV�RI�FUHGLELOLW\�DV�DSSOLHG�E\�VHDUFK�HQJLQHV�
&UHGLELOLW\�WKURXJK« 0HDVXUHV %DVHG�RQ«
6RXUFH 'RPDLQ�SRSXODULW\ /LQN�JUDSK
6HOHFWLRQ�EHKDYLRU ��&OLFN�WKURXJK�UDWH��L�H���KRZ�RIWHQ�D�FHUWDLQ�GRFXPHQW�LV�VHOHFWHG�ZKHQ�VKRZQ���7LPH�VSHQW�UHDGLQJ�ZKHQ�GRFXPHQW�ZDV�VHOHFWHG���%RXQFH�UDWH��L�H���KRZ�RIWHQ�D�XVHU�³ERXQFHV�EDFN´�WR�WKH�6(53�LPPHGLDWHO\�DIWHU�VHOHFWLQJ�WKH�GRFXPHQW
��,QGLYLGXDO�XVHU���8VHU�JURXS���8VHU�SRSXODWLRQ
5HFRPPHQGDWLRQ�WKURXJK�OLQNV �:HLJKWHG��QXPEHU�RI�OLQNV�SRLQWLQJ�WR�D�FHUWDLQ�GRFX�PHQW
��/LQNV�IURP�DOO�RWKHU�SDJHV���/LQNV�IURP�D�JURXS�RI�SDJHV��H�J���IURP�WRSLFDOO\�UHOHYDQW�SDJHV
([SOLFLW�UDWLQJV 1XPEHU�RI�³OLNHV�´�L�H���QXPEHU�RI�XVHUV�ZKR�H[SOLFLWO\�FOLFNHG�RQ�D�³OLNH´�EXWWRQ�VXFK�DV�)DFHERRN¶V
��8VHU�JURXS���8VHU�SRSXODWLRQ
(Lewandowski, 2012)
Trefferpräsentation in Suchmaschinen
• Text
8 |
• x
Anzeigen
Organische Ergebnisse
Universal-Search-
Ergebnisse
15.04.13
9
Ergebnisseite als Ganzes
• Suchergebnisseite – Search Engine Results Page (SERP)
• Drei Bereiche: – Organische Ergebnisse – Navigationselemente
– Werbung
• Wahrnehmung der SERP: Der Knick („fold“) – Above the fold
– Below the fold
Treffer 1
Treffer 2
Treffer 3
Treffer 4
Treffer 4
Suchfeld, Optionen
Werbung Werbung Navigation, Optionen
15.04.13
10
Das typische Verhalten der Suchmaschinennutzer
• Suchanfragen sind kurz und ungenau – „Die meisten Nutzer sind nicht willens, bei der Formulierung ihres Suchziels allzu
viel kognitive und zeitliche Energie aufzuwenden.“ (Machill et al., 2003)
• Trefferselektion beeinflusst durch – Suchmaschinenmarke (Jansen et al. 2007) – Position des Treffers (Keane, O'Brien, & Smyth, 2008)
– Treffer steht im sichtbaren Bereich (Granka et al. 2005; Cutrell 2007)
– Aussagekräftige Beschreibungen, hervorgehobene Keywords (Lewandowski 2008)
– Treffer ist besonders hervorgehoben – Universal Search
xxxx
• xxxx
15.04.13
11
xxxx
• xxxx
xxxx
• xxxx
15.04.13
12
Anfragetypen in der Websuche nach Broder (2002)
• Informational (informationsorientiert) – Nutzer möchte sich zu einem Thema informieren.
– Ziel sind mehrere Dokumente. • Navigational (navigationsorientiert)
– Ziel ist es, eine bestimmte Seite (wieder) zu finden.
– Typisch: Suche nach Homepage („Uni Regensburg“).
– Ziel ist i.d.R. ein Dokument.
• Transactional (transaktionsorientiert) – Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden soll.
– Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei.
Anteile der Anfragetypen
(Lewandowski, Drechsler & von Mach, 2012)
15.04.13
13
Vielen Dank für die Aufmerksamkeit.
Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg, Department Information
http://www.bui.haw-hamburg.de/lewandowski.html
[email protected] @Dirk_Lew