Wissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen

Preview:

DESCRIPTION

 

Citation preview

Wissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen?

Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de http://www.bui.haw-hamburg.de/lewandowski.html @Dirk_Lew Universität Rostock, 13. Dezember 2012

Wissensarmut •  These 1: Suchmaschinen ermöglichen einen extrem erleichterten Zugang

zu Informationen, was zu einem (potentiellen) Informationsreichtum führt.

•  These 2: Die Nutzer sind nur eingeschränkt in der Lage, sich diesen Informationsreichtum zu erschließen.

•  These 3: Die positive Bewertung der Suchergebnisse für bestimmte Anfragetypen führt zu einer übertrieben positiven Bewertung der Suchergebnisse als Ganzes.

•  These 4: Kommerzielle Interessen erschweren den Zugang zu Informationen (und damit der Bildung von Wissen).

•  These 5: Nur die Bereitstellung eines zu fairen Konditionen frei zugänglichen Web-Index kann Suchmaschinen zu Werkzeugen im Dienste eines Wissensreichtums machen.

Gliederung

1.  Die Bedeutung der Suchmaschinen 2.  Das Verhalten der Suchmaschinennutzer

3.  Anfragetypen und die Bewertung der Qualität der Suchergebnisse

4.  Interessengeleitete Suchergebnisseiten

5.  Wege zum Wissensreichtum (im Kontext Suchmaschinen)

Gliederung

1.  Die Bedeutung der Suchmaschinen 2.  Das Verhalten der Suchmaschinennutzer

3.  Anfragetypen und die Bewertung der Qualität der Suchergebnisse

4.  Interessengeleitete Suchergebnisseiten

5.  Wege zum Wissensreichtum (im Kontext Suchmaschinen)

Web search: „Always different, always the same“

http://web.archive.org/web/19961023234631/http://altavista.digital.com/

Masse

• In Deutschland in einem Monat 5,6 Milliarden Suchanfragen („Kern-Suche“).

• Pro Tag: >180 Millionen

• Pro Stunde: 7,5 Millionen

• Pro Minute: 125.448

• Pro Sekunde: 2.091

Suchmaschinen

Der Suchmaschinenmarkt (Deutschland)

ComScore-Zahlen März 2012; http://www.focus.de/digital/internet/netzoekonomie-blog/suchmaschinen-googles-marktanteil-steigt- auf-96-prozent-in-deutschland_aid_723240.html

95,9

1,1

0,9

0 10 20 30 40 50 60 70 80 90 100

Google

Bing

Yahoo

Suchmaschinen und Information Overload

•  Zugang zu Informationen durch Suchmaschinen –  Masse (viele Mrd. Dokumente indexiert)

–  Aktualität (allerdings nur schwer in der Recherche bestimmbar)

–  Funktionierendes Ranking (s.u.)

•  Information Overload –  „Information Overload kann anhand der Menge der Informationen definiert

werden, die ein Mensch zu verarbeiten in der Lage ist. Übersteigt die Informationsmenge, die dieser Mensch für seine Arbeit benötigt und verarbeiten kann, für einen nennenswerten Zeitraum sein Fassungsvermögen, so würde er unter Information Overload leiden.“ (Lewandowski, 2012)

Strategien gegen Information Overload

•  Vermeidungsstrategien bzw. unsystematische Linderung –  Informationen ignorieren

–  Beschränkung auf eine Quelle bzw. Quellengruppe

•  Strategien –  Technische Filter

–  Informations- bzw. Recherchekompetenz •  Quellenauswahl

•  Durchführung der Recherche •  Aufbereitung der Ergebnisse

–  Überdenken des Anspruchs auf Vollständigkeit

(Lewandowski, 2012)

Gliederung

1.  Die Bedeutung der Suchmaschinen 2.  Das Verhalten der Suchmaschinennutzer 3.  Anfragetypen und die Bewertung der Qualität der Suchergebnisse

4.  Interessengeleitete Suchergebnisseiten

5.  Wege zum Wissensreichtum (im Kontext Suchmaschinen)

Das typische Verhalten der Suchmaschinennutzer

•  Suchanfragen sind kurz und ungenau –  „Die meisten Nutzer sind nicht willens, bei der Formulierung ihres Suchziels allzu

viel kognitive und zeitliche Energie aufzuwenden.“ (Machill et al., 2003)

•  Trefferselektion beeinflusst durch –  Suchmaschinenmarke (Jansen et al. 2007) –  Position des Treffers (Keane, O'Brien, & Smyth, 2008)

–  Treffer steht im sichtbaren Bereich (Granka et al. 2005; Cutrell 2007)

–  Aussagekräftige Beschreibungen, hervorgehobene Keywords (Lewandowski 2008)

–  Treffer ist besonders hervorgehoben – Universal Search

xxxx

•  xxxx

xxxx

•  xxxx

Gliederung

1.  Die Bedeutung der Suchmaschinen 2.  Das Verhalten der Suchmaschinennutzer

3.  Anfragetypen und die Bewertung der Qualität der Suchergebnisse 4.  Interessengeleitete Suchergebnisseiten

5.  Wege zum Wissensreichtum (im Kontext Suchmaschinen)

Anfragetypen in der Websuche nach Broder (2002)

•  Informational (informationsorientiert) –  Nutzer möchte sich zu einem Thema informieren.

–  Ziel sind mehrere Dokumente. •  Navigational (navigationsorientiert)

–  Ziel ist es, eine bestimmte Seite (wieder) zu finden.

–  Typisch: Suche nach Homepage („Uni Regensburg“).

–  Ziel ist i.d.R. ein Dokument.

•  Transactional (transaktionsorientiert) –  Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden soll.

–  Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei.

Anteile der Anfragetypen

(Lewandowski, Drechsler & von Mach, 2012)

Vergleich der Trefferqualität von Suchmaschinen

1 2 3 4 5 6 7 8 9 10 Google 0,85 0,84 0,83 0,84 0,84 0,84 0,83 0,82 0,82 0,82 Bing 0,83 0,82 0,81 0,80 0,77 0,78 0,78 0,77 0,77 0,79

0,00

0,10

0,20

0,30

0,40

0,50

0,60

0,70

0,80

0,90

1,00

Prec

isio

n

Position (Kumuliert)

Bewertung des Sucherfolgs durch Nutzer

•  Bewertung nach Anfragetypen –  Informationsorientiert à Nachweis schwierig (Annahme: 50% eindeutig bewertbar)

– Navigationsorientiert à Nachweis eindeutig (Annahme: 100% eindeutig bewertbar)

–  Transaktionsorientiert à Nachweis leicht bis schwierig (Annahme: 50% eindeutig bewertbar)

Gliederung

1.  Die Bedeutung der Suchmaschinen 2.  Das Verhalten der Suchmaschinennutzer

3.  Anfragetypen und die Bewertung der Qualität der Suchergebnisse

4.  Interessengeleitete Suchergebnisseiten 5.  Wege zum Wissensreichtum (im Kontext Suchmaschinen)

Gruppen von Rankingfaktoren bei Suchmaschinen

•  Textstatistik –  „Wie gut passen Anfrage und Dokument zusammen?“ –  Worthäufigkeiten, Position der Suchbegriffe im Dokument, ...

•  Popularität –  „Wie wahrscheinlich ist es, dass der Nutzer bei seiner Web-Navigation auf dieses

Dokument treffen würde?“ –  Linkpopularität (linktopologisches Modell), Klickpopularität (Nutzungsmodell).

•  Aktualität –  „Sollen für diese Anfrage aktuelle Dokumente ausgegeben werden?“ –  Datumsangaben, Linkstruktur, ...

•  Lokalität (=Nutzermodell/Standort) –  „Welche Dokumente passen zur ‚Umgebung‘ des Nutzers?“ –  Länderinterfaces

Im Detail: Lewandowski 2005, Kap. 6

Gruppen von Rankingfaktoren bei Suchmaschinen

•  Textstatistik –  „Wie gut passen Anfrage und Dokument zusammen?“ –  Worthäufigkeiten, Position der Suchbegriffe im Dokument, ...

•  Popularität –  „Wie wahrscheinlich ist es, dass der Nutzer bei seiner Web-Navigation auf dieses

Dokument treffen würde?“ –  Linkpopularität (linktopologisches Modell), Klickpopularität (Nutzungsmodell).

•  Aktualität –  „Sollen für diese Anfrage aktuelle Dokumente ausgegeben werden?“ –  Datumsangaben, Linkstruktur, ...

•  Lokalität (=Nutzermodell/Standort) –  „Welche Dokumente passen zur ‚Umgebung‘ des Nutzers?“ –  Länderinterfaces

vor 1998

1998

2001

2004

Im Detail: Lewandowski 2005, Kap. 6

Popularität als Hilfskonstruktion zur Messung von Glaubwürdigkeit

���

&UHGLELOLW\�LQ�:HE�6HDUFK�(QJLQHV

E��� &OLFN�%DVHG�0HDVXUHV��8VLQJ�FOLFN�EDVHG�PHDVXUHV� WR�GHWHUPLQH�TXDOLW\�KDV�WKH�DGYDQWDJH�WKDW�VXFK�PHDVXUHV�DUH�DYDLODEOH�DOPRVW�LPPHGLDWHO\��ZKLOH�OLQN�EDVHG�PHDVXUHV� UHTXLUH� WLPH� WR�EXLOG�XS��7KH�GUDZEDFN��KRZHYHU��LV�WKDW�LQ�VHDUFK�HQJLQHV��PRVW�XVHUV�RQO\�FOLFN� RQ� WKH� UHVXOWV� SUHVHQWHG� ILUVW��WKHUHIRUH�� FOLFN�EDVHG� PHDVXUHV� DUH�KHDYLO\�ELDVHG��DV�QRW�HYHU\�GRFXPHQW�HYHQ�KDV�WKH�RSSRUWXQLW\�WR�EH�VHOHFWHG�

F��� 6RFLDO�6LJQDOV��,Q�WKH�FRQWH[W�RI�VRFLDO�PHGLD��H[SOLFLW� UDWLQJV�RI�GRFXPHQWV�DUH�XELTXLWRXV���7KHVH�MXGJPHQWV�FDQ�EH�H[SORLWHG�IRU�UDQNLQJ��DVVXPLQJ�WKDW�WKH� VHDUFK�HQJLQH�KDV�DFFHVV� WR�GDWD�IURP�D�VRFLDO�QHWZRUN�

���� )UHVKQHVV��7KH�HYDOXDWLRQ�RI�IUHVKQHVV�LV�LPSRUWDQW� IRU�:HE� VHDUFK� HQJLQHV� LQ� WZR�UHVSHFWV��)LUVWO\��LW�LV�D�PDWWHU�RI�ILQGLQJ�WKH�DFWXDO� RU� UHODWLYH� SXEOLFDWLRQ� DQG� UHIUHVK�GDWHV��$FKDU\D�HW�DO����������6HFRQGO\��WKH�TXHVWLRQ�FRQFHUQV�ZKLFK�VLWXDWLRQV�LW�LV�XVH�IXO�WR�GLVSOD\�IUHVK�GRFXPHQWV�SUHIHUHQWLDOO\�

���� /RFDOLW\��.QRZLQJ� WKH� ORFDWLRQ�RI� DQ� LQ�GLYLGXDO�XVHU�LV�RI�JUHDW�XVH�IRU�SURYLGLQJ�UHOHYDQW�UHVXOWV��7KLV�QRW�RQO\�KROGV�WUXH�LQ�D�PRELOH�FRQWH[W��EXW�DOVR�IRU�GHVNWRS�XVH�

���� 3HUVRQDOL]DWLRQ��7KH�DLP�WR�SURYLGH�XVHUV�ZLWK� WDLORUHG� UHVXOWV� LV� UHIHUUHG� WR� DV�SHU�

VRQDOL]DWLRQ�DQG�FRPELQHV�PHDVXUHV�IURP�WKH� XVHU¶V� RZQ� EHKDYLRU� �WKURXJK� TXHULHV�HQWHUHG��UHVXOWV�VHOHFWHG��UHDGLQJ�WLPH��ZLWK�PHDVXUHV�IURP�RWKHU�XVHUV¶�EHKDYLRU��IRFXV�LQJ�RQ�WKH�RQH�KDQG�RQ�DOO�XVHUV��DQG�RQ�WKH�RWKHU�KDQG�RQ�WKH�XVHUV�VRFLDOO\�FRQQHFWHG�WR� WKH�XVHU� LQ�TXHVWLRQ���DQG�ZLWK�JHQHUDO�PHDVXUHV��IUHVKQHVV�DQG�ORFDOLW\��

)URP�WKLV�VKRUW�H[SODQDWLRQ�RI�VHDUFK�HQJLQH�UDQNLQJ�VLJQDOV��ZH�FDQ�FRQFOXGH� WKDW�SRSXODU�LW\� OLHV� DW� WKH� KHDUW� RI� WKHVH� V\VWHPV�� ZKHWKHU�VXFK�SRSXODULW\�H[LVWV�ZLWK�DOO�WKH�:HE¶V�FRQWHQW�SURGXFHUV��ZKR�VHW�OLQNV�WR�RWKHU�SDJHV�DQG�WKXV�GHWHUPLQH� WKHLU�SRSXODULW\���ZLWK�D�FHUWDLQ�XVHU�JURXS��H�J���WKH�FRQWDFWV�RI�DQ�LQGLYLGXDO�XVHU���RU�ZLWK�DQ�LQGLYLGXDO�XVHU��WKURXJK�KLV�FOLFNV�DQG�YLHZLQJ�SDWWHUQV��

7KH�TXHVWLRQ�WKDW�DULVHV�IURP�WKH�GLVFXVVLRQ�RI�UDQNLQJ�VLJQDOV�LV�KRZ�VHDUFK�HQJLQHV�DUH�DEOH�WR�VKRZ�FUHGLEOH�UHVXOWV�ZLWKRXW�H[SOLFLWO\�FRQVLGHU�LQJ�FUHGLELOLW\�LQ�WKH�GRFXPHQWV��:KHQ�ORRNLQJ�DW�FUHGLELOLW\�RU��PRUH�JHQHUDOO\��LQIRUPDWLRQ�TXDOLW\�IUDPHZRUNV��.QLJKW��%XUQ��������:DQJ��;LH��� *RK�� ������ ;LH��:DQJ�� � *RK�� ������� ZH�FDQ�VHH�WKDW�WKH�FULWHULD�JHQHUDOO\�PHQWLRQHG�DUH�QRW� HDVLO\� DSSOLFDEOH� WR� DOJRULWKPV��7KHUHIRUH��³ZRUNDURXQGV´�PXVW�EH�IRXQG�

,Q�7DEOH����PHDVXUHV�XVHG� WR�GHWHUPLQH� WKH�FUHGLELOLW\�RI�GRFXPHQWV�DUH�VKRZQ��&UHGLELOLW\�

7DEOH����,PSOLFLW�PHDVXUHV�RI�FUHGLELOLW\�DV�DSSOLHG�E\�VHDUFK�HQJLQHV�

&UHGLELOLW\�WKURXJK« 0HDVXUHV %DVHG�RQ«

6RXUFH 'RPDLQ�SRSXODULW\ /LQN�JUDSK

6HOHFWLRQ�EHKDYLRU ��&OLFN�WKURXJK�UDWH��L�H���KRZ�RIWHQ�D�FHUWDLQ�GRFXPHQW�LV�VHOHFWHG�ZKHQ�VKRZQ���7LPH�VSHQW�UHDGLQJ�ZKHQ�GRFXPHQW�ZDV�VHOHFWHG���%RXQFH�UDWH��L�H���KRZ�RIWHQ�D�XVHU�³ERXQFHV�EDFN´�WR�WKH�6(53�LPPHGLDWHO\�DIWHU�VHOHFWLQJ�WKH�GRFXPHQW

��,QGLYLGXDO�XVHU���8VHU�JURXS���8VHU�SRSXODWLRQ

5HFRPPHQGDWLRQ�WKURXJK�OLQNV �:HLJKWHG��QXPEHU�RI�OLQNV�SRLQWLQJ�WR�D�FHUWDLQ�GRFX�PHQW

��/LQNV�IURP�DOO�RWKHU�SDJHV���/LQNV�IURP�D�JURXS�RI�SDJHV��H�J���IURP�WRSLFDOO\�UHOHYDQW�SDJHV

([SOLFLW�UDWLQJV 1XPEHU�RI�³OLNHV�´�L�H���QXPEHU�RI�XVHUV�ZKR�H[SOLFLWO\�FOLFNHG�RQ�D�³OLNH´�EXWWRQ�VXFK�DV�)DFHERRN¶V

��8VHU�JURXS���8VHU�SRSXODWLRQ

(Lewandowski, 2012)

Ergebnisseite als Ganzes

•  Suchergebnisseite –  Search Engine Results Page (SERP)

•  Drei Bereiche: – Organische Ergebnisse – Navigationselemente

– Werbung

•  Wahrnehmung der SERP: Der Knick („fold“) –  Above the fold

–  Below the fold

Organische Ergebnisse

•  „Organisch“ = aus dem Index der Suchmaschine erzeugt

–  Alle Dokumente aus dem Index haben potentiell die gleiche Chance, zu einer Suchanfrage gezeigt zu werden.

•  Sonderfall: Universal-Search-Ergebnisse – Universal-Search-Ergebnisse kommen aus speziellen

Indices („Kollektionen“) und werden in die Liste der organischen Ergebnisse eingespeist.

Werbung

•  Textanzeigen –  Kontextbasiert (in Relation zur

Suchanfrage)

– Oberhalb, unterhalb oder neben den organischen Ergebnissen

Beispiel für Werbung

•  Kennzeichnung –  Farblich hinterlegt

–  Anzeigenblöcke mit dem Wort „Anzeigen“ gekennzeichnet.

•  Unterscheidbarkeit von organischen Ergebnissen und Werbung

– Werbung kann relevant sein; Werbung wie organische Ergebnisse beschrieben

Suchmaschinenoptimierung (SEO)

•  Definition •  Alle Maßnahmen, die dazu geeignet sind, die Position von Webseiten im Ranking

der Suchmaschinen zu verbessern.

•  Kommerzieller Bereich –  Etablierte Branche; alle nennenswerten Websites verwenden

Suchmaschinenoptimierung

•  Weiterentwicklung von SEO –  NGOs

–  Academic Search Engine Optimization

XXXX

•  xxxx –  xxxx

–  xxxx

•  xxxx –  xxxx

–  xxxx

Universal Search

Universal Search

Können Suchmaschinen-Ergebnisseiten (SERPs) neutral sein?

•  Probleme in allen Bereichen der SERP –  Anzeigen: Unterscheidbar von den organischen Suchergebnissen?

–  Organische Ergebnisse: Durch SEO manipuliert?

–  Universal Search: Werbung für die eigenen Angebote der Suchmaschinen?

•  Was wäre eine neutrale Suchergebnisseite? –  Anzeigen klar von den organischen Ergebnissen getrennt + gekennzeichnet

–  Hinweise auf eigene Angebote klar gekennzeichnet; Alternativen angegeben

–  Durch SEO optimierte Seiten gekennzeichnet?

Gliederung

1.  Die Bedeutung der Suchmaschinen 2.  Das Verhalten der Suchmaschinennutzer

3.  Anfragetypen und die Bewertung der Qualität der Suchergebnisse

4.  Interessengeleitete Suchergebnisseiten

5.  Wege zum Wissensreichtum (im Kontext Suchmaschinen)

Index vs. Suchinterface

•  Suchmaschinen mit eigenem Index – Google, Bing, Exalead, ...

•  Suchmaschinen, die auf einen Partnerindex zurückgreifen –  T-Online, Web.de, AOL.de, ...

•  Geschäftsmodell Partnerindices –  Eine Suchmaschine mit eigenem Index stellt (1) ihre statischen Ergebnissets und

(2) ihre Textanzeigen dem Partner zur Verfügung

– Das mit den Werbeklicks verdiente Geld wird nach einem vorher festgelegten Schlüssel zwischen Suchmaschine und Partner aufgeteilt

Das Beziehungsgeflecht der Suchmaschinen (1)

Grafik mit historischer Entwicklung unter http://www.bruceclay.com/eu/serc_histogram/histogram.htm

Vision: Ein frei zugänglicher Suchmaschinenindex

•  Neue Suchmaschinen können nicht entstehen, da die Anfangsinvestitionen zu hoch sind.

•  Die Idee einer staatlichen / öffentlich-rechtlichen Suchmaschine ist gescheitert (und nicht wünschenswert).

•  Lösung: Bereitstellung eines Index, auf den alle frei zu fairen Bedingungen zugreifen können.

•  Ziel: Informationsvielfalt durch Suchmaschinen.

Wege zum Wissensreichtum: Zwei Bereiche

•  Individuum –  Informationskompetenz

–  Neu: Informationskompetenz hinsichtlich der Manipulierbarkeit von Suchergebnissen

•  Suchmaschinen –  Index vs. Suchmaschine

–  Neu: Vielfalt durch zahlreiche Suchmaschinen, die den gleichen Datenbestand verwenden können.

à Wissensreichtum durch eine Vielfalt von Suchmaschinen, die von kompetenten Nutzern bedient werden.

Wissensarmut •  These 1: Suchmaschinen ermöglichen einen extrem erleichterten Zugang

zu Informationen, was zu einem (potentiellen) Informationsreichtum führt.

•  These 2: Die Nutzer sind nur eingeschränkt in der Lage, sich diesen Informationsreichtum zu erschließen.

•  These 3: Die positive Bewertung der Suchergebnisse für bestimmte Anfragetypen führt zu einer übertrieben positiven Bewertung der Suchergebnisse als Ganzes.

•  These 4: Kommerzielle Interessen erschweren den Zugang zu Informationen (und damit der Bildung von Wissen).

•  These 5: Nur die Bereitstellung eines zu fairen Konditionen frei zugänglichen Web-Index kann Suchmaschinen zu Werkzeugen im Dienste eines Wissensreichtums machen.

Vielen Dank für Ihre Aufmerksamkeit Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg dirk.lewandowski@haw-hamburg,de Twitter: Dirk_Lew http://www.bui.haw-hamburg.de/ lewandowski.html

Recommended