4
{ AKTUELLES SCHLAGWORT* / WEB SCIENCE Web Science 1 Steffen Staab Das World Wide Web ist ein Informationsmedium, das sich dadurch auszeichnet, dass es von seinen Benutzern gleichzeitig geschaffen, konsumiert und modifiziert wird und dass dabei die Gren- zen zwischen Informationskonsum, -produktion und -modifikation verwischen. Selbst vermeintlich statische Hypertextseiten werden weitergeschrie- ben, erst recht sind Wiki-Seiten, Seiten in sozialen Online-Netzwerken, Webseiten mit Empfehlungs- funktionen, Like-Buttons, Kommentarfeldern oder Diskussionsforen so dynamisch, dass ihr Aussehen und ihre Inhalte auf der lokalen Website aufgrund der Benutzerinteraktionen angepasst werden. Die Auswahl des Konsumenten, z. B. durch Ver- folgen eines Links, beeinflusst aber auch im globalen Web die Darstellung von Inhalten. Besonders of- fensichtlich ist dieser Zusammenhang, wenn in Suchmaschinen die Ergebnisauswahl eines Nutzers die Suchergebnisse aller anderen Nutzer beeinflusst. Subtiler, aber gleichzeitig viel weitreichender ist aber die Tatsache, dass die Vernetzung von Informa- tionsdiensten wie z. B. von Suchmaschinen, sozialen Netzwerken, Werbediensten und Betriebssyste- men auf mobilen Endger¨ aten dazu f¨ uhren, dass die Aktivit¨ aten einer Person auf einer Webseite zur Mo- difikation der pr¨ asentierten Inhalte und Optionen auf anderen Webseiten f¨ uhrt. Wenn Benutzer des Webs gleichzeitig Kon- sumenten, Produzenten und Modifikatoren von Informationen sind und dadurch die Informati- onspr¨ asentationen und die Informationssichten anderer beeinflussen, dann l ¨ asst sich das Web nicht nur als ein dezentrales System von technischen Kom- ponenten beschreiben. Vielmehr bedarf es einer 1 Ein Langversion dieses Artikels ist erschienen in Staab 2013 [12]. systemischen Sichtweise, die untersucht, wie Vor- wissen, Kognition, Affekte, soziale Interaktionen und gesellschaftliche Diskurse im Web (z. B. die Dis- kussion zum PRISM ¨ Uberwachungsprogramm der NSA) die Benutzer in ihrem Verhalten beeinflus- sen, mit dem sie neue Information konsumieren, produzieren und modifizieren, und wie positive und negative Anreize, wie etwa ¨ okonomischer oder sozialer Gewinn, dieses Verhalten steuern. Auch eine nicht-technische Untersuchung von Be- nutzerverhalten w¨ urde hier zu kurz greifen, denn die verwendeten technischen Plattformen und In- frastrukturen im World Wide Web k¨ onnen das Benutzerverhalten begrenzen, erweitern oder auch subtil modifizieren – z. B. durch die Reaktionsge- schwindigkeit des Systems oder durch das Ranking und das Layout von Informationen. Solche systemischen, soziotechnischen Mecha- nismen sind bisher wenig untersucht. Da es um die Verarbeitung und Interpretation von Informa- tion sowie um die Beeinflussung menschlichen Verhaltens geht, spielen Effekte eine Rolle, die ¨ ublicherweise in verschiedenen wissenschaftlichen Disziplinen untersucht werden. Durch die zentrale Rolle, die diese Effekte in Bezug auf Wirkung und die R¨ uckkopplung innerhalb des Systems einnehmen, DOI 10.1007/s00287-013-0740-x © Springer-Verlag Berlin Heidelberg 2013 Steffen Staab Universität Koblenz-Landau 56016 Koblenz E-Mail: [email protected] *Vorschläge an Prof. Dr. Frank Puppe <[email protected]> oder Prof. Dr. Dieter Steinbauer <[email protected]> Alle „Aktuellen Schlagwörter“ seit 1988 finden Sie unter: www.ai-wuerzburg.de/as 548 Informatik_Spektrum_36_6_2013

Web Science

Embed Size (px)

Citation preview

Page 1: Web Science

{ AKTUELLES SCHLAGWORT* / WEB SCIENCE

Web Science1

Steffen Staab

Das World Wide Web ist ein Informationsmedium,das sich dadurch auszeichnet, dass es von seinenBenutzern gleichzeitig geschaffen, konsumiertund modifiziert wird und dass dabei die Gren-zen zwischen Informationskonsum, -produktionund -modifikation verwischen. Selbst vermeintlichstatische Hypertextseiten werden weitergeschrie-ben, erst recht sind Wiki-Seiten, Seiten in sozialenOnline-Netzwerken, Webseiten mit Empfehlungs-funktionen, Like-Buttons, Kommentarfeldern oderDiskussionsforen so dynamisch, dass ihr Aussehenund ihre Inhalte auf der lokalen Website aufgrundder Benutzerinteraktionen angepasst werden.

Die Auswahl des Konsumenten, z. B. durch Ver-folgen eines Links, beeinflusst aber auch im globalenWeb die Darstellung von Inhalten. Besonders of-fensichtlich ist dieser Zusammenhang, wenn inSuchmaschinen die Ergebnisauswahl eines Nutzersdie Suchergebnisse aller anderen Nutzer beeinflusst.Subtiler, aber gleichzeitig viel weitreichender istaber die Tatsache, dass die Vernetzung von Informa-tionsdiensten wie z. B. von Suchmaschinen, sozialenNetzwerken, Werbediensten und Betriebssyste-men auf mobilen Endgeraten dazu fuhren, dass dieAktivitaten einer Person auf einer Webseite zur Mo-difikation der prasentierten Inhalte und Optionenauf anderen Webseiten fuhrt.

Wenn Benutzer des Webs gleichzeitig Kon-sumenten, Produzenten und Modifikatoren vonInformationen sind und dadurch die Informati-onsprasentationen und die Informationssichtenanderer beeinflussen, dann lasst sich das Web nichtnur als ein dezentrales System von technischen Kom-ponenten beschreiben. Vielmehr bedarf es einer

1 Ein Langversion dieses Artikels ist erschienen in Staab 2013 [12].

systemischen Sichtweise, die untersucht, wie Vor-wissen, Kognition, Affekte, soziale Interaktionenund gesellschaftliche Diskurse im Web (z. B. die Dis-kussion zum PRISM Uberwachungsprogramm derNSA) die Benutzer in ihrem Verhalten beeinflus-sen, mit dem sie neue Information konsumieren,produzieren und modifizieren, und wie positiveund negative Anreize, wie etwa okonomischeroder sozialer Gewinn, dieses Verhalten steuern.Auch eine nicht-technische Untersuchung von Be-nutzerverhalten wurde hier zu kurz greifen, denndie verwendeten technischen Plattformen und In-frastrukturen im World Wide Web konnen dasBenutzerverhalten begrenzen, erweitern oder auchsubtil modifizieren – z. B. durch die Reaktionsge-schwindigkeit des Systems oder durch das Rankingund das Layout von Informationen.

Solche systemischen, soziotechnischen Mecha-nismen sind bisher wenig untersucht. Da es umdie Verarbeitung und Interpretation von Informa-tion sowie um die Beeinflussung menschlichenVerhaltens geht, spielen Effekte eine Rolle, dieublicherweise in verschiedenen wissenschaftlichenDisziplinen untersucht werden. Durch die zentraleRolle, die diese Effekte in Bezug auf Wirkung und dieRuckkopplung innerhalb des Systems einnehmen,

DOI 10.1007/s00287-013-0740-x© Springer-Verlag Berlin Heidelberg 2013

Steffen StaabUniversität Koblenz-Landau56016 KoblenzE-Mail: [email protected]

*Vorschläge an Prof. Dr. Frank Puppe<[email protected]> oderProf. Dr. Dieter Steinbauer <[email protected]>

Alle „Aktuellen Schlagwörter“ seit 1988 finden Sie unter:www.ai-wuerzburg.de/as

548 Informatik_Spektrum_36_6_2013

Page 2: Web Science

Abb. 1 Mikrointeraktionen fuhren zu Makroeffekten im Web. Web Science strebt an, diese Zusammenhange zu verstehen und zunutzen (Quelle: http://commons.wikimedia.org/wiki/File:Human_Behavior_Co-constituting_the_Web.png)

benotigt Web Science als eine Wissenschaft vom Webeinen multi- und interdisziplinaren Zugang zur Be-schreibung und Modellierung des Systems ,,WorldWide Web“ und seiner Akteure.

Abbildung 1 fasst zusammen, was Web Sci-ence mindestens abdecken muss: Viele Ak-teure interagieren auf der individuellen Ebene inMikrointeraktionen. Einerseits spiegeln diese Mi-krointeraktionen Aspekte des Benutzerverhaltenswieder, wie es durch seine kognitiven, sozialen undokonomischen Gegebenheiten situiert ist. Anderer-seits reflektieren diese Mikrointeraktionen auch dietechnischen Beschrankungen, die vorhandene Datenund Informationen, Anwendungen, Protokolle undRegulierungen des Webs dem Benutzer auferlegen.Beides zusammen fuhrt in der Masse der Benutzerzu Makroeffekten. Dementsprechend lasst sich WebScience wie folgt definieren:

Web Science ist die soziotechnische Wissenschaft,die untersucht, wie (i) neue oder vorhandene Techno-logien, (ii) Regulierungen im Web und Regulierungendurch Webtechnologien oder Webanwendungen und(iii) Aktivitaten der Webbenutzer das Web formenund verandern und wie umgekehrt das Web auf dieAkteure zuruckwirkt.

Das Ziel von Web Science ist es, Mikrointer-aktionen und Makroeffekte zu beschreiben und zuverstehen. Idealerweise erfolgt dieses Verstandnisdurch quantitativ beschreibende Modelle, wo dasnicht moglich ist zumindest durch qualitative Aus-

sagen uber den Zusammenhang zwischen Mikro-und Makroebene. Effekte auf beiden Ebenen sindim Kontext von Regulierungen des World WideWeb zu analysieren, wie sie durch Gesetze (z. B.politische Aussagen, Abbildungen von Nacktheit),technische Standardisierungen (z. B. HTML5),aber auch durch monopolartige Strukturen (z. B.Top-Level-Domanenvergabe) und oligopolartigeStrukturen (z. B. Optimierung fur wenige Suchma-schinenbetreiber) dem Benutzer und Betreiber vonWWW-Plattformen vorgegeben werden [13].

Im Weiteren fokussieren wir uns in diesemArtikel auf die Erlauterung der Bedeutung derMikro- und Makroebene in Web Science und zei-gen an diesen exemplarisch auf, inwiefern ein mul-ti-disziplinarer Ansatz fur Web Science notig ist.

Benutzerinteraktion und -verhaltenauf der Mikroebene

Die Modellierung von Interaktions- und Ver-haltensmuster ist ein etabliertes Thema in derWebforschung, das zunachst vor allem eingefuhrtwurde, damit Webanwendungen den BenutzernVorschlage machen konnen, welches Informations-objekt fur sie am interessantesten ist [11], wie sie ambesten navigieren konnen oder welches Produkt fursie am geeignetsten sein konnte [9]. Diese fruhestenModelle des Benutzerverhaltens, die in Empfehlungs-systemen realisiert werden, waren aber restringiertauf punktuelle Entscheidungen des Benutzers, z. B.

Informatik_Spektrum_36_6_2013 549

Page 3: Web Science

{ WEB SCIENCE

ein Produkt zu kaufen oder nicht. Durch die Model-lierung solcher punktuellen Entscheidungen erzieltman kein Verstandnis uber die Art und Weise, wieBenutzer im Web ihre Zeit einteilen und wie sieverschiedene Webanwendungen nutzen.

Daruber gehen neue Ansatze hinaus, die eintiefergehendes Verstandnis der psychologischen undsozialen Verhaltensmuster anvisieren. Zum Beispielhaben Lehmann et al. festgestellt, dass selbst ein-fache Charakterisierungen des Benutzerverhaltenswie Verweildauern und Haufigkeit der Nutzung ei-ner Webanwendung geeignet sind, um verschiedeneArten von Benutzerverhalten und Anwendungenzu kategorisieren [8]. Suchmaschinen werden z. B.haufig benutzt, aber eher mit kurzerer Verweildauer,soziale Netzwerke oft und mit langer Verweildauerund Reiseportale eher selten – namlich genau zurErledigung der Aufgabe ,,Reisebuchung“. Ob Be-nutzer also zufrieden sind mit einem Angebot undeine Benutzerbindung an das Angebot eingetretenist, lasst sich nicht alleine aufgrund dieser Musterbestimmen, sondern nur im Vergleich zur Nutzungahnlich gearteter Angebote.

Uber Verweildauer und Haufigkeit der Nutzunghinaus sind aber diffizilere Unterschiede in denVerhaltensweisen der Benutzer von entscheiden-dem Interesse. Die Sozialwissenschaften haben furkollaborative Systeme verschiedene Verhaltensty-pen beschrieben, z. B. Lurkers, Trolls oder Elitists.Neuere Untersuchungen befassen sich damit, dieKlassifikation in diese Nutzertypen automatisiertaus dem beobachtbaren Verhalten im Web abzulei-ten [3]. Zum Beispiel wird hierfur betrachtet, werDiskussionen anstoßt und wer wie oft und in wel-chen sozialen Zusammenhangen antwortet. Aus derBetrachtung dieses individuellen Verhaltens und derZusammensetzung einer Online Community mitvariierenden Anteilen verschiedener Benutzertypenlassen sich dann Vorhersagen, z. B. ob eine OnlineCommunity verstarkt von der Abwanderung ihrerBenutzer betroffen sein konnte.

Makrostrukturen in sozialen Inhaltenund Informationsstrukturen

Mikrointeraktionen individueller, isoliert von-einander agierender Benutzer lassen sich aufMeso- und Makroebene zusammenfassen in Formvon Verteilungen uber Aktivitaten und darausresultierenden Strukturen. Im Web finden sichMakrobeobachtungen zum Beispiel zu:

– Haufigkeitsverteilungen von Wort-Verwendungen;z. B. in Dokumenten oder in benutzererzeugtenInhalten oder in Suchmaschinenanfragen

– Haufigkeitsverteilungen von Beurteilungen; z. B.Notenvergaben fur Produkte

– Verteilungen von Linkstrukturen; z. B.Hypertextlinks oder Freundschaftsbeziehungen

Das wohl auffalligste Merkmal von Makrobeob-achtungen sozialer Benutzerinteraktionen im Webist, dass selten Gleich-, Normal- oder Exponenti-alverteilungen auftreten, wie man es oft erwartenwurde, wenn die Modelle fur die Mikrointeraktionender einzelnen Benutzer unabhangig voneinanderwaren.

Seit Ende der 90er-Jahre gab es eine umfang-reiche Analyse von Netzwerkstrukturen des WorldWide Webs. An vielen Stellen wurde wiederholt fest-gestellt, dass Linkstrukturen im Web skalenfrei sind,die Anzahl der Links pro Knoten einem Potenzge-setz folgen und sich ein Gesamtnetzwerk mit imMittel kleinem mittleren Abstand zwischen zweibeliebigen Knoten ergibt, d. h. das Netzwerk eineSmall World bildet [7]. Ahnliche Aussagen lassensich auch fur andere Strukturen im Web finden,z. B. Freundschaftsbeziehungen in sozialen Netz-werken [4]. Die Entwicklung von fundamentalenModellen fur die Mikrointeraktion, die diese be-obachtbaren Makroeffekte erklaren, ist noch beiweitem nicht abgeschlossen [2].

Ruckkopplungen von Benutzerverhalten imWorld Wide Web erfolgen oft beilaufig so, dass derBenutzer Wertungen abgibt, zum Beispiel dadurch,dass er Produkte wie Bucher oder Hotels auf einerSkala bewertet und gegebenenfalls Kommentare ver-fasst sowie dadurch, dass der Benutzer eigene oderfremde Informationsinhalte annotiert. Es kommtzu Systemeffekten erster Ordnung: die Daten derWebanwendung andern sich und aufgrund diesesgeanderten oder erweiterten Informationsbestan-des andern sich Menge, Reihenfolge und Art derInformationsprasentation. Folgen die dabei entste-henden Haufigkeiten von Worten oder Bewertungennicht den zu erwartenden Verteilungen, kann manoft von Anomalien ausgehen. Dellschaft berichtet,dass Spammer so andere Mikrointeraktionen beider Auswahl ihrer Worte durchfuhren als ,,normale“Benutzer, dass man alleine aufgrund der anders-gearteten Verteilung und ohne jegliche Analyseder Inhalte Spammer und Nicht-Spammer unter-

550 Informatik_Spektrum_36_6_2013

Page 4: Web Science

scheiden kann, sofern nur genugend viele Datenvorliegen [6].

Daruber hinaus ergeben sich aber auch System-effekte zweiter Ordnung: Aufgrund der geandertenAnsicht erhalt der Informationskonsument einanderes Bild, andere Eingaben von Informatio-nen, Bewertungen oder Annotierungen werdennahegelegt und damit andern sich Informations-modifikation und -produktion. Mithin andern dieproduzierten Informationsinhalte des einen Be-nutzers, was der nachste Benutzer erzeugt. SolcheEffekte konnen die Qualitat des Informationsge-haltes insgesamt potenziell verbessern – aber auchverschlechtern.

Eine mogliche Folge von Systemeffekten zwei-ter Ordnung sind Informationskaskaden [7], d. h.dass fur den Benutzer aufgrund vorheriger eigenerAktivitaten und der Aktivitaten anderer Benut-zer gewisse Informationen ausgeblendet werden.Wahler von linken Parteien sehen dann aufgrundihrer ursprunglichen Praferenzen im Extrem-fall nur noch Informationen von den von ihnenpraferierten politisch links-orientierten Autoren,und das Analoge gilt fur die Wahler von rechtenParteien. Ein globaler demokratischer Dialog wirdaufgrund solcher Systemeffekte eher eingeschrankt.Solche Makroeffekte wurden bei der Analyse vonQuerverweisen zwischen Blogs mit politischen In-halten beobachtet [1]: als Systemeffekt gibt sich eineTendenz zu Meinungsmonokulturen, obwohl dasMedium Web selbst im Prinzip bestens dafur ge-eignet ware, die Diskussion zu fordern, kommt ineinem naiv organisierten Informationsraum dieseFahigkeit nicht zum Tragen – vielmehr kann dasGegenteil eintreten [10].

KonklusionWeb Science untersucht Regulierungs-, Kolla-borations- und Koordinationsmethoden, die dasWeb auch in Zukunft zu einer produktiven undgesellschaftlich wunschenswerten Plattform fur un-sere Zukunft machen. Web Science benotigt hierfureinen Methodenmix: Web Engineering befasst sichprimar mit der technischen Realisierung von ska-lierbaren Webplattformen und Webinfrastrukturen.Um aber zu verstehen, wie Benutzer damit umge-hen, muss normative Wissenschaft Regulierungen

im Web auf ihre Auswirkungen hin untersuchen,deskriptive Wissenschaft die beobachteten Web-Phanomene strukturieren und klassifizieren –insbesondere historische und aktuelle Aktivitatender Benutzer. Pradiktive Methoden extrapolierendiese Beobachtungen in die Zukunft. Moglich sinddiese Untersuchungen nur auf Basis von Webbe-obachtungen, wie sie derzeit weltweit unter demSchlagwort ,,Web Observatories“ vorangetriebenwerden. Web Science muss hier allerdings einejuristische und ethische Selbstbeschrankung da-hingehend zugrunde legen, dass nicht alles, wasman vielleicht gerne beobachten wurde, beobachtetwerden darf.

Das Resultat dieser Wissenschaft vom Web wirdein besseres Verstandnis des existierenden WorldWide Webs sein, auch eine verbesserte Fahigkeit,neue Entwicklungen im Web fruher und genauer zubeurteilen, zu nutzen und zielgerichtet Webplattfor-men fur neue Aufgaben zu entwickeln, insbesonderefur Aufgaben, die die kreative Zusammenarbeit vonvielen Menschen erfordern.

Literatur1. Adamic LA, Glance N (2005) The political blogosphere and the 2004 U.S. election:

divided they blog. In: Proceedings of the 3rd international workshop on Link dis-covery (LinkKDD ’05), ACM, New York, pp 36–43

2. Akkermans H (2012) Web dynamics as a random walk: How and why power lawsoccur. In: ACM Web Science 2012: Conference Proceedings, Evanston, 22–24 June2012, pp 1–10

3. Alani H, Gottron T, Nasser B, Staab S (eds) (2014) A Computational Approach toAnalyzing and Managing Online Communities. Springer (to appear)

4. Backstrom, L, Boldi P, Rosa M, Ugander J, Vigna S (2012) Four Degrees of Separa-tion. In: Fourth ACM/ICA Web Science Conference, Evanston, 22–24 June 2012

5. Bernes-Lee T, Hall W, Hendler JA, O’Hara K, Shadbolt N, Weitzner DJ (2006) A Fra-mework for Web Science. Foundations and Trends in Web Science, now publish-ers, September 2006

6. Dellschaft K (2013) The Epistemic Dynamic Model: Developing a Theory of Tag-ging Systems. Dissertation, Universitat Koblenz-Landau

7. Easley D, Kleinberg J (2010) Networks, Crowds, and Markets: Reasoning About aHighly Connected World. Cambridge University Press, Cambridge

8. Lehmann J, Lalmas M, Yom-Tov E, Dupret G (2012) Models of user engagement.In: User Modeling, Adaptation, and Personalization. LNCS, Bd. 7379. Springer,Heidelberg, pp 164–175

9. Linden G, Smith B, York B (2003) Amazon.com recommendations: item-to-itemcollaborative filtering. IEEE Internet Computing 7(1): 76–80

10. Pariser E (2011) The Filter Bubble: What the Internet Is Hiding from You, PenguinPress, New York, May 2011

11. Resnick P, Iacovou N, Suchak M, Bergstrom P, Riedl J (1994) GroupLens: an openarchitecture for collaborative filtering of netnews. In: Proceedings of the 1994ACM conference on Computer supported cooperative work (CSCW ’94), ACM, NewYork, pp 175–186

12. Staab S (2013) Web science. In: Kuhlen W, Strauch SD (Hrsg.) Grundlagen derpraktischen Information und Dokumentation – Handbuch zur Einfuhrung in dieInformationswissenschaft und -praxis, 6. Aufl. Walter De Gruyter, Munchen,S 441–453

13. Zittrain J (2008) The Future of the Internet – And How to Stop It. Yale UniversityPress, New Haven & London

Informatik_Spektrum_36_6_2013 551