Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data‘ in der...

Preview:

DESCRIPTION

Guest lecture presented as a Visiting Scholar at the Centre for Advanced Studies, Ludwig-Maximilians-Universität München, 23 April 2013.

Citation preview

Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data‘ in der KommunikationsforschungAssociate Professor Axel BrunsQueensland University of TechnologyBrisbane, Australia

@snurb_dot_info | http://mappingonlinepublics.net/

‚BIG DATA‘

• Soziale Medien und ‚Big Data‘:– Erhebliches Wachstum der Social-Media-Nutzung– Nutzeraktivitäten produzieren Daten und Metadaten– Weitreichend verfügbar über APIs– Neue Tools zur Verarbeitung und Visualisierung von Big Data in großem

Maßstab

• Social Media Analytics als neues Feld:– Großflächige Erfassung von öffentlichen Nutzeraktivitäten– ‚Trending Topics‘, Nutzersentiment, einflußreiche Teilnehmer– Wissenschaftliche und kommerzielle Forschung– Ein ‚computational Turn‘ zu den ‚digital Humanities‘ (David Berry)– Ethische Fragen zu User Profiling und Urheberrecht für Daten

BIG DATA UND ÖFFENTLICHKEIT(EN)

• Neue Forschungsmethoden:– Empirische, großflächige, Echtzeitforschung– Datengetriebene, vollständige Auswertung statt kleinerer Fallbeispiele

öffentlicher Kommunikation– Aber auch: kombiniert qualitativ/quantitative Ansätze– Keine Internetstudien, sondern Gesellschaftsstudien mit dem Internet

(Richard Rogers)

• Neue Öffentlichkeitsideen:– Public Spherules, Issue Publics, persönliche Öffentlichkeiten (Jan Schmidt):

vielerlei miteinander verbundene Räume innerhalb einer komplexen Medienökologie

WARUM TWITTER?

• Twitter-Forschung:– Wichtiges weltweites Netzwerk– ~ 500 Millionen Accounts (aber wie viele davon aktiv?)

• Australien: ~ 2.2 Millionen Accounts• Deutschland: ~ 825.000 aktive, deutschsprachige Accounts (?)

– Diverse Nutzungsverhalten: über ‚Listening‘ (Kate Crawford) und phatische Kommunikation bis zu politischer und Krisenkoordination

– Gut entwickeltes Ökosystem von Drittanbietern (bislang)– Starke Tradition von Nutzerinnovation: @replies, #hashtags– Flache, offene Netzwerkstruktur:

nichtreziprokes Following, Profile öffentlich als Grundeinstellung– Gutes API zur Erfassung (großer) Forschungsdatensätze– Ethische Fragen begrenzt

NEW MEDIA AND PUBLIC COMMUNICATION: MAPPING AUSTRALIAN USER-CREATED CONTENT IN ONLINE SOCIAL NETWORKS

• Australian Research Council (ARC) Discovery Projekt (2010-13) – $410.000– Queensland University of Technology, Brisbane– Assoc. Prof. Axel Bruns, Assoc. Prof Jean Burgess– Erste großflächige Studie australischer Social-Media-Nutzung– Computergestützte kulturwissenschaftliche Analyse: blogs, Twitter, YouTube als vernetzte

Öffentlichkeiten– ‚Big Data‘ und disziplinärer Wandel in der Medien-, Kultur-, und Kommunikationswissen-

schaft – Entwicklung von ‚natively digital methods‘ (Richard Rogers)

http://mappingonlinepublics.net/

TWITTER-FORSCHUNGSTOOLS

• Datenerfassung:– yourTwapperkeeper + Eigenentwicklungen

• Datenverarbeitung:– Gawk – Open-Source-, Multiplattform-, programmierbares Tool zur Verarbeitung von CSV-Dokumenten

• Statistik:– Excel – Standard-Spreadsheetsoftware mit beschränkter Unterstützung für große Datensätze– Tableau – kommerzielle Windowssoftware mit Optimierung für (sehr) große Datensätze

• Textanalyse:– Leximancer – kommerzielle Multiplattformsoftware: Erfassung von Kernkonzepten aus großen Textkorpora,

Untersuchung und Visualisierung von Kookkurenz– WordStat – kommerzielle Windowssoftware: Textanalyse und Kookurrenzdaten, die zur Visualisierung

exportier werden können

• Visualisierung:– Gephi – Open-Source-, Multiplattformsoftware zur Netzwerkvisualisierung

UND JETZT?

#HASHTAGS ALS ÖFFENTLICHKEITEN

• #hashtags:– ‚#‘ + Schlüsselwort hilft, Themen leicht erkenn- und findbar zu machen– z.B. #ausvotes, #qldfloods, #royalwedding, #DSDS, #euro2012, #wahl2013

• Öffentlichkeiten (Publics, oft Issue Publics):– Befassen sich mit Themen öffentlichen Interesses mit gewisser gegenseitiger Bewußtheit– Unterschiedliche Intensität und Existenzzeiträume– Veränderlich und durch Diskurs und Affekt der Teilnehmer konstituiert

• #hashtag-Öffentlichkeiten:– Nicht alle Hashtags stellen Öffentlichkeiten dar;

Öffentlichkeiten werden nicht durch Twitter begrenzt– Welche Dynamiken gelten für verschiedene Hashtag-Öffentlichkeiten?– Was macht die Unterschiede zwischen ihnen aus?

#SPILL: 23. JUNI 2010, 18:00-19:00 AEST

http://mappingonlinepublics.net/2010/12/30/visualising-twitter-dynamics-in-gephi-part-2/

#SPILL: 23. JUNI 2010, 19:00-20:00

#SPILL: 23. JUNI 2010, 20:00-21:00

#ROYALWEDDING: 29. APRIL 2011 (UTC)

#AUSVOTES: JULI-AUG. 2010: THEMEN

HASHTAGÖFFENTLICHKEITEN

• Forschungsfragen zur Analyse von Hashtagöffentlichkeiten:– Ad hoc entstehende Themen und Öffentlichkeiten:

• Wie formen sich Online-Öffentlichkeiten, und wie lösen sie sich wieder auf? • Wie interagieren sie, und welche Strukturen formen sich dabei?• Woher beziehen sie ihre Informationen? Was teilen sie einander mit?• Sind es immer die einschlägigen Teilnehmer? • Wie isoliert oder vernetzt sind Online-Öffentlichkeiten?

– Hashtagöffentlichkeiten im größeren Kontext:• Wie vergleichbar sind verschiedene Hashtag-Events? • Gibt es grundlegende Gesetzmäßigkeiten bei der Entwicklung von Hashtags und Öffentlichkeiten?• Wie groß/wichtig/einflußreich sind sie? • Welche Themen führen zur Entstehung von Öffentlichkeiten auf Twitter?• Welche Community-Strukturen entwickeln sich?

STATISTISCHE DATENAUSWERTUNG

• Unterscheidung von Tweet-Typen:– Originaltweets: weder @reply noch Retweet– Retweets: enthalten RT @user (oder ähnlich), Button-

Retweets– Echte @replies: enthalten @user, aber nicht in Retweet-Form– URL-Tweets: enthalten URLs

• Mögliche Nutzung:– Aktivitätsmetriken pro Hashtag– Aktivitätsmetriken pro Zeitabschnitt (Tag, Stunde, Minute, Sekunde, ...)– Aktivitätsmetriken pro Nutzer (oder Gruppe von Nutzern)– ...

(Bruns & Stieglitz, 2012; 2013)

#EQNZ: WICHTIGSTE ACCOUNTS, 22 FEB.-7 MÄRZ 2011 (ERHALTENE RETWEETS + @REPLIES)

#EQNZ: VERGLEICH ÜBER ALLE VIER BEBEN (2010-2011)

(Bruns & Burgess, 2012)

HA

SH

TA

GM

ET

RIK

EN

(Bruns & Stieglitz, 2012)

EINE TYPOLOGIE DER TWITTERNUTZUNG

• Wie werden Hashtags bei akuten Ereignissen genutzt?– Gatewatching:

• Informationen zu aktuellen Entwicklungen finden und weiterleiten (bevor die Massenmedien es tun?)

• Ad hoc-Öffentlichkeiten: viele URLs, viele Retweets

– Audiencing:• Gemeinsame Teilnahme an großen (vorhersehbaren) Ereignissen• Gefühlte Gemeinschaft von Teilnehmern: wenige URLs, beschränktes Retweeting

– Welche anderen Nutzungsformen gibt es?• Fortlaufende Diskussionen (#auspol, #bundesliga, ...)• Memes (#ghettohurricanenames, ...)• Emotionsmarkierende Hashtags (#fail, #win, #headdesk, ...)• Gilt dies alles gleichermaßen auch für Schlüsselworte statt Hashtags?

JENSEITS VON HASHTAGS

Mehrere überlappende Öffentlichkeiten / Netzwerke– Was bestimmt ihre Formierung und Wiederauflösung?– Wie interagieren und verweben sie sich?– Wie sind sie mit der weiteren Medienökology verwoben?– Welche plattformübergreifenden Öffentlichkeiten bilden sie auf Twitter ab?

• Ad Hoc-Öffentlichkeiten, oft schnell formiert

und wieder aufgelöst

macro: #hashtags

• persönliche Öffentlichkeiten, langsam angesammelt

und üblicherweise stabil

meso: follower networks

• zwischenmenschlicheKommunikation,

ephemeral

micro:@replies

(Bruns & Moe, 2013)

#AUSPOL: FEB.-DEZ. 2011

DER WEITERE AUSTRALISCHE KONTEXT

• Wie lassen sich einzelne Hashtagöffentlichkeiten verstehen?– Welchen Teil der gesamten Nutzerschaft repräsentieren sie?– Sind ihre Aktivitäten breit (viele Teilnehmer) und/oder tief (hohes Volumen)?– Welchen Anteil am Gesamtaufkommen an australischen Tweets haben sie?– Unterhalten sich hier schon vorher (als Follower) vernetzte Nutzer, oder schafft

der Hashtag neue Verbindungen?

• Das australische Twitter-Netzwerk:– Snowball network crawl, ausgehend von Hashtagdatensätzen– Australische Teilnehmer durch Zeitzonenangabe im Profil identifiziert

(sowie Textangaben zum Ort, wo sinnvoll)– Sehr langwierige Erfassung – Profil- und Netzwerkabgriff für Millionen Nutzer– Bisher ~ 1,06 Millionen australische Accounts identifiziert (~ 50%?)– Netzwerkvisualisierung der Follower-Verbindungen durch Gephi

THE AUSTRALIAN TWITTERSPHERE?

Follower/Followee-Netzwerk:~120,000 australische Twitter-Nutzer(von ~ 950,000 Accounts, Stand Frühjahr 2012) Farbe = outdegree, Größe = indegree

#AUSPOL

Follower/Followee-Netzwerk:~120,000 australische Twitter-Nutzer(von ~ 950,000 Accounts, Stand Frühjahr 2012) Farbe = #auspol-Beteiligung

#AUSVOTES

Follower/Followee-Netzwerk:~120,000 australische Twitter-Nutzer(von ~ 950,000 Accounts, Stand Frühjahr 2012) Farbe = #ausvotes-Beteiligung

THEMEN-CLUSTER

PerthMarketing / PR

DesignWeb

Creative

FarmingAgriculture

HardlineConservatives

ConservativesJournalists

ALPProgressives

Greens

News

OpinionNews

NGOsSocial Policy

ITTech

Social MediaTechPR

Advertising

Real EstateProperty

JobsHR

Business

BusinessProperty

Parenting

Mums CraftArts

FoodWine

Beer

Adelaide

SocialICTs

CreativeDesign

FashionBeauty

UtilitiesServices

Net Culture

BooksLiteraturePublishing

Film

TheatreArts

RadioTV Music

DanceHip Hop

Triple J

TalkbackBreakfast TVCelebritiesCycling

Union

NRL

Football

CricketAFL

SwimmingV8s

Evangelicals

Teachinge-Learning

Schools

ChristiansHillsong

Teens

Jonas Bros.Beliebers

Australian Bands

@KRuddMP

@JuliaGillard

#QLDFLOODS

Follower/Followee-Netzwerk:~120,000 australische Twitter-Nutzer(von ~ 950,000 Accounts, Stand Frühjahr 2012) Farbe = #qldfloods-Beteiligung

#MASTERCHEF

Follower/Followee-Netzwerk:~120,000 australische Twitter-Nutzer(von ~ 950,000 Accounts, Stand Frühjahr 2012) Farbe = #masterchef-Beteiligung

THEAUSTRALIAN.COM.AU URLS

Follower/Followee-Netzwerk:~120,000 australische Twitter-Nutzer(von ~ 950,000 Accounts, Stand Frühjahr 2012) Farbe = Links zu The Australian

ABC.NET.AU URLS

Follower/followee network:~120,000 Australian Twitter users(of ~950,000 known accounts by early 2012) colour = Links zur ABC

WEITERE FORSCHUNGSMÖGLICHKEITEN

• Erhebungen zu bekannten / vorhersehbaren Themen:– Hashtags und Schlüsselworte– Interaktionen (Tweets und @Replies) um bekannte Accounts: Account-

Name als Schlüsselwort– Verbreitung von Links: Domain als Schlüsselwort ‚biggish data‘: groß für Kommunikationswissenschaftler, aber begrenzt

• Wirkliche ‚Big Data‘-Forschung:– Fortlaufende Erfassung der öffentlichen Aktivitäten vieler oder aller jetzt

bekannten australischen Accounts– Nutzung der Twitter-Firehose zur fortlaufenden Erfassung aller

anfallenden Tweets– (sehr) teuer, und äußerst speicher- und rechenintensiv

AUSTRALIAN TWITTER NEWS INDEX

http://mappingonlinepublics.net/tag/atnix/

AUSTRALIAN TWITTER NEWS INDEX

BIG BIG DATA: DIE ERSTE MILLION TWITTER-IDS

Twitter IDs 1-1.000.000 (48.000 Accounts weiterhin existent)

Graphen: Darryl Woodford –http://mappingonlinepublics.net/2013/04/08/the-first-million-ids-on-twitter/

DIE ERSTE MILLION: ZAHL DER TWEETS

DIE ERSTE MILLION: ZEITZONEN

EINE NEUE MILLION

• 1 Million neue Account-IDs (~ 422.000 existente Accounts) • Neu registriert am 18./19. März 2013, 16:00-01:00 UTC ( 1-1,5M neue Nutzer/Tag)

http://mappingonlinepublics.net/2013/04/05/whos-joining-twitter-a-look-at-1-million-recent-ids/

TWITTER-ÖFFENTLICHKEITEN

• #hashtags und andere Einzelöffentlichkeiten:– Koordinationsmechanismus für Kerndiskussion– Relativ einfach zu erfassen und auszuwerten– Nur ein Bruchteil der Gesamtkommunikation zum Thema– Nützlich als Fallstudien, aber sehr wenig vergleichende Perspektiven

• Nationale / globale Twitter-Erhebungen:– Wichtiger Kontext und Hintergrund für Hashtag-Fallstudien– Langsame und arbeitsintensive Erfassung, nie abgeschlossen– Sehr langfristige Perspektive, für Einzelprojekte kaum machbar / finanzierbar– Unabdingbar für die Untersuchung von Twitter als öffentlicher

Kommunikationsraum

‚BIG DATA‘ UND DIE DIGITAL HUMANITIES

• Entstehende Bedürfnisse in der Twitter-Forschung:– Einheitliche, kompatible Methoden und Metriken für die Twitter-Analyse

Tools und Ansätze bei http://mappingonlinepublics.net/ dokumentiert

– Leistungsfähige Infrastruktur für langfristige, hochvolumige Erfassung öffentlicher Kommunikation auf Twitter Datenzugriffskosten erfordern starke finanzielle Unterstützung

– Möglichkeiten zur langfristigen Speicherung und Archivierung von Daten Wichtige Rollen für Nationalbibliotheken und –archive

– Integration mit anderen Datensätzen (z.B. Massenmedieninhalten) Fragen der Interoperabilität sind noch zu lösen

• Twitter als Testfall für Digital-Humanities-Forschung an sich:– Weitverbreitete, offene, öffentliche Plattform für Alltagskommunikation– Hilfsmittel zur Beobachtung gesellschaftlicher Aktivitäten in großem Maßstab durch

Internetforschung

‚BIG DATA‘ UND AKADEMISCHE AUSBILDUNG

• Studenten brauchen interdisziplinäre Fähigkeiten:– Medien und Kommunikation zum Verständnis der Medienwelt– Mathematik und Statistik zum Umgang mit ‚Big Data‘– Computerwissenschaft zur Entwicklung der Auswertungstools– Kommunikationsdesign zur Entwicklung effektiver Visualisierungen– ...

– Wo findet man Studenten mit solchen Fähigkeiten?• Wer hat schon eine solche Kombination von Fertigkeiten?

– Wie können ihre Aktivitäten durch Institute unterstützt werden?• So vieles ist noch im Entstehen begriffen

– Wie gehen wir mit der Kurzlebigkeit einzelner Forschungsobjekte um?• APIs, Tools, Plattformen ändern sich oft schnell und unerwartet

INTERAKTION UM WICHTIGE ACCOUNTS

(Bruns, Weller, & Harrington, 2013)

Recommended