74
Social Media Daten als Grundlage sozialwissenschaftlicher Forschung: Chancen und Herausforderungen Kassel, 11.06.2014 Dr. Katrin Weller, [email protected], @kwelle http://katrinweller.net

Social-Media-Forschung

Embed Size (px)

DESCRIPTION

Eingeladener Vortrag in der interdisziplinären Ringvorlesung des Kompetenzzentrums für empirische Forschungsmethoden der Universität Kassel

Citation preview

Page 1: Social-Media-Forschung

Social Media Daten als Grundlage sozialwissenschaftlicher Forschung:

Chancen und Herausforderungen

Kassel, 11.06.2014

Dr. Katrin Weller, [email protected], @kwelle

http://katrinweller.net

Page 2: Social-Media-Forschung

Dr. Katrin Weller GESIS – Leibniz Institut für Sozialwissenschaften

Datenarchiv für Sozialwissenschaften

2006-2012: Heinrich-Heine-Universität Düsseldorf,

Promotion in Informationswissenschaft

Weller, K., Bruns, A., Burgess, J., Mahrt, M., & Puschmann, C. (Eds.) (2014). Twitter and Society. New York et al.: Peter Lang.

Page 3: Social-Media-Forschung

Fragen & Kommentare

Slides: http://de.slideshare.net/katrinweller

Page 4: Social-Media-Forschung

Hintergrund / Forschungsstand

Page 5: Social-Media-Forschung

5 http://www.conversationprism.com//

Page 6: Social-Media-Forschung

© Statista

GmbH

Von welchen der folgenden Netzwerke und Plattformen haben Sie schon gehört?

Umfrage zur Bekanntheit von Social Media Plattformen in Deutschland (2012)

30

40

55

56

58

62

67

68

69

71

72

80

87

96

Yappy

Flickr

Xing

Lokalisten

MeinVZ

MyVideo

MySpace

SchülerVZ

StudiVZ

Stayfriends

Wer-kennt-…

Twitter

YouTube

Facebook

0 20 40 60 80 100 120

Anteil der Befragten in %

Quelle: PwC, Entwicklung sozialer Medien im Vergleich, Seite 11 ID 76144

http://de.statista.com/statistik/daten/studie/76144/umfrage/umfrage-zur-bekanntheit-von-social-media-plattformen-in-deutschland/

Page 7: Social-Media-Forschung

Social Media Forschung in (Publikations)zahlen

0

500

1000

1500

2000

2500

3000

3500

4000

4500

5000Anzahl an Publikationen in Scopus

(TITLE-ABS-KEY("social media") OR TITLE-ABS-KEY("social web") OR TITLE-ABS-KEY("social software") OR TITLE-ABS-KEY("web 2.0")) AND PUBYEAR > 1999 [ März 2014]

Page 8: Social-Media-Forschung

Publikationen nach Fachgebieten (Scopus)

10650; 36%

5542; 19%

2384

2288

2151

1535

773

772

65 Computer ScienceSocial SciencesEngineeringMedicineBusiness, Management and AccountingMathematicsArts and HumanitiesDecision SciencesPsychologyNursingEconomics, Econometrics and FinanceBiochemistry, Genetics and Molecular BiologyHealth ProfessionsEnvironmental ScienceEarth and Planetary SciencesAgricultural and Biological SciencesPharmacology, Toxicology and PharmaceuticsPhysics and AstronomyMaterials ScienceMultidisciplinaryNeuroscienceImmunology and MicrobiologyChemical EngineeringVeterinaryDentistryChemistryEnergy

Page 10: Social-Media-Forschung

Forschungsthemen

Page 11: Social-Media-Forschung

pointless babble?

Page 12: Social-Media-Forschung

Top Thema: Wahlen

Page 13: Social-Media-Forschung

#egypt

Page 14: Social-Media-Forschung

Dauerthemen

E-Learning Marketing

Marktforschung / Nutzerstudien

Journalismus

Page 15: Social-Media-Forschung

Trends?

Vorhersagen Gesundheit Big Data

Page 16: Social-Media-Forschung

Was wird erforscht?

• Nutzergruppen • Ereignisse • Zielgruppen • Nutzungspraxis • Informationsflüsse • Einfluss • Meinungen und Stimmungen • Netzwerke • Interaktionen • …

Page 17: Social-Media-Forschung

Social Media Daten

Page 18: Social-Media-Forschung

Social Media Daten

• Texte

• Bilder

• Videos

• Multimedia

• Verbindungen I (Freunde, Follower)

• Verbindungen II (Links/URLs)

• Verbindungen/Aktionen (Likes, Favs, Kommentare, Downloads)

Page 19: Social-Media-Forschung

Beispiel: Twitter Daten

Page 20: Social-Media-Forschung

Datenzugang? Twitter APIs

• Nicht explizit für Wissenschaftler entwickelt

• Nicht rückwirkend zugänglich

• Nicht vollständig

Änderungen möglich

Page 21: Social-Media-Forschung

https://dev.twitter.com/console

Eige

ne

Use

r-ID

fin

den

: h

ttp

://w

ww

.idfr

om

use

r.co

m/

Page 22: Social-Media-Forschung
Page 23: Social-Media-Forschung
Page 25: Social-Media-Forschung

Chancen

Page 26: Social-Media-Forschung

Top 4: Chancen

Page 27: Social-Media-Forschung

#1

Beobachtung von spontanen Interaktionen und flüchtiger

Kommunikation

Page 28: Social-Media-Forschung

#2

Daten sind für eine Vielzahl von Ereignissen, Kontexten und Fragestellungen verfügbar.

Page 29: Social-Media-Forschung

#3

„Rich data“: Multimedia plus Netzwerke plus Interaktionen

Page 30: Social-Media-Forschung

#4

Interdisziplinäres Forschungsumfeld; Möglichkeit, neue Methoden

auszuprobierne und zu kombinieren

Page 31: Social-Media-Forschung

Methoden & Tools

Page 32: Social-Media-Forschung

Methoden

Content Analysis (qual. / quant.)

Umfrage / Interview) Experiment / Feldforschung

Page 33: Social-Media-Forschung

Mehr Methoden?

Page 34: Social-Media-Forschung

34

Methoden (in der sozialw. Twitter Forschung)

Weller, K. (2014). What do we get from Twitter – and what not? A close look at Twitter research in the social sciences. Knowledge Organization 41(3), 238-248.

Page 35: Social-Media-Forschung

TOOLS

• Datensammlung

• Analyse

Page 36: Social-Media-Forschung

Data collection

• dapper: http://open.dapper.net/ • SocSciBot “Web crawler and link analyser for the social sciences and

humanities http://socscibot.wlv.ac.uk • Chorus: http://www.chorusanalytics.co.uk/ • SODATO (Copenhagen Business School):

http://cssl.cbs.dk/software/sodato/ • NVivo 10 (eigenltich Tool für qualitative Inhaltsanalyse), jetzt mit

Import von Tweets, Facebook Posts, YouTube Daten, LinkedIn. • YourTwapperkeeper – für Twitter • Python Packages, z.B. für Wikipedia

36

Page 37: Social-Media-Forschung

Social Network Analysis

• NodeXL (mit Datenimport-Funktion)

• ORA (http://www.casos.cs.cmu.edu/projects/ora), a social network analysis (SNA) software package, for basic manipulations and visualization of the network data

• UCINET (http://www.analytictech.com/ucinet)

37

Page 38: Social-Media-Forschung

Digital Methods Initiative • https://wiki.digitalmethods.net/Dmi/ToolDatabase

Page 39: Social-Media-Forschung

GNIP

Page 40: Social-Media-Forschung

TOPSY

Page 41: Social-Media-Forschung

YourTwapperkeeper

Page 42: Social-Media-Forschung

NodeXL

Network Analysis – basierend auf Excel. Integrierte Funktion zur Sammlung von Daten aus u.a.: • Facebook • Twitter • YouTube • Flickr • Wikipedia

Page 43: Social-Media-Forschung

NodeXL

Page 44: Social-Media-Forschung

NodeXL

Page 45: Social-Media-Forschung

Gephi

Page 46: Social-Media-Forschung

Gephi

46

Page 48: Social-Media-Forschung

48

Page 49: Social-Media-Forschung

Sentiment Analysis

Dictionaries:

z.B. ANEW

Page 50: Social-Media-Forschung

NLP / Sentiment Analysis

• Discover text: http://discovertext.com/

• Twitter NLP: http://www.ark.cs.cmu.edu/TweetNLP/

• Internet Community Text Analyzer (ICTA) http://textanalytics.net

• Twitter NLP and Part-of-Speech Tagging: http://www.ark.cs.cmu.edu/TweetNLP/

• SentiStrength http://sentistrength.wlv.ac.uk/

• Sentiment analysis of Danish texts (by Copenhagen Business School): http://130.226.34.13/dh/sentiment_workshop/demo.php

50

Page 51: Social-Media-Forschung

Tool-Klassiker

• Nicht auf Social Media spezialisierte Tools, die man aus der klassischen Methoden-Arbeit kennt.

51

Page 52: Social-Media-Forschung

Inhaltsanalyse

52

CAQDAS Computer-Assisted Qualitative Data AnalysiS

– (z.B. MAXQDA, QDAMiner, ATLAS.ti, Qualrus, Nvivo)

– Speech Act Analyse

– Statistik

Data Science?

Page 53: Social-Media-Forschung

Oxford Internet Institute

Methoden-Guidelines: http://microsites.oii.ox.ac.uk/tidsr/welcome

Page 54: Social-Media-Forschung

Wichtig: Hintergrundwissen

54

Page 55: Social-Media-Forschung

Herausforderungen

Page 56: Social-Media-Forschung

Top 4: Herausforderungen

Page 57: Social-Media-Forschung

#1

Mangel an Theorie

Page 58: Social-Media-Forschung

Ende der Theorie?

58

because it’s there?

Big Data vs. Found Data

Page 59: Social-Media-Forschung

Ende der Theorie? Sozialwissenschaften

1. Problem

2. Forschungsfrage/

Hypothesen

3. Theorien

4. Methoden

5. Daten

6. Analyse

7. Ergebnispräsentation

Typische Big Data-Analyse

1. Methoden

2. Daten

3. Analyse

4. Ergebnispräsentation

5. Problem

Korrelation vs. Kausalität

Pfeffer, J. (2013). Big data, big research? Opportunities and constraints for computer supported social science.

Keynote zur „Digital methods“-Tagung der DGPuK-Fachgruppe Computervermittelte Kommunikation, Wien.

Abgerufen von http://www.pfeffer.at/slides/DigitalMethods-BigData.pdf

Page 60: Social-Media-Forschung

Anfang der Theorie?

“The interesting point is that these limitations can (and have to) be addressed by theory guided research that is typically conducted by social scientists. Accordingly, opportunities emerge for those social and behavioral scientists who are willing to collaborate with the Big Data researchers in the natural, engineering, and computer sciences.”

60

Snijders, C., Matzat, U., & Reips, U.-D. (2012). ‘Big Data’: Big gaps of knowledge in the field of Internet. International Journal of Internet Science, 7, 1-5. Retrieved from http://www.ijis.net/ijis7_1/ijis7_1_editorial.html

Page 61: Social-Media-Forschung

#2

„data haves“ vs. „data have-nots“

boyd, danah and Kate Crawford. (2012). “Critical Questions for Big Data”

Page 62: Social-Media-Forschung

Technische Herausforderungen

• Zugänglichkeit • Data Sharing • Änderungen • Manipulation (z.B. Twitter Bomb) & Spam • Personalisierte Ergebnisse

• Fehlende Reproduzierbarkeit und

Nachvollziehbarkeit

62

Page 63: Social-Media-Forschung

#3

Representativität?

Page 64: Social-Media-Forschung

Local Following

Page 65: Social-Media-Forschung

Repräsentativität

“The core challenge is that most big data that have received popular attention are not the output of instruments designed to produce valid and reliable data amenable for scientific analysis.“

Lazer, D., Kennedy, R., King, G., & Vespignani, A. (2014). The parable of Google Flu: Traps in big data analysis. Science, 343(6176), 1203-1205.

Page 66: Social-Media-Forschung

Blank, G. (2014). Who uses Twitter? Representativeness of Twitter Users. Presentation at General Online Research GOR 14. Retrieved from: http://conftool.gor.de/conftool14/index.php?page=downloadPaper&filename=Blank-Who_uses_Twitter_Representativeness-119.pptx&form_id=119&form_version=final

34

26

812

1814

10

1712

2328

333035

0

20

40

60

80

100

% w

ho h

ave

done m

ore

th

an n

eve

r

InterestPolitical activities

Interestin politics

Sendpolitical

message

ContactMP online

Re-postpoliticalnews

Politicalcommenton SNS

Findpolitical

facts

Signonline

petition

OxIS current users: 2013 N=1,613

Figure 6: Political Activities of Twitter Users

Twitter user Non-user

Page 67: Social-Media-Forschung

Repräsentativitätsprobleme auf mehreren Ebenen

“About a third of all UK Internet users have a twitter profile; a subset of that group are the active tweeters who produce the bulk of content; and then a tiny subset of that group (about 1%) geocode their tweets (essential information if you want to know about where your information is coming from).”

Graham M. (2012). Big data and the end of theory?". The Guardian. Retrieved from: http://www.theguardian.com/news/datablog/2012/mar/09/big-data-theory

Page 68: Social-Media-Forschung

Gefahren durch fehlende Repräsentativität

• Diskussion: Menschen, die durch Big Data nicht repräsentiert sind

http://streetbump.org

Siehe auch: http://www.wired.com/2014/03/potholes-big-data-crowdsourcing-way-better-government/

Page 69: Social-Media-Forschung

#4

Interdisziplinarität und methodische Standards

Page 70: Social-Media-Forschung
Page 71: Social-Media-Forschung

Fazit

• Spannendes Forschungsfeld mit viel Pioniergeist

• Beginnende Professionalisierung im Bereich Methoden und Standards

Page 72: Social-Media-Forschung

Literatur • Literaturliste zum Thema Big Data in den Sozialwissenschaften:

http://kwelle.wordpress.com/2014/04/12/big-data-links-and-literature/

Literaturempfehlungen

• Ackland, R. (2013). Web Social Science. Los Angeles et al: SAGE.

• Boyd, D., & Crawford, K. (2012). Critical questions for big data: Provocations for a cultural, technological, and scholarly phenomenon. Information, Communication, & Society, 15(5), 662-679.

• Bruns, A. (2013). Faster than the speed of print: Reconciling ‘big data’ social media analysis and academic scholarship. First Monday 10(18). Available http://firstmonday.org/ojs/index.php/fm/article/view/4879

• Giglietto, F., Rossi, L., & Bennato, D. (2012). The Open Laboratory: Limits and Possibilities of Using Facebook, Twitter, and YouTube as a Research Data Source. Journal of Technology in Human Services, 30(3-4), 145–159.

• Karpf, D. (2012). Social science research methods in internet time. Information, Communication & Society, 5(15), 639-661.

• Weller, K., Bruns, A., Burgess, J., Mahrt, M., & Puschmann, C. (2014). Twitter and Society. New York et al.: Peter Lang.

• Williams, S. A., Terras, M. M., Warwick, C. (2013). What do people study when they study Twitter? Classifying Twitter related academic papers. Journal of Documentation, 69(3), 384-410.

Page 73: Social-Media-Forschung

Grüße aus Köln!

73

Page 74: Social-Media-Forschung

Fragen und Feedback:

Dr. Katrin Weller

GESIS Leibniz Institute for the Social Sciences

[email protected]

@kwelle

http://katrinweller.net

74