Social Media Analytics – Aktuelle Herausforderung

Preview:

Citation preview

Lehrstuhl Informatik 5(Informationssysteme)

Prof. Dr. M. JarkeI5-KL-111010-1

TeLLNet

GALA Social Media Analytics –Aktuelle Herausforderungen

Ralf KlammaRWTH Aachen

Lehrstuhl für Informatik 5 – InformationssystemeRWTH Aachen

Gesellschaft für Informatik Regionalgruppe KölnThemenabend 06.07.2011

„Social Media, Social Networks“

Lehrstuhl Informatik 5(Informationssysteme)

Prof. Dr. M. JarkeI5-KL-111010-2

TeLLNet

GALA

Motivation Große Datenbestände aus dem Betrieb sozialer Medien Algorithmen zur Datenanalyse

– Statistische Analyse (z.B. kontextbewusste Nutzungsstatistiken)– Soziale Netzwerkanalyse (SNA)

Visualisierungstechniken– Statistische Diagramme (z.B. Box/Pie Chart, Timeline)– Geografische Karten (z.B. Google Maps 2D, Google Earth 3D)– Graph Visualisierungen (Fluss & Formation)

Web Technologien– HTML, CSS, JavaScript + Rahmenwerke (z.B. jQuery, dojo, sencha, etc.)– Web Widgets (OpenSocial, W3C)

Wie können Analyseergebnisse in Wikis, Blogs und Foren präsentiert werden, so dass sie dem Anwender zusätzlichen Nutzen bringen?

Lehrstuhl Informatik 5(Informationssysteme)

Prof. Dr. M. JarkeI5-KL-111010-3

TeLLNet

GALA

Ablauf

Lehrstuhl Informatik 5(Informationssysteme)

Prof. Dr. M. JarkeI5-KL-111010-4

TeLLNet

GALA

Welche Interaktionen sind nutzbar? Dienstnutzung

– Dienstaufrufe– Kontextinformationen (physisch, technisch, sozial, etc.)

Organisation von Nutzern in Communities– Entstehung & Entwicklung von (überlappenden) Communities– Entwicklung von internen und übergreifenden Nutzerrollen

Kollaboration zwischen Nutzern und Communities– Gemeinsame Erstellung & Bearbeitung von Resourcen & Metadaten– Social Media Operationen (Bewerten, Taggen, Kommentieren, etc.)

Kommunikation zwischen Nutzern und Communities– Asynchron (Blogs, RSS Feeds, Foren, Mailinglisten, etc.)– Synchron/Echtzeit (Instant Messaging, Multiuser Chats, Konferenzen, etc.)

Lehrstuhl Informatik 5(Informationssysteme)

Prof. Dr. M. JarkeI5-KL-111010-5

TeLLNet

GALA

Aktuelle Forschung am I5 –Systeme, Datenbestände & Analyse Netzwerkanalyse

– Digitale Bibliothek (AERCS) – > 800.000 Autoren, >1.4 Mio Aufsätze, >3700 Konferenzserien der Informatik– Datensätze von DBLP & CiteSeerX

– Web 2.0 Artefakte (MediaBase)– >730 Blogs & Mailinglisten, >330.000 Einträge– Internationale Blogs & Mailinglisten

– Chat (MobSOSX & Socrates XMPP)– >230 Nutzer, >40.000 Chat-Interaktionen in >1700 Sessions– XMPP Kommunikation (Instant Messaging, Multiuser Chat, etc.)

Statistische Analyse– Nutzung & Qualität von Web Diensten (MobSOS)

– >1,3 Mio Anfragen von >200 Nutzern aus >20 Communities an >40 Dienste– Sessions, Benutzer, Communities, Dienste, Kontext, Fehler

Lehrstuhl Informatik 5(Informationssysteme)

Prof. Dr. M. JarkeI5-KL-111010-6

TeLLNet

GALA

Welche Informationen sind aus der statistischen Analyse gewinnbar?

Kontextbewusste Nutzungsstatistiken Nutzer, Communities, Ressourcen, Dienste Ort, Zeit, Genutzte Technologien Frequenz, Dichte, Verteilung, Muster

Werkzeugqualität Performanz, Stabilität, etc. Fehleraufkommen/quellen

Empfehlungen für Nutzer Eigen- & Community-Bewusstheit Gemeinschaftliche Anforderungen

Lehrstuhl Informatik 5(Informationssysteme)

Prof. Dr. M. JarkeI5-KL-111010-7

TeLLNet

GALA

Welche Informationen sind aus der Netzwerkanalyse gewinnbar?

Identifikation von Rollen– Experten

– Empfang und Verbreitung von Information– Zentralitätsmaße [Wasserman & Faust, 1997]

– Innovation Stars (Boundary-Spanner, Broker) – Community-interne & übergreifende Kommunikation– Betweenness Zentralität [Burt, 2005]

Einflüsse– Wer oder was beeinflusst Nutzer oder Communities?– Influence networks [Lewis, 2008]

Identifikation von Communities– Welchen Communities gehört ein User an?– Community mining [Clauset et al., 2004]

Eigen- & Community-Bewusstheit (Struktur & Entwicklung) Empfehlungen für den Nutzer

Lehrstuhl Informatik 5(Informationssysteme)

Prof. Dr. M. JarkeI5-KL-111010-8

TeLLNet

GALA

Wie können Analyseergebnisse für den Nutzer visualisiert werden?

Web Widget Technologien (z.B. OpenSocial, W3C Widgets) Widget: Kleines UI Element mit beschränkter, wohldefinierter Funktionalität

– Metadaten: XML– Logik: HTML5, JS/AJAX, CSS & entsprechende Frameworks (z.B. jQuery) Grundbaustein für interaktive Visualisierungen von Analyseergebnissen

Widget Renderer: Rendering von Widgets unter Angabe der Widget URL Widget Container: Anordnung eines oder mehrerer Widgets auf einer Seite Zusammenstellung von Widgets aus verschiedenen Quellen via Widget URL Visualisierungs-Dashboards & Integration in beliebige Webseiten via iframe OS Lösungen: OpenSocial Apache Shindig; W3C Widgets Apache Wookie

Lehrstuhl Informatik 5(Informationssysteme)

Prof. Dr. M. JarkeI5-KL-111010-9

TeLLNet

GALA

Widget-basierte Visualisierung –Zero-Config Dashboard in iGoogle

Integration beliebiger konfigurationsloser Visualisierungs-Widgets in iGoogle Seiten

Lehrstuhl Informatik 5(Informationssysteme)

Prof. Dr. M. JarkeI5-KL-111010-10

TeLLNet

GALA

Widget-basierte Visualisierung –Interaktive Dashboards

1. Auswahl einer Datenbank

2. Auswahl selbst definierter Filter

3. Visualisierungen passen sich an Filter an

Lehrstuhl Informatik 5(Informationssysteme)

Prof. Dr. M. JarkeI5-KL-111010-11

TeLLNet

GALA

Integration von Visualisierungen in beliebige Webseiten

Einbettung in beliebigeWebseiten mittels iframes

Lehrstuhl Informatik 5(Informationssysteme)

Prof. Dr. M. JarkeI5-KL-111010-12

TeLLNet

GALA

Autorenumgebung für Visualisierungs-Widgets

1. Angabe einer Datenbankanfrage

2. Auswahl & Parametrisierung der Visualisierung

3. Widget Voransicht4. Angabe von Metadaten

5. Automatische Generierung von Widget Quellcode

Lehrstuhl Informatik 5(Informationssysteme)

Prof. Dr. M. JarkeI5-KL-111010-13

TeLLNet

GALA

Zusammenfassung & Ausblick Zusammenfassung

– Ablauf der Erstellung/Einbettung von Visualisierungen Sozialer Mediennutzung– Überblick über nutzbare Informationen– Überblick über Analysetechniken– Visualisierung mit Web Widgets (Dashboards & Einbettung)– Autorenumgebung für Visualisierungs-Widgets

Ausblick– Web Technologien (HTML5) + Cloud Technologien + Echtzeitprotokolle– Cloud-basierte Analyse- & Visualisierungsalgorithmen– Darstellung in Echtzeit mit XMPP

– XMPP-fähige Widgets– Nutzung der Publish-Subscribe XEP & HTML5 WebSocket

Recommended