39
1 02.11.2012 The Big Data - H.-J. Weimann 2 Big Data Eine Präsentation der U3L an der Goethe-Universität in Frankfurt am Main im Rahmen der Vortragsreihe zum 10-jährigen Bestehen der Internet-AG ENIGMA Schöne neue Welt – Gefangen im Netz ? 02.11.2012 H.-J. Weimann

Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

1

02.11.2012 The Big Data - H.-J. Weimann 2

Big DataEine Präsentation der U3L an der

Goethe-Universität in Frankfurt am Mainim Rahmen der Vortragsreihe zum

10-jährigen Bestehen der Internet-AG ENIGMA

Schöne neue Welt – Gefangen im Netz ?

02.11.2012H.-J. Weimann

Page 2: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

2

02.11.2012 The Big Data - H.-J. Weimann 3

Big Data

The era of Big Data has begun. Computer scientists, physicists, economists, mathematicians, political scientists, bio-informaticists, sociologists, and many others are clamoring for access to the massive quantities of information produced by and about people, things, and their interactions.

Six Provocations for Big Data

02.11.2012 The Big Data - H.-J. Weimann 4

Big Data

Das Zeitalter von " Big Data " hat begonnen.Computerwissenschaftler, Physiker,Wirtschaftswissenschaftler, Mathematiker,Politologen, Bio-Informatiker, Soziologen und viele andere fordern den Zugang zu den riesigen Mengen an Informationen, die von Menschen, Dingen und deren Wechselwirkungen produziert werden.

Six Provocations for Big Data

Page 3: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

3

02.11.2012 The Big Data - H.-J. Weimann 5

Was ist Big Data ?

Jeden Tag werden 2,5 Quintillionen (2,5 ●1018) Bytes an Daten erzeugt – so viel, dass 90% der auf der Welt vorhandenen Inf ormationen alleine in den letzten beiden Jahren erzeugt wurden .

Diese Daten kommen überall her: z.B. Sensoren zur Klimaüberwachung, Eingaben in Sozia le Netzwerke, digitale Fotos und Videos, Finanz- und Handelstransaktionen und GPS-Signale von Mobiltelefon en.

Das ist Big Data (!)www-01.ibm.com/software/data/bigdata

02.11.2012 The Big Data - H.-J. Weimann 6

IT-Trends 2012

Das Markforschungsinstitut Gartner Inc. hat die wichtigsten Techniken und Trends für 2012 ermittelt:

AnalyticsBig Data

Cloudhttp://www.computerwoche.de/2498181

Page 4: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

4

02.11.2012 The Big Data - H.-J. Weimann 7

Big Data

Kommerzielle Unternehmen versuchen so viele Daten wie möglich, von so vielen Personen wie möglich zu sammeln, um diese zu vermarkten.

Bis 2020 werden sie voraussichtlich über 44 mal so viele Daten verfügen wie heute.

Wer Daten sammelt, sammelt Macht.

Wer die Daten beherrscht wird künftig die Welt beherrschen.

02.11.2012 The Big Data - H.-J. Weimann 8

Alles umsonst ?

Das Internet ist nicht umsonst, auch wenn es sich für viele so darstellt.Vom Internet leben eine große Anzahl von Firmen, an der Spitze Amazon und Google. Diese Unternehmen haben immer wirtschaftliche Interessen (!)

Währung im Internet = Informationen

Page 5: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

5

02.11.2012 The Big Data - H.-J. Weimann 9

The big ten

http://www.textberater.com/news/facebook-und-amazon -uberholen-google/

02.11.2012 The Big Data - H.-J. Weimann 10

Amazon

Page 6: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

6

02.11.2012 The Big Data - H.-J. Weimann 11

Google

02.11.2012 The Big Data - H.-J. Weimann 12

Datenhandel

Die Unternehmen versuchen soviele Daten wie möglich von den Benutzern

zu erhaltenzu sammelnauszuwertenzu vermarkten

Verkauft werden: WerbeanzeigenDaten über BenutzerKomplette Unternehmen

Page 7: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

7

02.11.2012 The Big Data - H.-J. Weimann 13

Was ist Big Data ?

Das bemerkenswerte an Big Data ist nicht nur die gewa ltigeDatenmenge, sondern viel wichtiger sind die Beziehun gen zu anderen Daten.Erst durch Definition und Auswertung von Verknüpfunge n zwischen verschiedenen Datenbeständen wird der wahre Gehalt sichtbar.

Waren früher Daten dezentral und nicht für jeden zu gänglich verteilt (amtliche Register und Archive, Kirchenbücher, Zeit ungsarchive, private Tagebücher und Briefe), so werden die Daten heute immer mehr Personen und Maschinen zugänglich. Es können Verbindungen gezogen werden, die früher praktisch unmöglich ware n.

02.11.2012 The Big Data - H.-J. Weimann 14

Die neue Dimension

Unter Big Data versteht man große Mengen strukturierter und unstrukturierter Informationen s owie dateiorientierter und blockorientierter (*) Informationen.

Diese Daten erreichen eine neue Dimension, weil sie aus vielen verschiedenen Quellen in sehr kurzer Zei t neu entstehen und von sehr vielen Anwendern genutzt werden können .

(*) Blockorientierte Daten – in adressierbaren Blöcken gespeichert, z.B. Festplatten

Das Wesentliche an Big Data sind die mannigfaltigen Verknüpfungen zu anderen Daten und deren Auswertung in Echtzeit.

Page 8: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

8

02.11.2012 The Big Data - H.-J. Weimann 15

Wieviel ist viel ?

1024 Byte = 1.000.000.000.000.000.000.000.000 Byte Yottabyte (YB)

1021 Byte = 1.000.000.000.000.000.000.000 ByteZettabyte (ZB)

1018 Byte = 1.000.000.000.000.000.000 ByteExabyte (EB)

1015 Byte = 1.000.000.000.000.000 BytePetabyte (PB)

1012 Byte = 1.000.000.000.000 ByteTerabyte (TB)

109 Byte = 1.000.000.000 ByteGigabyte (GB)

106 Byte = 1.000.000 ByteMegabyte (MB)

103 Byte = 1.000 ByteKilobyte (kB)

Bereits in 2007 hat Google täglich 20 Petabytes an Benutzerdate n verabeitet.

IBM hat 2011 einen Speichercluster aus 200.000 Festplatten mit einer Kapazität von 120 Petabytes entwickelt.

02.11.2012 The Big Data - H.-J. Weimann 16

Datenspeicher

Die Erfassung und dauerhafte Speicherung dieser ungeheuren Datenmengen wurde nur möglich durch die gigantisch angewachsene Kapazität der Speichermedie n.

≙≙≙≙ 2.777 Disketten 1.44 M B≙≙≙≙ 44.43244.43244.43244.432 Disketten 1.44 MB

Page 9: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

9

02.11.2012 The Big Data - H.-J. Weimann 17

Die neuen Aspekte

• Daten- und Informationswachstum

• Geschwindigkeit, mit der die Analysen gefordert wer den

• Anzahl der Datenquellen

• Anzahl der Nutzer von Datenanalysen

02.11.2012 The Big Data - H.-J. Weimann 18

Datenflut

2010 2011 2012 2013 2014 2015

Page 10: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

10

02.11.2012 The Big Data - H.-J. Weimann 19

Datentransfer

Der weltweit größte kommerzielle Internet-Knoten ist der DE-CIX in Frankfurt am Main.Der Datendurchsatz betrug im August 2012 über 2 Ter rabits (10 12) pro Sekunde.

02.11.2012 The Big Data - H.-J. Weimann 20

DE-CIX

Die Daten fast aller deutschen Internetprovider (außer Telekom) fließen durch die Hanauer Landstraße in Frankfurt am Main.

Page 11: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

11

02.11.2012 The Big Data - H.-J. Weimann 21

Quo vadis ?

Rechner werden in Zukunft mit immer besserer Genauigkeit

• Wahrscheinlichkeiten ausrechnen• Prognosen erstellen und • Handlungsempfehlungen geben

Die Analyse von großen, unstrukturierten Datenmengen gehört inzwischen zu einem der stärksten Wachstumsfelder von professionellen Softwareherstellern wie IBM, SAP, Oracle und SAS.

02.11.2012 The Big Data - H.-J. Weimann 22

Wo kommen die Daten her ?

Suchmaschinen

Social Networks

GPS

Zahlungssysteme / Rabattaktionen

Mobilfunk / Smartphone

automatisch / maschinell generierte Daten (z.B. smart grid)

Videoüberwachungssysteme

künftig Kfz (smart car) ?

Page 12: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

12

02.11.2012 The Big Data - H.-J. Weimann 23

Videoüberwachung - INDECT

INtelligent information system supporting observation , searching and DEteCTion for security of citizens in urban environment.

Ein EU finanziertes Forschungsprojekt zur permanenten Überwachung der Bürger (vorerst an neuralgischen Pun kten).Bei den Olympischen Spielen in London 2012 wurde die ses System bereits eingesetzt.

Durch die Verknüpfung von Videoüberwachungsdateien m it anderen Daten sollen im Vorfeld potentielle Verbrecher erkan nt werden.Dabei werden vorgegebene Verhaltensmuster erkannt un d bei Auffälligkeiten mit anderen Daten (z.B. Mobiltelefo n) abgeglichen.

"Zu den verdächtigen Verhaltensmustern zählen etwa zu langes Sitzen, auf dem Boden sitzen in einem öffentlichen Verkehrsmittel oder in einem Flughafen oder das Verlieren des eigenen Gepäcks."

02.11.2012 The Big Data - H.-J. Weimann 24

Das Internet der Dinge

Die Zukunft des Internet (oder der Welt ?) gehört den Datensammlern.Mit den neuen IP-Adressen (2 128) kann jeder Benutzer und jedes Endgerät eindeutig gekennzeichnet werden. Nach den M enschen werden auch immer mehr Maschinen miteinander vernetz t und diese produzieren permanent unübersehbare Mengen an Daten .

Bis 2020 rechnet man mit 50 Milliarden vernetzter Geräteund dazu gehören neben den klassischen Rechnern vor allem Mobiltelefone aber auch Fernseher , Kühlschränke , Waschmaschinen und Autos .

Page 13: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

13

02.11.2012 The Big Data - H.-J. Weimann 25

Das Internet der Dinge

Noch nicht realisiert, aber angedacht und technisch möglich, ist die Vernetzung des Menschen selbst, etwa um gesundheitliche Daten unverzüglich auswerten zu können.

Diese Daten müssen gespeichert, analysiert und verarbeitet werden.Wer diese Daten "bändigen" kann, d.h. strukturiert verarbeiten und gewinnbringend vermarkten, wird die Welt beherrschen.

02.11.2012 The Big Data - H.-J. Weimann 26

Vortrag

Internet der Dingeam 18.01.2013, 12:00 Uhr, H5

Page 14: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

14

02.11.2012 The Big Data - H.-J. Weimann 27

Die Datensammler

Internetanbieter ( Youtube )Suchmaschinen ( Google )Soziale Netzwerke ( Facebook, Twitter )Social MediaKreditkartenanbieter ( acxiom.com)BankenVersicherungenTelefon-Provider ( Telekom, Vodafone )Online-Vertrieb ( ebay, Amazon )E-Book-Anbieter ( Amazon )Handel ( Payback-Systeme )KrankenkassenÄmter und VerwaltungenRFID / NFC(Geheimdienste ?)

02.11.2012 The Big Data - H.-J. Weimann 28

Suchmaschinen

Suchmaschinennutzung

83,7

4,6 3,3 3,2 1,3 1,1 2,8

0

10

20

30

40

50

60

70

80

90

Google Bing Yahoo t-online web.de ask.com Rest

Pro

zent

Page 15: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

15

02.11.2012 The Big Data - H.-J. Weimann 29

Was sammelt Google ?

• Daten, die Sie uns mitteilen

• Informationen, die wir aufgrund Ihrer Nutzung unser er Dienste erhalten

• Gerätebezogene Informationen

• Protokolldaten• Einzelheiten zu der Art und Weise, wie Sie unsere D ienste genutzt haben,

beispielsweise Ihre Suchanfragen

• Telefonieprotokollinformationen

• IP-Adresse

• Daten zu Geräteereignissen

• Cookies, über die Ihr Browser oder Ihr Google-Konto eindeutig identifiziert werdenkönnen

• Standortbezogene Informationen

• Eindeutige Applikationsnummern

• Lokale Speicherung

• Cookies und anonyme Kennungen

02.11.2012 The Big Data - H.-J. Weimann 30

Google ändert Datenschutzbestimmungen

Page 16: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

16

02.11.2012 The Big Data - H.-J. Weimann 31

Google scannt die E-Mailshttp://support.google.com/mail/bin/answer.py?hl=en& answer=1304609

02.11.2012 The Big Data - H.-J. Weimann 32

Was macht Google mit den Daten ?

Google benutzt die gesammelten Informationen, um de m Nutzer maßgeschneiderte Inhalte anzubieten – beispielsweise um ihm relevantere Suchergebnisse und Werbung zur Verfügung zu stellen.

Google kann die für das Google-Profil angegebenen Na men für andere von Google angebotenen Dienste, die ein Goog le-Konto erfordern, verwenden.

Google behält sich vor auch weitere personenbezogen e Daten aus einem Dienst mit Informationen und personenbezogene n Daten aus anderen Google-Diensten zu verknüpfen.

Google verarbeitet personenbezogene Daten auf Server n, die sich in zahlreichen Ländern auf der ganzen Welt befinden . Daher werden die personenbezogenen Daten gegebenenfalls auf eine m Server verarbeitet, der sich außerhalb des Landes befindet , in dem der Nutzer lebt.

Page 17: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

17

02.11.2012 The Big Data - H.-J. Weimann 33

Wer bekommt Daten von Google ?

Google stellt personenbezogene Daten seinen verbundenen Unternehmen, anderen vertrauenswürdigen Unternehmen oder Personen zur Verfügung, die diese im Auftrag von Google verarbeiten.

Google kann zusammengefasste, nicht-personenbezogene Daten an die Öffentlichkeit und seine Partner – wie beispielsweise Verlage, Werbeunternehmen oder verbundene Webseiten –weitergeben.

02.11.2012 The Big Data - H.-J. Weimann 34

Wie verdient Google Geld ?

Google generiert seine Einnahmen durch Werbung und insbesondere mit AdSense .Dabei werden bezahlte Anzeigen in die Suchliste ein geblendet.

Page 18: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

18

02.11.2012 The Big Data - H.-J. Weimann 35

Was sammelt Facebook ?

• Registrierungsdaten

• Informationen, die du freigibst

• Von Dritten bereitgestellte Informationen über dich

• Sonstige uns bereitgestellte Daten über dich• Jedes Mal, wenn du mit Facebook interagierst, erhal ten wir Daten über dich, zum Beispiel

wenn du das Profil einer anderen Person aufrufst, j emandem eine Nachricht sendest, nach einem/einer FreundIn oder einer Seite suchst, eine Werbeanzeige anklickst oder Facebook-Gutschriften erwirbst

• Wenn du Dinge wie Fotos oder Videos auf Facebook po stest, erhalten wir gegebenenfalls auch zusätzliche, ergänzende Daten (oder Metadaten) , etwa die Uhrzeit, das Datum und den Ort, an dem du das Foto oder Video aufgenommen hast

• Wir erhalten Daten von dem Computer, Handy oder son stigen Gerät, mithilfe dessen du auf Facebook zugreifst. Bei diesen Daten kann es sich u m deine IP-Adresse , deinen Standort , die Art des von dir genutzten Browsers oder die von dir besuchten Seiten handeln. Wir können zum Beispiel deinen GPS-Ort in Erfahrung bri ngen, damit wir dir mitteilen können, ob sich einer deiner Freunde in der Nähe befindet

• Wir erhalten Daten immer dann, wenn du ein Spiel, e ine Anwendung oder Webseite nutzt, welche/s die Facebook-Plattform verwendet, oder wenn du eine Webseite besuchst, auf der eine Facebook-Funktion (wie zum Beispiel ein sozial es Plug-in) vorhanden ist.

• Manchmal erhalten wir von unseren Werbepartnern, Ku nden und anderen Drittparteien Daten, die uns (oder ihnen) bei der Schaltung von W erbeanzeigen sowie dem Verständnis der Online-Aktivität behilflich sind und Facebook a llgemein verbessern.

02.11.2012 The Big Data - H.-J. Weimann 36

Frictionless Sharing

Die Timeline von Facebook wird künftig nicht nur du rch Eingaben des Benutzers bestückt, sondern durch Einträge die von Apps automatisch erzeugt werden.

Apps posten Ort, Status und Handlungen ohne aktives Eingreifen des Benutzers

Über das Open-Graph-Protokoll erfährt Facebook, was der Nutzer tut und postet automatisch Status-Updates in die Tim eline

Der Musikdienst Spotify veröffentlicht z.B. die gehörten Titel in der Timeline

Die Rezepte-App veröffentlicht, welches Mahl der Facebook-Nutzer gerade zubereitet (z.B. Bison-Burger)

Freunde erfahren in Echtzeit welches E-Book gerade g ekauft oder welcher Drink momentan in der Bar getrunken wird.

Page 19: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

19

02.11.2012 The Big Data - H.-J. Weimann 37

Frictionless Sharing

02.11.2012 The Big Data - H.-J. Weimann 38

Social Apps

In der Facebook-Timeline sieht das dann so aus

Page 20: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

20

02.11.2012 The Big Data - H.-J. Weimann 39

Social Graph

02.11.2012 The Big Data - H.-J. Weimann 40

Der Facebook Like-Button

Der " Gefällt mir "-Button von Facebook, der mittlerweile auf vielen Seiten auftaucht, überträgt Daten an Facebook, auch ohne dass der Anwender auf den Button klickt.

• Bei Nicht-Mitgliedern , die noch nie facebook.com aufgerufen haben, erhäl t Facebook lediglich die IP-Adresse und die URL des Referrer.

• Hat ein Nicht-Mitglied bereits facebook.com besucht , dann wurde dabei ein "Data-Cookie" platziert, dessen Inhalt beim Laden von Lik e-Buttons ebenfalls übertragen wird. Angeblich wird dieses Cookie nicht für Tracking-Funktionen verwendet.

• Wenn ein Mitglied, ob angemeldet oder nicht, eine S eite mit dem Like-Button lädt, erhält Facebook noch mehr Informationen. Dann werde n Datum, Zeit, URL und Browsertyp aufgezeichnet, um damit den Service zu v erbessern.

• Bei einem angemeldeten facebook-User können diese Daten dann sogar einer konkreten Person zugeordnet werden.

Page 21: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

21

02.11.2012 The Big Data - H.-J. Weimann 41

Collusion

Für den Firefox-Browser gibt es ein Add-On, das optisch die vielfältigen Verknüpfungen beim Ansehen von Internetseiten aufzeigt.

02.11.2012 The Big Data - H.-J. Weimann 42

Was macht Facebook mit den Daten ?

Für Inhalte wie Fotos und Videos („IP-Inhalte“), die unter die Rechte an geistigem Eigentum fallen, erteilst du uns durch deine Privatsphäre- und Anwendungseinstellungen die folgende Erlaubnis: Du gibst uns eine nicht-exklusive, übertr agbare, unterlizenzierbare, gebührenfreie, weltweite Lizenz für die Nutzung jeglicher IP-Inhalte , die du auf oder im Zusammenhang mit Facebook postest („IP-Lizenz“). Diese IP-Lizenz end et, wenn du deine IP-Inhalte oder dein Konto löschst, außer dei ne Inhalte wurden mit anderen Nutzern geteilt und diese haben die Inhalte nicht gelöscht.

Page 22: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

22

02.11.2012 The Big Data - H.-J. Weimann 43

Womit verdient Facebook Geld ?

Die Haupteinnahmequelle von Facebook ist Werbung

Darüberhinaus lässt Facebook Anwendungen von Fremdanbietern zu, die teilweise kostenpflichtige Angebote erstellen, daran verdient Facebook mit.

Werbekunden können zwar nicht direkt auf die Daten der Facebook-Nutzer zugreifen, aber sehr gezielte Interessengruppen ansteuern, z.B. nach bestimmten Orten, Altersgruppen, Familienstand, Ausbildung.

02.11.2012 The Big Data - H.-J. Weimann 44

Freemium-Anwendungen bei Facebook

Page 23: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

23

02.11.2012 The Big Data - H.-J. Weimann 45

Fremdanwender bei Facebook

Die Anwendungen bei Facebook können auf diverse Daten des Benutzers zugreifen

02.11.2012 The Big Data - H.-J. Weimann 46

Datenschutz bei Facebook-Anwendungen

Das Programm "Farmville" sammelt die Daten der Benutzer und darf diese auch an Dritte weitergeben

Page 24: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

24

02.11.2012 The Big Data - H.-J. Weimann 47

Werbung bei Facebook

Facebook bietet seinen Kunden detailierte Kataloge nach bestimmten Interessengruppen an, so kann etwa gezielt Werbung an Golfspieler verbreitet werden.

Zwar können auch Firmen kostenlos Pages auf Facebook erstellen, aber Facebook bietet diesen Seitenbetreibern maßgeschneiderte, kostenpflichtige Zusatzangebote.

02.11.2012 The Big Data - H.-J. Weimann 48

Individualität bei Facebook

Wenn Facebook über einen Teilnehmer alle Daten zur Verfügung hat, können bestimmte Schlussfolgerungen und Vorhersagen getroffen werden, die selbst der betroffene Anwender möglicherweise selber noch gar nicht kennt.

"Facebook weiß schon vor dem Benutzer was dieser am nächsten Wochenende tun wird ".

Page 25: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

25

02.11.2012 The Big Data - H.-J. Weimann 49

Was macht Twitter mit den Daten ?

Durch die Übermittlung, Veröffentlichung und/oder Anzeige von Inhalten in den Services räumt der Benutzer Twitter die nicht-exklusive, gebührenfreie und weltweite Erlaubnis ein (einschließlich dem Recht auf Erteilung von Unterlizenzen), diese Inhalte in sämtlichen, jetzt bekannten oder später entwickelten Medien oder Vertriebsmethoden zu benutzen , zu kopieren , zu vervielfältigen , zu verarbeiten , anzupassen , zu verändern , zu veröffentlichen und zu übertragen .

02.11.2012 The Big Data - H.-J. Weimann 50

Was sammelt Amazon ?

Gespeichert werden insbesondere die kompletten so g enannten Click-Streams der Kunden. Darunter fallen alle Eingab en wie Adressen, Zahlungsdaten, Suchwörter und Klicks auf betrachtete Artikel, die der Kunde jemals auf der Amazon-Websit e macht. Außerdem speichert Amazon alle über seine Site erfol gten Bestellungen und Verkäufe sowie jede E-Mail an und v on Amazon. Und zwar alles ohne jegliche zeitliche Befristung.

www.daten-speicherung.de/index.php/datenspeicherung/unternehmen

Page 26: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

26

02.11.2012 The Big Data - H.-J. Weimann 51

E-Book-Reader

02.11.2012 The Big Data - H.-J. Weimann 52

Watched by Kindle E-Book-Reader

Unbehaglich muss es dem Leser von E-Books auf Kindle-Book-Reader werden, denn das Leseverhalten des Benutzers wird unbemerkt an Amazon übertragen.Die Software stellt Amazon Daten über Ihren Kindle und dessen Interaktion mit dem Service bereit (z. B. verfügbarer Speicherplatz, Be triebszeit, Protokolldateien und Signalstärke). Darüber hinaus stellt die Software A mazon Informationen zu den digitalen Inhalten auf Ihrem Kindle und anderen Geräten sowie zur Nutzung der digitalen Inhalte durch Sie bereit (z. B. zuletzt gelesene Seite und Archivierung von Inhalten). Anmerkungen , Lesezeichen , Notizen , Markierungen oder ähnliche Kennzeichnungen, die Sie mit Ihrem Gerät oder Ihrer Lese-App vornehmen, sowie sonstige Informationen , die Sie bereitstellen, können auf Servern außerhalb des Landes, in dem Sie leben, gespeichert werden. Markierungen können dafür verwe ndet werden, anderen Kindle Nutzern anonyme Informationen über die am häufigste n markierten Textstellen bereitzustellen. (Amazon AGB)

Page 27: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

27

02.11.2012 The Big Data - H.-J. Weimann 53

Was sammelt Apple ?

Auf iPhone und iPad kann man Programme (= Apps ) nur über die Apple-Cloud (iTunes) kaufen und installieren.

Ebenso werden insbes. Musikdaten über die Cloud gela den.

Dass dabei natürlich das Nutzerverhalten protokolli ert wird, scheint die Anwender nicht zu stören, falls sie sich überha upt darüber im Klaren sind, dass ihr Verhalten, ihr Standort und andere Daten von Apple überwacht werden können.

02.11.2012 The Big Data - H.-J. Weimann 54

Was sammeln die Telefonprovider ?

SpiegelOnline 30.10.2012

Page 28: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

28

02.11.2012 The Big Data - H.-J. Weimann 55

Die Datenverwerter

Durch die Analyse und Bewertung von

Einkaufsverhalten

Kundenmeinungen

Studien und Umfragen

E-Mail-Korrespondenz

SocialMedia

und anderen Quellenwerden Information über den Kunden gesammelt, ausge wertet und zur Optimierung der Kundenkontakte verwendet.Es können dann sehr viel gezieltere, speziell auf d en jeweilgen Kunden zugeschnittene, Angebote unterbreitet werden .

02.11.2012 The Big Data - H.-J. Weimann 56

Privatsphäre unerwünscht ?

Die Datenbranche hat ein großes Interesse daran, da ss die Daten der Anwender im Internet nicht anonym und dam it zuverlässiger sind.

Es wird in diesem Zusammenhang gerne mit der Angst vor Kriminalität und Terror argumentiert, aber im Endef fekt stehen hier wirtschaftliche Interessen im Vordergrund.

Interessanterweise decken sich hier die Interessen des Staates mit denen der Datensammler.

Page 29: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

29

02.11.2012 The Big Data - H.-J. Weimann 57

Datenvermarktung

http://www.attensity.com/de/solutions-3/lara/

02.11.2012 The Big Data - H.-J. Weimann 58

Daten aus dem Cyberspace

Bei Versicherungen, im Bank- und Kreditwesen und in d er Werbeindustrie ist der Abgleich mit Daten aus dem I nternet mittlerweile üblich. Die Unternehmen sind bereit, v iel Geld in entsprechende Software zu investieren.

So nutzt etwa die Axa Global Direct alle zugänglichen Datenquellen zur optimierten Risikobewertung der Kunden, um indi viduelle Prämienangebote zu erstellen. (FTD_2012.06.07)

Banken möchten gerne über Risiken bei ihren Kunden informiert sein. Bei der Bewertung kann etwa das Freizeitverha lten eine Rolle spielen.

Page 30: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

30

02.11.2012 The Big Data - H.-J. Weimann 59

Wen interessieren die Daten ?

02.11.2012 The Big Data - H.-J. Weimann 60

Wen interessieren die Daten ?

Page 31: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

31

02.11.2012 The Big Data - H.-J. Weimann 61

Wen interessieren die Daten noch ?

Focus 20.10.2012

02.11.2012 The Big Data - H.-J. Weimann 62

Payback der "Datenkrake" auf freiwilliger Basis

Setzen Sie Ihre PAYBACK Karte bei einem Partnerunte rnehmen ein, so meldet dieses die Rabattdaten (Waren/Dienstleistungen, Preis, Rabattbetrag, Ort un d Zeitpunkt des Vorgangs ) an PAYBACK zur Gutschrift, Abrechnung gegenüber den Partnerunternehmen, Verwal tung und Auszahlung der Rabatte. Apotheken und Sparkassen melden Waren/Dienstleistungen nicht.

Page 32: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

32

02.11.2012 The Big Data - H.-J. Weimann 63

Freiwillige Preisgabe von Daten ?

02.11.2012 The Big Data - H.-J. Weimann 64

Social media share buttons

Mit diesen Buttons können Webbetreiber das Verhalten des Anwenders ausspionieren, ohne dass dieser irgendwo angemeldet sein muss, und ohne dass er etwas davon bemerkt.

Das Aufrufen einer Seite, die einen solchen Button enthält, genügt, um Daten preiszugeben.

Page 33: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

33

02.11.2012 The Big Data - H.-J. Weimann 65

RFID + NFC

Eine wichtige Rolle beim Sammeln von Datenwerden die Funkchips spielen.

RFID = Radio Frequency Identification

NFC = Near Field Communication

Alle Dinge des täglichen Lebens können, und werden teilweise schon, mit Identifikationschips ausgerüstet werden.

02.11.2012 The Big Data - H.-J. Weimann 66

RFID-Schnüffelchips

Immer mehr Kleidungsstücke enthalten RFID-Chips. Da mit lassen sich Kunden ausspähen und orten. Der Chip verbirgt sich meist imTextilpflegeetikett und kann auf eine Entfernung von mehreren Metern per Funk ausgelesen werden.

Was zur Optimierung der Logistik gedacht ist, wird zur Gefahr für dieKunden, wenn es in der Kleidung bleibt: Wo immer ein entsprechendes Lesegerät angebracht ist , werden -unbemerkbar - die Daten der Chips ausgelesen - und wi edererkannt.

Bekannte Bekleidungshersteller, darunter Peuterey, L emmi Fashion, Levi's und Gerry Weber, verwenden bereits RFID-Chip s.

Page 34: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

34

02.11.2012 The Big Data - H.-J. Weimann 67

Was passiert mit den Daten ?

Die Datensammler werden z.B. nicht nur wissen, wann sich der Nutzer wo für ein Produkt interessiert hat, sondern auch, ob er es tatsächlich gekauft hat oder nicht.

Die Nutzer können sehr präzise erfasst und in Grupp en sortiert werden, die für Werbende gezieltere Angebote ermögl ichen und mehr Erfolg versprechen.Es wird nicht mehr blind mit Massenwerbung gearbeitet , wobei bisher der größte Teil verpufft ist, sondern die Nu tzer werden gezielt angesprochen, ja unter Umständen fast genötigt.

02.11.2012 The Big Data - H.-J. Weimann 68

Wo bleibt der Datenschutz ?

Hat der Internetanbieter seinen Sitz im Ausland wird es schwierig ,

sitzt er im Nicht-EU-Ausland wird es schwieriger ,

sitzt er in exotischen Ländern wird es unmöglich

Datenschutz einzufordern.

Page 35: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

35

02.11.2012 The Big Data - H.-J. Weimann 69

Sicherheitsaspekte

Ob die Daten bei den Unternehmen sicher aufbewahrt werden können, ist eine wesentliche Frage.

Auch große Firmen (z.B. Sony) sind bereits Opfer vo n Hacker-Angriffen geworden, bei denen Kundendaten entwendet wurden.

02.11.2012 The Big Data - H.-J. Weimann 70

Interne Datendiebe

Neben Hacker-Angriffen ist der Datendiebstahl durch Mitarbeiter wohl das größere Problem.

Page 36: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

36

02.11.2012 The Big Data - H.-J. Weimann 71

Datenschutz im Internet ?

Die Zeitschrift c't hat Ende 2010 einen Test durchge führt und über eine reale bekannte Person, die damit anfänglich so gar einverstanden war, mit legalen Methoden Daten im Int ernet gesammelt.

Angefangen mit der Suche über Google konnten über de n Kandidaten sowohl berufliche als auch private Infor mationengefunden werden. Auch in sozialen Netzen wurde man fündig. Interessant wurde die Recherche aber erst, nachdem m an einem ebenfalls von der Person verwendeten Alias-Namen de m richtigen Namen zuordnen konnte.

Damit war es zum Herausfinden der Adresse nur noch ein kleiner Schritt und die Bilder vom Haus und der Wohnung konn ten ebenfalls im Netz gefunden werden.

Auch die Familienangehörigen waren über Fotos und e igene Namen in sozialen Netzen auffindbar.

02.11.2012 The Big Data - H.-J. Weimann 72

Der gläserne Internetnutzer ?

Obwohl alle einzelnen Informationen isoliert gesehe n unproblematisch erscheinen, schließlich wurden sie ja von dem Anwender selber online gestellt, ergaben sich durch die Kombination und gezielte Auswertungen sehr detaillierte Profile.

Man kann unter Umständen Tagesabläufe der Person na chvollziehen und beispielsweise erfahren wann die Wohnung leerst eht.(Dafür gibt es sogar eine spezielle Anwendung im In ternet: http://pleaserobme.com/)

Die Testperson war über die Ergebnisse schockiert un d hat der Veröffentlichung widersprochen.

Man sieht an diesem Beispiel, dass auch erfahrene N etzuser leicht den Überblick über ihre eigenen Daten verlieren kön nen, und was mit einer gezielten Auswertung zusammengeführter Inform ationen erreicht werden kann.

Page 37: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

37

02.11.2012 The Big Data - H.-J. Weimann 73

Wie geht es weiter ?

Die Herausforderung Big Data ist bereits in den Köp fen der Manager angekommen. Big Data hat sich innerhalb kurzer Zeit hinsichtlic h Relevanz und Investitionsbedarf unter den Top-Themen der Informa tions- und Kommunikationstechnik (ICT) etabliert - mit einer st eilen Tendenz nach oben. Das Thema wird mittlerweile sogar als re levanter eingestuft als der ICT Evergreen "Outsourcing".Die Unternehmen haben also erkannt, dass Daten imme r stärker zu einer strategischen Ressource werden.Bereits heute verspüren über 60 Prozent der ICT-Mana ger einen hohen bis sehr hohen Handlungsdruck, die beständig wachsende Datenflut sinnvoll zu kanalisieren - und dieser Druc k wird in den kommenden Jahren noch weiter stark zunehmen. Dies e rgab eine Befragung von mehr als 1.000 Entscheidungsträgern au s Großunternehmen und öffentlichen Institutionen mit mehr als 500 Mitarbeitern. Financial Times, 21.08.2012

02.11.2012 The Big Data - H.-J. Weimann 74

Die Zukunft ?

Die Maschinen werden in Zukunft nicht mehr lediglich die Fragen der Benutzer beantworten, sondern ihm konkret sagen was er als nächstes tun soll.Das Smartphone wird zur "guten Fee", die immer einen Rat ( den richtigen ? ) bereit hält, um die (vermeintlichen ) Wünsche des Benutzers zu erfüllen. Der umsorgte Anwender wird schließlich gar nicht mehr aus eigenem Antrieb wissen was er eigentlich will, sondern sein Verhalten wird ihm vorgeschrieben.

Page 38: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

38

02.11.2012 The Big Data - H.-J. Weimann 75

Schöne neue Welt ?

02.11.2012 The Big Data - H.-J. Weimann 76

Quellen

Six Provocations for Big Data Oxford Internet Institute’s symposium, September 2011Die programmierbare Welt FAZ 21.12.2012Mehr Kontrolle für Provider Stern.de 31.12.2012BigBrotherAwards www.bigbrotherawards.deComputerwoche http://www.computerwoche.de/2498181ICT Newsletter http://www.searchstorage.deGoogle Datenschutzrichtlinien http://www.google.com/intl/de/policies/privacy/Facebook Datenverwendungsrichtlinien http://www.facebook.com/about/privacy/Welt Online http://www.welt.dec't Computermagazin 01/2012 Patrick Breyer www.daten-speicherung.deFinanzbranche giert nach Facebook-Daten Financial Times Deutschland, 08.06.2012Die Datenfresser C.Kurz/F.Rieger ISBN978-3-596-19033-1Computerbild 18/2012 IndectSpiegel Online Netzwelt 08.06.2012

Page 39: Big Data - uni-frankfurt.de · wichtigsten Techniken und Trends für 2012 ermittelt: Analytics Big Data Cloud ... Big Data Kommerzielle Unternehmen versuchen so viele Daten wie möglich,

39

02.11.2012 The Big Data - H.-J. Weimann 77

Glossar

INDECT Intelligent information system supporting observation, searching and detection for security of citizens in urban environment

CIX Commercial Internet eXchangeDE-CIX German Commercial Internet Exchange