7
HAUPTBEITRAG / BIG DATA IN SMART ECOSYSTEMS } Big Data in Smart Ecosystems Peter Liggesmeyer · Jörg Dörr Jens Heidrich Einleitung Die Diskussion von Big-Data-Fragestellungen mit ausschließlichem Bezug auf Daten im Internet wird der Bedeutung des Themas nicht gerecht. Natür- lich wirft Big Data einerseits viele Fragen für den Umgang von Nutzern mit Internet-Diensten auf. An- dererseits ermöglicht die Auswertung von Daten im Internet ohne Zweifel bessere, adressatengerechtere Angebote. Aber das Internet im engeren Sinne ist eben nur einer von vielen Bereichen, in denen Big Data eine zunehmend wichtige Rolle spielen wird. In dem Maße, in dem die Digitalisierung alle Bereiche des Lebens zunehmend durchdringt, werden Daten erzeugt, sodass auch Big Data eine querschneidende Rolle einnimmt. In der aktuell stattfindenden Diskussion über die vierte industrielle Revolution (Industrie 4.0) werden explizit auch Big-Data-Themen adressiert. Charakteristisch für Industrie 4.0 sind flexible Pro- duktionsumgebungen, was einen hohen Grad an Autonomie, die Fähigkeit zur Selbstorganisation, sinnvolle Reaktionen auf Umgebungseinflüsse und die Fähigkeit zur verlässlichen Bewertung von Ei- genschaften – z. B. Sicherheit – erfordert. Dies setzt die Beschaffung, Verknüpfung und Auswertung von Daten sowie die Initiierung von Reaktionen auf Basis der Ergebnisse voraus. Zusätzlich müssen dabei z. B. Echtzeitanforderungen und ggf. Gefährdungssitua- tionen mit betrachtet werden. Ähnliche Beispiele lassen sich in praktisch jedem Anwendungsbereich finden. Zukünftige Systemlösungen werden aus zahl- reichen miteinander in Verbindung stehenden Teilsystemen bestehen, in denen Daten erzeugt und zwischen denen Daten ausgetauscht werden. Auf- seiten der eingebetteten Systeme interagieren diese Systeme zunehmend mit ihrer Umgebung – man spricht in diesem Zusammenhang auch von Cyber- Physical Systems (CPS) (siehe auch Abb. 1). Diese werden ebenfalls miteinander verknüpft sein und für noch umfassendere Aufgabenstellungen Lösungen anbieten. Aufseiten der Informationssysteme werden diese auch über Organisationsgrenzen hinweg wei- ter vernetzt zu betrieblichen Informationssystemen der Zukunft, im Kontext des Softwareclusters Süd- west auch unter dem Begriff ,,Emergente Software“ bekannt [1, 2]. Sowohl für die informationssystemge- triebene betriebliche Software als auch für die durch Eingebettete Systeme getriebenen Cyber-Physical- Systems spielen zunehmend mobile Endgeräte eine zentrale Rolle. Durch die gleichberechtigte Integration der Systeme zu sogenannten Smart Eco- systems nimmt die Komplexität der entstehenden neuen Systemklasse weiter zu. Wichtig ist, dass diese Hierarchie von zunehmend komplexer wer- denden Lösungen nur funktionieren kann, wenn umfangreiche Daten korrekt ausgewertet werden. DOI 10.1007/s00287-014-0772-x © Springer-Verlag Berlin Heidelberg 2014 Peter Liggesmeyer Präsident der Gesellschaft für Informatik e.V. (GI) Ahrstraße 4, 53175 Bonn E-Mail: [email protected] Peter Liggesmeyer · Jörg Dörr · Jens Heidrich Fraunhofer IESE, Fraunhofer-Platz 1, 67663 Kaiserslautern E-Mail: {peter.liggesmeyer, joerg.doerr, jens.heidrich}@iese.fraunhofer.de

Big Data in Smart Ecosystems

  • Upload
    jens

  • View
    216

  • Download
    1

Embed Size (px)

Citation preview

HAUPTBEITRAG / BIG DATA IN SMART ECOSYSTEMS }

Big Data in Smart EcosystemsPeter Liggesmeyer · Jörg Dörr

Jens Heidrich

EinleitungDie Diskussion von Big-Data-Fragestellungen mitausschließlichem Bezug auf Daten im Internet wirdder Bedeutung des Themas nicht gerecht. Natür-lich wirft Big Data einerseits viele Fragen für denUmgang von Nutzern mit Internet-Diensten auf. An-dererseits ermöglicht die Auswertung von Daten imInternet ohne Zweifel bessere, adressatengerechtereAngebote. Aber das Internet im engeren Sinne isteben nur einer von vielen Bereichen, in denen BigData eine zunehmend wichtige Rolle spielen wird. Indem Maße, in dem die Digitalisierung alle Bereichedes Lebens zunehmend durchdringt, werden Datenerzeugt, sodass auch Big Data eine querschneidendeRolle einnimmt.

In der aktuell stattfindenden Diskussion überdie vierte industrielle Revolution (Industrie 4.0)werden explizit auch Big-Data-Themen adressiert.Charakteristisch für Industrie 4.0 sind flexible Pro-duktionsumgebungen, was einen hohen Grad anAutonomie, die Fähigkeit zur Selbstorganisation,sinnvolle Reaktionen auf Umgebungseinflüsse unddie Fähigkeit zur verlässlichen Bewertung von Ei-genschaften – z. B. Sicherheit – erfordert. Dies setztdie Beschaffung, Verknüpfung und Auswertung vonDaten sowie die Initiierung von Reaktionen auf Basisder Ergebnisse voraus. Zusätzlich müssen dabei z. B.Echtzeitanforderungen und ggf. Gefährdungssitua-tionen mit betrachtet werden. Ähnliche Beispielelassen sich in praktisch jedem Anwendungsbereichfinden.

Zukünftige Systemlösungen werden aus zahl-reichen miteinander in Verbindung stehendenTeilsystemen bestehen, in denen Daten erzeugt und

zwischen denen Daten ausgetauscht werden. Auf-seiten der eingebetteten Systeme interagieren dieseSysteme zunehmend mit ihrer Umgebung – manspricht in diesem Zusammenhang auch von Cyber-Physical Systems (CPS) (siehe auch Abb. 1). Diesewerden ebenfalls miteinander verknüpft sein und fürnoch umfassendere Aufgabenstellungen Lösungenanbieten.

Aufseiten der Informationssysteme werdendiese auch über Organisationsgrenzen hinweg wei-ter vernetzt zu betrieblichen Informationssystemender Zukunft, im Kontext des Softwareclusters Süd-west auch unter dem Begriff ,,Emergente Software“bekannt [1, 2]. Sowohl für die informationssystemge-triebene betriebliche Software als auch für die durchEingebettete Systeme getriebenen Cyber-Physical-Systems spielen zunehmend mobile Endgeräteeine zentrale Rolle. Durch die gleichberechtigteIntegration der Systeme zu sogenannten Smart Eco-systems nimmt die Komplexität der entstehendenneuen Systemklasse weiter zu. Wichtig ist, dassdiese Hierarchie von zunehmend komplexer wer-denden Lösungen nur funktionieren kann, wennumfangreiche Daten korrekt ausgewertet werden.

DOI 10.1007/s00287-014-0772-x© Springer-Verlag Berlin Heidelberg 2014

Peter LiggesmeyerPräsident der Gesellschaft für Informatik e.V. (GI)Ahrstraße 4, 53175 BonnE-Mail: [email protected]

Peter Liggesmeyer · Jörg Dörr · Jens HeidrichFraunhofer IESE,Fraunhofer-Platz 1,67663 KaiserslauternE-Mail: {peter.liggesmeyer, joerg.doerr,jens.heidrich}@iese.fraunhofer.de

{ BIG DATA IN SMART ECOSYSTEMS

ZusammenfassungDie Diskussion über Big Data ist viel mehr als dieklassische Analyse von Internetdaten. Im Zeit-alter von Industrie 4.0 und dem Aufkommenvon Cyber-Physical Systems und schlussend-lich hochgradig integrierten Smart Ecosystemsgeht es darum, einen tatsächlich greifbarenMehrwert aus einem schier unendlich großenDatenschatz zu schaffen. Dabei gilt es einer-seits, die funktionale Sicherheit der beteiligteneingebetteten Systeme nicht zu gefährden, undandererseits, die Sicherheit der Daten innerhalbeines Smart Ecosystems nachhaltig sicherzustel-len. Dies stellt die Voraussetzung dar, um eineAkzeptanz derartiger Systeme langfristig zu er-reichen. Der vorliegende Beitrag zeigt einigezentrale Aspekte auf, die es bei der Umsetzungvon Big-Data-Systemen in Smart Ecosystems zubeherrschen gilt. Des Weiteren werden mögli-che Applikationsszenarien, die alle Bereiche derIndustrie und Wirtschaft umfassen, aufgezeigt.In diesem Zusammenhang werden einerseitsaktuelle Probleme aus Sicht der Praxis diskutiertund andererseits einige Herausforderungen inder Software-Engineering-Forschung aufge-zeigt, um Big-Data-Systeme zukünftig effektivund effizient unter Einhaltung vorgegebenerQualitätsmerkmale konstruieren zu können.

Beispiele für derartige Anwendungsberei-che sind die dezentrale Erzeugung, Verteilungund Speicherung von Energie aus regenerativenQuellen oder auch moderne Mobilitätslösun-gen. Die umfassende Nutzung von regenerativenEnergiequellen erfordert u. a. eine intelligenteSteuerung der Erzeugung, Verteilung und Spei-cherung der Energie, die verlässliche Erfassungvon Daten einschließlich entsprechender Schutz-mechanismen (Security), die sichere Handhabunghoher potenzieller Energien in Energiespeichernsowie den sicheren Netzbetrieb (Safety). Mo-derne Mobilitätslösungen zielen bei Fahrzeugenauf eine Minimierung des Treibstoffverbrauchsund die Sicherstellung günstiger Emissions-werte. In beiden Beispielen kann die geforderteLösung nur durch sichere, miteinander kommu-nizierende, verteilte Systeme mit entsprechenderSteuerungssoftware auf Basis der verfügbaren

umfangreichen, heterogenen Daten realisiertwerden.

Auch Energieversorgungs- und Mobilitäts-lösungen werden weiter zusammenwachsen. DieErzeugung, Speicherung und Verteilung regenera-tiver elektrischer Energie muss zwangsläufig einezunehmende Anzahl von Elektrofahrzeugen berück-sichtigen, da diese entsprechend versorgt werdenmüssen. Diese Fahrzeuge können allerdings auch alsEnergiespeicher dienen. Dann muss das Ziel sein,eine sinnvolle Kombination aus Energiemanage-ment und Mobilität in diesem ,,Smart Ecosystem“zu erreichen. Und das ist ganz ohne Zweifel eineBig-Data-Fragestellung. Im Folgenden werden zen-trale Aspekte im Kontext von Big Data für SmartEcosystems beleuchtet und beispielhafte, prakti-sche Applikationsszenarien beschrieben, in denenBig-Data-Analysen in Smart Ecosystems relevantwerden. Weiterhin werden wesentliche Heraus-forderungen aus Sicht der Praxis und Forschungaufgezeigt.

Zentrale Aspekte von Big Datain Smart Ecosystems

Bei der Sammlung und Verarbeitung von Big Dataim Kontext von Smart Ecosystems gibt es eine Reihezentraler Aspekte, die sowohl eine Herausforderungbei der praktischen Umsetzung von entsprechendenAnalysesystemen darstellen als auch einen wirk-lichen Mehrwert bei der aktiven Nutzung von BigData bedeuten. Im Folgenden werden diese zen-tralen Aspekte einander gegenübergestellt und miteinigen Beispielen aus der großen Menge an un-terschiedlichen Applikationsszenarien im BereichSmart Ecosystems erläutert.

Analyse historischer vs. zeitnaher Ereignisse: Umlangfristige Zusammenhänge erkennen und entspre-chende Modelle für die Zukunft ableiten zu können,ist die Analyse historischer Daten in einem SmartEcosystem unabdingbar, beispielsweise, um Produk-tionsprozesse auf Basis historischer Produktions-und Verkaufsdaten nachhaltig zu optimieren. Umkurzfristig und im Extremfall in Echtzeit auf Er-eignisse im Smart Ecosystem reagieren zu können,müssen außerdem Mechanismen zur schnellenDatenanalyse vorgehalten werden und Big-Data-Analysen müssen mit Complex Event Processingverzahnt werden. Dies geschieht beispielsweise,um den Produktionsprozess individuell auf aktu-elle Kundenanfragen hin anpassen zu können. Bei

Abb. 1 Big Data im Kontext der Integrationheterogener Systemklassen zu SmartEcosystems

langfristigen Analysen werden hohe Anforderungenan die Genauigkeit der Modelle gestellt; bei kurz-fristigen Entscheidungen tritt die Schnelligkeit derAnalyse in den Vordergrund.

Automatisierte vs. manuelle Analysen: Um mitBig Data einen Regelkreis unter Einhaltung vor-definierter Parameter effizient unter bekanntenWirkmechanismen zu steuern, werden einerseitsentsprechend automatisierte Verfahren benö-tigt. Andererseits ist es sinnvoll, gezielt manuelleAnalyseverfahren einzusetzen, um unbekannteBeziehungen zu eruieren und, falls sinnvoll, inautomatisierte Verfahren zu überführen. Dies istbeispielsweise bei einem Applikationsszenario inder Agrarwirtschaft sinnvoll, um den Wirkzusam-menhang zwischen der Effizienz eines bestimmtenDüngemittels und bestimmten klimatischen Bedin-gungen zu ermitteln und dessen Einsatz zukünftigentsprechend weitestgehend automatisiert zusteuern.

Lokale vs. globale Analysen: In einem SmartEcosystem können Big Data lokal innerhalb eineseinzelnen Systems (beispielsweise in der Energie-wirtschaft bei der Analyse seismischer Daten) oderglobal über verschiedene Systeme übergreifend(beispielsweise bei der Steuerung der Auslastungvon Energienetzen) benutzt werden. Dies bedingtentsprechende lokale und globale Analyseme-chanismen und Verfahren zur Sicherstellung derDatensicherheit, insbesondere, falls Daten überUnternehmensgrenzen hinweg analysiert werdensollen.

Interne vs. unternehmensübergreifende Kom-munikation: Big-Data-Analysen finden heute in derRegel nur innerhalb der eigenen Unternehmens-grenzen statt. Häufig bestehen große Hindernisse

im Austausch von Daten schon zwischen unterneh-mensinternen Geschäftseinheiten im Hinblick aufDatenhoheit und Datenschutz. Big-Data-Analysenüber Unternehmensgrenzen hinweg sind daherunüblich, bergen jedoch ein hohes Potenzial fürechte Innovationen, sobald die technische und wirt-schaftliche Machbarkeit dafür gegeben ist. ZentralesElement dafür ist die Überprüfung des Mehrwertssolcher Analysen auf der wirtschaftlichen Seiteund die Gewährleistung der Datenhoheit auf dertechnischen Seite. So könnte beispielsweise eineRoot-Cause-Analyse in der Produktionstechnik ef-fizient über die komplette Zuliefererkette gefahrenwerden.

Aktive Datenabfragen vs. passive Ereignisse:Big-Data-Analysen können passiv bei Auftretenentsprechender Ereignisse gefahren werden. Diesekönnen zeitliche Ereignisse im Sinne von turnusmä-ßigen Abfragen, aber auch auftretende Ereignisseaus Complex Event Processing oder ähnlichen Ver-fahren, z. B. bei unvorhergesehenen Vorfällen in derProduktion, sein. Gerade wenn neuartige Phäno-mene auftreten und eine gewisse Unsicherheit beider Interpretation der Datenmengen besteht (z. B.bei der Frage, ob wirklich kausale Zusammenhängevorliegen oder etwas ein statistisches Artefakt ist),so können die Analysen bei passiven Ereignissenmit zusätzlichen aktiven Datenabfragen kombiniertwerden. Dies kann einerseits durch die Einbezie-hung großer Nutzergruppen ermöglicht werden.Gerade in Smart Ecosystems treffen wir häufig aufSituationen, in denen große Nutzergruppen be-fragt werden können, z. B. alle Energieeinspeiserbzw. -verbraucher im Kontext von SmartEnergy.Hier können Analysesysteme mit Crowdsourcing-Lösungen kombiniert werden. Andererseits können

{ BIG DATA IN SMART ECOSYSTEMS

Expertengruppen direkt in die Interpretation derAnalyseverfahren eingebunden werden, z. B. mittelsentsprechender Abfragen über Mobilgeräte.

Aussichtsreiche ApplikationsszenarienIm Folgenden werden aussichtsreiche Applikations-szenarien für den gewinnbringenden Einsatz vonBig Data in Smart Ecosystems vorgestellt und disku-tiert.

Im Bereich der Produktionstechnik interagie-ren komplexe Produktionsanlagen mit Waren-wirtschaftssystemen und ERP-Systemen, umWertschöpfungsketten und Produktionsprozesseeffizient zu steuern und zu optimieren. Der Ein-satz von Big-Data-Analysen im Kontext eines SmartEcosystems ermöglicht einerseits eine globale Op-timierung über Unternehmensgrenzen hinweg undandererseits die flexible Anpassung und Steuerungder Abläufe basierend auf Kundenwünschen bishin zur individuellen Fertigung entsprechenderProdukte. Darüber hinaus können umfangreicheFehler-Ursachen-Analysen gefahren werden, umQualitätsmängel über die komplette Zuliefererkettenachhaltig abzustellen und damit Zeit und Kostenbei der Integration zugelieferter Komponenten zusparen.

Im Bereich der Agrarwirtschaft interagierenintelligente Nutzfahrzeuge mit entsprechend in-tegrierten Geräten mit Sensornetzwerken undBetriebsmanagementsystemen, um alle relevantenUmgebungsdaten zu erfassen, zu analysieren undzu einer Entscheidungsvorlage zur Steuerung undOptimierung von Arbeitsprozessen zu verdichten.Dies geschieht nicht nur lokal oder regional für einbestimmtes agrarwirtschaftliches Unternehmen,sondern geht bis hin zur unternehmensübergreifen-den globalen Datenanalyse, um kritische Ereignissezu identifizieren, über Root-Cause-Analysen aufdie entsprechenden Ursachen zu schließen undArbeitsabläufe entsprechend zu verbessern.

Im Bereich der Energiewirtschaft geht es umeine ganzheitliche Betrachtungsweise von derErzeugung über die Speicherung bis hin zum Ver-brauch von Energie. Dabei müssen ungeheureDatenmengen aus verschiedensten Systemen, wieherkömmlichen Kraftwerken, Windkraftanlagen,Solaranlagen, Speicherkraftwerken, Smart Me-ters im gewerblichen und privaten Bereich überUnternehmen und Körperschaften hinweg analy-siert werden. Dies ermöglicht beispielsweise eine

effektivere und effizientere Aussteuerung des Ener-gieverbrauchs und die Vermeidung von Über- undUnterlastszenarien sowie z. B. den Einsatz teurerGrundlastkraftwerke.

Im Bereich der Medizintechnik und des Ge-sundheitsmanagements steht die Integrationmedizintechnischer Geräte mit gesellschafts- undsozialpolitischen Prozessen und Maßnahmen imVordergrund, um präventiv Erkrankungen undRisiken vorzubeugen und medizinische Prozesseeffektiver und effizienter zu gestalten. Im Kontextaltersgerechter Assistenzsysteme können Big-Data-Analysen beispielsweise über die geschickteIntegration lokal vorhandener Daten mit globalenVorhersagemodellen das frühzeitige Erkennen vonGefahren- und Risikosituationen ermöglichen.

Im Bereich der Fahrzeugtechnik und derintelligenten Mobilität werden Fahrzeuge mitein-ander vernetzt und kommunizieren mit anderenSystemen innerhalb eines Smart Ecosystems. Big-Data-Analysen können in diesem Zusammenhangbeispielsweise global Verkehrsflüsse optimieren,Transportzeiten und Liegezeiten (von Waren) ver-kürzen und dem Menschen als zentralem Nutzerintelligente Mobilitätsdienstleistungen zur Verfü-gung stellen. Sie tragen damit zur Minimierungdes Treibstoffverbrauchs bei und reduzieren denAusstoß von Schadstoffen.

Die oben skizzierten Applikationsszenarien sindin einem Smart Ecosystem nicht getrennt vonein-ander zu betrachten, sondern als ein Ausschnitteines sich ständig weiterentwickelnden Systems,in dem neue Dienstleistungen und Organisatio-nen hinzukommen und aus dem andere über dieZeit hinweg ausscheiden können. Diese Verzahnungist heute bereits im Bereich der Energiewirtschaftund der Elektromobilität zu beobachten, wo Elek-trokraftfahrzeuge einerseits als Konsumenten vonEnergie auftreten, andererseits aber auch als de-zentrale Energiespeicher gesehen werden können.Ein weiteres Beispiel liegt in der Verknüpfung vonProduktionstechnik und intelligenten Mobilitätssys-temen mit dem Ziel, die Transport- und Liegezeitenvon Waren zu verkürzen und flexibel auf Umpla-nungen von Produktionsprozessen reagieren zukönnen.

Eine umfassendere Darstellung mit Fokus aufApplikationsszenarien im Kontext von Industrie4.0 findet sich beispielsweise in der IntegriertenForschungsagenda CPS [3].

Herausforderungen in der PraxisUm Big-Data-Analysen in Smart Ecosystemsermöglichen zu können, müssen diverse Heraus-forderungen sowohl in der Praxis als auch in derForschung (siehe nächstes Kapitel) gemeistert wer-den. Aus Sicht der Praxis wird im Folgenden auf dreiwesentliche Herausforderungen eingegangen.

Geeignete Infrastruktur: In Smart Ecosystemsarbeiten Unternehmen unterschiedlicher Größenin einem Ökosystem zusammen. Zur Analyse derDaten wird in den Unternehmen eine Big-Data-Infrastruktur mit entsprechender Rechenleistungbereitgestellt. Dies stellt Unternehmen vor mehrereHerausforderungen. Gerade kleine und mittelgroßeUnternehmen werden sich ggf. keine dedizierte In-frastruktur anschaffen wollen bzw. können. Hiermüssen neue Lösungsstrategien gefunden werden.Einerseits bietet der Trend zur Speicherung von Da-ten in der Cloud erste Ansätze für Big-Data-Analysenin der Cloud. Für die Analyse von sensiblen Datensind aber auch Ansätze der zeitweisen Anmietungvon Infrastruktur denkbar. Beide Ansätze sind alsBig-Data-Analysen sozusagen ,,on-demand“ vor-stellbar. Ein zweites Problem ist die bereits jetztvoranschreitende Etablierung von unterschiedli-chen, teilweise inkompatiblen Technologien zurBig-Data-Analyse. Hier entwickelt sich eine hetero-gene Landschaft von Big-Data-Anbietern, die sich inden Smart Ecosystems verschiedener Unternehmenunterschiedlich ausprägt. Für unternehmensüber-greifende Analysen müssen sich dann z. B. de-factoStandards in einem Ökosystem, kompatible Schnitt-stellen zwischen den Anbietersystemen oder einegeeignete, performante Zwischenschicht zumDatenaustausch etablieren.

Etablierung innovativer Geschäftsmodelle: All-gemein gilt, dass innovative Geschäftsmodelle einezentrale Fragestellung in Smart Ecosystems sind.Wir sehen jetzt in diversen Bereichen, dass sich neueAnbieter in etablierte Systeme einbringen wollenund können (z. B. Google im Automobilbereich). Aufder anderen Seite müssten sich auch neue, teilweisenoch nicht existierende Dienstanbieter gründen,um innovative Geschäftsmodelle zu ermöglichen.Ein Beispiel dafür wären die oben genannten ,,on-demand“-Analysen. Häufig stellt sich jedoch füralle potenziellen Beteiligten in einem solchen inno-vativen Geschäftsmodell im Smart Ecosystem dieFrage nach dem Risikomanagement, bzw. nach derTragfähigkeit eines solchen Geschäftsmodells. Lohnt

es sich, für einen gewissen Betrag Teile der eigenenDaten für eine Analyse an Geschäftspartner preis-zugeben? Welcher Preis wäre der richtige? WelchesRisiko besteht, dass die Daten oder die Analyseer-gebnisse zu anderen Zwecken missbraucht werden?Aus Sicht derer, die die Daten gerne einsehen wol-len, stellen sich analoge Fragen, beispielsweise: wasgenau bringt mir die Einbeziehung der Partnerdatenfür meine Analysen wirklich? Diese praktischen Her-ausforderungen stehen eng mit Forschungsfragenin Zusammenhang. Wenn die Forschung beispiels-weise Simulationsumgebungen für solche SmartEcosystems im Sinne einer Rapid-Prototyping-Umgebung entwickelt hat, könnte die Frage nachdem Mehrwert besser beantwortet werden. WennVerfahren und Technologien einmal ausgereift sindund den Datenschutz bei den Analysen und de-ren Daten gewährleisten können, werden weitereHemmschwellen sinken.

Standardisierung: Für einen effizienten Da-tenaustausch zwischen Unternehmen, aber auchzwischen den Analyseergebnissen unterschied-licher Technologien wäre eine Standardisierungder Daten, deren Modellierungsverfahren und derSpezifikation der Datenqualitäten eine erheblicheErleichterung. Eine mögliche Standardisierung fürBig-Data-Analysen in Smart Ecosystems kann sichjedoch schwierig gestalten. Viele Standardisierungs-verfahren finden für eine konkrete Branche statt,z. B. im Maschinenbau, in der Automobilbranche,in der Finanzbranche. Charakteristisch für SmartEcosystems ist es jedoch einerseits, dass am Öko-system Teilnehmer unterschiedlichster Branchenteilnehmen und andererseits, dass die Menge derTeilnehmer im Ökosystem sehr volatil sein kann.Dies kann eine schnelle Standardisierung sehrerschweren, bzw. ggf. unmöglich machen. Eine Stan-dardisierung über die Technologieanbieter wäre hierggf. der effizientere Weg.

Herausforderungen in der ForschungEntscheidungsmodelle: Ein Kernproblem bei Big-Data-Analysen liegt in der Verknüpfung vonGeschäftsmodellen und -zielen mit den potenzi-ell benötigten Daten und Informationen, um dierichtigen Entscheidungen für die Organisation(oder eine Gruppe von Organisationen in einemSmart Ecosystem) treffen zu können [4]. AktuelleForschungsarbeiten beschäftigen sich damit, wieEntscheidungsmodelle systematisch aus den Ge-

{ BIG DATA IN SMART ECOSYSTEMS

schäftszielen heraus konstruiert und wie Datenentsprechend aggregiert bzw. verdichtet werdenmüssen, um eine effiziente Entscheidungsfindungzu ermöglichen [5]. In der heutigen Zeit wird eineVielzahl von Daten über verschiedenste Systemehinweg gesammelt, aber es ist vielfach unklar,wie diese Daten sinnvoll im Kontext der strategi-schen Ausrichtung und unter Berücksichtigung derDatensicherheit eingesetzt werden können.

Daten- und Informationsqualität: Ein weiteresGrundproblem bei Big-Data-Analysen stellt dasVertrauen in die Daten und die daraus abgeleite-ten Informationen dar. Dies wird im Kontext vonSmart Ecosystems dadurch verstärkt, dass die Da-ten aus unterschiedlichsten Systemen verschiedenerOrganisationen stammen können und beispiels-weise Details über die Art der Datensammlung undQualitätssicherung nicht bekannt sind. AktuelleForschungsarbeiten beschäftigen sich beispiels-weise mit der expliziten Modellierung der Dateninkl. geforderter Qualitätscharakteristiken, wieVollständigkeit, Konsistenz oder Aktualität der Da-ten basierend auf Ansätzen aus dem Bereich derSoftware-Qualitätsmodellierung [6]. Abhängig vomkonkreten Applikationsszenario stehen dabei un-terschiedliche Charakteristiken im Vordergrund.Falls kurzfristig Entscheidungen getroffen werdenmüssen, kommt beispielsweise der Aktualität derDaten eine besondere Rolle zu. Falls langfristigestrategische Entscheidungen getroffen werden müs-sen, spielt etwa die Genauigkeit, Vollständigkeit undKonsistenz der Daten eine viel größere Rolle.

Datenvisualisierung: Nicht alle Entscheidun-gen in einem Smart Ecosystem werden auf Basiseines automatisierbaren Regelkreises getroffen,sondern sind vielfach menschbasiert. Um denEntscheidungsträger zu unterstützen, sind Visua-lisierungsmechanismen unabdingbar. Dabei kannman grob zwischen Ansätzen zur Verdichtung undnutzergerechten Exploration von Big Data [7] undAnsätzen zur effizienten algorithmischen Umset-zung der Visualisierung großer Datenmengen [8]unterscheiden. Aktuelle Arbeiten beschäftigen sichunter anderem damit, welche Visualisierungsme-chanismen für Big Data geeignet sind und wie derNutzer mit diesen interagieren muss, um effizientEntscheidungen treffen zu können.

Akzeptanz: Eine übergeordnete Fragestellungbei der Nutzung von Big Data in Smart Ecosystemsliegt darüber hinaus in der Akzeptanz derartiger

Systeme durch den Menschen als zentralen Nut-zer. Im Endeffekt handelt es sich bei einem SmartEcosystem um ein soziotechnisches System, in demder Mensch sowohl als Datenquelle (z. B. im Rah-men von Crowdsourcing-Ansätzen) als auch alsAktuator (z. B. um Entscheidungen auf Basis vonBig-Data treffen zu können) auftritt. Eine aktuelleHerausforderung liegt darin, unter Gewährleistungder Sicherheit der bereitgestellten Daten möglichstzuverlässig und transparent den Menschen als Da-tenquelle zu integrieren und ihn andererseits mitder Informationsvielfalt nicht zu überfrachten,sondern ihn mit einer der jeweiligen Entscheidungs-findung angemessenen Menge an Informationen zuversorgen.

Partitionierung globaler & lokaler Berech-nungen: Schon bei der lokalen Analyse großerDatenmengen aus einem Datenbestand beschäftigtsich die Forschung damit, wie die Daten so model-liert werden können, dass Berechnungen maximalparallelisiert ablaufen können, um die Auswertun-gen in den geforderten Zeiträumen zur Verfügung zustellen. Wenn nun im Kontext von Smart EcosystemsDaten global, d. h. unternehmensübergreifend, ana-lysiert werden sollen, geht man sowohl aufgrund derVolumina der Daten als auch aufgrund des geforder-ten Datenschutzes nicht davon aus, dass die Daten aneinen Ort zur Analyse kopiert werden können. Statt-dessen stellt sich die Frage, wie die Datenanalysenso partitioniert werden können, dass Teilanalysenbei einzelnen Unternehmen ablaufen und danachwieder zu einem Gesamtergebnis aggregiert werdenkönnen.

Simulatoren: Wie im Kapitel Herausforde-rungen in der Praxis schon angedeutet, bestehenfür Big-Data-Analysen im Kontext innovativerGeschäftsmodelle in Smart Ecosystems oft vieleHemmnisse. Die Erforschung von Simulationsum-gebungen für Smart Ecosystems kann auch für diedarin essenziellen Big-Data-Analysen einen großenMehrwert bieten. Wenn alle Teilnehmer beispiels-weise einer solchen Simulationsumgebung mitteilenwürden, welche Datentypen sie mit welchen Qualitä-ten anbieten könnten, so könnte ein Teilnehmer imÖkosystem eine Anfrage an die Simulationsumge-bung stellen, ob eine Analyse möglich ist. Weiterhinkönnte er diese ggf. sogar mit Test-Daten ausführen,um ein Gefühl dafür zu erhalten, welchen Wert einAnalyseergebnis für ihn hätte. Erst in einem zweitenSchritt würde dann, nachdem sich die Teilnehmer

im Ökosystem auf ein entsprechendes Geschäfts-modell geeinigt haben, die Analyse auf den echten,freigegebenen Daten ausgeführt.

Datennutzungskontrolle: Zentrale Fragestel-lungen für Unternehmen im Kontext von SmartEcosystems sind Datenhoheit und Datenschutz. Esist unwahrscheinlich, dass viele Unternehmen ihrevollständigen Datenmengen allen Teilnehmern imÖkosystem frei zugänglich machen möchten. Sensi-ble Daten wie z. B. Produktions- und Qualitätsdatenkönnten zwar für Szenarien wie unternehmensüber-greifende Produktionsdatenanalyse im Kontext vonAutomobilfertigung ein hohes Potenzial bieten, je-doch werden diese Daten von den Teilnehmern nichtfrei bereitgestellt. Daher kommt der Forschung imBereich Datenschutz für Big Data in Smart Eco-systems eine besondere Bedeutung zu, da sie einKernhemmnis für unternehmensübergreifendeAnalysen eliminiert. Existierende Forschung im Be-reich Nutzungskontrolle [9, 10] ermöglicht es bereitsdurch entsprechend formulierte Regeln (sogenanntePolicies) und eine modifizierte Infrastrukturum-gebung (Enforcement Framework), Daten, diedie eigene Unternehmensgrenze verlassen, effek-tiv zu schützen. Diese Frameworks sind jedochnoch nicht auf die Erfordernisse von Big-Data-Technologien optimiert. Hier muss beispielsweiseerforscht werden, ob die erforderliche Performanzin der Analyse der Daten bei der Kombinationvon existierender Nutzungskontrolltechnologie mitBig-Data-Technologien erreicht werden kann.

Zusammenfassung und FazitDie Diskussion über Big Data ist viel mehr als diegeschickte und gewinnbringende Analyse von In-ternetdaten. Im Zeitalter der vierten industriellenRevolution und dem Aufkommen von Cyber-Physical Systems und schlussendlich hochgradigintegrierten Smart Ecosystems geht es darum, einentatsächlich greifbaren Mehrwert für Unternehmenund Individuen aus der potenziellen Verfügbarkeiteines schier unendlich großen Datenschatzes zuschaffen. Bei Big Data in einem Smart Ecosystemspielen sowohl Daten aus klassischen eingebettetenSoftwaresystemen wie auch Business InformationSystems und auch der Mensch als zentrale dritteDatenquelle eine herausragende Rolle. Dabei gilt eseinerseits, die funktionale Sicherheit der beteiligten

eingebetteten Systeme nicht zu gefährden, und an-dererseits, die Sicherheit der Daten innerhalb einesSmart Ecosystems nachhaltig sicherzustellen. Diesstellt die Voraussetzung dar, um eine Akzeptanz von-seiten des Menschen als zentraler Figur eines SmartEcosystems zu schaffen. Akzeptanz umschließt da-bei die Bereitschaft, Daten unter der Prämisse derSicherheit in ein solches System einzugeben undgleichzeitig einen tatsächlichen Mehrwert aus derNutzung der Daten zu ziehen.

Der vorliegende Beitrag zeigte einige zentraleAspekte von Big Data in Smart Ecosystems auf, die eszu beherrschen gilt, wenn derartige Systeme Realitätwerden sollen. Des Weiteren wurde die Spannbreitemöglicher Applikationsszenarien, die alle Bereicheder Industrie und Wirtschaft umfasst, aufgezeigt. Indiesem Zusammenhang wurden aktuelle Herausfor-derungen aus Sicht der Praxis diskutiert, die es kurz-bis mittelfristig zu adressieren gilt, um entspre-chende Big-Data-Systeme erfolgreich umzusetzen.Darüber hinaus wurden einige Herausforde-rungen in der Software-Engineering-Forschungaufgezeigt, um Big-Data-Systeme zukünftig effek-tiv und effizient unter Einhaltung vorgegebenerQualitätsmerkmale konstruieren zu können.

Literatur1. Der Softwarecluster, http://www.software-cluster.com/de/, letzter Zugriff

14.1.20142. Knodel J, Webel Ch (2013) Softwareentwicklung 2020. Business Technology Ma-

gazin (1) (www.bt-magazin.de)3. Deutsche Akademie der Technikwissenschaften (2012) Integrierte Forschungs-

agenda Cyber-Physical Systems. In: Geisberger E, Broy M (Hrsg) Acatech Studie,März 2012

4. Biesdorf S, Court D, Willmott P (2013) Big data: What’s your plan? McKinsey Quar-terly (März 2013)

5. Basili V, Heidrich J, Lindvall M, Münch J, Regardie M, Rombach D, Seaman C, Tren-dowicz A (2010) Linking Software Development and Business Strategy ThroughMeasurement. IEEE Comput 43(4):57–65

6. Wagner S, Lochmann K, Heinemann L, Kläs M, Trendowicz A, Plösch R, Seidl A,Goeb A, Streit J (2012) The Quamoco Product Quality Modeling and AssessmentApproach. Proceedings der 34. International Conference on Software Engineering(ICSE 2012), Zürich, Schweiz, 1133–1142

7. Keim DA, Kohlhammer J, Ellis G, Mansmann F (2010) Mastering The InformationAge – Solving Problems with Visual Analytics, Eurographics

8. Joy KI (2009) Massive data visualization: a survey. In: Möller T, Hamann B, RussellRD (eds) Mathematical Foundations of Scientific Visualization, Computer Graphics,and Massive Data Exploration. Springer, Heidelberg

9. Feth D, Jung Ch (2012) Context-Aware, Data-Driven Policy Enforcement for SmartMobile Devices in Business Environments. In: Schmidt A, Russello G, Krontiris I,Lian S (eds) Security and Privacy in Mobile Information and Communication Sys-tems. 4th International Conference, MobiSec 2012 – Revised Selected Papers. Lec-ture Notes of the Institute for Computer Sciences, Social Informatics and Telecom-munications Engineering 107. Springer, Berlin, 69–80

10. Neisse R, Doerr J (2013) Model-based specification and refinement of usage con-trol policies. Eleventh Annual International Conference on Privacy, Security andTrust (PST), IEEE 2013