Was die Cloud mit einem brennenden Haus zu tun hat

Preview:

Citation preview

oder

Was die Cloud mit einem brennenden

Haus zu tun hat

Hybride Cloud-Szenarien

02.11.2016

Prof. Dr. Nane Kratzke

Ein Vortrag über ...

Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 2

häufig genannte Bedenken warum Cloud-basierte Geschäftsmodelle vermieden werden:

• Verfügbarkeit

• Sicherheit

• Vendor Lock-In (Fokus dieses Vortrags)• Kosten (Ausblick) Presentation URL

„Ein Ring sie zu knechten,ein Ring sie zu finden,ein Ring sie ins Dunkel zu treibenund ewig zu binden.“

Oder um im Genre zu bleiben:

Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 3

FLUCHTWEG (Agenda)

4

Was heißt es, wenn die Cloud brennt?

Wie lang ist eigentlich ihr Fluchtweg?

Wer kümmert sich eigentlich um Brandschutz in der Cloud?

Baulicher Brandschutz und Fluchtwege?

Wieso eigentlich das Risiko eingehen?

Was ist ihr sehnlichster Wunsch in einem brennenden Haus?

Raus! Und zwar schnell ...

Cloud TRANSIT (ein Forschungsprojekt)

7

• Es gibt viele Ansätze um in die Cloud zu kommen.

• aber kaum (praktikable) Ansätze eine Cloud zu verlassen oder zu wechseln.

• Jedoch: Wer weiß wie man rauskommt, ist eher bereit hineinzugehen.

Was heißt es nun, wenn die Cloud brennt ...

Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 8

• Provider ist insolvent ...

• Provider hebt Preise ...

• Provider reduziert meine Ressourcen-Limits ...

• Provider kündigt meinen Vertrag ...

• Provider hat Verfügbarkeitsprobleme ...

• Geänderte Gesetzeslage (Datenschutz) ...

• Sonstige Governance/Compliance Gründe (EU-Daten auf US-Boden?)

• Sonstige Image-Gründe (z.B. Verdi-Services auf AWS?)

Es gibt viele (schwer prognostizierbare) Gründe eine Cloud verlassen zu müssen.

FLUCHTWEG (Agenda)

9

Was heißt es, wenn die Cloud brennt?

Wie lang ist eigentlich ihr Fluchtweg?

Wer kümmert sich eigentlich um Brandschutz in der Cloud?

Baulicher Brandschutz und Fluchtwege?

Wieso eigentlich das Risiko eingehen?

Beispiel: Instagram

Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 10

• Weltweites Social Network zum Image-Sharing

• 20 Mitarbeiter

• Hosted on Amazon Web Services

• Marktwert 1 Mrd USD (das zahlte zumindest Facebook)

• Keine nennenswerten IT-Assets oder gar Rechenzentren (außer 20 Laptops)

JahreEs dauerte nur

Beispiel: Instagram

Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 11

• Etwa 1 Jahr für Analysen und

• Entwicklung von Toolings (insb. IP Collision Handling)

• Ca. 4 bis 8 Wochen für die eigentliche Migration

Frage: Wie lange benötigte Instagram, um seine Services in die Rechenzentren von Facebook zu migrieren?

???

Das war kein ad-hoc Umzug!

Ihr Fluchtweg kann also lang, ...

... einsam,

beschwerlich

und fernab jeder Datenautobahn verlaufen.

FLUCHTWEG (Agenda)

13

Was heißt es, wenn die Cloud brennt?

Wie lang ist eigentlich ihr Fluchtweg?

Wer kümmert sich eigentlich um Brandschutz in der Cloud?

Baulicher Brandschutz und Fluchtwege?

Wieso eigentlich das Risiko eingehen?

Wussten sie ...Mehr als 95% aller Unternehmen sind Klein- und Kleinstunternehmen

Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 14

KleinstunternehmenKleinunternehmenMittlere UnternehmenGroßunternehmen

Kategorie Mitarbeiter Umsatz

Kleinstunternehmen < 10 < 2 Mio. €

Kleinunternehmen < 50 < 10 Mio. €

Mittleres Unternehmen < 250 < 50 Mio. €

Großunternmehmen >= 250 >= 50 Mio. €

Verteilung von IKT Unternehmen in Europa (2014), EUSTAT

Aktuelle Cloud Computing Forschung ...

Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 15

• hat häufig implizite Annahmen:

• Beliebige Firmen mit

• großen IT-Abteilungen und der Fähigkeit

• beliebige Komplexität von Tools und Methoden beherrschen zu können.

• Diese “Super Tanker“ müssen keine Angst vor Unannehmlichkeiten wie Vendor Lock-In haben.

Unser Zielgruppe ist anders ...

Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 16

• Segelboot vs. Supertanker (Wetter)

• Kleine und mittlere Unternehmen

• 1 Personen IT-Abteilungen

• Public und Private Cloud Computing

• Wir untersuchen die Eignung von

• Container Technologien (z.B. Docker)

• Container Cluster (z.B. Kubernetes, Swarm, Mesos)

Unsere Erfahrung ....

Brandschutz (nicht nur) für kleine (d.h. 95% aller) Unternehmen sieht häufig

so aus ...

Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 17

FLUCHTWEG (Agenda)

18

Was heißt es, wenn die Cloud brennt?

Wie lang ist eigentlich ihr Fluchtweg?

Wer kümmert sich eigentlich um Brandschutz in der Cloud?

Baulicher Brandschutz und Fluchtwege?

Wieso eigentlich das Risiko eingehen?

Good News ...

Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 19

2006

2 von Standards abgedeckte Cloud

Services

2016

11 von Standards abgedeckte Cloud

Services

5 x mehr Standardisierung in 10 Jahren !!!

Am Beispiel:

Wesentliche (bittere) Erkenntnis

Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 20

2 2

2 4 6 77

7 7 11 11

1 1

2 4 7 1014

21 26 42 44

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016

Relationofconsid

eredservices

consideredbyCIMI,OCCI,CDMI,OVF,OCI,TOSCA notconsidered

Die Relation von standardisierten zu nicht standardisierten Diensten nahm aber dennoch über die letzten 10 Jahren ab!

Analyzed using over 2300 offical release notes of Amazon Web Services (AWS). Data for other providers like Google, Azure, Rackspace, etc. not presented. Basic conclusions for theseproviders are the same.

Cloud-native Applikativensind anfällig für Vendorlock-in Situationen. Dies

gilt insb. für KMU.

Das Cloud-Native Reference Model (ClouNS)

Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 21

Populäre Container-Cluster

Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 22

Docker SwarmSwarm Mode (Docker

1.12) kopiert Kubernetes-artige

Steuerungsprozesse. Kapselt diese aber in nur noch einer Komponenten und ist Secure by default(control and data plane). Versteckt damit Betriebs-

Komplexität.

GoogleSteuerungsprozesse die

kontinuierlich einen beabsichtigen Zustand einer

verteilten Applikation mit einem tatsächlichen Zustand

vergleichen, und bei Bedarf erforderliche Gegen-

maßnahmen automatisiert zu veranlassen. Nachfolger des

Google internen Borg Systems.

MesosphereApache Mesos ist ein

Datacenter Operating System für fein granulare Resourcen

Allokation. Mesos wird seit Jahren erfolgreich eingesetzt, um large scale Datacenters zu betreiben (Twitter, Netflix, ...)

Entwicklung von elatischen Plattformen (Open Source) ...

Vermeiden von Vendor Lock-In mittels existierender Container-Technologien

Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 23

Operate application on current provider.

Scale cluster into prospective provider.

Shutdown nodes on current provider. Cluster reschedules lost container.

Migration finished.

Pets

Cattle

FLUCHTWEG (Agenda)

24

Was heißt es, wenn die Cloud brennt?

Wie lang ist eigentlich ihr Fluchtweg?

Wer kümmert sich eigentlich um Brandschutz in der Cloud?

Baulicher Brandschutz und Fluchtwege?

Wieso eigentlich das Risiko eingehen?

Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 25

Kostenassoziativät

Neue Geschäftsmodelle

z.B. Kostenassoziativität

z.B. Peak Loads

Berkley View of Cloud Computing, 2009: Kostenassoziativität im Cloud Computing

26

Es kostet dasselbe ...

... 720 Server

für eine Stunde

oder einen Server für

720 Stunden zu betreiben.

Wir haben Angst vor Peak Loads, nur warum?

27

„In other words, even if cloud services cost, say, twice as much, a pure cloud solution makes sense forthose demand curves where the peak-to-average ratiois two-to-one or higher.“Weinman, Mathematical Proof of the Inevitability of Cloud Computing, 2011

http://www.joeweinman.com/Resources/Joe_Weinman_Inevitability_Of_Cloud.pdf

Analysierter Anwendungsfall

• Webtechnologie Vorlesung und Praktikum Semester SS2011, SS2012, WS2012/13.

• Projekte: Entwicklung eines Web Information Systems

• Allen Studierendengruppen konnten nach eigenem Ermessen Ressourcen von Amazon Web Services (AWS) anfordern.

• Analyse der Kosten- und Resourcennutzung von Studierenden.

Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 28

Average to Peak Ratio pro Woche

29Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems

13 14 15 16 17 18 19 20 21 22 23 24 25

Average Box UsageMaximum Box Usage in an hour

(A)Maximum and Average Box Usage

Calendar Week

Use

d S

erve

r Box

es

010

2030

4050

13 14 15 16 17 18 19 20 21 22 23 24 25

(B)Accumulated Processing Hours per Week

Calendar WeekP

roce

ssin

g H

ours

0500

1000

1500

2000

14 16 18 20 22 24

0.0

0.2

0.4

0.6

0.8

1.0(C)

Average Box to Maximum Box Ratioaccording to Weinman

Calendar Week

Avg

to M

ax B

ox U

sage

Rat

io

Cloud computing iseconomical reasonable

Cloud computingmight be reasonable

Cloud computing iseconomical not reasonable

Ergebnis

30

Eine Cloud-basierte Lösungen bietet einen mehr als 25-fachen Kostenvorteil.

Das gemessene ATP Ratio von 0.035 bedeutet einen 1/0.035 == 28.57 fachen Kostenvorteil für einen Cloud Provider.

Verglichen mit einer Inhouse-Labor Lösung.

FLUCHTWEG (Agenda)

31

Was heißt es, wenn die Cloud brennt?

Wie lang ist eigentlich ihr Fluchtweg?

Wer kümmert sich eigentlich um Brandschutz in der Cloud?

Baulicher Brandschutz und Fluchtwege?

Wieso eigentlich das Risiko eingehen?

Zusammenfassung

• Sie wollen in die Cloud?

• Machen Sie sich VORHER über Fluchtwege vertraut!

• Fördern Sie doch mal Forschung für KMU (so teuer ist das gar nicht)

• d.h. für 95% aller Unternehmen

• (und nicht nur für 5%)

• Neue Geschäftsmodelle dank ...

• Kostenassoziativität

• Kostenvorteile insb. bei stark variierenden Workloads (peak, unpredictable, rising, falling, once in a lifetime, periodical workloads)

About

Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 33

CoSA: https://cosa.fh-luebeck.de/en/contact/people/n-kratzke

Blog: http://www.nkode.io

Twitter: @NaneKratzke

GooglePlus: +NaneKratzke

LinkedIn: https://de.linkedin.com/in/nanekratzke

GitHub: https://github.com/nkratzke

ResearchGate: https://www.researchgate.net/profile/Nane_Kratzke

SlideShare: http://de.slideshare.net/i21aneka

Prof. Dr. rer. nat. Nane Kratzke

Acknowledgement

• Mordor Meme by imgflip.com• All other pictures taken from Pixabay.com (CC0 Licence)

Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 34

Our research is funded by German Federal Ministry of Education and Research

(Project Cloud TRANSIT, 03FH021PX4). We thank fat IT solution GmbH (Kiel)

for their support of Cloud TRANSIT.

Picture ReferencePresentation URL

Backup Slides

Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 35

Cloud-native Applikationen

Cloud-native Applikationen haben eine hohe technische Abhängigkeit von unterliegenden Cloud

Infrastrukturen. Cloud TRANSIT untersucht, wie man Cloud-native Applikationen bauen und

betreiben sollte, um solche Abhängigkeiten zu reduzieren.

DEFINITION: A cloud-native application is a (micro)service-based, elastic and horizontal scalable application where each self-containeddeployment unit of that application is designedaccording to cloud-focused software design patternsand operated on a self-service agile elastic platform.

Gemessene Ressourcennutzung

37Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems

13 14 15 16 17 18 19 20 21 22 23 24 25

Average Box UsageMaximum Box Usage in an hour

(A)Maximum and Average Box Usage

Calendar Week

Use

d S

erve

r Box

es

010

2030

4050

13 14 15 16 17 18 19 20 21 22 23 24 25

(B)Accumulated Processing Hours per Week

Calendar Week

Pro

cess

ing

Hou

rs

0500

1000

1500

2000

14 16 18 20 22 24

0.0

0.2

0.4

0.6

0.8

1.0

(C)Average Box to Maximum Box Ratio

according to Weinman

Calendar Week

Avg

to M

ax B

ox U

sage

Rat

io

Training

Project 24x7 Migration

Woher kommt dieser Kostenvorteil?

Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 38

13 14 15 16 17 18 19 20 21 22 23 24 25

Average Box UsageMaximum Box Usage in an hour

(A)Maximum and Average Box Usage

Calendar Week

Use

d S

erve

r Box

es

010

2030

4050

13 14 15 16 17 18 19 20 21 22 23 24 25

(B)Accumulated Processing Hours per Week

Calendar Week

Pro

cess

ing

Hou

rs

0500

1000

1500

2000

14 16 18 20 22 24

0.0

0.2

0.4

0.6

0.8

1.0

(C)Average Box to Maximum Box Ratio

according to Weinman

Calendar Week

Avg

to M

ax B

ox U

sage

Rat

io

Wie müssen sie ihr Datacenter dimensionieren?peak load

Was wird nur benötigt?

averageload

Und das Delta?

Misst die Überdimensionierung ...

Wie macht man aus einem KMU ein Instagram?

Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 39

Einfach 20 Tech Nerds wie ihn ...

Das funktioniert vielleicht im Silicon Valley, ...

... Aber die meisten Firmen verkaufen Domänen-spezifische Dienste und beschäftigen daher Domänenexperten und keine Cloud-Experten (das ist sogar im Software Engineering so).

Gibt es einen anderen Weg?

... anheuern. Die wissen wie man das letzte aus einer Cloud herausholt.

Do you considered network latencies?You are relying on SDN ...

Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 40

Data transfer in relative comparison(bigger is better)

Message Size (kB)

Rat

io (%

)

0kB 50kB 150kB 250kB 350kB 450kB

40%

60%

80%

100%

120%

Reference: (Exp. V1, V3, V5)SDN loss on m3.large (2−core, V2 compared with V1)SDN loss on m3.xlarge (4−core, V4 compared with V3)SDN loss on m3.2xlarge (8−core, V6 compared with V5)

Decreasing loss with increaseof cores due to a reduction of

CPU contention effects.

(1) SDN deployed on high core machines decreasesperformance down to 80% - 90%.

(2) That is far less than a potential language impact (40% -190%).

Kratzke, N., & Quint, P.-C. (2016). ppbench- A Visualizing Network Benchmark forMicroservices. InProceedings of 6th. International Conference on Cloud Computing and Service Sciences (CLOSER 2016) (Vol. 2, pp. 223–231).

Kratzke, N., & Quint, P.-C. (2015). How toOperate Container Clusters more Efficiently? Some Insights Concerning Containers, Software-Defined-Networks, and theirsometimes Counterintuitive Impact on Network Performance. International Journal On Advances In Networks andServices, 8(3&4), 203–214.

Kratzke, N. (2015). About Microservices, Containers and their Underestimated Impact on Network Performance. In Proceedings ofCLOUD COMPUTING 2015 (6th. International Conference on Cloud Computing, GRIDS and Virtualization) (pp. 165–169).

Recommended