27
IT-Services & Consulting solutions & more Simon Ashdown, Peter Jansky 08.03.2018 IT-Betrieb

IT-Betrieb - pixel-group.de · 2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - Folie 2 IT Betrieb Ein Störfall ist eingetreten l „Der IT-Betrieb hat die Aufgabe, die Hardware

Embed Size (px)

Citation preview

IT-Services & Consulting

solutions & more

Simon Ashdown, Peter Jansky 08.03.2018

IT-Betrieb

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 2

IT Betrieb

Ein Störfall ist eingetreten

l „Der IT-Betrieb hat die Aufgabe, die Hardware und die zum Betrieb der Hardware

erforderliche Software in angemessenem Umfang zur Verfügung zu stellen und

störungsfrei zu betreiben.“

l „Im Störungsfall dient der IT-Betrieb als zentrale Ansprechstelle der Anwender, bei

Ausfällen hat er für die möglichst kurzfristige Wiederherstellung der Verfügbarkeit

Sorge zu tragen.“*

l Es geht um Verfügbarkeit

Systemwiederherstellung

Datenwiederherstellung

l NICHT

Systemschutz

Datenschutz (Spionage / Datenklau usw.)

* Gruber Versicherungslexikon, Dr. Christian Hofer

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 3

IT Betrieb

Früher wollte man sich gegen folgende Risiken schützen

l Hardwaredefekte

l Verlust einzelner Dateien (Anwenderfehler)

l Total Verlust (Disaster Recovery)

Heute kommen gestiegene Geschäftsrisiken bei den alten Themen dazu

l Big Data (Datenmengen)

l Vernetzung

l Business Modelle

Reines Internetgeschäft

Abhängigkeiten entlang der Wertschöpfungskette

....

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 4

Neue Risiken

und es kommen, neben den alten, weitere Risiken hinzu durch

l eine massiv gewachsene Anzahl von Endgeräten

l die meistens auch vernetzt sind

Mobile Endgeräte

Smart Devices, IoT

...

Die neuen Risiken

l Verlust bzw. die Verschlüsselung ganzer Laufwerke

Netzwerkfreigaben

Clients

l Backdoors und Sicherheitslücken (Ausfall von Servern)

Betriebssystem

Clients

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 5

Welche Risiken sind

l gefühlt

l reell

Risikoeinschätzung

l Gesamtrisiko

l Tolerierbares Risiko

l Restrisiko

l Pre-Loss

Vermeiden

Schutzmaßnahmen

l Post-Loss

Schadensminimierung

Abwälzen (Versicherung)

Risikomanagement

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 6

Risikomanagement

Weiß ich es wirklich …

Wie lange kann welches meiner Systeme ausfallen ohne

ernsthafte Konsequenzen für mein Unternehmen ?

1 Woche? 1 Tag? 4 Stunden? 1 Stunde?

?

Wieviel Datenverlust ist verkraftbar im Falle einer

Wiederherstellung ?

2 Tage? 1 Tag? 4 Stunden? 1 Stunde?

?

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 7

Risikomanagement

Wie lange darf im Fehlerfall die Wiederherstellung dauern?

l Welche Ausfallzeiten meiner Server Systeme kann ich verkraften?

Dienste, Warenwirtschaft, ERP, Mailserver, Webshop, …

l Wie lange komme ich ohne Zugriff auf meine Daten aus?

Dateien, E-Mail Postfächer, Datenbanken, …

l Wie lange komme ich ohne Kommunikation aus?

E-Mail, Telefonie, Internet, Cloud-Dienste, …

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 8

Risikomanagement

Welcher Zeitraum an Daten darf im Falle einer Wiederherstellung maximal verlorengehen?

l In welchen Intervallen kann ich Sicherungen zur Verfügung stellen?

Backups

Snapshots

Replikas

Spiegelungen

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 13

Wiederherstellung

Risiko Hardwareausfall oder Ausfall Serversystem

Klassisch

RTO: Je System ca. 1 – 3 Tage

RPO: letzter Backup, normalerweise Stand letzte Nacht vor dem Schadensfall

Backup über Betriebssystem-Agents auf Band oder VTL

Hohe Wiederherstellzeiten durch langwierige Vorgänge

Hardware-Beschaffung,

Installation Betriebssystem und Backup-Agent,

Restore aus Backup

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 14

Wiederherstellung

Risiko Hardwareausfall oder Ausfall Serversystem

Klassisch mit virtualisierten Servern

RTO: Je System ca. 1 – 2 Tage

RPO: letzter Backup, normalerweise Stand letzte Nacht vor dem Schadensfall

Backup über Betriebssystem-Agents auf Band oder VTL

Hohe Wiederherstellzeiten durch langwierige Vorgänge

(Hardware-Beschaffung),

Installation Betriebssystem und Backup-Agent,

Restore aus Backup

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 15

Wiederherstellung

Risiko Hardwareausfall

Optimiertes System

RTO: ca. 0 - 0,5 Stunden (je System)

RPO: 0 Stunden

Virtualisierung mit redundanten Virtualisierungs-Hosts (Hypervisor)

Gemeinsames zentrales Storage oder mehrere Storagesysteme

Automatisches Failover bei Ausfall Hypervisor

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 16

Wiederherstellung

Risiko Hardwareausfall

Optimiertes System

RTO: ca. 0 - 0,5 Stunden (je System)

RPO: 0 Stunden

Virtualisierung mit redundanten Virtualisierungs-Hosts (Hypervisor)

Gemeinsames zentrales Storage oder mehrere Storagesysteme

Automatisches Failover bei Ausfall Hypervisor

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 17

Wiederherstellung

Risiko Ausfall Serversystem

Optimiertes System

RTO: ca. 0,5 Stunden

RPO: ca. 1 Stunde

Virtualisierung mit redundanten Virtualisierungs-Hosts (Hypervisor)

Gemeinsames zentrales Storage oder mehrere Storagesysteme

Replizierung von Serversystemen in kurzen Intervallen

Alternative: Storage Snapshots in kurzen Intervallen

Achtung auf Datenintegrität !

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 18

Wiederherstellung

Risiko Ausfall Serversystem

Optimiertes System

RTO: ca. 0,5 Stunden

RPO: ca. 1 Stunde

Virtualisierung mit redundanten Virtualisierungs-Hosts (Hypervisor)

Gemeinsames zentrales Storage oder mehrere Storagesysteme

Replizierung von Serversystemen in kurzen Intervallen

Alternative: Storage Snapshots in kurzen Intervallen

Achtung auf Datenintegrität !

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 19

Wiederherstellung

Risiko Hardwareausfall oder Ausfall Serversystem

l Nochmal im Vergleich:

Klassisch

RTO: ca. 1 – 2 Tage

RPO: ca. 0,5 - 1 Tage

Optimiertes System

RTO: 0 - 0,5 Stunden

RPO: 0 – ca.1 Stunde

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 20

Wiederherstellung

Risiko Verschlüsselung, Verlust ganzer Dateisysteme

Klassisch

Fileserver oder NAS

RTO: 0,5 – x Tage, entsprechend Datenmenge

RPO: letzter Backup, normalerweise Stand letzte Nacht.

Dateisystem des File-Servers neu aufsetzen

Restore aus Backup, u.U. mehrere inkrementelle Medien

Transferzeiten entsprechend Datenmenge

Clientsysteme:

RTO: 1 Clientsystem ca. 1 Tag, 20 Clientsysteme ca. 1 Mannwoche

Parallelbearbeitung nur eingeschränkt möglich

Installation Betriebssystem,

Netzwerkintegration

Updates auf aktuellen Stand

Installation Anwendungen inkl. Updates

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 21

Wiederherstellung

Risiko Verschlüsselung, Verlust ganzer Dateisysteme

Optimiert Serversysteme

NAS-Storage (Netzwerkfreigaben per CIFS oder NFS)

RTO: ca. 5 Minuten

RPO: letzter Snapshot, ca. 1 Stunde

Snapshot-Technologie: Snapshot (ReadOnly) wieder schreibbar setzen

l Weitere Möglichkeiten

Asynchrone Spiegelung wichtiger Datenbereiche auf Storage-Ebene (siehe Disaster Recovery)

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 22

Wiederherstellung

Risiko Verschlüsselung, Verlust ganzer Dateisysteme

Optimiert Serversysteme

NAS-Storage (Netzwerkfreigaben per CIFS oder NFS)

RTO: ca. 5 Minuten

RPO: letzter Snapshot, ca. 1 Stunde

Snapshot-Technologie: Snapshot (ReadOnly) wieder schreibbar setzen

l Weitere Möglichkeiten

Asynchrone Spiegelung wichtiger Datenbereiche auf Storage-Ebene (siehe Disaster Recovery)

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 23

Wiederherstellung

Risiko Verschlüsselung, Verlust ganzer Dateisysteme

Optimiert Serversysteme

NAS-Storage (Netzwerkfreigaben per CIFS oder NFS)

RTO: ca. 5 Minuten

RPO: letzter Snapshot, ca. 1 Stunde

Snapshot-Technologie: Snapshot (ReadOnly) wieder schreibbar setzen

l Weitere Möglichkeiten

Asynchrone Spiegelung wichtiger Datenbereiche auf Storage-Ebene (siehe Disaster Recovery)

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 24

Wiederherstellung

Risiko Verschlüsselung, Verlust ganzer Dateisysteme

Optimiert Serversysteme

NAS-Storage (Netzwerkfreigaben per CIFS oder NFS)

RTO: ca. 5 Minuten

RPO: letzter Snapshot, ca. 1 Stunde

Snapshot-Technologie: Snapshot (ReadOnly) wieder schreibbar setzen

l Weitere Möglichkeiten

Asynchrone Spiegelung wichtiger Datenbereiche auf Storage-Ebene (siehe Disaster Recovery)

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 25

Wiederherstellung

Risiko Verschlüsselung, Verlust ganzer Dateisysteme

Optimiert Clientsysteme

Zentrale Softwareverteilung:

RTO: Ein Clientsystem ca. 0,5 Tage, 20 Clientsysteme ca. 1 Manntag

RPO: nicht relevant, die Daten sollten auf dem Server liegen

Alle Clientsysteme parallel ausrollbar.

Betriebssystem und Anwendungen fertig konfiguriert

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 26

Wiederherstellung

Risiko Verschlüsselung, Verlust ganzer Dateisysteme

Optimiert Clientsysteme

Terminalserver mit Thin Clients

RTO: ca. 0 bis 0,5 Stunden (bei Virtualisierung)

RPO: nicht relevant, die Daten sollten auf anderen Servern liegen.

Entspricht einem Ausfall Serversystem

Nur einzelne Systeme sind wiederherzustellen

Wahrscheinlich sind nur Benutzerdaten (Zugriffsrechte) betroffen!

Nachteil: Bedingt eine starke Standardisierung der Benutzerumgebung

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 27

Wiederherstellung

Risiko Verschlüsselung, Verlust ganzer Dateisysteme

l Nochmal im Vergleich:

Fileserver / NAS

Klassisch:

RTO: 0,5 bis x Tage

RPO: 0,5 – 1 Tag

Optimiertes System:

RTO: ca. 5 Minuten

RPO: ca. 1 Stunde

Clientsysteme

Klassisch:

RTO: 20 Clientsysteme ca. 1 Mannwoche

RPO: nicht relevant

Optimiertes System:

RTO: 20 Clientsysteme ca. 1 Manntag

RPO: nicht relevant

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 28

Risiken

Risiko Totalverlust Systeme und Daten

l Minimalanforderung:

Offsite Lagerung der Backup-Medien oder Offsite Backup zu externem Standort

l Optimierung für schnellen Wiederanlauf:

Zweiter Serverraum: anderer Brandabschnitt oder externer Standort

Zweiter Hypervisor mit Storage im zweiten Serverraum

Replikas der virtuellen Server jeweils in den anderen Serverraum

Spiegelung des Datei-Storage in den zweiten Serverraum

Backup (Langzeit Archiv) in den zweiten Serverraum (Alternative Backup in die Cloud)

E-Mail-Archiv

Appliance

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 29

Cloud Chancen / Risiken

Cloud Dienste (SaaS, Office 365, ...)

l Technische Ausfallsicherheit meines Providers (s. vorhergehende Folien)

l Geschäftliche Ausfallsicherheit des Providers

Konkurs / Übernahme / Abkündigungen …

Backup in der Cloud

l Verlust meines Backups

Gesamt- / Teilbetrieb in der Cloud

l Verlust des Gesamtsystems

l Verlust der Daten (außer mit eigenem Backup aus der Cloud)

2018 NETexpress GmbH - Ein Unternehmen der PIXEL Group - www.netexpress.de Folie 30

Null-Risiko ist nicht bezahlbar / erreichbar

Risikomanagement ist firmenspezifisch

l Gesamtrisiko

l Tolerierbares Risiko

l Restrisiko

l Pre-Loss

Vermeiden

Schutzmassnahmen

l Post-Loss

Schadensminimierung

Abwälzen (Versicherung)

und bildet die Entscheidungsbasis für benötigte Investition zur optimierten

Schadensminimierung

Fazit

NETexpress Network Solutions GmbH

Lochhamer Schlag 17

D-82166 Gräfelfing

Tel.: +49/89/8 98 68-400

Fax: +49/89/8 98 68-444

[email protected]

www.netexpress.de

© 2018 NETexpress GmbH

Ein Unternehmen der PIXEL Group