Author
hella-dieter
View
215
Download
1
Embed Size (px)
Clusterlion-Prsentation
ClusterLionUnternehmenskritische Applikationen mssen heute jeder Zeit verfgbar sein! Hochverfgbarkeit der IT Heute eine Grundlage und keine OptionDie meisten Branchen sind heute von einer funktionierenden IT abhngig.Daher ist permanente IT Verfgbarkeit Always-ON fr viele Unternehmen eine Grundvoraussetzung und keine Option mehr.Jeder Ausfall kostet Geld und Image!
Die Werte der Branchen und Studien variieren, doch fest steht, IT Downtime verursacht betrchtlichen Schaden!
Wie viel kostet IT Downtime?
Redundante HardwareKein single Point of Failure innerhalb der SystemeZumindest zwei rumlich getrennte RechenzentrenSynchrone DatenspiegelungCluster Technologie fr transparenten Site Failover
Doch auch in der Cluster Technologie gibt es Szenarien, wo das zentrale System ausfallen kann.In diesem Fall entsteht betrchtlicher Schaden fr das Unternehmen!Hochverfgbarkeit erreichen
Was ist ein Split Brain Zustand?Wikipedia: Split Brain ist in der Informatik ein unerwnschter Zustand eines Computerclusters, bei dem alle Zwischenverbindungen zwischen den Clusterteilen gleichzeitig unterbrochen sind.Zur Koordination der Transaktionen im Cluster wird in der Regel ein Cluster Interconnect verwendet. Wird die Verbindung zwischen einem oder mehreren Teilen des Clusters ber diesen Weg unterbrochen, kann keines noch unterscheiden ob es sich um einen partiellen Ausfall oder eine Trennung handelt. Alle diese (nun isolierten) Clusterfragmente arbeiten fr sich weiter, um die Bereitstellung des Dienstes aufrechtzuerhalten.
Srvc(a)Heartbeat
Hardware Fehleraktiv/aktivClusterBeispiel: Hardware AusfallCluster Service (a) wird automatisch auf den zweiten Cluster Node gestartet (Takeover)
Srvc(b)Srvc(a)
LeitungsausfallBeispiel: LeitungsausfallCluster Services werden nicht automatisch bernommen, jede Site luft autark weiter. Sobald die Leitungen wieder verfgbar sind, werden die Daten synchronisiert und der Cluster befindet sich wieder im Normalzustand.Heartbeat
aktiv/aktivClusterSrvc(a)
Srvc(b)Srvc(a)
Beispiel: Stromausfall im RechenzentrumDer Cluster wei nun nicht ob es sich nur um einen Leitungsausfall oder um einen Stromausfall handelt! Service (a) wird nicht automatisch bernommen! Service (a) geht nun offline!Nur durch einen manuellen Takeover oder einen dritten Standort (Quorum) kann das Service bernommen werden.Desasterfall, Stromausfall, etc.
aktiv/aktivClusterHeartbeat
Srvc(b)?
Srvc(a)
Manual Cluster Takeover
Srvc(a)
7-Mode MetroCluster
BSrvc (b)cf giveback
A
A3
A3
A2
A1
B4
B3
B2
B1Srvc (a)system01 failed !takeover!
stretched HAA/A Controller Failure Scenario1st Controller failsIdentity moves to 2nd controllerI/O passes through 2nd controllerAfter repairing1st controller,issue cf givebackIdentity moves back to 1st controllerNormal operations continues7-Mode MetroCluster
AABBSrvc (a)Srvc (b)MC Site Failure ScenarioEntire Site A fails2nd controller checks heartbeat, disk-connections and IP connection while still serving its dataHuman or process on 3rd Site identifies site-failureIssue cf takeover dIdentity moves to second controller
SiteA down orsite-connection broken?
cf takeover -dcf giveback
MC Fabric
Srvc(b)Srvc(a)cDOT MetroCluster, local HAno automatic Takeover between Datacenterstretched HAlocal HAlocal HAData ONTAP 8.3MetroCluster Management und Desaster Recovery Guide
Data ONTAP 8.3MetroCluster Management und Desaster Recovery Guide
ClusterLion, die Lsung!
UPSGrid
100mEthernet
RS232
QRemote Quorum
100mEthernet
RS232Monitoring:PowerStorage Controller Partner Status Heart-Beat1. Reporting:A1: Lost Cluster PartnerB1: Lost Cluster PartnerA2: not responding any moreB2: not responding any more2. Action:A2: Power offB2: Power offA1: force Takeover B1: force TakeoverQ: Open Helpdesk TicketTakeoverClusterLion-AP (Advanced Protection)
open TicketPartner Helpdesk
Support Customer during GivebackTelco BTelco AUse Case: Site DesasterUPSGrid
MC FabricGiveback
A1B1A2B2
Srvc(b)Srvc(a)Srvc(b)ClusterLion-AP erhht die Verfgbarkeit eines zwei-Standorte Storage Clusters!Deutlich geringere Kosten im Vergleich zu einem traditionellen Quorum Standort (Leitungskosten, Betriebskosten, Aministration)!Selbst bei einem Site Desaster (K-Fall) an einem Standort werden die Cluster Services ordnungsgem bergeben und alle Applikationen bleiben verfgbar!Durch lokales Abschalten wird eine Dateninkonsistenz aufgrund eines Split Brain Syndroms durch ClusterLion ausgeschlossen!An jedem bestehenden NetApp MetroCluster kann ClusterLion unterbrechungsfrei nachgerstet werden und so die Verfgbarkeit der unternehmenskritischen Applikationen weiter steigern!Vorteile durch ClusterLion-APAlleinstellungsmerkmal (USP) speziell in NetApp MetroCluster Projekten!Hhere Marge durch den Verkauf von zustzlichen Services (Premium Contract)!Door opener bei Bestandskunden der Mitbewerber!Vorteil bei Ausschreibungen durch geringere TCO im Vergleich zu einem 3 Standorte Konzept!Technisch valide Antwort auf Witness-Konzepte der Mitbewerber (z.B. EMC vplex, etc.) Hhere Sicherheit und Verfgbarkeit fr den Kunden!Mehrwert fr ClusterLion ResellerBasiert auf HighEnd Industrie Komponenten berwacht Stromversorgungen, Netzwerk, Interconnects und die Dienste des Clusters.Kommuniziert ber zwei getrennte und vom Cluster unabhngige Kommunikationskanle.Bei Beeintrchtigung der Storage Services wird ein automatischer Takeover im Storage Cluster ausgelst und die Gefahr von Split-Brain mit Garantie ausgeschlossen.
Die Storage Services laufen weiter keine Downtime!ClusterLion im Detail7x24 Telefon SupportProaktive Benachrichtigung des KundenAutomatisches Support Ticket am Partner HelpdeskUntersttzung beim Cluster GivebackPremium Support f. Partner
ClusterLion ohne Frontblendehot swap BatteryClusterLion (front view)
4x Power Input4x Power Output (UPS max. 1.100W)2x Cooling Fans2x 24V Output for UMTS GatewaysReset Button2x Serial Consol Port6x Ethernet Connectivity ClusterLion (rear view)
...ob man sich einen Betrieb ohne ClusterLion leisten kann?
Vielen DANK!Die Frage ist nicht ob man sich ClusterLion leisten kann? Sondern...