Herzlich Willkommen€¦ · P633 Marcus Eichler 17.09.2003 Dok: #31225 18 Der Korrelator hat...

Preview:

Citation preview

Herzlich Willkommen bei der Abschlusspräsentation der

Diplomarbeit vonMarcus Eichler

Korrelation von automatisierten Servicekontakten (Events) im Rahmen des Dienstleistungsangebotes Application Service Providing der DATEV im BereichLeitungsüberwachung und Erstellung eines Prototypen

Aufgabensteller Prof. Dr. A. DeinzerArbeit vorgelegt am 16.02.2004

durchgeführt bei Fa. DATEV eG, Paumgartnerstraße 6-14Design & Technik IT-Management

Betreuer Stefan Nepf Dipl.-Betriebswirt (FH) Michael Schellenberger

Anschrift Marcus EichlerNeumarkterstr. 3490559 Burgthann

P633 Marcus Eichler 17.09.2003 Dok: #31225 3

Teilnehmer

• Prof. Dr. Arnulf Deinzer (FH-Kempten)

• Michael Beer (DATEV)

• Stefan Nepf (DATEV)

• Marcus Eichler (FH-Kempten)

P633 Marcus Eichler 17.09.2003 Dok: #31225 4

Agenda

1. Motivation

2. Analyse (Leitung)

3. Konzept

4. Implementation

5. Test

6. Resümee

P633 Marcus Eichler 17.09.2003 Dok: #31225 5

Warum?

??

?

„Ich kann nicht arbeiten“

Wir helfen unseren Kunden!

Analyse Konzept Implementierung Test ResümeeMotivation

P633 Marcus Eichler 17.09.2003 Dok: #31225 6

Wie?

Fehler erkennen

Fehler beheben

Fehler vermeiden

Analyse Konzept Implementierung Test ResümeeMotivation

P633 Marcus Eichler 17.09.2003 Dok: #31225 7

Was ist nötig?

Wer Fehler erkennen, beheben und vermeiden will, muss:

- die Systeme des Kunden kennen

- diese dokumentieren

- die Systeme so konfigurieren, damit Fehler vermieden werden

- prüfen, ob die Systeme optimal laufen

- prüfen, ob die Systeme noch funktionieren

ständig

ständig

ständig

ständig

ständig

Manuell NICHT möglich!

Analyse Konzept Implementierung Test ResümeeMotivation

P633 Marcus Eichler 17.09.2003 Dok: #31225 8

Komplexität / Größe

- 1121 administrierte Server

Kanzlei

- 309 betreute Kanzleien

- 3902 verwaltete Clients

Analyse Konzept Implementierung Test ResümeeMotivation

Geschäftsbereich IT-Management

(Stand: Januar 2004)

P633 Marcus Eichler 17.09.2003 Dok: #31225 9

Leistungsumfang des IT Management

•Datensicherung

•Virenschutz

•Wartung der Systeme

•Systemmanagement

•Lizenzmanagement

•Administration

•Problemmanagement

•Änderungsmanagement

•Teamservice für produkt-übergreifende Unterstützung

•Hotline

Notwendig: Automatisierung von Serviceprozessen

Analyse Konzept Implementierung Test ResümeeMotivation

P633 Marcus Eichler 17.09.2003 Dok: #31225 10

Problem des automatisierten „Monitorings“

ca. 135.000 Meldungen im Monat(Stand: Dezember 2003)

Meldung

Meldung

Meldung

Korrelation von automatisierten Servicekontakten

Analyse Konzept Implementierung Test ResümeeMotivation

Notwendig:

P633 Marcus Eichler 17.09.2003 Dok: #31225 11

Netzwerkstruktur

Abbildung : DATEVasp – Die technische Infrastruktur aus den Schulungsunterlagen Doc#: 29643

Analyse Konzept Implementierung Test ResümeeMotivation

P633 Marcus Eichler 17.09.2003 Dok: #31225 12

Ablauf

• Automatische Überwachung aller Systeme

• Meldung an eine zentrale Empfangsstation

• Verarbeitung der Meldung

Analyse Konzept Implementierung Test ResümeeMotivation

P633 Marcus Eichler 17.09.2003 Dok: #31225 13

Agent 1

Kanzleisysteme

Agent 2

Agent …

Service Center

Überwachen Empfangen Speichern Verdichten Ticket

Datenbank Filter / Korrelation

Meldungs-empfänger

Verarbeitungsprozess

Analyse Konzept Implementierung Test ResümeeMotivation

P633 Marcus Eichler 17.09.2003 Dok: #31225 14

• Rule based Systems

• Model based Systems

• Case based Systems

Verschiedene Ansätze

Analyse Konzept Implementierung Test ResümeeMotivation

• Dependency Graph

• Neural Network

P633 Marcus Eichler 17.09.2003 Dok: #31225 15

Erst bei mehreren Hinweisen auf einen Vorfall wird ein Ticket erzeugtLösungsansatz: Neural Network

Neuron (Knoten)

Analyse Konzept Implementierung Test ResümeeMotivation

P633 Marcus Eichler 17.09.2003 Dok: #31225 16

1. „NewOID“

2. „Prozent“

3. „ZeitinMin“

4. „Bezeichnung“

Notwendige Parameter

Neuron (Knoten)

Gewichtung

Überwachungszeitraum

Analyse Konzept Implementierung Test ResümeeMotivation

Information

P633 Marcus Eichler 17.09.2003 Dok: #31225 17

Zeit

T0

Zeit in Minuten

T-1

Überwachungszeitraum

„ZeitinMin“ = Überwachungszeitraum

Überwachungszeitraum

Analyse Konzept Implementierung Test ResümeeMotivation

P633 Marcus Eichler 17.09.2003 Dok: #31225 18

Der Korrelator hat Auffälligkeiten in…. entdeckt C-1234

UUID

Verlust eines ICMP-Packetes abcd C-1234

Datei konnte nicht gelesen werden efgh C-1234

Antwortzeit des Routers zu groß ijkl C-1234

mnop C-1234

ParentUUIDUUID

Neue Meldung

Eingangssignale

Kopieren

Verlust eines ICMP-Packetes

Verknüpfung der Meldungen

Analyse Konzept Implementierung Test ResümeeMotivation

P633 Marcus Eichler 17.09.2003 Dok: #31225 19

C-6F9619FF-8B86-D011-B42D-00C04FC964FF-10.162.9.1

C für CorrelatorSystemerzeugte IDIP- Adresse

Erzeugung einer UUID

Analyse Konzept Implementierung Test ResümeeMotivation

P633 Marcus Eichler 17.09.2003 Dok: #31225 20

1. Vorbereitungen (Meldung des Agenten eindeutig machen)

2. Abfragealgorithmus entwickeln

3. Anpassungen am Troubleticketsystem

ToDo

Analyse Konzept Implementierung Test ResümeeMotivation

P633 Marcus Eichler 17.09.2003 Dok: #31225 21

Meldungen eindeutig machen (Beispiel Cricket)

Schwellwert überschritten (OID1)

Schwellwert überschritten

Schwellwert überschritten (OID1)

Analyse Konzept Implementierung Test ResümeeMotivation

Vorher Nachher

CPU ausgelastet(OID1)

Bandbreite überschritten(OID 2)

P633 Marcus Eichler 17.09.2003 Dok: #31225 22

Abfragealgorithmus entwickeln (gespeicherte Prozedur)

Eingabe AusgabeVerarbeitung

Analyse Konzept Implementierung Test ResümeeMotivation

Einlesen Suchmuster ermitteln

Scannen Berechnen Ausgeben

P633 Marcus Eichler 17.09.2003 Dok: #31225 23

Das Troubleticketsystem anpassen

Array aller UUID´sUUID1

UUID2

UUID3

Analyse Konzept Implementierung Test ResümeeMotivation

P633 Marcus Eichler 17.09.2003 Dok: #31225 24

Funktionstest / Stresstest

Analyse Konzept Implementierung Test ResümeeMotivation

• Funktionstest

Mustererkennung und Verknüpfung

Weiterleitung der Meldungen

• Stresstest

Erhöhung der Anzahl zu korrelierender Meldungen

Erhöhung des Überwachungszeitraumes

P633 Marcus Eichler 17.09.2003 Dok: #31225 25

Funktionstest

Analyse Konzept Implementierung Test ResümeeMotivation

Durch den Korrelator erstelltes Problemticket

P633 Marcus Eichler 17.09.2003 Dok: #31225 26

Erhöhung der Anzahl zu korrelierenden Meldungen

Laufzeit der Prozedur SP_OpenView bei sukzessiver Erhöhung der zu verarbeitenden Meldungen

(Überwachungszeitraum = 60 min)

0,00

2,00

4,00

6,00

8,00

10,00

12,00

0 1 2 3 4 5 6 7 8 9

Meldungen

Zeit in s

Analyse Konzept Implementierung Test ResümeeMotivation

Ergebnis: Bei Täglich ca. 3500 Meldungen, reicht Performance aus

P633 Marcus Eichler 17.09.2003 Dok: #31225 27

Laufzeit der Prozedur SP_OpenView bei sukzessiver erhöhung des Überwachungszeitraumes

0

2

4

6

8

10

12

14

16

18

20

60 120180

240300

360500

10001500

20002500

10000100000

Überwachungszeitraum in Minuten

Zeit in S

Erhöhung des Überwachungszeitraumes

Analyse Konzept Implementierung Test ResümeeMotivation

Ergebnis: Korrelationen über mehrere Tage sind möglich

P633 Marcus Eichler 17.09.2003 Dok: #31225 28

Beispiel (Leitungsüberwachung)

ASP-Verbindung10060.1.3.6.1.4.1.3744.3.1.11710NSM_Interface_Ethernet_überschritten

ASP-Verbindung10060.1.3.6.1.4.1.3744.3.1.11710NSMAliveNichtErreichbarShare

ASP-Verbindung10060.1.3.6.1.4.1.3744.3.1.11710NSMAliveNichtErreichbar

ASP-Verbindung1060.1.3.6.1.4.1.3744.3.1.11710NSMAliveWiederErreichbar

ASP-Verbindung3560.1.3.6.1.4.1.3744.3.1.11710NSMAliveOKPingFehler

ASP-Verbindung3560.1.3.6.1.4.1.3744.3.1.11710NSMAliveOKPingTeilweise

ASP-Verbindung3560.1.3.6.1.4.1.3744.3.1.11710NSMPingTeilweiseErreichbar

ASP-Verbindung1060.1.3.6.1.4.1.3744.3.1.11710NSMPingWiederErreichbar

ASP-Verbindung3560.1.3.6.1.4.1.3744.3.1.11710NSMPingNichtErreichbar

BezeichnungProzentZeit/Min

NewOIDTrapname

Resultat in 24 std. Korrelationsfaktor hier 18 : 1

Analyse Konzept Implementierung Test ResümeeMotivation

P633 Marcus Eichler 17.09.2003 Dok: #31225 29

Verringerung der Ticketanzahlen

Reduzieren des Aufwandes

Überblick bewahren

Hinweise behalten (Analyse möglich)

Resümee

Analyse Konzept Implementierung Test ResümeeMotivation

P633 Marcus Eichler 17.09.2003 Dok: #31225 30

• Fragen?

Fragen?

Vielen Dank für Ihre Aufmerksamkeit

Marcus Eichler

Recommended