Management grosser Daten-Netze Dipl.-Ing. Christoph M. Lechner christoph.lechner@planet.at

Preview:

Citation preview

Management grosser Daten-Netze

Dipl.-Ing. Christoph M. Lechnerchristoph.lechner@planet.at

Bitte Mobiltelephone ruhigstellen

Ablauf

• Juni 2004– Vortrag, Diskussion und Fallbeispiele– Kaffeepausen, Mittagsunterbrechung– Ende spätestens 16:00

• Juni 2004– Präsentation der Gruppenarbeiten

Ziel der Veranstaltung

• Einführung in das Netzwerk-Management– Problemstellung– Anwendungsgebiete– Verfahren– Tools– Technische Details nach Bedarf

• Strategische Überlegungen zur Skalierbarkeit von Managementtools und -prozessen

Benotung

• Bis 30. Juli 2004 ca. zwei Seiten technisch detaillierter Aufsatz zu einem Netzwerk-management Thema (noch nicht gezeigtes Tool etc.) per email.

Begriffsdefinition Netzwerk-Management

• Gesamtheit von– Verfahrensweisen– Techniken– Hilfsmitteln

• zur Verwaltung von Daten-Netzwerken

Managementbereiche

OSI

Network

Management

ng

Managementbereiche

Layer 0: Kabelmanagement & ToolsLayer 1: Verkabelungsmanagement & ToolsLayer 2: Gerätemanagement & Tools

cdp, mac-tabellen etc.Layer 3: IP-basiertes Netzwerkmanagement & Tools

SNMP, Rmon etc.Dokumentation für den Störfall

Configuration Management

• Inventur– Hardware– Software

• Verbindungen• Kabelwege• Konfigurationen• Änderungsmanagement

(Change Control)

Configuration Management

• Hardware– Genauer Ort (Raum, Stockwerk, Schrank, HE usw.)– Seriennummern– Datum der Anschaffung/Inbetriebnahme– Garantie/Wartungsfristen– Service-Level, Service-Partner– Konfigurationsbeschreibung (Modul x in Slot y von

Gerät z)

Configuration Management

• Software– Seriennummern, Lizenschlüssel– Datum der Anschaffung/Inbetriebnahme– Garantie/Wartungsfristen (updateservice)– Service-Level, Service-Partner (bugfix)– Parametrisierung (Adressen, alles, das zur

Rekonstruktion benötigt wird)

Configuration Management

• Verbindungen– Genaue Bezeichnung des Anschlusses– Welches Interface wird damit mit welchem Gerät

verbunden?– Link-Geschwindigkeit, Duplex etc.– Service-Level (hochkritisch oder unkritisch etc.)– Ausführende Person, Datum der Anschaltung– Kostenstelle zur Verrechnung

Configuration Management

• Kabelwege– Genauer Ort der Netzwerkanschlüsse– Genauer Ort der Patchfelder– Verlauf des Kabels (z.B. Microstation-Plan)– Meßprotokolle, Abnahmedokumentation– Kabellängen– Verwendete Stecker– Patchungen

Configuration Management

• Konfigurationen– Parametrisierung

• Adressen, • alles, das zur Rekonstruktion benötigt wird

– Benutzernamen/Passwörter– SNMP Communities– Trap-destinations– Syslogserver

Configuration Management

• Change Management– Wichtigster Prozess in der IT!– Wer ist wann wie und wie lange betroffen– Notfallplan, wenn etwas schief geht– Verständigungsliste– Beteiligtenliste– Durchführungsplan– „Checkpoints“– Kriterien zur Feststellung des Erfolges

Fault Management

• Meldungen (Events)• Alarmmeldungen (Alarms)• Problem Identifikation• Problem-Behebung (Troubleshooting)• Problem-Lösung (Solving)• Fehlerdokumentation (Fault Logging)

Fault Management

• Meldungen (Events)– Nachrichten über ein Ereignis, das keine unmittelbar

Sytemgefahr darstellt• Port up/down• Tür auf/zu• Speicherplatz zu 85% gefüllt ...

– Protkollierung und Analyse notwendig• Kann die Vorzeichen eines crashes ankündigen

Fault Management

• Alarm-Meldungen (Alarms)– Nachrichten über ein Ereignis, das eine unmittelbar

Sytemgefahr darstellt• Power failure• Uplink down• Speicherplatz zu 100% gefüllt ...

– Protkollierung und Analyse notwendig– Meist unmittelbarer Handlungsbedarf– Benachrichtigung der Bereitschaft

Fault Management

• Benachrichtigung der Bereitschaft– Klassifizierung des Ereignisses und Verständigung der

zuständigen Personen– Rückmeldung, ob die Verständigung angekommen ist– Eskalationsverfahren bei Problempersistenz– Benachrichtigungswege eher „outbound“, d.h.

unabhängig vom überwachten System.• SMS• Voice-mail• e-mail ?

Fault Management

• Problem-Identifikation– Oft komplexe Wirkzusammenhänge– Wenig Automatisationsunterstützung– Gute Dokumentation notwendig

• Wieder „outbound“, z.B. CD, Papier• Graphische Darstellung des Netzwerkes

– Information über letzte Änderungen– Hohes Maß an Erfahrung notwendig

Fault Management

• Problem-Behebung– (vorübergehende) Maßnahme zur Beseitigung der

Problemauswirkung.– „Workaround“, Q&D etc.

• z.B. Flugkabel, andere Software ...– Ziel ist, ein zumindest teilweise funktionsfähiges

System bis zum nächsten Wartungsfenster zu haben.– Unbedingt dokumentieren– Aus dem Provisorium darf kein Dauerzustand werden!

Fault Management

• Problem-Lösung– Maßnahme zur nachhaltigen Beseitigung des Problems– Beseitigung der Ursachen– Maßnahmen, um eine Wiederholung zu verhindern– Dokumentation in Wissensdatenbank

• Evtl. Nachschulungen– Überprüfung, ob ähnliche Szenarien drohen

Fault Management

• Fehlerdokumentation (fault logging)– Jeder Fehler (auch wenn er durch die Technik

automatisch korrigiert wurde) muß dokumentiert und analysiert werden

– Trendanalyse• z.B. Unsere 3 Jahre alten GBIC gehen vermehrt

kaputt– Fehlerprevention

• Ältere GIBC vorsorglich tauschen

Performance Management

• Verfügbarkeit (Availability)• Antwortzeiten (Response time)• Durchsatz (Throughput)• Nutzung (Utilisation)• Kapazitätsplanung (Capacity)

Performance Management

• Verfügbarkeit (Availability)– % der Zeit, die das System während der vereinbarten

Betriebszeiten zu den vereinbarten Bedingungen arbeitete

– Basis der Dienstgütevereinbarung (Service Level)– Messung muß mit dem Kunden vereinbart werden

• Welche Parameter werden wo gemessen• Gemeinsame Übereinkunft über die

Problemursachen (z.B. DAU)

Performance Management

• Antwortzeiten (Response time)– Zeit, die eine Anwendung vom Userinput bis zur

Reaktion benötigt– Meist nicht durch das Netz verursacht

• Delay kann sich aufsummieren– Basis der Dienstgütevereinbarung (Service Level)– Messung muß mit dem Kunden vereinbart werden

• Welche Parameter werden wo gemessen• Gemeinsame Übereinkunft über die

Problemursachen (z.B. DAU)

Performance Management

• Durchsatz (Throughput)– (Korrekt) übertragene Datenmenge pro Zeiteinheit

• „Goodput“• Datenverlust (z.B. Hardwaredefekt) verursacht

massive Verzögerungen– Basis der Dienstgütevereinbarung (Service Level)– Messung muß mit dem Kunden vereinbart werden

• Welche Parameter werden wo gemessen– Eigene „probes“ an typischen Stellen installieren

Performance Management

• Nutzung (Utilisation)– Basis der Kapazitätsplanung– Typische Szenarien– Basis für Traffic Engineering Maßnamen– Absolut und in % der maximal verfügbaren Bandbreite

Performance Management

• Kapazitätsplanung (Capacity)– Trend Analyse– Ursachenforschung der Entwicklung– Vorhersage der weiteren Entwicklung– Maßnahmen zur Anpassung der Kapazitäten

• z.B. traffic-engineering• Hardware upgrade

Accounting Management

• Investitions-Sicherung• Kostenüberwachung• Nutzungsverrechnung• Kostenverrechnung

Security Management

• Allemeine Richtlinien (Policy)• Befugnisse (Authority)• Zugriffs-Ebenen (Access Level)• Protkollierung (Logging)• Regelverstösse (Exceptions)

– Anmeldefehler (Authentication failure)– Intrusion detection

Strategische Überlegungen

• Skalierbarkeit von Managementtools und -prozessen– Verteilung/Speicherung der Dokumentation– Verständigungsverfahren– Out-tasking– Bereitschaftsregelungen

SNMP

• Simple Network Management Protocol• UDP (!)• Aktuell SNMPv3 (Draft RFC 2271-2275), noch

nicht verbreitet– Authentisierung (MD5)– Verschlüsselung (DES)– Klassenbildung

• OSI CMIP

SNMP

• Agent (im Device)• Manager (zentrales tool)• MIB Management Information Base

– Öffentlicher und privater Teil– Baumstruktur

• Numerisch / Mnemonics• Traps

SNMP RFCs =>> RTFM

• RFC 1067 - A Simple Network Management Protocol

• RFC 1089 - SNMP over Ethernet

• RFC 1140 - IAB Official Protocol Standards

• RFC 1147 - Tools for Monitoring and Debugging TCP/IP Internets and Interconnected Devices [superceded by RFC 1470]

• RFC 1155 - Structure and Identification of Management Information for TCP/IP based internets.

• RFC 1156 (H)- Management Information Base Network Management of TCP/IP based internets

• RFC 1157 - A Simple Network Managment Protocol

• RFC 1158 - Management Information Base Network Management of TCP/IP based internets: MIB-II

• RFC 1161 (H)- SNMP over OSI

• RFC 1187 - Bulk Table Retrieval with the SNMP

• RFC 1212 - Concise MIB Definitions

• RFC 1213 - Management Information Base for Network Management of TCP/IP-based internets: MIB-II

• RFC 1215 (I)- A Convention for Defining Traps for use with the SNMP

• RFC 1224 - Techniques for Managing Asynchronously-Generated Alerts

• RFC 1270 (I)- SNMP Communication Services

• RFC 1303 (I)- A Convention for Describing SNMP-based Agents

• RFC 1470 (I)- A Network Management Tool Catalog

• RFC 1298 - SNMP over IPX (obsolete, see RFC 1420)

• RFC 1418 - SNMP over OSI

• RFC 1419 - SNMP over AppleTalk

• RFC 1420 - SNMP over IPX (replaces RFC 1298)

RMON

• Remote Monitor (RFC 1271, 1573)• Neun Gruppen

– Statistik– History– Host – Host top n– Matrix– Alarms– Events– Filter– Capture

Tools

• What´s up gold• Orion Network Performance Monitor• Logalot• Denika• NetHealth• C6000• Cisco Works• Epi-Center• ForeView

Tools

• Tivoli– Netview

• MRTG• Loriot• SNAG-View 1.2• Remedy

C6000

C6000

C6000

Cisco-Works

links

• Hardware– http://www.cisco.com/

– http://www.extremenetworks.com/

– http://www.foundrynet.com/

• Kabel– http://www.kerpen.com/

– http://www.daetwyler.de/

– http://www.osi-fiber.de/

links

• tools– http://www.mrtg.org/

– http://www.fnt.de/

– http://www.oasys-software.com/

• traffic-shaper– http://bandwidtharbitrator.com/– http://www.sitaranetworks.com/– http://www.peribit.com/

Management grosser Daten-Netze

Dipl.-Ing. Christoph M. Lechnerchristoph.lechner@planet.at

Recommended