Markus Schmidt - DOAG

Preview:

Citation preview

Datenbanküberwachung mit

Open Source-Mitteln

Markus Schmidt

Markus Schmidt 2 26.10.2011

DB Struktur Dienste Sicherheit Verfügbarkeit

Implementierung

Prozesse DB Struktur Zukunfts- sicherheit

Strategische Beratung

Wartung & Support

Wartung Aktualisierung Administration Support

Projektmanagement

Planung Koordination Ausführung Test & Freigabe

Analyse Konsolidierung Management

Oracle Lizenzmanagement

Markus Schmidt 3 26.10.2011

Agenda

o Monitoring

o Open Source Tools

o Icinga

o Fragen

Monitoring

Markus Schmidt 5 26.10.2011

Warum Überwachung ?

o Administrative Sicht

o Komplexität der Infrastruktur gestiegen

o Überblick behalten

o Besseres Verständnis für Zusammenhänge schaffen

o IT steht unter Kostendruck

o Konzentration auf die Kernaufgaben, Zeitgewinn

o Keine Zeit investieren, um funktionierende Systeme zu prüfen

o Minimieren der Routinetätigkeiten

o Gezielte Eingriffe bei Problemen durch Benachrichtigung

o Vertrauen in die IT schaffen oder zurückgewinnen

o Wiederkehrende Probleme erkennen, dokumentieren,beheben

und zukünftig vermeiden

Markus Schmidt 6 26.10.2011

Warum Überwachung ?

o Organisatorische Sicht

o Praktisch alle Prozesse IT-gestützt oder IT-getrieben

o IT-Prozesse sind zunehmend mission critical

o Investitionsplanung, Schaffung von Planungssicherheit

o Ermittlung von Kennzahlen

o Störhäufigkeiten

o Ausfälle

o Einhalten von Vereinbarungen (SLAs)

o Vermeidung von Eskalationen und Unzufriedenheit

o Häufig subjektives Empfinden

o Unterstützung aller Phasen

o Change, Operate, Support, Optimize

Markus Schmidt 7 26.10.2011

Was ist Überwachung nicht ?

o Überwachung löst Probleme nicht

o Liefert aber Hinweise auf die Probleme

o Infrastruktur wird nicht automatisch zuverlässig

o Zeigt aber Möglichkeiten für gezielte Verbesserungen

o Ausfälle werden durch Überwachung nicht automatisch

verhindert

o Aber zeitnahe Erkennung ist möglich

o Trend zu instabilem Systemverhalten wird aufgedeckt

Markus Schmidt 8 26.10.2011

Was kann überwacht werden ?

o Server

o Storage

o Netzwerkkomponenten

o Sensoren Bsp: Temperatur

o USV

o Drucker

o Anwendungen

o Datenbanken

o Logfiles

o …

Open Source

Monitoring Systeme

Markus Schmidt 10 26.10.2011

Auswahlkriterien: technische Sicht

o Leichte Administration o Gute Dokumentation, Community

o Konzentration auf das Wesentliche

o Flexibilität bei Überwachungsmöglichkeiten

o Alarmierung

o Stabiler und skalierbarer Betrieb o Modularer Betrieb

o Wissen von Abhängigkeiten

o Minimieren der Routinearbeiten o Logfileanalyse

o Keine Statusüberprüfungen

Markus Schmidt 11 26.10.2011

Auswahlkriterien: organisatorische Sicht

o Planungssicherheit

o Möglichkeit zur Investitionsplanung durch Trendanalyse

o Kennzahlen

o Störungsanfälligkeit

o Häufigkeit von Eskalationen

o Benachrichtigungen

o Eskalationsmechanismus

o Auswertungen

o Historische Betrachtung

o Trendanalyse

o Integrationsmöglichkeiten

o Rechtliche Aspekte

Markus Schmidt 12 26.10.2011

Systeme

Beispielhaft:

o GroundWork Monitoring

o OpenNMS

o Zenoss

o Nagios / Icinga

Markus Schmidt 13 26.10.2011

GroundWork

Überwachungssystem aus vielen OpenSource Programmen

wie z.B. Nagios

Einfache Installation

Autodiscovery

Chartbasierte Auswertungen

+ Notification Email

- Custom Script

Markus Schmidt 14 26.10.2011

OpenNMS

Enterprise Network Management System auf Basis von Open

Source

Chart basierte Auswertungen

- Ressourcenintensiv

- Komplexe Administration

+ Notification Email

+ Custom Script

Markus Schmidt 15 26.10.2011

Zenoss

kommerzielles OpenSource-Projekt mit freiem Kern

Chart basierte Auswertungen

- Aufwändige Nacharbeiten

- Eigeschränkte Templates

+ Notification Email

+ Custom Script

Markus Schmidt 16 26.10.2011

Nagios / Icinga

Einsatzbereich:

Neuinstallation:

Hardware und Betriebssystem

Detaillierte Überwachung von

Applikationen und Datenbanken

Standardmäßig einige wenige

Plugins

Durchführung grundlegender

Überwachungs-Checks

Viele Plugins online frei verfügbar

Markus Schmidt 17 26.10.2011

Verbreitung

Markus Schmidt 18 26.10.2011

Nagios / Icinga

Markus Schmidt 19 26.10.2011

Markus Schmidt 20 26.10.2011

Funktionsweise

o Hosts / Services werden aktiv überwacht

o Server initiiert o Prüfung der Hosts

o Ausführung der Prüfskripte auf den Hosts

o Statusmeldungen mit Prüfergebnissen werden ausgewertet

o Gezielte Benachrichtigung der Administratoren bei Überschreiten der Schwellwerte per Mail, SMS, …

o Aufzeichnung der Performancedaten zur späteren Auswertung

o Eskalationsmanagement

Markus Schmidt 21 26.10.2011

Addons

Benutzeroberfläche erweiterbar

Visualisierung

Konfiguration

Markus Schmidt 22 26.10.2011

Modulkonzept

Eigene Checks mit minimalem Aufwand zu erstellen

Aufbau auf kleinen Modulen in C, C++, C#, Java, Perl,

PHP, Python, …

Beispiel für Festplattenkapazitätscheck

Modul überprüft Speicherplatz mit 3 Parametern

Bei Überschreitung des Warning-Schwellwertes Anzeige auf der

Oberfläche

Markus Schmidt 23 26.10.2011

Icinga & Oracle

Abdeckung: o Betriebsparameter

o Aktueller Zustand

o Verfügbarkeit, Auslastung, Antwortzeiten

o Konformität mit Firmenrichtlinien

o Trendanalysen

o Füllgrad / Wachstum Tablespaces

o Last

Ziel: Überwachung der gesamten Datenbank o in unterschiedlichen Zeitabständen

o mit unterschiedlichem Detaillierungsgrad

o Frühzeitige Reaktion auf kritische Zustände

Markus Schmidt 24 26.10.2011

Oracle Monitoring

Aktueller Zustand

1. Listener, Connectversuch, TNS-Ping

2. Antwortzeiten

3. Oracle Prozesse

4. Last auf Datenbank, CPU, IO

5. angemeldete Benutzer

6. Alert-Log Prüfung

7. Deadlocks

8. Blockierte und blockierende Sessions

9. Backup

Markus Schmidt 25 26.10.2011

Oracle Monitoring Performancedaten / Trends

Füllgrad und Wachstum

1. Filesystems

2. Tablespaces

3. Datafiles

4. Archivelogs

Plattenzugriffe, Durchsatz und Peaks

Markus Schmidt 26 26.10.2011

Konformität

1. Foreign-Key-Spalten

2. Ungültige Objekte

3. Offline Tablespaces

4. Nicht wiederherstellbare Objekte

5. Integritätsprüfung des Backups

6. Rollen und Benutzerrechte

7. Systemprivilegien

8. Anmeldung als privilegierter Benutzer

9. OFA-Standards eingehalten

10. Firmenstandards eingehalten

Die Checks decken einen großen Informationsumfang ab.

Der Administrator muss nur an einer Stelle analysieren um Probleme und

Schwächen der Datenbank zu finden.

Markus Schmidt 27 26.10.2011

Oracle Enterprise Manager

o Klar – auch eine Möglichkeit

o Datenbank nötig

o Agenten nötig (Ressourcen!)

o Netzwerküberwachung ?

o Komplette Infrastruktur ?

Fragen ?

Essential Bytes GmbH & Co. KG

Markus Schmidt

Steinebühlstraße 30

77749 Hohberg

mschmidt@essential-bytes.de

http://www.essential-bytes.de

Kontakt

Recommended