Proseminar Präsentation Thomas Schnöller a0008691@unet.univie.ac.at ICQ: 73076298

Preview:

Citation preview

Proseminar Präsentation

Thomas Schnöllera0008691@unet.univie.ac.at

ICQ: 73076298

Themen der Präsentation Einführung ins Transaction

Management Distributed Concurrency Control Distributed DBMS Reliability

Einführung ins Transaction Management Definitionen Eigenschaften Typen

Definition Transaktion: Besteht aus einer Sequenz

von Lese- und Schreiboperationen auf eine Datenbank zusammen mit Berechnungsschritten

Transaction management behandelt das Problem die Datenbank immer in einen konsistenten Zustand zu halten, auch wenn gleichzeitige Zugriffe und Fehler auftreten.

Eigenschaften von Transaktionen Untrennbarkeit (=Atomicity) Konsistenz (=Consistency) Isolation Widerstandsfähigkeit (=Durability)

Untrennbarkeit (=Atomicity) Eine Transaktion wird als eine

Einheit von Operationen angesehen

Darum werden entweder alle Aktionen einer Transaktion beendet oder keine

All-or-Nothing Prinzip

Konsistenz (=Consistency) Richtigkeit einer Transaktion Ist ein korrektes Programm, dass

einen konsistenten Datenbankstatus zu einem anderen mapped

Isolation Wird gebraucht, damit eine

Transaktion die ganze Zeit über eine konsistente Datenbank sieht

Eine ausführende Transaktion kann ihre Ergebnisse nicht anderen gleichzeitig ausführenden Transaktionen offenbaren, bis zu deren Einsatz

Widerstandsfähigkeit (=Durability) Falls eine Transaktion einsetzt sind

ihre Resultate permanent und können auch nicht aus der Datenbank gelöscht werden

Typen von TransaktionenKriterien zur Typeneinteilung: Dauer von Transaktionen Organisation der Lese- und

Schreibzugriffe Struktur

Kriterium der Dauer von Transaktionen Short-life Transaction:

Kurze Ausführungs- und Antwortzeit Relative kleine Datenbank Banking, Fluglinien Reservierung, ...

Long-life Transaction Gegenteil von Short-life CAD/CAM database, statistische

Applikationen, komplexe Abfragen, image processing

Kriterium der Organisation der Lese- und Schreibaktionen General Model

Lese- und Schreibzugriffe haben keine bestimmte Reihenfolge

Two-step Model Leseaktionen werden vor Schreibaktionen

ausgeführt Restricted Model

Daten müssen gelesen werden, bevor sie geschrieben werden

Restricted two-step Model Vereint das two-step mit dem restricted Model

Action Model Besteht aus dem Restricted Model, mit dem Unterschied, dass jedes <Lese und Schreib> Paar ausgeführt wird

General model

Two-step model Restricted model

Restricted two-step model

Action Model

Kriterium der Struktur Flat Transactions

Ein Startpunt und ein Endpunkt Meiste Arbeit im Transactionmanagement

beruht auf Flat Transactions Nested Transactions (Open-Closed)

Eine Transaktion ikludiert eine andere Workflows

Neuer Typ. Wurde erstellt, da die alten Typen den Anforderungen komplexer Geschäftsmodelle nicht gerecht wurden

Distributed Concurrency Control Klassifizierung von Concurrency

(=Gleichzeitigkeits) Algorithmen Locking-Based Timestamp-Based

Klassifizierung Das weitverbreitetste

Klassifizierungsmerkmal ist die Synchronisation

Durchbruch in der Klassifizierung liegt aber in den: Locking based: Basieren auf den exklusiven

Zugriff von gemeinsamen Daten Protocols: Ordnen die Ausführungen von

Transaktionen auf Grund eines Rule-Set

Diese beiden Klassen können

wiederum aus zwei Sichtweisen betrachtet werden: Pessimistische Sicht: Viele

Transaktionen werden einen Konflikt mit anderern Transaktionen haben

Optimistische Sicht: Nicht viele Transaktionen werden Konflikte mit anderen Transaktionen haben

Optimistisch

Pessimistisch

Validate Read Compute Wri te

Read Compute Validate Wri te

Auf Grund dieser Sichtweisen kann man die Concurrency Control Methods wieder in zwei Klassen einteilen: Pessimistic Algorithms: Synchronisieren die

gleichzeitige Ausführung von Transaktionen schon früh im Lebenszyklus der Ausführungen

Optimistic Algorithms: Verzögern die Synchronisation der Transaktionen bis zur Terminierung

Concurrency Control Algorithms

Pessimistic Optimistic

Locking Timestamp Ordering Hyprid Locking Timestamp

Ordering

Cent ralized

Primary Copy

Distributed

Basic

Multiversion

Conser- vative

Locking-Based Concurrency Control Algorithms Grundidee: Es darf nur immer eine

Operation auf gemeinsame Daten, auf die auch mehrere Operationen, die einen Konflikt verursachen können zugreifen können, zugreifen. Dies passiert durch einen sogenannten „Lock“ in jeder Einheit.

2 Typen von Locks: Read Lock Write Lock

Kompatibilität von Lock-Modes Man spricht von Kompatibilität von

Lock-Modes, wenn 2 Transaktionen die auf die selben Daten zugreifen, die Berechtigung für einen „Lock“ zur selben Zeit.

  

  Read Lock Write Lock

Read Lock compatible Not compatible

Write Lock Not compatible Not compatible

Timestamp-Based Algorithms Einfaches Identifizierungsmittel für

Transaktionen Einzigartig Monoton Verschiedene Möglichkeiten des Zuweisens:

Global steigender Zähler Bei verteilten Systemen ein Problem Jede

Seite verwendet meist einen eigenen lokalen Zähler

Distributed DBMS Reliability Definition System, Status und Fehler Zuverlässigkeit und Verfügbarkeit Gründe für Fehler in verteilten

Systemen Ansätze und Techniken zur

Fehlervermeidung Fehler in verteilten DBMS

Definition Ein zuverlässiges DBMS ist eines, dass

auch dann noch User-Requests bearbeiten kann, auch wenn das darunter liegende System unzuverlässig ist. In anderen Worten, wenn Komponenten der verteilten Umgebung Fehler haben, sollte ein zuverlässiges DBMS in der Lage sein weiter User-Requests zu bearbeiten ohne die Datenbankkonsistenz zu zerstören.

System, Status und Fehler System: Besteht aus einer Sammlung von

Komponenten und interagiert mit seiner Umwelt durch Antworten mit einem bestimmten Verhalten, die auf bestimmte Reize (=Stimuli) erfolgen. Jede Komponente stellt ebenfalls ein System dar die auch als Subsystem bezeichnet werden. Die Art wie die Komponenten eines Systems zusammengesetzt sind nennt man Design.

Stimuli Response

Component 1

Component 3

Component 2

Externer Status: Kann die Antwort sein, die ein System auf einen externen Reiz gibt

Interner Status: Ist der externe Status der Komponenten des Systems.

Spezifikation: Beinhaltet das gültige Verhalten, die ein System in einem bestimmten Status aufweist.

Es gibt 3 Arten von Fehlern: Failure: Jedes abweichende Verhalten

von der Spezifikation Error: Der Teil eines Status ist falsch Fault: Jeder Fehler in den internen

states der Komponenten oder des Designs eines Systems

Fault Error Failure

Zuverlässigkeit und Verfügbarkeit Zuverlässigkeit bedeutet, dass in

einem System, während eines bestimmten Zeitintervalls keine Fehler auftreten. Wird typischerweise für Systeme beschrieben, die nicht repariert werden können (z.B.: Weltraum-basierte Systeme), oder wo die Operation des Systems so kritisch ist, dass keine Zeit zum Reparieren toleriert werden kann.

Verfügbarkeit hingegen bedeutet, dass ein System zu einem bestimmten Zeitpunkt genau das macht, was in der Spezifikation spezifiziert wurde. Eine bestimmte Anzahl an Fehlern kann auftreten, wenn diese aber beseitigt wurden, ist das System zu einem bestimmten Zeitpunkt wieder Verfügbar. Damit sieht man, dass sich Verfügbarkeit auf reparable Systeme bezieht.

1985: IBM/XA Operating System mit Stanford linear accelerator (SLAC) :

SLAC data

Hardw are57%

Environment17%

Operations14%

Softw are12%

Hardw are

Environment

Operations

Softw are

1985: Tandem Computers

Tandem data

Hardw are24%

Environment20%

Operations23%

Softw are33% Hardw are

Environment

Operations

Softw are

Performance Studie des AT&T 5ESS digital Switch

5ESS sw itch data

Hardw are32%

Unknow n6%

Operations18%

Softw are44%

Hardw are

Unknow n

Operations

Softw are

Ansätze und Techniken zur Fehlervermeidung 2 fundamentale Ansätze zur Fehler

Vermeidung sind die Toleranz und Prävention von Fehlern. Toleranz: Beruht auf den Designansätzen

von Systemen, welche es in Betracht ziehen, dass Fehler auftreten können. Versucht Mechanismen in das System einzubaun, um Fehler zu entdecken, zu entfernen bzw zu kompensieren bevor Systemfehler auftreten

Prävention: Implementierte System soll keine Fehler haben

Beispiele für Techniken

Redundanz in Systeme einbauen: Falls eine Komponente ausfällt übernimmt(=kompensieren) die redundante Komponente die Aufgaben.

Modularer Aufbau des Systems: Modularität des Systems ermöglicht die Isolation von Fehlern in einer Komponente. Ist darum für Software- Hardwaresysteme wichtig. 

Fehler in verteilten DBMS

Transaction Failures (aborts) Site (system) Failures Media (disk) Failures Communication Failures

Transaction Failures Incorrect input data deadlock

Site (System) Failures Meist Hard- oder Softwarefehler Führt zu einem Verlust von

Hauptspeicherinhalten jeder Inhalt der Datenbank der in einem Buffer des Hauptspeichers gelegen hat geht verloren

In VS spricht man auch von Site Failure anderer Computer kann ausfallen Total Partiell

Media Failures Bei Secondary Storage Devices Bei Betriebssystemfehlern oder

Hardwarefehlern Alle Daten des DBMS die sekundär

gespeichert wurden gehen verloren Abhilfe: Duplizieren und Archivieren

des Sekundärmediums

Communication Failures Treten nur in verteilten Systemen auf Verschiedene Ursachen:

Fehler in Messages Unsachgemäß angeforderte Messages Lost Messages Line Failures

Verlorene oder nicht lieferbare Messages sind meist Ursachen für einen Line Failure. Das Netzwerk kann dabei in zwei oder mehrere getrennte Gruppen zerfallen Network Partioning

Recommended