Relationale und Postrelationale Datenbanken Meier, A. Kapitel 6

1.1 Der Untersuchungsgegenstand der Wirtschaftsinformatik

1

1 Der Weg zum Datenmanagement

1.1Der Untersuchungsgegenstand der Wirtschaftsinformatik

Information als Produktionsfaktor

Der Wandel von der Industrie- zur Informations- und Wissens-gesellschaft spiegelt sich in der Bewertung der Information als Produktionsfaktor. Information (engl. information) hat im Gegensatz zu materiellen Wirtschaftsgtern folgende Eigen-schaften:

Darstellung: Information wird durch Zeichen, Signale, Nachrich-ten oder Sprachelemente spezifiziert.

Verarbeitung: Information kann mit der Hilfe von Algorithmen (Berechnungsvorschriften) bermittelt, gespeichert, klassifiziert, aufgefunden und in andere Darstellungsformen transformiert werden.

Alter: Information unterliegt keinem physikalischen Alterungs-prozess.

Original: Information ist beliebig kopierbar und kennt keine Originale.

Trger: Information bentigt keinen fixierten Trger, d.h., sie ist unabhngig vom Ort.

Unterschiede zwischen digitalen und materiellen Gtern

Diese Eigenschaften belegen, dass sich digitale Gter (Informationen, Software, Multimedia etc.) in der Handhabung sowie in der kono-mischen und rechtlichen Wertung von materiellen Gtern stark unter-scheiden. Beispielsweise verlieren Produkte durch die Nutzung meis-tens an Wert, gegenseitige Nutzung von Informationen hingegen entspricht einem Wertzuwachs. Ein weiterer Unterschied besteht darin, dass materielle Gter mit mehr oder weniger hohen Kosten hergestellt werden, die Verfielfltigung von Informationen jedoch

templates_FM.book Page 1 Friday, December 1, 2006 10:07 AM


2

einfach und kostengnstig ist (Rechenaufwand, Material des Infor-mationstrgers). Dies wiederum fhrt dazu, dass die Eigentumsrechte und Besitzverhltnisse schwer zu bestimmen sind, obwohl man digi-tale Wasserzeichen und andere Datenschutz- und Sicherheitsmecha-nismen zur Verfgung hat.

Fasst man die Information als Produktionsfaktor im Unternehmen auf, so hat das wichtige Konsequenzen:

Informationen bilden Entscheidungsgrundlagen und sind somit in allen Organisationsfunktionen von Bedeutung.

Informationen knnen aus unterschiedlichen Quellen zugnglich gemacht werden; die Qualitt der Information ist von der Verfg-barkeit, Korrektheit und Vollstndigkeit abhngig.

Durch das Sammeln, Speichern und Verarbeiten von Informatio-nen fallen Aufwnde und Kosten an.

Aufgabengebiete jeder Organisation sind durch Informationsbe-ziehungen miteinander verknpft, die Erfllung ist damit von hohem Mae vom Integrationsgrad der Informationsfunktion abhngig.

Bedeutung des Informations-

managements

Ist man bereit, die Information als Produktionsfaktor zu betrachten, muss diese Ressource geplant, gesteuert, berwacht und kontrolliert werden. Damit ergibt sich die Notwendigkeit, das Informationsma-nagement als Fhrungsaufgabe wahrzunehmen. Dies bedeutet einen grundlegenden Wechsel im Unternehmen: Neben einer technisch ori-entierten Funktion wie Betrieb der Informatikmittel (Produktion) muss die Planung und Gestaltung der Informationsfunktion ebenso wahrgenommen werden.

Untersuchungs-gegenstand

der Wirtschafts- informatik

Der Untersuchungsgegenstand der Wirtschaftsinformatik (engl. information management) sind rechnergesttzte Informationssys-teme. Das Fachgebiet beschftigt sich mit der Konzeption, Entwick-lung, Einfhrung und Nutzung betrieblicher Informations- und Kom-munikationssysteme.

Dialog mit dem Anwender

Ein rechnergesttztes Informationssystem (engl. information sys-tem) erlaubt dem Anwender gem Abbildung 1-1, Fragen zu stellen und Antworten zu erhalten. Je nach Art des Informationssystems sind hier Fragen zu einem begrenzten Anwendungsbereich zulssig. Dar-ber hinaus existieren offene Informationssyteme im World Wide Web, die beliebige Anfragen mit der Hilfe eines Browsers bearbeiten knnen (siehe dazu Abschnitt 5.2). In Abbildung 1-1 ist das rechner-gesttzte Informationssystem mit einem Kommunikationsnetz resp. mit dem Internet verbunden, um webbasierte Informationssysteme in die Recherchearbeiten einzubeziehen.


1.1 Der Untersuchungsgegenstand der Wirtschaftsinformatik

3

Abb.1-1 Architektur und Komponenten eines Informations- systems

Zur Speicherungs-komponente

Ein Informations- oder Datenbanksystem besteht prinzipiell aus einer Speicherungskomponente und einer Softwarekomponente (vgl. Abschnitt 1.3). Die Speicherungskomponente umfasst nicht nur Daten, sondern kann Verfahren (Methoden) betreffen. Bei bestimm-ten Typen von Informationssystemen ist es mglich, mit Hilfe spezi-fischer Verfahren (Inferenzmaschine) noch nicht bekannte Sachver-halte aus den Datensammlungen zu extrahieren. In einem solchen Anwendungsfall spricht man von einer Wissensbank resp. von einem wissensbasierten Informationssystem (vgl. Abschnitt 6.7).

Die Sprach-schnittstelle

Die Softwarekomponente eines Informationssystems enthlt eine Abfrage- und Manipulationssprache, um die Daten und Informatio-nen auswerten und verndern zu knnen. Dabei wird der Anwender mit einer Dialogkomponente gefhrt, die Hilfestellungen (Helpdienst) und Erklrungen anbietet. Die Softwarekomponente bedient nicht nur die Benutzerschnittstelle, sondern verwaltet auch Zugriffs- und Bearbeitungsrechte der Anwender.

Ein relationales Datenbanksystem ist ein Informationssystem, bei dem die Daten und Datenbeziehungen ausschlielich in Tabellen abgelegt werden (Abschnitt 1.2). Zudem ist bei einem solchen Sys-tem die Sprache eine relationenorientierte Abfrage- und Manipulati-onssprache, wie sie in Abschnitt 1.3 erlutert wird.

Datenbank

Methodenbank

Wissensbank

Informationssystem

Softwaresystemmit

Benutzerfhrung Dialoggestaltung Abfragesprache Manipulations-

sprache Recherchehilfen Zugriffsrechten Datenschutz

Anwender

Frage

AntwortKommuni-kationsnetzresp. WWW



4

1.2Grundbegriffe des Relationenmodells

Tabellarische Form der

Informations- darstellung

Eine einfache und anschauliche Form Daten oder Informationen zu sammeln oder darzustellen, ist die der Tabelle. Von jeher sind wir es gewohnt, tabellarische Datensammlungen ohne Interpretationshilfen zu lesen und zu verstehen.

Mchten wir Informationen ber Mitarbeiter sammeln, so knnen wir ein Tabellengerst gem Abb. 1-2 entwerfen. Der in Grossbuch-staben geschriebene Tabellenname MITARBEITER bezeichnet die Tabelle selbst. Die einzelnen Tabellenspalten werden mit den gewnschten Merkmals- oder Attributsnamen berschrieben; in unserem Beispiel sind dies die Mitarbeiternummer M#, der Mitar-beitername Name und der Wohnort Ort des Mitarbeiters.

Merkmale oder Attribute sind

Eigenschaften

Ein Merkmal oder Attribut (engl. attribute) ordnet jedem Eintrag in der Tabelle einen bestimmten Datenwert aus einem vordefinierten Wertebereich (engl. domain) als Eigenschaft zu. In der Tabelle MIT-ARBEITER ermglicht das Merkmal M# das eindeutige Identifizieren

Abb.1-2 Tabellengerst

fr eine Tabelle MITARBEITER

der Mitarbeiter. Aufgrund dieser Eigenschaft erklren wir die Mitar-beiternummer zum Schlssel. Zur Verdeutlichung der Schlsselei-genschaft werden die Schlsselmerkmale im Folgenden kursiv im Tabellenkopf1 angeschrieben. Mit dem Merkmal Ort werden die dazugehrenden Ortsnamen, mit dem Merkmal Name die entspre-chenden Mitarbeiternamen bezeichnet.

Eine Tabelle ist eine Menge von

Datenstzen

Ohne weiteres lassen sich nun die gewnschten Daten der Mitar-beiter in die Tabelle MITARBEITER zeilenweise eintragen (vgl. Abb. 1-3). Dabei knnen gewisse Datenwerte mehrfach in der Tabelle

1 In einigen Standardwerken der Datenbankliteratur werden die Schlsselmerk-male durch Unterstreichung kenntlich gemacht.

MITARBEITER

Name Ort

Tabellenname

Merkmal oder Attribut

M#

Schlsselmerkmal


1.2 Grundbegriffe des Relationenmodells

5

erscheinen. So bemerken wir in der Tabelle MITARBEITER, dass der Wohnort Liestal zweimal vorkommt. Dieser Sachverhalt ist wesent-lich und sagt aus, dass sowohl der Mitarbeiter Becker als auch der Mitarbeiter Meier in Liestal wohnen. In der Tabelle MITARBEITERknnen nicht nur Ortsbezeichnungen mehrfach vorkommen, sondern auch Mitarbeiternamen. Aus diesen Grnden ist das bereits erwhnte Schlsselmerkmal M# notwendig, das jeden Mitarbeiter in der Tabelle eindeutig bestimmt.

Was ist ein Identifikations-schlssel?

Ein Identifikationsschlssel oder Schlssel (engl. identification key) einer Tabelle ist ein Merkmal oder eine minimale Merkmals-kombination, wobei innerhalb der Tabelle die Schlsselwerte die Datenstze (genannt Zeilen oder Tupel) eindeutig identifizieren. Aus dieser Kurzdefinition lassen sich zwei wichtige Schlsseleigenschaf-ten herleiten:

Abb.1-3 Tabelle MITARBEITER mit Ausprgungen

Eindeutigkeit und Minimalitt sind gefordert

Jeder Schlsselwert identifiziert eindeutig einen Datensatz inner-halb der Tabelle, d.h., verschiedene Tupel drfen keine identi-schen Schlssel aufweisen (Eindeutigkeit).

Falls der Schlssel eine echte Kombination von Merkmalen dar-stellt, muss diese minimal sein. Mit anderen Worten: Kein Merk-mal der Kombination kann gestrichen werden, ohne dass die Ein-deutigkeit der Identifikation verlorengeht (Minimalitt).

Mit den beiden Forderungen nach Eindeutigkeit und Minimalitt ist ein Schlssel vollstndig charakterisiert.

M#

M19

M4

M1

M7

Name

Schweizer

Becker

Meier

Huber

Ort

Frenkendorf

Liestal

Liestal

Basel

MITARBEITERSpalte

Datenwert Datensatz(Zeile oder Tupel)



6

Vorsicht bei der Festlegung eines

Schlssels

Anstelle eines natrlichen Merkmals oder einer natrlichen Merk-malskombination kann ein Schlssel als knstliches Merkmal einge-fhrt werden. Die Mitarbeiternummer M# aus unserem Beispiel ist knstlich, weil sie keine natrliche Eigenschaft der Mitarbeiter dar-stellt. Aus ideellen Grnden struben wir uns zwar oft dagegen, knstliche Schlssel oder Nummern als identifizierende Merkmale vorzusehen, vor allem wenn es sich um personenbezogene Informati-onen handelt. Auf der anderen Seite fhren natrliche Schlssel oder Schlsselkombinationen nicht selten zu Datenschutzproblemen. Als Beispiel sei die in der Schweiz bliche Alters- und Hinterbliebenen-Versicherungsnummer (AHV-Nummer) genannt, die unter anderem das Geburtsdatum jeder Person enthlt. Es fragt sich, ob die auf vie-len Ausweisen und Dokumenten abgedruckte AHV-Nummer mit ihren personenbezogenen Bestandteilen als Identifikationsmerkmal vom Datenschutz her vernnftig ist.

Knstliche Schlssel

bewhren sich

Ein knstlicher Schlssel sollte aufgrund obiger berlegungen anwendungsneutral und ohne Semantik (Aussagekraft, Bedeutung) definiert werden. Sobald aus den Datenwerten eines Schlssels irgendwelche Sachverhalte abgeleitet werden knnen, besteht ein Interpretationsspielraum. Auch kann es vorkommen, dass sich die ursprnglich wohldefinierte Bedeutung eines Schlsselwertes im Laufe der Zeit ndert oder verlorengeht. So wird bei sprechenden Schlsseln die Forderung nach Eindeutigkeit auf einmal verletzt.

TabellendefinitionZu den

Eigenschaften einer Relation

Zusammenfassend verstehen wir unter einer Tabelle oder Relation (engl. table, relation) eine Menge von Tupeln, die tabellenfrmig dargestellt werden und folgende Anforderungen erfllen:

Eine Tabelle besitzt einen eindeutigen Tabellennamen. Innerhalb der Tabelle ist jeder Merkmalsname eindeutig und

bezeichnet eine bestimmte Spalte mit der gewnschten Eigen-schaft.

Die Anzahl der Merkmale ist beliebig, die Ordnung der Spalten innerhalb der Tabelle ist bedeutungslos.

Eines der Merkmale oder eine Merkmalskombination identifi-ziert eindeutig die Tupel innerhalb der Tabelle und wird als Pri-mrschlssel bezeichnet.

Die Anzahl der Tupel einer Tabelle ist beliebig, die Ordnung der Tupel innerhalb der Tabelle ist bedeutungslos.

Beim Relationenmodell (engl. relational model) wird gem obiger Definition jede Tabelle als Menge ungeordneter Tupel aufgefasst. Zu


1.3 Die international standardisierte Sprache SQL

7

beachten ist, dass aufgrund dieses Mengenbegriffs in einer Tabelle ein und dasselbe Tupel nur einmal vorkommen darf.

1.3Die international standardisierte Sprache SQL

Mengen- orientierte Daten-banksprache

Wie wir gesehen haben, stellt das Relationenmodell Informationen in Form von Tabellen dar. Dabei entspricht jede Tabelle einer Menge von Tupeln oder Datenstzen desselben Typs. Dieses Mengenkon-zept erlaubt grundstzlich, Abfrage- und Manipulationsmglichkei-ten mengenorientiert anzubieten. Das Resultat einer Selektionsopera-tion ist eine Menge, d.h., jedes Ergebnis eines Suchvorgangs wird vom Datenbanksystem als Tabelle zurckgegeben. Falls keine Tupel der durchsuchten Tabelle die geforderten Eigenschaften erfllen, erhlt der Anwender eine leere Resultattabelle. nderungsoperatio-nen wirken ebenfalls auf eine Tabelle oder auf einzelne Tabellenbe-reiche.

Die Sprache SQL ist zertifiziert

Die wichtigste Abfrage- und Manipulationssprache fr Tabellen heit Structured Query Language oder abgekrzt SQL (vgl. Abb. 1-4). Diese Sprache wurde durch das ANSI (American National Stan-dards Institute) und durch die ISO (International Organization for Standardization) genormt.2

Die Sprache SQL gengt einem allgemeinen Grundmuster, das wir anhand der in Abb. 1-4 aufgefhrten Abfrage illustrieren:

Selektiere (SELECT) das Merkmal Name aus (FROM) der Tabelle MITARBEITER, wobei (WHERE) der Wohnort Liestal ist!

Jede Abfrage generiert eine Resultattabelle

Der Ausdruck SELECT-FROM-WHERE wirkt auf eine oder meh-rere Tabellen und erzeugt als Resultat immer eine Tabelle. Auf unser Beispiel bezogen erhalten wir fr obige Abfrage eine Resultattabelle mit den gewnschten Namen Becker und Meier.

SQL ist mengenorientiert

Diese mengenorientierte Arbeitsweise unterscheidet SQL prinzi-piell von nicht-relationalen Datenbanksprachen. Hier liegt denn auch ein wesentlicher Vorteil fr den Anwender, da eine einzige SQL-Abfrage eine ganze Reihe von Aktionen im Datenbanksystem ausl-sen kann. So ist es nicht notwendig, dass der Anwender die Suchvor-gnge selbst ausprogrammiert. Ein relationales Datenbanksystem nimmt ihm diese Arbeit ab.

2 Das ANSI ist der nationale Normenausschuss der USA und entspricht dem DIN (Deutsches Institut fr Normung) in Deutschland. Der ISO gehren die nationalen Normenausschsse an.



8

Abb.1-4 Formulierung

einer Abfrage mit SQL

Das WAS zhlt, nicht das WIE

Relationale Abfrage- und Manipulationssprachen sind deskriptiv, also beschreibend. Allein durch das Festlegen der gesuchten Eigen-schaften erhlt der Anwender die gewnschten Informationen. Eine Anleitung zur Berechnung der resultierenden Datenstze muss von ihm nicht spezifiziert werden. Das Datenbanksystem bernimmt diese Aufgabe, bearbeitet die Abfrage oder die Manipulation mit eigenen Such- und Zugriffsmethoden und erstellt die gewnschte Resultattabelle.

Im Gegensatz zu den deskriptiven Abfrage- oder Manipulations-sprachen mssen bei den herkmmlichen prozeduralen Datenbank-sprachen durch den Anwender selbst die Ablufe zur Bereitstellung der gesuchten Informationen ausprogrammiert werden. Dabei ist das Ergebnis jeder Abfrageoperation ein einzelner Datensatz und nicht eine Menge von Tupeln.

Das Navigieren in Datenbestnden

bernimmt das System

Bei der deskriptiven Formulierung einer Abfrage beschrnkt sich SQL auf die Angabe der gewnschten Selektionsbedingung in der WHERE-Klausel, bei den prozeduralen Sprachen hingegen muss ein Algorithmus zum Auffinden der einzelnen Datenstze vom Anwen-der spezifiziert werden. Lehnen wir uns an bekannte Datenbankspra-chen von hierarchischen Datenbanksystemen, so suchen wir gemAbb. 1-5 zuerst mit GET_FIRST einen ersten Datensatz, der das gewnschte Suchkriterium erfllt. Anschlieend lesen wir smtliche

MITARBEITER

Selektiere die Namen der Mitarbeiter, die in Liestal wohnen

SELECT FROM WHERE Name

BeckerMeier

Resultattabelle

Beispiel einer Abfrage

Formulierung in SQL

M#

M19M4M1M7

Name

SchweizerBeckerMeierHuber

Ort

FrenkendorfLiestalLiestalBasel

NameMITARBEITEROrt = Liestal


1.3 Die international standardisierte Sprache SQL

9

Datenstze durch GET_NEXT-Befehle, bis wir das Ende der Datei oder eine nchste Hierarchiestufe innerhalb der Datenbank erreichen.

Die physische Datenstruktur bleibt verborgen

Bei den prozeduralen Datenbanksprachen stellen wir zusammen-fassend fest, dass sie satzorientierte oder navigierende Befehle fr das Bearbeiten von Datensammlungen verlangen. Dieser Sachverhalt setzt vom Anwendungsentwickler einigen Sachverstand und Kennt-nis der inneren Struktur der Datenbank voraus. Zudem kann ein gele-gentlicher Benutzer eine Datenbank nicht selbststndig auswerten. Im Gegensatz zu den prozeduralen Sprachen mssen bei relationalen Abfrage- und Manipulationssprachen keine Zugriffspfade, Verarbei-tungsablufe oder Navigationswege spezifiziert werden. Dadurch wird der Entwicklungsaufwand fr Datenbankauswertungen wesent-lich reduziert.

Der gelegentliche Anwender bekommt eine Chance

Mchte man Datenbankabfragen und -auswertungen von den Fachabteilungen oder von den Endbenutzern selbst durchfhren las-sen, so kommt dem deskriptiven Ansatz eine groe Bedeutung zu. Untersuchungen deskriptiver Datenbankschnittstellen haben offenge-legt, dass auch ein gelegentlicher Benutzer eine echte Chance hat, mit Hilfe deskriptiver Sprachelemente seine gewnschten Auswer-tungen selbststndig durchfhren zu knnen. Aus Abb. 1-5 ist zudem ersichtlich, dass die Sprache SQL der natrlichen Sprache nahesteht. So existieren heute relationale Datenbanksysteme, die ber einen natrlich-sprachlichen Zugang verfgen.

Abb.1-5 Unterschied zwischen deskriptiven und prozeduralen Sprachen

Selektiere die Namen der Mitarbeiter,die in Liestal wohnen

prozedurale Sprache:

deskriptive Sprache:

get first MITARBEITER search argument (Ort = 'Liestal')while status = 0 dobegin print (Name) get next MITARBEITER search argument (Ort = 'Liestal')end

SELECTFROMWHERE

natrliche Sprache:

NameMITARBEITEROrt = Liestal



10

1.4 Die Komponenten eines relationalen Datenbanksystems

Ted Codd ist der Begrnder des

Relationen- modells

Das Relationenmodell wurde Anfang der siebziger Jahre durch die Arbeiten von Edgar Frank Codd begrndet. Daraufhin entstanden in Forschungslabors erste relationale Datenbanksysteme, die SQL oder hnliche Datenbanksprachen untersttzten. Ausgereiftere Produkte haben inzwischen die Praxis erobert.

Was ist ein relationales

DBMS?

Ein relationales Datenbankmanagementsystem (engl. relational database management system), abgekrzt RDBMS und oft vereinfa-chend relationales Datenbanksystem genannt, ist gem Abb. 1-6 ein integriertes System zur einheitlichen Verwaltung relationaler Daten-banken. Neben Dienstfunktionen stellt ein RDBMS eine deskriptive Sprache fr Datenbeschreibungen und Datenmanipulationen zur Ver-fgung.

Aufgaben der Speicherungs-

und Verwaltungs-komponenten

Jedes relationale Datenbanksystem besteht aus einer Speiche-rungs- und einer Verwaltungskomponente (vgl. Abb. 1-6): Die Spei-cherungskomponente dient dazu, sowohl Daten als auch Beziehun-gen zwischen ihnen lckenlos in Tabellen abzulegen. Neben Tabellen mit Benutzerdaten aus unterschiedlichen Anwendungen existieren vordefinierte Systemtabellen, die beim Betrieb der Datenbanken bentigt werden. Diese enthalten Beschreibungsinformationen und lassen sich vom Anwender jederzeit abfragen, nicht aber verndern. Die Verwaltungskomponente enthlt als wichtigsten Bestandteil eine relationale Datendefinitions- und Datenmanipulationssprache. Dane-ben umfasst diese Sprache auch Dienstfunktionen fr die Wiederher-stellung von Datenbestnden nach einem Fehlerfall, zum Daten-schutz und zur Datensicherung.

Die Eigenschaften eines relationalen Datenbanksystems lassen sich wie folgt zusammenfassen:

Relationale DBMS

sind formal abgesichert

Ein RDDBMS dient der strukturierten Datenorganisation und hat eine klare formale Grundlage. Alle Informationen werden in Tabellen abgespeichert, wobei Abhngigkeiten zwischen den Merkmalswerten einer Tabelle oder mehrfach vorkommende Sachverhalte aufgedeckt werden knnen. Diese formalen Instru-mente ermglichen einen widerspruchsfreien Datenbankentwurf und garantieren saubere Datenstrukturen.

Relationale Sprachen sind

mengenorientiert

Ein RDBMS untersttzt eine mengenorientierte Sprachschnitt-stelle zur Datendefinition, -selektion und -manipulation. Die Sprachkomponente ist deskriptiv und entlastet den Anwender bei Auswertungen oder bei Programmierttigkeiten. Bei dieser deskriptiven Sprachschnittstelle gibt der Anwender aufgrund


1.4 Die Komponenten eines relationalen Datenbanksystems

11

seiner Vorstellungen eine Selektionsbedingung an. Das Durch-suchen der Datenbank und das Bereitstellen der Resultattabelle hingegen bernimmt das Datenbanksystem.

Unabhngigkeit zwischen Daten-organisation und Anwendungs- programmen

Ein RDBMS gewhrleistet eine groe Datenunabhngigkeit, d.h., Daten und Anwendungsprogramme bleiben weitgehend voneinander getrennt. Diese Unabhngigkeit ergibt sich aus der Tatsache, dass die eigentliche Speicherungskomponente eines RDBMS von der Anwenderseite durch eine Verwaltungskompo-nente entkoppelt ist. Im Idealfall knnen physische nderungen in den relationalen Datenbanken vorgenommen werden, ohne dass die entsprechenden Anwendungsprogramme anzupassen sind.

Mehrere Benutzer knnen gleichzeitig arbeiten

Ein RDBMS ermglicht und untersttzt den Mehrbenutzerbe-trieb, d.h., es knnen mehrere Benutzer gleichzeitig ein und die-selbe Datenbank abfragen oder bearbeiten. Das relationale Datenbanksystem muss also dafr sorgen, dass parallel ablau-fende Aktionen auf einer Datenbank sich nicht gegenseitig behindern oder gar die Korrektheit der Daten beeintrchtigen.

Datenkonsistenz und -integritt bleiben gewahrt

Ein RDBMS stellt Hilfsmittel zur Gewhrleistung der Datenin-tegritt bereit. Unter Datenintegritt versteht man die fehlerfreie und korrekte Speicherung der Daten sowie ihren Schutz vor Zer-strung, vor Verlust, vor unbefugtem Zugriff und Missbrauch.

Abb.1-6 Die zwei Komponenten eines relationalen Datenbank- systems

Relationales Datenbankmanagementsystem DBMS

- Daten und Daten- beziehungen in Form von Tabellen- Beschreibungsdaten und statistische An- gaben (Systemtabellen)

- relationale Datendefinitions- und Datenmanipulations- sprache- zentrale Funktionen fr Reorganisation, Schutz, Sicherheit etc.

Speicherungs-komponente

Verwaltungs-komponente

MSDB



12

Relationale DBMS

dominieren den Markt

Nicht-relationale Datenbanksysteme erfllen solche Eigenschaften nur teilweise. Aus diesem Grunde haben die relationalen Datenbank-systeme in den letzten Jahren einen Durchbruch auf dem Markt erzielt; ein Ende dieser erfolgreichen Entwicklung ist zur Zeit nicht abzusehen. Relationale Datenbanksysteme legen auch auf dem Gebiet der Leistungsfhigkeit oder Performanz (engl. performance) von Jahr zu Jahr zu, obwohl die mengenorientierte Verarbeitung ihren Preis hat. Erfahrungen aus der Betriebspraxis mit relationalen Datenbanksystemen befruchten wiederum neuere Entwicklungen auf dem Gebiet verteilter oder wissensbasierter Daten- und Methoden-banken. berdies wurzeln viele Forschungs- und Entwicklungsarbei-ten zu Datenbanken in der relationalen Datenbanktheorie (vgl. Kapi-tel 6).

1.5Zur Organisation des Datenbankeinsatzes

Zum Produktions-faktor Information

Viele Firmen und Institutionen betrachten ihre Datenbestnde als unentbehrliche Ressource. Sie pflegen und unterhalten zu Geschfts-zwecken nicht nur ihre eigenen Daten, sondern schlieen sich mehr und mehr an ffentlich zugngliche Datensammlungen an. Die welt-weite Zunahme und das stetige Wachstum der Informationsanbieter mit ihren Dienstleistungen rund um die Uhr illustriert den Stellenwert webbasierter Datenbestnde.

Ein betriebliches Daten-

management ist gefordert

Die Bedeutung aktueller und realittsbezogener Information hat einen direkten Einfluss auf die Ausgestaltung des Informatikberei-ches. So sind vielerorts Stellen des Datenmanagements entstanden, um die datenbezogenen Aufgaben und Pflichten bewusster angehen zu knnen. Ein zukunftgerichtetes Datenmanagement befasst sich sowohl strategisch mit der Informationsbeschaffung und -bewirt-schaftung als auch operativ mit der effizienten Bereitstellung und Auswertung von aktuellen und konsistenten Daten.

Zur Langlebigkeit der Daten-

bestnde

Aufbau und Betrieb eines Datenmanagements verursachen betrchtliche Kosten mit anfnglich nur schwer messbarem Nutzen. Es ist nmlich nicht einfach, klar strukturierte Datenmodelle, wider-spruchsfreie und fr jedermann verstndliche Datenbeschreibungen, saubere und konsistente Datenbestnde, griffige Sicherheitskonzepte, aktuelle Auskunftsbereitschaft und anderes mehr eindeutig zu bewer-ten und somit aussagekrftig in Wirtschaftlichkeitsberlegungen ein-zubeziehen. Erst ein allmhliches Bewusstwerden von Bedeutung und Langlebigkeit der Daten relativiert fr das Unternehmen die not-wendigen Investitionen.


1.5 Zur Organisation des Datenbankeinsatzes

13

Aufgaben und Pflichten des Daten- managements

Um den Begriff Datenmanagement (engl. data management) bes-ser fassen zu knnen, sollte das Datenmanagement zunchst in seine Aufgabenbereiche Datenarchitektur, Datenadministration, Daten-technik und Datennutzung aufgegliedert werden. Die Abb. 1-7 cha-rakterisiert diese vier Teilgebiete des Datenmanagements mit ihren Zielen und Instrumenten.

Abb.1-7 Die vier Eckpfeiler des Daten- managements

Die Daten- architektur ist grundlegend und strategisch

Die Datenarchitektur analysiert, klassifiziert und strukturiert mit aus-gefeilter Methodik die Unternehmensdaten. Neben der eigentlichen Analyse der Daten- und Informationsbedrfnisse mssen die wich-tigsten Datenklassen und ihre gegenseitigen Beziehungen unterein-ander in Datenmodellen unterschiedlichster Detaillierung festgehal-ten werden. Diese aus der Abstraktion der realen Gegebenheiten entstandenen und aufeinander abgestimmten Datenmodelle bilden die Basis der Datenarchitektur.

Begriffe und Formate mssen administriert werden

Die Datenadministration bezweckt, die Datenbeschreibungen und die Datenformate sowie deren Verantwortlichkeiten einheitlich zu erfassen und zu kontrollieren, um eine anwendungsbergreifende Nutzung der langlebigen Unternehmensdaten zu gewhrleisten. Beim heutigen Trend zu einer dezentralen Datenhaltung auf intelli-genten Arbeitsplatzrechnern oder auf verteilten Abteilungsrechnern

Daten-architektur

Formulieren und Pflegendes unternehmensweitenDatenmodells, Unter-sttzen der Anwendungs-entwicklung bei derDatenmodellierung

Verwalten von Daten undFunktionen anhand vonStandardisierungsricht-linien und internationalenNormen, Beraten vonEntwicklern und Endbe-nutzern

Installieren, Reorgani-sieren und Sicherstellenvon Datenbanken, Durch-fhren von Datenbank-restaurierungen nacheinem Fehlerfall

Bereitstellen von Aus-wertungs- und Report-funktionen unter Berck-sichtigung des Daten-schutzes resp. derDateneignerschaft

Datenanalyse und Ent-wurfsmethodik, Werk-zeuge fr die rechnerge-sttzte Datenmodellierung

Data-Dictionary-Systeme,Werkzeuge fr den Ver-wendungsnachweis

Datenbankverwaltungs-systeme, Hilfsmittelzur Wiederherstellungvon Datenbanken undzur Leistungsoptimierung

Sprache fr Datenbank-abfragen und -manipula-tionen, Reportgeneratoren

Ziele Werkzeuge

Daten-administration

Datentechnik

Datennutzung



14

kommt der Datenadministration eine immer grere Verantwortung bei der Pflege der Daten und bei der Vergabe von Berechtigungen zu.

Die technische Herausforderung

des Daten-managements

Die Spezialisten der Datentechnik installieren, berwachen und reorganisieren Datenbanken und stellen diese in einem mehrstufigen Verfahren sicher. Dieser Fachbereich, oft auch Datenbanktechnik oder Datenbankadministration genannt, ist zudem fr das so genannte Technologiemanagement verantwortlich, da Erweiterungen in der Datenbanktechnologie immer wieder bercksichtigt und beste-hende Methoden und Werkzeuge laufend verbessert werden mssen.

Das Information Center

organisiert die Datennutzung

Der vierte Eckpfeiler des Datenmanagements, die Datennutzung, ermglicht die eigentliche Bewirtschaftung der Unternehmensdaten. Mit einem besonderen Benutzerservice, den unter Umstnden auch so genannte Information Centers anbieten, werden die Fachabteilun-gen gezielt angeleitet, ihre eigenen Datenbestnde selbststndig zu pflegen, nachzufhren und auszuwerten.

Somit ergibt sich nun von der Charakterisierung der datenbezoge-nen Aufgaben und Pflichten her gesehen fr das Datenmanagement folgende Definition:

Definition des Daten-

managements

Unter dem Datenmanagement fasst man alle betrieblichen und tech-nischen Funktionen der Datenarchitektur, der Datenadministration und der Datentechnik zusammen, die der unternehmensweiten Datenhaltung, Datenpflege und Datennutzung dienen.

Kein Informations-management ohne Daten-

management

Die hier vorgeschlagene Begriffsbildung umfasst technische wie betriebliche Funktionen. Dies bedeutet allerdings nicht zwangslufig, dass in der Aufbauorganisation eines Unternehmens die Funktionen der Datenarchitektur, der Datenadministration, der Datentechnik und des Benutzerservice in einer einzigen Organisationseinheit zusam-mengezogen werden mssen.

1.6Bemerkungen zur Literatur

Standardwerke zu Datenbank-

systemen

Es gibt eine groe Anzahl von Standardwerken zu dem Gebiet der Datenbanken, woran sich auch die Bedeutung dieses Informatikbe-reiches ablesen lsst. Einige Lehrbcher behandeln nicht nur relatio-nale, sondern auch die heute noch gebruchlichen hierarchischen und netzwerkartigen Datenbanksysteme. Sehr bekannt sind die Werke von Connolly und Begg (2004), Hoffer et al. (2005) sowie von Date (2004), eher theoretisch ist das Textbuch von Ullman (1982), auf-schlussreich dasjenige von Silberschatz et a1. (2005) und umfassend das Standardwerk von Elmasri und Navathe (2006). Gardarin und Valduriez (1989) geben eine Einfhrung in die relationale Daten-banktechnologie sowie in das Gebiet der Wissensbanken.


1.6 Bemerkungen zur Literatur

15

Deutsch- sprachige Lehrbcher im Datenbank- bereich

Als deutschsprachige Lehrbcher im Datenbankbereich sind Schlageter und Stucky (1983), Vossen (2000), Wedekind (1981) und Zehnder (2002) zu erwhnen. Die jngsten Werke von Heuer und Saake (2000), Kemper und Eickler (2006) sowie von Lang und Lockemann (1995) gehen auf Grundlagen und Erweiterungen von Datenbanksystemen ein.

Werke und Forschungs- literatur zum betrieblichen Daten- management

Das eigentliche Fachbuch ber betriebliche Aspekte des Datenma-nagements stammt von Dippold et al. (2005). Biethahn et al. (2000) widmen in ihrem Band ber das Daten- und Entwicklungsmanage-ment der Datenarchitektur und der Datenadministration mehrere Kapitel, die Einfhrung von Martin (1986) konzentriert sich auf die Datenbanktechnik, schliet aber Managementberlegungen mit ein. Das Handbuch der Wirtschaftsinformatik von Kurbel und Strunz (1990) enthlt ein Kapitel ber das Datenmanagement. Scheer (1991) und Vetter (1998) beschrnken sich in ihren Werken auf die Datenar-chitektur und erlutern das methodische Werkzeug zur unterneh-mensweiten Datenmodellierung. Heinrich und Lehner (2005), Mar-tiny und Klotz (1989) sowie sterle et al. (1991) streifen in ihren Werken ber das Informationsmanagement auch Themen des Daten-managements. Auer den erwhnten Fachbchern existieren einige Artikel; zu erwhnen ist der Aufsatz von Gemnden und Schmitt (1991), dem eine empirische Untersuchung in deutschen Grounternehmen angefgt ist. Meier (1994) charakterisiert in sei-nem Beitrag die Ziele und Aufgaben des Datenmanagements aus der Sicht des Praktikers. Fragen der Datenadministration werden von Meier und Johner (1991) sowie von Ortner et al. (1990) aufgegriffen.


http://www.springer.com/978-3-540-46553-9

Documents

Relationale und Postrelationale Datenbanken Meier, A. Kapitel 6