Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/25
Textdatenbanken
Volltextdatenbanken enthalten im Prinzip den vollen Text einer
Dokumentationseinheit. Aber in allen Fällen wird der Text bzw. die in ihm
enthaltenen Informationen durch weitere Felder beschrieben:
• Attribute
• Merkmale
• Nomenklaturen
• Thesaurus
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 2/25
Feldname Datentyp
ND (Dokument-, Artikelnummer qualitatives Merkmal
PY (Erscheinungsjahr) Rangmerkmal
VN (Ausgabenummer der Zeitung) Rangmerkmal
PD (Erscheinungsdatum der Zeitung) Rangmerkmal
PA (Seite der Zeitung) Rangmerkmal
AC (zweistelliger Zifferncode des Autors
qualitatives Merkmaloder Redakteurs)
AU (Name oder Namenskurzzeichen des
qualitatives MerkmalAutors oder Redakteurs)
RB (Titel einer Rubrik) formatiertes Feld bzw. qualitatives Merkmal
TI (Titel des Artikels) formatiertes Feld
UT (Untertitel) formatiertes Feld
AB (Einleitung des Artikels) Text
T1 (1. Textabschnitt des Artikels) Text
++ (weitere Textabschnitte des Artikels) Text
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 3/25
Die drei formatierten Felder RB, TI und UT übernehmen noch Informationen des
Artikels mit Textcharakter. Lediglich das Feld RB könnte, bei entsprechender
Strukturierung auch ein qualitatives Merkmal sein. Hinzu kommen noch
Rangmerkmale. VN und PD, sowie die Seitennummer haben einen eindeutigen
Rangcharakter. Für das Retrieval bedeutet das, dass zusätzlich die
kleiner/größer-Operatoren Verwendung finden können.
Die verbleibenden Felder stellen qualitative Merkmale dar. Wie bereits
ausgeführt, bilden qualitative Merkmale nach dem Messvorgang disjunktive
Teilmengen auf der betrachteten Menge der Objekte. Einige jedoch nehmen eine
Sonderstellung ein, weil ihre Teilmengen aus nur je einem Element bestehen. In
diesem Datensatz ist dies z.B. das Feld ND.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 4/25
Für das Retrieval stellen diese Felder insoweit eine Besonderheit dar, weil ein
Suchvorgang mit ihnen (über eine Merkmalsausprägung) immer zu einer
einelementigen Menge führt. Diese Felder erlauben also die Identifikation
einzelner Sätze der Datenbank. Sie sollen, in Anlehnung an den entsprechenden
Begriff der Datenbanktheorie, „Schlüssel“ genannt werden.
Neben langen Texten (allgemein, Zeitschriften, Vorschriften) werden auch
Patentdatenbanken als Volltextdatenbanken geführt.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 5/25
Bibliographische Datenbanken
AB = textliche Informationen
Textliche Informationen werden modelliert. Da aber Wissen modelliert wird, wird
von Repräsentationen (Wissensrepräsentationen) gesprochen. Diese
Repräsentationen können nun als Erklärungsversuch verstanden werden.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 6/25
Feldname Datentyp
AN (Accession number) Schlüssel
TI (Original title) formatiertes Feld
AU (Author(s)) formatiertes Feld
DT (Document type) qualitatives Merkmal
SO (Source) formatiertes Feld bzw. qualitatives Merkmal
Decimal Classification
DP (primary) Nomenklatur
DS (Secondary) Nomenklatur
DG (Geographical) Nomenklatur
MJ (Major descriptors) Nomenklatur bzw. qualitatives Merkmal
MN (Minor descriptors) Nomenklatur bzw. qualitatives Merkmal
AB (Abstract) Text (Information über Text)
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 7/25
Integrierte Datenbanken
Datenbanken mit umfangreichem Inhalt. Sie integrieren Daten aus Fakten-
basierenden Datenbanken und aus textlichen Datenbanken.
Data Warehouse ist ein Begriff, der in diesem Zusammenhang verwendet wird.
• Fakten an Produkten
• statische Daten (z.B. Herstellung Ein- und Ausfuhr)
• Daten der Zulieferer
• Rechtsvorschrift
• (Umweltverträglichkeit)
• Patentinformationen
• Formalismen
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 8/25
1. Auf der unteren Ebene sind horizontal die mengenorientierten Systeme
angegeben, die sich an den operativen Funktionen Produktion, Technik,
Beschaffung, Vertrieb und Personaleinsatz ausrichten. Als Beispiel kann
Betriebsdatenerfassung (BDE), bspw. Auch die Arbeitszeiterfassung genannt
werden.
2. Die mengenorientierten Prozesse werden vertikal in wertorientierten
Abrechnungssystemen des Rechnungswesens erfasst. Beispiele für das
Beschaffungssystem sind die Kreditorenbuchführung, für das Vertriebssystem
die Debitorenbuchführung und für das Personalwesen die Lohn- und
Gehaltsabrechnung.
3. Aus den mengen- und wertorientierten Systemen Informationen für Berichts-
und Kontrollsysteme abgeleitet.
4. Analyse- und Informationssysteme werden erstellt, die neben den verdichteten
Daten auch Daten externer Quellen einbeziehen. Beispiele hierfür sind
Marketing-, Beschaffungs- und Produktionsinformationssysteme.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 9/25
5. Die höchste Verdichtungsstufe bilden Planungs- und Entscheidungssysteme,
die insbesondere für langfristig wirkende Entscheidungen Unterstützung
geben sollen, zum Beispiel etwa ein Vertriebs-Führungsinformationssystem für
den Vertriebsvorstand.
Auch hier liegt wieder ein zusammengesetztes Feld vor (CI), das ohne
Schwierigkeit in die Form einzelner Merkmale überführt werden kann. Weiter
finden sich hier bereits in diesem ersten Teil der Informationseinheit numerische
Informationen im Feld CD (Corporate Statistics). Numerische Informationen in
Online-Datenbanken stellen wiederum im Regelfall Ausprägungen quantitativer
Merkmale oder vercodete Ausprägungen qualitativer Merkmale dar. In diesem
Fall handelt es sich um klare quantitative Merkmale: SALES (in US-Dollar) und
EMPLOYEES, allerdings in einem zusammengehörigen Teil erfasst.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 10/25
Feldname Datentyp
AB (Abstract, hier Time Series) Text bzw. Tabelle (!)
AN (Identification number) qualitatives Merkmal/Schlüssel
CI (Corporate Information) zusammengesetztes Feld aus qualitativen Merkmalen
CN (Country Descriptor & Country Code) Nomenklatur
CO (Company Descriptor) qualitatives Merkmal/Schlüssel
CS (Corporate Statistics) zusammengesetzt aus qualitativen Merkmalen und einem
Rangmerkmal
EN (Event Descriptor & Country Code) Nomenklatur mit Mehrfacheinträgen
PN (Product Descriptor & Event Code) Nomenklatur mit Mehrfacheinträgen
SE (Stock exchange and symbol) qualitative Merkmale
SF (Special feature) qualitatives Merkmal
SO (Source) qualitatives Merkmal
TI (Title) formatiertes Feld
YR (Year of Publication) Rangmerkmal
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 11/25
Grafik in Datenbanken
Grafik in
integrierten
Datenbanken
Bilddateien
gif
jpeg
Geographische
Datenbank
(Stadtpläne)
Grafische Struktur
(Kommunikation
über grafische
Elemente)
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 12/25
Funktionsorientierte Informationssysteme
Produktion Technik Beschaffung Vertrieb Personal
vertikal
horizontal
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 13/25
Typische Begriffe:
Planungs- und Entscheidungssysteme Gewinn, Marktanteil
Analyse- und Informationssysteme Abweichungen, Korrelationen
Berichts- und Kontrollsysteme Kosten- und Erlösart, Kostenstelle, Kostenträger
Wertorientierte Abrechnungssysteme Konto, Buchungssatz
Mengenorientierte operative Systeme Produktionsfaktoren, Aufträge
(Administrations- & Dispositionssysteme
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 14/25
Einarbeitung
Disposition
Informationsübertragungs- und Wartezeiten
Einarbeitung
Lieferantenauswahl
Informationsübertragungs- und Wartezeiten
Einarbeitung
Bestellschreibung
8. Stunde
8. Stunde
1. Stunde
1. Stunde
1. Stunde
1. Stunde
2. Stunde
2. Stunde
Prozesskette mit arbeitsteiliger Datenverwaltung
Durchlaufzeit (DLZ) = 24 Stunden = 3 Tage
Ablauf bei traditioneller arbeitsteiliger Organisation
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 15/25
Einarbeitung
Disposition
Wartezeiten
Einarbeitung
Lieferantenauswahl
Wartezeiten
Einarbeitung
Bestellschreibung
Datenbank
Prozesskette mit integrierter Datenbasis
Durchlaufzeit (DLZ) = 16 Stunden = 2 Tage
Ablauf bei Unterstützung durch integrierte Datenbank
4. Std.
4. Std.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 16/25
Integration (lateinisch) : „Wiederherstellung eines Ganzen“
Allgemein: (Wieder-)Herstellung einer Einheit; Einbeziehung;
Eingliederung in ein größeres Ganzes, d.h. z.B.
• das Zusammenwirken der verschiedenen Informationssysteme
• unternehmensintern und unternehmensübergreifend
• auf den unterschiedlichsten Ebenen
• Daten, Funktionen, Organisation
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 17/25
Kriterien für Anfragesprachen
Ad hoe Formulierung:
Der Benutzer soll eine Anfrage formulieren können, ohne ein vollständiges
Programm schreiben zu müssen.
Deskriptivität:
Der Benutzer soll formulieren: „Was will ich haben?“ und nicht „Wie komme ich an
das, was ich haben will?“
Mengenorientiertheit:
Jede Operation soll auf Mengen von Daten gleichzeitig arbeiten, nicht navigierend
nur auf einzelnen Elementen (one-tuple-at-a-time).
Abgeschlossenheit:
Das Ergebnis kann wieder als Eingabe für die nächsten Anfragen verwendet
werden
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 18/25
Adäquatheit:
Alle Konstrukte des zugrundeliegenden Datenmodells werden unterstützt.
Orthogonalität:
Sprachkonstrukte sind in ähnlichen Situationen auch ähnlich anwendbar.
Optimierbarkeit:
Die Sprache besteht aus wenigen Operationen, für die es Optimierungsregeln
gibt.
Effizienz:
Jede Operation ist effizient ausführbar.
Sicherheit:
Keine Anfrage, die syntaktisch korrekt ist, darf in eine Endlosschleife geraten oder
ein unendliches Ergebnis liefern.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 19/25
Eingeschränktheit:
Die Anfragesprache darf keine komplette Programmiersprache sein. Diese
Eigenschaft folgt aus Sicherheit, Optimierbarkeit und Effizienz.
Vollständigkeit:
Die Sprache muss mindestens die Anfrage einer Standardsprache ausdrücken
können.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 20/25
Invnr Name
4711 Meyer
1201 Schulz
0007 Müller
4712 Meyer
Invnr Titel ISBN Autor
0007 Dr. No 3-125 James Bond
1201 Objektdatenbanken 3-111 Heuer
4711 Datenbanken 3-765 Vossen
4712 Datenbanken 3-891 Ullman
4717 Pascal 3-999 Wirth
Ausleih
Buch
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 21/25
Projektion
Der Syntax der Projektion ist
¶ [attributmenge] (relation)
Beispiel:
¶ [Name] (Ausleih)
Selektion
Die Syntax der Selektion ist
σ [bedingung] (relation)
Beispiel:
σ [Name<‚N‘] (Ausleih)
Name
Meyer
Schulz
Müller
Invnr Name
4711 Meyer
0007 Müller
4712 Meyer
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 22/25
Verbund
Relation 1 Relation 2
Beispiel:
Ausleih Buch
Umbenennung
ß [ neu alt] (relation)
Beispiel:
ß [Autor 1 Autor 2] (Buch 2)
Müller Dr. No 3-125James Bond
SchulzObjektdaten-
banken3-111 Heuer
Meyer Datenbanken 3-765 Vossen
Meyer Datenbanken 3-891 Ullman
Autor 2
Witt
Vossen
Silberschatz
Meier
Wirth
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 23/25
Vereinigung
relation 1 U relation 2
Beispiel:
Buch 1 U ß [Autor 1 Autor 2] (Buch 2)
Differenz
relation1 – relation 2
Beispiel:
Buch 1 – ß [Autor 1 Autor 2] (Buch 2)
Name
James Bond
Heuer
Ullman
Autor 1
James Bond
Heuer
Vossen
Ullman
Wirth
Witt
Silberschatz
Meier
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 24/25
Durchschnitt
relation 1 ∩ relation 2
Beispiel:
Buch 1 ∩ ß [Autor 1 Autor 2] (Buch 2)
Minimale Menge relationenalgebraischer Operatoren
Für theoretische Untersuchungen ist es wichtig, mit einer minimalen Menge von
Operationen auszukommen. Eine minimale Relationenalgebra besteht etwa aus
den Operationen.
π σ ß U - ∩
Autor 1
Vossen
Wirth
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 25/25
Wobei bei der Selektion nur einfache Konstanten- und Attribute – Selektionen,
aber keine vollständigen booleschen Ausdrücke notwendig sind. Wir bezeichnen
diese Menge von Operationen mit Ω.
Die Operationen mit Ω sind unabhängig, d.h. es kann keine weggelassen werden,
ohne die Vollständigkeit zu verlieren.