36
0 - 1 Prof. Dr.-Ing. Dr. h. c. Theo Härder AG Datenbanken und Informationssysteme Zi. 36/330, Tel.: 0631-205-4030 E-Mail: [email protected] http://www.haerder.de/ Informationssysteme Sommersemester 2008 TU Kaiserslautern Fachbereich Informatik Postfach 3049 67653 Kaiserslautern Vorlesung: Dienstag, 15.30 - 17.00 Uhr, Raum 46-220 und Donnerstag, 10.00 - 11.30 Uhr, Raum 46-220 Beginn: 8.4.2008 Übung: n. V., s. Aushang

Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 1

Prof. Dr.-Ing. Dr. h. c. Theo HärderAG Datenbanken und InformationssystemeZi. 36/330, Tel.: 0631-205-4030E-Mail: [email protected]://www.haerder.de/

Informationssysteme

Sommersemester 2008

TU KaiserslauternFachbereich Informatik

Postfach 304967653 Kaiserslautern

Vorlesung:

Dienstag, 15.30 - 17.00 Uhr, Raum 46-220

und

Donnerstag, 10.00 - 11.30 Uhr, Raum 46-220

Beginn: 8.4.2008

Übung:

n. V., s. Aushang

Page 2: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 2

Googl

e Data

Uni

vers

e

Web Services

Ope

nDoc

CORB

A

XPat

h

Tech

nisc

he u

ndbe

trie

blic

he In

form

atio

ns-

syst

eme

Wor

kflo

w-M

anag

emen

t

TP-M

onito

re

Obj

ekt-r

elat

iona

leD

B-E

rwei

teru

ngst

echn

olog

ie

XML-

DB

SU

nive

rsal

Sto

rage

SQL:

1999

Info

rmat

ion

Inte

grat

ion

Bus

ines

s In

telli

genc

eD

ata

Min

ing

Dat

a W

areh

ouse

DB

-Mid

dlew

are

Mod

ellie

rung

von

Dat

en u

nd

OB

DC

Gate

ways

Xope

n/D

CF

Java

SQLJ

Dat

aLin

ks

Tuxe

doWeb

Sphe

re

Enci

naSy

base

Ora

cle

11g

Ada

bas

IBM

Info

rmix

CIC

S

Ente

rpris

e

Visual

StudioO

MG

OLAP

R3Vi

sual

Age

CPM

Rat

iona

l Ros

eU

ML

ERM

Tran

sakt

ions

-sy

stem

e

Doc

umen

t Obj

ect M

odel

Cont

ent M

gmt

XQuery

Java

Bean

s

Dyn

amic

Ser

ver

DB

2

Dat

aJoi

ner

Web

Con

tent

Mgm

t Sys

tem

eD

CO

MJ2

EE

XML-SCHEMA

.NET

JDBC

SQLX

EAI

CWM

Visual

Basic

Kom

pone

nten

basi

erte

Syst

emen

twic

klun

gC

ompo

nent

War

e

Bus

ines

s O

bjec

tsG

esch

äfts

proz

esse

n

Tran

sfor

mat

ion

Fede

ratio

n Pl

acem

ent

e-Businesse-***

Wel

tbild

des

Leh

rgeb

iete

s In

form

atio

nssy

stem

e

Info

rmat

ion

Retri

eval

Web

-Eng

inee

ring

Dat

a St

ream

s

Tam

ino

Web

- und

DB

-Cac

hing

DOM

XML-

SQL

Page 3: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 3

Betriebliche Informationssysteme1

Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmenwider und dienen dazu, deren Arbeitsabläufe zu organisieren und zu unterstützen.Darum sind sie wichtig.

Betriebliche Informationssysteme sind stark datenbankbasierte Anwendungen, oftmit sehr vielen Benutzern (Tausende und mehr). Es sind transaktionsverarbeitende Sys-teme, d.h., sie erbringen ihre Leistung in vielen, kleinen Schritten für die gleichzeitigzugreifenden Benutzer. Dabei müssen sie die Integrität der Daten gewährleisten sowiehohen Durchsatz und kurze Antwortzeiten schaffen. Betriebliche Informationssystemelaufen heutzutage typischerweise auf einem leistungsfähigen Server und präsentierensich dem Benutzer mit einer grafischen Oberfläche als Client/Server-Systeme, zuneh-mend auch via Internet. Sie sind aber nicht nur Dialogsysteme, sondern benötigen meistauch einen Batch, der Massenverarbeitung effizient außerhalb des Dialogs abwickelt.

Ein Data Warehouse ist ein spezieller Aspekt betrieblicher Informationssysteme. Esakkumuliert und verdichtet die Daten aus den operativen Transaktionssystemen zu demZweck, die Geschäftsentwicklung zu analysieren und darauf aufbauend Entscheidun-gen zur Steuerung des Unternehmens zu treffen.

Die Software für betriebliche Informationssysteme ist meist sehr komplex und umfang-reich (einige Hunderttausend bis Millionen Zeilen Programmcode), ihre Entwicklungverursacht erheblichen Aufwand und kostet viel Geld. Und sie lebt lange (zehn biszwanzig Jahre und mehr), weshalb ihre Wartungskosten erheblich sind und die der Erst-entwicklung oft übersteigen. Es lohnt sich folglich, Software von vornherein wartungs-freundlich und erweiterbar zu konstruieren.

Ohne betriebliche Informationssysteme könnten Unternehmen ihr Geschäft nicht betrei-ben. Das gilt in der industriellen Produktion ebenso wie im Dienstleistungssektor, ganzbesonders jedoch für jene Unternehmen, die im Kern reine Informationsverarbeiter sind,z.B. Banken, Versicherungen, Touristikanbieter. Bei allen wirken die IT-Systeme tief aufdie Unternehmensorganisation ein. Betriebliche Informationssysteme dienen dem Kern-geschäft von Unternehmen und damit Investitionsgüter von strategischer Bedeutung.

1.Diese Beschreibung der Aufgaben von betrieblichen Informationssystemen und von E-Business ist dem Buch“sd&m - Ein Software- und Beratungshaus stellt sich vor” (mit unwesentlichen Änderungen) entnommen (sd&m:software design & management, München, 2001).

Page 4: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 4

E-Business

E-Business ist die Nutzung des Internets zu geschäftlichen Zwecken aller Art. Das fängtan mit der E-Mail und dem Herunterladen von Software per File-Transfer, geht weitermit der Darstellung des Unternehmens, seiner Produkte und seiner Stellenangebote imWorld Wide Web sowie mit dem Intranet als elektronischem schwarzem Brett und Werk-zeug des Wissensmanagements und schließt E-Commerce mit ein.

Bei E-Commerce fließt Geld, denn es geht um Handel, also den Abschluss und dieAbwicklung von Kaufverträgen. Dabei werden Varianten unterschieden, je nachdem,wer mit wen handelt: ein Unternehmen mit seinen Endkunden (Business-to-Consumer,B2C), Unternehmen untereinander (Business-to-Business, B2B) oder Endkunden direktmiteinander über Börsen und Auktionen (Consumer-to-Consumer, C2C). Es lohnt sichzudem, nach dem „Aggregatzustand“ der gehandelten Produkte zu unterscheiden, d.h.zwischen dem Handel mit materiellen Produkten und jenem mit Informationen; denn dieGeschäftsmodelle sind völlig verschieden. Bei materiellen Gütern kommt es entschei-dend auf die Logistik an, also auf den Versand. Für unempfindliche Artikel (z.B. Bücher,Kleidung) genügt ein Paketdienst, für verderbliche und zeitkritische Ware (Blumen, diezur Geburtstagsfeier eintreffen sollen) muss ein spezieller Lieferservice eingerichtetwerden. Für den reinen Informationshandel (z. B. mit Musik oder dem kostenpflichtigenNachschlagen in einem E-Lexikon) ist das Internet der ideale Transportweg, nur zahltdafür niemand gerne. Geschäftlich interessant dagegen ist Information, hinter der eineDienstleistung steht (z. B. das Buchen eines Fluges, verbunden mit dem Kauf einesTickets, oder der Abschluss einer Versicherung).

E-Business braucht starke Softwaresysteme. Es sind komplexe Systeme, denn es genügtnicht, sich mit einer gut gestalteten Web-Oberfläche dem Benutzer zu präsentieren –werblich ansprechend, um ihn zu gewinnen, ergonomisch, um ihn nicht zu verlieren.Dahinter muss mehr stehen: eine flexible Anwendung, die sich schnell an geänderteGeschäftsprozesse anpassen lässt, und eine gehaltvolle Datenbank. Aber das ist nochnicht alles. Das Internet erfordert erhöhte Sicherheit und Bezahlung in neuen Formen.Tausende von Anwendern greifen gleichzeitig zu und erwarten rasche Reaktion. Weiter-hin ist Anwendungsintegration von zentraler Bedeutung: Vorhandene (Legacy-) Sys-teme müssen über das Internet zugänglich gemacht und Anwendungen verschiedenerUnternehmen darüber direkt verbunden werden. Kurzum, Software-Engineering fürkomplexe Systeme ist gefragt: @business @ngineering.

Page 5: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 5

E-Business (2)

E-Business-Systeme sind nichts anderes als betriebliche Informationssysteme, aller-dings mit besonderen Anforderungen: Erstens sind es eigentlich überbetrieblicheInformationssysteme, denn sie verbinden über ein Unternehmen hinausgehend Mitarbei-ter, Lieferanten und Kunden und werden vor allem von Menschen genutzt, die nichtAngestellte des betreibenden Unternehmens sind. Diese Anwender sind unbekannt,d. h., man kann sie beim Entwurf des Systems nicht befragen, man kann sie nicht schu-len, ihnen keine Anweisungen erteilen, und man muss mit Ungeschicklichkeit oder garböswilligen Attacken rechnen. Dennoch kommt es gerade auf sie an, denn es sind(potenzielle) Kunden (im B2C-Geschäft) oder Mitarbeiter von guten Geschäftspartnern(B2B). Die Ergonomie der Benutzeroberfläche ist also in bisher nicht bekannterWeise erfolgskritisch. Ebenso sind es die Organisation der Geschäftsprozesse, die nunüber das eigene Unternehmen hinausreichen, sowie bestimmte Sicherheitsmaßnahmen(Firewall, Verschlüsselung, elektronisches Bezahlen).

Zweitens muss man beim Bauen und Integrieren von E-Business-Systemen eine nochnie da gewesene Komplexität der Technologie beherrschen. Man muss sich mit derProgrammierung der Web-Oberfläche auskennen (HTML, XML, Java-Applets etc.),Netzprotokolle (z.B. HTTP) und Web-Server einzusetzen verstehen, Anwendungs-pro-gramme in Java schreiben und unter der Transaktionskontrolle von Application-Ser-vern zum Laufen bringen, Standard-Internet-Anwendungen (z.B. Intershop) sowievorhandene (Legacy-) Systeme (CICS, Cobol, DB2) integrieren. Damit nicht genug:Systeme für E-Mail, Verschlüsselung, Zahlung und anderes müssen eingebunden wer-den. Schließlich ist das Ganze so zu integrieren, zu testen und zu tunen, dass es korrekt,zuverlässig und schnell läuft. Die zu verknüpfende Technologie reicht vom Mainframeüber Client/Server-Systeme zum Internet.

Weitere Unterstützung: Ein Webservice ist eine mit einem Uniform Resource Identifier(URI) eindeutig identifizierbare Software-Anwendung, deren Schnittstellen als XML-Artefakte definiert, beschrieben und gefunden werden können. Ein Webservice unter-stützt die direkte Interaktion mit anderen Software-Systemen unter Verwendung XML-basierter Nachrichten durch den Austausch über internetbasierte Protokolle.

Ein Beispiel ist die Interaktion zwischen Fluggesellschaften und Reisebüros. Die Flug-gesellschaften stellen Möglichkeiten zum Nachschlagen bzw. Buchen von Flügen übereinen Webservice bereit. Die Reisebüros bieten auf ihrem Web-Auftritt Flüge verschie-dener Fluggesellschaften an, von denen die Reisebüros zur Laufzeit über UDDI erfah-ren. Der Kunde kann so beim Reisebüro zentral Preise und Termine verschiedener Flügevergleichen und direkt buchen (http://de.wikipedia.org/wiki/Webservice).

Page 6: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 6

Ziele

• Vermittlung von Grundlagen- und Methodenwissen2 sowieErwerb von Fähigkeiten und Fertigkeiten im BereichDatenbanken und Informationssysteme:

- Nutzung von Informations- und Datenmodellen, insbes.

• Entity/Relationship-Modell und Erweiterungen

• Relationenmodell

- Entwurf, Aufbau und Wartung von Datenbanken

• Modellierung von Miniwelten und Entwicklung von DB-Schemata

• Einsatz von SQL als DB-Standard-Sprache

- Sicherung der Abläufe in Datenbanken

• Transaktionskonzept mit ACID-Eigenschaften

• Mehrbenutzerbetrieb, semantische Integrität, Fehlerbehandlung

- Verwaltung und Handhabung semi- und unstrukturierter Daten/Dokumente

• Markup-Sprachen, Web-Zugriff

• XML-Datenmodell und XQuery

- Geschäftsprozessmodellierung und Abbildung auf Workflows

• Voraussetzungen für Übernahme von Tätigkeiten:

- Entwicklung von betrieblichen Anwendungs- und Informationssystemen,insbesondere DB-gestützte Anwendungen

- Planung und Realisierung von Geschäftsprozessen

- Systemverantwortlicher für Datenbanksysteme, insbes. Unternehmens-,Datenbank-, Anwendungs- und Datensicherungsadministrator

2. Grundlagenwissen ist hochgradig allgemeingültig und nicht von bestimmten Methoden abhängig. Die Halbwert-zeit ist sehr hoch. Methodenwissen muss ständig an die aktuelle Entwicklung angepasst werden. In der Informatikhaben sich die entscheidenden Methoden alle 8-10 Jahre erheblich geändert. Werkzeugwissen ist methodenab-hängig. Werkzeuge haben in der Informatik oft nur eine Lebensdauer von 2-3 Jahren.

Page 7: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 7

ÜBERSICHT (vorl.)

0. Übersicht und Motivation

- ARIS als Rahmenkonzept

- Rahmenkonzept der Vorlesung

1. Einführung und Grundbegriffe

- Miniwelt – modellhafte Abbildung

- Information – was ist das?

- Aufgaben eines Informationssystems (IS)

- Daten in Informationssystemen

- Beispiele für Informationssysteme

2. E/A-Architektur und Zugriff

- E/A-Architektur von Informationssystemen

- Einsatz von Speicherhierarchien

- Datenstrukturen auf Externspeichern

- B-Bäume und B*-Bäume

- Informationssuche bei strukturierten Daten

3. Informationsmodelle

- Vorgehensweise bei DB-Entwurf und -Modellierung

- Entity-Relationship-Modell (ERM)

- Erweiterungen, insbes. Abstraktionskonzepte

• Generalisierung

• Aggregation und Assoziation

Page 8: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 8

ÜBERSICHT (2)

4. Grundlagen des Relationenmodells

- Konzepte des Relationenmodells (RM)

- Relationenalgebra

• Operationen

• Algebraische Optimierung

- Abbildung ERM → RM

5. Die Standardsprache SQL (SQL92) - Anfragesprache

- Datenmanipulation

- Datendefinition

- Abbildung von Beziehungen (Referentielle Integrität)

- Wartung von Beziehungen (Referentielle Aktionen)

6. Transaktionskonzept- Überblick über ACID-Eigenschaften

- Gewährleisten von Atomarität

- Sicherung der Datenintegrität

- Serialisierbarkeit und Synchronisation(Concurrency Control)

- Synchronisationsprotokolle: Überblick

- Aufgaben und Ziele der Fehlerbehandlung

Page 9: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 9

ÜBERSICHT (3)

7. Semistrukturierte Daten

- XML-Einführung

- Datenmodellierung mit XML

- Neue Sprachkonzepte

- Anfrageverarbeitung mit XPath und XQuery (Überblick)

8. Modellierung von Geschäftsprozessen- Anforderungen

- Geschäftsprozessmodellierung

- Modellierungsaspekte und -sprachen

- ARIS-Ansatz

9. Petri-Netze und Workflows- Elemente der Petri-Netz-Theorie

- Markierungssituationen und Ablaufstrukturen

- Systemklassen, Dynamische Eigenschaften

- Relationenmodell und Workflows

10. Workflow-Management

- Aspekte von Workflows

- Anforderungen an ein WfMS

- Funktionale Architektur eines WfMS

- Transaktionen und Workflows

Page 10: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 10

LITERATURLISTE

Baumgarten, B.: Petri-Netze – Grundlagen und Anwendungen, 2. Auflage, Spek-trum Akademischer Verlag, 1996

Elmasri, R., Navathe, S.: Grundlagen von Datenbanksystemen, 3., überarbeiteteAuflage, Pearson Studium, 2005

Faeskorn-Woyke, H., Bertelsmeier, B., Riemer, P., Bauer, E.: Datenbanksyste-me – Theorie und Praxis mit SQL2003, Oracle und MySQL, PearsonStudium, 2007

Kemper, A., Eickler, A.: Datenbanksysteme – Eine Einführung, 6. aktualisierte underweiterte Auflage, Oldenbourg Wissenschaftsverlag, 2006

Kemper, A, Wimmer, M.: Übungsbuch Datenbanksysteme, Oldenbourg Wissen-schaftsverlag, 2006

Korth, H.F., Silberschatz, A.: Database System Concepts, 3rd Edition, McGraw-HillBook Comp., New York, 1997

Kudraß, T. (Hrsg.): Taschenbuch Datenbanken, Fachbuchverlag Leipzig, 2007Lausen, G.: Datenbanken – Grundlagen und XML-Technologien, Elsevier, Mün-

chen, 2005Pernul, G., Unland, R.: Datenbanken im Unternehmen: Analyse, Modellbildung

und Einsatz, Oldenbourg-Verlag, 2001Saake, G., Sattler, K.-U., Heuer, A.: Datenbanken – Konzepte und Sprachen, 3.

Auflage, mitp, 2008Vossen, G.: Datenmodelle, Datenbanksprachen und Datenbankmanagement-

systeme, 5. Auflage, Oldenbourg Wissenschaftsverlag, 2008

ZEITSCHRIFTEN:

TODS Transactions on Database Systems, ACM Publikation (vierteljährlich)Information Systems Pergamon Press (6-mal jährlich)The VLDB Journal (vierteljährlich)Informatik - Forschung und Entwicklung (vierteljährlich)

TAGUNGSBÄNDE:

SIGMOD Tagungsband, jährliche Konferenz der ACM Special Interest Group onManagement of Data

VLDB Tagungsband, jährliche Konferenz „Very Large Data Bases“ IEEE Tagungsband, jährliche Konferenz „Int. Conf. on Data Engineering“GI Tagungsbände der Tagungen der Gesellschaft für Informatik, Tagungen inner-

halb des Fachausschusses 2.5 Informationssystemeund viele weitere Konferenzreihen

Page 11: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 11

Entwicklung von Informationssystemen

• Sicht auf den Themenbereich (nach Scheer)

- Was ist die Gesamtaufgabe?

- BWL-Anforderungen an die Weiterentwicklung der Informationstechnik

- IT eröffnet neue Möglichkeiten für BWL-Konzepte und -Anwendungen

BetriebswirtschaftlicheProblemstellung

Fachkonzept(Semantische Modelle)

DV-Konzept

TechnischeImplementierung

Informationstechnik

Abgleich zwischenSoll-Konzeptund Systemlösung

BWL und Wirtschaftsinformatik

Kerninformatik

Page 12: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 12

Entwicklung von Informationssystemen (2)

• Betriebliche Anwendungs- oder Informationssysteme

- Eigenentwicklungen von SW (zu teuer, nur noch < 20%)

- Einsatz integrierter Standard-SW (hat sich durchgesetzt)

- neuerdings: Ergänzung von speziellen Teilsystemen durch Componentware(es werden SW-Komponenten für bestimmte AW-Ausschnitte zu Anwen-dungssystemen „montiert“)

➥ Vielfalt (Wirrwarr) von Methoden mit starken Überlappungen

• Viele Informationssysteme sind heute Web-Applikationen

➥ Gesucht ist eine Methodologie (Lehre von den Methoden) für die Entwicklungsmethoden

• ARIS – Architektur integrierter Informationssysteme

- erlaubt die einzelnen Bausteine eines IS hinsichtlich ihrer Art, funktionalenEigenschaften und ihres Zusammenwirkens zu beschreiben

- will eine Methodologie als Rahmenkonzept bieten, die typische Fragen be-antworten helfen soll:

• Gibt es einen besten Weg bei der Entwicklung von IS?• Wo beginnt der Entwicklungsprozess und wo endet er?• Wieviel Stufen der Entwicklung sind erforderlich?

➥ Zielsetzung ist Einordnung und Bewertung von Methoden

e-Gov

e-M

edic

ine

B2Be-Commerce

B2C

Web-Engineering

e-Science

e-So

ciet

ye-Learning

Page 13: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 13

Entwicklung von Informationssystemen (3)

• ARIS verfolgt einen ganzheitlichen Beschreibungsansatz fürInformationssysteme

- Datenmodellierung: war Ausgangspunkt und ist aus Sicht von DBISimmer noch dominierender Aspekt

- Weitere Bereiche: Funktions-, Steuerungs- und Organisationssicht

- Beschreibungsebenen wollen alle Phasen des „Life Cycle“-Prozesses eines Informationssystems umfassen

• Analyse (weitgehend informell)

• Fachkonzept (formale Beschreibungssprachen)

• DV-Konzept (logische Konkretisierung)

• Implementierung (abstrakte Realisierung)

• Konkrete Realisierung (Systementwicklung, -evolution, -wartung)

• Vorgehensweise von ARIS

- Unterstützung der Beschreibung, Realisierung und Integration vonGeschäftsprozessen (engl. business process, synonym: Unternehmensprozess)

- Entwicklung eines Modells für Geschäftsprozesse

- Zerlegung dieses Modells in einzelne Sichten(wegen seiner hohen Komplexität)

- Konzept der unterschiedlichen Beschreibungsebenen

• von der betriebswirtschaftlichen Problemstellungbis zur rechnergestützten Realisierung

• umfasst Aufgaben der BWL und Wirtschaftsinformatikbis zur Kerninformatik

➥ ARIS will Informationssysteme zur Unterstützung von Geschäfts-prozessen ganzheitlich beschreiben

Page 14: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 14

ARIS als Rahmenkonzept

• Geschäftsprozess

ist eine Abfolge von Aktionen bzw. Interaktionen, die von Objekten bzw.zwischen mehreren Objekten durchgeführt werden und einem betriebli-chen Ziel dienen

- Objekte (Akteure), die Aktionen durchführen: Mitarbeiter, Kunden, Lie-feranten, aber auch technische Systeme (Anwendungssysteme)

- Durchführung von Aktionen: Erzeugung, Transformation und Verbrauchvon Objekten, die Materialien, Produkte, Informationen und allgemeineDienstleistungen sein können

• EPK-Modell zur Beschreibung von Geschäftsprozessen

- Ereignisgesteuerte Prozessketten (EPK)

- Beschreibungselemente

• EPK-Beispiel beschreibt typische Geschäftsabläufe des Beschaffungswesens

Funktion EreignisProzess-

wegweiserOrganisations-

einheitstyp

EntitätstypXOR

Page 15: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 15

EPK-Beispiel

Bestell.-anf.

Bestellung

Bestell- EinkaufanforderungBestellungs-bearbeitung

mit Lieferplanist erstellt

Lieferplan-abruf ist

übermittelt

XOR

XOR

Bestellung

Lieferplan

Bestell-anforderung

Fachab-Bestellan-

forderungs-bearbeitungteilung

Fertigungmit Fertigungs-

auftrag

Instand-haltungs-

abwicklung

Bedarf anMaterial istaufgetreten

Bestell.-anf.ist

erstellt

Bestellungist

angelegt

Freigabe vonEinkaufs-

Bestell-

Freigabe-

Bestellung

anforderung

kriterien

belegenEinkauf

EinkaufLieferplan-einteilung

XORWare ist

eingetroffen

Warenein-gangsbe-

Warenein-gang ist

arbeitung

gebucht

Bestellung

Rechnung

Zahlungs-anweisung

Rechnungs-bearbeitung

Rechnungs-prüfung

Zahlung istdurchzu-führen

AutomatischerRechnungs-

lauf

Fertigungmit Fertigungs-

auftrag

Lieferschein

Warenein-

Instand-haltungs--abwicklung

gangsbe-städtigung

Warenan-nahme

Einkaufsbelegist freigegebenu. übermittelt

Page 16: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 16

ARIS als Rahmenkonzept (2)

Dat

enträ

gers

yste

m

Dat

enDat

enst

rukt

ur

Dat

enm

odel

l

VER

WAL

TET

Anw

endu

ngs-

Funk

tion

Funk

tions

stru

ktur

FÜH

RT

AU

S

UN

TER

STÜ

TZT

softw

are

Ziel

stru

ktur

Unt

erne

h-m

ungs

ziel

DAT

EN

INP

UT

DAT

ENO

UTP

UT

LÖST

AU

SW

IRD

ER

ZEU

GT

ZUST

ÄND

IG

ZUG

RIF

FSR

EC

HT

Info

rma-

tions

mod

ell

UM

FAS

ST

Ste

ueru

ng

Leis

tung

sstru

ktur

Leis

tung

Out

putle

istu

ng

Funk

tion

Leis

tung

Inpu

tleis

tung

Org

astru

ktur

Org

anis

a-tio

nsm

odel

l

Org

anis

atio

nC

ompu

terh

ardw

are

Men

schl

iche

Arb

eits

leis

tung

Mas

chin

enre

ssou

rce

ZUG

EOR

DN

ET

ZUG

EOR

DN

ET

ZUG

EOR

DN

ET

Softw

are

als

Met

amod

ell:

Um

alle

Ges

chäf

tspr

ozes

se e

ines

Unt

erne

hmen

s st

euer

n zu

kön

nen,

bed

arf e

s an

fang

s kl

arer

Vors

tellu

ngen

und

Beg

riffe

für d

ie A

bläu

fe. D

as o

bige

Sch

ema

zum

Bei

spie

l ist

ein

e gr

obe

Vere

infa

chun

g de

s AR

IS-In

for-

mat

ions

mod

ells

. Das

AR

IS-M

odel

l hat

sic

h w

egen

sei

ner D

etai

ltief

e un

d O

ffenh

eit w

eltw

eit f

ür d

as P

roze

ss-M

anag

emen

t So

lche

Bes

chre

ibun

gen

fülle

n al

s D

etai

lzei

chnu

ngen

gan

ze R

äum

e au

s.du

rchg

eset

zt.

Page 17: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 17

ARIS als Rahmenkonzept (3)

• Idee von ARIS: Zerlegung in Sichten

- Organisationssicht: beschreibt die Mitarbeiter (menschliche Akteure)und ihre Organisationsstrukturen

- Datensicht: beschreibt die Daten und ihre Abhängigkeiten untereinan-der

- Funktionssicht (oder Aufgabensicht): stellt die Aufgaben in ihrer hie-rarchischen Abhängigkeitsstruktur (Aufgabe kann aus mehreren Tei-laufgaben bestehen) dar

- Steuerungssicht: integriert die in den anderen Sichten definierten Objekte in den Geschäftsprozess

• Veranschaulichung der Sichtenzerlegung von ARIS

• Erweiterung um Leistungssicht

- In neueren ARIS-Versionen werden noch die betrieblichen Leistungen (Produkte, Sachleistungen, Dienstleistungen) beschrieben

Organisation

Daten FunktionenSteuerung

Page 18: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 18

ARIS als Rahmenkonzept (4)

• ARIS: Abstakte Beschreibung der Vorgehensweise

- Zerlegung in verschiedene Sichten

- Verfeinerung durch unterschiedliche Beschreibungsebenen

• Einteilung in Sichten ist abhängig von der Zielsetzung

- ARIS beschreibt mehr die BWL-Sichtweise, während wir mehr die Informatik-Sichtweise der Entwicklung von Informationssystemen betonen wollen

- Einheiten der Organisations- und Leistungssicht werden deshalb als Aus-schnitte der Datensicht verstanden

- Die Leistungssicht wird ersetzt durch eine Sicht der SW-Architekturen zur Be-reitstellung von Rechnerplattformen, Prozessen und Infrastrukturen zur Rea-lisierung von Informationssystemen

- Anstelle der Organisationssicht führen wir (um das Haus mit Dach beizube-halten) eine Anwendungssicht ein, welche die Zuordnung der Aufgaben inder Unternehmenshierarchie charakterisiert

Daten Steuerung Funktionen

Organisation

Leistung

Fachkonzept

DV-Konzept

Implementierung

Page 19: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 19

Rahmenkonzept für die Vorlesung

• Zuordnung der Themen der Vorlesung

• GBIS-Rahmen ist Wegweiser durch die Vorlesung

- Zerlegung in Sichten

- Verfeinerung durch hierarchische Beschreibungsebenen

- Ergänzung durch Anwendungssicht als „Dach“

➥ Zuordnung enthält unsere Interpretation der Sichten und ihrer Aufgaben, Zusammenspiel von 5 Aspekten: W5-Modell

Daten Steuerung Funktionen

Anwendung

SW-Architektur

strategische,

planende und kontrollierende,

administrative und operationale Aufgaben

Systemarchitekturen: Client/Server-Modelle, Schichtenmodelle

Datenarten, E/A-Architektur und Zugriffsverfahren

Netze / Rechner / Prozesse / Speicher: physische Sicht

ER-Modellierung

Relationen-modell

SQL

Ereignis-Prozess-Ketten

Petri-Netze

relationaleDB-Abbildung

ObjektorientierteAnalyse (OOA)

ObjektorientierterEntwurf (OOD)

ObjektorientierteProgr.-Sprachen

(Java)

Klassifikation der Aufgaben und ihre Zuordnung zurbetrieblichen Organisation

realisiert durchAnwendungs- und Informationssysteme

(BWL-Aufgaben)

Transaktions-konzept

Page 20: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 20

Rahmenkonzept für die Vorlesung (2)

• Vertiefende Vorlesungen (Beispiele)

- Unterscheidung nach Beschreibungsebenen ist hier nicht sinnvoll

- Zuordnung zu den einzelnen Sichten steht im Vordergrund

Daten Steuerung Funktionen

Anwendung

SW-Architektur

Datenbank-anwendung

Realisierungvon DBS

Middleware fürheterogene und

Transaktions-systeme

Middleware für heterogene und verteilte IS

Komponenten-basierteSW-Entwicklung

AW-Klassen:Data Warehouse, Data Mining

Digitale Bibliotheken

. . .

. . .

Mobile Computing

E-Business-Anwendungen

. . .

Neuere Entwicklungenfür Datenmodelle

Geschäfts-prozess-modellierung

Verteilte undParallele DBS

verteilte IS

Page 21: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 21

DBS als Kern von Informationssystemen

• Kern der Vorlesung

- Modellierung, Verwaltung und Sicherung von strukturierten Daten (Sätze)

- Es gibt verschiedenartige Datenmodelle und die sie realisierenden DBS

• relational und objekt-relational (RDBS/ORDBS auf Basis von SQL)

• hierarchisch (DBS nach dem Hierarchiemodell)

• netzwerkartig (DBS nach dem Codasyl-Standard)

• objektorientiert (OODBS)

- Verarbeitung von semi- oder unstrukturierten Daten

• Bezugspunkt ist ein Schichtenmodell

- Erklärung der Abläufe im DBS

- Verfeinerung der Sichtweise in späteren Vorlesungen

Speichersystem

Datensystem

deskriptive AnfragenZugriff auf Satzmengen

Satzzugriffe

Seitenzugriffe

Übersetzung und Opti-mierung von Anfragen

Verwaltung von physischen Sätzen und

DB-Puffer- und Extern-speicher-Verwaltung

Zugriffspfaden

DB

Aufgaben der Art der Operationen an der SchnittstelleSystemschicht

Zugriffssystem

Page 22: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 22

DBS als Kern von Informationssystemen (2)

• Wie sieht der Herstellermarkt aus?

• Verteilung von DBS und Dateien

• Künftige DBS

- Aufstellung berücksichtigt nur strukturierte Daten. 85% der weltweit verfügbaren Daten aber sind semi- oder unstrukturiert (Internet, wiss. Aufzeichnungen und Experimente usw.)

- SQL-XML-DBS, XML-SQL-DBS, native XML-DBS

Source: Gartner Dataquest (May 2005)

Marktanteile in %

34,1

33,7

20

2,9

2,3 6,6

IBMOracleMicrosoftNCR TeradataSybaseOthers

Source: Gartner Dataquest (May 2005)

Marktanteile in %

34,1

33,7

20

2,9

2,3 6,6

IBMOracleMicrosoftNCR TeradataSybaseOthers

100 %

80 %

60 %

40 %

20 %

0 %1990 1995 2000

OODBS

RDBS/ORDBS

Cod. DBS

Hier. DBS

Flache Dateien

2005

Einsatzverteilung

Page 23: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 23

Evolution und Historie

1960

1970

1980

1990

2000

XML

Sem

i-Str

uctu

red

Obj

ect-R

elat

iona

l

Obj

ect-O

rient

ed

Rel

atio

nal

Net

wor

k

Hie

rarc

hica

lRelational Data Model

CODASYL Standard

SQLEntity-Relationship Model

SQL-86

ODMG 1.0OM Data Model

SQL: 1999XML

ODMG 3.0

Page 24: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 24

Ein weiteres Paradigma –„Alles fließt (panta rhei)3“

• Vertauschte Rollen

- statt Auswertung von gespeicherten Daten Filterung, Verknüpfung undTransformation von Datenströmen

- zentrale Bedeutung für die individuelle Informationsversorgung, insbeson-dere bei einer immer weiter fortschreitenden Verwendung vieler kleiner unddamit mobiler Endgeräte

• Wichtige Unterschiede

3. fälschlicherweise Heraklit zugeschriebene Formel für sein Weltbild

Eigenschaft Datenbankbasierte Informationssysteme Subskriptionssysteme

Verarbeitungs-charakteristik

zustandsorientiert(globaler Zustand)

konsumorientiert(evtl. lokaler temporärer Zustand)

Anfragesemantik isolierte Anfrage stehende Anfragen(‘standing query’)

Zugriffscharakteristik systemzentriert(‘row-set-model’)

dokumentenzentriert(‘document-model’)

Auswertungssemantik komplexe Analysen informativ,Auslöser detaillierter Analysen

Schemaaspekt Existenz eines globalen Schemas

Zugriff auf lokale Schemata der partizipierenden Datenquellen

Anfrage ErgebnisDatenbank-system

Daten

Daten Subskriptions-system

Subskriptionen- Anfragen- Auslieferungs-

bedingungen

Ergebnis

Page 25: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 25

Was sind Data-Warehouse-Systeme?

Die Zielvorgabe für ein „Data Warehouse“ ist es, die im Unternehmen vorhandenen (und even-tuell noch aufzubauende) Datenbestände dem Endbenutzer so bereitzustellen, daß diesernicht nur einen vorgegebenen Blickwinkel (durch Programme realisiert) auf diese Daten ein-nehmen kann. Das bedeutet, daß sowohl der Datenbestand selbst als auch die benutztenWerkzeuge flexibel genug sein müssen, um alle anfallenden Fragestellungen zu beantworten.

Ein oft dargestelltes Beispiel solcher Blickwinkel ist der Absatz von verschiedenen Waren-gruppen, in verschiedenen Märkten unter Berücksichtigung der Zeit. Es ergibt sich damitfolgender 3-dimensionaler Datenbereich.

Damit können nun unterschiedliche Fragen direkt beantwortet werden:

Für den Marktleiter: Wie entwickelt sich Warengruppe X in meinem Markt im Zeitraum [Anfang, Ende]?

Für den Warengruppenmanager: Welche Absatzverteilung auf Märkte bezogen gibt es für meine Warengruppe im Zeitraum [An-fang, Ende] (dargestellte Ebene in der Abbildung)?

Für den Finanzvorstand: Wie entwickelt sich das Umsatzergebnis (als Summe über alle Märkte und alle Warengruppen)über die Zeit?

Die Analogie zum Warenhaus ist also dahingehend zu interpretieren, daß der Anwender durchdie „Datenangebote“ geführt wird und die für ihn relevanten Informationen einfach „mitnehmen“kann. Neben bereits dargestellten verschiedenen Blickwinkeln ergibt sich innerhalb derDimensionen auch noch die Notwendigkeit einer Hierarchisierung: Beispielsweise kann dieWarengruppendimension auf artikelgenaue Informationen verfeinert oder aber auf Sortiments-bereiche vergröbert werden.

Zeit

Warengruppe

Märkte

Page 26: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 26

Aufbau eines Data Warehouse

Extraktion/Transaktion

Extraktion/Transformation

Extraktion/Transaktion

Datenzugriff

Monitoring

Extraktion/Transaktion

Extraktion/Transaktion

Met

adat

en/R

epos

itory

OLT

P-

Syst

eme op

erat

iona

leD

aten

Dat

a W

areh

ouse

als

Dat

enba

nkB

eric

hte/

Ana

lyse

n

OLA

P

Dat

a M

inin

g

Page 27: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 27

Begriffe

• Viele Namen, die nicht alle gleiche Bedeutung besitzen:

- Data Mining, Knowledge Discovery, Business Intelligence, Data Exploration, Pattern Recognition, Information Retrieval, Knowledge Management, ...

• Dies ist unsere Sicht:

- Knowledge Discovery ist ein Prozeß zu Suche oder Erzeugung von Wissen aus großen Datenmengen. Seltener wird dazu auch der Begriff Data Exploration benutzt.

- Eine Phase dieses Prozesses, Pattern Generation genannt, generiert relevante Informationen. In unserem Falle ist diese Phase gleichbedeutend mit Data Mining, hier kann aber auch z.B. Online Analytical Processing (OLAP) angesiedelt sein.

- Business Intelligence bezeichnet den Einsatz von Knowledge Discovery im Unternehmen, um ökonomischen Nutzen zu erzielen.

- Der Begriff Pattern Recognition wird eher in anderen Disziplinen wie Kl (Bildverstehen) und Naturwissenschaften (z.B. bei Informationssystemen für Biochemie und Geographie (GIS)) verwendet, obwohl es sich hierbei im Prinzip auch um Knowledge Discovery handelt.

- Information Retrieval ist gleichbedeutend mit Data Exploration, wird aber eher für textorientierte Informationen benutzt (Such-Maschinen, „Text-Mining“).

- Knowledge Management umfaßt u. a. auch Knowledge Discovery. Im Vordegrund steht aber die Verwaltung von Wissen, damit es auch in Zukunft den Mitgliedern einer Organisation in geeigneter Weise (Geschwindigkeit, Qualität, Kosten, etc.) zur Verfügung steht.

Page 28: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 28

Data Mining – Anwendungsmöglichkeiten

• Anwendungstyp (Fragestellung, Problem) bestimmt wesentlich die Art der Technik

- Aufdeckung von Kreditkartenmißbrauch

- Neues Layout eines Supermarktes

- Einteilung von Versicherungskunden in Risikoklassen

- Vorhersage/Risikoabschätzung bei Therapien

- Zielgruppen-Marketing

- Kunden-Ranking (Umsatzschätzung)

- Abschätzung der Kreditwürdigkeit von Kunden

- . . .

• Generelles Ableitungsproblem bei unscharfer/unsicherer Information

- Semantic Web will Information beispielsweise durch automatische Schlussfolgerungen ableiten

- Natural-language reasoning?

- This law is known as the fundamental law on consultants pricing!

As we all know from elementary physics courses in high school:

(1) Power = Work / TimeAlso each able manager is well aware, that

(2) Knowledge = Power (3) Time = Money

Applying (2), (3) to (1) we get (4) Knowledge = Work / Money

And finally(5) Money = Work / Knowledge

Page 29: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 29

3 künftige Schwerpunktthemen: Semantik4, ...

• Ziele der DB-Entwicklung

- letzte 20 Jahre: Leistung, Verfügbarkeit, Funktionalität

- nächste 20 Jahre: Semantik (wir erreichen aber immer nur etwas mehr!)

• Von der Gleichheit zur Approximation! Konzept der Ähnlichkeit: viele Formen, Interpretationen, Applikationen

- Information Retrieval, Geo-Datenbanken

- Klassifikation, Clusteranalyse (Data Mining)

- Mustererkennung, Fallbasiertes Schließen, …

• Suche nach „Politiker“ als Begriff in einer Anfrage

• Oft implizite Annahme: Standardisiertes (Meta-)Schema

- für alle Datenquellen vorhanden und

- vollständig,

- korrekt,

- konsistent,

- mit wahren und

- vertrauenswürdigen Inhalten

4. Douglas R. Hofstadter: „Wo die Bedeutung sitzt“ in : Gödel, Escher, Bach – ein Endlos Geflochtenes Band,Klett-Cotta, 1985

10

Unsicherheitsbereich bei Ähnlichkeitsproblemengenügendungenügend weiß nicht

α β

Politiker

Volksvertreter

Abgeordneter

PolitischerM

ensch

Politischinter. Bürger 10

Unsicherheitsbereich bei Ähnlichkeitsproblemengenügendungenügend weiß nicht

α β 10 10

Unsicherheitsbereich bei Ähnlichkeitsproblemengenügendungenügend weiß nicht

α β

Politiker

Volksvertreter

Abgeordneter

PolitischerM

ensch

Politischinter. Bürger

Page 30: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 30

Suchen im Web

• Erfassung, Analyse und Indexierung von Web-Dokumenten

WWW

Web Surfing:In Internet-Cafes mit oderohne ...

Dokumente

„Crawling”

Extraktion vonrelevanten Wörtern

SurfingInternetCafes

...LinguistischeMethoden:

Stammbildung

SurfInternet

Cafe...

Konstruktionvon gewichteten

Termen(weighted features)

Surf, WelleInternet, WWW

Cafe, Bistro...

Indexierung

Thesaurus(Ontologie)

Synonyme,Ober-, Unter-

begriffe

Index(B*-Baum)

Bistro Cafe ...

URLs

Ontologie ist ursprünglich eine philosophische Disziplin, neuerdings ein Modebegriff der Informatik. Meyers Enzyklopädisches Lexikon führt Ontologie als „Lehre von dem Wesen und den Eigenschaften des Seienden”. In der Informatik ist sie die „formale Spezifikation eines Gegenstandsbereichs in Form eines Begriffssystems”.

Page 31: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 31

Verbesserung der Web-Suche

• Web-Wachstum

- täglich: + >1 Mio. Webseiten

- Web verknüpft durch n Mrd. Hyperlinks

➥ Wegen des rasanten und chaotischen Wachstums ist dasWeb so gut wie strukturlos (globales Spaghettiknäuel)

• Jeder darf Webseiten erzeugen, unabhängig von

- Herkunft, Bildung, Kultur, Interesse, Motivation

- Sprache, Dialekt, Stil, ... sind nicht festgelegt

- Webseite (n bis n ⋅ 105 Zeichen) kann Wahrheit, Lüge, Weisheit, Propaganda oder schlichten Unsinn enthalten

• Wie findet man die „besten Seiten“ zum Thema X?

- Suche nach »Flugzeug« → > 7.550.000 Seiten

- Suche nach »Air Nepal« → ~ 13.000 Seiten

- Suche nach »Air Nepal Kathmandu« → 1 Seite

- Suchmaschinen (Yahoo!, AltaVista, HotBot, Lycos, Infoseek, Excite, ...) ord-nen Webseiten nach Wichtigkeit mit Hilfe von sog. Rangfunktionen

• Rangfunktionen beruhen auf Faustregeln (Heuristiken) • Einfache Heuristik: Zählen, wie oft der Suchbegriff in der Seite vorkommt

(Auftreten am Anfang der Seite wird stärker bewertet als in der Mitte oderam Ende)

• Verfeinerung: Wörter im Titel, in Überschriften oder in Großdruck bekom-men größeres Gewicht

➥ Viele Tricks (Spamming): „Billige Flüge Billige Flüge Billige Flüge“ oderWiederholung von Phrasen in unsichtbaren Schriftgrößen und Farben

Page 32: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 32

Verbesserung der Web-Suche (2)

• Annahmen und Rangbildung von Suchmaschinen fragwürdig

- In relevanten Seiten steht nicht immer der entscheidende Suchbegriff, während andere, die ihn enthalten, vollkommen irrelevant sind

- Synonyme (verschiedene Wörter mit gleicher Bedeutung)Auto, Kfz, Kraftfahrzeug, Personentransportmittel (spezieller: PKW, Bus, ...)

- Polyseme (verschiedene Bedeutungen für dasselbe Wort)Jaguar – Wildkatze (Raubtier), Auto, Football-Mannschaft

• Verbesserte Verfahren

- Einsatz semantischer Netze (Projekt: Word-Net)Zu „Kfz“ wird das Synonym „Auto“ gefunden. Es werden alle Webseiten gesucht, in denen mindestens eines der Wörter vorkommt!

➥ Verschärfung des Polysemproblems

➥ Lösung des Synonymproblems unbefriedigend: Web kennt keine Sprachgrenzen: Aufbau und Wartung eines vollständigen undkulturübergreifenden semantischen Netzes?

- Ausnutzung der Hyperlinks zur Verbesserung der Suche

• Weitere Schwierigkeiten bei der Suche

- „Harvard“ kommt in > Mio. Webseiten vor; auf der Homepage von Harvardist der Begriff für Suchmaschinen „uninteressant“

- auf der Homepage von „IBM“ kommt der Begriff Computer nicht vor

➥ Bei manchen Suchmaschinen werden solche Probleme manuell gelöst: Die „Harvard“-Seite kommt an die Spitze der Liste für „Harvard“.Aber: Handverlesene Seiten bei einer unbegrenzten Anzahl von Fragen?

Google's mission is to make the world's information universally accessible and useful.

Page 33: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 33

Wie hängt das alles zusammen?

• Klassische Transaktionsverarbeitung

• Client/Server-Interaktion

Transaktionssystem

UPDATE accountsSET balance = balance - 3WHERE A# = 03874;

17

0387

4

# balance

OKEOT

BOT

14

Tran

sakt

ions

-Pr

ogra

mm

e

Datenbanksystem

Karte ?PIN ?Konto ?BuchungAusgabe

Transaktionssystem

UPDATE accountsSET balance = balance - 3WHERE A# = 03874;

UPDATE accountsSET balance = balance - 3WHERE A# = 03874;

17

0387

4

# balance

0387

4

# balance

OKOKEOTEOT

BOTBOT

14

Tran

sakt

ions

-Pr

ogra

mm

e

Datenbanksystem

Karte ?PIN ?Konto ?BuchungAusgabe

Start.jsp

QueryOut.jsp

QueryIn.jsp

CloseConnection.jsp ExitServlet

ConnectionServlet

SchemaInformation.jsp

QueryServlet

Client Web-Server DB-Server

Start.jsp

QueryOut.jsp

QueryIn.jsp

CloseConnection.jsp ExitServlet

ConnectionServlet

SchemaInformation.jsp

QueryServlet

Client Web-Server DB-Server

Page 34: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 34

Wie hängt das alles zusammen? (2)

• Architektur von Web-Applikationen

- klassische Schichtenarchitektur (3-tier)

- Zusammenstellung von wichtigen Sprachen, Protokollen, Komponentenusw.

- Client/Server- und Web-Applikationen werden nicht in dieser Vorlesung be-handelt

- Sie sind Gegenstand von Vertiefungsvorlesungen und Praktika

DesktopWeb-BrowserHTML, CSS, DOM,

Scripts, etc.ActiveXcontrols

Middle Tier

Client Tier

Backend Tier(EIS)

HTTP/SOAP

IIOP, RMI, TCP/IP, ...

SSIASPCGI,

PHP,SSJS

ODBC, JDBC, JDO, SQLJ, ...

Applications

FCGI,WAI

Applets

COM, ActiveXCORBA

legacysystems

filesystem

CAxSCMERP

<xml/>

OODBSORDBSPDM

Web-Server

Servlet, JSP

EJB

DesktopWeb-BrowserHTML, CSS, DOM,

Scripts, etc.ActiveXcontrols

Middle TierMiddle Tier

Client TierClient Tier

Backend Tier(EIS)

HTTP/SOAP

IIOP, RMI, TCP/IP, ...

SSIASPCGI,

PHP,SSJS

ODBC, JDBC, JDO, SQLJ, ...

Applications

FCGI,WAI

Applets

COM, ActiveXCORBA

legacysystemslegacy

systemsfile

systemfile

systemCAxCAxSCMSCM

ERPERP<xml/>

OODBSORDBS

<xml/><xml/>

OODBSOODBSORDBSORDBSPDM

Web-Server

Servlet, JSP

EJB

Servlet, JSPServlet, JSP

EJBEJB

Page 35: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 35

Zum Nachdenken –Wie viele Informationen gibt es auf der Welt?5

• Was ist überhaupt Information?

- schwierige Abgrenzung, individuelle Bewertung

- Was wird aufgezeichnet, was lohnt sich aufzuheben?

- Redundante Information (Exemplare eines Buchs, Kopien eines Films) wirdhier ausgeschlossen

- Nicht alle Daten, die weltweit durch Sensoren, Mess- und Aufnahmegerätenusw. (Experimente, Überwachung, ...) erzeugt werden, führen zu relevantenInformationen (in unserem Sinne)

• Annahme

- Um alle relevanten Informationen aufzuheben, genügt die Speicherung vonwenigen Tausend PBytes6

- Die Produktion von Magnetplatten und -bändern hat diese Speicherkapazitätbereits um das Jahr 2000 erreicht

• Behauptung: In wenigen Jahren

- sind wir in der Lage, „alles“ aufzuheben, d. h., keine Information muss weggeworfen werden

- werden die „typischen“ Informationen nur noch von Rechnern aufbewahrt,gesucht und aufbereitet; der Mensch sieht weder die Daten, noch kennt erden Aufbewahrungsort und die genauen Ableitungsverfahren.

5. http://www.lesk.com/mlesk/ksg97/ksg.html6. 1 Gigabyte (GByte) = 1.000 Megabytes = 109 Bytes

1 Terabyte (TByte) = 1.000 Gigabytes1 Petabyte (PByte) = 1.000 Terabytes1 Exabyte (EByte) = 1.000 Petabytes1 Zettabyte (ZByte) = 1.000 Exabytes1 Yottabyte (YByte) = 1.000 Zettabytes

Page 36: Informationssysteme - TU Kaiserslautern€¦ · 0 - 3 Betriebliche Informationssysteme1 Betriebliche Informationssysteme spiegeln die Geschäftsmodelle von Unternehmen wider und dienen

0 - 36

Schlussfolgerungen

• Es wird genug Platten- und Bandspeicher geben, um alles zu speichern,was alle Menschen schreiben, sagen, tun oder photographieren.

- Für das Schreiben gilt dies bereits heute

- In einigen Jahren trifft das auch für die restlichen Informationen zu

- Wie lange wird es noch dauern, bis alle VITA-Dokumente eines Menschen als Lebensgeschichte aufgezeichnet werden können?

• Rechner speichern und verwalten Informationen besser und effektiverals Menschen

- Nach dem Jahr 2000 werden viele Platten und Kommunikationsverbindun-gen direkt Informationen aus Rechner-zu-Rechner- und nicht mehr (nur) ausMensch-zu-Mensch-Kommunikation speichern

- Wie lange wird es noch dauern, bis der Mensch die meiste gespeicherte In-formation gar nicht mehr zu sehen bekommt?

- Wir müssen lernen, wie alles automatisch ausgewertet werden kann undwas bei unserer knappen Zeit unserer besonderen Aufmerksamkeit bedarf.

• Künftige Entwicklung

- Heute konzentriert man sich bei den „Digitalen Bibliotheken“ auf die Einga-be: auf das Scanning, Komprimieren und OCR von Informationen.

- Morgen wird anstelle der Eingabe die „relevante Auswahl“ die wesentlicheRolle spielen: Selektion, Suche und Qualitätsbewertung von Informationen

➥ Wir können eine reale „World Encyclopedia“ mit einem echten „pla-netary memory for all mankind“ aufbauen, wie H.G. Wells bereits1938 in seinem Buch „World Brain“ geschrieben hat!