24
Wege aus dem Daten-Chaos Von der Datenspeicherung zum Wissensmanagement Fragestellungen, Begriffe und Technische Konzepte Ein Unternehmen der ExperTeam-Gruppe Pallas GmbH HermülheimerStraße 10 50321 Brühl Emil-Figge-Straße 85 44227 Dortmund [email protected] http://www.pallas.com DLR Workshop 16.05.2002 Hans-Gerd Schaal Geschäftsführer 23.05.2002 © Pallas GmbH Die Geschäftsbereiche der Pallas GmbH Knowledge- Consulting Pallas Intelligence Enterprise Knowledge-Portals E-Learning Pallas Performance High Performance Application High Performance Tools Performance Consulting Pallas Security Security Center App. Service Providing Security Consulting

Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

1

Wege aus dem Daten-Chaos

Von der Datenspeicherung zum WissensmanagementFragestellungen, Begriffe und Technische Konzepte

Ein Unternehmen der ExperTeam-Gruppe

Pallas GmbHHermülheimerStraße 1050321 Brühl

Emil-Figge-Straße 8544227 Dortmund

[email protected]://www.pallas.com

DLR Workshop

16.05.2002

Hans-Gerd SchaalGeschäftsführer

23.05.2002 © Pallas GmbH

Die Geschäftsbereiche der Pallas GmbH

Knowledge-Consulting

Pallas Intelligence

Enterprise Knowledge-Portals

E-Learning

Pallas Performance

High Performance Application

High Performance Tools

PerformanceConsulting

Pallas Security

Security CenterApp. Service Providing

Security Consulting

Page 2: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

2

23.05.2002 © Pallas GmbH

Von der Datenspeicherung zum Wissensmanagement

n Aktuelle Herausforderungen

n Von Daten zum Wissen

– Historische Perspektive– Konzeptionelle Perspektive

– Technologische Perspektive

n Überblick über wichtige Konzepte

– Datawarehouse

– PDM

– Data-Mining– Knowledge-Discovery

– Semantic Web

n Ausblick

23.05.2002 © Pallas GmbH

Daten-Chaos: Die Herausforderung

„Informationsflut ist ein Teil der Tragödie der Kultur des modernen Menschen“Georg Simmel 1858 –1918

Alle klagen über zu viel an Informationen, keiner fühlt sich gut informiert.

Reich an Daten, arm an Information.

Wenn Ihre Organisation wüsste, was sie alles wissen?

Page 3: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

3

23.05.2002 © Pallas GmbH

Aus dem Datenchaos entwickelt sich zunächst ein Begriffschaos

Data Marts

Data Warehouse

EISBalanced Scorecard

DBMS

PDM

KnowledgeDiscovery

Business-Intelligence

Web Mining

Wissens-Management

Semantic Web

Information Retrieval

DesicionSupport

Portal

PLMWissensnetze

23.05.2002 © Pallas GmbH

Technologie-Basiert

Daten, Informationen, Wissen...bilden eine Wertschöpfungskette

komplex

unstrukturiert

Bedeutungsgehalt

Kontextbezogen

(Personenabhängig)

einfach

Strukturiert

Ohne Bedeutung

Kontextunabhängig

Personenunabhängig

Zeichen - Werte - Fakten - Zusammenhänge - Muster – Prinzipien - Erfahrung

EntscheidenHandeln

Einsicht

Unternehmens-Intelligenz

Daten

Informationen

Wissen

Wert/Nutzen

Page 4: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

4

23.05.2002 © Pallas GmbH

Wertsteigerung durch Informationstechnologieheißt Semantik mit Computern beherrschen

Daten

Informationen

WissenWert/Nutzen

generieren

extrahieren

verstehen

bereitstellenfinden

speichern

verteilenTechnologie-Basiert

23.05.2002 © Pallas GmbH

Treiber für die Entwicklung von Konzepten und Technologien

ExponentiellesDatenwachstum

Wettbewerbs-Druck

Zunehmende Bedeutung von

Information

Globalisierung

Auslöser

Automatisierung

Integration

Prozess-Orientierung

Qualität

Wissens-Gewinnung

Standardisierung

Treiber

Time toMarket

Qualitäts-Steigerung

Ergebnis-Steigerung

Kosten-einsparung

Ziele

Strategie-entwicklung

Page 5: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

5

23.05.2002 © Pallas GmbH

Vom Daten zum Wissensmanagement aus historischer Perpektive...

Wissens -management

Intelligence-Orientierung

Informations-management

Daten-management

Informationals Ressource

Technologie-Entwicklung &Automation

Funktions -orientierung

Transaktion &Integration

Datenbank-administration

Prozess &Standardisierung

Daten-modellierung

TransparenzFlexibilitätQualität

1960 1970 1980 1990 2000 2010

Treiber

In Anlehnung an Dippolt et al. Unternehmensweites Datenmanagement 2001

23.05.2002 © Pallas GmbH

Der Weg zum Wissensmanagement führt nur über das Daten und Informationsmanagement

Daten-Management

Informations-Management

Wissens-Management

Erfolgreiches Wissensmanagement setzt ein effizientes Daten- und Informations-Management voraus

Page 6: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

6

23.05.2002 © Pallas GmbH

Intelligence-Portfolio

Wissensredaktion

Communities

Konferenzen

„Kultur-Entwicklung“

Intelligente Agenten

Semantic Web

Foren, eMeetings

Collaboration

E-Mail

Pull / Push Technologie

Balanced Scorecard

Reporting

Verteilen & Kommunizieren

Implizit

Human Ressource

Explizit

E-Learning

Internet/IntranetDMS-SystemeArchiv -Systeme

Web-Mining

Text-Mining

Case Based Reasoning

Retrieval

...Qualitativ...Unstrukturiert

...Wissen

Intellectual Capital

Organizational Memory

Abteilungen / Teams

Mitarbeiter

Innovations -Mgt.

Personal-Mgt.

Organisations-entwicklung

Data Mining

OLAPMIS, EIS, DSS

Kennzahlenanalyse

Entwickeln & Entdecken

QuantitativStrukturiert...

Daten...

Data Warehouse

PDM

Operative Systeme (OLTP)

Speichern &

Bereitstellen

... Informationen ...

42 %58%

Delphi-Studie

Verdopplungalle 18 Monate

88% sind nicht perSearch-Engine auffindbar

23.05.2002 © Pallas GmbH

Intelligence-Portfolio

Wissensredaktion

Communities

Konferenzen

„Kultur-Entwicklung“

Intelligente Agenten

Semantic Web

Foren, eMeetings

Collaboration

E-Mail

Pull / Push Technologie

Balanced Scorecard

Reporting

Verteilen & Kommunizieren

Implizit

Human Ressource

Explizit

E-Learning

Internet/IntranetDMS-SystemeArchiv -Systeme

Web-Mining

Text-Mining

Case Based Reasoning

Retrieval

...Qualitativ...Unstrukturiert

...Wissen

Intellectual Capital

Organizational Memory

Abteilungen / Teams

Mitarbeiter

Innovations -Mgt.

Personal-Mgt.

Organisations-entwicklung

Data Mining

OLAPMIS, EIS, DSS

Kennzahlenanalyse

Entwickeln & Entdecken

QuantitativStrukturiert...

Daten...

Data Warehouse

PDM

Operative Systeme (OLTP)

Speichern &

Bereitstellen

... Informationen ...

Page 7: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

7

23.05.2002 © Pallas GmbH

Intelligence-Portfolio

Wissensredaktion

Communities

Konferenzen

„Kultur-Entwicklung“

Intelligente Agenten

Semantic Web

Foren, eMeetings

Collaboration

E-Mail

Pull / Push Technologie

Balanced Scorecard

Reporting

Verteilen & Kommunizieren

Implizit

Human Ressource

Explizit

E-Learning

Internet/IntranetDMS-SystemeArchiv-Systeme

Web-Mining

Text-Mining

Case Based Reasoning

Retrieval

...Qualitativ...Unstrukturiert

...Wissen

Intellectual Capital

Organizational Memory

Abteilungen / Teams

Mitarbeiter

Innovations -Mgt.

Personal-Mgt.

Organisations-entwicklung

Data Mining

OLAPMIS, EIS, DSS

Kennzahlenanalyse

Entwickeln & Entdecken

QuantitativStrukturiert...

Daten...

Data Warehouse

PDM

Operative Systeme (OLTP)

Speichern &

Bereitstellen

... Informationen ...

23.05.2002 © Pallas GmbH

Intelligence-Portfolio

Wissensredaktion

Communities

Konferenzen

„Kultur-Entwicklung“

Intelligente Agenten

Semantic Web

Foren, eMeetings

Collaboration

E-Mail

Pull / Push Technologie

Balanced Scorecard

Reporting

Verteilen & Kommunizieren

Implizit

Human Ressource

Explizit

E-Learning

Internet/IntranetDMS-SystemeArchiv -Systeme

Web-Mining

Text-Mining

Case Based Reasoning

Retrieval

...Qualitativ...Unstrukturiert

...Wissen

Intellectual Capital

Organizational Memory

Abteilungen / Teams

Mitarbeiter

Innovations-Mgt.

Personal -Mgt.

Organisations-entwicklung

Data Mining

OLAPMIS, EIS, DSS

Kennzahlenanalyse

Entwickeln & Entdecken

QuantitativStrukturiert...

Daten...

Data Warehouse

PDM

Operative Systeme (OLTP)

Speichern &

Bereitstellen

... Informationen ...

In Anlehnung an Grothe/Gentsch Business Intelligence 2000

Page 8: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

8

23.05.2002 © Pallas GmbH

Intelligence-Portfolio

Wissensredaktion

Communities

Konferenzen

„Kultur-Entwicklung“

Intelligente Agenten

Semantic Web

Foren, eMeetings

Collaboration

E-Mail

Pull / Push Technologie

Balanced Scorecard

Reporting

Verteilen & Kommunizieren

Implizit

Human Ressource

Explizit

E-Learning

Internet/IntranetDMS-SystemeArchiv -Systeme

Web-Mining

Text-Mining

Case Based Reasoning

Retrieval

...Qualitativ...Unstrukturiert

...Wissen

Intellectual Capital

Organizational Memory

Abteilungen / Teams

Mitarbeiter

Innovations -Mgt.

Personal-Mgt.

Organisations-entwicklung

Data Mining

OLAPMIS, EIS, DSS

Kennzahlenanalyse

Entwickeln & Entdecken

QuantitativStrukturiert...

Daten...

Data Warehouse

PDM

Operative Systeme (OLTP)

Speichern &

Bereitstellen

... Informationen ...

23.05.2002 © Pallas GmbH

PDM / EDM Integration der Engineering-Daten während des Produktlebenszyklus

Erweiterte EDMS-Definition ( nachPloenzke)

PDMS

PLMS

Page 9: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

9

23.05.2002 © Pallas GmbH

Durchgängige Nutzung und Verteilung von Engineering-Daten bietet hohe Rationalisierungspotentiale

n Simultaneous-Engineering-Prinzip führt zu verbessertem Informationsfluss in der gesamten Vorgangsbearbeitung

n Integration bereichsübergreifender Abläufe und Zusammenarbeit n Standardisierung und erhöhte Wiederverwendung von Produkten n Steigerung der Entwicklungsqualität:

– Wiederverwendungsgrad ca. 70% – 20% der Arbeitszeit für die Konstruktion von Produkten – 35% für die Suche nach Daten

n Ideale Einsparungsmöglichkeiten:– Dokumentenmanagement (ablegen, anfordern, verteilen)– Freigabe, Prüfung, Änderungsmanagement, – Klassifikation, Daten und Dokumente suchen– Projektplanung, -verfolgung, -controlling

Quelle: www.irp.de

23.05.2002 © Pallas GmbH

PDMS/EDMS Systemintegration

PPSAuftrags-

Daten

Produktions-programmPlanung

Ablauf-PlanungMenge

Termine

Auftrags-steuerung

Auftrags-überwachung

TermineKapazitäten

CAMFertigung

CADEntwicklungKonstruktion

CAPArbeits-Planung

NCNC-Programm

Erstellung

CAQQualitäts

überwachung

PDM-Technische

Daten

Kunden-bezogen

Produkt-bezogen

Quelle: www.irp.de

Page 10: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

10

23.05.2002 © Pallas GmbH

Grundprinzip von Informationssystemen

Operative Systeme

OLTP

ExterneDaten

InterneDaten

Informations-Systeme

Lesen, ergänzenSchreiben, ändern, löschenDatenoperationen

Beobachtung, Analyse, Entscheidung

Abwicklung, TransaktionZiel

Entscheider„Wissensarbeiter“,

Operativer BereichAnwender, Kunde, Lieferant

Nutzer

Zeitpunktbezogen, Historie, periodisch geladen

dynamischArt der Daten

Relationalmultidimensional

Hierarchischrelational

DBMS

Einfache Benutzungflexibler Datenzugriff

Verfügbarkeit, PerformancePriorität

23.05.2002 © Pallas GmbH

Zusammenspiel von OLTP und Data-Warehouse

ERP

SCM

PDM

CRM

WWW

Dat

en-R

eeng

inee

ring

Ext

rakt

ion,

Tra

nsfo

rmat

ion,

Lade

nR

eplik

atio

n

Data-Warehouse

OperationalData-Store

Data-Marts

Data-MartsData-Marts

Meta-Daten

DB-KatalogTool-

Dircetory DB Katalog Scheduler

OLTP ETLStaging Area Data-Warehouse OLAP Präsentation

Ad hocAnalyse

Data-Mining

Reports

ReportMgt.

Page 11: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

11

23.05.2002 © Pallas GmbH

Intelligence-Portfolio

Wissensredaktion

Communities

Konferenzen

„Kultur-Entwicklung“

Intelligente Agenten

Semantic Web

Foren, eMeetings

Collaboration

E-Mail

Pull / Push Technologie

Balanced Scorecard

Reporting

Verteilen & Kommunizieren

Implizit

Human Ressource

Explizit

E-Learning

Internet/IntranetDMS-SystemeArchiv -Systeme

Web-Mining

Text-Mining

Case Based Reasoning

Retrieval

...Qualitativ...Unstrukturiert

...Wissen

Intellectual Capital

Organizational Memory

Abteilungen / Teams

Mitarbeiter

Innovations -Mgt.

Personal-Mgt.

Organisations-entwicklung

Data Mining

OLAPMIS, EIS, DSS

Kennzahlenanalyse

Entwickeln & Entdecken

QuantitativStrukturiert...

Daten...

Data Warehouse

PDM

Operative Systeme (OLTP)

Speichern &

Bereitstellen

... Informationen ...

23.05.2002 © Pallas GmbH

MIS mit zentraler Datenkomponente erfordern ein einheitliches Datenmodell

A

B

C

D

Daten-Akquisition 1

Daten-Akquisition 2

Daten-Akquisition 3

EIS 1

DSS 1

EIS 2

Klassische MIS -Systeme

EIS 1

DSS 1

EIS 2

A

B

C

D

Dat

en-A

kqui

sitio

n 1

DW

Dat

en-A

kqui

sitio

n 1

Moderne MIS -Systeme

MIS: Management Information SystemEIS: Executiv Information System Top-ManagementDSS: Decision Support System Taktischer Bereich

Page 12: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

12

23.05.2002 © Pallas GmbH

DW-Analysen mit OLAP-Technologien sind Stand der Technik

Produkt

Kunde

Zeit

Ergebnisse

Deckungsbeitrag

Wahrscheinlichkeit

Preis-Sensitivität

Performance

Risikoklassen

Kundensegmentierung

Auswertung nach Dimensionen

1. Welchen Deckungsbeitrag hat ein bestimmtes Produkt im letzten Quartal in einer bestimmten Region für Kundensegment A erzielt ?

2. Wie verändert sich der Umsatz in Region A bei bestimmten Preisänderungen ?

OLAP

Würfel (Cube)

Dimension

Element

23.05.2002 © Pallas GmbH

Trends in der Weiterentwicklung von DW

n Schreibender Zugriff: zurückschreiben von gewonnen Information in das Data Warehouse

n Manuelle Datenerweiterung: manuelle Anreicherung von Daten, z.B. zusätzliche Kategorisierungen

n „Realtime“ Analysen: Informationen müssen sofort aus den OLTP- Systemen in das Data Warehouse gebracht werden (ODS)

n Informationserweiterung auf unstrukturierte Informationen (Web)

n Portalintegration, Einbindung in personalisierte Web-Portale „My place-Idee“

Page 13: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

13

23.05.2002 © Pallas GmbH

Data Mining

n „Effiziente Suche nach verborgenen, wertvollen Informationen in großen Datenmengen und deren Interpretation“ (SchommerC. et al)

n Erkennen von Mustern / Strukturen / Gesetzmäßigkeiten in strukturierten Datenbeständen, um Entscheidungen und Vorhersagen zu treffen

n Hypothesenfreie Wissensgenerierung„Endeckungsmodell“ bzw. explorative Datenanalyse

n Maschinelles Lernen (Aneignen von Hypothesen über Gesetzmäßigkeiten der realen Welt)

23.05.2002 © Pallas GmbH

Mit Data Mining können unübersichtliche Daten auf wenige, interpretierbare Muster reduziert werden

viele Einzelfälle

undurchschaubar

wenige typische Kombinationen

Lesbar und analysierbar

Page 14: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

14

23.05.2002 © Pallas GmbH

Aufgaben und Methoden des Data Mining

Prognose

Segmentierung

Assoziations-Analyse

Klassifikation

Neuronale Netze

Entscheidungs-Bäume

Clustering

Assoziations-verfahren

PrognoseUmsatz

Prognose Bonität

Warenkorb-Analyse

Erkennen von Marktsegmenten

FragestellungBeispiel

Data-Mining-Aufgabe

Data-Mining-Methode

Quelle: Grothe/Gentsch Business Intelligence 2000

23.05.2002 © Pallas GmbH

Im Data Mining werden Methoden des induktiven Lernens angewendet

Quelle: Krahl / Windheuser / Zick: Data Mining: Einsatz in der Praxis

Maschi-nellesLernen

DeduktivesLernen

InduktivesLernen

ÜberwachtesLernen

(Klassifikation)

UnüberwachtesLernen

(Assoziationen,Segmentierung)

Statistik, Lineare Methoden,Fuzzy Logic, Genetische Algorithmen

DataMining

Neuronale Netze

Entscheidungsbäume

Regelinduktion

k-nächste -Nachbarn

Diskriminanzanalyse

Assoziationen

Neuronale Netze

Demographisches Clustern

k-means Clustering

hierarchisches Clustern

Maschi-nellesLernen

DeduktivesLernen

InduktivesLernen

ÜberwachtesLernen

KlassifikationPrognose

UnüberwachtesLernen

Assoziationen,Segmentierung

Deskriptive Statistik, Lineare Methoden, Fuzzy Logic,

DataMining

Neuronale Netze

k-nächste -Nachbarn

Diskriminanzanalyse

Assoziationen

Neuronale Netze

Entscheidungsbäume

Regelinduktion

hierarchisches Clustern

Demographisches Clustern

Page 15: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

15

23.05.2002 © Pallas GmbH

Herausforderung Data Mining

n Herausforderung besteht in der Wahl der optimalen Methode, häufig heuristisches Verfahren

n Data-Mininig liefert „Informationen“ in Form von Mustern und Gesetzmäßigkeiten, keine Entscheidungen

n „garbage in“ <–> „garbage out“

n 80 % des Aufwandes entsteht für „Datenreinigung“

n Wichtiges Anwendungsgebiet „Data Quality“

23.05.2002 © Pallas GmbH

Intelligence-Portfolio

Wissensredaktion

Communities

Konferenzen

„Kultur-Entwicklung“

Intelligente Agenten

Semantic Web

Foren, eMeetings

Collaboration

E-Mail

Pull / Push Technologie

Balanced Scorecard

Reporting

Verteilen & Kommunizieren

Implizit

Human Ressource

Explizit

E-Learning

Internet/IntranetDMS-SystemeArchiv -Systeme

Web-Mining

Text-Mining

Case Based Reasoning

Retrieval

...Qualitativ...Unstrukturiert

...Wissen

Intellectual Capital

Organizational Memory

Abteilungen / Teams

Mitarbeiter

Innovations -Mgt.

Personal-Mgt.

Organisations-entwicklung

Data Mining

OLAPMIS, EIS, DSS

Kennzahlenanalyse

Entwickeln & Entdecken

QuantitativStrukturiert...

Daten...

Data Warehouse

PDM

Operative Systeme (OLTP)

Speichern &

Bereitstellen

... Informationen ...

Page 16: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

16

23.05.2002 © Pallas GmbH

Retrieval „Just in time“-Bereitstellung von relevanten Informationen

Retrieval

Cluster-Ansätze

Assoziations -analyse

Merkmalsbasiert

ProbalistischeAnsätze

Vektormodelle

Fuzzy-Set

Strukturbasierte

Linguistische Netze

SemantischeNetze

Ontologien

Exact match

Boole sche Logik

Kontext-operatoren

Komposita-Zerlegung

Phonetische Suche

partial match(Ranking)

Isolierte Dokumente

Vernetzte Dokumente

Quelle: www.ontoprise.de

23.05.2002 © Pallas GmbH

Text- / Web Mining basiert auf den Methoden des Data Mining und zielt auf unstrukturierte Daten

Web Mining ist die Übertragung von Data-und Text Mining-Techniken auf unstrukturiertes Datenmaterial, das im Zusammenhang mit Prozessen im Internet /Intranet gesammelt wird.

Abstrakterstellung

Auswertung von Reklamationsberichten

Ähnlichkeiten in Kundenkorrespondenz

Zuordnung von Zeitungsartikeln

Aufbau von Knowledge-Maps

Fragestellungen Methoden

Neuronale Netze

Entscheidungs-Bäume

Clustering

Assoziations-verfahren

Page 17: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

17

23.05.2002 © Pallas GmbH

Integriertes Knowledge-Mining im E-Business

Web ContentWeb Usage

E-Business

Log Files WWWOnline -Shop

Data-Mining Text-MiningData-Mining

E-Business-Intelligence

Quelle: Grothe/Gentsch Business Intelligence 2000

23.05.2002 © Pallas GmbH

Intelligence-Portfolio

Wissensredaktion

Communities

Konferenzen

„Kultur-Entwicklung“

Intelligente Agenten

Semantic Web

Foren, eMeetings

Collaboration

E-Mail

Pull / Push Technologie

Balanced Scorecard

Reporting

Verteilen & Kommunizieren

Implizit

Human Ressource

Explizit

E-Learning

Internet/IntranetDMS-SystemeArchiv -Systeme

Web-Mining

Text-Mining

Case Based Reasoning

Retrieval

...Qualitativ...Unstrukturiert

...Wissen

Intellectual Capital

Organizational Memory

Abteilungen / Teams

Mitarbeiter

Innovations -Mgt.

Personal-Mgt.

Organisations-entwicklung

Data Mining

OLAPMIS, EIS, DSS

Kennzahlenanalyse

Entwickeln & Entdecken

QuantitativStrukturiert...

Daten...

Data Warehouse

PDM

Operative Systeme (OLTP)

Speichern &

Bereitstellen

... Informationen ...

Page 18: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

18

23.05.2002 © Pallas GmbH

Die Balance Scorecard ist ein strategisches Management- und Kommunikations-Instrument

n Ausgewogener Berichtsbogen für Performance Management

n Umsetzung von Zielen in Kennzahlen

n Gleichgewicht zwischen Perspektiven

n Strategische Entscheidungen werden transparent

n Zukunftsorientierung statt Vergangenheit

n Herausforderungen: – Geeignete Kennzahlen für die

Perspektiven

– Informationsquellen für Kennzahlen

KundenPerspektive

FinanziellePerspektive

Prozess-Perspektive

Lern und Wachstum-Perspektive

Vision &Strategie

Ziele Aktionen Maßstab

23.05.2002 © Pallas GmbH

Intelligence-Portfolio

Wissensredaktion

Communities

Konferenzen

„Kultur-Entwicklung“

Intelligente Agenten

Semantic Web

Foren, eMeetings

Collaboration

E-Mail

Pull / Push Technologie

Balanced Scorecard

Reporting

Verteilen & Kommunizieren

Implizit

Human Ressource

Explizit

E-Learning

Internet/IntranetDMS-SystemeArchiv -Systeme

Web-Mining

Text-Mining

Case Based Reasoning

Retrieval

...Qualitativ...Unstrukturiert

...Wissen

Intellectual Capital

Organizational Memory

Abteilungen / Teams

Mitarbeiter

Innovations -Mgt.

Personal-Mgt.

Organisations-entwicklung

Data Mining

OLAPMIS, EIS, DSS

Kennzahlenanalyse

Entwickeln & Entdecken

QuantitativStrukturiert...

Daten...

Data Warehouse

PDM

Operative Systeme (OLTP)

Speichern &

Bereitstellen

... Informationen ...

Page 19: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

19

23.05.2002 © Pallas GmbH

Das Grundproblem des Knowledge-Discovery beschreibt das Bedeutungs-Dreieck

n Computer verarbeiten nur „Symbole“

n Interpretation von Symbolen ist kontext- und personenabhängig

n Kommunikation mit Computer oder zwischen Personen setzt gleiche Interpretation voraus.

n „Gemeinsames Verständnis“ der Realen WeltBeispiel: „Data-Mining“

- Data-Warehouse ?- Statistisches Verfahren ?- Cognos ?- Daten-Mine ?

BegriffKonzept

Symbol / Wort

Reale Welt

Aktiviert eine Vorstellung

bezieht sich auf

steht für

Idee des Semantic Webauf Basis von Wissensnetzen und Ontologien

23.05.2002 © Pallas GmbH

Assoc

Assoc

Assoc

Wissensnetze mit Topic Map Standard

Topic

TopicTopic

MultidimensionalerBegriffs-

Beziehungs-Komplex

Informations-ressource

(occurrence,Belegstelle)

Occurrence Assoc O-AssocO-Assoc

ist relevant, weil ...

T-A-O

Page 20: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

20

23.05.2002 © Pallas GmbH

Topic Map am Beispiel Business Intelligence

Data Marts

Data Warehouse

EIS

Balanced Scorecard

DBMS

DLR

Business-Intelligence

Semantic Web

OLAP Portal

WissensnetzeVeranstaltungen

Knowledge Discovery

Web Mining

Information Retrieval

Text Mining

Data Mining

Ontologie

DBMS IntranetPDM DMS

ist ein

basiert auf

ist ein

ist ein

basiert auf

basiert auf

T-A-O

Data Management

23.05.2002 © Pallas GmbH

Ontologie ist eine von mehreren Anwendern geteilte begriffliche Spezifikation eines Anwendungsbereiches

n Darstellung in Form von semantischen Netzen mit Begriffen, Beziehungen, Typenhierarchien

n Begriffe bilden eine Metastruktur über den Inhaltenn Funktion/Nutzen

– Visualisierung von intellektuelle Wissensstrukturen – Navigation in Wissensstrukturen

– Intelligentes Retrieval, Suche in Netzen (Query Answering)– Inferenzmechanismen (Schlussfolgerungen)

• Mitarbeiter arbeitet in KM-Projekt > Mitarbeiter hat KM Knowhow

– Standardisierter Austausch (XML-Basis)

n Beispiel: Topic Map Standard

Page 21: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

21

23.05.2002 © Pallas GmbH

Kommunikation mit Intelligenten Agenten

Ein Agent ist

ein Softwareprogramm, das für seinen Nutzer bestimmte Aufgaben erledigt und dabei ein ausreichendes Maß an Intelligenz besitzt, um seine Aufgaben in Teilen autonom durchzuführen, seine Nutzer gegenüber Dritten zu repräsentieren und mit seiner Umwelt auf sinnvolle Art und Weise zu interagieren.“

[Zarnekow & Brenner 1999]

23.05.2002 © Pallas GmbH

Beispiele für Agenten

Anwendungsbereiche

n Gezielte Informationsversorgung

n Überwachung dynamischer Datenquellen

n Preisvergleich im E-Commerce

n Vermittler in elektronischen Marktplätzen

n Telematiksysteme

n Workflow Management

n Produktionsteuerung

Informationsversorgung

n Such-Agenten für wiederverwendbare Recherchen

n Profil-Agenten für individuelle Interessen

n Kategorie-Agenten fürTaxonomien

n News-Agenten für Themenkanäle

Page 22: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

22

23.05.2002 © Pallas GmbH

Business-Intelligence

Business Intelligence

i.e.SWissensredaktion

Communities

Konferenzen

„Kultur-Entwicklung“

Intelligente Agenten

Semantic Web

Foren, eMeetings

Collaboration

E-Mail

Pull / Push Technologie

Balanced Scorecard

Reporting

Verteilen & Kommunizieren

Implizit

Human Ressource

Explizit

E-Learning

Internet/IntranetDMS-SystemeArchiv -Systeme

Web-Mining

Text-Mining

Case Based Reasoning

Retrieval

...Qualitativ...Unstrukturiert

...Wissen

Intellectual Capital

Organizational Memory

Abteilungen / Teams

Mitarbeiter

Innovations -Mgt.

Personal-Mgt.

Organisations-entwicklung

Data Mining

OLAPMIS, EIS, DSS

Kennzahlenanalyse

Entwickeln & Entdecken

QuantitativStrukturiert...

Daten...

Data Warehouse

PDM

Operative Systeme (OLTP)

Speichern &Bereitstellen

Intelligence-Portfolio

... Informationen ...

23.05.2002 © Pallas GmbH

Wissens-Management

Wissens-Management

i.e.SWissensredaktion

Communities

Konferenzen

„Kultur-Entwicklung“

Intelligente Agenten

Semantic Web

Foren, eMeetings

Collaboration

E-Mail

Pull / Push Technologie

Balanced Scorecard

Reporting

Verteilen & Kommunizieren

Implizit

Human Ressource

Explizit

E-Learning

Internet/IntranetDMS-SystemeArchiv -Systeme

Web-Mining

Text-Mining

Case Based Reasoning

Retrieval

...Qualitativ...Unstrukturiert

...Wissen

Intellectual Capital

Organizational Memory

Abteilungen / Teams

Mitarbeiter

Innovations -Mgt.

Personal-Mgt.

Organisations-entwicklung

Data Mining

OLAPMIS, EIS, DSS

Kennzahlenanalyse

Entwickeln & Entdecken

QuantitativStrukturiert...

Daten...

Data Warehouse

PDM

Operative Systeme (OLTP)

Speichern &Bereitstellen

Intelligence-Portfolio

... Informationen ...

Page 23: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

23

23.05.2002 © Pallas GmbH

EnterpriseInformation-

Portale

Wissensredaktion

Communities

Konferenzen

„Kultur-Entwicklung“

Intelligente Agenten

Semantic Web

Foren, eMeetings

Collaboration

E-Mail

Pull / Push Technologie

Balanced Scorecard

Reporting

Verteilen & Kommunizieren

Implizit

Human Ressource

Explizit

E-Learning

Internet/IntranetDMS-SystemeArchiv -Systeme

Web-Mining

Text-Mining

Case Based Reasoning

Retrieval

...Qualitativ...Unstrukturiert

...Wissen

Intellectual Capital

Organizational Memory

Abteilungen / Teams

Mitarbeiter

Innovations -Mgt.

Personal-Mgt.

Organisations-entwicklung

Data Mining

OLAPMIS, EIS, DSS

Kennzahlenanalyse

Entwickeln & Entdecken

QuantitativStrukturiert...

Daten...

Data Warehouse

PDM

Operative Systeme (OLTP)

Speichern &Bereitstellen

Intelligence-Portfolio

... Informationen ...

© Pallas GmbH

Enterprise-Information-Portale Höchste Stufe der Evolution und Integration

OLAPKnowledgeDiscovery

Colla-boration

DataMining

Search &Retrieval

Personalisierung

Zugriffsteuerung

Prozessorientierung

Enterprise IntegrationMail-

ServerOLTP-

SystemeData-

WarehouseDMS/Archiv

ERP-CRM-PDM

ExterneDaten-quellen

Menü, Knowledge-Map, Agenten, Retrieval, Pull/Push

VisualisierungNavigationUsability

Business-Intelligence

Daten, Informationen und Wissen über Kunden, Produkte, Prozesse, Projekte, etc.

Intelligentes Wissensportal

Page 24: Wege aus dem Daten-Chaos - Startseite - DLR Portal · n Simultaneous-Engineering-Prinzip führt ... Zusammenspiel von OLTP und Data-Warehouse ERP SCM PDM CRM WWW Daten-Reengineering

24

23.05.2002 © Pallas GmbH

Ausblick: Daten-Chaos ist beherrschbar

n Daten- und Informations-Management sind technisch lösbar

n Wissensmanagement ist eine kulturelle Herausforderung

n Die Lösungen:

– Datenqualität / Data-Reenginiering

– Metadatenkonzepte

– Semantik

n Bei aller Euphorie: Entscheidungen werden häufig nicht mit dem Kopf sondern mit dem Bauch getroffen.

Wege aus dem Daten-Chaos

Von der Datenspeicherung zum WissensmanagementFragestellungen, Begriffe und Technische Konzepte

Ein Unternehmen der ExperTeam-Gruppe

Pallas GmbHHermülheimerStraße 1050321 Brühl

Emil-Figge-Straße 8544227 Dortmund

[email protected]://www.pallas.com

DLR Workshop

16.05.2002

Hans-Gerd SchaalGeschäftsführer