18
Information Engineering und Information Life Cycle Norbert Fuhr Universit¨ at Duisburg-Essen Information Engineering SS 2013 Inhaltsverzeichnis ¨ Ubersicht ¨ uber die Vorlesung Information Engineering Informationskompetenz Suchkompetenz Daten – Information – Wissen Wissensmanagement Information Lifecycle Zusammenfassung ¨ Ubersicht ¨ uber die Vorlesung (Vorl¨ aufige) ¨ Ubersicht ¨ uber die Vorlesung 1. Grundlagen 2. Methoden 3. Systeme 4. Anwendungen 5. Evaluierung

Information Engineering und Information Life Cycle

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Information Engineering und Information Life Cycle

Information Engineering und Information LifeCycle

Norbert Fuhr

Universitat Duisburg-Essen

Information EngineeringSS 2013

Inhaltsverzeichnis

Ubersicht uber die Vorlesung

Information Engineering

Informationskompetenz

Suchkompetenz

Daten – Information – Wissen

Wissensmanagement

Information Lifecycle

Zusammenfassung

Ubersicht uber die Vorlesung

(Vorlaufige) Ubersicht uber die Vorlesung

1. Grundlagen

2. Methoden

3. Systeme

4. Anwendungen

5. Evaluierung

Page 2: Information Engineering und Information Life Cycle

Grundlagen

I Information Engineering

I Information Lifecycle

I Daten – Information – Wissen

I Wissen und Prozesse: Workflows / Wissensintensive Aufgaben

I Information Seeking & Searching

I Repositories, Datenbanken

I Digitale Bibliotheken und Collaboratories

Methoden

I (Autorensysteme)

I Digitalisierung

I Informationsextraktion

I (Information Mining)

I Metadaten

I Ontologien

I Annotationen

I Digital Preservation (Langzeitarchivierung)

I (Information Retrieval)

I Recommendation

I Evaluierung

Systeme

I Architekturen

I Repositories

I Web Server

I Content-Management-Systeme

I Wikis

I Digitale Bibliotheken

Page 3: Information Engineering und Information Life Cycle

Anwendungen

I DAFFODIL

I COLLATE

I Soziale Netze / Kollaborative Web 2.0-Systeme

Information Engineering

DefinitionEigenschaften

Was ist Information Engineering?

Eine erste Definition von Information Engineering:

The application of an interlocking set of formaltechniques for the planning, analysis, design andconstruction of information systems, applied on anenterprisewide basis or across a major sector of anenterprise.

James Martin

Was ist Information Engineering?

I Formale Methoden zurI PlanungI AnalyseI EntwurfI Realisierung

von Informationssystemen

I Methoden bauen aufeinander auf und sind voneinanderabhangig

I Methoden werden zumeist unternehmensweit verwendet

Page 4: Information Engineering und Information Life Cycle

Was ist Information Engineering?

Information Engineering is an integrated set oftechniques, based on corporate strategic planning, whichresults in the analysis, design and development ofsystems which supports those plans exactly. InformationEngineering is applied by managers and users with noknowledge of computers, but instead with an expertknowledge of their business - in conjunction with expertsystems which provide rapid feedback to management forrefinement of the strategic plans.

Finkelstein

I Strategische Planung

I Kooperation und Partnerschaft von Managern und Nutzernmit Entwicklern

Eigenschaften des IE

I Information Engineering beschreibt keine starre Methodik,sondern Methoden

I IE fordert Top-Down-Ansatz von Informationssystemen:

1. Unternehmensweite Informationssystemplanung2. Analyse von Geschaftsbereichen3. Informationssystementwurf4. Informationsystemrealisierung5. Informationssystemeinfuhrung

Eigenschaften des IE

I IE unterstutzt Aufbau eines sich laufend weiterentwickelndenBestands an Wissen uber ein Unternehmen

I IE unterstutzt langfristige Evolution der Informationssysteme

I Orientierung an Unternehmenszielen

I Benutzerbeteiligung

I Strategische Planung

Eigenschaften des IE

Keine Beschrankung auf Unternehmen!

I Klassische Definition des IE zugeschnitten auf das“computerisierte Unternehmen“

I Web-Informationssysteme, Digitale Bibliotheken

I Offene Communities vs. geschlossene Unternehmen

I Vermittlung von Inhalt und Wissen an Communities

I Kollaborative Erstellung neuen Wissens und neuer Inhalte

I IE-Methoden auch auf diese Informationsysteme erweiterbar

Page 5: Information Engineering und Information Life Cycle

Informationskompetenz

Informationskompetenz - 6 SchritteImplizierte FahigkeitenBenachbarte Kompetenzen(Potenzielle) Systemunterstutzung

Information/Wissen als Entscheidungsgrundlage

”People’s actions are based more on what they believe than onwhat is objectively true”[Bandura, 1997; Pajares, 2002].

“What you see is all there is (WYSIATI)”(Entscheidung allein aufgrund der vorhandenen, unzureichendenInformation)(Kahneman, 2011: Thinking fast and slow)

→ Informationskompetenz als notwendige Fahigkeit, um Glaubendurch Wissen zu ersetzen

Informationskompetenz - 6 Schritte

1. AufgabendefinitionI Definiere das InformationsproblemI Identifiziere das Informationsbedurfnis

2. Informations-Beschaffungs-StrategienI Bestimme alle moglichen QuellenI Wahle die besten Quellen aus

3. Lokalisierung und ZugriffI Lokalisiere die Quellen (intellektuell und physisch)I Finde die Information innerhalb der Quelle

4. Benutze die InformationI Anschauen (z.B. lesen, horen, betrachten, anfassen)I Extrahiere die relevante Information

5. SyntheseI Organisiere die Information aus verschiedenen QuellenI Prasentiere die Information

6. BewertungI Beurteile das Produkt (Effektivitat)I Beurteile den Prozess (Effizienz)

Page 6: Information Engineering und Information Life Cycle

Implizierte Fahigkeiten

1. AufgabendefinitionI Informationsbedarf erkennen

2. Informations-Beschaffungs-StrategienI Kenntnis von StrategienI Kenntnis von Quellen

3. Lokalisierung und ZugriffI Lokalisierung von InformationI zielgerichtete Selektion von Information

4. Benutze die InformationI Organisation von Information

5. SyntheseI zweckoptimierte Gestaltung und Prasentation

6. BewertungI kritische Beurteilung von Information

Benachbarte Kompetenzen

I Bibliothekskompetenz

I Computerkompetenz

I Digitalkompetenz (Fahigkeit, uber Computer dargestellteInformationen unterschiedlicher Formate verstehen undanwenden zu konnen)

I Internet-Kompetenz

I Suchkompetenz

I Kommunikationskompetenz

I Lesekompetenz

I Medienkompetenz

I Schreibkompetenz

(Potenzielle) Systemunterstutzung

1. AufgabendefinitionI Wissenstests in Lehr-/Lernumgebungen

2. Informations-Beschaffungs-StrategienI Strategien fur Standardprobleme (z.B. known item search)

3. Lokalisierung und ZugriffI Hilfe bei der Anfrageformulierung (→ Daffodil)I situationsabhangige Vorschlage zur Suchfortsetzung (→

Daffodil)

4. Benutze die InformationI strukturierte Ablage (→ personliche Handbibliothek in

Daffodil)I Annotationsmoglichkeiten

5. SyntheseI ?

6. BewertungI ?

Suchkompetenz

SuchbarkeitLinguistische FunktionenAnfragespracheRankingSuchtaktiken und Strategien

Page 7: Information Engineering und Information Life Cycle

Suchkompetenz

I Aufbau einer Web-Suchmaschine

I Suchbarkeit

I Linguistische Funktionen

I Anfragesprache

I Ranking

I Suchtaktiken und Strategeme

Aufbau einer Web-Suchmaschine

Basiskomponenten einer Web-Suchmaschine

Crawler Sammelt Webseiten, interagiert mit Webservern beimDokumentzugriff, folgt Links zu neuen Quellen

Parser/Indexer Extrahiert Schlusselworter aus Texten und indexiertdie Dokumente

Datenbank Effiziente Speicherung der extrahierten undaufbereiteten Daten (z.B. in einer Datenbank mitinvertierten Listen)

Searcher Entgegenname von Anfragen, sucht in der Datenbanknach den passenden Antworten

Page 8: Information Engineering und Information Life Cycle

SuchbarkeitWelche Dokumente konnen uberhaupt gefunden werden?

I Zugriff:I offentlich zuganglichI verlinktI durch robots.txt erlaubtI keine Datenbankinhalte (außer wenn verlinkt)

I AktualitatI Dokumentformat

I nur Texte (kein Faksimile, andere Medien nur uber Text)I keine exotischen Dokumentformate

I keine Sprachubersetzung

Suchkompetenz - linguistische Funktionen

Wortnormalisierung Fuhr – fuhr, Schuss – Schuß, colour – color,meta tag – meta-tag – metatag – meta tag’s

Grundformreduktion Hauser – Hauses – Hause – Haus, Duisburg –Duisburgs, ¬ Duisburger

Nominalphrasen ”information retrieval”, ”retrieval * information”

Komposita Einfamilienhaus, Reihenendhaus, Doppelhaushalfte

Synonyme Handy Mobiltelefon Smartphone / ∼handy

Anfragesprache

I UND, ODER, Negationhandy -vertrag

I Zahlenbereiche: 100..200 EURO

I Facetten: Objekttyp (Bil-der/Maps/Videos/News/Shopping/..),Standort, Sprache, Zeitraum

I site:, link:, filetype:,

related:

link:uni-due.de -site:uni-due.de

I inurl:, intitle:, intext:,

inanchor:

duisburg -intext:duisburg

RankingFaktoren, die eine Seite nach oben bringen

I Suchbegriffe kommen haufig in der Seite vor

I Suchbegriffe kommen in Ankertexten vor

I Page rank

I Nutzer-Klicks: fremde, eigene, Freunde (Google+)

I Diversitat

(Faktoren werden als Merkmale in einem learning to rank-Ansatzverwendet, auf Klick-Daten trainiert)

Search engine optimization:Maßnahmen, eine Seite nach oben zu bringenaber: Web spam

Page 9: Information Engineering und Information Life Cycle

Suchtaktiken und Strategien

Taktiken:

Monitoring ”Tactics to keep the search on track and efficient”

Strukturelle Taktiken auf der Menge der potenziellen Antworten

Suchformulierung verbreitern/einengen, viele/wenige Terme

Term-Taktiken Auswahl/Variation der Suchterme

Ideen-Taktiken offene Suchmoglichkeiten/Variation

Strategie: Plan zu Durchfuhrung einer komplexen Suche

Daten – Information – Wissen

Die Begriffe Daten, Information und WissenSichtweisen auf Wissen

Daten – Information – Wissen

I Im Zusammenhang mit Informationssystemen tauchen dieBegriffe “Daten“, “Wissen“ und “Information“ auf

I In der Informatik redet man auch von “Datenbanken“ oder“Wissensmanagement“

I Was also ist der Unterschied zwischen Daten, Wissen undInformation?

Sichtweise des Wissensmanagement

I Unterscheidung zwischen Daten und Information auf der einenund Wissen der anderen Seite

I Kontinuum Daten – Information – WissenI Abgrenzung hinsichtlich der Fragestellung

I Daten und Information: “wer – was – wo – und wann?“I Wissen: “wie?“ und “warum?“

I Prozessorientierter Ansatz:I Wissen als Ressource, die zur Erledigung einer Aufgabe

notwendig istI Neues Wissen kann aus der Erledigung der Aufgabe entstehenI Integrierte Betrachtung von Daten, Information und Wissen

Page 10: Information Engineering und Information Life Cycle

Sicht der Informationswissenschaft

I Ursprunglich: Kontinuum Daten – Wissen – Information

I Gegensatz zur allgemein ublichen Begrifflichkeit

I Daher: Daten – Information – Wissen, mit Erlauterungen ausder Informationswissenschaft

Syntax, Semantik und Pragmatik

Syntax: Hierbei wird ein Objekt als Folge von Symbolenaufgefasst.

Semantik beschaftigt sich mit der Bedeutung eines Objektes.

Pragmatik orientiert sich an der Nutzung eines Objektes fureinen bestimmten Zweck.

Daten — Information — Wissen Wissen

I Wissen ist die Teilmenge von Information, die von jemandemin einer konkreten Situation zur Losung von Problemenbenotigt wird

I Suche nach Wissen in externen Quellen

I Informationssysteme: Extraktion des benotigten Wissens ausder bereitgestellten Information

I Transformation von Information in Wissen als ein Mehrwerterzeugender Prozess

I Wissen ist Information in Aktion

Page 11: Information Engineering und Information Life Cycle

Beispiel: LINUX Manuals

I Beinhalten Information uber Linux

I Beispiel: wie drucke ich ein Dokument?

I Benotigtes Wissen: Teilmenge der insgesamt in den Manualsverfugbaren, umfangreichen Information

I Mehrwert durch gezielte Bereitstellung (z.B. durch das Linuxman-Kommando)

Anderes Beispiel: Daten

T01 -- T02 1:2

T03 -- T04 2:0

T05 -- T06 2:4

T07 -- T08 1:4

T09 -- T10 1:1

T11 -- T12 1:0

T13 -- T14 1:4

T15 -- T16 1:3

T17 -- T18 3:2

Aus Daten wird Information

Ergebnisse Fußball-Bundesliga 28. Spieltag

Hannover – Bayern 1:2Schalke – Gladbach 2:0Hamburg – Stuttgart 2:4Aachen – Dortmund 1:4Berlin – Bielefeld 1:1Bremen – Nurnberg 1:0Leverkusen – Bochum 1:4Frankfurt – Cottbus 1:3Wolfsburg – Mainz 3:2

Wissen zur Entscheidungsfindung

Problem: Soll ich heute mein BVB-Trikotauf der Arbeit anziehen?

Ergebnisse Fußball-Bundesliga 28. Spieltag

Hannover – Bayern 1:2Schalke – Gladbach 2:0Hamburg – Stuttgart 2:4Aachen – Dortmund 1:4Berlin – Bielefeld 1:1Bremen – Nurnberg 1:0Leverkusen – Bochum 1:4Frankfurt – Cottbus 1:3Wolfsburg – Mainz 3:2

Page 12: Information Engineering und Information Life Cycle

Rolle des Wissens zur Entscheidungsunterstutzung

Wissen dient zur “informationellen Handlungsabsicherung“

NützlichkeitEntscheidung WissenInformation

1) Verfügbarkeit

b) Zugänglichkeit2) Interpretierbarkeit

a) Bereitstellung

Daten

3) Neuigkeit

8) Informationswert b) Verständlichkeit a) Informationsgehalt7) Validität

4) Glaubwürdigkeit

5) Relevanz a) Kontext−Relevanz b) Aktualität

a) Bereitstellung b) Zugänglichkeit

6) Entsch.−Verfügbark.

Sichtweisen auf Wissen

I Enzyklopadisches WissenI AlltagswissenI Lexikalisches WissenI FachwissenI Erfahrungswissen

I Handlungswissen

I Raumliches Wissen

I Episodisches Wissen

AlltagswissenDies sind 4 Apfel

Unternehmen sollen Gewinne erwirtschaften

Lexikalisches Wissen

Schimmel bezeichnet weißes Pferd

Abbildung: Weißes Pferd, Jerzy Panek

Fohlen bezeichnet junges Pferd... und das Team von BorussiaMonchengladbach ;-)

Page 13: Information Engineering und Information Life Cycle

Fachwissen

Gewinn ist Umsatz minus Kosten

G = U − K

Komplexe Zahlen besitzen einen Real- und ImaginarteilRealteil︷ ︸︸ ︷1.631 , 4.73i︸ ︷︷ ︸

Imaginarteil

Erfahrungswissen

Unreife Fruchte konnen Durchfall verursachen

Abbildung: Unreife Frucht der Red Savina, scharfster Chili der Welt

Handlungswissen

Kenntnis von Prozeduren und Problemlosungen

Raumliches WissenAnaloge Reprasentation physischer Objekte durch Reprasentationraumlicher Information und Verhaltnisse

Beispiel: Mentale Rotation analoger Objekte

Page 14: Information Engineering und Information Life Cycle

Episodisches Wissen

Autobiografisches Wissen, das aus erinnerbaren Erlebnissen besteht

Beispiel: George spielt Golf in Yale

Implizites vs. explizites Wissen

Implizites Wissen:

In mentalen Modellen, kognitiven Bildern Konstruktenund Karten sowie routinierten Verhaltens- undVorgehensweisen eingelagertes Wissen bezeichnet man alsimplizites Wissen (tacit knowledge ),auch als Know-how oder Fingerspitzengefuhl beschrieben

Explizites Wissen (Polanyi)

Spezifisches, reproduzierbares Wissen,In der Regel schriftlich (oder anderweitig explizit)reprasentiert

Implizites vs. explizites Wissen

Aufgabe von Informationssystemen:

I Implizites Wissen in Explizites uberfuhren

I Explizites Wissen bei Anwendung evtl. wieder implizit

Wissensmanagement

SECI-Modell

Page 15: Information Engineering und Information Life Cycle

Wissensmanagement

”Wissensmanagement beschaftigt sich mit den Moglichkeiten, aufdie Wissensbasis eines Unternehmens Einfluss zu nehmen. Unterder Wissensbasis eines Unternehmens werden alle Daten undInformationen, alles Wissen und alle Fahigkeiten verstanden, diediese Organisation zur Losung ihrer vielfaltigen Aufgabenbenotigt.” (Wikipedia)

I Wissen als Produktionsfaktor

I Informationssysteme zur Verwaltung des Wissens

I Chief Information Officer (CIO) fur Informationsmanagement

I Kritik: Wissensmanagement verwendet undifferenziertenWissensbegriff

SECI-Modell

[Nonaka & Takeuchi 95]

Modell der Wissenserzeugung:

I Sozialisation

I Externalisierung

I Kombination

I Internalisierung

Sozialisation

I Lernen durch Beobachtung Anderer

I Besprechungen, Brainstorming

Externalisierung

I Dokumentieren, Veroffentlichung

I Abspeichern in Datenbanken

Kombination

I Organisation von Wissen

I Integration von Wissen aus verschiedenen Quellen

Internalisierung

I Verinnerlichen von Wissen (Lernen)

I Wissen erhalten und anwenden

Information Lifecycle

Der Information Lifecycle im Information EngineeringPhasen des Information LifecycleIE-Methoden im Information Lifecycle

Page 16: Information Engineering und Information Life Cycle

Information Lifecycle im IE

I In dieser VL: Konzentration auf Methoden und Werkzeuge desIE

I Grundlage der weiteren Betrachtungen: InformationLifecycle

I Betrachtung aller Lebensphasen von Information (Erstellungbis Anwendung)

I Ideal: Informationssystem unterstutzt alle Phasen

I Einsatz von Methoden hangt vom Informationssystementwurfab (nach Planung und Analyse)

I Implementierung und Integration der Methoden undWerkzeuge Teil der Realisierung des Informationssystems

Information Lifecycle

Information Lifecycle

I Information dient der Erfullung einer Aufgabe

I Formulierung als Prozess

I Teilaufgaben als untergeordnete Prozesse

I Wissensintensive Aufgaben

Creation/Receipt

I Autorensysteme (Authoring)I Erstellung einfacher TexteI Hypertext- und Multimediadokumente, Hypermedia

I MetadatenI Daten uber DokumenteI z.B. bibliographische Daten

I AnnotationenI Spezielle Art von MetadatenI Verschlagwortung, “tagging“ bzw. semantische AnnotationI Textuelle Kommentare, Diskussionen

I Markup

Page 17: Information Engineering und Information Life Cycle

Creation/Receipt

I DigitalisierungI Erfassung und Umsetzung von nicht-digitalen Quellen in

digitaleI Textuelle Dokumente (Scanning, OCR)I Nicht-textuelle Daten (Schall, Messdaten, Video, Bilder) →

Sampling

I ModellierungI Formale Darstellung von Prozessablaufen, Sequenzen,

Anwendungsfallen, Zustanden und Beziehungen

Storage

I Kurz- bis langfristige Speicherung der Information

I Fluchtige Information im Hauptspeicher

I Ablage in Dateien

I Großere Datenmengen, (semi-)strukturierte Daten:Datenbanken

I Dokumente: Digitale Bibliotheken/Repositories

I Langzeitarchivierung (digital preservation)

I Wissensreprasentation und Organisation, Ontologien

I Aufbereitung fur die Suche: Indexierung

Dissemination

I Information Retrieval

I Recommender-Systeme

I Zugangsmanagement (access management)

Use

I Informationssysteme dienen haufig der Erfullung einerbestimmten Aufgabe oder eines bestimmten Zwecks

I Informationssystem kann Anwendungen gezielt unterstutzen

I Beispiel Geisteswissenschaften: Interpretation des Materialsmittels annotationsbasierter Diskussion (damit auchGenerierung neuer Information)

I Beispiel Informationssystem fur Multimediadokumente:Abspielfunktionen fur Videos oder Musik

Page 18: Information Engineering und Information Life Cycle

Zusammenfassung

Zusammenfassung

I Begriff des Information Engineering erlautertI Keine starre Methodik, sondern Methoden und WerkzeugeI Konzentration auf Realisierung von Informationssystemen

I Informationskompetenz als notwendige Voraussetzung

I Daten – Information – Wissen

I WissensmanagementI Information Lifecycle

I 4 PhasenI Mogliche Methoden fur jede Phase