25
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus Thomas Koch OrbiTeam Software GmbH & Co. KG KnowledgeCamp 2012, Karlsruhe

Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Embed Size (px)

DESCRIPTION

Am Beispiel des Projektes EnArgus wird eine Methode zur Wissenserschließung und –Modellierung präsentiert, bei der eine Anwendungsdomäne durch Informationsextraktion aus Wiki-Texten (durch Sprachanalyse) erschlossen und in einer Ontologie repräsentiert wird. Die Ontologie dient dabei zur Unterstützung einer intelligenten Volltextsuche.

Citation preview

Page 1: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Wissenserschließung und –Modellierung:

Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Thomas Koch

OrbiTeam Software GmbH & Co. KG

KnowledgeCamp 2012, Karlsruhe

Page 2: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Kurzvorstellung: EnArgus-Projekt

• Ziel: Entwicklung und Erprobung eines zentralen Informationssystems für Energieforschungs-vorhaben aus dem Bereich der Förderung durch Bund und Länder

• Unterschiedliche Zielgruppen – Die interessierte Öffentlichkeit

• Überblick über Forschungsprojekte

– Die Geldgeber (Ministerien, Projektträger) • Was wird/wurde gefördert (inhaltliche Fragen)

• Forschungstrends, Experten, Verteilung Fördermittel etc.

Page 3: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Ausgangssituation

Diverse Problemstellungen und Anforderungen • Projektdaten sind auf eine Vielzahl nicht

kompatibler Datenbanken verstreut • Datenbanken sind eher betriebswirtschaftlich

motiviert und zur fachlichen Auswertung wenig geeignet

• Bedarf nach Auswertungswerkzeugen und erweiterten Recherchemöglichkeiten

• Vorhabenbeschreibungen sind oftmals sehr fachspezifisch – Wissen über Fachgebiet für Recherche erforderlich

Page 4: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Idee

Verbesserte Suche durch Wissenserschließung • Wiki-texte

– Werden von Fachexperten gemeinsam verfasst

• Informationsextraktion – Aufbau der Ontologie

durch Textanalyse

• Ontologie – Dient der formalen und expliziten

Repräsentation von Wissen

• Suchanfrage – Wird durch verwandte Begriffe aus

Ontologie angereichert

• Optimierte Suchergebnisse zufriedene Benutzer

Fachexperte

Anwender

Page 5: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Vorgehen

• Zusammenführen von Daten aus versch. Quellen – Projektdaten aus PROFI (administrative Daten) – Projektdokumente mit Inhalt (z.B. Berichte) – Inhaltliche Erschließung über Suchmaschine

• Inhaltssuche (Volltext) und Metadatensuche

• Unterstützung der Recherche durch Fachontologie – Fachontologie wird mit Hilfe der Energieexperten erstellt – Energieexperten formulieren Sachzusammenhänge im Wiki – Ontologieexperten realisieren Erfassung des Wikis durch

Methoden der Sprachanalyse und Wissensextraktion – IT-Experten implementieren das Basis-System mit

Suchfunktionen, die auf die Ontologie zurückgreifen

Page 6: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Recherche-Cockpit

Energie-

forschungs

-Wiki

BSCW Core

EnArgus-DB Index Dokumente

Ontologie Core

Ontologie-DB

Kooperations- Unterstützg.

Ontologie-

Editor

Wiki-Seiten

Auswertung &

Visualisierung Suchanfragen

& -ergebnisse

EnArgus Systemarchitektur

Page 7: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Fakten: EnArgus®

• Nationales Forschungsvorhaben – Partner: aus Energieforschung und Informatik

• Fraunhofer FIT, FKIE, UMSICHT und ISI • Forschungszentrum Jülich • Ruhr-Universität Bochum • OrbiTeam Software

– Gefördert durch BMWi • 5. Energieforschungsprogramm

der Bundesregierung • 2 Jahre Laufzeit

(Juli 2011 bis Juni 2013)

– Mehr Infos: https://www.enargus.de

Page 8: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Aufwand/Nutzen

• Aufwand: Aufbau der Ontologie – Erfordert Expertenwissen

• Ontologie-Experten und Experten der Fachdomäne

– (Teil-)Automatisierung durch Sprachanalyse • Ziel: Fachexperten dokumentieren im Wiki und System

extrahiert automatisch die Fachontologie daraus

• Nutzen – Bessere Unterstützung bei der Suche

• z.B. Vorschlagen von verwandten Begriffen • Dadurch mehr relevante Treffer und zielgerichtete Suche

– Wiki ist zugleich hilfreich für Anwender • Verknüpfung von Fachbegriffen mit Wiki als eine Art Glossar

Page 9: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

EnArgus: Teilsysteme

EnArgus.master

• Für die interne Nutzung

• Vollzugriff auf die Vorhaben-Datenbank

• Hinzufügen von Inhalten/ Dokumenten zu Vorhaben über Kooperationsplattform

• Zugang zu Recherche-Funktionen

• Expertensuche, gespeicherte Suchen etc.

EnArgus.public

• Für die Öffentlichkeit

• Einfache Bedienung

• Ansprechende Webseiten

• Eingeschränkter Zugriff auf Daten von Vorhaben

• Einfache Suchfunktion

• Lesender Zugriff auf EnArgus.wiki

Page 10: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

EnArgus.public

• Öffentliches Teilsystem

Page 11: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

EnArgus.public

• Facetten

Page 12: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

EnArgus.public

• Facetten

Page 13: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

EnArgus.public

• Details

Page 14: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Details zum Wiki

• Vorgehensweise – Vorlage im Wiki für die Energie-Experten zur

Beschreibung von Objekten – Aus Beschreibungen wurde von Ontologie-Experten zunächst der

obere Teil der Ontologie aufgebaut ("upper ontology")

• Bearbeitete Fachthemen: – Elektrochemische Energiespeicher – CCS (Carbon Dioxide Capture and Storage) – Windenergie – Elektrische Energiespeicher

• Einschränkungen / Hinweise – Formulierungen im Wiki sollten in einfacher Sprache erfolgen, damit

die Sprachanalyse verwertbare Ergebnisse liefert.

• Technische Basis: MoinMoin Wiki

Page 15: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Wiki: Beispiele

Page 16: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Informationsextraktion

• Aufbau der Ontologie durch Textanalyse – Wiki-Texte werden (durch Software) ausgewertet

– In diesem Prozess erfolgt die Umwandlung von Text in Wissen!

– Ergebnis der Informationsextraktion ist die (aktualisierte/erweiterte) Ontologie

– Technik: • Text mining

• Semantic Role Labeling (SRL)

– Tools: • GATE (General Architecture for Text Engineering)

• Protegé/OWL

Page 17: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Details zur Ontologie

• Grundlage jeder Ontologie ist eine Taxonomie – relevante Begriffe der Domäne werden in einem

Baum repräsentiert

– Begriffe sind nach Ober- und Unterklassen angeordnet

• Ontologie dient der Wissensrepräsentation – Begriffe enthalten Attribute

(z.B. Eigenschaften oder andere Schreibweisen)

– Zusätzliche Relationen zwischen den Begriffen bilden weitere semantische Beziehungen ab

Page 18: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Ontologiebasierte Suche

• Benutzer können eine

Suchanfrage starten und Suchbegriff(e) eingeben

• in der einfachen Suche werden Synonyme automatisch mit in die Anfrage einbezogen (optional)

• in der erweiterten Suche werden semantisch verwandte Begriffe (aus der Ontologie) angeboten

Page 19: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Ontologiebasierte Suche

• Benutzer können eine

Suchanfrage starten und Suchbegriff(e) eingeben

• in der einfachen Suche werden Synonyme automatisch mit in die Anfrage einbezogen (optional)

• in der erweiterten Suche werden semantisch verwandte Begriffe (aus der Ontologie) angeboten

Page 20: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Ontologiebasierte Suche

• Benutzer können eine

Suchanfrage starten und Suchbegriff(e) eingeben

• in der einfachen Suche werden Synonyme automatisch mit in die Anfrage einbezogen (optional)

• in der erweiterten Suche werden semantisch verwandte Begriffe (aus der Ontologie) angeboten

Page 21: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Ontologiebasierte Suche

• Benutzer können eine

Suchanfrage starten und Suchbegriff(e) eingeben

• in der einfachen Suche werden Synonyme automatisch mit in die Anfrage einbezogen (optional)

• in der erweiterten Suche werden semantisch verwandte Begriffe (aus der Ontologie) angeboten

Page 22: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Suchergebnisse

• Ansicht der Treffer

– Darstellung von Details (pro Vorhaben)

Page 23: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Auswertungen

• Akkumulation der Suchergebnisse

– Konkrete Fragestellung: Verteilung der Förderkosten über die Jahre

Page 24: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Ausblick

• Weitere Aspekte im Projekt – Unterstützung der Datenanalyse

• Statistische Auswertungen von Abfragen • Graphische Visualisierung von Zusammenhängen Recherche-Cockpit (derzeit in der Entwicklung)

• Weitere Ideen für die Zukunft – Unterstützung von Mehrsprachigkeit – Ausbau der Datenbasis (Erfassung weiterer Themenfelder aus

der Energieforschung) – ergonomischere Bedienung für die Fachexperten

(z.B. durch grafischen Ontologieeditor) – Einbeziehung weiterer externer Datenquellen – Automatisierte Verschlagwortung von Vorhaben

(durch Tagging-Verfahren)

Page 25: Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Diskussion/Fragen

• Fragen an die KM-Community

– Erfahrungen mit Wissensmodellierung

– weitere Ansätze zur inhaltlichen Erschließung einer Anwendungsdomäne (und Erfahrungen damit)?

– Erfahrungen mit ontoligiebasierter Suche

– Unterschied ‚Fachwissen‘ vs. ‚Prozesswissen‘ ?!

• Glossar vs. Rezeptbuch