28
EnArgus – ein ontologiebasiertes Forschungsinformationssystem Thomas Koch OrbiTeam Software GmbH & Co. KG PyCon.DE 2012, Leipzig

EnArgus – ein ontologiebasiertes Forschungsinformationssystem

Embed Size (px)

DESCRIPTION

Vortrag zum Projekt EnArgus (www.enargus.de) auf der Python Konferenz in Leipzig (PyCon DE 2012) am 30.10.2012

Citation preview

Page 1: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

EnArgus – ein ontologiebasiertes Forschungsinformationssystem

Thomas Koch OrbiTeam Software GmbH & Co. KG

PyCon.DE 2012, Leipzig

Page 2: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

Kurzvorstellung: EnArgus-Projekt

• Ziel: Entwicklung und Erprobung eines zentralen Informationssystems für Energieforschungs-vorhaben aus dem Bereich der Förderung durch Bund und Länder

• Unterschiedliche Zielgruppen – Die interessierte Öffentlichkeit

• Überblick über Forschungsprojekte

– Die Politik: Ministerien & Projektträger • Was wird/wurde gefördert (inhaltliche Fragen)

• Forschungstrends, Experten, Verteilung Fördermittel etc.

30.10.2012 PyCon 2012 2

Page 3: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

Ausgangssituation

Diverse Problemstellungen und Anforderungen • Informationen über Projekte auf diverse Quellen verstreut:

– Datenbanken, Dokumente (z.B. Berichte)

• Projektdatenbanken – sind eher betriebswirtschaftlich motiviert – sind zur fachlichen Auswertung wenig geeignet

• Projektdokumente – sind oftmals sehr fachspezifisch formuliert

• Bedarf nach – Übergreifenden komfortablen Recherchemöglichkeiten – Einbeziehung von Wissen über Fachgebiet bei der Recherche – Auswertungswerkzeugen (auf Suchergebnissen)

30.10.2012 PyCon 2012 3

Page 4: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

Idee

Verbesserte Suche durch Wissenserschließung • Wiki-Artikel

– Zu Fachbegriffen der Energieforschung – Von Fachexperten gemeinsam verfasst

• Informationsextraktion – Aufbau der Ontologie

durch Textanalyse

• Ontologie – Dient der formalen und expliziten

Repräsentation von Wissen

• Suchanfrage – Wird durch verwandte Begriffe aus

Ontologie angereichert

• Optimierte Suchergebnisse zufriedene Benutzer

Fachexperte

Anwender 30.10.2012

Page 5: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

Vorgehen

• Zusammenführen von Daten – Projektdaten aus PROFI (administrative Daten) – Projektdokumente aus versch. Quellen – Inhaltliche Erschließung über Suchmaschine

• Inhaltssuche (Volltext) und Metadatensuche

• Unterstützung der Recherche durch Fachontologie – Fachontologie wird mit Hilfe der Energieexperten erstellt – Energieexperten formulieren Sachzusammenhänge im Wiki – Ontologieexperten realisieren Erfassung des Wikis durch

Methoden der Sprachanalyse und Wissensextraktion – IT-Experten implementieren das Basis-System mit

Suchfunktionen, die auf die Ontologie zurückgreifen

30.10.2012 PyCon 2012 5

Page 6: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

Fakten: EnArgus®

• Nationales Forschungsvorhaben – Partner: aus Energieforschung und Informatik

• Fraunhofer FIT, FKIE, UMSICHT und ISI • Forschungszentrum Jülich • Ruhr-Universität Bochum • OrbiTeam Software

– Gefördert durch BMWi • Bundesministerium für Wirtschaft

und Technologie • 5. Energieforschungsprogramm

der Bundesregierung • 2 Jahre Laufzeit

(Juli 2011 bis Juni 2013)

– Mehr Infos: https://www.enargus.de

30.10.2012 PyCon 2012 6

Page 7: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

EnArgus: Teilsysteme

Für die Öffentlichkeit Für die interne Nutzung

EnArgus.public

• Einfache Bedienung

• Ansprechende Webseiten

• Eingeschränkter Zugriff

• Einfache Suchfunktionen

• Faceted Search

• Zugriff auf EnArgus.wiki

EnArgus.master

• Expertensuche

• Vollzugriff auf Vorhaben

• Hinzufügen von Inhalten

• Statistische Auswertungen

• Suchen speichern

• Suchen veröffentlichen

30.10.2012 PyCon 2012 7

Page 8: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

Recherche-Cockpit

Energie-forschungs

-Wiki

BSCW Core

EnArgus-DB Index Dokumente

Ontologie Core

Ontologie-DB

Kooperations- Unterstützg.

Ontologie- Editor

Auswertung & Visualisierung

Suchanfragen & -ergebnisse

Wiki-Texte

Wiki Core

EnArgus Systemarchitektur

30.10.2012 PyCon 2012 8

Page 9: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

Recherche-Cockpit

Energie-forschungs

-Wiki

BSCW Core

EnArgus-DB Index Dokumente

Ontologie Core

Ontologie-DB

Kooperations- Unterstützg.

Ontologie- Editor

Auswertung & Visualisierung

Suchanfragen & -ergebnisse

Wiki-Texte

Wiki Core

EnArgus Systemarchitektur

30.10.2012 PyCon 2012 9

Page 10: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

• Öffentliches Teilsystem

– Einfache Bedienung

– Ansprechende Webseiten

30.10.2012

Page 11: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

• Faceted Search – Einfache

Suchfunktion

– Einschränkung über Facetten

– Facette: Filter nach bestimmten Kriterien (auch mehrstufig)

30.10.2012

Page 12: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

• Detailansicht – Eingeschränkter

Zugriff auf Details

30.10.2012

Page 13: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

EnArgus Wiki

• Mehrfacher Nutzen – Einfache Bedienung

• Fachexperten beschreiben Anwendungsdomäne im Wiki

• Fachexperten müssen nichts über die Fachontologie wissen

– Wiki ist zugleich hilfreich für Anwender • Verknüpfung von Fachbegriffen mit Wiki als eine Art Glossar

• Wiki soll später der Öffentlichkeit zur Verfügung stehen

• Technische Basis – MoinMoin Wiki

– Einfache Integration („SSO“)

30.10.2012 PyCon 2012 13

Page 14: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

Wiki: Beispiele

30.10.2012 14

Page 15: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

Informationsextraktion

• Aufbau der Ontologie durch Textanalyse – Wiki-Texte werden (durch Software) ausgewertet

• Dabei erfolgt die Umwandlung von Text in Wissen! • Ergebnis der Informationsextraktion ist die

(aktualisierte/erweiterte) Ontologie

– Ziel: Unterstützung der Suche • z.B. Vorschlagen von verwandten Begriffen • Dadurch mehr relevante Treffer und zielgerichtete Suche

– Technik: • Text mining • Semantic Role Labeling (SRL)

– Tools: • GATE (General Architecture for Text Engineering) • Protegé (Ontologie-Editor und Java-Bibliothek)

30.10.2012 PyCon 2012 15

Page 16: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

Ontologie: Beispiel

Energiespeicher

Batterie

Blei-Säure-Batterie

Lithium-Ionen-Batterie

Natrium-Schwefel-Batterie

Nickel-Cadmium-Batterie

Nickel-Metallhydrid-Batterie

Redox-Flow-Batterie Vanadium-Redox-

Flow-Batterie

Druckluftspeicher

Kurzzeitspeicher

Wasserstoffspeicher

ist-ein

30.10.2012 PyCon 2012 16

Label: Flussbatterie Redox-Flow-Zelle Redox-Flussbatterie

Anode

Kathode

Elektrolyt

besteht-aus

Page 17: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

ENARGUS.MASTER Ontologiebasierte Suche

• Benutzer können eine

Suchanfrage starten und Suchbegriff(e) eingeben

• in der einfachen Suche werden Synonyme automatisch mit in die Anfrage einbezogen (optional, EnArgus.public)

• in der erweiterten Suche werden semantisch verwandte Begriffe (aus der Ontologie) angeboten (nur in EnArgus.master)

30.10.2012

Page 18: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

ENARGUS.MASTER Ontologiebasierte Suche

• Benutzer können eine

Suchanfrage starten und Suchbegriff(e) eingeben

• in der einfachen Suche werden Synonyme automatisch mit in die Anfrage einbezogen (optional, EnArgus.public)

• in der erweiterten Suche werden semantisch verwandte Begriffe (aus der Ontologie) angeboten (nur in EnArgus.master)

30.10.2012

Page 19: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

ENARGUS.MASTER Ontologiebasierte Suche

• Technik:

– JPype zur Anbindung an die Java-Bibliothek(en)

– Eigener Prozess verkürzt Zugriffszeit

• Starten der JVM und Laden der Bibliotheken (JAR)

• Laden der Ontologie (aus OWL-Datei)

Web-Request-Prozess

BSCW Core (Python)

Ontologie-Service-Prozess

Protégé-API

Ontologie-

Service (Python)

Bibliothek für Ontologie-Anfragen

(Java) :

Ontologie-Datei (OWL)

JPype Service RPC

30.10.2012

Page 20: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

ENARGUS.MASTER Erweiterte Suche

• Benutzerschnittstelle für Experten – Erlaubt Klammerung

von Suchbegriffen – Auswahl diverser

Attribute (Metadaten)

• Technik: – HTML/CSS/Dojo

(JavaScript Framework)

– Suchanfrage wird in JSON codiert

30.10.2012

Page 21: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

ENARGUS.MASTER Erweiterte Suche

• Benutzerschnittstelle für Experten – Komplexes Suchformular – Wunsch nach Übersicht

zur formulierten Suche Repräsentation in Graph Enthält Suchterme und

Klammerung Darstellung von UND- /

ODER-Gruppen

• Technik:

– GraphViz, pydot

30.10.2012 PyCon 2012 21

Page 22: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

ENARGUS.MASTER Vorhabendetails

• Detailansicht zu einem Projekt

– Metadaten

– Dokumente

– Verwandte Projekte

30.10.2012 PyCon 2012 22

Page 23: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

ENARGUS.MASTER Vorhabendetails

• Detailansicht zu einem Projekt

– Metadaten

– Dokumente

– Verwandte Projekte

30.10.2012 PyCon 2012 23

Page 24: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

ENARGUS.MASTER Auswertungen

• Akkumulation der Suchergebnisse

– z.B. Fragestellung: Verteilung der Förderkosten über die Jahre

• Technik

– pandas,matplotlib

30.10.2012

Page 25: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

ENARGUS.MASTER Auswertungen

• Akkumulation der Suchergebnisse

– z.B. Fragestellung: Verteilung der Förderkosten über die Jahre

• Technik

– pandas,matplotlib

30.10.2012

Page 26: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

Systeme im Einsatz

• BSCW-Server – Verwaltet Benutzer, Dokumente,

Metadaten, Zugriffsrechte etc.

• Wiki-Server – MoinMoin (angepasstes ‚look&feel‘) – Verwaltet Wiki-Texte der Fachexperten

• Ontology-Service – Basiert auf Protegé (Java) und OWL – Python-Bridge als lokaler Prozess

• Diverse Python Tools – Issue Tracker (Trac) – Test (Py.test) …

30.10.2012 PyCon 2012 26

Page 27: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

Bibliotheken im Einsatz

• Numpy, Pandas, Matplotlib – Statistische Auswertungen und Visualisierung

(Teil der Pydata Familie)

• GraphViz, pydot – Darstellung von Graphen

• PyLucene – Volltextsuche, Facetten

• JPype – Anbindung an Java-Bibliotheken

(hier: Protegé)

30.10.2012 PyCon 2012 27

Page 28: EnArgus – ein ontologiebasiertes Forschungsinformationssystem

Diskussion/Fragen

Kontakt für weitere Fragen

[email protected]

• @tomy_koch

Mehr Infos zum Projekt

• Am Stand im Foyer!

• www.enargus.de

30.10.2012 PyCon 2012 28

?