IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Preview:

DESCRIPTION

Talk given in Salzburg at IRIS 2014. In German. About linked vocabularies with focus on controlled vocabularies in the area tax law.

Citation preview

Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Mag. Blumauer Andreas

Semantic Web Companywww.semantic-web.at

www.poolparty.biz

Semantic Web Company GmbH

Gegründet 2001 in Wien

>20 Experts im Bereich semantischer Technologien

Produkt: PoolParty Suite (seit 2009)

Kunden: Globale Konzerne, NPOs, NGOs und GOs

Geschäftsführer, Wirtschaftsinformatiker

Kunden aus ‚wissensintensiven‘ Branchen

• Pearson• Roche• World Bank

• Daimler• Credit Suisse• Wolters Kluwer

• Nintendo• Council of EU• Wood Mackenzie

• Ministry of Finance (AUT)• Education Services (AUS)• Bank of America

Kunden aus der öffentlichen Verwaltung

AT Ministry of Finance - https://www.bmf.gv.at

AT Geological Survey - http://www.geologie.ac.at/

AUS Education Services - http://www.esa.edu.au

AUS Healthdirect - http://www.healthdirect.org.au

NOR Directorate of Immigration - http://www.udi.no/

SUI Swiss Federal Archives - http://www.bar.admin.ch/

UK Centre for Ecology & Hydrology - http://www.ceh.ac.uk

EU European Commission - http://ec.europa.eu/

EU Council of the EU - http://www.consilium.europa.eu

EU European Country of Origin Network – http://ecoi.net

Die Vortragsthemen

Informationsquellen zu bestimmten Rechtsgebieten wie Steuerrecht oder Zollrecht sind üblicher Weise mannigfaltig, kaum vernetzt und aus unterschiedlichsten Stakeholder-Perspektiven verfasst worden. Eine der größten Herausforderungen, denen sich viele juristische Berufe im Zeitalter von 'Big Data'

stellen müssen, ist die gezielte und kontextabhängige Vernetzung unterschiedlichster Informationsbestände entlang eines Entscheidungsprozesses.

Mit Hilfe kontrollierter Vokabulare und juristischer Thesauri, die auf Basis global anerkannter Technologiestandards entwickelt werden, können Fachinformationen gezielt und

automatisiert vernetzt werden. Werden Linked Data Standards wie SKOS ('Simple Knowledge Organization System') eingesetzt, so gelingt darüberhinaus die

organisationsübergreifende und multilinguale Informationsvernetzung auf effizientere Weise als je zuvor.

Zahlreiche Organisationen und ihre Fachvokabulare wie z.B. das Amt für Veröffentlichungen der

Europäischen Union (EuroVoc), das Schweizerische Bundesgericht (Jurivoc) oder das Leibniz-

Informationszentrum Wirtschaft (STW Thesaurus) haben bereits standard-basierte Vokabulare veröffentlicht, die in den nächsten Jahren den Status von Eckpfeilern für ein globales semantisches Web erlangen können.

Der Vortrag stellt die Anforderungen an ein Thesaurus-System des

Bundesministeriums für Finanzen dar, sowie ein Lösungskonzept, das u.a. auf

die Verwendung von offenen Linked Data Standards abzielt.

Warum Fachvokabulare?

Fachvokabulare: Glossare, Taxonomien, Thesauri, Ontologien

Fachvokabulare helfen, den Kontext eines Informationsobjekts genauer zu bestimmen, und damit die Bedeutung eines Begriffs zu determinieren

Die Notwendigkeit von permanent adressierbaren Referenzpunkten in einem babylonischen Sprachengeflecht wird immer offensichtlicher

Was bedeutet Kaffee?

Kaffee

• Stärke• Größe• Milch?• Schokolade?• Preis

Warum vernetzte Fachvokabulare?

VerwaltungsreformSearc

h

bmaskLebensministerium

bmvit BM.I

Standard basierte, vernetzte Fachthesauri

http://vocabulary.wolterskluwer.de/arbeitsrecht/10913

• EuroVoc• Thesaurus

Sozial-Wissenschaften• DBPedia• Standard-Thesaurus

Wirtschaft

50 Mrd.Fakten

Beispiel: Education Services Australia

SKOS-Thesauri in der Verwaltung

Eurovoc (EU)

ESCO (EU)

Jurivoc (SUI)

ScoT (AUS)

Agrovoc (UN)

GEMET (EEA)

GeoThesaurus (AT)

ST Wirtschaft (Leibniz Gesellschaft)

Polythematic SH (CZ)

Canadian SH (Can)

Worldbank Taxonomy (WBG)

Arbeitsrechts-Thesaurus (Wolters Kluwer)

Reegle Thesaurus (REEEP)

Demnächst: Steuerrechts-Thesaurus (AT)

Simple Knowledge Organization System (SKOS)

--- -- ----- -- ------- Umsatzsteuer-------- --- -------- -- Café---- -----

---- ---- ---- ---

--- --Mwst--- ------ --- ------ -- ---- --

---- ----- --- --Gastronomie---- -----

---- ---- ---- --- ------ -------- ----

http://voc.org.com/core/77

MwstaltLabel

Umsatzsteuer prefLabel

Gastronomie

Gastro

http://voc.org.com/core/176

Café

narrower

http://voc.org.com/core/44

Use Cases für SKOS entlang desContent Life Cycles

Fallbeispiel: WM-Werkzeug für das Finanzressort

Verbesserung / Vereinfachung des Annotationsprozesses(“hoher redaktioneller Aufwand notwendig, Schlagworte, Synonyme etc. zu jedem einzelnen Dokument zu vergeben”)

Suche auf Basis der Bedeutung eines Suchbegriffs (“Expertensprache, Umgangsprache, Synonyme, ähnliche Begriffe, …”)

Aufbau und Einsatz von Ressort-spezifischen Fach-Thesauri (Steuerrecht, Zollrecht, …)

Vereinfachung des Annotationsprozesses

Zu den vorgeschlagenen Tags kann Kontextinformation aus dem Wissens-graph angezeigt werden.

Extraktion von Enititäten mit PoolParty

Import von Excel, Word, PDF, CSV, XML, SKOS/RDF; integrierbar mit Oracle, SharePoint, Google, Mindbreeze, FirstSpirit, Drupal, Wordpress, …

FINDOK: Konzept-basierte Suche

Semi-automatische Erstellung von semantischen Fachvokabularen

Österreichischer Steuerrechtsthesaurus - Grundstruktur

Allgemeinbegriffe - Synonymverwaltung

Recommended