22
Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web Mag. Blumauer Andreas Semantic Web Company www.semantic-web.at www.poolparty.biz

IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Embed Size (px)

DESCRIPTION

Talk given in Salzburg at IRIS 2014. In German. About linked vocabularies with focus on controlled vocabularies in the area tax law.

Citation preview

Page 1: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Mag. Blumauer Andreas

Semantic Web Companywww.semantic-web.at

www.poolparty.biz

Page 2: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Semantic Web Company GmbH

Gegründet 2001 in Wien

>20 Experts im Bereich semantischer Technologien

Produkt: PoolParty Suite (seit 2009)

Kunden: Globale Konzerne, NPOs, NGOs und GOs

Geschäftsführer, Wirtschaftsinformatiker

Page 3: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Kunden aus ‚wissensintensiven‘ Branchen

• Pearson• Roche• World Bank

• Daimler• Credit Suisse• Wolters Kluwer

• Nintendo• Council of EU• Wood Mackenzie

• Ministry of Finance (AUT)• Education Services (AUS)• Bank of America

Page 4: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Kunden aus der öffentlichen Verwaltung

AT Ministry of Finance - https://www.bmf.gv.at

AT Geological Survey - http://www.geologie.ac.at/

AUS Education Services - http://www.esa.edu.au

AUS Healthdirect - http://www.healthdirect.org.au

NOR Directorate of Immigration - http://www.udi.no/

SUI Swiss Federal Archives - http://www.bar.admin.ch/

UK Centre for Ecology & Hydrology - http://www.ceh.ac.uk

EU European Commission - http://ec.europa.eu/

EU Council of the EU - http://www.consilium.europa.eu

EU European Country of Origin Network – http://ecoi.net

Page 5: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Die Vortragsthemen

Informationsquellen zu bestimmten Rechtsgebieten wie Steuerrecht oder Zollrecht sind üblicher Weise mannigfaltig, kaum vernetzt und aus unterschiedlichsten Stakeholder-Perspektiven verfasst worden. Eine der größten Herausforderungen, denen sich viele juristische Berufe im Zeitalter von 'Big Data'

stellen müssen, ist die gezielte und kontextabhängige Vernetzung unterschiedlichster Informationsbestände entlang eines Entscheidungsprozesses.

Mit Hilfe kontrollierter Vokabulare und juristischer Thesauri, die auf Basis global anerkannter Technologiestandards entwickelt werden, können Fachinformationen gezielt und

automatisiert vernetzt werden. Werden Linked Data Standards wie SKOS ('Simple Knowledge Organization System') eingesetzt, so gelingt darüberhinaus die

organisationsübergreifende und multilinguale Informationsvernetzung auf effizientere Weise als je zuvor.

Zahlreiche Organisationen und ihre Fachvokabulare wie z.B. das Amt für Veröffentlichungen der

Europäischen Union (EuroVoc), das Schweizerische Bundesgericht (Jurivoc) oder das Leibniz-

Informationszentrum Wirtschaft (STW Thesaurus) haben bereits standard-basierte Vokabulare veröffentlicht, die in den nächsten Jahren den Status von Eckpfeilern für ein globales semantisches Web erlangen können.

Der Vortrag stellt die Anforderungen an ein Thesaurus-System des

Bundesministeriums für Finanzen dar, sowie ein Lösungskonzept, das u.a. auf

die Verwendung von offenen Linked Data Standards abzielt.

Page 6: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Warum Fachvokabulare?

Fachvokabulare: Glossare, Taxonomien, Thesauri, Ontologien

Fachvokabulare helfen, den Kontext eines Informationsobjekts genauer zu bestimmen, und damit die Bedeutung eines Begriffs zu determinieren

Die Notwendigkeit von permanent adressierbaren Referenzpunkten in einem babylonischen Sprachengeflecht wird immer offensichtlicher

Page 7: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web
Page 8: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Was bedeutet Kaffee?

Kaffee

• Stärke• Größe• Milch?• Schokolade?• Preis

Page 9: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Warum vernetzte Fachvokabulare?

VerwaltungsreformSearc

h

bmaskLebensministerium

bmvit BM.I

Page 10: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Standard basierte, vernetzte Fachthesauri

http://vocabulary.wolterskluwer.de/arbeitsrecht/10913

• EuroVoc• Thesaurus

Sozial-Wissenschaften• DBPedia• Standard-Thesaurus

Wirtschaft

50 Mrd.Fakten

Page 11: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Beispiel: Education Services Australia

Page 12: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

SKOS-Thesauri in der Verwaltung

Eurovoc (EU)

ESCO (EU)

Jurivoc (SUI)

ScoT (AUS)

Agrovoc (UN)

GEMET (EEA)

GeoThesaurus (AT)

ST Wirtschaft (Leibniz Gesellschaft)

Polythematic SH (CZ)

Canadian SH (Can)

Worldbank Taxonomy (WBG)

Arbeitsrechts-Thesaurus (Wolters Kluwer)

Reegle Thesaurus (REEEP)

Demnächst: Steuerrechts-Thesaurus (AT)

Page 13: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Simple Knowledge Organization System (SKOS)

--- -- ----- -- ------- Umsatzsteuer-------- --- -------- -- Café---- -----

---- ---- ---- ---

--- --Mwst--- ------ --- ------ -- ---- --

---- ----- --- --Gastronomie---- -----

---- ---- ---- --- ------ -------- ----

http://voc.org.com/core/77

MwstaltLabel

Umsatzsteuer prefLabel

Gastronomie

Gastro

http://voc.org.com/core/176

Café

narrower

http://voc.org.com/core/44

Page 14: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Use Cases für SKOS entlang desContent Life Cycles

Page 15: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Fallbeispiel: WM-Werkzeug für das Finanzressort

Verbesserung / Vereinfachung des Annotationsprozesses(“hoher redaktioneller Aufwand notwendig, Schlagworte, Synonyme etc. zu jedem einzelnen Dokument zu vergeben”)

Suche auf Basis der Bedeutung eines Suchbegriffs (“Expertensprache, Umgangsprache, Synonyme, ähnliche Begriffe, …”)

Aufbau und Einsatz von Ressort-spezifischen Fach-Thesauri (Steuerrecht, Zollrecht, …)

Page 16: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Vereinfachung des Annotationsprozesses

Zu den vorgeschlagenen Tags kann Kontextinformation aus dem Wissens-graph angezeigt werden.

Page 17: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Extraktion von Enititäten mit PoolParty

Import von Excel, Word, PDF, CSV, XML, SKOS/RDF; integrierbar mit Oracle, SharePoint, Google, Mindbreeze, FirstSpirit, Drupal, Wordpress, …

Page 18: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

FINDOK: Konzept-basierte Suche

Page 19: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Semi-automatische Erstellung von semantischen Fachvokabularen

Page 20: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Österreichischer Steuerrechtsthesaurus - Grundstruktur

Page 21: IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

Allgemeinbegriffe - Synonymverwaltung