30
DATA SUPPORT OPEN Trainingsmodul 2.4 RDF-Vokabulare entwerfen und entwickeln Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen dabei, die Werte zu schaffen, nach denen sie suchen. Wir sind ein Netzwerk von Unternehmen mit nahezu 180.000 Mitarbeitern in 158 Ländern, die sich dazu verpflichtet fühlen Qualität in den Bereichen Assurance, Tax & Legal sowie Advisory zu liefern. Sagen Sie uns, was Ihnen wichtig ist und besuchen Sie für weitere Informationen unsere Webseite www.pwc.com PwC bezieht sich auf das PwC Netzwerk und/oder eine oder mehrere Mitgliedsfirmen, von denen jede ein rechtlich selbstständiges Unternehmen ist. Besuchen Sie unsere Webseite www.pwc.com/structure für weitere Details.

Das Entwerfen und die Entwicklung von Vokabularen in RDF

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORT

OPEN

Trainingsmodul 2.4

RDF-Vokabulare entwerfen und entwickeln

Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen dabei, die Werte zu schaffen, nach denen sie suchen. Wir sind ein Netzwerk von Unternehmen mit nahezu 180.000

Mitarbeitern in 158 Ländern, die sich dazu verpflichtet fühlen Qualität in den Bereichen Assurance, Tax & Legal sowie Advisory zu liefern. Sagen Sie uns, was Ihnen wichtig ist und besuchen Sie für

weitere Informationen unsere Webseite www.pwc.com

PwC bezieht sich auf das PwC Netzwerk und/oder eine oder mehrere Mitgliedsfirmen, von denen jede ein rechtlich selbstständiges Unternehmen ist. Besuchen Sie unsere Webseite

www.pwc.com/structure für weitere Details.

Page 2: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Diese Präsentation wurde von PwC erstellt Autoren: Nikolaos Loutas, Michiel De Keyzer, and Stijn Goedertier Metadaten der

Präsentation

Folie 2

Open Data Support wird von der Europäischen Kommission, gemäß SMART 2012/0107 ‘Lot 2: Provision of services for the Publication, Access and Reuse of Open Public Data across the European Union, through existing open data portals’(Vertrag No. 30-CE-0530965/00-17) finanziert. © 2014 European Commission

Disclaimer

1. Die Ansichten, die in dieser Präsentation vertreten werden, spiegeln ausschließlich die Meinung des Autors wider und dürfen unter keinen Umständen als offizielle Position der Europäischen Kommission interpretiert werden. Die Europäische Kommission übernimmt weder eine Garantie für die Genauigkeit der Informationen, die Inhalt dieser Präsentation sind, noch akzeptiert sie jegliche Verantwortung für die Nutzung der selbigen. Referenzen innerhalb dieser Präsentation zu spezifischen Produkten, Spezifikationen, Prozessen oder Services durch Handelsnamen, Markenzeichen, Hersteller oder ähnliches, implizieren nicht unbedingt deren Unterstützung oder Bevorzugung durch die Europäische Kommission. Der Autor hat sämtliche Anstrengungen unternommen, um sicherzustellen, dass er/sie, wo nötig, die Erlaubnis erhalten hat, die einzelnen Teile der in dieser Präsentation genutzten Manuskripte zu benutzen. Dies beinhaltet das Einholen einer Nutzungserlaubnis von den Lizenzinhabern oder deren gesetzlichen Vertretern zur Nutzung von Illustrationen, Karten, Schaubildern, die durch Rechte des geistigen Eigentums geschützt sind.

2. Diese Präsentation wurde sorgfältig von PwC zusammengestellt, jedoch gibt PwC keine Erklärung darüber ab und übernimmt keine Garantie dafür (weder ausdrücklich noch implizit), dass die Informationen in dieser Präsentation vollständig oder akkurat sind. PwC ist nicht für die Informationen in dieser Präsentation oder jedwede Entscheidung oder Konsequenz, die aus ihr resultieren, haftbar zu machen. PwC haftet nicht für etwaige Schäden, die durch die Nutzung der Informationen in dieser Präsentation entstehen sollten. Die Informationen in dieser Präsentation sind genereller Natur und einzig dafür bestimmt, eine Orientierungshilfe für Themen allgemeinen Interesses zu sein. Diese Präsentation ist kein Ersatz für professionelle Beratung zu jedwedem speziellen Thema. Kein Leser sollte auf der Basis der Themendarstellungen in dieser Präsentation handeln, ohne vorher angemessene professionelle Beratung einzuholen.

Page 3: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Lernziele

Am Ende dieses Trainingsmoduls sollten Sie wissen:

• was die Best-Practices bei der Erstellung eines RDF Vokabulars sind, mit dem Sie Ihre Daten modellieren können.

• wo Sie RDF Vokabulare zur Wiederverwendung finden können.

• wie Sie Ihr eigenes RDF-Vokabular erstellen können.

• wie Sie Ihre RDF-Vokabulare veröffentlichen können.

• wie der Prozess und die Methodik zur Entwicklung semantischer Vereinbarungen funktionieren, die vom ISA-Programm der Europäischen Kommission entwickelt wurden.

Folie 3

Page 4: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Inhalt

In diesem Modul geht es...

• um die einzelnen Schritte bei der Modellierung Ihrer Daten.

• darum, wie Sie vorhandene Vokabulare wiederverwenden können, um Ihre Daten zu modellieren.

• darum, wie Sie neue Klassen und Eigenschaften in RDF erstellen können.

• darum, wie und wo Sie Ihr RDF-Vokabular veröffentlichen können, damit es von Anderen wiederverwendet werden kann.

Folie 4

Page 5: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

RDF-Vokabular

Folie 5

„Ein Vokabular ist ein Datenmodell, das Klassen, Eigenschaften und Beziehungen beinhaltet, die dazu genutzt werden können Ihre Daten und Metadaten zu beschreiben.”

RDF Vokabulare sind Sammlungen von Begriffen, die dazu genutzt werden können Dinge zu beschreiben.

Ein Begriff ist entweder eine Klasse oder eine Eigenschaft.

Objekttyp Eigenschaften (Beziehungen)

Datentyp Eigenschaften (Attribute)

Page 6: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Was sind Klassen, Beziehungen und Eigenschaften?

Klasse. Ein Konstrukt, das Dinge in der realen und/oder virtuellen Welt darstellt, z.B. eine Person, eine Organisation oder ein Konzept wie “Gesundheit” oder “Freiheit”.

Beziehung. Eine Verbindung zwischen zwei Klassen: zwischen einem Dokument und der Organisation, die es veröffentlicht hat (d.h. Organisation veröffentlicht Dokument); oder zwischen einer Karte und der geografischen Region, die sie zeigt (d.h. Karte zeigt geografische Region). In RDF werden Beziehungen als Objekttyp Eigenschaften kodiert.

Eigenschaft. Eine Eigenschaft einer Klasse in einer bestimmten Dimension, wie z.B. der offizielle Name einer Organisation oder das Datum und die Zeit, wann ein Beobachtung gemacht wurde.

Folie 6

Page 7: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN Folie 7

Beispiele für Klassen, Beziehungen und Eigenschaften

http://.../org/2172798119

Ort http://example.com/site

/1234

RegisteredOrganisation Address

Dahliastraat 24, 2160 Wommelgem “Nike”

a a

fullAddress legalName

Kla

sse

Eig

ensc

haft

Beziehung

Page 8: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Modellieren Sie Ihre Daten Wie Sie andere Vokabulare wiederverwenden, Ihre eigenen Begriffe definieren und Ihre Vokabulare veröffentlichen und bewerben können, um damit Daten zu beschreiben.

Folie 8

Page 9: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

6 Schritte bei der Modellierung Ihrer Daten

Beginnen Sie mit einem festen Domainmodell, das nach einem strukturierten Prozess und Methodik entwickelt wurde.

Recherchieren Sie vorhandene Begriffe sowie deren Nutzung und maximieren Sie die Wiederverwendung dieser Begriffe.

Dort, wo neue Begriffe als Spezialisierungen von vorhandenen Begriffen betrachten werden können, erstellen Sie Unterklassen und Untereigenschaften.

Wenn neue Begriffe erforderlich sind, erstellen Sie sie gemäß allgemein anerkannter Best-Practices.

Veröffentlichen Sie Ihre Daten innerhalb einer sehr stabilen Umgebung, die erstellt wurde um persistent zu sein.

Publizieren Sie das RDF-Schema, indem sie es auf relevanten Services registrieren.

Folie 9

1

Siehe auch: https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas

2

3

4

5

6

Page 10: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Beginnen Sie mit einem robusten Domainmodell

Folie 10

1

class Domain Model

RegisteredOrganisation

- identifier

- name

- registrationDate

- status

- type

Address

- identifier

- fullAddress

- postcode

ContactPoint

- identifier

- name

- telephone

- email

- fax

- website

Activ ity

- identifier

- name

Certificate

- identifier

- name

location

organisationCertificate

contactInformation

organisationActivity

Page 11: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Verwenden Sie vorhandene Begriffe und Vokabulare wieder

• Universalvokabulare: DCMI, RDFS

• Um Dinge zu benennen: rdfs:label, foaf:name, skos:prefLabel

• Um Leute zu beschreiben: FOAF, vCard, Core Person Vocabulary

• Um Projekte zu beschreiben: DOAP, ADMS.SW

• Um eine semantische Interoperabilität zu beschreiben: ADMS

• Um registrierte Organisationen zu beschreiben: Registered Organisation Vocabulary

• Um Adressen zu beschreiben: vCard, Core Location Vocabulary

• Um öffentliche Dienstleistungen zu beschreiben: Core Public Service Vocabulary

• Um Datensätze zu beschreiben: DCAT, DCAT Anwendungsprofil, VoID

Folie 11

2

Page 12: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Anwendungsprofile erstellen

• Unterschiedliche Domains haben unterschiedliche Anforderungen an die domainspezifische Semantik, z.B. Klassifikationskonzepte.

• Generische RDF-Vokabulare liefern normalerweise die Basisklassen, die benötigt werden, um Erweiterungen zu erlauben, mit denen, sofern erforderlich, spezifische Unterklassenstrukturen oder Klassifikations-schemen hinzugefügt werden können.

• In solchen Fällen werden Wiederverwender dazu ermutigt, Anwendungsprofile einer speziellen Anwendungsdomain zu definieren, indem sie (sofern erforderlich) Unterklassen, Untereigenschaften und kontrollierte Vokabulare spezifizieren.

• Zum Beispiel:

DCAT Anwendungsprofil für Datenportale in Europa

Registered Organization Vokabular als Anwendungsprofil der Organisations-Ontologie.

Folie 12

Siehe auch: joinup.ec.europa.eu/asset/dcat_application_profile/home

Page 13: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Vorteile der Weiterverwendung

• Weiterverwendung fördert die Interoperabilität Ihrer Daten in hohem Maße.

Beispielsweise bewirkt die Verwendung von <dcterms:created>, dessen Wert ein Datumsformat vom Typ 2013-02-21^^xsd:date sein sollte, dass die Daten sofort von vielen Maschinen verarbeitbar sind. Wenn Ihr Schema Datenherausgeber dazu zwingt ein abweichendes Format für Bezeichnungen und das Datum, wie ex:date "21 February 2013“ zu benutzen, dann ist für veröffentlichte Daten, bei denen Ihr Schema genutzt wird, eine weitere Verarbeitung erforderlich um sie anderen Daten anzugleichen.

• Weiterverwendung erhöht die Glaubwürdigkeit Ihres Schemas.

Es zeigt, dass es mit genügend Sorgfalt und Professionalität veröffentlicht worden ist, was die Weiterverwendung weiter fördert.

• Weiterverwendung ist einfacher und billiger.

Durch die Weiterverwendung von Klassen und Eigenschaften gut definierter und richtig gehosteter Vokabeln vermeiden Sie, dass Sie die Bemühung ihrer Erstellung wiederholen müssen.

Folie 13

Page 14: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Hier können Sie vorhandene Vokabulare finden…

Folie 14

http://joinup.ec.europa.eu/

http://lov.okfn.org/

Page 15: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Erstellen Sie Unterklassen und Untereigenschaften

• RDF-Schemata und Vokabulare enthalten oft Begriffe, die sehr generisch sind.

• Durch die Erstellung von Unterklassen- und Untereigenschafts-beziehungen können Systeme, die die übergeordnete Eigenschaft oder Klasse verstehen, in der Lage sein, die Daten zu interpretieren; selbst wenn die spezifischeren Begriffe unbekannt sind.

• Vermeiden Sie es, Unterklassen und Untereigenschaften aus dem einzigen Grund zu erstellen, damit Sie Ihren eigenen Begriff verwenden können, um etwas zu beschreiben, was bereits existiert.

Folie 15

3

Page 16: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Erstellung von Untereigenschaften - Beispiel

Das Registered Organization Vokabular definiert drei Untereigenschaften von „org:classification“: ‚companyType‘, ‚companyStatus‘ und ‚companyActivity‘.

Folie 16

Page 17: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Eine Untereigenschaft in RDF definieren

<rdf:Property rdf:about="rov:companyType">

<rdfs:label xml:lang="en">company type</rdfs:label>

<rdfs:comment xml:lang="en" rdf:parseType="Literal">

This property records the type of company. Familiar types are SA, PLC, LLC, GmbH etc. Each jurisdiction will have a limited set of recognised company types and these should be used in a consistent manner using a skos:Concept as described in the <a href="#skos:Concept">Code</a> Class.

</rdfs:comment>

<rdfs:isDefinedBy rdf:resource="http://www.w3.org/ns/regorg#"/> <rdfs:range rdf:resource="skos:Concept"/>

<rdfs:subPropertyOf rdf:resource="org:classification" /> <dcterms:identifier>legal:companyType</dcterms:identifier>

</rdf:Property>

Folie 17

Page 18: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Wenn neue Begriffe erforderlich sind, erstellen Sie sie gemäß allgemein anerkannter Best-Practices.

Klassen beginnen mit einem Großbuchstaben und sind immer Singular, z.B. skos:Concept.

Eigenschaften beginnen mit einem Kleinbuchstaben, z.B. rdfs:label.

Objekteigenschaften sollten Verben sein, z.B. org:hasSite.

Datentypeigenschaften sollten Substantive sein, z.B. dcterms:description.

Verwenden Sie Großbuchstaben, wenn ein Begriff aus mehr als einem Wort besteht, z.B. foaf:isPrimaryTopicOf.

Folie 18

4

Page 19: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Definieren einer neuen Klasse - Organisation

<rdf:RDF

xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#”

xmlns:org=“htpp://example.org/organisation-schema”>

<rdf:Class rdf:about=“org:Organisation">

<rdfs:label xml:lang="en">Organisation</rdfs:label>

<rdfs:comment xml:lang:”en”>

Legal entity that is registered in an official national or regional

register.

</rdfs:comment>

</rdf:Class>

Folie 19

Page 20: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Definieren einer neuen Eigenschaft - registrationNumber

<rdf:RDF

xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#”

xmlns:org=“htpp://example.org/organisation-schema”>

<rdf:Property rdf:about=“org:registrationNumber">

<rdfs:label xml:lang="en">registrationNumber</rdfs:label>

<rdfs:comment xml:lang:”en”>

The number that a registered organisation receives upon registration in the official register.

</rdfs:comment>

</rdf:Class>

Folie 20

Page 21: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Definieren von Domain- und Bereichsbeschränkungen

<rdf:RDF

xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#”

xmlns:org=“htpp://example.org/organisation-schema”

xmlns:locn=“http://www.w3.org/ns/locn#”>

<rdf:Property rdf:about=“org:isLocated">

<rdfs:label xml:lang="en">isLocated</rdfs:label>

<rdfs:comment xml:lang:”en”>

The official address of the registered organisation’s headquarters.

</rdfs:comment>

<rdfs:domain rdf:resource=“org:Organisation”/>

<rdfs:range rdf:resource=“locn:Address”>

</rdf:Class>

Folie 21

http://example.org/org/1234 org:isLocated http://dbpedia.org/page/Brussels

Page 22: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Veröffentlichen Sie Ihre Daten innerhalb einer sehr stabilen Umgebung, die erstellt wurde um persistent zu sein

• Wählen Sie einen stabilen Namensraum für Ihr RDF-Schema (z.B. W3C, Purl...)

• Folgen Sie Good Practices bei der Veröffentlichung von persistenten Uniform Resource Identifier (URI) Sets, sowohl in Bezug auf das Format als auch auf Entwurfsregeln und Verwaltung.

• Beispiele:

http://www.w3.org/ns/adms

http://purl.org/dc/elements/1.1

Folie 22

5

Siehe auch: https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas http://www.slideshare.net/OpenDataSupport/design-and-manage-persitent-uris

Page 23: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Publizieren Sie das RDF-Schema, indem sie es auf relevanten Services registrieren

Sobald Ihr RDF-Schema veröffentlicht wurde, werden Sie wollen, dass die Leute es kennenlernen. Um ein breiteres Publikum zu erreichen, registrieren Sie es auf Joinup und Linked Open Vocabularies.

Folie 23

6

Refine the search results via the

faceted search f ilters.

2

1

3

http://joinup.ec.europa.eu

http://lov.okfn.org

Page 24: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Schlussfolgerungen

Folie 24

Beginnen Sie mit einem robusten Domainmodell, das nach einem strukturierten Prozess und Methodik entwickelt wurde.

Recherchieren Sie vorhandene Begriffe sowie deren Nutzung und maximieren Sie die Wiederverwendung dieser Begriffe.

Dort, wo neue Begriffe als Spezialisierungen von vorhandenen Begriffen betrachten werden können, erstellen Sie Unterklassen und Untereigenschaften.

Wenn neue Begriffe erforderlich sind, erstellen Sie sie gemäß allgemein anerkannter Best-Practices.

Veröffentlichen Sie Ihre Daten innerhalb einer sehr stabilen Umgebung, die erstellt wurde um persistent zu sein.

Publizieren Sie das RDF-Schema, indem sie es auf relevanten Services registrieren.

Analysieren

Modellieren

Veröffentlichen

Page 25: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Gruppenübung

Folie 25

Erstellen Sie in Zweiergruppen die RDF Beschreibung für ein Vokabular, das einen Bürger darstellt.

Was sind, Ihrer Meinung nach, die größten Hindernisse für die Weiterverwendung vorhandener RDF-Vokabulare?

http://www.visualpharm.com

http://www.visualpharm.com

Machen Sie auch den Online-Test!

Page 26: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Vielen Dank! ...und jetzt IHRE Fragen?

Folie 26

Page 27: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Referenzen

Folie 9:

• Linked Data Cookbook. W3C. http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook

Folie 10-23:

• ISA Programme. Cookbook for translating Data Models to RDF Schemas. https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas

Folie 16, 18-21:

• W3C. An organization ontology. http://www.w3.org/TR/vocab-org/

Folie 23:

• ADMS Brochure. ISA Programme. https://joinup.ec.europa.eu/elibrary/document/adms-brochure

Folie 27

Page 28: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Weiterführende Literatur

Linked Data Cookbook, W3C Government Linked Data Working Group,

http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook

EC, ISA Process and methodology for developing semantic agreements, https://joinup.ec.europa.eu/community/core_vocabularies/document/process-and-methodology-developing-semantic-agreements

EC ISA, Cookbook for translating Data Models to RDF Schemas https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas

Folie 28

Page 29: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Verwandte Projekte und Initiativen

Joinup, http://joinup.ec.europa.eu

Linked Open Vocabularies (LOV), http://lov.okfn.org/

EC ISA, e-Government Core Vocabularies, https://joinup.ec.europa.eu/community/core_vocabularies/home

W3C Schools – Learn RDF http://www.w3schools.com/rdf/default.asp

EUCLID, http://euclid-project.eu/

XML Summer School http://xmlsummerschool.com/

Folie 29

Page 30: Das Entwerfen und die Entwicklung von Vokabularen in RDF

DATASUPPORTOPEN

Werden Sie Teil unseres Teams...

Folie 30

Besuchen Sie uns

Kontaktieren Sie uns

Lernen Sie uns kennen

Folgen Sie uns

Open Data Support http://www.slideshare.net/OpenDataSupport

http://www.opendatasupport.eu Open Data Support http://goo.gl/y9ZZI

@OpenDataSupport [email protected]