52
DATA SUPPORT OPEN Trainingsmodul 1.5 Förderung der Weiterverwendung von Open Government Data durch die Open Data Interoperability Platform(ODIP) Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen dabei, die Werte zu schaffen, nach denen sie suchen. Wir sind ein Netzwerk von Unternehmen mit nahezu 180.000 Mitarbeitern in 158 Ländern, die sich dazu verpflichtet fühlen Qualität in den Bereichen Assurance, Tax & Legal sowie Advisory zu liefern. Sagen Sie uns, was Ihnen wichtig ist und besuchen Sie für weitere Informationen unsere Webseite www.pwc.com PwC bezieht sich auf das PwC Netzwerk und/oder eine oder mehrere Mitgliedsfirmen, von denen jede ein rechtlich selbstständiges Unternehmen ist. Besuchen Sie unsere Webseite www.pwc.com/structure für weitere Details.

Förderung der Weiterverwendung von offenen Regierungsdaten durch die Open Data Interoperability Platform

Embed Size (px)

DESCRIPTION

 

Citation preview

DATASUPPORT

OPEN

Trainingsmodul 1.5

Förderung der Weiterverwendung von Open Government Data durch die Open Data Interoperability Platform(ODIP)

Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen dabei, die Werte zu schaffen, nach denen sie suchen. Wir sind ein Netzwerk von Unternehmen mit nahezu 180.000

Mitarbeitern in 158 Ländern, die sich dazu verpflichtet fühlen Qualität in den Bereichen Assurance, Tax & Legal sowie Advisory zu liefern. Sagen Sie uns, was Ihnen wichtig ist und besuchen Sie für

weitere Informationen unsere Webseite www.pwc.com

PwC bezieht sich auf das PwC Netzwerk und/oder eine oder mehrere Mitgliedsfirmen, von denen jede ein rechtlich selbstständiges Unternehmen ist. Besuchen Sie unsere Webseite

www.pwc.com/structure für weitere Details.

DATASUPPORTOPEN

Diese Präsentation wurde von PwC erstellt Autoren: Michiel De Keyzer, Nikolaos Loutas and Stijn Goedertier Metadaten der

Präsentation

Folie 2

Open Data Support wird von der Europäischen Kommission, gemäß SMART 2012/0107 ‘Lot 2: Provision of services for the Publication, Access and Reuse of Open Public Data across the European Union, through existing open data portals’(Vertrag No. 30-CE-0530965/00-17) finanziert. © 2014 European Commission

Disclaimer

1. Die Ansichten, die in dieser Präsentation vertreten werden, spiegeln ausschließlich die Meinung des Autors wider und dürfen unter keinen Umständen als offizielle Position der Europäischen Kommission interpretiert werden. Die Europäische Kommission übernimmt weder eine Garantie für die Genauigkeit der Informationen, die Inhalt dieser Präsentation sind, noch akzeptiert sie jegliche Verantwortung für die Nutzung der selbigen. Referenzen innerhalb dieser Präsentation zu spezifischen Produkten, Spezifikationen, Prozessen oder Services durch Handelsnamen, Markenzeichen, Hersteller oder ähnliches, implizieren nicht unbedingt deren Unterstützung oder Bevorzugung durch die Europäische Kommission. Der Autor hat sämtliche Anstrengungen unternommen, um sicherzustellen, dass er/sie, wo nötig, die Erlaubnis erhalten hat, die einzelnen Teile der in dieser Präsentation genutzten Manuskripte zu benutzen. Dies beinhaltet das Einholen einer Nutzungserlaubnis von den Lizenzinhabern oder deren gesetzlichen Vertretern zur Nutzung von Illustrationen, Karten, Schaubildern, die durch Rechte des geistigen Eigentums geschützt sind.

2. Diese Präsentation wurde sorgfältig von PwC zusammengestellt, jedoch gibt PwC keine Erklärung darüber ab und übernimmt keine Garantie dafür (weder ausdrücklich noch implizit), dass die Informationen in dieser Präsentation vollständig oder akkurat sind. PwC ist nicht für die Informationen in dieser Präsentation oder jedwede Entscheidung oder Konsequenz, die aus ihr resultieren, haftbar zu machen. PwC haftet nicht für etwaige Schäden, die durch die Nutzung der Informationen in dieser Präsentation entstehen sollten. Die Informationen in dieser Präsentation sind genereller Natur und einzig dafür bestimmt, eine Orientierungshilfe für Themen allgemeinen Interesses zu sein. Diese Präsentation ist kein Ersatz für professionelle Beratung zu jedwedem speziellen Thema. Kein Leser sollte auf der Basis der Themendarstellungen in dieser Präsentation handeln, ohne vorher angemessene professionelle Beratung einzuholen.

DATASUPPORTOPEN

Lernziele

Am Ende dieses Trainingsmodul sollten Sie verstehen :

• wie Sie Barrieren bei der Weiterverwendung Ihrer Datensätze überwinden können.

• wie Open Data Support die Weiterverwendung von Datensätzen fördern kann.

• was das DCAT Anwendungsprofil ist und wie es verwendet werden kann.

• was die Open Data Interoperability Platform (ODIP) ist und wie sie verwendet werden kann.

Folie 3

DATASUPPORTOPEN

Inhalt

Dieses Modul enthält...

• einen Überblick über den Kontext von Open Government Data in Europa.

• einen Überblick über das Open Data Support Projekt.

• Informationen über das DCAT Anwendungsprofil für Datenportale in Europa als ein homogenisiertes Metadatenmodell.

• Information darüber, wie die Open Data Interoperability Plattform verwendet werden kann.

Folie 4

DATASUPPORTOPEN

In Europa gibt es mehr als 160 Portale, die Open Government Data bereitstellen

160+

Vorhandenes OGD Portal

Folie 5

DATASUPPORTOPEN

Open Data bietet großes Potenzial sozialen und wirtschaftlichen Mehrwert zu generieren

Folie 6

Öffentliche Verwaltungen teilen ihre Daten online

Entwickler/ Unternehmen suchen nach Daten

Veröffentlichung von Daten

Weiterverwendung von Daten

Bürger/Unternehmen profitieren von den Anwendungen (Services)

Entwickler/Unternehmen integrieren Daten in Anwendungen (Services)

DATASUPPORTOPEN

Hindernisse bei der Veröffentlichung und Weiter-verwendung von Open Government Data

Herausgeber Wiederverwender

Keine Übersicht darüber, bei welchen Daten es wahrscheinlicher ist, dass sie weitergenutzt werden/welche Daten ein höheres ROI-Potenzial haben.

Mangelnder Überblick über vorhandene/verfügbare Datensätze.

Unklares Geschäftsmodell für die Veröffentlichung von Open Data.

Unklares Geschäftsmodell für die Weiter-verwendung von Open Data.

Beschränkte Toolunterstützung. Daten sind oft von geringer Qualität, veraltet, unstrukturiert und/oder nicht maschinenlesbar.

Konkurrierende Lizenzen für Datensätze. Mangel an Lizenzinformation oder inkompatible Lizenzen.

Konkurrierende Vokabulare für die Beschreibung von Datensätzen.

Unterschiedliche Vokabulare bei der Suche nach Datensätzen.

Domainspezifische Anforderungen an Metadaten.

Mangel an (qualitativ hochwertigen) Metadaten.

Aufwand, um die Metadaten aktuell zu halten.

Mangel an Informationen über die Herkunft.

Folie 7

Meta

da

ten

Met

ad

ate

n

DATASUPPORTOPEN

Keine Weiterverwendung = kein sozialer und wirtschaftlicher Mehrwert

Folie 8

Öffentliche Verwaltungen teilen ihre Daten online

Entwickler/ Unternehmen suchen nach Daten

Bürger/Unternehmen profitieren von den Anwendungen (Services)

Entwickler/Unternehmen integrieren Daten in Anwendungen (Services)

DATASUPPORTOPEN

Open Data Support

... von der Europäischen Kommission finanziert, zielt DG CONNECT darauf ab, Zugangs- und Bewusstseins-barrieren zu senken.

Folie 9

DATASUPPORTOPEN

Die Aufgabe des Open Data Supports...

Folie 10

Die Sichtbarkeit und den Zugang zu Datensätzen

zu erleichtern, die auf lokalen und nationalen Open Data Portalen veröffentlicht wurden, um dadurch deren Weiterverwendung innerhalb und außerhalb

von nationalen Grenzen zu erhöhen.

Siehe auch: http://www.slideshare.net/OpenDataSupport

DATASUPPORTOPEN

Mit Hilfe von...

… einem vereinheitlichten

Zugang zu

Metadatenbeschrei-bungen offener Datensätze über einem einzigen

Zugangspunkt. ODIPP

Paneuropäisches Datenportal

Folie 11

DATASUPPORTOPEN

DCAT Anwendungsprofil Ein gemeinsames Vokabular für die Beschreibung von Datensätzen, die auf europäischen Datenportalen gehostet werden und auf dem „Data Catalogue Vocabulary“ (DCAT) basieren.

Folie 12

DATASUPPORTOPEN

Eine gemeinsame Initiative von...

Finanziert durch das ISA Programm unter Action 1.1. “Improving semantic interoperability in European eGovernment systems” (SEMIC project).

Folie 13

DATASUPPORTOPEN

Eine internationale Arbeitsgruppe von Experten

• Vorsitzender: Antonio Carneiro (Amt für Veröffentlichungen)

• 59 Arbeitsgruppenmitglieder, bestehend aus:

- 16 europäischen Mitgliedstaaten (UK,IT,ES,DK,DE,SK,BE,AT,SE,FI,FR,IE,NL,GR,SI )

- den USA

- mehreren europäischen Institutionen und internationalen Organisationen

- 40 verschiedenen Datenportalen

Folie 14

Siehe auch: https://joinup.ec.europa.eu/asset/dcat_application_profile/description

DATASUPPORTOPEN

Indem ein gemeinsames Metadatenschema verwendet wird um Datensätze zu beschreiben und Metadaten zu teilen, können…

• Datenherausgeber die Auffindbarkeit und so die Weiterverwendung ihrer Daten erhöhen.

• Datenverwender einheitlich über Plattformen hinweg suchen, ohne mit Schwierigkeiten konfrontiert zu werden, die durch die Verwendung von separaten Modellen oder Sprachunterschieden entstehen.

Folie 15

Die Qualität und die Verfügbarkeit von Metadatenbeschreibungen haben einen direkten Einfluss darauf, wie leicht Datensätze gefunden werden können!

DATASUPPORTOPEN

Das DCAT-AP ermöglicht den Austausch von Metadatenbeschreibungen zwischen Datenportalen

Folie 16

DATASUPPORTOPEN

Was beinhaltet die Spezifikation?

Folie 17

DATASUPPORTOPEN

Das Datenmodel des DCAT Anwendungsprofils

Folie 18

class DCAT-AP

«mandatory»

dcat:Catalog

«mandatory»

dct:description

dct:title

«recommended»

dct:issued

dct:modified

«optional»

dcat:CatalogRecord

«mandatory»

dct:modified

«recommended»

dct:issued

«optional»

dct:description

dct:title

«mandatory»

foaf: Agent

«mandatory»

foaf:name

«mandatory»

skos:ConceptScheme

«mandatory»

dct:title

«mandatory»

skos:Concept

«mandatory»

skos:prefLabel

«mandatory»

dcat:Dataset

«mandatory»

dct:description

dct:title

«optional»

adms:versionNotes

amds:version

dct:identifier

dct:issued

dct:modified

«recommended»

dcat:Distribution

«recommended»

dct:description

«optional»

dcat:byteSize

dcat:downloadURL

dcat:mediaType

dct:issued

dct:modified

dct:title

«optional»

dct:LicenseDocument

«optional»

foaf:Document

«optional»

dct:Frequency

«optional»

adms:Identifier

«optional»

dct:LinguisticSystem

«mandatory»

rdfs:Resource

«mandatory»

rdfs:Literal

«optional»

dct:Location

«optional»

dct:

MediaTypeOrExtent

«optional»

dct:PeriodOfTime

«optional»

schema:endDate

schema:startDate

«optional»

dct:RightsStatement

«optional»

dct:Standard

«optional»

v :VCard

dct:language

«optional»

dct:publisher

«mandatory»

dcat:themeTaxonomy

«recommended»

skos:inScheme

foaf:primaryTopic

«mandatory»

dcat:distribution

«recommended»

dcat:theme

«recommended»

dcat:dataset

«mandatory»

dct:publisher

«recommended»

adms:status

«recommended»

dct:l icense«recommended»

dct:type

«recommended»

dct:language

«recommended»

adms:contactPoint

«recommended»

dcat:record

«optional»

dct:spatial

«optional»

dcat:mediaType

«optional»

dcat:accessURL

«mandatory»

dcat:landingPage

«optional»

dct:spatial

«optional»foaf:homepage

«recommended»

dcat:keyword

«recommended»

dct:accrualPeriodicity

«optional» dct:conformsTo

«optional»

adms:identifier

«optional»

adms:status

«optional»

dct:rights

«optional»

dct:l icense

«recommended»

dct:format

«recommended»

dct:type

«recommended»

dct:temporal

«optional»

dct:rights

«optional»

DATASUPPORTOPEN

Verwendung des DCAT Anwendungsprofils

Vorgeschriebene Klasse: Ein Empfänger von Daten MUSS in der Lage sein, Informationen über die Instanzen der Klasse zu verarbeiten; der Absender der Daten MUSS Informationen über die Instanzen der Klasse liefern.

Empfohlene Klasse: Ein Empfänger von Daten MUSS in der Lage sein, Informationen über die Instanzen der Klasse zu verarbeiten; der Absender der Daten MUSS Informationen über Instanzen der Klasse liefern, sofern diese verfügbar sind.

Optionale Klasse: Ein Empfänger von Daten MUSS in der Lage sein, Informationen über die Instanzen der Klasse zu verarbeiten; der Absender der Daten KANN die Informationen liefern, ist aber nicht verpflichtet dies zu tun.

Vorgeschriebene Eigenschaft: Ein Empfänger von Daten MUSS in der Lage sein, Informationen für diese Eigenschaft zu verarbeiten; der Absender der Daten MUSS Informationen für diese Eigenschaft liefern.

Empfohlene Eigenschaft: Ein Empfänger von Daten MUSS in der Lage sein, Informationen für diese Eigenschaft zu verarbeiten; der Absender der Daten SOLLTE Informationen für diese Eigenschaft liefern, sofern diese verfügbar sind.

Optionale Eigenschaft: Ein Empfänger von Daten MUSS in der Lage sein, Informationen für diese Eigenschaft zu verarbeiten; der Absender der Daten KANN Informationen für diese Eigenschaft liefern, ist aber nicht verpflichtet dies zu tun.

Folie 19

DATASUPPORTOPEN

Kontrollierte Vokabulare

Folie 20

URI Eigenschaft Verwendet für

Klasse vorgeschlagenes Vokabular

dcat:mediaType Verteilung MDR File types Name Authority List

dcat:theme Datensatz EuroVoc domains

dcat:themeTaxonomy Katalog EuroVoc

dct:accrualPeriodicity Datensatz Dublin Core Collection Description Frequency

Vocabulary

dct:format Verteilung MDR File Type Named Authority List

dct:language Katalog, Datensatz MDR Languages Named Authority List

dct:publisher Katalog, Datensatz MDR Corporate bodies Named Authority List

dct:spatial Katalog, Datensatz MDR Countries Named Authority List, MDR Places

Named Authority List

adms:status Katalog, Eintragung ADMS change type vocabulary

dct:type Lizenz Dokument ADMS license type vocabulary

DATASUPPORTOPEN

Abbildungsbeispiel – GovData

Folie 21

dct:title (Dataset)

dct:description

dct:publisher

dct:title (Distribution)

Dcat:accessURL

dcat:keyword

dct:license

dct:theme

dct:issued

dct:PeriodOfTime

adms:contactPoint

DATASUPPORTOPEN

Beispiel: Beschreibung eines Datensatzes mit dem DCAT-AP

<rdf:Description rdf:about=“http://data.gov.uk/data ">

<rdf:type rdf:resource=“http://www.w3.org/ns/dcat#Catalog”/>

<dct:title xml:lang=“en”>data.gov.uk</dct:title>

<dct:description xml:lang=“en”>Description of the data portal</dct:description>

<dct:license rdf:resource=” http://www.nationalarchives.gov.uk/doc/open-government-licence”/>

</rdf:Description>

<rdf:Description rdf:about=“http://data.gov.uk/dataset/east-sussex-county-council-election-results”/>

<rdf:type rdf:resource=“http://www.w3.org/ns/dcat#Dataset”/>

<dct:title xml:lang=”en”>East Sussex County Council election results</dct:title>

<dct:description xml:lang=“en”>A list of elections to East Sussex County Council, which leads to data about candidates, parties, electoral divisions and votes cast. Uses the Open Election Data RDF vocabulary from http://openelectiondata.org/

</dct:description>

</rdf:Description>

<rdf:Description rdf:adbout=“http://www.eastsussex.gov.uk/yourcouncil/localelections/election2009/default.aspx”/>

<rdf:type rdf:resource=“http://www.w3.org/ns/dcat#Distribution”/>

<dct:title xml:lang=“en”>East Sussex County Council election 4 June 2009, and subsequent bi-elections</dct:title>

<dcat:accessURL rdf:resource=“http://www.eastsussex.gov.uk/yourcouncil/localelections/election2009/default.aspx “/>

<dct:license rdf:resource=“http://www.nationalarchives.gov.uk/doc/open-government-licence”/>

</rdf:Description>

Folie 22

DATASUPPORTOPEN

Wo können Sie das DCAT Anwendungsprofil finden?

Folie 23

https://joinup.ec.europa.eu/asset/dcat_application_profile/description

DATASUPPORTOPEN

Erstellen von Mappings für das DCAT-AP

Folie 24

DATASUPPORTOPEN

Teilen Sie Ihre Metadaten auf ODIP Die Open Data Interoperability Platform (ODIP) ermöglicht es Ihnen, Metadatendatensätze mit dem DCAT-AP zu teilen, um so die Auffindbarkeit und Sichtbarkeit Ihrer Datensätze zu verbessern, was letztendlich zu breiterer Weiterverwendung führt.

Folie 25

DATASUPPORTOPEN

Was kann ODIP?

• Metadaten von einem Open Data Portal sammeln.

• Metadaten in RDF transformieren.

• RDF-Metadaten harmonisieren, die in den vorherigen Schritten mit dem DCAT-AP produziert wurden.

• Die harmonisierten Metadaten gegenüber dem DCAT-AP validieren.

• Die Metadatenbeschreibung als Linked Open Metadata veröffentlichen.

• Die Metadaten automatisch auf Englisch übersetzen.

Folie 26

ODIPP

Paneuropäisches

Datenportal

DATASUPPORTOPEN

Wie kann ODIP Ihnen dabei helfen, Ihre Metadaten zu verbessern?

• ODIP bildet Ihre Metadaten auf ein Standardmodell ab, z.B. das DCAT-AP.

• ODIP hilft Ihnen dabei, standardisierte, mehrsprachige und kontrollierte Vokabulare in Ihren Metadaten wiederzuverwenden und ersetzt fehleranfällige Textwerte oder maßgeschneiderte Listen.

• Mittels seines Validierungsservices erlaubt Ihnen ODIP, Unstimmigkeiten und Fehler in Ihren Metadaten zu entdecken.

• ODIP ordnet Ihren Metadaten persistente URIs zu.

• ODIP verknüpft Ihre Metadaten mit anderen Metadaten und bereichert sie durch zusätzlichen Kontext; dadurch gewinnen diese an Bedeutung.

• ODIP übersetzt automatisch den Titel und die Beschreibung der Metadaten ins Englische

Folie 27

DATASUPPORTOPEN

Wie sieht ODIP aus?

http://odip.opendatasupport.eu

Folie 28

DATASUPPORTOPEN

Eine ODIP Aufgabe

Eine ODIP Aufgabe besteht aus drei möglichen Phasen, die in einer bestimmten Reihenfolge durchlaufen werden müssen und die aus mehreren Plug-ins zusammengesetzt sind.

1. Extraktion

2. Transformation

3. Laden

Folie 29

Außerdem können diese Aufgaben so geplant werden, dass sie periodisch, nacheinander oder manuell starten.

DATASUPPORTOPEN

Überblick über den ODIP Prozess „Extrahieren-

Transformieren-Laden“

Folie 30

DATASUPPORTOPEN

1. Extraktion

• In der Extraktionsphase werden Rohdaten mit Hilfe des entsprechenden Plug-Ins (abhängig von der Technologie der Quelle) aus einem gegebenen Open Data Quellportal abgefragt (extrahiert).

• Mögliche Extraktoren:

CKAN Extractor

RDF Extractor

SPARQL Extractor

Virtuoso Extractor

CSV Extractor

Folie 31

DATASUPPORTOPEN

2. Transformation

• Ziel der Transformationsphase ist es, die von dem Open Data Portal gesammelten Metadaten zu harmonisieren, zu bereinigen und darauf vorzubereiten auf ODIP gespeichert zu werden.

• Vorhandene Transformatoren:

ODS Value Mapper.

SPARQL Update Query Transformer.

ODS Cleaner.

ODS DCAT Application Profile Harmoniser.

ODS Modification Detector.

ODS Validator.

Web Translations.

Folie 32

DATASUPPORTOPEN

3. Laden

• In der Ladephase werden die gesammelten und harmonisierten Metadaten mit Hilfe des Virtuoso Loaders auf dem Virtuoso RDF Speicher gespeichert.

Folie 33

DATASUPPORTOPEN

Beispiel Sammeln von Daten eines CKAN-basierten Open Data Portals

1. Erstellen Sie einen neuen Job auf ODIP 2. Extraktionsphase

- Fügen Sie einen CKAN Extractor hinzu und konfigurieren Sie ihn, um Daten von einem CKAN API zu sammeln.

3. Transformationsphase - Fügen Sie den ODS Value Mapper hinzu - Fügen Sie einen SPARQL Update Query Transformer mit den relevanten

Fragen hinzu - Fügen Sie den ODS Cleaner hinzu - Fügen Sie den DCAT Application Profile Harmoniser hinzu - Fügen Sie einen Modifikationsdetektor hinzu - Fügen Sie den ODS Validator hinzu - Fügen Sie Web Translations hinzu

4. Ladephase - Laden Sie die extrahierten Daten mit Hilfe des Virtuoso Loaders in einem

Virtuoso RDF Store hoch

5. Planen Sie einen Job auf ODIP

Folie 34

DATASUPPORTOPEN

Beispiel – 1. Erstellen Sie eine Job auf ODIP

• Um einen neuen Job zu erstellen, klicken Sie auf “New Job”.

• Im unteren Teil des Bildschirms können Sie die aktuelle Aufgabenstellung innerhalb jeder der drei Phasen konfigurieren, indem Sie einen Tab auswählen.

• Für jede Phase können Sie entsprechende Module hinzufügen und konfigurieren.

Folie 35

Geben Sie dem Job einen Namen

Fügen Sie eine kurze

Beschreibung für den Job hinzu

Drücken Sie auf den “Add”-Knopf, um die Plug-Ins zu bestimmen, die eingesetzt

werden sollen

DATASUPPORTOPEN

Beispiel – 2. Extraktion: Hinzufügen und Konfigurieren eines CKAN Extraktors, um Daten von einem CKAN API zu sammeln

Nach dem Hinzufügen des CKAN Extraktor Plug-Ins werden Sie aufgefordert, das folgende Formular auszufüllen:

Folie 36

Der Web Standort des CKAN-Portals, von dem Sie Daten sammeln möchten. Das Portal sollte API Version 3 unterstützen und API muss aktiviert sein.

Herausgeber, Lizenz, Titel und Beschreibung: Wird im gespeicherten Katalog für die Eigenschaften von dct:publisher, dct:license, dct:title und dct:description verwendet.

Prädikatspräfix: JSON-Attribute werden in Prädikate umgewandelt, indem sie an das Prädikatspräfix angehängt werden. Die CKAN-API-Antwort ist in JSON, die wir dann in RDF umwandeln.

Themenpräfix: Das Präfix wird genutzt, um einen URI für die Metadaten des gesammelten Datensatzes zu erstellen. Das Thema wird erstellt als <subjectprefix>/dataset/<datasetid>

Ignorierte Schlüssel: Eine durch Kommata getrennte Liste von JSON-Attributen, die nicht in RDF-Triple konvertiert werden sollen.

DATASUPPORTOPEN

• Beginnen Sie, indem Sie den ODS DCAT Application Profile Harmonizer hinzufügen.

Dieses Plug-in erstellt die harmonisierten Katalogdaten und ein Grundgerüst für jeden Datensatz, den es identifiziert.

• Verwenden Sie den Modification Detector (Modifikationsdetektor), um die Herkunft von Daten zu vergleichen, die vom CKAN-Extraktor zwischen der gegenwärtigen und vorherigen Version der Rohdaten erzeugt wurden und das dct:modified Feld um Datensätze im Katalog zu setzen.

Es ist keine Konfiguration erforderlich.

Folie 37

Geben Sie einen Namen an, um den Katalog zu identifizieren.

Beispiel – 3. Transformation: Hinzufügen und Konfigurieren von Plug-Ins um Daten abzugleichen (1/3)

DATASUPPORTOPEN

• Abbildung der Beschreibung des Datensatzes in dct:description, so wie es das DCAT-AP erfordert.

• Verwenden Sie das ODS Cleaner Plug-in, um die in den aktiven Datensatz geladenen Rohdaten zu entfernen, bevor Sie diese in einer abgeglichenen Grafik speichern.

Es ist keine Konfiguration erforderlich.

Folie 38

Verwenden Sie den SPARQL Update Query Transformer, um vorhandene Eigenschaften und Werte zusätzlich zu den vom DCAT-AP empfohlenen abzubilden.

Beispiel – 3. Transformation: Hinzufügen und Konfigurieren von Plug-Ins um Daten abzugleichen (2/3)

DATASUPPORTOPEN

Das finale Ergebnis Ihrer Harmonisierungspipeline sollte der folgenden Abbildung ähneln:

Konfigurieren Sie den Virtuoso Loader, um die abgeglichenen Daten in Virtuoso hochzuladen.

Folie 39

Beispiel – 3. Transformation: Hinzufügen und Konfigurieren von Plug-Ins um Daten abzugleichen (2/3)

DATASUPPORTOPEN

Der Virtuoso Loader wird die generierten Triple im Virtuoso RDF-Speicher speichern. Die Triple werden in eine Grafikdatei Ihrer Wahl eingefügt.

Der Virtuoso Loader braucht einen Host, einen Port und die Benutzeranmeldedaten, um sich mit Ihrem Virtuoso-Server zu verbinden.

Folie 40

Beispiel – 4. Laden: Laden Sie die extrahierten Daten mit Virtuoso Loader in den Virtuoso RDF Store hoch

DATASUPPORTOPEN

Beispiel – 5. Planen Sie einen Job auf ODIP

Ein Job kann so geplant werden, dass er in einem festgelegten Intervall durchgeführt wird oder an einem anderen Job anschließt:

• Intervallplanung: <sec> <min> <hour> <day-of-month> <month> <day-of-week>

Beispiel:

0 0 4 * * * - jeden Tag um 4 Uhr

0 0 0 * * 1 - jeden Montag um Mitternacht

0 30 * * * - jede halbe Stunde nach einer vollen Stunde

• Verkettete Planung: Wählen Sie einen Job, nach dem dieser Job ausgeführt werden soll.

Folie 41

DATASUPPORTOPEN

ODIP Reporting-Tool

Folie 42

Jedes Mal wenn ein Job durchgeführt wurde, wird ein Bericht erstellt, den man wie im folgenden Screenshot einsehen kann:

Informiert den Benutzer, ob ein Plug-in korrekt funktioniert hat oder nicht

Wählen Sie den entsprechenden Job

DATASUPPORTOPEN

Entdecken Sie Datensätze mittels ODIP Die Open Data Interoperability Platform (ODIP) ermöglicht es Ihnen, Metadatendatensätze mit dem DCAT-AP zu teilen, um so die Auffindbarkeit und Sichtbarkeit Ihrer Datensätze zu verbessern, was letztendlich zu breiterer Weiterverwendung führt.

Folie 43

DATASUPPORTOPEN

Der öffentliche SPARQL-Endpunkt von ODIP Abfrageschnittstelle

Folie 44

http://data.opendatasupport.eu

DATASUPPORTOPEN

Der öffentliche SPARQL-Endpunkt von ODIP Ergebnis-Set

Folie 45

DATASUPPORTOPEN

Mehr über ODIP

• ODIP basiert auf der LOD Management Suite, die ursprünglich von der Semantic Web Company im Rahmen des LOD2 FP7-Projekts erstellt wurde.

• Die LOD Manager Suite wurde von TenForce im Rahmen des Open Data Supports um den Einsatz von ODIP erweitert.

• Es wird auf GitHub unter GPLv2 verfügbar gemacht.

Folie 46

DATASUPPORTOPEN

Schlussfolgerungen

• Gute Qualität von Metadatenbeschreibungen kann die Auffindbarkeit offener Datensätzen verbessern.

• DCAT-AP kann für den Abgleich von Metadaten für Datensätze verwendet werden, die auf verschiedenen Open Data Portalen gehostet sind. Es ermöglicht deren Abfrage mit einem einheitlichen Vokabular.

• ODIP kann die Sammlung und die Harmonisierung nach dem DCAT-AP sowie die Veröffentlichung der Metadaten als Linked Data auf verschiedenen Open Data Portalen unterstützen.

• Durch seinen öffentlichen SPARQL-Endpunkt liefert ODIP einen einzelnen Zugangspunkt zu Datensätzen aus ganz Europa

• Leichterer Zugang zu Datensätzen bedeutet eine höhere Wiederverwendung von Datensätzen.

Folie 47

DATASUPPORTOPEN

Gruppenfragen

Folie 48

Wie viele Open Government Data Portale in Ihrem Land kennen Sie?

Kennen Sie Anwendungen oder Dienste in Ihrem Land, die auf Open Government Data basieren?

Wie würden Sie die Sichtbarkeit von Open Government Data Portalen mit der Sichtbarkeit von traditionellen Datenanbietern, wie den nationalen statistischen Ämtern, vergleichen?

Haben Sie von der Open Government Data Initiative der Europäischen Kommission gehört?

http://www.visualpharm.com

http://www.visualpharm.com

http://www.visualpharm.com

http://www.visualpharm.com

Machen Sie auch den Online-Test!

DATASUPPORTOPEN

Vielen Dank! ...und jetzt IHRE Fragen?

Folie 49

DATASUPPORTOPEN

Referenzen

Folien 4, 6, 9, 10, 11 & 12:

• Open Data Support: How can we help you?. Open Data Support. http://www.slideshare.net/OpenDataSupport/open-data-support-service-description

Folie 12:

• Data Catalogue Vocabulary. http://www.w3.org/TR/vocab-dcat/

Folien 13-21:

• DCAT Application Profile for data portals in Europe Community. ISA Programme. https://joinup.ec.europa.eu/asset/dcat_application_profile/description https://joinup.ec.europa.eu/asset/dcat_application_profile/asset_release/all

Folien 23-35:

• LODMS User Manual for Open Data Support. Open Data Support

Folie 29:

• Figure from http://www.semantic-web.at/linked-open-data-management-suite-lodms

Folie 50

DATASUPPORTOPEN

Verwandte Projekte und Initiativen

DCAT Application Profile for Data Portals in Europe, https://joinup.ec.europa.eu/asset/dcat_application_profile/description

Publicdata.eu, http://www.w3.org/2011/gld/wiki/Main_Page

LOD2 FP7 Project, http://lod2.eu/

The Semantic Web Company, http://www.semantic-web.at/

Linked Open Data Management Suite, http://www.semantic-web.at/linked-open-data-management-suite-lodms

OpenLink Virtuoso, http://virtuoso.openlinksw.com/

Data Catalog Interoperability Protocol, http://spec.datacatalogs.org/

Folie 51

DATASUPPORTOPEN

Werden Sie Teil unseres Teams...

Folie 52

Besuchen Sie uns

Kontaktieren Sie uns

Lernen Sie uns kennen

Folgen Sie uns

Open Data Support http://www.slideshare.net/OpenDataSupport

http://www.opendatasupport.eu Open Data Support http://goo.gl/y9ZZI

@OpenDataSupport [email protected]