Download pdf - Dietze linked data-vr-es

Transcript

Linked Data für die semantische

Integration von VRE Daten

Stefan Dietze

L3S Research Center

- Herder Institut, 18.3.2015 -

18/03/15 1 Stefan Dietze

Aktuelle Anwendungsschwerpunkte

Anwendungs- & Forschungsdaten Architektur/Cultural Heritage

DURAARK und verwandte Initiativen

Daten für Bildung und Bildungsforschung:

W3C Community Group on Linked Open Education

LinkedUp / Data Catalog

Research areas

Web science, Information Retrieval, Semantic Web & Linked Data, data & knowledge integration

Anwendungsdomänen: TEL/Education, Web archiving, scientific data management

Einige Projekte

Introduction

http://www.l3s.de/

18/03/15 2

See also: http://purl.org/dietze

Stefan Dietze

Semantic Web/Linked Data: Beispiel “Google Knowledge Graph”

18/03/15 3 Stefan Dietze

Google Knowledge Graph

Strukturiertes Faktenwissen aus z.B. DBpedia, Freebase etc.

Repräsentiert im standardisierten, maschinen-lesbaren Format „RDF“ (Resource Description Framework)

dbp:United_States

http://dbpedia.org/resource/Cambridge_MA

dbp:W3C

country

cityOf

dbp:MIT

ru.dbp:Кембридж_(Массачусетс)

sameAs

headquarterOf

Semantic Web/Linked Data: Beispiel “Google Knowledge Graph”

18/03/15 4 Stefan Dietze

Semantic Web/Linked Data

Gesamtheit “aller” RDF Datasets

Linked Data Prinzipien: RDF, SPARQL und URIs

Linked Data Cloud: vernetzter Graph aus offenen Web Daten (500+ Datasets and 100 Mrd RDF Statements)

dbp:United_States

http://dbpedia.org/resource/Cambridge_MA

dbp:W3C

country

cityOf

schema:City

typeOf

dbp:MIT

ru.dbp:Кембридж_(Массачусетс)

sameAs

headquarterOf

Semantic Web/Linked Data: Beispiel “Google Knowledge Graph”

18/03/15 5 Stefan Dietze

geonames:4931972

sameAs

Linked Data für Architektur/Cultural Heritage?

18/03/15 Stefan Dietze 6

RDF Vokabulare

Kontext/Hintergrundwissen:

Geodaten und Geokontext

Historie

Statistische Daten etc

Gadiraju, U., Kawase, R., Dietze, S., Extracting

Architectural Patterns from Web data, in Proceedings of

13th International Semantic Web Conference (ISWC2014),

Riva Del Garda, Italy, October 2014 [ Best ISWC2014

Poster Award ]

DURAARK Consortium

18/03/15 Stefan Dietze 7

http://www.duraark.eu

Goals

Semantische Anreicherung und Archivierung von Architekturdaten (3D Models, Metadata, relevante Web Daten/Linked Data)

“DURAARK: Durable Architectural Knowledge”in a

Herausforderungen

Diverse Stakeholder: Architekten, Cultural Heritage Experten/Forscher, Urban Planner

Diverse und “evolving” Daten: low-level Point Clouds & Legacy 3D Modelle, Building Information Models (BIM), abstraktere semantische Informationen & Vokabulare

Komplexe Kontextinformation zu: Infrastruktur, Historie, gesetzlichen Rahmenbedingungen, Umwelt, etc

Automatisierte “Semantische Anreicherung” von Architekturwissen: (Linked) Web Data zur Anreicherung, Verlinkung, Disambiguierung

Archivierung und temporale Analyse

Building Data Web Data and Vocabularies

“DURAARK: Durable Architectural Knowledge”in a

18/03/15 Stefan Dietze 8

DURAARK Ergebnisse: Daten & Interface

“DURAARK Workbench”

18/03/15 Stefan Dietze 9

“Semantic Digital Archive” (analog zu WissKI/Graph Database)

RDF Vokabulare (BuildM, IFCM etc)

“BuildM Schema”: RDF Vokabular (ähnlich CHML), aligned mit schema.org, FOAF, DBpedia ontology, Geonames

http://data.duraark.eu/sparql

http://data.duraark.eu/vocab/buildm

http://workbench.duraark.eu

DURAARK Ergebnisse: Methoden, Tools, Komponentenutshell

18/03/15 Stefan Dietze 10

Geometric Enrichment: Detection von Shapes und Structures

Point Clouds/CAD => IFC

Semantic Enrichment Methoden

Focused Crawling von Linked Data

Langzeitarchivierung

LinkedUp-Herausforderung: Suche nach Daten

Stefan Dietze 18/03/15

? ? ?

Domäne/Disziplin: Welche Datasets/Ressourcen nützlich für Thema XY (z.B. „Astronomy“) ?

Ressourcen Typen: Welche Datasets beinhalten statistische Daten, bibliogr. Ressourcen, AV Material, Publikationen?

Links: Welche Datasets/Ressourcen sind ähnlich?

Qualität: Aktualität, Dynamik, Erreichbarkeit, Korrektheit

11

http://www.linkedup-project.eu/

“LinkedUp Catalog”: Daten für Bildung & Bildungsforschung

Automatische Extraktion von Dataset Metadata

[WebSci2013, ESWC2013, ESWC2014]

Stefan Dietze 18/03/15 12

Dataset

Catalog/Registry

Kuratierung existierender Datasets (z.B. OER, bibliographische Daten, University Data)

Veröffentlichung neuer Linked Datasets mit Content Anbietern (z.B. Elsevier, ACM, SoLAR)

http://data.linkededucation.org/linkedup/catalog/

LinkedUp Catalog: umfangreichste Zusammenstellung von LD/Open Data für Bildung und Bildungsforschung (ca. 50 Datasets)

Automatisierte Anreicherung mit Hintergrundwissen & Links

The LinkedUp Data Catalogue: A Meta-Dataset of Linked

Datasets in the Education Domain, d'Aquin, M., Adamou, A.,

Dietze, S., Fetahu, B., Semantic Web Journal, under review.

.

LinkedUp Catalog: Federated Search, Automatische Annotationen in a nutshell

“Federated Queries” durch Schema Mappings

Automatisierte Kategorisierung & Metadaten („Topics“)

Stefan Dietze 18/03/15 13

http://data.linkededucation.org/linkedup/catalog/

Topics: DBpedia Kategorien

Beispiel “LAK Dataset”

Forschungsressourcen in Kooperation mit

Linked Data Corpus aller relevanten „Learning Analytics“ und „Educational Data Mining“ Publikationen (5 Jahre, relevante Journals & Konferenzen, ca. 800 Publikationen)

Metadaten und Voll-Text als Linked Data (direkte Verlinkung mit Forschungsdaten in Arbeit)

Genutzt in Vielzahl von Anwendungen; LAK Data Challenge: http://lak.linkededucation.org

Facilitating Scientometrics in Learning Analytics and Educational

Data Mining - the LAK Dataset, Taibi, D., Dietze, S., D’Aquin,

Semantic Web Journal (accepted with minor revisions), 2014.

Proceedings of the LAK Data Challenge 2014, held at the 4th

Conference on Learning Analytics and Knowledge (LAK2014), Eds.:

Drachsler, H., Dietze, S., d’Aquin, M., Herder, E., Taibi, D.,, CEUR

Workshop Proceedings, Vol. 1137, 2014.

18/03/15 Stefan Dietze

Journals &

conference

proceedings

RDF

„5-Star“ Linked Data

14

Zusammenfassung: Linked Data & VRE’s in a nutshell

Zusammenfassung

Linked Data/Semantic Web für Datenrepräsentation und Nutzung in VREs

Zahlreiche verwandte Tools (Text Mining, NER etc),

(Verlinkte) Vokabulare und Datasets, speziell für Forschungsinformationen und Domänenwissen

Beispiele: DURAARK Semantic Digital Archive (SDA), LAK Dataset, LinkedUp Data Catalog

Relevante Links – Linked Data in Architecture

DURAARK => http://duraark.eu

W3C Community Group on Linked Building Data => https://www.w3.org/community/lbd/

DURAARK „SDA“ => http://data.duraark.eu/sparql

Relevante Links – Linked Data (allgemein, Forschungsdaten/Bildung)

LinkedUp Data Catalog => http://data.linkededucation.org/linkedup/catalog/

W3C Community Group on Linked Data in Eductaion => https://www.w3.org/community/opened/

18/03/15 Stefan Dietze 15

16 Stefan Dietze 18/03/15

Vielen Dank für Ihre Aufmerksamkeit!

Weitere Links

http://purl.org/dietze

http://www.l3s.de

http://data.l3s.de


Recommended