Transcript
Page 1: Semantic Web Grundlagen - Linked Data · Semantic Web Grundlagen Birte Glimm Institut für Künstliche Intelligenz j 02. Feb 2012 Linked Data 2/42Birte Glimm j Semantic Web Grundlagen

Semantic Web GrundlagenBirte GlimmInstitut für Künstliche Intelligenz | 02. Feb 2012

Linked Data

2/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Organisatorisches: Inhalt

Einleitung und XML 17. Okt Hypertableau II 12. DezEinführung in RDF 20. Okt Übung 4 15. DezRDF Schema 24. Okt SPARQL Syntax & Intuition 19. Dezfällt aus 27. Okt SPARQL Semantik 22. DezLogik – Grundlagen 31. Okt SPARQL 1.1 9. JanÜbung 1 3. Nov Übung 5 12. JanSemantik von RDF(S) 7. Nov SPARQL Entailment 16. JanRDF(S) & Datalog Regeln 10. Nov SPARQL Implemetierung 19. JanOWL Syntax & Intuition 14. Nov Ontology Editing 23. JanÜbung 2 17. Nov Übung 6 26. JanOWL & BLs 21. Nov Ontology Engineering 30. JanOWL 2 24. Nov Linked Data 2. FebTableau 28. Nov SemWeb Anwendungen 6. FebÜbung 3 1. Dez Übung 7 9. FebBlocking & Unravelling 5. Dez Wiederholung 13. FebHypertableau 8. Dez Übung 8 16. Feb

Abfragen und RIF wurde gestrichen

3/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Linked Data

4/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Daten im Web

I Immer mehr Websites stellen einen programmatischenZugriff auf ihre Daten zur Verfügung

I Dabei werden Semantic Web Standards verwendet, z.B.die Linking Open Data (LOD) Initiativehttp://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData

I Verwendet werden APIs, z.B. via JSON/REST

I Semantic Web Technologien vereinfachen die Integrationvon Daten aus verschiedenen Quellen

I Die Kombination von Daten erlaubt auf tiefere Einblicke

Page 2: Semantic Web Grundlagen - Linked Data · Semantic Web Grundlagen Birte Glimm Institut für Künstliche Intelligenz j 02. Feb 2012 Linked Data 2/42Birte Glimm j Semantic Web Grundlagen

5/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Linked Data im Web 01.05.2007

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch.http://lod-cloud.net/

6/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Linked Data im Web 31.03.2008

SWConference

Corpus

DBpedia RDF Book Mashup

DBLPBerlin

Revyu

Project Guten-berg

FOAFprofiles

Geo-names

Music-brainz

Magna-tuneJamendo

World Fact-book

DBLPHannover

SIOCprofiles

Sem-Web-

Central

Euro-stat

ECS South-ampton

BBCLater +TOTP

Doap-space

Open-Guides

Gov-Track

US Census Data

W3CWordNet

flickrwrapprWiki-

company

OpenCyc

lingvoj

Onto-world

BBCJohnPeel

Flickrexporter

Audio-Scrobbler QDOS

updated

RKB Explorer

NEW!riese

NEW!

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch.http://lod-cloud.net/

7/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Linked Data im Web 14.07.2009

As of July 2009

LinkedCTReactome

Taxonomy

KEGG

PubMed

GeneID

Pfam

UniProt

OMIM

PDB

SymbolChEBI

Daily Med

Disea-some

CAS

HGNC

InterPro

Drug Bank

UniParc

UniRef

ProDom

PROSITE

Gene Ontology

HomoloGene

PubChem

MGI

UniSTS

GEOSpecies

Jamendo

BBCProgrammes

Music-brainz

Magna-tune

BBCLater +TOTP

SurgeRadio

MySpaceWrapper

Audio-Scrobbler

LinkedMDB

BBCJohnPeel

BBCPlaycount

Data

Gov-Track

US Census Data

riese

Geo-names

lingvoj

World Fact-book

Euro-stat

flickrwrappr

Open Calais

RevyuSIOCSites

Doap-space

Flickrexporter

FOAFprofiles

CrunchBase

Sem-Web-

Central

Open-Guides

Wiki-company

QDOS

Pub Guide

RDF ohloh

W3CWordNet

OpenCyc

UMBEL

Yago

DBpediaFreebase

Virtuoso Sponger

DBLPHannover

IRIT Toulouse

SWConference

Corpus

RDF Book Mashup

Project Guten-berg

DBLPBerlin

LAAS- CNRS

Buda-pestBME

IEEE

IBM

Resex

Pisa

New-castle

RAE 2001

CiteSeer

ACM

DBLP RKB

Explorer

eprints

LIBRIS

SemanticWeb.org

Eurécom

RKBECS

South-ampton

CORDIS

ReSIST ProjectWiki

NationalScience

Foundation

ECS South-ampton

LinkedGeoData

BBC Music

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch.http://lod-cloud.net/

8/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Linked Data im Web 22.09.2010

As of September 2010

MusicBrainz

(zitgist)

P20

YAGO

World Fact-book (FUB)

WordNet (W3C)

WordNet(VUA)

VIVO UFVIVO

Indiana

VIVO Cornell

VIAF

URIBurner

Sussex Reading

Lists

Plymouth Reading

Lists

UMBEL

UK Post-codes

legislation.gov.uk

Uberblic

UB Mann-heim

TWC LOGD

Twarql

transportdata.gov

.uk

totl.net

Tele-graphis

TCMGeneDIT

TaxonConcept

The Open Library (Talis)

t4gm

Surge Radio

STW

RAMEAU SH

statisticsdata.gov

.uk

St. Andrews Resource

Lists

ECS South-ampton EPrints

Semantic CrunchBase

semanticweb.org

SemanticXBRL

SWDog Food

rdfabout US SEC

Wiki

UN/LOCODE

Ulm

ECS (RKB

Explorer)

Roma

RISKS

RESEX

RAE2001

Pisa

OS

OAI

NSF

New-castle

LAAS

KISTIJISC

IRIT

IEEE

IBM

Eurécom

ERA

ePrints

dotAC

DEPLOY

DBLP (RKB

Explorer)

Course-ware

CORDIS

CiteSeer

Budapest

ACM

riese

Revyu

researchdata.gov

.uk

referencedata.gov

.uk

Recht-spraak.

nl

RDFohloh

Last.FM (rdfize)

RDF Book

Mashup

PSH

ProductDB

PBAC

Poké-pédia

Ord-nance Survey

Openly Local

The Open Library

OpenCyc

OpenCalais

OpenEI

New York

Times

NTU Resource

Lists

NDL subjects

MARC Codes List

Man-chesterReading

Lists

Lotico

The London Gazette

LOIUS

lobidResources

lobidOrgani-sations

LinkedMDB

LinkedLCCN

LinkedGeoData

LinkedCT

Linked Open

Numbers

lingvoj

LIBRIS

Lexvo

LCSH

DBLP (L3S)

Linked Sensor Data (Kno.e.sis)

Good-win

Family

Jamendo

iServe

NSZL Catalog

GovTrack

GESIS

GeoSpecies

GeoNames

GeoLinkedData(es)

GTAA

STITCHSIDER

Project Guten-berg (FUB)

MediCare

Euro-stat

(FUB)

DrugBank

Disea-some

DBLP (FU

Berlin)

DailyMed

Freebase

flickr wrappr

Fishes of Texas

FanHubz

Event-Media

EUTC Produc-

tions

Eurostat

EUNIS

ESD stan-dards

Popula-tion (En-AKTing)

NHS (EnAKTing)

Mortality (En-

AKTing)Energy

(En-AKTing)

CO2(En-

AKTing)

educationdata.gov

.uk

ECS South-ampton

Gem. Norm-datei

datadcs

MySpace(DBTune)

MusicBrainz

(DBTune)

Magna-tune

John Peel(DB

Tune)

classical(DB

Tune)

Audio-scrobbler (DBTune)

Last.fmArtists

(DBTune)

DBTropes

dbpedia lite

DBpedia

Pokedex

Airports

NASA (Data Incu-bator)

MusicBrainz(Data

Incubator)

Moseley Folk

Discogs(Data In-cubator)

Climbing

Linked Data for Intervals

Cornetto

Chronic-ling

America

Chem2Bio2RDF

biz.data.

gov.uk

UniSTS

UniRef

UniPath-way

UniParc

Taxo-nomy

UniProt

SGD

Reactome

PubMed

PubChem

PRO-SITE

ProDom

Pfam PDB

OMIM

OBO

MGI

KEGG Reaction

KEGG Pathway

KEGG Glycan

KEGG Enzyme

KEGG Drug

KEGG Cpd

InterPro

HomoloGene

HGNC

Gene Ontology

GeneID

GenBank

ChEBI

CAS

Affy-metrix

BibBaseBBC

Wildlife Finder

BBC Program

mesBBC

Music

rdfaboutUS Census

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch.http://lod-cloud.net/

Page 3: Semantic Web Grundlagen - Linked Data · Semantic Web Grundlagen Birte Glimm Institut für Künstliche Intelligenz j 02. Feb 2012 Linked Data 2/42Birte Glimm j Semantic Web Grundlagen

9/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Linked Data im Web 19.09.2011

As of September 2011

MusicBrainz

(zitgist)

P20

Turismo de

Zaragoza

yovisto

Yahoo! Geo

Planet

YAGO

World Fact-book

El ViajeroTourism

WordNet (W3C)

WordNet (VUA)

VIVO UF

VIVO Indiana

VIVO Cornell

VIAF

URIBurner

Sussex Reading

Lists

Plymouth Reading

Lists

UniRef

UniProt

UMBEL

UK Post-codes

legislationdata.gov.uk

Uberblic

UB Mann-heim

TWC LOGD

Twarql

transportdata.gov.

uk

Traffic Scotland

theses.fr

Thesau-rus W

totl.net

Tele-graphis

TCMGeneDIT

TaxonConcept

Open Library (Talis)

tags2con delicious

t4gminfo

Swedish Open

Cultural Heritage

Surge Radio

Sudoc

STW

RAMEAU SH

statisticsdata.gov.

uk

St. Andrews Resource

Lists

ECS South-ampton EPrints

SSW Thesaur

us

SmartLink

Slideshare2RDF

semanticweb.org

SemanticTweet

Semantic XBRL

SWDog Food

Source Code Ecosystem Linked Data

US SEC (rdfabout)

Sears

Scotland Geo-

graphy

ScotlandPupils &Exams

Scholaro-meter

WordNet (RKB

Explorer)

Wiki

UN/LOCODE

Ulm

ECS (RKB

Explorer)

Roma

RISKS

RESEX

RAE2001

Pisa

OS

OAI

NSF

New-castle

LAASKISTI

JISC

IRIT

IEEE

IBM

Eurécom

ERA

ePrints dotAC

DEPLOY

DBLP (RKB

Explorer)

Crime Reports

UK

Course-ware

CORDIS (RKB

Explorer)CiteSeer

Budapest

ACM

riese

Revyu

researchdata.gov.

ukRen. Energy Genera-

tors

referencedata.gov.

uk

Recht-spraak.

nl

RDFohloh

Last.FM (rdfize)

RDF Book

Mashup

Rådata nå!

PSH

Product Types

Ontology

ProductDB

PBAC

Poké-pédia

patentsdata.go

v.uk

OxPoints

Ord-nance Survey

Openly Local

Open Library

OpenCyc

Open Corpo-rates

OpenCalais

OpenEI

Open Election

Data Project

OpenData

Thesau-rus

Ontos News Portal

OGOLOD

JanusAMP

Ocean Drilling Codices

New York

Times

NVD

ntnusc

NTU Resource

Lists

Norwe-gian

MeSH

NDL subjects

ndlna

myExperi-ment

Italian Museums

medu-cator

MARC Codes List

Man-chester Reading

Lists

Lotico

Weather Stations

London Gazette

LOIUS

Linked Open Colors

lobidResources

lobidOrgani-sations

LEM

LinkedMDB

LinkedLCCN

LinkedGeoData

LinkedCT

LinkedUser

FeedbackLOV

Linked Open

Numbers

LODE

Eurostat (OntologyCentral)

Linked EDGAR

(OntologyCentral)

Linked Crunch-

base

lingvoj

Lichfield Spen-ding

LIBRIS

Lexvo

LCSH

DBLP (L3S)

Linked Sensor Data (Kno.e.sis)

Klapp-stuhl-club

Good-win

Family

National Radio-activity

JP

Jamendo (DBtune)

Italian public

schools

ISTAT Immi-gration

iServe

IdRef Sudoc

NSZL Catalog

Hellenic PD

Hellenic FBD

PiedmontAccomo-dations

GovTrack

GovWILD

GoogleArt

wrapper

gnoss

GESIS

GeoWordNet

GeoSpecies

GeoNames

GeoLinkedData

GEMET

GTAA

STITCH

SIDER

Project Guten-berg

MediCare

Euro-stat

(FUB)

EURES

DrugBank

Disea-some

DBLP (FU

Berlin)

DailyMed

CORDIS(FUB)

Freebase

flickr wrappr

Fishes of Texas

Finnish Munici-palities

ChEMBL

FanHubz

EventMedia

EUTC Produc-

tions

Eurostat

Europeana

EUNIS

EU Insti-

tutions

ESD stan-dards

EARTh

Enipedia

Popula-tion (En-AKTing)

NHS(En-

AKTing) Mortality(En-

AKTing)

Energy (En-

AKTing)

Crime(En-

AKTing)

CO2 Emission

(En-AKTing)

EEA

SISVU

education.data.g

ov.uk

ECS South-ampton

ECCO-TCP

GND

Didactalia

DDC Deutsche Bio-

graphie

datadcs

MusicBrainz

(DBTune)

Magna-tune

John Peel

(DBTune)

Classical (DB

Tune)

AudioScrobbler (DBTune)

Last.FM artists

(DBTune)

DBTropes

Portu-guese

DBpedia

dbpedia lite

Greek DBpedia

DBpedia

data-open-ac-uk

SMCJournals

Pokedex

Airports

NASA (Data Incu-bator)

MusicBrainz(Data

Incubator)

Moseley Folk

Metoffice Weather Forecasts

Discogs (Data

Incubator)

Climbing

data.gov.uk intervals

Data Gov.ie

databnf.fr

Cornetto

reegle

Chronic-ling

America

Chem2Bio2RDF

Calames

businessdata.gov.

uk

Bricklink

Brazilian Poli-

ticians

BNB

UniSTS

UniPathway

UniParc

Taxonomy

UniProt(Bio2RDF)

SGD

Reactome

PubMedPub

Chem

PRO-SITE

ProDom

Pfam

PDB

OMIMMGI

KEGG Reaction

KEGG Pathway

KEGG Glycan

KEGG Enzyme

KEGG Drug

KEGG Com-pound

InterPro

HomoloGene

HGNC

Gene Ontology

GeneID

Affy-metrix

bible ontology

BibBase

FTS

BBC Wildlife Finder

BBC Program

mes BBC Music

Alpine Ski

Austria

LOCAH

Amster-dam

Museum

AGROVOC

AEMET

US Census (rdfabout)

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch.http://lod-cloud.net/

10/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Semantic Web Technologien

I Nützlich zum Publizieren, zum Austausch und zurIntegration von Daten

I Semantic Web Technologien sind mittlerweile rechtausgereift

I IRIs (IETF RFC 3987, 2005)I HTTP (IETF RFC 2616, 1999)I RDF (W3C Recommendation, 1999, Update in 2004)I RDFS (W3C Recommendation, 2004)I SPARQL (W3C Recommendation, 2008, Update im

Moment)I OWL (W3C Recommendation, 2004, Update in 2009)

I Linked Data besteht aus einigen Prinzipien zumPublizieren von Datem im Web

11/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Linked Data Principles*

1. Use URIs to name things; not only documents, but alsopeople, locations, concepts, etc.

2. To enable agents (human users and machine agents alike)to look up those names, use HTTP URIs

3. When someone looks up a URI we provide usefulinformation; with ’useful’ in the strict sense we usuallymean structured data in RDF.

4. Include links to other URIs allowing agents (machines andhumans) to discover more things

*http://www.w3.org/DesignIssues/LinkedData.html

12/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Zusammenhang zwischen URI einer Sacheund URI einer Quelle

User Agent

Web Server

http://www.polleres.net/foaf.rdf#me

http://www.polleres.net/foaf.rdf

HTTPGET

RDF

Page 4: Semantic Web Grundlagen - Linked Data · Semantic Web Grundlagen Birte Glimm Institut für Künstliche Intelligenz j 02. Feb 2012 Linked Data 2/42Birte Glimm j Semantic Web Grundlagen

13/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Zusammenhang zwischen URI einer Sacheund URI einer Quelle

User Agent

Web Server

http://dbpedia.org/resource/Gordon_Brown

http://dbpedia.org/data/Gordon_Brown

http://dbpedia.org/page/Gordon_Brown

HTTPGET

303*HTTPGET

RDF

*HTTP Response Code 303: See Other

14/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Hintergrund: Uniform Resource Identifiers

I Ein Uniform Resource Identifier ist eine kompakteSequenz von Charakteren, die eine abstrakte oderphysikalische Ressource identifizieren [RFC3986]

I SyntaxURI = Schema ":" hier-part [ "?" Abfrage ] [ "#" Fragment ]

I Beispiel

foo://︸ ︷︷ ︸Schema

authority︷ ︸︸ ︷examemple.com:8042/ bar︸︷︷︸

path

query︷ ︸︸ ︷?name=peter #titel︸ ︷︷ ︸

Fragment

15/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

URIs/IRIsProtokoll︷ ︸︸ ︷http://

Domäne︷ ︸︸ ︷semanticweb.org/id/︸ ︷︷ ︸

Namensraum

Axel_Polleres︸ ︷︷ ︸Lokaler Name

Präfix︷ ︸︸ ︷thing:

︷ ︸︸ ︷Axel_Polleres

I URIs sind “Uniform Resource Identifiers”I IRIs sind Unicode-basierte “Internationalized Resource

Identifiers”I Jede URI identifiziert eine EntitätI Semantic Web URIs nutzen üblicherweise HTTP

I HyperText Transfer ProtocolI Können idealerweise aufgelöst werden, um weitere Daten

zu erhaltenI Linked Data

16/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Auflösung von URIs

Page 5: Semantic Web Grundlagen - Linked Data · Semantic Web Grundlagen Birte Glimm Institut für Künstliche Intelligenz j 02. Feb 2012 Linked Data 2/42Birte Glimm j Semantic Web Grundlagen

17/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Das HTTP Protokoll

Das HTTP Protokoll ist laut [RFC2616]I an application-level protocol for distributed, collaborative,

hypermedia information systemsI a generic, stateless, protocol which can be used for many

tasks beyond its use for hypertextI a protocol which includes the typing and negotiation of

data representation, allowing systems to be builtindependently of the data being transferred

18/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

HTTP Übersicht

I HTTP Nachrichten bestehen aus der Anfrage eines Clientsan einen Server und die Antworten des Servers zum Client

I Bestimmte Methoden sind vordefiniert (z.B. GET, POST,etc.), aber weitere können definiert werden

I Eine Menge von Statuscodes ist definiert:I Informational 1xx, provisional response, (100 Continue)I Successful 2xx, request successfully received, understood,

and accepted (201 Created)I Redirection 3xx, further action needs to be taken by user

agent to fulfill the request (301 Moved Permanently)I Client Error 4xx, client erred (405 Method Not Allowed)I Server Error 5xx, server encountered an unexpected

condition (501 Not Implemented)

19/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

HTTP Übersicht

1. Parse URI and find HTTP protocol2. Look up DNS name to determine the

associated IP address3. Open a TCP stream to port 80 at the

IP address determined above4. Format an HTTP GET request for

resource and send that to the server5. Read response from the server6. From status code (200) determine a

successful request (representationof the resource is available)

7. Inspect the returned Content-Type(e.g., UTF-8 encoded text/html)

8. Pass the entity-body to the HTMLrendering engine

20/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

HTTP GET Request

GET /todaysnews HTTP/1.1Host: example.comUser-Agent: Mozilla/8.0Accept: text/html,application/xhtml+xml;q=0.9,*/*Accept-language: en-us

Page 6: Semantic Web Grundlagen - Linked Data · Semantic Web Grundlagen Birte Glimm Institut für Künstliche Intelligenz j 02. Feb 2012 Linked Data 2/42Birte Glimm j Semantic Web Grundlagen

21/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

HTTP Response

HTTP/1.1 200 OKDate: Tue, 28 Aug 2007 01:49:33 GMTServer: Apache/2.2.11Content-Type: text/html; charset=utf-8

<!DOCTYPE html PUBLIC"-//W3C//DTD XHTML 1.0 Strict//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">

<html xmlns="http://www.w3.org/1999/xhtml"xml:lang="en" lang="en">

<head><title>Today’s news</title></head><body>

<h1>Today’s News: Oh boy!!</h1>[HTML FOR NEWS REPORT HERE]

</body></html>

22/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Repräsentationen

I Informationsressourcen können unterschiedlicheRepräsentationen haben.

I Eine Repräsentation ist ein Stream von Bytes in einembestimmten Format wie z.B. HTML, RDF/XML oder JPEG.

I Beispiel: Eine Rechnung ist eine Informationsressource,die in HTML, als druckbares PDF oder als RDF Dokumentrepräsentiert werden kann.

I Eine einzelne Ressource kann viele verschiedeneRepräsentationen haben z.B. in verschiedenen Formaten,Auflösungen oder Sprachen

23/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

HTTP Content Negotiation

I Content Negotiation (CN, conneg) ist der Prozess derSelektion der besten Repräsentation für eine Anfragewenn mehrere Repräsentationen verfügbar sind

I Drei Arten: server-driven, agent-driven, transparent

$ curl -H "Accept: application/rdf+xml"http://dbpedia.org/resource/Galway

HTTP/1.1 303 See OtherContent-Type: application/rdf+xmlLocation: http://dbpedia.org/data/Galway.rdf$

curl – Tool um Daten zu einerm Server zu schicken oder von einemServer zu empfangen-H bedeutet nur HTTP/HTTPS

24/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

RDF als Linked Data

<?xml version="1.0"?><rdf:RDF

xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:foaf="http://xmlns.com/foaf/0.1/">

<foaf:Person rdf:about="#ah"><foaf:name>Andreas Harth</foaf:name>

</foaf:Person></rdf:RDF>

Datei veröffentlicht unter http://harth.org/andreas/foaf.rdfURI bezeichnet Andreas: http://harth.org/andreas/foaf.rdf#ah

Page 7: Semantic Web Grundlagen - Linked Data · Semantic Web Grundlagen Birte Glimm Institut für Künstliche Intelligenz j 02. Feb 2012 Linked Data 2/42Birte Glimm j Semantic Web Grundlagen

25/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Semantic Web Application Architecture

26/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Linked Data Anwendungen: Minimale Architektur

As of September 2011

MusicBrainz

(zitgist)

P20

Turismo de

Zaragoza

yovisto

Yahoo! Geo

Planet

YAGO

World Fact-book

El ViajeroTourism

WordNet (W3C)

WordNet (VUA)

VIVO UF

VIVO Indiana

VIVO Cornell

VIAF

URIBurner

Sussex Reading

Lists

Plymouth Reading

Lists

UniRef

UniProt

UMBEL

UK Post-codes

legislationdata.gov.uk

Uberblic

UB Mann-heim

TWC LOGD

Twarql

transportdata.gov.

uk

Traffic Scotland

theses.fr

Thesau-rus W

totl.net

Tele-graphis

TCMGeneDIT

TaxonConcept

Open Library (Talis)

tags2con delicious

t4gminfo

Swedish Open

Cultural Heritage

Surge Radio

Sudoc

STW

RAMEAU SH

statisticsdata.gov.

uk

St. Andrews Resource

Lists

ECS South-ampton EPrints

SSW Thesaur

us

SmartLink

Slideshare2RDF

semanticweb.org

SemanticTweet

Semantic XBRL

SWDog Food

Source Code Ecosystem Linked Data

US SEC (rdfabout)

Sears

Scotland Geo-

graphy

ScotlandPupils &Exams

Scholaro-meter

WordNet (RKB

Explorer)

Wiki

UN/LOCODE

Ulm

ECS (RKB

Explorer)

Roma

RISKS

RESEX

RAE2001

Pisa

OS

OAI

NSF

New-castle

LAASKISTI

JISC

IRIT

IEEE

IBM

Eurécom

ERA

ePrints dotAC

DEPLOY

DBLP (RKB

Explorer)

Crime Reports

UK

Course-ware

CORDIS (RKB

Explorer)CiteSeer

Budapest

ACM

riese

Revyu

researchdata.gov.

ukRen. Energy Genera-

tors

referencedata.gov.

uk

Recht-spraak.

nl

RDFohloh

Last.FM (rdfize)

RDF Book

Mashup

Rådata nå!

PSH

Product Types

Ontology

ProductDB

PBAC

Poké-pédia

patentsdata.go

v.uk

OxPoints

Ord-nance Survey

Openly Local

Open Library

OpenCyc

Open Corpo-rates

OpenCalais

OpenEI

Open Election

Data Project

OpenData

Thesau-rus

Ontos News Portal

OGOLOD

JanusAMP

Ocean Drilling Codices

New York

Times

NVD

ntnusc

NTU Resource

Lists

Norwe-gian

MeSH

NDL subjects

ndlna

myExperi-ment

Italian Museums

medu-cator

MARC Codes List

Man-chester Reading

Lists

Lotico

Weather Stations

London Gazette

LOIUS

Linked Open Colors

lobidResources

lobidOrgani-sations

LEM

LinkedMDB

LinkedLCCN

LinkedGeoData

LinkedCT

LinkedUser

FeedbackLOV

Linked Open

Numbers

LODE

Eurostat (OntologyCentral)

Linked EDGAR

(OntologyCentral)

Linked Crunch-

base

lingvoj

Lichfield Spen-ding

LIBRIS

Lexvo

LCSH

DBLP (L3S)

Linked Sensor Data (Kno.e.sis)

Klapp-stuhl-club

Good-win

Family

National Radio-activity

JP

Jamendo (DBtune)

Italian public

schools

ISTAT Immi-gration

iServe

IdRef Sudoc

NSZL Catalog

Hellenic PD

Hellenic FBD

PiedmontAccomo-dations

GovTrack

GovWILD

GoogleArt

wrapper

gnoss

GESIS

GeoWordNet

GeoSpecies

GeoNames

GeoLinkedData

GEMET

GTAA

STITCH

SIDER

Project Guten-berg

MediCare

Euro-stat

(FUB)

EURES

DrugBank

Disea-some

DBLP (FU

Berlin)

DailyMed

CORDIS(FUB)

Freebase

flickr wrappr

Fishes of Texas

Finnish Munici-palities

ChEMBL

FanHubz

EventMedia

EUTC Produc-

tions

Eurostat

Europeana

EUNIS

EU Insti-

tutions

ESD stan-dards

EARTh

Enipedia

Popula-tion (En-AKTing)

NHS(En-

AKTing) Mortality(En-

AKTing)

Energy (En-

AKTing)

Crime(En-

AKTing)

CO2 Emission

(En-AKTing)

EEA

SISVU

education.data.g

ov.uk

ECS South-ampton

ECCO-TCP

GND

Didactalia

DDC Deutsche Bio-

graphie

datadcs

MusicBrainz

(DBTune)

Magna-tune

John Peel

(DBTune)

Classical (DB

Tune)

AudioScrobbler (DBTune)

Last.FM artists

(DBTune)

DBTropes

Portu-guese

DBpedia

dbpedia lite

Greek DBpedia

DBpedia

data-open-ac-uk

SMCJournals

Pokedex

Airports

NASA (Data Incu-bator)

MusicBrainz(Data

Incubator)

Moseley Folk

Metoffice Weather Forecasts

Discogs (Data

Incubator)

Climbing

data.gov.uk intervals

Data Gov.ie

databnf.fr

Cornetto

reegle

Chronic-ling

America

Chem2Bio2RDF

Calames

businessdata.gov.

uk

Bricklink

Brazilian Poli-

ticians

BNB

UniSTS

UniPathway

UniParc

Taxonomy

UniProt(Bio2RDF)

SGD

Reactome

PubMedPub

Chem

PRO-SITE

ProDom

Pfam

PDB

OMIMMGI

KEGG Reaction

KEGG Pathway

KEGG Glycan

KEGG Enzyme

KEGG Drug

KEGG Com-pound

InterPro

HomoloGene

HGNC

Gene Ontology

GeneID

Affy-metrix

bible ontology

BibBase

FTS

BBC Wildlife Finder

BBC Program

mes BBC Music

Alpine Ski

Austria

LOCAH

Amster-dam

Museum

AGROVOC

AEMET

US Census (rdfabout)

Abf

rage

Ant

wor

t

27/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Beispiel: Visualisierung der Wahlergebnisse

I Daten von IT.NRW (Landesbetrieb Information und TechnikNordrhein-Westfalen) im CSV Format

I Schritt 1: Konvertierung nach RDF (mittels GoogleAppEngine* Wrapper oder Google Refine** mit RDFExtension***)

I Schritt 2: Linked Data AbfragenI Schritt 3: Visualisierung der Ergebnisse

*http://code.google.com/appengine/**http://code.google.com/p/google-refine/***http://lab.linkeddata.deri.ie/2010/grefine-rdf-extension/http://gesis-lod.appspot.com/vis/

28/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Beispiel: Visualisierung der Ökonomischen Situation

I Daten von GESIS (Leibniz-Institut fürSozialwissenschaften) im CSV Format

I Schritt 1: Konvertierung nach RDF und publiziere dieDaten online

I Schritt 2: Linked Data AbfragenI Schritt 3: Visualisierung der Ergebnisse

http://gesis-lod.appspot.com/vis/

Page 8: Semantic Web Grundlagen - Linked Data · Semantic Web Grundlagen Birte Glimm Institut für Künstliche Intelligenz j 02. Feb 2012 Linked Data 2/42Birte Glimm j Semantic Web Grundlagen

29/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Beispiel: Visualisierung Eurostat Daten

I Daten von Eurostat (Statistisches Büro der EU) im CSVoder SDMX Format

I Schritt 1: Konvertierung nach RDFI Schritt 2: Linked Data AbfragenI Schritt 3: Visualisierung der Ergebnisse

http://estatwrap.ontologycentral.com/page/tsieb010

30/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Linked Data Services

I Einige Services erlauben nur eingeschränkten Zugriff aufIhre Daten (z.B. APIs von sozialen Netzwerken)

I Manchmal wird mehr als ein Parameter benötigt (z.B. umden kürzesten Abstand zwischen zwei Punkten zuberechnen)

I Idealerweise sollte Linked Data derartige Serviceintegrieren

31/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Szenario

I Typisches Datenintegrationsszenario

Gemeinsames

Datenformat

Daten

Integration

Interaktive

Datenexploration

I Anfrage: Welche Jobangebote gibt es von Konkurrentenvon Facebook?

I Anfrage: Nach welchem Muster vergibt Vulcan CapitalMittel?

32/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Datenqueallen

Page 9: Semantic Web Grundlagen - Linked Data · Semantic Web Grundlagen Birte Glimm Institut für Künstliche Intelligenz j 02. Feb 2012 Linked Data 2/42Birte Glimm j Semantic Web Grundlagen

33/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Schritt 1: Vorbereitung der Daten - Gemeinsames Datenformat

34/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Schritt 2: Datenintegration

35/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Schritt 3: Interaktive Datenexploration

1. Abfrage

2.E

rgeb

niss

e

3. Visualisierung

36/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Verlinkung von Daten mit Daten von Servicen?

:facebook foaf:name "Facebook" .:facebook cb:has_office :facebook-hp .:facebook-hq geo:lat "37.416" .:facebook-hq geo:long "122.152" .:facebook-hq vc:locality "Palo Alto, CA" .

Gegeben der Firmenname und Ort, finde dieJobangebote

Gegeben die Koordinaten, finde nahegelegeneOrte (via GeoNames)

Page 10: Semantic Web Grundlagen - Linked Data · Semantic Web Grundlagen Birte Glimm Institut für Künstliche Intelligenz j 02. Feb 2012 Linked Data 2/42Birte Glimm j Semantic Web Grundlagen

37/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Daten Service?

I Gegeben eine Eingabe, erzeuge die AusgabeI Eingabe und Ausgabe hängen in einer

Service-spezifischen Art zusammenI Weltzustand bleibt unverändert

Eingabe Ausgabe

Service

Relation

definiert

I Beispiel: GeoNames findNearbyWikipedia ServiceI Eingabe: Latitude/Longitude KoordinatenI Ausgabe: OrteI Beziehung: Ausgabe Orte sind in der Nähe der

Eingabekoordinaten

38/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

LIDS: Linked Data ServicesI Wünschenswert wäre eine Integration von Daten Servicen

mit Linked Data1. LIDS müssen sich an die Linked Data Prinzipien halten

I Wünschenswert wäre die Nutzung von Daten Servicen inSoftware Programmen

1. LIDS brauchen maschinenlesbare Beschreibungen vonEingabe und Ausgabe

39/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Data Services als Linked Data

I Eingabe ist gegeben als URI

Service Endpoint︷ ︸︸ ︷http://geowrap.openlids.org/findNearbyWikipedia

Parameter︷ ︸︸ ︷?lat=37.416&lng=-122.152

EingabeIdentifier︷ ︸︸ ︷#point

I Auflösung der URI ergibt RDF:@prefix dbp: <http://dbpedia.org/resource/> .

@prefix : <http://geo..Wiki

Eingabe︷ ︸︸ ︷?lat=37.416&lng=-122.152#> .

:point

Relation︷ ︸︸ ︷foaf:based_near dbp:Palo_Alto%2C_California ,

dbp:Packard%27s_garage︸ ︷︷ ︸Ausgabe

.

40/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

LIDS Beschreibungen mittels SPARQL

I Gegeben eine bestimmte Eingabe, kann dieentsprechende Ausgabe von einer impliziten Datenquelleabgefragt werden

I Entspricht einer SPARQL CONSTRUCT Abfrage

CONSTRUCT { [output] } FROM [endpoint] WHERE { [input] }

I Eingabe beschreibt die benötigten Daten alsAbfragemuster

I Der Endpunkt ist die base URI um eine Service Eingabezu konstruieren

I Ausgabe beschreibt die Daten, die der Service geliefert hat

CONSTRUCT { ?point foaf:based_near ?feature. }FROM <http:/geowrap.openlids.org/findNearbyWikipedia>WHERE { ?point a Point ; geo:lat ?lat ; geo:long ?lng }

Page 11: Semantic Web Grundlagen - Linked Data · Semantic Web Grundlagen Birte Glimm Institut für Künstliche Intelligenz j 02. Feb 2012 Linked Data 2/42Birte Glimm j Semantic Web Grundlagen

41/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

LIDS Zusammenfassung

I Dynamische Quellen (GeoNames Wrapper, TwitterWrapper, Feeds Wrapper) können in Linked Data integriertwerden

I LIDS nützlich fürI Einfügen von LIDS in statische RDF DatensätzeI Linked Data Endpunkte, die dynamisch Links von ihren

Daten zu LIDS hinzufügenI Linked Data Browser, die abgefragte Daten um abgefragte

Daten von LIDS erweiternI Integration von LIDS in die SPARQL Abfrageverarbeitung

I LIDS erlauben das Publizieren und Wiederbenutzen vonDatenservices im Web

42/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

Zusammenfassung

I Die Menge an verfügbaren Daten wächst ständigI Semantik wird gebraucht, um Daten aus verschiedenen

Quellen zu integrierenI Abfrage und Visualisierung von Daten in Kombination

möglich

I Die Verarbeitung und Abfrage von Daten ausverschiedenen Quellen erhöht die Transparenz underleichtert die Forschung (Testen von Hypothesen wirdeinfacher)


Recommended