Author
others
View
5
Download
0
Embed Size (px)
Semantic Web GrundlagenBirte GlimmInstitut für Künstliche Intelligenz | 02. Feb 2012
Linked Data
2/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Organisatorisches: Inhalt
Einleitung und XML 17. Okt Hypertableau II 12. DezEinführung in RDF 20. Okt Übung 4 15. DezRDF Schema 24. Okt SPARQL Syntax & Intuition 19. Dezfällt aus 27. Okt SPARQL Semantik 22. DezLogik – Grundlagen 31. Okt SPARQL 1.1 9. JanÜbung 1 3. Nov Übung 5 12. JanSemantik von RDF(S) 7. Nov SPARQL Entailment 16. JanRDF(S) & Datalog Regeln 10. Nov SPARQL Implemetierung 19. JanOWL Syntax & Intuition 14. Nov Ontology Editing 23. JanÜbung 2 17. Nov Übung 6 26. JanOWL & BLs 21. Nov Ontology Engineering 30. JanOWL 2 24. Nov Linked Data 2. FebTableau 28. Nov SemWeb Anwendungen 6. FebÜbung 3 1. Dez Übung 7 9. FebBlocking & Unravelling 5. Dez Wiederholung 13. FebHypertableau 8. Dez Übung 8 16. Feb
Abfragen und RIF wurde gestrichen
3/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Linked Data
4/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Daten im Web
I Immer mehr Websites stellen einen programmatischenZugriff auf ihre Daten zur Verfügung
I Dabei werden Semantic Web Standards verwendet, z.B.die Linking Open Data (LOD) Initiativehttp://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData
I Verwendet werden APIs, z.B. via JSON/REST
I Semantic Web Technologien vereinfachen die Integrationvon Daten aus verschiedenen Quellen
I Die Kombination von Daten erlaubt auf tiefere Einblicke
http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenDatahttp://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData
5/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Linked Data im Web 01.05.2007
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch.http://lod-cloud.net/
6/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Linked Data im Web 31.03.2008
SWConference
Corpus
DBpedia RDF Book Mashup
DBLPBerlin
Revyu
Project Guten-berg
FOAFprofiles
Geo-names
Music-brainz
Magna-tuneJamendo
World Fact-book
DBLPHannover
SIOCprofiles
Sem-Web-
Central
Euro-stat
ECS South-ampton
BBCLater +TOTP
Doap-space
Open-Guides
Gov-Track
US Census Data
W3CWordNet
flickrwrapprWiki-
company
OpenCyc
lingvoj
Onto-world
BBCJohnPeel
Flickrexporter
Audio-Scrobbler QDOS
updated
RKB Explorer
NEW!riese
NEW!
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch.http://lod-cloud.net/
7/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Linked Data im Web 14.07.2009
As of July 2009
LinkedCTReactome
Taxonomy
KEGG
PubMed
GeneID
Pfam
UniProt
OMIM
PDB
SymbolChEBI
Daily Med
Disea-some
CAS
HGNC
InterPro
Drug Bank
UniParc
UniRef
ProDom
PROSITE
Gene Ontology
HomoloGene
PubChem
MGI
UniSTS
GEOSpecies
Jamendo
BBCProgrammes
Music-brainz
Magna-tune
BBCLater +TOTP
SurgeRadio
MySpaceWrapper
Audio-Scrobbler
LinkedMDB
BBCJohnPeel
BBCPlaycount
Data
Gov-Track
US Census Data
riese
Geo-names
lingvoj
World Fact-book
Euro-stat
flickrwrappr
Open Calais
RevyuSIOCSites
Doap-space
Flickrexporter
FOAFprofiles
CrunchBase
Sem-Web-
Central
Open-Guides
Wiki-company
QDOS
Pub Guide
RDF ohloh
W3CWordNet
OpenCyc
UMBEL
Yago
DBpediaFreebase
Virtuoso Sponger
DBLPHannover
IRIT Toulouse
SWConference
Corpus
RDF Book Mashup
Project Guten-berg
DBLPBerlin
LAAS- CNRS
Buda-pestBME
IEEE
IBM
Resex
Pisa
New-castle
RAE 2001
CiteSeer
ACM
DBLP RKB
Explorer
eprints
LIBRIS
SemanticWeb.org
Eurécom
RKBECS
South-ampton
CORDIS
ReSIST ProjectWiki
NationalScience
Foundation
ECS South-ampton
LinkedGeoData
BBC Music
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch.http://lod-cloud.net/
8/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Linked Data im Web 22.09.2010
As of September 2010
MusicBrainz
(zitgist)
P20
YAGO
World Fact-book (FUB)
WordNet (W3C)
WordNet(VUA)
VIVO UFVIVO
Indiana
VIVO Cornell
VIAF
URIBurner
Sussex Reading
Lists
Plymouth Reading
Lists
UMBEL
UK Post-codes
legislation.gov.uk
Uberblic
UB Mann-heim
TWC LOGD
Twarql
transportdata.gov
.uk
totl.net
Tele-graphis
TCMGeneDIT
TaxonConcept
The Open Library (Talis)
t4gm
Surge Radio
STW
RAMEAU SH
statisticsdata.gov
.uk
St. Andrews Resource
Lists
ECS South-ampton EPrints
Semantic CrunchBase
semanticweb.org
SemanticXBRL
SWDog Food
rdfabout US SEC
Wiki
UN/LOCODE
Ulm
ECS (RKB
Explorer)
Roma
RISKS
RESEX
RAE2001
Pisa
OS
OAI
NSF
New-castle
LAAS
KISTIJISC
IRIT
IEEE
IBM
Eurécom
ERA
ePrints
dotAC
DEPLOY
DBLP (RKB
Explorer)
Course-ware
CORDIS
CiteSeer
Budapest
ACM
riese
Revyu
researchdata.gov
.uk
referencedata.gov
.uk
Recht-spraak.
nl
RDFohloh
Last.FM (rdfize)
RDF Book
Mashup
PSH
ProductDB
PBAC
Poké-pédia
Ord-nance Survey
Openly Local
The Open Library
OpenCyc
OpenCalais
OpenEI
New York
Times
NTU Resource
Lists
NDL subjects
MARC Codes List
Man-chesterReading
Lists
Lotico
The London Gazette
LOIUS
lobidResources
lobidOrgani-sations
LinkedMDB
LinkedLCCN
LinkedGeoData
LinkedCT
Linked Open
Numbers
lingvoj
LIBRIS
Lexvo
LCSH
DBLP (L3S)
Linked Sensor Data (Kno.e.sis)
Good-win
Family
Jamendo
iServe
NSZL Catalog
GovTrack
GESIS
GeoSpecies
GeoNames
GeoLinkedData(es)
GTAA
STITCHSIDER
Project Guten-berg (FUB)
MediCare
Euro-stat
(FUB)
DrugBank
Disea-some
DBLP (FU
Berlin)
DailyMed
Freebase
flickr wrappr
Fishes of Texas
FanHubz
Event-Media
EUTC Produc-
tions
Eurostat
EUNIS
ESD stan-dards
Popula-tion (En-AKTing)
NHS (EnAKTing)
Mortality (En-
AKTing)Energy
(En-AKTing)
CO2(En-
AKTing)
educationdata.gov
.uk
ECS South-ampton
Gem. Norm-datei
datadcs
MySpace(DBTune)
MusicBrainz
(DBTune)
Magna-tune
John Peel(DB
Tune)
classical(DB
Tune)
Audio-scrobbler (DBTune)
Last.fmArtists
(DBTune)
DBTropes
dbpedia lite
DBpedia
Pokedex
Airports
NASA (Data Incu-bator)
MusicBrainz(Data
Incubator)
Moseley Folk
Discogs(Data In-cubator)
Climbing
Linked Data for Intervals
Cornetto
Chronic-ling
America
Chem2Bio2RDF
biz.data.
gov.uk
UniSTS
UniRef
UniPath-way
UniParc
Taxo-nomy
UniProt
SGD
Reactome
PubMed
PubChem
PRO-SITE
ProDom
Pfam PDB
OMIM
OBO
MGI
KEGG Reaction
KEGG Pathway
KEGG Glycan
KEGG Enzyme
KEGG Drug
KEGG Cpd
InterPro
HomoloGene
HGNC
Gene Ontology
GeneID
GenBank
ChEBI
CAS
Affy-metrix
BibBaseBBC
Wildlife Finder
BBC Program
mesBBC
Music
rdfaboutUS Census
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch.http://lod-cloud.net/
http://lod-cloud.net/http://lod-cloud.net/http://lod-cloud.net/http://lod-cloud.net/
9/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Linked Data im Web 19.09.2011
As of September 2011
MusicBrainz
(zitgist)
P20
Turismo de
Zaragoza
yovisto
Yahoo! Geo
Planet
YAGO
World Fact-book
El ViajeroTourism
WordNet (W3C)
WordNet (VUA)
VIVO UF
VIVO Indiana
VIVO Cornell
VIAF
URIBurner
Sussex Reading
Lists
Plymouth Reading
Lists
UniRef
UniProt
UMBEL
UK Post-codes
legislationdata.gov.uk
Uberblic
UB Mann-heim
TWC LOGD
Twarql
transportdata.gov.
uk
Traffic Scotland
theses.fr
Thesau-rus W
totl.net
Tele-graphis
TCMGeneDIT
TaxonConcept
Open Library (Talis)
tags2con delicious
t4gminfo
Swedish Open
Cultural Heritage
Surge Radio
Sudoc
STW
RAMEAU SH
statisticsdata.gov.
uk
St. Andrews Resource
Lists
ECS South-ampton EPrints
SSW Thesaur
us
SmartLink
Slideshare2RDF
semanticweb.org
SemanticTweet
Semantic XBRL
SWDog Food
Source Code Ecosystem Linked Data
US SEC (rdfabout)
Sears
Scotland Geo-
graphy
ScotlandPupils &Exams
Scholaro-meter
WordNet (RKB
Explorer)
Wiki
UN/LOCODE
Ulm
ECS (RKB
Explorer)
Roma
RISKS
RESEX
RAE2001
Pisa
OS
OAI
NSF
New-castle
LAASKISTI
JISC
IRIT
IEEE
IBM
Eurécom
ERA
ePrints dotAC
DEPLOY
DBLP (RKB
Explorer)
Crime Reports
UK
Course-ware
CORDIS (RKB
Explorer)CiteSeer
Budapest
ACM
riese
Revyu
researchdata.gov.
ukRen. Energy Genera-
tors
referencedata.gov.
uk
Recht-spraak.
nl
RDFohloh
Last.FM (rdfize)
RDF Book
Mashup
Rådata nå!
PSH
Product Types
Ontology
ProductDB
PBAC
Poké-pédia
patentsdata.go
v.uk
OxPoints
Ord-nance Survey
Openly Local
Open Library
OpenCyc
Open Corpo-rates
OpenCalais
OpenEI
Open Election
Data Project
OpenData
Thesau-rus
Ontos News Portal
OGOLOD
JanusAMP
Ocean Drilling Codices
New York
Times
NVD
ntnusc
NTU Resource
Lists
Norwe-gian
MeSH
NDL subjects
ndlna
myExperi-ment
Italian Museums
medu-cator
MARC Codes List
Man-chester Reading
Lists
Lotico
Weather Stations
London Gazette
LOIUS
Linked Open Colors
lobidResources
lobidOrgani-sations
LEM
LinkedMDB
LinkedLCCN
LinkedGeoData
LinkedCT
LinkedUser
FeedbackLOV
Linked Open
Numbers
LODE
Eurostat (OntologyCentral)
Linked EDGAR
(OntologyCentral)
Linked Crunch-
base
lingvoj
Lichfield Spen-ding
LIBRIS
Lexvo
LCSH
DBLP (L3S)
Linked Sensor Data (Kno.e.sis)
Klapp-stuhl-club
Good-win
Family
National Radio-activity
JP
Jamendo (DBtune)
Italian public
schools
ISTAT Immi-gration
iServe
IdRef Sudoc
NSZL Catalog
Hellenic PD
Hellenic FBD
PiedmontAccomo-dations
GovTrack
GovWILD
GoogleArt
wrapper
gnoss
GESIS
GeoWordNet
GeoSpecies
GeoNames
GeoLinkedData
GEMET
GTAA
STITCH
SIDER
Project Guten-berg
MediCare
Euro-stat
(FUB)
EURES
DrugBank
Disea-some
DBLP (FU
Berlin)
DailyMed
CORDIS(FUB)
Freebase
flickr wrappr
Fishes of Texas
Finnish Munici-palities
ChEMBL
FanHubz
EventMedia
EUTC Produc-
tions
Eurostat
Europeana
EUNIS
EU Insti-
tutions
ESD stan-dards
EARTh
Enipedia
Popula-tion (En-AKTing)
NHS(En-
AKTing) Mortality(En-
AKTing)
Energy (En-
AKTing)
Crime(En-
AKTing)
CO2 Emission
(En-AKTing)
EEA
SISVU
education.data.g
ov.uk
ECS South-ampton
ECCO-TCP
GND
Didactalia
DDC Deutsche Bio-
graphie
datadcs
MusicBrainz
(DBTune)
Magna-tune
John Peel
(DBTune)
Classical (DB
Tune)
AudioScrobbler (DBTune)
Last.FM artists
(DBTune)
DBTropes
Portu-guese
DBpedia
dbpedia lite
Greek DBpedia
DBpedia
data-open-ac-uk
SMCJournals
Pokedex
Airports
NASA (Data Incu-bator)
MusicBrainz(Data
Incubator)
Moseley Folk
Metoffice Weather Forecasts
Discogs (Data
Incubator)
Climbing
data.gov.uk intervals
Data Gov.ie
databnf.fr
Cornetto
reegle
Chronic-ling
America
Chem2Bio2RDF
Calames
businessdata.gov.
uk
Bricklink
Brazilian Poli-
ticians
BNB
UniSTS
UniPathway
UniParc
Taxonomy
UniProt(Bio2RDF)
SGD
Reactome
PubMedPub
Chem
PRO-SITE
ProDom
Pfam
PDB
OMIMMGI
KEGG Reaction
KEGG Pathway
KEGG Glycan
KEGG Enzyme
KEGG Drug
KEGG Com-pound
InterPro
HomoloGene
HGNC
Gene Ontology
GeneID
Affy-metrix
bible ontology
BibBase
FTS
BBC Wildlife Finder
BBC Program
mes BBC Music
Alpine Ski
Austria
LOCAH
Amster-dam
Museum
AGROVOC
AEMET
US Census (rdfabout)
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch.http://lod-cloud.net/
10/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Semantic Web Technologien
I Nützlich zum Publizieren, zum Austausch und zurIntegration von Daten
I Semantic Web Technologien sind mittlerweile rechtausgereift
I IRIs (IETF RFC 3987, 2005)I HTTP (IETF RFC 2616, 1999)I RDF (W3C Recommendation, 1999, Update in 2004)I RDFS (W3C Recommendation, 2004)I SPARQL (W3C Recommendation, 2008, Update im
Moment)I OWL (W3C Recommendation, 2004, Update in 2009)
I Linked Data besteht aus einigen Prinzipien zumPublizieren von Datem im Web
11/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Linked Data Principles*
1. Use URIs to name things; not only documents, but alsopeople, locations, concepts, etc.
2. To enable agents (human users and machine agents alike)to look up those names, use HTTP URIs
3. When someone looks up a URI we provide usefulinformation; with ’useful’ in the strict sense we usuallymean structured data in RDF.
4. Include links to other URIs allowing agents (machines andhumans) to discover more things
*http://www.w3.org/DesignIssues/LinkedData.html
12/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Zusammenhang zwischen URI einer Sacheund URI einer Quelle
User Agent
Web Server
http://www.polleres.net/foaf.rdf#me
http://www.polleres.net/foaf.rdf
HTTPGET
RDF
http://lod-cloud.net/http://www.w3.org/DesignIssues/LinkedData.html
13/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Zusammenhang zwischen URI einer Sacheund URI einer Quelle
User Agent
Web Server
http://dbpedia.org/resource/Gordon_Brown
http://dbpedia.org/data/Gordon_Brown
http://dbpedia.org/page/Gordon_Brown
HTTPGET
303*HTTPGET
RDF
*HTTP Response Code 303: See Other
14/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Hintergrund: Uniform Resource Identifiers
I Ein Uniform Resource Identifier ist eine kompakteSequenz von Charakteren, die eine abstrakte oderphysikalische Ressource identifizieren [RFC3986]
I SyntaxURI = Schema ":" hier-part [ "?" Abfrage ] [ "#" Fragment ]
I Beispiel
foo://︸ ︷︷ ︸Schema
authority︷ ︸︸ ︷examemple.com:8042/ bar︸︷︷︸
path
query︷ ︸︸ ︷?name=peter #titel︸ ︷︷ ︸
Fragment
15/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
URIs/IRIsProtokoll︷ ︸︸ ︷http://
Domäne︷ ︸︸ ︷semanticweb.org/id/︸ ︷︷ ︸
Namensraum
Axel_Polleres︸ ︷︷ ︸Lokaler Name
Präfix︷ ︸︸ ︷thing:
︷ ︸︸ ︷Axel_Polleres
I URIs sind “Uniform Resource Identifiers”I IRIs sind Unicode-basierte “Internationalized Resource
Identifiers”I Jede URI identifiziert eine EntitätI Semantic Web URIs nutzen üblicherweise HTTP
I HyperText Transfer ProtocolI Können idealerweise aufgelöst werden, um weitere Daten
zu erhaltenI Linked Data
16/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Auflösung von URIs
17/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Das HTTP Protokoll
Das HTTP Protokoll ist laut [RFC2616]I an application-level protocol for distributed, collaborative,
hypermedia information systemsI a generic, stateless, protocol which can be used for many
tasks beyond its use for hypertextI a protocol which includes the typing and negotiation of
data representation, allowing systems to be builtindependently of the data being transferred
18/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
HTTP Übersicht
I HTTP Nachrichten bestehen aus der Anfrage eines Clientsan einen Server und die Antworten des Servers zum Client
I Bestimmte Methoden sind vordefiniert (z.B. GET, POST,etc.), aber weitere können definiert werden
I Eine Menge von Statuscodes ist definiert:I Informational 1xx, provisional response, (100 Continue)I Successful 2xx, request successfully received, understood,
and accepted (201 Created)I Redirection 3xx, further action needs to be taken by user
agent to fulfill the request (301 Moved Permanently)I Client Error 4xx, client erred (405 Method Not Allowed)I Server Error 5xx, server encountered an unexpected
condition (501 Not Implemented)
19/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
HTTP Übersicht
1. Parse URI and find HTTP protocol2. Look up DNS name to determine the
associated IP address3. Open a TCP stream to port 80 at the
IP address determined above4. Format an HTTP GET request for
resource and send that to the server5. Read response from the server6. From status code (200) determine a
successful request (representationof the resource is available)
7. Inspect the returned Content-Type(e.g., UTF-8 encoded text/html)
8. Pass the entity-body to the HTMLrendering engine
20/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
HTTP GET Request
GET /todaysnews HTTP/1.1Host: example.comUser-Agent: Mozilla/8.0Accept: text/html,application/xhtml+xml;q=0.9,*/*Accept-language: en-us
21/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
HTTP Response
HTTP/1.1 200 OKDate: Tue, 28 Aug 2007 01:49:33 GMTServer: Apache/2.2.11Content-Type: text/html; charset=utf-8
Today’s news
Today’s News: Oh boy!![HTML FOR NEWS REPORT HERE]
22/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Repräsentationen
I Informationsressourcen können unterschiedlicheRepräsentationen haben.
I Eine Repräsentation ist ein Stream von Bytes in einembestimmten Format wie z.B. HTML, RDF/XML oder JPEG.
I Beispiel: Eine Rechnung ist eine Informationsressource,die in HTML, als druckbares PDF oder als RDF Dokumentrepräsentiert werden kann.
I Eine einzelne Ressource kann viele verschiedeneRepräsentationen haben z.B. in verschiedenen Formaten,Auflösungen oder Sprachen
23/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
HTTP Content Negotiation
I Content Negotiation (CN, conneg) ist der Prozess derSelektion der besten Repräsentation für eine Anfragewenn mehrere Repräsentationen verfügbar sind
I Drei Arten: server-driven, agent-driven, transparent
$ curl -H "Accept: application/rdf+xml"http://dbpedia.org/resource/Galway
HTTP/1.1 303 See OtherContent-Type: application/rdf+xmlLocation: http://dbpedia.org/data/Galway.rdf$
curl – Tool um Daten zu einerm Server zu schicken oder von einemServer zu empfangen-H bedeutet nur HTTP/HTTPS
24/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
RDF als Linked Data
Andreas Harth
Datei veröffentlicht unter http://harth.org/andreas/foaf.rdfURI bezeichnet Andreas: http://harth.org/andreas/foaf.rdf#ah
http://harth.org/andreas/foaf.rdfhttp://harth.org/andreas/foaf.rdf#ah
25/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Semantic Web Application Architecture
26/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Linked Data Anwendungen: Minimale Architektur
As of September 2011
MusicBrainz
(zitgist)
P20
Turismo de
Zaragoza
yovisto
Yahoo! Geo
Planet
YAGO
World Fact-book
El ViajeroTourism
WordNet (W3C)
WordNet (VUA)
VIVO UF
VIVO Indiana
VIVO Cornell
VIAF
URIBurner
Sussex Reading
Lists
Plymouth Reading
Lists
UniRef
UniProt
UMBEL
UK Post-codes
legislationdata.gov.uk
Uberblic
UB Mann-heim
TWC LOGD
Twarql
transportdata.gov.
uk
Traffic Scotland
theses.fr
Thesau-rus W
totl.net
Tele-graphis
TCMGeneDIT
TaxonConcept
Open Library (Talis)
tags2con delicious
t4gminfo
Swedish Open
Cultural Heritage
Surge Radio
Sudoc
STW
RAMEAU SH
statisticsdata.gov.
uk
St. Andrews Resource
Lists
ECS South-ampton EPrints
SSW Thesaur
us
SmartLink
Slideshare2RDF
semanticweb.org
SemanticTweet
Semantic XBRL
SWDog Food
Source Code Ecosystem Linked Data
US SEC (rdfabout)
Sears
Scotland Geo-
graphy
ScotlandPupils &Exams
Scholaro-meter
WordNet (RKB
Explorer)
Wiki
UN/LOCODE
Ulm
ECS (RKB
Explorer)
Roma
RISKS
RESEX
RAE2001
Pisa
OS
OAI
NSF
New-castle
LAASKISTI
JISC
IRIT
IEEE
IBM
Eurécom
ERA
ePrints dotAC
DEPLOY
DBLP (RKB
Explorer)
Crime Reports
UK
Course-ware
CORDIS (RKB
Explorer)CiteSeer
Budapest
ACM
riese
Revyu
researchdata.gov.
ukRen. Energy Genera-
tors
referencedata.gov.
uk
Recht-spraak.
nl
RDFohloh
Last.FM (rdfize)
RDF Book
Mashup
Rådata nå!
PSH
Product Types
Ontology
ProductDB
PBAC
Poké-pédia
patentsdata.go
v.uk
OxPoints
Ord-nance Survey
Openly Local
Open Library
OpenCyc
Open Corpo-rates
OpenCalais
OpenEI
Open Election
Data Project
OpenData
Thesau-rus
Ontos News Portal
OGOLOD
JanusAMP
Ocean Drilling Codices
New York
Times
NVD
ntnusc
NTU Resource
Lists
Norwe-gian
MeSH
NDL subjects
ndlna
myExperi-ment
Italian Museums
medu-cator
MARC Codes List
Man-chester Reading
Lists
Lotico
Weather Stations
London Gazette
LOIUS
Linked Open Colors
lobidResources
lobidOrgani-sations
LEM
LinkedMDB
LinkedLCCN
LinkedGeoData
LinkedCT
LinkedUser
FeedbackLOV
Linked Open
Numbers
LODE
Eurostat (OntologyCentral)
Linked EDGAR
(OntologyCentral)
Linked Crunch-
base
lingvoj
Lichfield Spen-ding
LIBRIS
Lexvo
LCSH
DBLP (L3S)
Linked Sensor Data (Kno.e.sis)
Klapp-stuhl-club
Good-win
Family
National Radio-activity
JP
Jamendo (DBtune)
Italian public
schools
ISTAT Immi-gration
iServe
IdRef Sudoc
NSZL Catalog
Hellenic PD
Hellenic FBD
PiedmontAccomo-dations
GovTrack
GovWILD
GoogleArt
wrapper
gnoss
GESIS
GeoWordNet
GeoSpecies
GeoNames
GeoLinkedData
GEMET
GTAA
STITCH
SIDER
Project Guten-berg
MediCare
Euro-stat
(FUB)
EURES
DrugBank
Disea-some
DBLP (FU
Berlin)
DailyMed
CORDIS(FUB)
Freebase
flickr wrappr
Fishes of Texas
Finnish Munici-palities
ChEMBL
FanHubz
EventMedia
EUTC Produc-
tions
Eurostat
Europeana
EUNIS
EU Insti-
tutions
ESD stan-dards
EARTh
Enipedia
Popula-tion (En-AKTing)
NHS(En-
AKTing) Mortality(En-
AKTing)
Energy (En-
AKTing)
Crime(En-
AKTing)
CO2 Emission
(En-AKTing)
EEA
SISVU
education.data.g
ov.uk
ECS South-ampton
ECCO-TCP
GND
Didactalia
DDC Deutsche Bio-
graphie
datadcs
MusicBrainz
(DBTune)
Magna-tune
John Peel
(DBTune)
Classical (DB
Tune)
AudioScrobbler (DBTune)
Last.FM artists
(DBTune)
DBTropes
Portu-guese
DBpedia
dbpedia lite
Greek DBpedia
DBpedia
data-open-ac-uk
SMCJournals
Pokedex
Airports
NASA (Data Incu-bator)
MusicBrainz(Data
Incubator)
Moseley Folk
Metoffice Weather Forecasts
Discogs (Data
Incubator)
Climbing
data.gov.uk intervals
Data Gov.ie
databnf.fr
Cornetto
reegle
Chronic-ling
America
Chem2Bio2RDF
Calames
businessdata.gov.
uk
Bricklink
Brazilian Poli-
ticians
BNB
UniSTS
UniPathway
UniParc
Taxonomy
UniProt(Bio2RDF)
SGD
Reactome
PubMedPub
Chem
PRO-SITE
ProDom
Pfam
PDB
OMIMMGI
KEGG Reaction
KEGG Pathway
KEGG Glycan
KEGG Enzyme
KEGG Drug
KEGG Com-pound
InterPro
HomoloGene
HGNC
Gene Ontology
GeneID
Affy-metrix
bible ontology
BibBase
FTS
BBC Wildlife Finder
BBC Program
mes BBC Music
Alpine Ski
Austria
LOCAH
Amster-dam
Museum
AGROVOC
AEMET
US Census (rdfabout)
Abf
rage
Ant
wor
t
27/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Beispiel: Visualisierung der Wahlergebnisse
I Daten von IT.NRW (Landesbetrieb Information und TechnikNordrhein-Westfalen) im CSV Format
I Schritt 1: Konvertierung nach RDF (mittels GoogleAppEngine* Wrapper oder Google Refine** mit RDFExtension***)
I Schritt 2: Linked Data AbfragenI Schritt 3: Visualisierung der Ergebnisse
*http://code.google.com/appengine/**http://code.google.com/p/google-refine/***http://lab.linkeddata.deri.ie/2010/grefine-rdf-extension/http://gesis-lod.appspot.com/vis/
28/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Beispiel: Visualisierung der Ökonomischen Situation
I Daten von GESIS (Leibniz-Institut fürSozialwissenschaften) im CSV Format
I Schritt 1: Konvertierung nach RDF und publiziere dieDaten online
I Schritt 2: Linked Data AbfragenI Schritt 3: Visualisierung der Ergebnisse
http://gesis-lod.appspot.com/vis/
http://code.google.com/appengine/http://code.google.com/p/google-refine/http://lab.linkeddata.deri.ie/2010/grefine-rdf-extension/http://lab.linkeddata.deri.ie/2010/grefine-rdf-extension/http://gesis-lod.appspot.com/vis/http://gesis-lod.appspot.com/vis/
29/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Beispiel: Visualisierung Eurostat Daten
I Daten von Eurostat (Statistisches Büro der EU) im CSVoder SDMX Format
I Schritt 1: Konvertierung nach RDFI Schritt 2: Linked Data AbfragenI Schritt 3: Visualisierung der Ergebnisse
http://estatwrap.ontologycentral.com/page/tsieb010
30/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Linked Data Services
I Einige Services erlauben nur eingeschränkten Zugriff aufIhre Daten (z.B. APIs von sozialen Netzwerken)
I Manchmal wird mehr als ein Parameter benötigt (z.B. umden kürzesten Abstand zwischen zwei Punkten zuberechnen)
I Idealerweise sollte Linked Data derartige Serviceintegrieren
31/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Szenario
I Typisches Datenintegrationsszenario
Gemeinsames
Datenformat
Daten
Integration
Interaktive
Datenexploration
I Anfrage: Welche Jobangebote gibt es von Konkurrentenvon Facebook?
I Anfrage: Nach welchem Muster vergibt Vulcan CapitalMittel?
32/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Datenqueallen
http://estatwrap.ontologycentral.com/page/tsieb010
33/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Schritt 1: Vorbereitung der Daten - Gemeinsames Datenformat
34/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Schritt 2: Datenintegration
35/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Schritt 3: Interaktive Datenexploration
1. Abfrage
2.E
rgeb
niss
e
3. Visualisierung
36/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Verlinkung von Daten mit Daten von Servicen?
:facebook foaf:name "Facebook" .:facebook cb:has_office :facebook-hp .:facebook-hq geo:lat "37.416" .:facebook-hq geo:long "122.152" .:facebook-hq vc:locality "Palo Alto, CA" .
Gegeben der Firmenname und Ort, finde dieJobangebote
Gegeben die Koordinaten, finde nahegelegeneOrte (via GeoNames)
37/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Daten Service?
I Gegeben eine Eingabe, erzeuge die AusgabeI Eingabe und Ausgabe hängen in einer
Service-spezifischen Art zusammenI Weltzustand bleibt unverändert
Eingabe Ausgabe
Service
Relation
definiert
I Beispiel: GeoNames findNearbyWikipedia ServiceI Eingabe: Latitude/Longitude KoordinatenI Ausgabe: OrteI Beziehung: Ausgabe Orte sind in der Nähe der
Eingabekoordinaten
38/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
LIDS: Linked Data ServicesI Wünschenswert wäre eine Integration von Daten Servicen
mit Linked Data1. LIDS müssen sich an die Linked Data Prinzipien halten
I Wünschenswert wäre die Nutzung von Daten Servicen inSoftware Programmen
1. LIDS brauchen maschinenlesbare Beschreibungen vonEingabe und Ausgabe
39/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Data Services als Linked Data
I Eingabe ist gegeben als URI
Service Endpoint︷ ︸︸ ︷http://geowrap.openlids.org/findNearbyWikipedia
Parameter︷ ︸︸ ︷?lat=37.416&lng=-122.152
EingabeIdentifier︷ ︸︸ ︷#point
I Auflösung der URI ergibt RDF:@prefix dbp: .
@prefix : .
:point
Relation︷ ︸︸ ︷foaf:based_near dbp:Palo_Alto%2C_California ,
dbp:Packard%27s_garage︸ ︷︷ ︸Ausgabe
.
40/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
LIDS Beschreibungen mittels SPARQL
I Gegeben eine bestimmte Eingabe, kann dieentsprechende Ausgabe von einer impliziten Datenquelleabgefragt werden
I Entspricht einer SPARQL CONSTRUCT Abfrage
CONSTRUCT { [output] } FROM [endpoint] WHERE { [input] }
I Eingabe beschreibt die benötigten Daten alsAbfragemuster
I Der Endpunkt ist die base URI um eine Service Eingabezu konstruieren
I Ausgabe beschreibt die Daten, die der Service geliefert hat
CONSTRUCT { ?point foaf:based_near ?feature. }FROM WHERE { ?point a Point ; geo:lat ?lat ; geo:long ?lng }
41/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
LIDS Zusammenfassung
I Dynamische Quellen (GeoNames Wrapper, TwitterWrapper, Feeds Wrapper) können in Linked Data integriertwerden
I LIDS nützlich fürI Einfügen von LIDS in statische RDF DatensätzeI Linked Data Endpunkte, die dynamisch Links von ihren
Daten zu LIDS hinzufügenI Linked Data Browser, die abgefragte Daten um abgefragte
Daten von LIDS erweiternI Integration von LIDS in die SPARQL Abfrageverarbeitung
I LIDS erlauben das Publizieren und Wiederbenutzen vonDatenservices im Web
42/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012
Zusammenfassung
I Die Menge an verfügbaren Daten wächst ständigI Semantik wird gebraucht, um Daten aus verschiedenen
Quellen zu integrierenI Abfrage und Visualisierung von Daten in Kombination
möglich
I Die Verarbeitung und Abfrage von Daten ausverschiedenen Quellen erhöht die Transparenz underleichtert die Forschung (Testen von Hypothesen wirdeinfacher)