of 11 /11
Semantic Web Grundlagen Birte Glimm Institut für Künstliche Intelligenz | 02. Feb 2012 Linked Data 2/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012 Organisatorisches: Inhalt Einleitung und XML 17. Okt Hypertableau II 12. Dez Einführung in RDF 20. Okt Übung 4 15. Dez RDF Schema 24. Okt SPARQL Syntax & Intuition 19. Dez fällt aus 27. Okt SPARQL Semantik 22. Dez Logik – Grundlagen 31. Okt SPARQL 1.1 9. Jan Übung 1 3. Nov Übung 5 12. Jan Semantik von RDF(S) 7. Nov SPARQL Entailment 16. Jan RDF(S) & Datalog Regeln 10. Nov SPARQL Implemetierung 19. Jan OWL Syntax & Intuition 14. Nov Ontology Editing 23. Jan Übung 2 17. Nov Übung 6 26. Jan OWL & BLs 21. Nov Ontology Engineering 30. Jan OWL 2 24. Nov Linked Data 2. Feb Tableau 28. Nov SemWeb Anwendungen 6. Feb Übung 3 1. Dez Übung 7 9. Feb Blocking & Unravelling 5. Dez Wiederholung 13. Feb Hypertableau 8. Dez Übung 8 16. Feb Abfragen und RIF wurde gestrichen 3/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012 Linked Data 4/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012 Daten im Web I Immer mehr Websites stellen einen programmatischen Zugriff auf ihre Daten zur Verfügung I Dabei werden Semantic Web Standards verwendet, z.B. die Linking Open Data (LOD) Initiative http://www.w3.org/wiki/SweoIG/TaskForces/ CommunityProjects/LinkingOpenData I Verwendet werden APIs, z.B. via JSON/REST I Semantic Web Technologien vereinfachen die Integration von Daten aus verschiedenen Quellen I Die Kombination von Daten erlaubt auf tiefere Einblicke

Semantic Web Grundlagen - Linked Data · Semantic Web Grundlagen Birte Glimm Institut für Künstliche Intelligenz j 02. Feb 2012 Linked Data 2/42Birte Glimm j Semantic Web Grundlagen

  • Author
    others

  • View
    5

  • Download
    0

Embed Size (px)

Text of Semantic Web Grundlagen - Linked Data · Semantic Web Grundlagen Birte Glimm Institut für...

  • Semantic Web GrundlagenBirte GlimmInstitut für Künstliche Intelligenz | 02. Feb 2012

    Linked Data

    2/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Organisatorisches: Inhalt

    Einleitung und XML 17. Okt Hypertableau II 12. DezEinführung in RDF 20. Okt Übung 4 15. DezRDF Schema 24. Okt SPARQL Syntax & Intuition 19. Dezfällt aus 27. Okt SPARQL Semantik 22. DezLogik – Grundlagen 31. Okt SPARQL 1.1 9. JanÜbung 1 3. Nov Übung 5 12. JanSemantik von RDF(S) 7. Nov SPARQL Entailment 16. JanRDF(S) & Datalog Regeln 10. Nov SPARQL Implemetierung 19. JanOWL Syntax & Intuition 14. Nov Ontology Editing 23. JanÜbung 2 17. Nov Übung 6 26. JanOWL & BLs 21. Nov Ontology Engineering 30. JanOWL 2 24. Nov Linked Data 2. FebTableau 28. Nov SemWeb Anwendungen 6. FebÜbung 3 1. Dez Übung 7 9. FebBlocking & Unravelling 5. Dez Wiederholung 13. FebHypertableau 8. Dez Übung 8 16. Feb

    Abfragen und RIF wurde gestrichen

    3/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Linked Data

    4/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Daten im Web

    I Immer mehr Websites stellen einen programmatischenZugriff auf ihre Daten zur Verfügung

    I Dabei werden Semantic Web Standards verwendet, z.B.die Linking Open Data (LOD) Initiativehttp://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData

    I Verwendet werden APIs, z.B. via JSON/REST

    I Semantic Web Technologien vereinfachen die Integrationvon Daten aus verschiedenen Quellen

    I Die Kombination von Daten erlaubt auf tiefere Einblicke

    http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenDatahttp://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData

  • 5/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Linked Data im Web 01.05.2007

    Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch.http://lod-cloud.net/

    6/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Linked Data im Web 31.03.2008

    SWConference

    Corpus

    DBpedia RDF Book Mashup

    DBLPBerlin

    Revyu

    Project Guten-berg

    FOAFprofiles

    Geo-names

    Music-brainz

    Magna-tuneJamendo

    World Fact-book

    DBLPHannover

    SIOCprofiles

    Sem-Web-

    Central

    Euro-stat

    ECS South-ampton

    BBCLater +TOTP

    Doap-space

    Open-Guides

    Gov-Track

    US Census Data

    W3CWordNet

    flickrwrapprWiki-

    company

    OpenCyc

    lingvoj

    Onto-world

    BBCJohnPeel

    Flickrexporter

    Audio-Scrobbler QDOS

    updated

    RKB Explorer

    NEW!riese

    NEW!

    Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch.http://lod-cloud.net/

    7/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Linked Data im Web 14.07.2009

    As of July 2009

    LinkedCTReactome

    Taxonomy

    KEGG

    PubMed

    GeneID

    Pfam

    UniProt

    OMIM

    PDB

    SymbolChEBI

    Daily Med

    Disea-some

    CAS

    HGNC

    InterPro

    Drug Bank

    UniParc

    UniRef

    ProDom

    PROSITE

    Gene Ontology

    HomoloGene

    PubChem

    MGI

    UniSTS

    GEOSpecies

    Jamendo

    BBCProgrammes

    Music-brainz

    Magna-tune

    BBCLater +TOTP

    SurgeRadio

    MySpaceWrapper

    Audio-Scrobbler

    LinkedMDB

    BBCJohnPeel

    BBCPlaycount

    Data

    Gov-Track

    US Census Data

    riese

    Geo-names

    lingvoj

    World Fact-book

    Euro-stat

    flickrwrappr

    Open Calais

    RevyuSIOCSites

    Doap-space

    Flickrexporter

    FOAFprofiles

    CrunchBase

    Sem-Web-

    Central

    Open-Guides

    Wiki-company

    QDOS

    Pub Guide

    RDF ohloh

    W3CWordNet

    OpenCyc

    UMBEL

    Yago

    DBpediaFreebase

    Virtuoso Sponger

    DBLPHannover

    IRIT Toulouse

    SWConference

    Corpus

    RDF Book Mashup

    Project Guten-berg

    DBLPBerlin

    LAAS- CNRS

    Buda-pestBME

    IEEE

    IBM

    Resex

    Pisa

    New-castle

    RAE 2001

    CiteSeer

    ACM

    DBLP RKB

    Explorer

    eprints

    LIBRIS

    SemanticWeb.org

    Eurécom

    RKBECS

    South-ampton

    CORDIS

    ReSIST ProjectWiki

    NationalScience

    Foundation

    ECS South-ampton

    LinkedGeoData

    BBC Music

    Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch.http://lod-cloud.net/

    8/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Linked Data im Web 22.09.2010

    As of September 2010

    MusicBrainz

    (zitgist)

    P20

    YAGO

    World Fact-book (FUB)

    WordNet (W3C)

    WordNet(VUA)

    VIVO UFVIVO

    Indiana

    VIVO Cornell

    VIAF

    URIBurner

    Sussex Reading

    Lists

    Plymouth Reading

    Lists

    UMBEL

    UK Post-codes

    legislation.gov.uk

    Uberblic

    UB Mann-heim

    TWC LOGD

    Twarql

    transportdata.gov

    .uk

    totl.net

    Tele-graphis

    TCMGeneDIT

    TaxonConcept

    The Open Library (Talis)

    t4gm

    Surge Radio

    STW

    RAMEAU SH

    statisticsdata.gov

    .uk

    St. Andrews Resource

    Lists

    ECS South-ampton EPrints

    Semantic CrunchBase

    semanticweb.org

    SemanticXBRL

    SWDog Food

    rdfabout US SEC

    Wiki

    UN/LOCODE

    Ulm

    ECS (RKB

    Explorer)

    Roma

    RISKS

    RESEX

    RAE2001

    Pisa

    OS

    OAI

    NSF

    New-castle

    LAAS

    KISTIJISC

    IRIT

    IEEE

    IBM

    Eurécom

    ERA

    ePrints

    dotAC

    DEPLOY

    DBLP (RKB

    Explorer)

    Course-ware

    CORDIS

    CiteSeer

    Budapest

    ACM

    riese

    Revyu

    researchdata.gov

    .uk

    referencedata.gov

    .uk

    Recht-spraak.

    nl

    RDFohloh

    Last.FM (rdfize)

    RDF Book

    Mashup

    PSH

    ProductDB

    PBAC

    Poké-pédia

    Ord-nance Survey

    Openly Local

    The Open Library

    OpenCyc

    OpenCalais

    OpenEI

    New York

    Times

    NTU Resource

    Lists

    NDL subjects

    MARC Codes List

    Man-chesterReading

    Lists

    Lotico

    The London Gazette

    LOIUS

    lobidResources

    lobidOrgani-sations

    LinkedMDB

    LinkedLCCN

    LinkedGeoData

    LinkedCT

    Linked Open

    Numbers

    lingvoj

    LIBRIS

    Lexvo

    LCSH

    DBLP (L3S)

    Linked Sensor Data (Kno.e.sis)

    Good-win

    Family

    Jamendo

    iServe

    NSZL Catalog

    GovTrack

    GESIS

    GeoSpecies

    GeoNames

    GeoLinkedData(es)

    GTAA

    STITCHSIDER

    Project Guten-berg (FUB)

    MediCare

    Euro-stat

    (FUB)

    DrugBank

    Disea-some

    DBLP (FU

    Berlin)

    DailyMed

    Freebase

    flickr wrappr

    Fishes of Texas

    FanHubz

    Event-Media

    EUTC Produc-

    tions

    Eurostat

    EUNIS

    ESD stan-dards

    Popula-tion (En-AKTing)

    NHS (EnAKTing)

    Mortality (En-

    AKTing)Energy

    (En-AKTing)

    CO2(En-

    AKTing)

    educationdata.gov

    .uk

    ECS South-ampton

    Gem. Norm-datei

    datadcs

    MySpace(DBTune)

    MusicBrainz

    (DBTune)

    Magna-tune

    John Peel(DB

    Tune)

    classical(DB

    Tune)

    Audio-scrobbler (DBTune)

    Last.fmArtists

    (DBTune)

    DBTropes

    dbpedia lite

    DBpedia

    Pokedex

    Airports

    NASA (Data Incu-bator)

    MusicBrainz(Data

    Incubator)

    Moseley Folk

    Discogs(Data In-cubator)

    Climbing

    Linked Data for Intervals

    Cornetto

    Chronic-ling

    America

    Chem2Bio2RDF

    biz.data.

    gov.uk

    UniSTS

    UniRef

    UniPath-way

    UniParc

    Taxo-nomy

    UniProt

    SGD

    Reactome

    PubMed

    PubChem

    PRO-SITE

    ProDom

    Pfam PDB

    OMIM

    OBO

    MGI

    KEGG Reaction

    KEGG Pathway

    KEGG Glycan

    KEGG Enzyme

    KEGG Drug

    KEGG Cpd

    InterPro

    HomoloGene

    HGNC

    Gene Ontology

    GeneID

    GenBank

    ChEBI

    CAS

    Affy-metrix

    BibBaseBBC

    Wildlife Finder

    BBC Program

    mesBBC

    Music

    rdfaboutUS Census

    Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch.http://lod-cloud.net/

    http://lod-cloud.net/http://lod-cloud.net/http://lod-cloud.net/http://lod-cloud.net/

  • 9/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Linked Data im Web 19.09.2011

    As of September 2011

    MusicBrainz

    (zitgist)

    P20

    Turismo de

    Zaragoza

    yovisto

    Yahoo! Geo

    Planet

    YAGO

    World Fact-book

    El ViajeroTourism

    WordNet (W3C)

    WordNet (VUA)

    VIVO UF

    VIVO Indiana

    VIVO Cornell

    VIAF

    URIBurner

    Sussex Reading

    Lists

    Plymouth Reading

    Lists

    UniRef

    UniProt

    UMBEL

    UK Post-codes

    legislationdata.gov.uk

    Uberblic

    UB Mann-heim

    TWC LOGD

    Twarql

    transportdata.gov.

    uk

    Traffic Scotland

    theses.fr

    Thesau-rus W

    totl.net

    Tele-graphis

    TCMGeneDIT

    TaxonConcept

    Open Library (Talis)

    tags2con delicious

    t4gminfo

    Swedish Open

    Cultural Heritage

    Surge Radio

    Sudoc

    STW

    RAMEAU SH

    statisticsdata.gov.

    uk

    St. Andrews Resource

    Lists

    ECS South-ampton EPrints

    SSW Thesaur

    us

    SmartLink

    Slideshare2RDF

    semanticweb.org

    SemanticTweet

    Semantic XBRL

    SWDog Food

    Source Code Ecosystem Linked Data

    US SEC (rdfabout)

    Sears

    Scotland Geo-

    graphy

    ScotlandPupils &Exams

    Scholaro-meter

    WordNet (RKB

    Explorer)

    Wiki

    UN/LOCODE

    Ulm

    ECS (RKB

    Explorer)

    Roma

    RISKS

    RESEX

    RAE2001

    Pisa

    OS

    OAI

    NSF

    New-castle

    LAASKISTI

    JISC

    IRIT

    IEEE

    IBM

    Eurécom

    ERA

    ePrints dotAC

    DEPLOY

    DBLP (RKB

    Explorer)

    Crime Reports

    UK

    Course-ware

    CORDIS (RKB

    Explorer)CiteSeer

    Budapest

    ACM

    riese

    Revyu

    researchdata.gov.

    ukRen. Energy Genera-

    tors

    referencedata.gov.

    uk

    Recht-spraak.

    nl

    RDFohloh

    Last.FM (rdfize)

    RDF Book

    Mashup

    Rådata nå!

    PSH

    Product Types

    Ontology

    ProductDB

    PBAC

    Poké-pédia

    patentsdata.go

    v.uk

    OxPoints

    Ord-nance Survey

    Openly Local

    Open Library

    OpenCyc

    Open Corpo-rates

    OpenCalais

    OpenEI

    Open Election

    Data Project

    OpenData

    Thesau-rus

    Ontos News Portal

    OGOLOD

    JanusAMP

    Ocean Drilling Codices

    New York

    Times

    NVD

    ntnusc

    NTU Resource

    Lists

    Norwe-gian

    MeSH

    NDL subjects

    ndlna

    myExperi-ment

    Italian Museums

    medu-cator

    MARC Codes List

    Man-chester Reading

    Lists

    Lotico

    Weather Stations

    London Gazette

    LOIUS

    Linked Open Colors

    lobidResources

    lobidOrgani-sations

    LEM

    LinkedMDB

    LinkedLCCN

    LinkedGeoData

    LinkedCT

    LinkedUser

    FeedbackLOV

    Linked Open

    Numbers

    LODE

    Eurostat (OntologyCentral)

    Linked EDGAR

    (OntologyCentral)

    Linked Crunch-

    base

    lingvoj

    Lichfield Spen-ding

    LIBRIS

    Lexvo

    LCSH

    DBLP (L3S)

    Linked Sensor Data (Kno.e.sis)

    Klapp-stuhl-club

    Good-win

    Family

    National Radio-activity

    JP

    Jamendo (DBtune)

    Italian public

    schools

    ISTAT Immi-gration

    iServe

    IdRef Sudoc

    NSZL Catalog

    Hellenic PD

    Hellenic FBD

    PiedmontAccomo-dations

    GovTrack

    GovWILD

    GoogleArt

    wrapper

    gnoss

    GESIS

    GeoWordNet

    GeoSpecies

    GeoNames

    GeoLinkedData

    GEMET

    GTAA

    STITCH

    SIDER

    Project Guten-berg

    MediCare

    Euro-stat

    (FUB)

    EURES

    DrugBank

    Disea-some

    DBLP (FU

    Berlin)

    DailyMed

    CORDIS(FUB)

    Freebase

    flickr wrappr

    Fishes of Texas

    Finnish Munici-palities

    ChEMBL

    FanHubz

    EventMedia

    EUTC Produc-

    tions

    Eurostat

    Europeana

    EUNIS

    EU Insti-

    tutions

    ESD stan-dards

    EARTh

    Enipedia

    Popula-tion (En-AKTing)

    NHS(En-

    AKTing) Mortality(En-

    AKTing)

    Energy (En-

    AKTing)

    Crime(En-

    AKTing)

    CO2 Emission

    (En-AKTing)

    EEA

    SISVU

    education.data.g

    ov.uk

    ECS South-ampton

    ECCO-TCP

    GND

    Didactalia

    DDC Deutsche Bio-

    graphie

    datadcs

    MusicBrainz

    (DBTune)

    Magna-tune

    John Peel

    (DBTune)

    Classical (DB

    Tune)

    AudioScrobbler (DBTune)

    Last.FM artists

    (DBTune)

    DBTropes

    Portu-guese

    DBpedia

    dbpedia lite

    Greek DBpedia

    DBpedia

    data-open-ac-uk

    SMCJournals

    Pokedex

    Airports

    NASA (Data Incu-bator)

    MusicBrainz(Data

    Incubator)

    Moseley Folk

    Metoffice Weather Forecasts

    Discogs (Data

    Incubator)

    Climbing

    data.gov.uk intervals

    Data Gov.ie

    databnf.fr

    Cornetto

    reegle

    Chronic-ling

    America

    Chem2Bio2RDF

    Calames

    businessdata.gov.

    uk

    Bricklink

    Brazilian Poli-

    ticians

    BNB

    UniSTS

    UniPathway

    UniParc

    Taxonomy

    UniProt(Bio2RDF)

    SGD

    Reactome

    PubMedPub

    Chem

    PRO-SITE

    ProDom

    Pfam

    PDB

    OMIMMGI

    KEGG Reaction

    KEGG Pathway

    KEGG Glycan

    KEGG Enzyme

    KEGG Drug

    KEGG Com-pound

    InterPro

    HomoloGene

    HGNC

    Gene Ontology

    GeneID

    Affy-metrix

    bible ontology

    BibBase

    FTS

    BBC Wildlife Finder

    BBC Program

    mes BBC Music

    Alpine Ski

    Austria

    LOCAH

    Amster-dam

    Museum

    AGROVOC

    AEMET

    US Census (rdfabout)

    Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch.http://lod-cloud.net/

    10/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Semantic Web Technologien

    I Nützlich zum Publizieren, zum Austausch und zurIntegration von Daten

    I Semantic Web Technologien sind mittlerweile rechtausgereift

    I IRIs (IETF RFC 3987, 2005)I HTTP (IETF RFC 2616, 1999)I RDF (W3C Recommendation, 1999, Update in 2004)I RDFS (W3C Recommendation, 2004)I SPARQL (W3C Recommendation, 2008, Update im

    Moment)I OWL (W3C Recommendation, 2004, Update in 2009)

    I Linked Data besteht aus einigen Prinzipien zumPublizieren von Datem im Web

    11/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Linked Data Principles*

    1. Use URIs to name things; not only documents, but alsopeople, locations, concepts, etc.

    2. To enable agents (human users and machine agents alike)to look up those names, use HTTP URIs

    3. When someone looks up a URI we provide usefulinformation; with ’useful’ in the strict sense we usuallymean structured data in RDF.

    4. Include links to other URIs allowing agents (machines andhumans) to discover more things

    *http://www.w3.org/DesignIssues/LinkedData.html

    12/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Zusammenhang zwischen URI einer Sacheund URI einer Quelle

    User Agent

    Web Server

    http://www.polleres.net/foaf.rdf#me

    http://www.polleres.net/foaf.rdf

    HTTPGET

    RDF

    http://lod-cloud.net/http://www.w3.org/DesignIssues/LinkedData.html

  • 13/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Zusammenhang zwischen URI einer Sacheund URI einer Quelle

    User Agent

    Web Server

    http://dbpedia.org/resource/Gordon_Brown

    http://dbpedia.org/data/Gordon_Brown

    http://dbpedia.org/page/Gordon_Brown

    HTTPGET

    303*HTTPGET

    RDF

    *HTTP Response Code 303: See Other

    14/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Hintergrund: Uniform Resource Identifiers

    I Ein Uniform Resource Identifier ist eine kompakteSequenz von Charakteren, die eine abstrakte oderphysikalische Ressource identifizieren [RFC3986]

    I SyntaxURI = Schema ":" hier-part [ "?" Abfrage ] [ "#" Fragment ]

    I Beispiel

    foo://︸ ︷︷ ︸Schema

    authority︷ ︸︸ ︷examemple.com:8042/ bar︸︷︷︸

    path

    query︷ ︸︸ ︷?name=peter #titel︸ ︷︷ ︸

    Fragment

    15/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    URIs/IRIsProtokoll︷ ︸︸ ︷http://

    Domäne︷ ︸︸ ︷semanticweb.org/id/︸ ︷︷ ︸

    Namensraum

    Axel_Polleres︸ ︷︷ ︸Lokaler Name

    Präfix︷ ︸︸ ︷thing:

    ︷ ︸︸ ︷Axel_Polleres

    I URIs sind “Uniform Resource Identifiers”I IRIs sind Unicode-basierte “Internationalized Resource

    Identifiers”I Jede URI identifiziert eine EntitätI Semantic Web URIs nutzen üblicherweise HTTP

    I HyperText Transfer ProtocolI Können idealerweise aufgelöst werden, um weitere Daten

    zu erhaltenI Linked Data

    16/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Auflösung von URIs

  • 17/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Das HTTP Protokoll

    Das HTTP Protokoll ist laut [RFC2616]I an application-level protocol for distributed, collaborative,

    hypermedia information systemsI a generic, stateless, protocol which can be used for many

    tasks beyond its use for hypertextI a protocol which includes the typing and negotiation of

    data representation, allowing systems to be builtindependently of the data being transferred

    18/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    HTTP Übersicht

    I HTTP Nachrichten bestehen aus der Anfrage eines Clientsan einen Server und die Antworten des Servers zum Client

    I Bestimmte Methoden sind vordefiniert (z.B. GET, POST,etc.), aber weitere können definiert werden

    I Eine Menge von Statuscodes ist definiert:I Informational 1xx, provisional response, (100 Continue)I Successful 2xx, request successfully received, understood,

    and accepted (201 Created)I Redirection 3xx, further action needs to be taken by user

    agent to fulfill the request (301 Moved Permanently)I Client Error 4xx, client erred (405 Method Not Allowed)I Server Error 5xx, server encountered an unexpected

    condition (501 Not Implemented)

    19/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    HTTP Übersicht

    1. Parse URI and find HTTP protocol2. Look up DNS name to determine the

    associated IP address3. Open a TCP stream to port 80 at the

    IP address determined above4. Format an HTTP GET request for

    resource and send that to the server5. Read response from the server6. From status code (200) determine a

    successful request (representationof the resource is available)

    7. Inspect the returned Content-Type(e.g., UTF-8 encoded text/html)

    8. Pass the entity-body to the HTMLrendering engine

    20/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    HTTP GET Request

    GET /todaysnews HTTP/1.1Host: example.comUser-Agent: Mozilla/8.0Accept: text/html,application/xhtml+xml;q=0.9,*/*Accept-language: en-us

  • 21/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    HTTP Response

    HTTP/1.1 200 OKDate: Tue, 28 Aug 2007 01:49:33 GMTServer: Apache/2.2.11Content-Type: text/html; charset=utf-8

    Today’s news

    Today’s News: Oh boy!![HTML FOR NEWS REPORT HERE]

    22/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Repräsentationen

    I Informationsressourcen können unterschiedlicheRepräsentationen haben.

    I Eine Repräsentation ist ein Stream von Bytes in einembestimmten Format wie z.B. HTML, RDF/XML oder JPEG.

    I Beispiel: Eine Rechnung ist eine Informationsressource,die in HTML, als druckbares PDF oder als RDF Dokumentrepräsentiert werden kann.

    I Eine einzelne Ressource kann viele verschiedeneRepräsentationen haben z.B. in verschiedenen Formaten,Auflösungen oder Sprachen

    23/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    HTTP Content Negotiation

    I Content Negotiation (CN, conneg) ist der Prozess derSelektion der besten Repräsentation für eine Anfragewenn mehrere Repräsentationen verfügbar sind

    I Drei Arten: server-driven, agent-driven, transparent

    $ curl -H "Accept: application/rdf+xml"http://dbpedia.org/resource/Galway

    HTTP/1.1 303 See OtherContent-Type: application/rdf+xmlLocation: http://dbpedia.org/data/Galway.rdf$

    curl – Tool um Daten zu einerm Server zu schicken oder von einemServer zu empfangen-H bedeutet nur HTTP/HTTPS

    24/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    RDF als Linked Data

    Andreas Harth

    Datei veröffentlicht unter http://harth.org/andreas/foaf.rdfURI bezeichnet Andreas: http://harth.org/andreas/foaf.rdf#ah

    http://harth.org/andreas/foaf.rdfhttp://harth.org/andreas/foaf.rdf#ah

  • 25/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Semantic Web Application Architecture

    26/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Linked Data Anwendungen: Minimale Architektur

    As of September 2011

    MusicBrainz

    (zitgist)

    P20

    Turismo de

    Zaragoza

    yovisto

    Yahoo! Geo

    Planet

    YAGO

    World Fact-book

    El ViajeroTourism

    WordNet (W3C)

    WordNet (VUA)

    VIVO UF

    VIVO Indiana

    VIVO Cornell

    VIAF

    URIBurner

    Sussex Reading

    Lists

    Plymouth Reading

    Lists

    UniRef

    UniProt

    UMBEL

    UK Post-codes

    legislationdata.gov.uk

    Uberblic

    UB Mann-heim

    TWC LOGD

    Twarql

    transportdata.gov.

    uk

    Traffic Scotland

    theses.fr

    Thesau-rus W

    totl.net

    Tele-graphis

    TCMGeneDIT

    TaxonConcept

    Open Library (Talis)

    tags2con delicious

    t4gminfo

    Swedish Open

    Cultural Heritage

    Surge Radio

    Sudoc

    STW

    RAMEAU SH

    statisticsdata.gov.

    uk

    St. Andrews Resource

    Lists

    ECS South-ampton EPrints

    SSW Thesaur

    us

    SmartLink

    Slideshare2RDF

    semanticweb.org

    SemanticTweet

    Semantic XBRL

    SWDog Food

    Source Code Ecosystem Linked Data

    US SEC (rdfabout)

    Sears

    Scotland Geo-

    graphy

    ScotlandPupils &Exams

    Scholaro-meter

    WordNet (RKB

    Explorer)

    Wiki

    UN/LOCODE

    Ulm

    ECS (RKB

    Explorer)

    Roma

    RISKS

    RESEX

    RAE2001

    Pisa

    OS

    OAI

    NSF

    New-castle

    LAASKISTI

    JISC

    IRIT

    IEEE

    IBM

    Eurécom

    ERA

    ePrints dotAC

    DEPLOY

    DBLP (RKB

    Explorer)

    Crime Reports

    UK

    Course-ware

    CORDIS (RKB

    Explorer)CiteSeer

    Budapest

    ACM

    riese

    Revyu

    researchdata.gov.

    ukRen. Energy Genera-

    tors

    referencedata.gov.

    uk

    Recht-spraak.

    nl

    RDFohloh

    Last.FM (rdfize)

    RDF Book

    Mashup

    Rådata nå!

    PSH

    Product Types

    Ontology

    ProductDB

    PBAC

    Poké-pédia

    patentsdata.go

    v.uk

    OxPoints

    Ord-nance Survey

    Openly Local

    Open Library

    OpenCyc

    Open Corpo-rates

    OpenCalais

    OpenEI

    Open Election

    Data Project

    OpenData

    Thesau-rus

    Ontos News Portal

    OGOLOD

    JanusAMP

    Ocean Drilling Codices

    New York

    Times

    NVD

    ntnusc

    NTU Resource

    Lists

    Norwe-gian

    MeSH

    NDL subjects

    ndlna

    myExperi-ment

    Italian Museums

    medu-cator

    MARC Codes List

    Man-chester Reading

    Lists

    Lotico

    Weather Stations

    London Gazette

    LOIUS

    Linked Open Colors

    lobidResources

    lobidOrgani-sations

    LEM

    LinkedMDB

    LinkedLCCN

    LinkedGeoData

    LinkedCT

    LinkedUser

    FeedbackLOV

    Linked Open

    Numbers

    LODE

    Eurostat (OntologyCentral)

    Linked EDGAR

    (OntologyCentral)

    Linked Crunch-

    base

    lingvoj

    Lichfield Spen-ding

    LIBRIS

    Lexvo

    LCSH

    DBLP (L3S)

    Linked Sensor Data (Kno.e.sis)

    Klapp-stuhl-club

    Good-win

    Family

    National Radio-activity

    JP

    Jamendo (DBtune)

    Italian public

    schools

    ISTAT Immi-gration

    iServe

    IdRef Sudoc

    NSZL Catalog

    Hellenic PD

    Hellenic FBD

    PiedmontAccomo-dations

    GovTrack

    GovWILD

    GoogleArt

    wrapper

    gnoss

    GESIS

    GeoWordNet

    GeoSpecies

    GeoNames

    GeoLinkedData

    GEMET

    GTAA

    STITCH

    SIDER

    Project Guten-berg

    MediCare

    Euro-stat

    (FUB)

    EURES

    DrugBank

    Disea-some

    DBLP (FU

    Berlin)

    DailyMed

    CORDIS(FUB)

    Freebase

    flickr wrappr

    Fishes of Texas

    Finnish Munici-palities

    ChEMBL

    FanHubz

    EventMedia

    EUTC Produc-

    tions

    Eurostat

    Europeana

    EUNIS

    EU Insti-

    tutions

    ESD stan-dards

    EARTh

    Enipedia

    Popula-tion (En-AKTing)

    NHS(En-

    AKTing) Mortality(En-

    AKTing)

    Energy (En-

    AKTing)

    Crime(En-

    AKTing)

    CO2 Emission

    (En-AKTing)

    EEA

    SISVU

    education.data.g

    ov.uk

    ECS South-ampton

    ECCO-TCP

    GND

    Didactalia

    DDC Deutsche Bio-

    graphie

    datadcs

    MusicBrainz

    (DBTune)

    Magna-tune

    John Peel

    (DBTune)

    Classical (DB

    Tune)

    AudioScrobbler (DBTune)

    Last.FM artists

    (DBTune)

    DBTropes

    Portu-guese

    DBpedia

    dbpedia lite

    Greek DBpedia

    DBpedia

    data-open-ac-uk

    SMCJournals

    Pokedex

    Airports

    NASA (Data Incu-bator)

    MusicBrainz(Data

    Incubator)

    Moseley Folk

    Metoffice Weather Forecasts

    Discogs (Data

    Incubator)

    Climbing

    data.gov.uk intervals

    Data Gov.ie

    databnf.fr

    Cornetto

    reegle

    Chronic-ling

    America

    Chem2Bio2RDF

    Calames

    businessdata.gov.

    uk

    Bricklink

    Brazilian Poli-

    ticians

    BNB

    UniSTS

    UniPathway

    UniParc

    Taxonomy

    UniProt(Bio2RDF)

    SGD

    Reactome

    PubMedPub

    Chem

    PRO-SITE

    ProDom

    Pfam

    PDB

    OMIMMGI

    KEGG Reaction

    KEGG Pathway

    KEGG Glycan

    KEGG Enzyme

    KEGG Drug

    KEGG Com-pound

    InterPro

    HomoloGene

    HGNC

    Gene Ontology

    GeneID

    Affy-metrix

    bible ontology

    BibBase

    FTS

    BBC Wildlife Finder

    BBC Program

    mes BBC Music

    Alpine Ski

    Austria

    LOCAH

    Amster-dam

    Museum

    AGROVOC

    AEMET

    US Census (rdfabout)

    Abf

    rage

    Ant

    wor

    t

    27/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Beispiel: Visualisierung der Wahlergebnisse

    I Daten von IT.NRW (Landesbetrieb Information und TechnikNordrhein-Westfalen) im CSV Format

    I Schritt 1: Konvertierung nach RDF (mittels GoogleAppEngine* Wrapper oder Google Refine** mit RDFExtension***)

    I Schritt 2: Linked Data AbfragenI Schritt 3: Visualisierung der Ergebnisse

    *http://code.google.com/appengine/**http://code.google.com/p/google-refine/***http://lab.linkeddata.deri.ie/2010/grefine-rdf-extension/http://gesis-lod.appspot.com/vis/

    28/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Beispiel: Visualisierung der Ökonomischen Situation

    I Daten von GESIS (Leibniz-Institut fürSozialwissenschaften) im CSV Format

    I Schritt 1: Konvertierung nach RDF und publiziere dieDaten online

    I Schritt 2: Linked Data AbfragenI Schritt 3: Visualisierung der Ergebnisse

    http://gesis-lod.appspot.com/vis/

    http://code.google.com/appengine/http://code.google.com/p/google-refine/http://lab.linkeddata.deri.ie/2010/grefine-rdf-extension/http://lab.linkeddata.deri.ie/2010/grefine-rdf-extension/http://gesis-lod.appspot.com/vis/http://gesis-lod.appspot.com/vis/

  • 29/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Beispiel: Visualisierung Eurostat Daten

    I Daten von Eurostat (Statistisches Büro der EU) im CSVoder SDMX Format

    I Schritt 1: Konvertierung nach RDFI Schritt 2: Linked Data AbfragenI Schritt 3: Visualisierung der Ergebnisse

    http://estatwrap.ontologycentral.com/page/tsieb010

    30/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Linked Data Services

    I Einige Services erlauben nur eingeschränkten Zugriff aufIhre Daten (z.B. APIs von sozialen Netzwerken)

    I Manchmal wird mehr als ein Parameter benötigt (z.B. umden kürzesten Abstand zwischen zwei Punkten zuberechnen)

    I Idealerweise sollte Linked Data derartige Serviceintegrieren

    31/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Szenario

    I Typisches Datenintegrationsszenario

    Gemeinsames

    Datenformat

    Daten

    Integration

    Interaktive

    Datenexploration

    I Anfrage: Welche Jobangebote gibt es von Konkurrentenvon Facebook?

    I Anfrage: Nach welchem Muster vergibt Vulcan CapitalMittel?

    32/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Datenqueallen

    http://estatwrap.ontologycentral.com/page/tsieb010

  • 33/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Schritt 1: Vorbereitung der Daten - Gemeinsames Datenformat

    34/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Schritt 2: Datenintegration

    35/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Schritt 3: Interaktive Datenexploration

    1. Abfrage

    2.E

    rgeb

    niss

    e

    3. Visualisierung

    36/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Verlinkung von Daten mit Daten von Servicen?

    :facebook foaf:name "Facebook" .:facebook cb:has_office :facebook-hp .:facebook-hq geo:lat "37.416" .:facebook-hq geo:long "122.152" .:facebook-hq vc:locality "Palo Alto, CA" .

    Gegeben der Firmenname und Ort, finde dieJobangebote

    Gegeben die Koordinaten, finde nahegelegeneOrte (via GeoNames)

  • 37/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Daten Service?

    I Gegeben eine Eingabe, erzeuge die AusgabeI Eingabe und Ausgabe hängen in einer

    Service-spezifischen Art zusammenI Weltzustand bleibt unverändert

    Eingabe Ausgabe

    Service

    Relation

    definiert

    I Beispiel: GeoNames findNearbyWikipedia ServiceI Eingabe: Latitude/Longitude KoordinatenI Ausgabe: OrteI Beziehung: Ausgabe Orte sind in der Nähe der

    Eingabekoordinaten

    38/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    LIDS: Linked Data ServicesI Wünschenswert wäre eine Integration von Daten Servicen

    mit Linked Data1. LIDS müssen sich an die Linked Data Prinzipien halten

    I Wünschenswert wäre die Nutzung von Daten Servicen inSoftware Programmen

    1. LIDS brauchen maschinenlesbare Beschreibungen vonEingabe und Ausgabe

    39/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Data Services als Linked Data

    I Eingabe ist gegeben als URI

    Service Endpoint︷ ︸︸ ︷http://geowrap.openlids.org/findNearbyWikipedia

    Parameter︷ ︸︸ ︷?lat=37.416&lng=-122.152

    EingabeIdentifier︷ ︸︸ ︷#point

    I Auflösung der URI ergibt RDF:@prefix dbp: .

    @prefix : .

    :point

    Relation︷ ︸︸ ︷foaf:based_near dbp:Palo_Alto%2C_California ,

    dbp:Packard%27s_garage︸ ︷︷ ︸Ausgabe

    .

    40/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    LIDS Beschreibungen mittels SPARQL

    I Gegeben eine bestimmte Eingabe, kann dieentsprechende Ausgabe von einer impliziten Datenquelleabgefragt werden

    I Entspricht einer SPARQL CONSTRUCT Abfrage

    CONSTRUCT { [output] } FROM [endpoint] WHERE { [input] }

    I Eingabe beschreibt die benötigten Daten alsAbfragemuster

    I Der Endpunkt ist die base URI um eine Service Eingabezu konstruieren

    I Ausgabe beschreibt die Daten, die der Service geliefert hat

    CONSTRUCT { ?point foaf:based_near ?feature. }FROM WHERE { ?point a Point ; geo:lat ?lat ; geo:long ?lng }

  • 41/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    LIDS Zusammenfassung

    I Dynamische Quellen (GeoNames Wrapper, TwitterWrapper, Feeds Wrapper) können in Linked Data integriertwerden

    I LIDS nützlich fürI Einfügen von LIDS in statische RDF DatensätzeI Linked Data Endpunkte, die dynamisch Links von ihren

    Daten zu LIDS hinzufügenI Linked Data Browser, die abgefragte Daten um abgefragte

    Daten von LIDS erweiternI Integration von LIDS in die SPARQL Abfrageverarbeitung

    I LIDS erlauben das Publizieren und Wiederbenutzen vonDatenservices im Web

    42/42 Birte Glimm | Semantic Web Grundlagen | 02. Feb 2012

    Zusammenfassung

    I Die Menge an verfügbaren Daten wächst ständigI Semantik wird gebraucht, um Daten aus verschiedenen

    Quellen zu integrierenI Abfrage und Visualisierung von Daten in Kombination

    möglich

    I Die Verarbeitung und Abfrage von Daten ausverschiedenen Quellen erhöht die Transparenz underleichtert die Forschung (Testen von Hypothesen wirdeinfacher)