Semantic Web, SKOS und Linked Data

  • Published on
    24-Jan-2015

  • View
    2.307

  • Download
    10

Embed Size (px)

DESCRIPTION

Presentation held at the KIM Workshop, located at the 4th Leipziger Congress for Information and Library, March 16th 2010.

Transcript

  • 1. Semantic Web, SKOS und Linked Data Kai Eckert4. Leipziger Kongress fr Information und Bibliothek, 16. Mrz 2010Workshop in Kooperation mit dem Kompetenzzentrum Interoperable Metadaten (KIM) Universittsbibliothek Mannheim

2. Was brauchen wir? Eine standardisierte Syntax Damit Metadaten berhaupt als solche erkannt werden! W3C: XML, RDF, RDF Schema, OWL Ein oder mehrere standardisierte Vokabularien Damit Suchmaschinen, Produzenten und Verbraucher die gleicheSprache sprechen Jede Menge Resourcen, die durch Metadaten beschriebensind. Universittsbibliothek Mannheim 3. RDF: Resource Description Framework map www.fourseasons.com/de/tokyo/ type Hotel locationhttp://www.daml.org/2001/12 /namefactbook/factbook- Tokyo ont#A53037 Universittsbibliothek Mannheim 4. Vokabularien Dublin Core FRBR FOAF SKOS SIOCDas Vokabular fr die RDF-Daten. Beschreibung in RDF Schema und OWL Nicht zu verwechseln mit den bibliothekarischenVokabularien: Wertevokabularien Universittsbibliothek Mannheim 5. Was sind RDF-Daten? Tripel, die Aussagen (Statements) darstellen: Subjekt, Prdikat, Objekt Beispiel: Deutschland hat als Hauptstadt Berlin. Das Subjekt und das Prdikat einer Aussage mssen innerhalbvon RDF als URI eindeutig bezeichnet werden. Als Objekt knnen URIs oder Datenwerte (Literale) verwendetwerden. Beispiel in RDF: ex:locations/germany ex:vocab/capital ex:locations/berlin ex:locations/germany ex:vocab/name Deutschland ex:locations/berlin ex:vocab/name BerlinUniversittsbibliothek Mannheim 6. Die Schnheit von URIs Aussagen ber Ressourcen knnen unabhngig von denRessourcen selbst gettigt werden: http://doi.acm.org/10.1145/1298406.1298426 http://purl.org/dc/elements/1.1/creator Verschiedene Orte! Verschiedene Besitzer! http://dblp.uni-trier.de/rec/pers/e/Eckert:Kai/doi:10.1145/1298406.1298426 dc:creatordblp:pers/e/Eckert:Kai/ Universittsbibliothek Mannheim 7. Die Eindeutigkeit von URIs Eine URI beschreibt eindeutig und (hoffentlich) dauerhaft eineganz bestimmte Ressource. http://dblp.uni-trier.de/rec/pers/e/Eckert:Kai/ Aber: Eine Ressource kann durch verschiedene URIsbeschrieben werden http://dblp.uni-trier.de/rec/pers/e/Eckert:Kai/ http://ki.informatik.uni-mannheim.de/people/kai_eckert.html http://de.linkedin.com/in/kaieckert Keine Eineindeutigkeit! Universittsbibliothek Mannheim 8. Ist das ein Problem? Die quivalenz von URIs lsst sich jederzeit und von jedem alsRDF Statement ausdrcken:http://de.linkedin.com/in/kaieckert owl:sameAshttp://dblp.uni-trier.de/rec/pers/e/Eckert:Kai/ Dadurch lassen sich insbesondere auch Prdikate (Vokabular)gleichsetzen. So lassen sich transparent Datenbestnde mit anderenDatenbestnden verknpfen. Linked Data Universittsbibliothek Mannheim 9. Exkurs: URI Syntax : Beispiele http://www.bib.uni-mannheim.de/ mailto:eckert@bib.uni-mannheim.de http://purl.org/dc/elements/1.1/creator http://dublincore.org/2008/01/14/dcelements.rdf#creator info:lc/vocabulary/countries/af urn:nbn:de:gbv:089-3321752945 urn:isbn:0345391802 http://doi.acm.org/10.1145/1298406.1298426 http://dx.doi.org/10.1145/1298406.129842 Universittsbibliothek Mannheim 10. Exkurs: Verschiedene Schemata http://... Lediglich eine registrierte Domain notwendig, um Eindeutigkeit zu sichern. Mglichkeit, URIs mit beliebigen Inhalten zu dereferenzieren (RDF!) PURL Dienst von OCLC mit dem Vorteil, dass URIs dereferenzierbar bleiben, selbst wenn man die eigene Domain wieder aufgibt. URN Eingeschrnkt dereferenzierbar ber Resolver-Dienste Aufwndige Registrierung ber IANA info: Nicht referenzierbar, aber leichter zu registrieren als URN Namespaces.Universittsbibliothek Mannheim 11. Exkurs: Referenzen zu URIs URI Schemes http://www.iana.org/assignments/uri-schemes.html Info URIs (info:/) http://info-uri.info/registry/OAIHandler?verb=ListRecords&metadataPrefix=oai_dc info:lc http://info-uri.info/registry/OAIHandler?verb=GetRecord&metadataPrefix=reg&identifier=info:lc/ Uniform Resource Names (urn::) http://www.iana.org/assignments/urn-namespaces/ Universittsbibliothek Mannheim 12. SKOS: Ein Vokabular fr (Werte-)Vokabulare SKOS = Simple Knowledge Organization System Knowledge Organisation Systems (KOS) bezeichnen Systemezur Wissensorganisation, wie Normdateien, Glossare, Wrterbcher, Ortsverzeichnisse,Schlagwortkataloge, Klassifikationen. Thesauri, SemantischeNetzwerke, Ontologien, ... Simple drckt aus, dass auf einige Merkmale zurReprsentation von KOS verzichtet wird. Ein gemeinsamer Nenner zur Reprsentation von Thesauri,Klassifikationen und Schlagwortkatalogen. Universittsbibliothek Mannheim 13. SKOS auf einer Folie Zentrale Begriff: Das Konzept (concept) Konzepte werden zusammengefasst zu einem concept-scheme Konzepte knnen mit Bezeichnern in verschiedenen Sprachenversehen werden: label Identifikation und Dokumentation: notation, note,changeNote, definition, editorialNote, example,historyNote, scopeNote Konzepte knnen verlinkt werden: broader, narrower,related Schlielich: Mapping und Gruppierung Universittsbibliothek Mannheim 14. SKOS Vokabular Concept editorialNote OrderedCollection ConceptScheme example Member inSchemehistoryNote MemberList hasTopConcept note broadMatch topConceptOfscopeNote closeMatch altLabelBroader exactMatch hiddenLabel broaderTransitive mappingRelation prefLabel narrower narrowMatch notationNarrowerTransitive relatedMatch RelatedMatchRelated changeNoteSemanticRelation definitionCollection Universittsbibliothek Mannheim 15. SKOS XL SKOS Extension for Labels (XL) Hauptpunkte: Lexikalisch identische Labels mssen nicht identisch sein Erlaubt semantische Relationen zwischen Labels Insbesondere zur Implementierung von Relationen wieacronym, use, used for, ... Universittsbibliothek Mannheim 16. Beispiel TheSoz Thesaurus der Sozialwissenschaften 11.600 Terme, davon 7.750 Deskriptoren (Schlagwrter) Komplexe Relationen wie Use for combination oder Used forcombination. Besonderheit: 200 Nicht-Deskriptoren zur Disambiguierung: Beispiel: Der alternative Nicht-Deskriptor Erhebung enthlt dieRelationen Use Datengewinnung, Use Revolution sowie UseWiderstand, die alle gleichwertig zu behandeln sind, und behandeltdadurch die Mehrdeutigkeit des Begriffes Erhebung. Zustzlich existiert eine parallele Klassifikationshierarchie, derdie Deskriptoren zugeordnet werden. Universittsbibliothek Mannheim 17. Beispielimplementierung: TheSoz in SKOS (benutzt SKOS-XL)Element Beschreibung / Funktion SKOS Klasse / PropertyDDDeskriptorskosxl:prefLabelNDNicht-Deskriptorskosxl:altLabelADAlternativer Nicht-Deskriptor skosxl:altLabelNTUnterbegriff (Narrower Term)skos:narrowerBTOberbegriff (Broader Term)skos:broaderRTVerwandter Term (Related Term)skos:relatedUSE Benutze Y statt X (Use) ext:USE als Property der Klasseext:equivalenceRelationshipUFGegenteil von USE: Y benutzt statt X (Used For) ext:UF als Property der Klasseext:equivalenceRelationshipUSK Benutze Kombination X UND Y (Use Combination) ext:preferredTermComponent als Propertyder Klasse ext:CompoundEquivalenceUFK Gegenteil von USK: Benutzt fr X mit Y (Used Forext:compoundNonPreferredTerm undCombination)ext:preferredTermComponent als Propertiesder Klasse ext:CompoundEquivalencetranslation Engl. bersetzung des Terms ext:hasTranslationscope Scope Notes skos:scopeNoteNotationNumerischer Code der systematischen Klassifikation, der skos:notationcodeder Term zuzuordnen istUniversittsbibliothek Mannheim 18. Beispiel STW Standard Thesaurus Wirtschaft, http://zbw.eu/stw/ 5.800 Schlagwrter 17.000 Terme Spezialitt: bergeordnete hierarchische Klassifikation zurUntergliederung der Schlagwrter mit 500 Klassen Ziel: Einheitliche Hierarchie, aber weiterhin Unterscheidungzwischen der Klassifikation und den eigentlichen, zurVerschlagwortung verwendeten, Schlagwrtern. Mglich durch Einfhrung neuer RDF-Klassen, die alsUnterklassen von skos:concept definiert sind.Universittsbibliothek Mannheim 19. Implementierung STW in SKOS Neue Unterklassen von skos:Concept: zbwext:Descriptor: Normale Konzepte zbwext:Thsys: Klassen aus der bergeordneten Hierarchie zurKlassifikation der Konzepte, werden nicht zur Beschreibung vonDokumenten genutzt. Neue Unterklasse von skos:note: zbwext:useInsteadNote: Enthlt Hinweise ber Use Instead-Relationen zwischen Termen, die nicht verloren gehen sollen. Universittsbibliothek Mannheim 20. Weitere SKOS Projekte Standard Thesaurus Wirtschaft (ZBW) Thesaurus fr die Sozialwissenschaften (Gesis) General Multilingual Environmental Thesaurus UK Archival Thesaurus UK Government Category List AGROVOC FAO Agricultural Thesaurus WordNet LCSH Universittsbibliothek Mannheim 21. Linked Data Universittsbibliothek Mannheim 22. Die Daten kommen... Universittsbibliothek Mannheim 23. Linked Open Data der Bibliotheken Katalog der Universitts- und Stadtbibliothek Kln (USB) Katalog der Hochschulbibliothek der Fachhochschule Kln Katalog der Bibliothek/Mediathek der Kunsthochschule frMedien Kln Katalog des Landesbibliothekszentrums Rheinland-Pfalz (LBZ),PLB Speyer Katalog des Landesbibliothekszentrums Rheinland-Pfalz (LBZ),RLB Koblenz Katalog des Landesbibliothekszentrums Rheinland-Pfalz (LBZ),BB Zweibrcken 5,4 Millionen DatenstzeUniversittsbibliothek Mannheim 24. Beispiel: New York Times Verffentlicht seit 2009 den New York Times Index als LinkedOpen Data (Stand: Mrz 2010): 4.978 Personen 3.081 Organisationen 1.910 Orte http://data.nytimes.com/ Linked Data: Eigene Daten, Verknpfungen zu Artikeln, Provenienz-Informationen Verknpft mit geonames.org, dbpedia, freebase, ... Universittsbibliothek Mannheim 25. Beispiel: DBLP DBLP Projekt: http://www.informatik.uni-trier.de/~ley/db/ Verffentlichung als RDF: http://www4.wiwiss.fu-berlin.de/dblp/ Hauptschlich Dublin Core und FOAF Vokabular Universittsbibliothek Mannheim 26. Referenzen Adolphus (2010): The Semantic Web a new tool for libraries? http://info.emeraldinsight.com/librarians/info/viewpoints/semantic_web.htm Borst, Neubert (2009): Case Study: Publishing STW Thesaurusfor Economi

Recommended

View more >