of 30 /30
www.zbw.eu Einbindung von Linked Data in existierende Bibliotheksanwendungen Dr. Timo Borst Joachim Neubert IT-Entwicklung Deutsche Zentralbibliothek für Wirtschaftswissenschaften / Leibniz-Informationszentrum Wirtschaft Kiel/Hamburg SWIB09 – Semantic Web in Bibliotheken Köln, 24./25. November 2009

Einbindung von Linked Data in existierende Bibliotheksanswendungen

  • Author
    redsys

  • View
    533

  • Download
    3

Embed Size (px)

DESCRIPTION

 

Text of Einbindung von Linked Data in existierende Bibliotheksanswendungen

  • 1. Einbindung von Linked Data in existierendeBibliotheksanwendungenDr. Timo BorstJoachim NeubertIT-EntwicklungDeutsche Zentralbibliothek fr Wirtschaftswissenschaften /Leibniz-Informationszentrum WirtschaftKiel/HamburgSWIB09 Semantic Web in BibliothekenKln, 24./25. November 2009 www.zbw.eu
  • 2. bersicht 1) Linked Data in der ZBW: Kurze Historie 2) Design des STW-Webservice und API 3) Integration von Linked Data in Bibliotheksanwendungen a. Motivation (am Beispiel von Repositorien) b. Anwendungsfall_1: Verschlagwortung c. Anwendungsfall_2: Suche d. Anwendungsfall_3: Erfassung von Autoren e. Mehrschichten-Architektur 4) Zusammenfassung und Fazit: Die Bedeutung von Linked Data fr Bibliotheken SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 3. Linked Data in der ZBW: Kurze Historie Die Deutsche Zentralbibliothek fr Wirtschaftswissenschaften / Leibniz-Informationszentrum Wirtschaft sammelt und erfasst wirtschaftswissenschaftliche Literatur seit ber 90 Jahren Hoher Grad an eigener systematischer Indexierung Der Standard-Thesaurus Wirtschaft (STW) wurde in den 90er Jahren gemeinsam mit anderen konomischen Instituten im Rahmen eines Projekts gefrdert Ziel des Projekts war die Vereinheitlichung wirtschaftswissenschaftlicher Schlagwrter Mittlerweile wird der STW von der ZBW weiter gepflegt, aktuell umfasst er 5.800 Schlagwrter in Deutsch und Englisch Mrz 2009 wurde der STW als Linked Data im Netz publiziert. Merkmale: Aufbereitung als SKOS, Webprsentation mit RDFa-Tags, Download als RDF/XML-Datei, SPARQL-Endpoint Verffentlicht unter einer Creative Commons-Lizenz zum nicht- kommerziellen Gebrauch (by-nc-sa) SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 4. Design des STW-Webservice und API (Lngerfristige) Ziele Den STW als Linked Data in ZBW-eigene Applikationen einbinden Auch fr Semantic Web-Unkundige (RDF(a)? OWL?? Turtles?? Graphen?? Ontologien???) anbieten Mglichkeit zur leichtgewichtigen Integration in andere Bibliotheksanwendungen schaffen Damit auch Dritten die Mglichkeit zu verhltnismig unaufwendiger Nachnutzung bieten Externe Linked Data selber wiederum mglichst leichtgewichtig integrieren SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 5. Design des STW-Webservice und API Entwurfsentscheidungen Aktuelle Testversion ffentlich verfgbar unter http://zbw.eu/beta/stw-ws Kommandozeilen-Mimik zur Vermeidung komplexer SPARQL-Anfragen: http://zbw.eu/beta/stw-ws/suggest?query=finanz ist quivalent mit: SELECT DISTINCT ?term ?concept ?prefLabel WHERE { { ?concept skos:prefLabel ?term . } UNION { ?concept skos:altLabel ?term . } UNION { ?concept skos:hiddenLabel ?term . } . FILTER (regex(str(?term), "^finanz", "i")) . ?concept skos:prefLabel ?prefLabel . } ORDER BY ?term LIMIT 10 SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 6. Design des STW-Webservice und API Entwurfsentscheidungen An typischen Anwendungsfllen im Retrieval (Konzept- /Labelsuche, Synonymsuche, Eingrenzung/Erweiterung von Suchanfragen) orientiert Liefert alle notwendigen Informationen in einem Round-Trip Pragmatischer Ansatz: Kein Vollstndigkeitsanspruch im Gegensatz zu SKOS API (2004) und anderen SOAP-basierten Anstzen Anwender (Programmierer) knnen selbstgebaute Queries gegen den ffentlichen SPARQL-Endpoint ausfhren und die Ergebnisse mit demselben Interface ihren eigenen Anwendungen anbieten SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 7. Design des STW-Webservice und API Beispiel: Synonymsuche /synomyms Erhlt einen Term (Ein- oder Mehrwort) und gibt die dazugehrigen Synonyme aus. http://zbw.eu/beta/stwws/stwwswrapper.php?service=synonyms&query=bank SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 8. Design des STW-Webservice und APIbersicht zu den bisher angebotenen Services Servicename Beschreibung /concepts Liefert den Term als Linked Data (d.h. als URI) /narrower Liefert zu einem Term alle Unterbegriffe /labels Liefert alle (mehrsprachigen) Namen fr ein Konzept /synonyms Liefert alle Vorzugsbenennungen eines Terms /suggest Liefert Vorschlge fr einen Suchterm (auf Basis der eingegebenen Anfangszeichen) /combined1 Vereinigung der obigen Operationen, zur Integration in Suchanwendungen SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 9. Design des STW-Webservice und APIParameter des STW-Webservice dataset (stw / jel / ???) query (Suchstring) concept (URI des Konzepts) lang (en / de) output (html / sparql-xml / sparql-json) callback (Javascript-Funktion) SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 10. Integration von Linked Data in Bibliotheksanwendungen Motivation (am Beispiel von Repositorien) Warum Repositorien oder Repository-SW? Repositorien sind allgemein genutzte Erfassungs-/Retrieval- /Verbreitungssysteme (Data Provider), zumeist OSS und Community-getrieben Zahlreiche Installationen an Hochschulen, Bibliotheken, Rechenzentren Einschlgige OSS-Repositoriensoftware (DSpace, EPrints, OPUS) untersttzt derzeit noch nicht die Integration extern kontrollierter Normdaten The major difficulty we have found is with DSpaces handling of metadata. While we feel that the number of fields in Dublin Core is adequate for most if not all uses (DCMI Usage Board 2006), we are troubled by the lack of authority control when completing its fields. Without some control over uniform titles, authors and subjects accessing the items in the future will very problematic. [4] Neither the standards nor the software unterlying institutional repositories anticipated performing naming authority control on widely disparate metadata from highly unreliable sources. [2] SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 11. Integration von Linked Data in Bibliotheksanwendungen Typische Mngel Daten (Autorennamen, beschreibende Schlagwrter, Herausgeber, Dokumenttypen etc.) werden ohne semantische und syntaktische Restriktionen teilweise im Freitext erfasst (Syntaktische) Suchen liefern nur eingeschrnkte oder uneindeutige Ergebnisse, erfordern ggf. aus Anwendersicht subtilere Suchkenntnisse (Trunkierung etc.) (Suche nach Abbott, Philip liefert nur Treffer fr Nr. 2/3) Namensnderungen sind praktisch nicht nachvollziehbar Selbst wenn syntaktische und semantische Eindeutigkeit in einem Repository lokal erzielt werden knnen, erneuert und verschrft sich das Problem auf Seiten der Aggregatoren SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 12. Anwendungsfall_1: Verschlagwortung DER Anwendungsfall fr Bibliothekare Nutzergruppen: Bibliothekare + Wissenschaftler (?) + Bibliotheksnutzer (?) Vorgang: Eingabe von beschreibenden Metadaten, die hufig aus einem kontrollierten Vokabular stammen Bestandteil von Open Access relevanten Vorgngen wie das self-publishing, das self-archiving oder das social tagging Frage: Knnen wir den Vorgang der Verschlagwortung mit Hilfe des STW Webservice untersttzen, so dass wir bei der Eingabe zu besseren normierten Metadaten gelangen? SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 13. Anwendungsfall_1: Verschlagwortung Demo SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 14. Anwendungsfall_1: VerschlagwortungErfassungsmaske unter http://econstor.eu SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 15. Anwendungsfall_1: VerschlagwortungErfassungsmaske unter http://econstor.eu SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 16. Anwendungsfall_2: Suche Der hufigste Anwendungsfall in Bibliotheksanwendungen Nutzergruppen: Bibliothekare + Wissenschaftler + Bibliotheksnutzer Vorgang: Zumeist einfache Volltextsuche ber Metadatenfelder und/oder Volltexte (soweit letztere verfgbar sind und im Suchmaschinenindex liegen) Frage: Knnen wir den Vorgang der Suche mit Hilfe des STW Webservice untersttzen, so dass wir zu besseren Suchergebnissen gelangen? SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 17. Anwendungsfall_2: Suche Demo SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 18. Anwendungsfall_2: SucheErweiterte Suche unter http://econstor.euEingabe: TeleworkTreffer: 9 SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 19. Anwendungsfall_2: SucheMouse-over Telearbeit SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 20. Anwendungsfall_2: SucheTrefferzahl: 20 (!) durch die Erweiterung mit Synonymen SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 21. Anwendungsfall_3: Erfassung von Autoren Der Normalfall in Katalogen - in anderen Erfassungssystemen bisher der Ausnahmefall Nutzergruppen: Bibliothekare + Wissenschaftler (?) + Bibliotheksnutzer (?) Vorgang: Eingabe von Autorennamen Frage: Knnen wir die Autorenerfassung mit Hilfe des STW- Webservice und vor allem mit extern kontrollierten Normdaten so untersttzen, dass wir bei der Eingabe zu besseren Autorendaten gelangen? SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 22. Anwendungsfall_3: Erfassung von Autoren Demo SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 23. Anwendungsfall_3: Erfassung von AutorenErfassungsmaske unter http://87.106.250.18/beta/econstor/ SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 24. Mehrschichten-Architektur SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 25. Integration von Linked Data in Bibliotheksanwendungen Vorteile Leichtgewichtige Erweiterungen bestehender (Alt-)Systeme Strategie des minimalen Eingriffs Keine nderungen am Datenmodell oder am Systemkern ntig Typen von (Web-)Bibliotheksanwendungen, die sich auf diese Weise zwanglos erweitern lieen: Repositorien (zumeist OSS, Plugin-Architektur) Kataloge (zumeist proprietre SW und monolithisch) Portale (zumeist OSS, heterogene Inhalte hinsichtlich Art und Herkunft) -> WebService zur Erzeugung von Meshups sowie alle offenen Systeme mit kollaborativer verteilter Verschlagwortung (z.B. Academic Linkshare) SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 26. Integration von Linked Data in Bibliotheksanwendungen Komplementre Anstze DSpace 1.6 (in Planung, siehe [1]): Umfassende Untersttzung bei der Konfiguration von Auswahlfeldern und ihrer Belegung mit Authority-Plugins (Choice Management) Erweiterung des Datenmodells um eine Spalte fr den Authority Key (nach dem Linked Data-Modell eine URI), ferner um eine Spalte fr die sprachspezifische Anzeige (im Fall von mehrsprachigen Thesauri -> AGROVOC) Anpassungen bei den Eingabe- bzw. Bearbeitungsmasken, bei der Suche und bei der Darstellung SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 27. Zusammenfassung und Fazit:Die Bedeutung von Linked Data fr Bibliotheken Normdaten liegen hufig nicht bei der Einrichtung selbst, sollten gerade deshalb aber eingebunden werden (Bibliotheken als Abnehmer von Linked Data zur Veredelung der im Haus generierten Metadaten) Damit Normdatenbestnde sowohl im Haus als auch von Dritten genutzt werden knnen, bedrfen sie der Exponierung als Linked Data Konsequente Weborientierung: Selbst die passive Nutzung von Linked Data erfordert tiefergehende Kenntnisse ber Webtechnologien Webservices knnen die Schwelle zur Nutzung dieser Daten senken, indem sie ein simples API anbieten Wenn das verbreitet geschieht, haben die Betreiber zumal von Repositorien und anderen webbasierten Bibliothekssystemen die Wahl, welche Schlagwortlisten/Thesauri/Normdaten sie einbinden und welche Tools sie zur Untersttzung von Indexierung und Recherche nutzen. SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 28. Vielen Dank! Timo BorstLinks: Joachim Neubert http://87.106.250.18/beta/econstor/ German National Library of http://zbw.eu/beta/stw-ws Economics (ZBW) / http://zbw.eu/beta/sparql Leibniz Centre for Economics http://zbw.eu/stw {t.borst,j.neubert}@zbw.eu On Publishing STW as SKOS and Linked Data: http://events.linkeddata.org/ldow2009/papers/ldow2009_paper7.pdf SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009
  • 29. Literatur [1] http://wiki.dspace.org/index.php/Authority_Control_of_Metadata_Values [2] http://minds.wisconsin.edu/handle/1793/31735 [3] http://dsug09.ub.gu.se/index.php/dsug/dsug09/paper/view/22/3 [4] http://subjectobject.net/2006/11/09/the-dspace-digital-repository-a- project-analysis/ [5] http://code.google.com/p/dspace-agrisap/wiki/ThesaurusAddOn [6] http://edoc.hu-berlin.de/conferences/dc-2008/subirats-imma- 199/PDF/subirats.pdf SWIB09 Semantic Web in Bibliotheken Kln, 24./25.11.2009