Upload
olligold
View
280
Download
0
Embed Size (px)
DESCRIPTION
Vortrag zur Vorlesung "Datenstrukturierung und Metadatenmanagement" an der HAW Hamburg am 11.12.2013
Citation preview
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Linked Data in Bibliothekskatalogen
Oliver Goldschmidt
TU Hamburg-Harburg
Vortrag im Rahmen des Kurses „Datenstrukturierung und Metadatenmanagement“ von Christine Gläser im WS 2013/14
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in BibliothekskatalogenBildquelle: rjrgmc28 via Flickr
http://www.flickr.com/photos/rjrgmc28/6128952207
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Suchmaschine
Wikipedia Webseite Datenbank
Inhalte der DB
Traditionelles Web
Deep Web
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Suchmaschine
Wikipedia
Webseite
DatenbankInhalte der DB
Semantisches Web
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
It's all about Semantic Web
● das Netz der Bedeutungen● strukturierte Informationen● maschinell interpretierbar● Aufbau von Dienstleistungen durch
Drittanbieter wird vereinfacht
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Warum eigentlich „Open“?
• Das „Open“ in Linked Open Data beschreibt die rechtliche Grundlage des Angebotes
• Die Daten müssen mit einer Lizenz versehen sein, die die Nachnutzung eindeutig erlaubt
• Beispiele offener Lizenzen: Creative Commons (z.B. CC-BY, CC-BY-SA, ...), Public Domain (CC 0)
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
● Bibliographische Daten● Normdaten● Bestandsdaten● Ausleihdaten● Kundendaten● ...
Bibliotheksdaten
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Kataloganreicherung
Bibliothekskatalog
Rezensionen
Covers
InhaltsverzeichnisseBewertungen
Empfehlungen
Zusätzliche Daten(Autoreninfos, ...)
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Szenario Beispiel 1
Bibliothekskatalog
Grundlagen der Relativitäts-theorie vonEinstein???
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
HAW Hamburg: https://kataloge.uni-hamburg.de/DB=2/XMLPRS=N/PPN?PPN=020793707
Treffer im HAW Katalog
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Bibliothekskatalog
Toll! Nun will ich mehr über Einstein wissen!
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Ergebnis im HAW Katalog
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Mehr Infos im HAW Katalog
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Deutsche Nationalbibliothek: http://d-nb.info/451080920
Treffer im DNB Katalog
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Wege zur Anreicherung
● Setzen eines Links auf die zusätzlichen Informationen
● Dynamische Einblendung der Informationen● Übernahme der Informationen
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Setzen eines Links
Dieser Datensatz bei der DNB: http://d-nb.info/451080920
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Dynamische Einblendung
Einheitssachtitel: Meaning of relativity <dt.> (Quelle: http://d-nb.info/451080920)
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Übernahme
Einheitssachtitel: Meaning of relativity <dt.>
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Bezug zu Linked Data
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
http://d-nb.info/451080920/about/rdf
Daten in RDF
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
● Die RDF-Ansicht ist eine primär maschinenlesbare Variante der gleichen Daten
● Die RDF-Ansicht kann ebenso wie die HTML-Ansicht von einem Webserver geladen werden
Daten in RDF
Bildquelle: Amy van der Hiel via Flickr http://www.flickr.com/photos/amyvdh/5060627580
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
● Wir schauen uns nun einen Ausschnitt aus der maschinenlesbaren Datei näher an
● Was wir hier sehen ist RDF in XML● Bei <dc:publisher> sehen wir den Verlagsnamen
Vieweg● Bei <dcterms:creator> sehen wir eine
Internetadresse (URL)
Linked Data in RDF
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Auch zu diesen Infos gibt es eine Repräsentation in RDF!
Auch zu diesen Infos gibt es eine Repräsentation in RDF!
Linked Data aus der GND
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
● Beim Hochschulbibliothekszentrum (HBZ) in Nordrhein-Westfalen werden bereits jetzt Bibliotheksdaten als Linked Data bereitgestellt (lobid.org)
● Lobid umfasst dabei bibliographische Daten und Organisationen (Bibliotheken)
● Beispiel: http://lobid.org/resource/TT000329732/about
Projekt Lobid
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
● Auch aus der VIAF können die Daten unterschiedlich repräsentiert gelesen werden
● RDF: http://viaf.org/viaf/75121530/rdf.xml● HTML: http://viaf.org/viaf/75121530
Projekt VIAF
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
● Projekt von Magnus Pfeffer an der UB Mannheim
● Wurde 2011 auf der SWIB-Tagung vorgestellt
Ausleihdaten als LD
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
● Daten sollten gesammelt und als LOD zur Verfügung gestellt werden– Anzahl der Ausleihvorgänge für ein Medium
– Nutzertyp des Ausleihenden
● Verwendung der Daten– Empfehlungssysteme
– Verbesserung der Relevanzbewertung
Ausleihdaten als LD
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Verwendung der Daten
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
● Projektstatus unklar, vermutlich eingestellt● Ausleihdaten können nur von Bibliotheken
kommen● Mehrwert bei Rankingentscheidungen wäre zu
erwarten
Projektstatus
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
● Linked Data kann zur Unterstützung der Suche genutzt werden
● Über Linked Data können Normdaten eingebunden werden
Linked Data in der Suche
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Problemstellung
Mögliche Probleme bei der Suche:● Pseudonyme● Unterschiedliche Schreibweisen● Synonyme● Homonyme● Mehrsprachigkeit
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Lösungsansatz Schritt 1
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
● alle alternativen Schreibweisen werden mit dem Suchbegriff mit ODER verknüpft
● Es entsteht also: Gorbatschow ODER Gorbačev ODER Gorbachev ODER …
● Im Suchergebnis sind jetzt alle Ergebnisse enthalten
Lösungsansatz Schritt 2
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
● UB Leipzig hat bis Mitte 2013 diesen Lösungsansatz genutzt
● Inzwischen ist die Normdatensuche geändert
● Projekt im LD-Kontext beendet
Projektstatus
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Zwischenfazit
● Es gibt neben LD andere Wege, Daten zur Verfügung zu stellen
● Diese Wege funktionieren bereits● Linked Data kann trotzdem
gewinnbringend eingesetzt werden● Nutzen nur dann gegeben, wenn viele
Bibliotheken Daten liefern
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Aus: Stefan Gradmann: "Container - Content - Context: zur Evolution bibliothekarische Metadaten von Katalogdaten zu Library Linked Data". In: Handbuch Bibliothek. Hrsg. v. Konrad Umlauf und Stefan Gradmann, Stuttgart, Metzler, 2012, S. 127
„Die weltweit größte Bibliothek [ Library of Congress in den USA ]
verabschiedet sich (...) vom Serialisierungsformat MARC“
BIBFRAME Initiative
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
• Feldbasiert
• Codierte Darstellung
• Kryptische Zeichenketten
• Aufwändige Umcodierung
Codierung in MARC
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
• Teilweise schwer interpretierbar
• Schwer erweiterbar
• Uneinheitlich (UK MARC, US MARC, UNIMARC)
Beispiel: Feld 100 (Autor)UK MARC $aShakespeare$hWilliam
US MARC $aShakespeare, William
UNIMARC $aShakespeare$bWilliam
UNIMARC $aShakespeare,$bWilliam
Nachteile von MARC
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Die Technik hinter Linked Data
Bildquelle: Signalhead at en.wikipedia https://commons.wikimedia.org/wiki/File:Data_link_modules.jpg
• Triple-strukturiert
• URI-orientiert
• Ontologiegeprägt
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Triple - Struktur
Universitätsbibliothek der TU Harburg hat email-adresse [email protected].
SubjektPrädikat
Objekt
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
<http://lobid.org/organisation/DE-830> <http://www.w3.org/2006/vcard/ns#email> <mailto:[email protected]> .
URI - Orientierung
● Die Einzelteile des Satzes werden in URIs umgeformt
● HTTP-URIs können im Internet nachgeschlagen werden
● Subjekt und Objekt können auch Nicht-URI-Zeichenketten sein
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Ontologie - Prägung
<http://lobid.org/organisation/DE-830> <http://www.w3.org/2006/vcard/ns#email> <mailto:[email protected]> .
● Prädikat muss aus einer Ontologie stammen● Ontologie definiert also kontrolliertes Vokabular● Ontologie ist frei wählbar● Zahlreiche Ontologien verfügbar
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
✔ Flexibilität✔ Einfachkeit✔ Offenheit✔ Erweiterbarkeit
Vorteile von Linked Data in RDF
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Datenquellen● Gemeinsame Normdatei GND● Deutsche Nationalbibliothek DNB● Virtual International Authority File VIAF● Lobid (Linked Open Data Service des HBZ)● Europeana● Dbpedia● ...
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Bibliothekarische Datenquellen
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
• Anreicherung von Kataloginformationen
• Einbeziehung in bibliothekarische Suchsysteme
• Nicht vergessen: auch selbst Daten beitragen
Datennutzung
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
● Neue Dienste werden realisierbar– Welche Bibliotheken in der Nähe haben ein bestimmtes
Buch?– Ist dieses Buch auch im Moment verfügbar?– Hat diese Bibliothek derzeit auch gerade offen?
● Nahtlosere Integration in andere Webangebote
Datennutzung
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
✗ Datenkonvertierung notwendig
✗ Tools „zu kompliziert“ und schwer handhabbar
✗ Endlosketten oder -schleifen bei der Verfolgung von Links
Technische Hürden
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Ängste
✗ Mangelndes technisches Verständnis✗ Rechtliche Unsicherheit✗ Unsicherheit, eigene Daten aus der Hand zu
geben✗ Meinung, damit kommerziellen Anbietern das
Feld zu überlassen und sich selbst überflüssig zu machen
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Die Hürden und Ängste gilt es zu beseitigen, denn
• Linked Open Data kann sinnvoll genutzt werden
• Aber nur wenn viele mitmachen, ist es wirklich sinnvoll
Daraus ergeben sich zwei mögliche Versionen des Blicks in die Kristallkugel
Perspektiven
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
✗ Linked Data wird (weiterhin) weitgehend von Bibliothekaren ignoriert
✗ Bibliothekssysteme bleiben proprietär und umgehen Linked Data
●
Bildquelle: ihave3kids via Flickr http://www.flickr.com/photos/9012854@N05/4624962871
„Schöne“ neue Welt
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
✔ Linked Data wird verstärkt eingesetzt
✔ Tools werden verbessert, Bibliothekssysteme handhaben Linked Data
✔ Linked Data hilft Bibliotheken, neue Dienste aufzubauen
Bildquelle: Peter E. Lee (via Flickr) http://www.flickr.com/photos/oldpatterns/8546371107
Schöne neue Welt
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
Vielen Dank für Ihre Aufmerksamkeit!
Fragen?
Bildquelle: San Mateo County Library via Flickr http://www.flickr.com/photos/smcl/3939332053
Oliver GoldschmidtHAW Hamburg 11.12.2013
Datenstrukturierung und MetadatenmanagementLinked Data in Bibliothekskatalogen
● Handbuch Bibliothek. Hrsg. v. Konrad Umlauf und Stefan Gradmann, Stuttgart, Metzler, 2012
● Pohl, Adrian; Ostrowski, Felix: Linked Data und die Bibliothekswelt. http://eprints.rclis.org/15324/1/pohl_2011_linked-data_ODOK.pdf
● Christoph, Pascal: Datenanreicherung auf LOD-Basis, http://www.dr0i.de/lib/pages/Datenanreicherung_auf_LOD_Basis.html
● Pfeffer, Magnus: Ausleihdaten aus Bibliotheken als Linked Open Data veröffentlichen http://swib.org/swib11/vortraege/swib11-magnus-pfeffer.pdf
● BIBFRAME Initiative http://www.loc.gov/bibframe/
● Greenall, Rurik: cataloguers as the ultimate reasoning machines http://swib.org/swib11/vortraege/swib11-rurik-greenall.pdf
Quellen