of 39 /39
© KIM Linked Library Data & RDA - Berlin, 15. September 2010 Linked Library Data & RDA Alexander Haffner

Linked Library Data & RDA

Embed Size (px)

DESCRIPTION

Durch den neuen Erschließungsstandard „Resource Description and Access“ (RDA) lassen sich bibliografische Daten sowie Normdaten Semantic-Web-konform repräsentieren. Der Vortrag soll aufzeigen, welche Auswirkungen RDA auf die Katalogisierung in Bibliotheken und den Zugang zu den erschlossenen Ressourcen im Semantic Web hat. Anhand erster Erfahrungen aus praktischen Umsetzungen wird erläutert, wie bibliografische Daten durch RDA und Linked-Data-Technologien besser zugänglich gemacht und vor allem nachgenutzt werden können.

Text of Linked Library Data & RDA

  • 1. Linked Library Data & RDA Alexander Haffner
  • 2. Kosteneffizienz Internationalisierung Interoperabilitt Nutzerbedrfnisse Zielstellung
  • 3.
    • bergang von der Industrie- zur Informationsgesellschaft
    • bietet die Infrastruktur fr eine neue Qualitt des Umgangs mit Information hinsichtlich Beschaffung wie auch Bereitstellung.
      • hohe Verfgbarkeit
      • hohe Aktualitt
      • geringe Kosten
    • Probleme des Webs:
      • Flle an Informationen
      • ausgerichtet auf Menschen als Endnutzer
      • Lokalisierung von Information problematisch
      • heutige Suchmaschinen gut, aber stichwortbasiert
    • wnschenswert:
      • inhaltliche, semantische Suche
    Das Web Pascal Hitzler, 2008
  • 4. Das Semantic Web
    • Ziele:
      • Strukturierung der Web-Informationen zur Erleichterung der automatisierten Auswertung
      • offene Standards zur Beschreibung von Informationen / Wissen
        • RDF, RDFS, OWL, SKOS
        • domnenspezifische Vokabulare
      • Just-In-Time-Abfrage dezentraler Wissensbasen
      • Methoden zur Gewinnung von weiteren Informationen aus existierenden Beschreibungen
  • 5. Ist-Stand in Bibliotheken
  • 6. Harvesting mittels OAI-PMH Data Provider Data Provider Data Provider Service Provider HTTP Anfrage XML Nutzer
  • 7. Linked Data und das Semantic Web
  • 8. Wissensmodellierung
    • Ontologien als zentrale Technologie!
      • Stellen einen Bezugsrahmen fr
        • die Disambiguierung und
        • die globale Vernetzung von Bedeutung zur Verfgung
      • Vermitteln Hintergrundwissen
      • Haben eine explizite formale Semantik
      • Knnen als gemeinsame Ressource genutzt werden, z.B. ber das WWW
      • Erlauben die Integration verteilten Wissens
      • Erlauben den Umgang mit implizitem Wissen
    Pascal Hitzler, 2008
  • 9.
    • RDF Schema (RDFS):
      • Definition der Struktur von Metadaten-Records (Datenmodell)
      • Definition von Classes und Properties
      • fr die Reprsentation leichtgewichtiger Ontologien
    • Web Ontology Language (OWL):
      • Definition von Metadatenstrukturen und fr die Reprsentation von kontollierten Vokabular
      • fr die Reprsentation von komplexen Ontologien:
        • erlaubt logisches Schlieen auf Basis der Prdikatenlogik
    Wissensmodellierung
  • 10. Kontrollierte Vokabulare
    • Simple Knowledge Organization System (SKOS):
      • Knowledge Organisation Systems (KOS) bezeichnen Systeme zur Wissensorganisation
      • SKOS dient der Reprsentation von Klassifikationssystemen, Thesauri und anderem kontrollierten Vokabularien
    • Simple drckt aus, dass auf einige Merkmale zur Reprsentation von KOS verzichtet wird
      • Ein gemeinsamer Nenner zur Reprsentation
  • 11. SKOS auf einer Folie
    • Zentrale Begriffe:
      • Das Konzept (concept)
      • Konzepte werden zusammengefasst zu einem concept-scheme
      • Konzepte knnen mit Bezeichnern (Lexical Labels) in verschiedenen Sprachen versehen werden: prefLabel, altLabel, hiddenLabel
      • Identifikation und Dokumentation: notation, note, changeNote, definition, editorialNote, example, historyNote, scopeNote
      • Konzepte knnen verlinkt werden: broader, narrower, related
      • Schlielich: Mapping und Gruppierung: broadMatch, closeMatch, exactMatch, mappingRelation, narrowMatch, relatedMatch
    Kai Eckert, 2010
  • 12. Beispiel: SKOS
  • 13. Linked Data und das Semantic Web
  • 14.
    • Nachnutzung der Daten:
      • ffentlich zugngliches Netz von strukturierten Informationen
      • Vielzahl von Informationsanbieteren aus kommerziellen sowie nicht-kommerziellen (ffentlichen) Bereichen
      • Ausweisung bzw. Vermeidung von redundanten Informationen
    • Problemstellung:
      • Was sind zuverlssige und vertrauenswrdige Daten?
      • Wer beurteilt die Zuverlssigkeit und Vertrauenswrdigkeit der Daten?
      • Wie verdeutlicht man, dass Daten zuverlssig und vertrauenswrdig sind?
    Vertrauenswrdigkeit von Linked Data
  • 15.
    • Linked Data in Bibliotheken:
      • Bibliografische Daten und Normdaten
        • seit Jahrzehnten intellektuell erschlossen
        • werden einen Status von zuverlssigen und vertrauenswrdigen Daten im Semantic Web bekommen
    • Nachnutzung durch eine Vielzahl von Service Providern
      • kommerzielles Interesse
      • globale Informationsvernetzung
    Bibliotheken im Semantic Web
  • 16. DNB BVB SWB GBV HBZ HeBIS KOBV VBB SUBHH SLUB SBB BSB SUBG Bibliotheken im Semantic Web Internationale Bibliotheken
  • 17.
    • Nutzerzentrierter Katalogisierungsstandard
      • Neuausrichtung der Katalogisierungsperspektive
      • Regelwerk fr Bibliothekare und Nicht-Bibliothekare fr die akkurate Beschreibung von Entitten und deren Beziehungen
    • Basiert auf FRBR und FRAD
    • RDA soll AACR2 und RAK-WB ablsen und eine internationale Harmonisierung schaffen
      • deckt alle Medientypen ab (nicht-digital und digital; textuell, visuell, auditiv, taktil etc.)
    • erstes Release von RDA Juni 2010
      • Verffentlichung des Regelwerkes im RDA-Toolkit
    • unabhngig von Metadatenformaten
      • definitive Realisierung in MARC 21 und RDF
      • RDA-Entwicklung zielt auf Vorteile des Semantic Web ab
    Resource Description and Access (RDA)
  • 18.
    • Katalogisierungsmodell fr die Identifikation und eindeutige Definition von:
      • Entitten von Interesse fr Benutzer anhand der bibliografischen Eintragung,
      • Attributen zu Entitten,
      • Beziehungen zwischen Entitten.
    • Entitten im FRBR Model:
      • group 1: work, expression, manifestation, item
      • group 2: person, corporate body
      • group 3: concept, object, event, and place
    Functional Requirements for Bibliographic Records (FRBR)
  • 19. FRBR-Entitten Gruppe 1
    • Gruppe 1:
      • Produkte intellektueller bzw. knstlerischer Anstrengungen
  • 20. FRBR-Entitten und Beziehungen
    • Gruppe 2:
      • Verantwortliche fr
        • den intellektuellen bzw. knstlerischen Inhalt
        • fr die physische Produktion und Verbreitung oder
        • fr den Schutz
        • der Entitten der Gruppe 1
  • 21. FRBR-Entitten Gruppe 1
      • Suchanfrage: Dan Brown als Autor
    Work 3: Angels & demons / Dan Brown (2000) Work 2: Digital Fortress / Dan Brown (1998) Work 4: Deception Point / Dan Brown (2001) Work 1: 187 Men to Avoid / Dan Brown (1995) Work 5: The Da Vinci Code / Dan Brown (2003) Work 6: The Lost Symbol / Dan Brown (2009)
  • 22. FRBR-Entitten Gruppe 1 Work 3: Angels & demons / Dan Brown (2000) Expression 1: Text Expression X: Text (German) Expression 2: Spoken word Expression 3: Braille Manifestation 1a: Angels & demons / Dan Brown. New York : Pocket Books, 2000. 430 p. : maps, 25 cm. (Angels and demons) ISBN 0671027360 Manifestation 1b: Angels & demons / Dan Brown. eBook. New York : Atria Books, 2004. Adobe PDF, 899 KB. (Angels and demons) ISBN 0743412397
  • 23. FRBR-Entitten und Beziehungen
    • Gruppe 3:
      • Zustzliche Entitten, die (neben den Entitten der Gruppen 1 und 2) der thematischen Beschreibung von Werken dienen
  • 24. Functional Requirements for Authority Data (FRAD)
  • 25.
    • Definition eines Semantic-Web-konformen RDA-Formats durch die DCMI/RDA Task Group
      • RDA Element Sets (Classes, Properties)
      • z. B. Werk, Title, Content type
      • RDA Value Vocabularies (kontrolliertes Vokabular)
      • z. B. spoken word (instance of content type)
      • http://metadataregistry.org/rdabrowse.htm
    • Reprsentationen fr FRBRer, FRBRoo und FRAD werden durch die FRBR Review Group spezifiziert
      • FRBRer (provisorisch): http://metadataregistry.org/schema/show/id/5.html
      • FRAD (provisorisch):
      • http://metadataregistry.org/schema/show/id/24.html
    Die Ontologien - Element Sets und Vokabulare
  • 26. Ontologiespezifikation in der Metadata Registry
  • 27. RDA Record - Person
  • 28. RDA Record - Person
  • 29. RDA Record - Work
  • 30. RDA Record - Expression
  • 31. RDA Record - Manifestation
  • 32.
    • Ausweisung von Gleichheitsbeziehungen zwischen Entitten
      • Redundanzausweisung
    • Nachnutzung bereits erschlossener und Integration neuer Ressourcen
      • Internationales Datennetz
      • Zeit- und Kostenreduktion
    • Dezentrale Suchanfragen ber das Web
      • Voraussetzung SPARQL-Interface und performanter Triple-Store auf Seiten des Data Providers
      • Endnutzeranfragen auf unbegrenzter Anzahl von dezentralen Datenbanken/Katalogen
      • Automatisierte Datenanreicherung
    Mehrwert von Linked Library Data
  • 33.
    • Aggregation von Informationen
      • MARC 21 Beispiel:
        • 370 ## $eBerlin $s1928 $t1933
        • 370 ## $eDresden $s1933 $t1939
      • RDF-Beispiel:
    Grenzen derzeitiger Linked Library Data
  • 34.
    • Aggregation von Informationen
      • MARC 21 Beispiel:
        • 370 ## $eBerlin $s1928 $t1933
        • 370 ## $eDresden $s1933 $t1939
      • RDF-Beispiel - Lsungsansatz:
    Grenzen derzeitiger Linked Library Data
  • 35.
    • Meta-Metadaten
      • derzeitiger Umsetzung ohne Meta-Metadaten:
    Grenzen derzeitiger Linked Library Data Corporate Body Person Family Person Person Person Employee Family Member Alternate Identity
  • 36.
    • Meta-Metadaten
      • Umsetzung laut
      • RDA-Regelwerk
    Grenzen derzeitiger Linked Library Data
  • 37.
    • Meta-Metadaten
      • Potentieller
      • Lsungsansatz
    Grenzen derzeitiger Linked Library Data
  • 38.
    • Nutzeranforderungen ins Zentrum der Entwicklung stellen
      • Globale Wissensvernetzung
      • Strukturierung der bibliografischen Entitten nach Nutzerinteresse
        • FRBR-Modell, Katalogisierung nach RDA
    • Aufmerksamkeit fr bibliografische Daten im Semantic Web steigern
      • nicht-bibliothekarische Organisationen knnen die qualitativ hochwertigen Daten automatisiert in ihre Systeme einbinden
      • Vorteil der partiellen Datenabfrage
    • Automatisierte Anreicherung von bibliografischen Daten durch Daten aus externen Datenquellen (z. B. aus kommerziellen Bereichen)
      • Provenance-Ausweisung
    • Etablierung neuer Geschftsmodelle
    Schlussbetrachtung
  • 39.
    • Vielen Dank!
    • discussion is welcome