60
Resource Discovery: Sacherschließung am Ende? Prof. Magnus Pfeffer Hochschule der Medien, Stuttgart [email protected]

Resource Discovery - Sacherschließung am Ende?

Embed Size (px)

DESCRIPTION

Mein Vortrag auf der VDB-Fortbildung Erziehungswissenschaft / Pädagogik 11./12. April 2013 in Braunschweig

Citation preview

Page 1: Resource Discovery - Sacherschließung am Ende?

Resource Discovery: Sacherschließung am Ende?

Prof. Magnus PfefferHochschule der Medien, [email protected]

Page 2: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 2

Vom Katalog zum Resource Discovery System

Umsetzung durch kommerzielle Anbieter

Herausforderungen und Probleme in der Suche

Chancen für die Bibliotheken

Ausblick

Überblick

Page 3: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 3

Vom Katalog zum Resource Discovery System

Page 4: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 4

Kataloge Boolesche Suche

Differenzierte Indexe Erweiterte Suche als Standard

Langsame Suche Hardware/Software begrenzen die

Suchgeschwindigkeit

Begrenzte Datenmenge Für jeden Bestand eine eigene Datenbank

Page 5: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 5

Einfache Suche Undifferenzierter „Google-Schlitz“ Erweiterte Suchmöglichkeiten verborgen

Schnelle Ergebnisse Suchgeschwindigkeit nur durch Bandbreite begrenzt

Allumfassend Wenn Google es nicht findet, existiert es nicht

Generation Google

Page 6: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 6

Wissenschaftliche Suchmaschinen

Page 7: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 7

Resource Discovery Fokus für neue Entwicklungen

Suchmaschinentechnologie Modernes und einheitliches User Interface Nutzung durch mobile Endgeräte

Kein neuer Katalog Gleichberechtigter, einheitlicher Zugang zu allen

Beständen der Bibliothek Volltext-Indexierung Web-Scale Discovery

Nach Breeding (2010)

Page 8: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 8

Umsetzung durch kommerzielle Anbieter

Page 9: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 9

Produkte Summon (Serial Solutions/Proquest)

http://www.serialssolutions.com/en/services/summon

Primo mit Primo Central (Ex Libris) http://www.exlibrisgroup.com/de/category/PrimoUeberblick

EBSCO Discovery Service http://www.ebscohost.com/discovery/

Vgl. Jansen et. al. (2010)

Page 10: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 10

Komponenten Suchoberfläche

Rechercheportal im modernen Look Facettiertes Browsen der Ergebnisse Integration von Link Resolvern (Volltextzugang) Anbindung an Bibliothekssystem

Page 11: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 11

Oberfläche mit facettierter Suche

Eingabemaske mit Stichwortsuche

Trefferliste

Facetten zurEinschränkung

der Treffermenge

Erweiterung des Suchraums

Page 12: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 12

Kontointegration und Link Resolver

Page 13: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 13

Komponenten Zentraler Index

Beim Anbieter gehostet Bibliografische Daten für alle Kunden Kunden können Ausschnitte wählen

Lokaler Index Eigene bibliografische Daten

Page 14: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 14

Eigenschaften der Indexe „Megaindex“

Mehrere 100 Millionen Datensätze Nicht nur Metadaten, oft auch Volltexte indexiert Hauptverkaufsargument der Anbieter

Hetrogene Herkunft Verlage und Datenbankproduzenten Bibliothekskataloge Frei verfügbares Open Access Material

Page 15: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 15

Eigenschaften der Indexe Heterogene Inhalte

Zeitschriften-/ Konferenzbeiträge Print- und E-Books Zeitungsartikel, Rezensionen, Working Papers, …

Aber: sehr wenig deutsche/deutschsprachige Inhalte

Page 16: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 16

Unterschiede der Implementierung Installation

Lokal auf eigenem Server Gehostet beim Anbieter: Software-as-a-service

Komponenten Oberfläche + Index vom Anbieter Zentraler Index als Datenquelle für eigene Oberfläche

Page 17: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 17

Unterschiede der Implementierung Selektion des Suchraums

Standardsuchraum Reduktion auf „klassischen“ Katalogbestand Erweiterung auf das „web scale discovery“

Navigation Anordnung und Inhalte der Facetten Drill-down nach formalen und inhaltlichen Aspekten

Page 18: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 18

KonSearch

RDS der UB KonstanzSummon Oberfläche und Index

Beim Anbieter gehostet

Page 19: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 19

Wissensportal Primo

RDS der TU BerlinPrimo Oberfläche und Index

Beim KOBV gehostet

Page 20: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 20

HEIDI

RDS der UB HeidelbergEigene Oberfläche + Summon Index

Lokale Installation

Page 21: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 21

SULB Wissensportal

RDS der Saarländischen Universitäts-und Landesbibliothek

Ebsco Discovery Service Oberfläche und IndexBeim Anbieter gehostet

Page 22: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 22

Katalog Plus

RDS der UB FreiburgEbsco Discovery Service

Eigene Oberfläche + Index vom Anbieter

Page 23: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 23

Zusammenfassung RDS Einfache Suche

Einheitlicher Zugang Modernes Interface

Schnelle Ergebnisse Suchmaschinentechnologie

Umfassend Zugang zu allen Beständen der Bibliothek Erweiterter Suchraum durch zentralen Index

→ Erwartungen werden erfüllt

Page 24: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 24

Herausforderungen und Probleme

Page 25: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 25

Normierung Heterogene Quellen → Heterogene Inhalte

Elemente der Titelaufnahmen Ansetzung von Personennamen Inhaltliche Erschließung

Beobachtung Häufige Dubletten

Titel Erschließungselemente

Verweisungsformen sind nicht suchbar

Page 26: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 26

Heterogene Erschließung Suche nach „Linked Open Data“

Schlagwortfacette EDS, UB Freiburg: 100(!) Einträge Darunter für das Konzept „Linked Open Data“

Linked Data Linked Data (Ld) Linked Data (Semantic Web) Linked Open Data Linked Open Data (Lod)

Page 27: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 27

Ansetzung und Verweise

Page 28: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 28

Dubletten

Page 29: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 29

Nachvollziehbarkeit Inhalte der zentralen Indexe sind nicht dokumentiert

Anbieter sehen den zentralen Index als Möglichkeit, sich von den Wettbewerbern abzugrenzen

Oft nur allgemeine Angaben Verlage Fachgesellschaften Selten: Zeitschriften

Keine Aussagen zum Umfang bestimmter Inhalte

Inhalte des zentralen Index sind nicht stabil Entfernung von Inhalten aufgrund ausgelaufener

Lizenzen

Page 30: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 30

Nachvollziehbarkeit Indexing und Retrieval ist nicht dokumentiert

Indexbasis Metadaten Abstracts Volltext

Normalisierung und linguistische Bearbeitung Umlaute Grammatische Reduktion (z.b. Plural) Synonymerweiterung

Ranking

Page 31: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 31

Indexing und Ranking Konsearch

Suche nach „Linked open data libraries“ Treffer 1 bis 3

Page 32: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 32

Treffermengen Undifferenzierte Suche als Standard

Metadaten und Volltext indexiert Auch spezifische Anfragen liefern riesige Mengen

TU Berlin

UB Freiburg

Page 33: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 33

Chancen

Page 34: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 34

Traditionalle Stärken... Einheitliche Erschließung

Formal Inhaltlich

Strenge Normierung Gemeinsame Normdatei Zeitschriftendatenbank

Relevanz der Inhalte Aktive Auswahl

Page 35: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 35

… für besseres Suchen und Finden Zusammenbringen und Differenzieren

Alles zu einem bestimmten Thema finden Alles von einem Autor finden Klare Trennung von inhaltlich verschiedenem

Nutzer nicht mit großen Treffermengen alleine lassen Sinnvolle Facettierung der Ergebnisse Nicht nur formal, sondern auch inhaltlich

Page 36: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 36

Transparenz Inhalte

Was kann recherchiert werden? Was nicht? Und warum nicht?

Suchprozess Wie wird indexiert? Welche Normalisierungen wurden verwendet? Wurde die Suche verändert?

Page 37: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 37

Fragestellung

Wiesenmüller (2012)

Page 38: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 38

Ja!

Bild: Wikipedia / Public Domain

Page 39: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 39

Systemaufbau

Präsentation

Logik

Datenbank

Oberfläche

Such- und Kontoverwaltung

Index

Page 40: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 40

Präsentation Manipulation der Anzeige

Anbieten von externen Informationen Anbieten von alternativen Sucheinstiegen

Manipulation der Sucheingabe Erkennen von Personen

Sucherweiterung um alternative Schreibweisen

Erkennen von Konzepten Sucherweiterung um Synonyme Anbieten von Disambiguierung Anbieten von Ober- und Unterbegriffen für die Suche

Page 41: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 41

Mock-Up

Gorbatschow

Name erkannt.

Bekannte alternative Schreibeweisen:Gorbačëv

GhurbatshufGkormpatsoph

GorbačëvGorbačevGorbacëv

GorbachevGorbachovGorbaciovGorbač'ovGorbacsovGorbaczowGorbatchevGorbatsjovGorbats'ovGorbatxovГорбачев

Suche automatisch ergänzen?

Page 42: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 42

Mock-Up

Krebs

Meinen Sie:Krebs <Medizin>Krebs <Sterbild>

Page 43: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 43

Mock-Up

Mehr Infomationen

● GND Eintrag● Wikipedia

● Lexika

Neue Suchen

● Vom gleichen Autor● Über diesen Autor

Page 44: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 44

Datenbankschicht Ziel: Homogenisierung der Daten

Anpassen von Datenelementen Anreichern der Daten Anpassen der Indexierung

Aber: Zentraler Index im „Besitz“ der Anbieter

→ Zugang zu den Daten existentiell

Page 45: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 45

Auswerten der Erschließung Inhaltiche Erschließung vielfach vorhanden

Erschließungssysteme heterogen

Ansatz: Abgleich zwischen Erschließungssystemen Manuell erstellte Konkordanzen Automatisch generierte Mappings

Page 46: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 46

Auswertung der Hierarchie Erschließung auf unterschiedlichen Ebenen

Verlag / Reihe Zeitschrift / Sammelband Aufsatz

Ansatz: Akkumulieren und Verteilen „von unten nach oben“ „von oben nach unten“

Page 47: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 47

Auswertung der Redundanz „Echte“ Dubletten

Sehr ähnliche Einträge Ausgaben

Print, Elektronisch, Paperback, International

Auflagen und Versionen Working Paper, Pre- / Postprint

Übersetzungen

Ansatz: Übertragung von inhaltlicher und formaler Erschließung aus Dubletten und anderen Ausgaben

Page 48: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 48

Forschungsprojekt Clustering von Katalogdaten zur Übertragung von

Erschließungsinformationen

Daten SWB

Katalog des Südwestdeutschen Bibliotheksverbundes

Hebis Katalog des Hessischen Bibliotheks- und Informationssystems

HBZ Katalog des Hochschulbibliothekszentrum des Landes Nordrhein-

Westfalen

B3Kat Gemeinsamer Verbundkatalog von Bibliotheksverbund Bayern und

dem Kooperativen Bibliotheksverbund Berlin-Brandenburg

Page 49: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 49

Ergebnisse

Katalog Monografien Anteil RVK

Anteil RSWK

Zuwachs RVK

Zuwachs RSWK

SWB 13.330.743 4.217.226 4.083.113 581.780 957.275

Hebis 8.844.188 1.933.081 2.237.659 1.097.992 1.308.581

HBZ 13.271.840 1.018.298 3.322.100 2.272.558 1.080.162

B3Kat 22.685.738 5.750.295 6.055.164 2.969.381 2.765.967

Page 50: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 50

Ausblick

Page 51: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 51

(Linked) Open Data Bereitstellung in offenen Formaten

Bereitstellung unter freien Lizenzen

Verfügbarkeit großer bibliografischer Datensammlungen Nationalbibliografien Kataloge von Bibliotheken und /-verbünden Fachbibliografien Open-Access Repositorien Verlagsdaten Normdaten

Page 52: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 52

Gemeinsame Infrastruktur Culturegraph.org

Initiative von DNB und HBZ Ziel: Zusammenführen von bibliografischen

Informationen, die als Linked Open Data zur Verfügung stehen

Open Source Infrastruktur Parametrisierbare Metadatenverarbeitung Erweiterbar (Java) Skalierbar (Hadoop)

→ Ideale Ausgangsbasis zur Verarbeitung großer Datenmengen

Page 53: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 53

Freie Softwarelösung vufind

Gemeinsame Entwicklung von Bibliotheken Leistungsfähige Softwarebasis Großer Anwenderkreis

Page 54: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 54

vufind Sucheinstieg

Page 55: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 55

vufind Layout

Page 56: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 56

Berufsfeld Metadatenmanagement als eine zentrale Aufgabe

Damit auch künftiger Ausbildungsschwerpunkt

Ziel: Zusammenführen von Metadaten in eigenem Index Homogenisierung der Daten

Formal Inhaltlich

Anreicherung mit externen Quellen Empfehlungen Verknüpfungen Zusatzinformationen

Page 57: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 57

Die Konkurrenz schläft nicht

Google analysiert die Nutzereingaben

Erkannt werden:Personen

KunstwerkeBücherFilme

Computerspiele….

(auch abstrakte Konzepte)

Angezeigt werden Kurzinformationenund sinnvolle Verknüpfungen

zu anderen Entitäten

Page 58: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 58

Danke für Ihre Aufmerksamkeit!

Folien online unterhttp://www.slideshare.net/MagnusPfeffer/

Dieses Werk bzw. Inhalt steht unter einerCreative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 3.0 Unported Lizenz.

Page 59: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 59

Links Wissensportal Primo

http://portal.ub.tu-berlin.de/

HEIDI http://heidi.ub.uni-heidelberg.de/

KonSearch http://konstanz.summon.serialssolutions.com/

Katalog Plus http://www.ub.uni-freiburg.de/index.php?id=opac&no_cache=1

SLUB Wissensportal http://www.sulb.uni-saarland.de/?id=115

Culturegraph Infrastruktur http://sourceforge.net/projects/culturegraph/

Page 60: Resource Discovery - Sacherschließung am Ende?

12. April 2013 Fortbildung VdB, Braunschweig 60

Quellen Marshall Breeding: The State of the Art in Library Discovery 2010, in:

Computers in Libraries, 30 (1), 2010, S. 31

Heiko Jansen, Kirstin Kemner-Heek, Roswitha Schweitzer: Konkurrenzanalyse ausgewählter kommerzieller Suchindizes, Online-Veröffentlichung, 2010

Magnus Pfeffer: Using clustering across union catalogues to enrich entries with indexing information, in: Data Analysis, Machine Learning and Knowledge Discovery – Proceedings of the 36th Annual Conference of the German Classification Society, Springer, Heidelberg/Berlin, 2012 (noch nicht erschienen)

Heidrun Wiesenmüller: Resource Discovery Systeme, Vortrag auf der 36. Jahrestagung der Gesellschaft für Klassifikation, 2012