Upload
magnus-pfeffer
View
2.038
Download
0
Embed Size (px)
DESCRIPTION
Mein Vortrag auf der VDB-Fortbildung Erziehungswissenschaft / Pädagogik 11./12. April 2013 in Braunschweig
Citation preview
Resource Discovery: Sacherschließung am Ende?
Prof. Magnus PfefferHochschule der Medien, [email protected]
12. April 2013 Fortbildung VdB, Braunschweig 2
Vom Katalog zum Resource Discovery System
Umsetzung durch kommerzielle Anbieter
Herausforderungen und Probleme in der Suche
Chancen für die Bibliotheken
Ausblick
Überblick
12. April 2013 Fortbildung VdB, Braunschweig 3
Vom Katalog zum Resource Discovery System
12. April 2013 Fortbildung VdB, Braunschweig 4
Kataloge Boolesche Suche
Differenzierte Indexe Erweiterte Suche als Standard
Langsame Suche Hardware/Software begrenzen die
Suchgeschwindigkeit
Begrenzte Datenmenge Für jeden Bestand eine eigene Datenbank
12. April 2013 Fortbildung VdB, Braunschweig 5
Einfache Suche Undifferenzierter „Google-Schlitz“ Erweiterte Suchmöglichkeiten verborgen
Schnelle Ergebnisse Suchgeschwindigkeit nur durch Bandbreite begrenzt
Allumfassend Wenn Google es nicht findet, existiert es nicht
Generation Google
12. April 2013 Fortbildung VdB, Braunschweig 6
Wissenschaftliche Suchmaschinen
12. April 2013 Fortbildung VdB, Braunschweig 7
Resource Discovery Fokus für neue Entwicklungen
Suchmaschinentechnologie Modernes und einheitliches User Interface Nutzung durch mobile Endgeräte
Kein neuer Katalog Gleichberechtigter, einheitlicher Zugang zu allen
Beständen der Bibliothek Volltext-Indexierung Web-Scale Discovery
Nach Breeding (2010)
12. April 2013 Fortbildung VdB, Braunschweig 8
Umsetzung durch kommerzielle Anbieter
12. April 2013 Fortbildung VdB, Braunschweig 9
Produkte Summon (Serial Solutions/Proquest)
http://www.serialssolutions.com/en/services/summon
Primo mit Primo Central (Ex Libris) http://www.exlibrisgroup.com/de/category/PrimoUeberblick
EBSCO Discovery Service http://www.ebscohost.com/discovery/
Vgl. Jansen et. al. (2010)
12. April 2013 Fortbildung VdB, Braunschweig 10
Komponenten Suchoberfläche
Rechercheportal im modernen Look Facettiertes Browsen der Ergebnisse Integration von Link Resolvern (Volltextzugang) Anbindung an Bibliothekssystem
12. April 2013 Fortbildung VdB, Braunschweig 11
Oberfläche mit facettierter Suche
Eingabemaske mit Stichwortsuche
Trefferliste
Facetten zurEinschränkung
der Treffermenge
Erweiterung des Suchraums
12. April 2013 Fortbildung VdB, Braunschweig 12
Kontointegration und Link Resolver
12. April 2013 Fortbildung VdB, Braunschweig 13
Komponenten Zentraler Index
Beim Anbieter gehostet Bibliografische Daten für alle Kunden Kunden können Ausschnitte wählen
Lokaler Index Eigene bibliografische Daten
12. April 2013 Fortbildung VdB, Braunschweig 14
Eigenschaften der Indexe „Megaindex“
Mehrere 100 Millionen Datensätze Nicht nur Metadaten, oft auch Volltexte indexiert Hauptverkaufsargument der Anbieter
Hetrogene Herkunft Verlage und Datenbankproduzenten Bibliothekskataloge Frei verfügbares Open Access Material
12. April 2013 Fortbildung VdB, Braunschweig 15
Eigenschaften der Indexe Heterogene Inhalte
Zeitschriften-/ Konferenzbeiträge Print- und E-Books Zeitungsartikel, Rezensionen, Working Papers, …
Aber: sehr wenig deutsche/deutschsprachige Inhalte
12. April 2013 Fortbildung VdB, Braunschweig 16
Unterschiede der Implementierung Installation
Lokal auf eigenem Server Gehostet beim Anbieter: Software-as-a-service
Komponenten Oberfläche + Index vom Anbieter Zentraler Index als Datenquelle für eigene Oberfläche
12. April 2013 Fortbildung VdB, Braunschweig 17
Unterschiede der Implementierung Selektion des Suchraums
Standardsuchraum Reduktion auf „klassischen“ Katalogbestand Erweiterung auf das „web scale discovery“
Navigation Anordnung und Inhalte der Facetten Drill-down nach formalen und inhaltlichen Aspekten
12. April 2013 Fortbildung VdB, Braunschweig 18
KonSearch
RDS der UB KonstanzSummon Oberfläche und Index
Beim Anbieter gehostet
12. April 2013 Fortbildung VdB, Braunschweig 19
Wissensportal Primo
RDS der TU BerlinPrimo Oberfläche und Index
Beim KOBV gehostet
12. April 2013 Fortbildung VdB, Braunschweig 20
HEIDI
RDS der UB HeidelbergEigene Oberfläche + Summon Index
Lokale Installation
12. April 2013 Fortbildung VdB, Braunschweig 21
SULB Wissensportal
RDS der Saarländischen Universitäts-und Landesbibliothek
Ebsco Discovery Service Oberfläche und IndexBeim Anbieter gehostet
12. April 2013 Fortbildung VdB, Braunschweig 22
Katalog Plus
RDS der UB FreiburgEbsco Discovery Service
Eigene Oberfläche + Index vom Anbieter
12. April 2013 Fortbildung VdB, Braunschweig 23
Zusammenfassung RDS Einfache Suche
Einheitlicher Zugang Modernes Interface
Schnelle Ergebnisse Suchmaschinentechnologie
Umfassend Zugang zu allen Beständen der Bibliothek Erweiterter Suchraum durch zentralen Index
→ Erwartungen werden erfüllt
12. April 2013 Fortbildung VdB, Braunschweig 24
Herausforderungen und Probleme
12. April 2013 Fortbildung VdB, Braunschweig 25
Normierung Heterogene Quellen → Heterogene Inhalte
Elemente der Titelaufnahmen Ansetzung von Personennamen Inhaltliche Erschließung
Beobachtung Häufige Dubletten
Titel Erschließungselemente
Verweisungsformen sind nicht suchbar
12. April 2013 Fortbildung VdB, Braunschweig 26
Heterogene Erschließung Suche nach „Linked Open Data“
Schlagwortfacette EDS, UB Freiburg: 100(!) Einträge Darunter für das Konzept „Linked Open Data“
Linked Data Linked Data (Ld) Linked Data (Semantic Web) Linked Open Data Linked Open Data (Lod)
12. April 2013 Fortbildung VdB, Braunschweig 27
Ansetzung und Verweise
12. April 2013 Fortbildung VdB, Braunschweig 28
Dubletten
12. April 2013 Fortbildung VdB, Braunschweig 29
Nachvollziehbarkeit Inhalte der zentralen Indexe sind nicht dokumentiert
Anbieter sehen den zentralen Index als Möglichkeit, sich von den Wettbewerbern abzugrenzen
Oft nur allgemeine Angaben Verlage Fachgesellschaften Selten: Zeitschriften
Keine Aussagen zum Umfang bestimmter Inhalte
Inhalte des zentralen Index sind nicht stabil Entfernung von Inhalten aufgrund ausgelaufener
Lizenzen
12. April 2013 Fortbildung VdB, Braunschweig 30
Nachvollziehbarkeit Indexing und Retrieval ist nicht dokumentiert
Indexbasis Metadaten Abstracts Volltext
Normalisierung und linguistische Bearbeitung Umlaute Grammatische Reduktion (z.b. Plural) Synonymerweiterung
Ranking
12. April 2013 Fortbildung VdB, Braunschweig 31
Indexing und Ranking Konsearch
Suche nach „Linked open data libraries“ Treffer 1 bis 3
12. April 2013 Fortbildung VdB, Braunschweig 32
Treffermengen Undifferenzierte Suche als Standard
Metadaten und Volltext indexiert Auch spezifische Anfragen liefern riesige Mengen
TU Berlin
UB Freiburg
12. April 2013 Fortbildung VdB, Braunschweig 33
Chancen
12. April 2013 Fortbildung VdB, Braunschweig 34
Traditionalle Stärken... Einheitliche Erschließung
Formal Inhaltlich
Strenge Normierung Gemeinsame Normdatei Zeitschriftendatenbank
Relevanz der Inhalte Aktive Auswahl
12. April 2013 Fortbildung VdB, Braunschweig 35
… für besseres Suchen und Finden Zusammenbringen und Differenzieren
Alles zu einem bestimmten Thema finden Alles von einem Autor finden Klare Trennung von inhaltlich verschiedenem
Nutzer nicht mit großen Treffermengen alleine lassen Sinnvolle Facettierung der Ergebnisse Nicht nur formal, sondern auch inhaltlich
12. April 2013 Fortbildung VdB, Braunschweig 36
Transparenz Inhalte
Was kann recherchiert werden? Was nicht? Und warum nicht?
Suchprozess Wie wird indexiert? Welche Normalisierungen wurden verwendet? Wurde die Suche verändert?
12. April 2013 Fortbildung VdB, Braunschweig 37
Fragestellung
Wiesenmüller (2012)
12. April 2013 Fortbildung VdB, Braunschweig 38
Ja!
Bild: Wikipedia / Public Domain
12. April 2013 Fortbildung VdB, Braunschweig 39
Systemaufbau
Präsentation
Logik
Datenbank
Oberfläche
Such- und Kontoverwaltung
Index
12. April 2013 Fortbildung VdB, Braunschweig 40
Präsentation Manipulation der Anzeige
Anbieten von externen Informationen Anbieten von alternativen Sucheinstiegen
Manipulation der Sucheingabe Erkennen von Personen
Sucherweiterung um alternative Schreibweisen
Erkennen von Konzepten Sucherweiterung um Synonyme Anbieten von Disambiguierung Anbieten von Ober- und Unterbegriffen für die Suche
12. April 2013 Fortbildung VdB, Braunschweig 41
Mock-Up
Gorbatschow
Name erkannt.
Bekannte alternative Schreibeweisen:Gorbačëv
GhurbatshufGkormpatsoph
GorbačëvGorbačevGorbacëv
GorbachevGorbachovGorbaciovGorbač'ovGorbacsovGorbaczowGorbatchevGorbatsjovGorbats'ovGorbatxovГорбачев
Suche automatisch ergänzen?
12. April 2013 Fortbildung VdB, Braunschweig 42
Mock-Up
Krebs
Meinen Sie:Krebs <Medizin>Krebs <Sterbild>
12. April 2013 Fortbildung VdB, Braunschweig 43
Mock-Up
Mehr Infomationen
● GND Eintrag● Wikipedia
● Lexika
Neue Suchen
● Vom gleichen Autor● Über diesen Autor
12. April 2013 Fortbildung VdB, Braunschweig 44
Datenbankschicht Ziel: Homogenisierung der Daten
Anpassen von Datenelementen Anreichern der Daten Anpassen der Indexierung
Aber: Zentraler Index im „Besitz“ der Anbieter
→ Zugang zu den Daten existentiell
12. April 2013 Fortbildung VdB, Braunschweig 45
Auswerten der Erschließung Inhaltiche Erschließung vielfach vorhanden
Erschließungssysteme heterogen
Ansatz: Abgleich zwischen Erschließungssystemen Manuell erstellte Konkordanzen Automatisch generierte Mappings
12. April 2013 Fortbildung VdB, Braunschweig 46
Auswertung der Hierarchie Erschließung auf unterschiedlichen Ebenen
Verlag / Reihe Zeitschrift / Sammelband Aufsatz
Ansatz: Akkumulieren und Verteilen „von unten nach oben“ „von oben nach unten“
12. April 2013 Fortbildung VdB, Braunschweig 47
Auswertung der Redundanz „Echte“ Dubletten
Sehr ähnliche Einträge Ausgaben
Print, Elektronisch, Paperback, International
Auflagen und Versionen Working Paper, Pre- / Postprint
Übersetzungen
Ansatz: Übertragung von inhaltlicher und formaler Erschließung aus Dubletten und anderen Ausgaben
12. April 2013 Fortbildung VdB, Braunschweig 48
Forschungsprojekt Clustering von Katalogdaten zur Übertragung von
Erschließungsinformationen
Daten SWB
Katalog des Südwestdeutschen Bibliotheksverbundes
Hebis Katalog des Hessischen Bibliotheks- und Informationssystems
HBZ Katalog des Hochschulbibliothekszentrum des Landes Nordrhein-
Westfalen
B3Kat Gemeinsamer Verbundkatalog von Bibliotheksverbund Bayern und
dem Kooperativen Bibliotheksverbund Berlin-Brandenburg
12. April 2013 Fortbildung VdB, Braunschweig 49
Ergebnisse
Katalog Monografien Anteil RVK
Anteil RSWK
Zuwachs RVK
Zuwachs RSWK
SWB 13.330.743 4.217.226 4.083.113 581.780 957.275
Hebis 8.844.188 1.933.081 2.237.659 1.097.992 1.308.581
HBZ 13.271.840 1.018.298 3.322.100 2.272.558 1.080.162
B3Kat 22.685.738 5.750.295 6.055.164 2.969.381 2.765.967
12. April 2013 Fortbildung VdB, Braunschweig 50
Ausblick
12. April 2013 Fortbildung VdB, Braunschweig 51
(Linked) Open Data Bereitstellung in offenen Formaten
Bereitstellung unter freien Lizenzen
Verfügbarkeit großer bibliografischer Datensammlungen Nationalbibliografien Kataloge von Bibliotheken und /-verbünden Fachbibliografien Open-Access Repositorien Verlagsdaten Normdaten
12. April 2013 Fortbildung VdB, Braunschweig 52
Gemeinsame Infrastruktur Culturegraph.org
Initiative von DNB und HBZ Ziel: Zusammenführen von bibliografischen
Informationen, die als Linked Open Data zur Verfügung stehen
Open Source Infrastruktur Parametrisierbare Metadatenverarbeitung Erweiterbar (Java) Skalierbar (Hadoop)
→ Ideale Ausgangsbasis zur Verarbeitung großer Datenmengen
12. April 2013 Fortbildung VdB, Braunschweig 53
Freie Softwarelösung vufind
Gemeinsame Entwicklung von Bibliotheken Leistungsfähige Softwarebasis Großer Anwenderkreis
12. April 2013 Fortbildung VdB, Braunschweig 54
vufind Sucheinstieg
12. April 2013 Fortbildung VdB, Braunschweig 55
vufind Layout
12. April 2013 Fortbildung VdB, Braunschweig 56
Berufsfeld Metadatenmanagement als eine zentrale Aufgabe
Damit auch künftiger Ausbildungsschwerpunkt
Ziel: Zusammenführen von Metadaten in eigenem Index Homogenisierung der Daten
Formal Inhaltlich
Anreicherung mit externen Quellen Empfehlungen Verknüpfungen Zusatzinformationen
12. April 2013 Fortbildung VdB, Braunschweig 57
Die Konkurrenz schläft nicht
Google analysiert die Nutzereingaben
Erkannt werden:Personen
KunstwerkeBücherFilme
Computerspiele….
(auch abstrakte Konzepte)
Angezeigt werden Kurzinformationenund sinnvolle Verknüpfungen
zu anderen Entitäten
12. April 2013 Fortbildung VdB, Braunschweig 58
Danke für Ihre Aufmerksamkeit!
Folien online unterhttp://www.slideshare.net/MagnusPfeffer/
Dieses Werk bzw. Inhalt steht unter einerCreative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 3.0 Unported Lizenz.
12. April 2013 Fortbildung VdB, Braunschweig 59
Links Wissensportal Primo
http://portal.ub.tu-berlin.de/
HEIDI http://heidi.ub.uni-heidelberg.de/
KonSearch http://konstanz.summon.serialssolutions.com/
Katalog Plus http://www.ub.uni-freiburg.de/index.php?id=opac&no_cache=1
SLUB Wissensportal http://www.sulb.uni-saarland.de/?id=115
Culturegraph Infrastruktur http://sourceforge.net/projects/culturegraph/
12. April 2013 Fortbildung VdB, Braunschweig 60
Quellen Marshall Breeding: The State of the Art in Library Discovery 2010, in:
Computers in Libraries, 30 (1), 2010, S. 31
Heiko Jansen, Kirstin Kemner-Heek, Roswitha Schweitzer: Konkurrenzanalyse ausgewählter kommerzieller Suchindizes, Online-Veröffentlichung, 2010
Magnus Pfeffer: Using clustering across union catalogues to enrich entries with indexing information, in: Data Analysis, Machine Learning and Knowledge Discovery – Proceedings of the 36th Annual Conference of the German Classification Society, Springer, Heidelberg/Berlin, 2012 (noch nicht erschienen)
Heidrun Wiesenmüller: Resource Discovery Systeme, Vortrag auf der 36. Jahrestagung der Gesellschaft für Klassifikation, 2012