21
Von der Ein-Datenbank-Suche zum verteilten Suchszenario Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der Dewey-Dezimalklassifikation 5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 Dr. Andreas Oskar Kempf, M.A.(LIS) Katrin Baum, Dipl.-Bibl. GESIS Leibniz-Institut für Sozialwissenschaften

Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

Embed Size (px)

DESCRIPTION

Wie lassen sich fachspezifische Instrumente der bibliothekarischen und dokumentarischen Inhaltserschließung in sowohl national als auch vor allem stärker international sichtbare Erschließungssysteme einbinden? Dieser Frage widmet sich eine Kooperation zwischen Deutscher Nationalbibliothek (DNB) und GESIS - Leibniz-Institut für Sozialwissenschaften zur Erstellung und Evaluation von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften (KlassSoz) und der Dewey Decimal Classification (DDC), deren Ergebnisse im Rahmen des BID-Kongresses vorgestellt werden sollen. Crosskonkordanzen dienen der Behandlung semantischer Heterogenität, indem Verbindungen zwischen semantischen Einheiten unterschiedlicher Erschließungssysteme erstellt und diese Relationen qualifiziert werden. Hierdurch wird die einheitliche Suche über verteilte und heterogen erschlossene Informationsangebote - auch über unterschiedliche Dokument- und Datentypen hinweg - möglich: aus einer Ein-Datenbank-Suche wird ein verteiltes Suchszenario. Gleichzeitig erfolgt die enge Anbindung eines lokal verwendeten Indexierungsinstruments an ein international etabliertes Erschließungssystem. Der Vortrag liefert einen Überblick über die Methodik zur Erstellung, Qualifizierung und Evaluation der Relationen. Anhand exemplarischer Falldarstellungen wird das genaue Vorgehen beim Mapping illustriert. Zusätzlich wird auf die Überführung der Crosskonkordanzen in das SKOS-Format und damit die Bereitstellung der Mappings als Linked Data im Semantic Web eingegangen. Abschließend werden die Nutzungsmöglichkeiten der Mappings zur Wissensexploration skizziert.

Citation preview

Page 1: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

Von der Ein-Datenbank-Suche

zum verteilten Suchszenario Zum Aufbau von Crosskonkordanzen zwischen

der Fachklassifikation Sozialwissenschaften

und der Dewey-Dezimalklassifikation

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013

Dr. Andreas Oskar Kempf, M.A.(LIS)

Katrin Baum, Dipl.-Bibl.

GESIS – Leibniz-Institut für Sozialwissenschaften

Page 2: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

Gliederung

Definition und Nutzen von Crosskonkordanzen

Vorstellung der verwendeten Klassifikationssysteme

Klassifikation Sozialwissenschaften (KlassSoz)

Dewey-Dezimalklassifikation (DDC)

Zum Vorgehen beim Crosskonkordanz-Aufbau

Relations- und Relevanztypen

Einfache und mehrfache Relationen

Exemplarische Klassenabbildungen

Gesamtübersicht und Ausblick

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 2

Page 3: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

Definition Crosskonkordanzen

Crosskonkordanzen bezeichnen im Kontext der Inhaltserschließung Beziehungen zwischen Konzepten unterschiedlicher Erschließungssysteme (z.B. Thesaurus, Klassifikation). Die Beziehungen werden bilateral und somit richtungsabhängig festgelegt.(z.B. KlassSoz > DDC; DDC > KlassSoz).

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 3

Page 4: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

Anwendungsszenario

Crosskonkordanz-Aufbau KlassSoz > DDC

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 4

KlassSoz

DDC DDC

SOLIS DNBKatalog SOLIS DNB

Katalog

Page 5: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

RelationstypenSKOS-Mapping-Relationen

skos:exactMatch-Relation (A=B): Klasseninhalt Zielklassifikation (B) ist mit Klasseninhalt der Ausgangsklassifikation (A) identisch

skos:broadMatch-Relation (A<B): Klasseninhalt der Zielklassifikation (B) ist weiter gefasst als der Klasseninhalt der Ausgangsklassifikation (A)

skos:narrowMatch-Relation (A>B):Klasseninhalt der Zielklassifikation (B) ist enger gefasst als der Klasseninhalt der Ausgangsklassifikation (A)

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 5

Page 6: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

Relevanztypen

Hohe Relevanz für das Retrieval: Klasseninhalt der Ausgangsklassifikation ist zentraler Klasseninhalt der Zielklassifikation

Mittlere Relevanz für das Retrieval:

Klasseninhalt der Ausgangsklassifikation ist ein nachrangiger, wenngleich nicht marginaler Bestandteil des Klasseninhalts der Zielklassifikation

Geringe Relevanz für das Retrieval:Klasseninhalt der Ausgangsklassifikation ist nur ein marginaler Bestandteil des Klasseninhalts der Ausgangsklassifikation

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 6

Page 7: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

Klassifikation Sozialwissenschaften (KlassSoz)

Fachklassifikation in dieser Form seit 1996 für die GESIS Literatur- und Projekt-datenbank (SOLIS/SOFIS) verwendet

159 Klassen (5 Haupt- und 154 Unterklassen)

3 Hierarchieebenen

Variable Anzahl an Unterklassen

Vergabepraxis: 1 Hauptnotation und variable Anzahl an Nebennotationen

Page 8: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

Klassifikation Sozialwissenschaften (KlassSoz)

Page 9: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 9

Dewey-Dezimalklassifikation (DDC)

Universalklassifikation1873 von Melvil Dewey entwickelt und 1876 erstmals veröffentlichtwird in über 200.000 Bibliotheken in über 135 Länder verwendet

in über 30 Sprachen übersetzt

seit 2005 auch von der DNB verwendet

ca. 27.000 Klassen in den Haupttafelnca. 9.500 Klassen in den Hilfstafelnder Aufbau entspricht dem Dezimalsystem, d.h. max. 10 Unterklassen

Page 10: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 10

Dewey-Dezimalklassifikation (DDC)

Page 11: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

Crosskonkordanz-Aufbau

Einfache Relationen: für die Abbildung

der Klasseninhalte aufeinander wird

ausschließlich eine Relation verwendet

Mehrfache Relationen: für die Abbildung

der Klasseninhalte aufeinander werden

mehrere Relationen aufgebaut

(1:n-Relation, n:1-Relation)

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 11

Page 12: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

Einfache Relationen (1/3)

Beispiel: skos:exactMatch-Relation

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 12

=: kongruente Klasseninhalte

h: Klassen-inhalt KlassSoz deckt sich sehr gut mit DDC-Klasse

Page 13: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

Einfache Relationen (2/3)

Beispiel: skos:broadMatch-Relation

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 13

<: DDC-Klassen-inhalt ist weiter gefasst als Klas-seninhalt Klass-Soz

m: nur ein Teil des KlassSoz-Klasseninhaltsfindet sich in DDC-Klasse wieder

Page 14: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

Einfache Relationen (3/3)

Beispiel: skos:narrowMatch-Relation

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 14

>: DDC-Klasseist enger ge-fasst als Klass-Soz-Klasse

m: Klassen-inhalt KlassSoz findet sich nurzu einem ge-wissen Teil in DDC-Klasse

Page 15: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

Mehrfache Relationen (1/2)

Beispiel: 1:n-Relation

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 15

>/>: Inhalt der KlassSoz-Klasse findet sich in beiden DDC-Klassen

h/m: Inhalt der KlassSoz-Klasse deckt sich deutlich stärker mit der obigen DDC-Klasse

Page 16: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

Mehrfache Relationen (2/2)

Beispiel: n:1-Relationen

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 16

</<: die Inhalte beider KlassSoz-Klassen sind in der DDC-Klasse enthalten

m/m: beide KlassSoz-Klassen machen ca. die Hälfte der DDC-Klasse aus

Page 17: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

Gesamtübersicht (erste Hälfte KlassSoz)

Crosskonkordanz-Aufbau KlassSoz > DDCRelationenaufbau:78 KlassSoz-Klassen: 1 Hauptklasse, 77 Unterklassen (7 obere Hierarchie-

und 70 untere Hierarchieebene) 149 Relationen insgesamt + 1 Nullrelation:

45 exactMatch-Relationen (=)

15 broadMatch-Relationen (<)

89 narrowMatch-Relationen (>)

Relevanzbewertung:71x hohe Relevanz

40x mittlere Relevanz

38x geringe Relevanz

Relationenanzahl:Einfache Relationen: 20

Mehrfache Relationen: 57

(41x 1:n-Relationen + 16x n:1-Relationen)

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 17

Page 18: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

Schwierigkeiten beim CK-Aufbau

Manche Klassen der Klassifikation Sozialwissenschaften lassen sich nicht abbilden (z.B. „10508 – spezielle Ressortpolitik“, darin u.a. Agrar-, Energie, Forschungs-und Innenpolitik).

Manche Unterschiede zwischen Klassen der Klassifikation Sozialwissenschaften sind in der DDC nicht vorgesehen (z.B. „DDC 372 Primarbildung“: Enthält Elementar- und Primarbildung.

Sammelklassen sind in der DDC vielfach nicht vorge-sehen (z.B. „10599 – Sonstiges zur Politikwissen-schaft“).

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 18

Page 19: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

AusblickCrosskonkordanz-Aufbau DDC > KlassSoz

Nutzen für den Datenbankaufbau:

Übernahme der DDC-Notation bei DNB-Datenimport möglich

Interoperabilitätszunahme/Retrieval-Nutzen:

KlassSoz als Sucheinstieg für nach DDC erschlossener

Literatur

Repräsentation der Mappings in SKOS-Format

- Abbildung der Klassifikation Sozialwissenschaften in SKOS und

Modellierung der aufgebauten Crosskonkordanzen

- Verlinkung der Klassifikationssysteme über die in der SKOS-

Klassifikation hinterlegten URIs

- Suchraumerweiterung zu im Web verfügbaren Datenquellen

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 201319

Page 20: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 20

Vielen Dank

für Ihre Aufmerksamkeit!

Dr. Andreas Oskar Kempf

GESIS – Leibniz-Institut für Sozialwissenschaften

[email protected]

www.gesis.org

Page 21: Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC

Weiterführende Informationen DDC Deutsch – Dewey-Dezimalklassifikation Deutsch

http://www.dnb.de/DE/Wir/Projekte/Abgeschlossen/ddcDeutsch.html;jsessionid=26240F5AD055

C5315A99413A4929D7EB.prod-worker3 (Zugriff am 04. März 2013)

Klassifikation Sozialwissenschaften: http://www.gesis.org/fileadmin/upload/dienstleistung/tools_

standards/Klassifikation_Sozialwissenschaften.pdf (Zugriff am 04. März 2013).

Mayr, Philipp; Petras, Vivien (2008): Cross-concordances - terminology mapping and its effectiveness

for information retrieval: In: World Library and Information Congress: 64th IFLA General Conference and

Meeting, Québec http://archive.ifla.org/IV/ifla74/papers/129-Mayr_Petras-en.pdf.

Petras, Vivien (2010) Heterogenitätsbehandlung und Terminology Mapping durch Crosskonkordanzen –

eine Fallstudie. In: Sieglerschmidt, Jörg/Ohly, Peter (Hg.) Wissensspeicher in digitalen Räumen.

Nachhaltigkeit, Verfügbarkeit, semantische Interoperabilität. Würzburg: Ergon-Verlag, 91-102.

Schott, Hannelore/Schroeder, Albert (2004) Crosskonkordanzen von Thesauri und Klassifikationen. In:

Budin, G.;Ohly, Hans-Peter (Hg.) Wissensorganisation in kooperativen Lern- und Arbeitsumgebungen.

Würzburg: Ergon-Verlag, 41-49.

SKOS-Mapping-Relations http://www.w3.org/TR/2009/REC-skos-reference-20090818/ (Zugriff am

04.März 2013).

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 21