Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen...

Preview:

DESCRIPTION

Wie lassen sich fachspezifische Instrumente der bibliothekarischen und dokumentarischen Inhaltserschließung in sowohl national als auch vor allem stärker international sichtbare Erschließungssysteme einbinden? Dieser Frage widmet sich eine Kooperation zwischen Deutscher Nationalbibliothek (DNB) und GESIS - Leibniz-Institut für Sozialwissenschaften zur Erstellung und Evaluation von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften (KlassSoz) und der Dewey Decimal Classification (DDC), deren Ergebnisse im Rahmen des BID-Kongresses vorgestellt werden sollen. Crosskonkordanzen dienen der Behandlung semantischer Heterogenität, indem Verbindungen zwischen semantischen Einheiten unterschiedlicher Erschließungssysteme erstellt und diese Relationen qualifiziert werden. Hierdurch wird die einheitliche Suche über verteilte und heterogen erschlossene Informationsangebote - auch über unterschiedliche Dokument- und Datentypen hinweg - möglich: aus einer Ein-Datenbank-Suche wird ein verteiltes Suchszenario. Gleichzeitig erfolgt die enge Anbindung eines lokal verwendeten Indexierungsinstruments an ein international etabliertes Erschließungssystem. Der Vortrag liefert einen Überblick über die Methodik zur Erstellung, Qualifizierung und Evaluation der Relationen. Anhand exemplarischer Falldarstellungen wird das genaue Vorgehen beim Mapping illustriert. Zusätzlich wird auf die Überführung der Crosskonkordanzen in das SKOS-Format und damit die Bereitstellung der Mappings als Linked Data im Semantic Web eingegangen. Abschließend werden die Nutzungsmöglichkeiten der Mappings zur Wissensexploration skizziert.

Citation preview

Von der Ein-Datenbank-Suche

zum verteilten Suchszenario Zum Aufbau von Crosskonkordanzen zwischen

der Fachklassifikation Sozialwissenschaften

und der Dewey-Dezimalklassifikation

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013

Dr. Andreas Oskar Kempf, M.A.(LIS)

Katrin Baum, Dipl.-Bibl.

GESIS – Leibniz-Institut für Sozialwissenschaften

Gliederung

Definition und Nutzen von Crosskonkordanzen

Vorstellung der verwendeten Klassifikationssysteme

Klassifikation Sozialwissenschaften (KlassSoz)

Dewey-Dezimalklassifikation (DDC)

Zum Vorgehen beim Crosskonkordanz-Aufbau

Relations- und Relevanztypen

Einfache und mehrfache Relationen

Exemplarische Klassenabbildungen

Gesamtübersicht und Ausblick

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 2

Definition Crosskonkordanzen

Crosskonkordanzen bezeichnen im Kontext der Inhaltserschließung Beziehungen zwischen Konzepten unterschiedlicher Erschließungssysteme (z.B. Thesaurus, Klassifikation). Die Beziehungen werden bilateral und somit richtungsabhängig festgelegt.(z.B. KlassSoz > DDC; DDC > KlassSoz).

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 3

Anwendungsszenario

Crosskonkordanz-Aufbau KlassSoz > DDC

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 4

KlassSoz

DDC DDC

SOLIS DNBKatalog SOLIS DNB

Katalog

RelationstypenSKOS-Mapping-Relationen

skos:exactMatch-Relation (A=B): Klasseninhalt Zielklassifikation (B) ist mit Klasseninhalt der Ausgangsklassifikation (A) identisch

skos:broadMatch-Relation (A<B): Klasseninhalt der Zielklassifikation (B) ist weiter gefasst als der Klasseninhalt der Ausgangsklassifikation (A)

skos:narrowMatch-Relation (A>B):Klasseninhalt der Zielklassifikation (B) ist enger gefasst als der Klasseninhalt der Ausgangsklassifikation (A)

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 5

Relevanztypen

Hohe Relevanz für das Retrieval: Klasseninhalt der Ausgangsklassifikation ist zentraler Klasseninhalt der Zielklassifikation

Mittlere Relevanz für das Retrieval:

Klasseninhalt der Ausgangsklassifikation ist ein nachrangiger, wenngleich nicht marginaler Bestandteil des Klasseninhalts der Zielklassifikation

Geringe Relevanz für das Retrieval:Klasseninhalt der Ausgangsklassifikation ist nur ein marginaler Bestandteil des Klasseninhalts der Ausgangsklassifikation

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 6

Klassifikation Sozialwissenschaften (KlassSoz)

Fachklassifikation in dieser Form seit 1996 für die GESIS Literatur- und Projekt-datenbank (SOLIS/SOFIS) verwendet

159 Klassen (5 Haupt- und 154 Unterklassen)

3 Hierarchieebenen

Variable Anzahl an Unterklassen

Vergabepraxis: 1 Hauptnotation und variable Anzahl an Nebennotationen

Klassifikation Sozialwissenschaften (KlassSoz)

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 9

Dewey-Dezimalklassifikation (DDC)

Universalklassifikation1873 von Melvil Dewey entwickelt und 1876 erstmals veröffentlichtwird in über 200.000 Bibliotheken in über 135 Länder verwendet

in über 30 Sprachen übersetzt

seit 2005 auch von der DNB verwendet

ca. 27.000 Klassen in den Haupttafelnca. 9.500 Klassen in den Hilfstafelnder Aufbau entspricht dem Dezimalsystem, d.h. max. 10 Unterklassen

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 10

Dewey-Dezimalklassifikation (DDC)

Crosskonkordanz-Aufbau

Einfache Relationen: für die Abbildung

der Klasseninhalte aufeinander wird

ausschließlich eine Relation verwendet

Mehrfache Relationen: für die Abbildung

der Klasseninhalte aufeinander werden

mehrere Relationen aufgebaut

(1:n-Relation, n:1-Relation)

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 11

Einfache Relationen (1/3)

Beispiel: skos:exactMatch-Relation

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 12

=: kongruente Klasseninhalte

h: Klassen-inhalt KlassSoz deckt sich sehr gut mit DDC-Klasse

Einfache Relationen (2/3)

Beispiel: skos:broadMatch-Relation

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 13

<: DDC-Klassen-inhalt ist weiter gefasst als Klas-seninhalt Klass-Soz

m: nur ein Teil des KlassSoz-Klasseninhaltsfindet sich in DDC-Klasse wieder

Einfache Relationen (3/3)

Beispiel: skos:narrowMatch-Relation

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 14

>: DDC-Klasseist enger ge-fasst als Klass-Soz-Klasse

m: Klassen-inhalt KlassSoz findet sich nurzu einem ge-wissen Teil in DDC-Klasse

Mehrfache Relationen (1/2)

Beispiel: 1:n-Relation

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 15

>/>: Inhalt der KlassSoz-Klasse findet sich in beiden DDC-Klassen

h/m: Inhalt der KlassSoz-Klasse deckt sich deutlich stärker mit der obigen DDC-Klasse

Mehrfache Relationen (2/2)

Beispiel: n:1-Relationen

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 16

</<: die Inhalte beider KlassSoz-Klassen sind in der DDC-Klasse enthalten

m/m: beide KlassSoz-Klassen machen ca. die Hälfte der DDC-Klasse aus

Gesamtübersicht (erste Hälfte KlassSoz)

Crosskonkordanz-Aufbau KlassSoz > DDCRelationenaufbau:78 KlassSoz-Klassen: 1 Hauptklasse, 77 Unterklassen (7 obere Hierarchie-

und 70 untere Hierarchieebene) 149 Relationen insgesamt + 1 Nullrelation:

45 exactMatch-Relationen (=)

15 broadMatch-Relationen (<)

89 narrowMatch-Relationen (>)

Relevanzbewertung:71x hohe Relevanz

40x mittlere Relevanz

38x geringe Relevanz

Relationenanzahl:Einfache Relationen: 20

Mehrfache Relationen: 57

(41x 1:n-Relationen + 16x n:1-Relationen)

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 17

Schwierigkeiten beim CK-Aufbau

Manche Klassen der Klassifikation Sozialwissenschaften lassen sich nicht abbilden (z.B. „10508 – spezielle Ressortpolitik“, darin u.a. Agrar-, Energie, Forschungs-und Innenpolitik).

Manche Unterschiede zwischen Klassen der Klassifikation Sozialwissenschaften sind in der DDC nicht vorgesehen (z.B. „DDC 372 Primarbildung“: Enthält Elementar- und Primarbildung.

Sammelklassen sind in der DDC vielfach nicht vorge-sehen (z.B. „10599 – Sonstiges zur Politikwissen-schaft“).

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 18

AusblickCrosskonkordanz-Aufbau DDC > KlassSoz

Nutzen für den Datenbankaufbau:

Übernahme der DDC-Notation bei DNB-Datenimport möglich

Interoperabilitätszunahme/Retrieval-Nutzen:

KlassSoz als Sucheinstieg für nach DDC erschlossener

Literatur

Repräsentation der Mappings in SKOS-Format

- Abbildung der Klassifikation Sozialwissenschaften in SKOS und

Modellierung der aufgebauten Crosskonkordanzen

- Verlinkung der Klassifikationssysteme über die in der SKOS-

Klassifikation hinterlegten URIs

- Suchraumerweiterung zu im Web verfügbaren Datenquellen

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 201319

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 20

Vielen Dank

für Ihre Aufmerksamkeit!

Dr. Andreas Oskar Kempf

GESIS – Leibniz-Institut für Sozialwissenschaften

andreas.kempf@gesis.org

www.gesis.org

Weiterführende Informationen DDC Deutsch – Dewey-Dezimalklassifikation Deutsch

http://www.dnb.de/DE/Wir/Projekte/Abgeschlossen/ddcDeutsch.html;jsessionid=26240F5AD055

C5315A99413A4929D7EB.prod-worker3 (Zugriff am 04. März 2013)

Klassifikation Sozialwissenschaften: http://www.gesis.org/fileadmin/upload/dienstleistung/tools_

standards/Klassifikation_Sozialwissenschaften.pdf (Zugriff am 04. März 2013).

Mayr, Philipp; Petras, Vivien (2008): Cross-concordances - terminology mapping and its effectiveness

for information retrieval: In: World Library and Information Congress: 64th IFLA General Conference and

Meeting, Québec http://archive.ifla.org/IV/ifla74/papers/129-Mayr_Petras-en.pdf.

Petras, Vivien (2010) Heterogenitätsbehandlung und Terminology Mapping durch Crosskonkordanzen –

eine Fallstudie. In: Sieglerschmidt, Jörg/Ohly, Peter (Hg.) Wissensspeicher in digitalen Räumen.

Nachhaltigkeit, Verfügbarkeit, semantische Interoperabilität. Würzburg: Ergon-Verlag, 91-102.

Schott, Hannelore/Schroeder, Albert (2004) Crosskonkordanzen von Thesauri und Klassifikationen. In:

Budin, G.;Ohly, Hans-Peter (Hg.) Wissensorganisation in kooperativen Lern- und Arbeitsumgebungen.

Würzburg: Ergon-Verlag, 41-49.

SKOS-Mapping-Relations http://www.w3.org/TR/2009/REC-skos-reference-20090818/ (Zugriff am

04.März 2013).

5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 21

Recommended