28
Metadatenstandards und moderne Suchoberflächen Befunde aus dem Projekt swissbib Tobias Viegener, Projektkoordinator swissbib Öffentliche Bibliothek der Universität Basel

Viegener_Swissbib

Embed Size (px)

DESCRIPTION

Autor: Tobias Viegener, Projekt swissbib, Universitätsbibliothek Basel. Referat an der Fachtagung Resource Descripton and Acces (RDA) des BIS, der HTW Chur und der Schweizerischen Nationalbibliothek, 6. Mai 2010, Schweizerische Nationalbibliothek, Bern. Welche Probleme stellen sich aus der Zusammenführung der bibliographsichen Daten der verschiedenen Bibliotheksverbünde und der Nationalbibliothek in der Schweiz für die Indexierung und Aufbereitung im Rahmen von swissbib? Anhand von Beispielen aus der Praxis zeigt der Beitrag das Spannungsfeld zwischen den verschiedenen Interpretatioen von Format und Katalogisierungsregeln.

Citation preview

Page 1: Viegener_Swissbib

Metadatenstandards und moderne Suchoberflächen Befunde aus dem Projekt swissbib

Tobias Viegener, Projektkoordinator swissbibÖffentliche Bibliothek der Universität Basel

Page 2: Viegener_Swissbib

Projekt swissbibDer Vortrag

1. Eckdaten zu swissbib2. Suchoberfläche und Daten3. Datenaufbereitung in swissbib4. Probleme der heterogener Erfassung5. Chancen einheitlicher Autoritätsdaten

2

Page 3: Viegener_Swissbib

Projekt swissbibEckdaten

Datenlage:• 8 Bibliographische Datenbanken• 20 Mio. Datensätze• 3 Datenbanken mit Namensautoritäten• Ein Institutional Repository (Zora)• Metadaten von retro.seals• Tägliches Update in MARCXML oder DC (pro Tag c.a. 40‘000 zu

verarbeiten)

3

Stand 2010 (Halbzeit):• System läuft stabil und ist produktiv benutzbar• Im Rahmen Projekts wird weiter an Funktionen und Qualität

gearbeitet – deshalb auch noch „beta“

Page 4: Viegener_Swissbib

Projekt swissbibEckdaten

Format und Regelwerk• Format (drei Interpretationen von MARC21, die zwischen nahe an

der „amerikanischen“ Interpretation und eher eigenständig anzusiedeln sind)

• Erfassungsrichtlinien (mit mehr oder weniger Abweichung von AACR2 und mehr oder weniger lokalen Eigenheiten)

4

Page 5: Viegener_Swissbib

Projekt swissbibSwissBib-Lösung

5

Datenquellen

CBSDatenaufbe-reitung

FASTIndexierung & Suche

TouchPointOberfläche & Anbindung

Tägliches Update der meisten Quellen

Korrektur/Import > Matching/Merging > Ver-linkung > Gruppierung > Export/Anreicherung

Kontinuierliches Update

Import > Dedublierung „redundanter“ Strings >Indexierung > Anreicherung > Verlinkung

1. Anzeige, Einbindung, Weiterleitung2. SRU-Interface für andere Suchservices

Page 6: Viegener_Swissbib

Projekt swissbib

6

Datenaufbereitung und -präsentation in Swissbib

... funktioniert, weil Vieles einfach sauber und gleichartig erledigt wird

... Und das in gut 80% der Fälle

... hat ihre Tücken, weil

• die bestehenden Regelwerke viele Interpretationen zulassen• unter Gesichtspunkten der Zeitersparnis vereinfacht wird• mit Blick auf lokale Gepflogenheiten und die eigene Datenbank gearbeitet

wird• Kataloge historisch gewachsen sind• Bereinigungen nicht kooperativ erfolgen können und so immer zu wenig

Personal vorhanden ist ;-)

Tour d‘horizon

Page 7: Viegener_Swissbib

Projekt swissbib

7

Der aktuelle Stand: Was kann‘s?

Page 8: Viegener_Swissbib

Projekt swissbibFacetten

8

=ldr cim a22 4u 4500...=007 sd z||g|||||||=008 051222s2006 gw ||n ger|d...=016 7- $a 977875652 $2 GyFmDB=020 -- $a 3-87024-063-6 $c EUR 7.50 (freier Pr.), sfr 70.00=035 -- $a (IDSLU)000498722=040 -- $a DDB $d SzZuIDS LU LUZHB=044 -- $a gw=072 -7 $a 592 $2 IDS LU=100 1- $a Tucholsky $D Kurt $9 141256591 $8 Tucholsky, Kurt $8

AT: Wrobel, Ignaz. Pseudonym von Kurt Tucholsky $8 AT: Tiger, Theobald. Pseudonym von Kurt Tucholsky $8 AT: Panter, Peter. Pseudonym von Kurt Tucholsky $8 AT: Hauser, Kaspar. Pseudonym von Kurt Tucholsky

=245 10 $a Anna Thalbach liest Kurt Tucholsky "Rheinsberg" $h Ton $c Regie: Torsten Feuerstein

=246 10 $a Rheinsberg=260 -- $a Berlin $b Argon-Verl $c 2006=300 -- $a 2 Compact Discs (in 1 Behältnis)=490 0- $a Argon-Hörbuch=691 L6 $u 3.1.3 $a Lyrik, Epik=695 L- $a CD=695 L- $a Hörbuch=700 1- $a Thalbach $D Anna=700 1- $a Feuerstein $D Torsten

=898 -- $a MU030612001

=949 -- $b LUZHB $B IDSLU

Page 9: Viegener_Swissbib

Projekt swissbibFacetten: Verfasser

Kleinster gemeinsamer Nenner: 100/700 $a

Einbindung von Namensautoritäten löst einige Inkonsistenzen:

=100 1- $a Beethoven, L. van (Ludwig)=>=100 1- $a Beethoven, Ludwig van

9

=100 1- $a Beethoven $D Ludwig van=100 1- $a Beethoven $D Ludwig van $d 1770-1827=100 1- $a Beethoven $D Ludwig van $d 1770-=700 1- $a Beethoven $D Ludwig van $c Komponist $d 1770 - 1827 $l

ger=700 1- $a Beethoven $D Ludwig van $c Composer $d 1770 - 1827 $l eng=700 1- $a Beethoven $D Ludwig van $c Compositeur $d 1770 - 1827 $l

fre

Page 10: Viegener_Swissbib

Projekt swissbibBeschlagwortung - Facetten

http://www.worldcat.org/oclc/255145786http://www.worldcat.org/oclc/560446115

10

Page 11: Viegener_Swissbib

Projekt swissbibTiteldaten

11

=ldr cim a22 4u 4500...=007 sd z||g|||||||=008 051222s2006 gw ||n ger|d...=016 7- $a 977875652 $2 GyFmDB=020 -- $a 3-87024-063-6 $c EUR 7.50 (freier Pr.), sfr 70.00=035 -- $a (IDSLU)000498722...=100 1- $a Tucholsky $D Kurt=245 10 $a Anna Thalbach liest Kurt Tucholsky "Rheinsberg" $h

Ton $c Regie: Torsten Feuerstein=246 10 $a Rheinsberg=260 -- $a Berlin $b Argon-Verl $c 2006=300 -- $a 2 Compact Discs (in 1 Behältnis)=490 0- $a Argon-Hörbuch=691 L6 $u 3.1.3 $a Lyrik, Epik=695 L- $a CD=695 L- $a Hörbuch=700 1- $a Thalbach $D Anna=700 1- $a Feuerstein $D Torsten

=898 -- $a MU030612001

=949 -- $b LUZHB $B IDSLU

Page 12: Viegener_Swissbib

Projekt swissbibMaterialtypen

=LDR 01135nim 22002894u 4500 =007 sd z||g|||||||=008 990202s1998\\\\gw\\\n\\\\\\\\\\\\\\ger|d =245 10 $a Homo Faber $h Ton ...=300 -- $a 2 Compact Discs + $e Booklet=906 -- $e SR CD

=LDR 01229nim a2200361 a 4500 =007 s| |||||||||||=008 000904s1998\\\\sz\\|||||\|\|||0|0\\ger\d =245 10 $a Homo faber $h [Enregistrement sonore]...=300 -- $a 2 Compact Discs in Behältnis (ca 120 Min.)

$b ADD $c 12 cm

=LDR 01112nim a22002774a 4500 a=008 090223s1998\\\\gw\\\n\\\\\\\\\\f0\\ger\d =245 14 $a Homo faber $h [Tonaufzeichnung] ...=300 -- $a2 Compact Discs (120 Min.) $c 12 cm + $e 1

Booklet ([12] S.)

12

Für die Sortierung ein eigener Code:

MU-03-06-12-001

Für die Dedublierung ein Mindeststandard:

Leader pos. 06 und 07008 pos. 23/29 plus 245 $h

Page 13: Viegener_Swissbib

Projekt swissbib245 $h

13

CD, CD-ROM, CD-Rom, CDR, Comic, Computerdiskette, Dia, Dias, Diskette, Filmmmaterial, Folien, Kassette, Maschinenlesbare Daten; Postenkarten, Poster,Posters, Semesterarbeit, Spiele, Tonaufzeichnung, Tonbandkassette, Video, von Dianna Aston ; ill. von Sylvia Long

SNL IDS REROBild Bildmaterial Image fixeBraille BrailleElektronische Ressource Elektronische Daten Ressource électroniqueFilm Filmmaterial Film cinématographiqueHologrammKarteiKartenmaterial Kartenmaterial Document cartographiqueMedienkombination Medienpaket Ensemble multi-supports **Mikroform Mikroform MicroformeMikroskopisches PräparatMusikdruck Noten Musique impriméeMusikmanuskriptObjekt ObjetProjektionsbild Image projetéeSpiel Tonaufzeichnung Ton Enregistrement sonoreVideoaufzeichnung Enregistrement vidéo

Page 14: Viegener_Swissbib

Projekt swissbibUpdatevorgang: Garbage in – Garbage out...

Update und Import – was wird nicht geladen?• Aufnahmen mit strukturellen Fehlern (nicht XML-konform, nicht reparierbare

Unterfeldcodes...)• Dummies: http://aleph.unibas.ch/F/?func=find-

b&find_code=SIN&request=ZB%20Hospes%20186• Titelaufnahmen ohne Pflichtfelder (mit Ausnahmen und entsprechenden

Konsequenzen)

14

=LDR 01206nam 22003857u 4500=008 920206s1975\\\\gw\\\\\\\\\\\\00\\\\ger\d=020 -- ‡a3-499-11603-0...=100 -- ‡aBöttger, Barbara=240 -- ‡aSiebenhundert Millionen ohne Zukunft?=245 -- ‡a700 Millionen ohne Zukunft?‡bFaschismus

oder Revolution in Indien und Bangladesh‡cBarbara Böttger

=260 -- ‡aReinbek b. Hamburg‡bRowohlt‡c1975=300 -- ‡a254 S.‡c19 cm=490 -- ‡aRororo‡v1603‡i1603=490 -- ‡aRororo aktuell‡v680‡i680

=LDR 00824nam 2200205uu 4500=008 000000s1975\\\\gw\\\\\\\\\\\\\00\0\ger\\=020 -- ‡a3-499-11603-0=100 -- ‡aBöttger, Barbara...=260 -- ‡aReinbek b. Hamburg‡bRowohlt‡c1975=300 -- ‡a254 S.=730 -- ‡aSiebenhundert Millionen ohne Zukunft?=730 -- ‡a700 Millionen ohne Zukunft?‡bFaschismus

oder Revolution in Indien und Bangladesh

Page 15: Viegener_Swissbib

Projekt swissbib

15

=ldr com a22 5u 4500=005 20100408133900.0=007 co |g ||||||||=008 090126s2009 gw ||| b|ger|d=015 -- $a GFR-DNB-09,N07,0137=016 7- $a 992308224 $2 GyFmDB=020 -- $a 978-3-8362-1308-0 $c ...=040 -- $a DDB $d SzZuIDS BS/BE A100=100 1- $a Scholz $D Michael=245 10 $a Java und XML $b Grundlagen, Einsatz, Referenz $c Michael Scholz, Stephan Niedermeier=250 -- $a 2., aktualisierte und vollständig überarb. Aufl=260 -- $a Bonn $b Galileo Press $c 2009=300 -- $a 702 S $b Ill + $e 1 CD-ROM=490 0- $a Galileo Computing=700 1- $a Niedermeier $D Stephan=986 -- $a SWISSBIB $b 046212256

=ldr cam a22 5u 4500=005 20100408181646.0=007 co |g ||||||||=008 091220s2009 gw |00 |ger|d=020 -- $a 978-3-8362-1308-0=040 -- $a SzZuIDS NEBIS ZHAW-T=082 0- $a 005.133=245 00 $a Java und XML $b Grundlagen, Einsatz, Referenz $c Michael Scholz, Stephan Niedermeier=250 -- $a 2., aktual. und vollst. überarb. Aufl=260 -- $a Galileo Press $b Bonn $c 2009=300 -- $a 702 S + $e 1 CD-ROM=490 0- $a Galileo Computing=700 1- $a Scholz $D Michael=700 1- $a Niedermeier $D Stephan=986 -- $a SWISSBIB $b 046212256

• Verwaltungsaufnahmen (Informationen zu ausgeschiedenen Beständen, stornierten Materialien...)

• Daten ohne jede interne Verlinkung, ohne Holding oder Item und ohne externe URL• Erwerbungsaufnahmen:

Page 16: Viegener_Swissbib

Projekt swissbibDedublierung

• Kontrollnr.: 020, 022, 024 035• Titel: 245• Verfasser: #00, #10, #11• Jahr: 008 pos. 06/07-14• Format: LDR, 008, 245$h• Hauptsprache: 008 pos. 35-37

16

OK

nein

???

• Bestimmung eines Kandidaten• Definitionsmöglichkeiten

• welche Felder angepasst werden

• wie Felder angepasst werden sollen

• Wie bereits bestehende Dubletten angepasst werden sollen

a b

a b

a

c

Definition von Schwellenwerten0.0-0.77 = keine Dublette0.77-0.9 = evtl. Dublette0.9-1.0 = Dublette

Page 17: Viegener_Swissbib

Projekt swissbibBeispiele für Dedublierung

=LDR 01152nas a2200289uu 4500=008 811118c19619999gw\\\\m\\\\\\\0\\\\\mul\d=022 \\$a0721-3433…=245 00$aEuropäische Hochschulschriften.$pReihe

15, Klassische Sprachen und Literaturen=$bPublications universitaireseuropéennes.$nSérie 15, Philologie et littérature classiques = European university studies.$nSeries 15, Classics

…=260 \\$aFrankfurt a.M. ;$aBern ;$aCirencester

:$bPeter D. Lang=300 \\$c21 cm…=906 \\$bSchriftenreihe = Collection

=LDR 00743nas a22001694u 4500=008 991129c19809999sz\\\\m\\\\\\\0\\\\\ger\\=022 \\$a0721-3433…=245 00$aEuropäische Hochschulschriften.$nReihe

15, Klassische Sprachen und Literaturen=$bEuropean university studies. Series 15, Classics = Publications universitaireseuropéennes. Série 15, Philologie et littérature classique

…=260 \\$aBern :$bLang=906 \\$bSchriftenreihe = Collection

=LDR 01609nas a22003732i 4500=007 ta=008 940308cuuuu9999sz\\x\m\\\\\\\0\\\\0ger\d=022 \\$a0721-3433…=245 00$aEuropäische Hochschulschriften.$nReihe

15,$pKlassische Sprachen und Literaturen=$bPublications universitaires européennes. Série 15, Philologie et littératureclassiques = European university studies. Series 15, Classics

…=260 \\$aFrankfurt a.M. ;$aBern [etc.] :$bP. Lang=300 \\$aBd. ;$c21 cm

=LDR 00843nas a22001937a 4500=008 960525u\\\\\\\\\\\|||m||\||||00||\0und\d=022 \\$a0721-3433..=245 00$aEuropäische Hochschulschriften.$pReihe

15, Klassische Sprachen und Literaturen=$bPublications universitaires européennes. Série 15, Philologie et littératureclassiques = European university studies. Series 15, Classics

…=260 \\$aFrankfurt am Main ;$aBern [etc.] :$bP.

Lang

Format als Killerkriterium: Revolution Zahlungsverkehrs Automation

Page 18: Viegener_Swissbib

Projekt swissbib

18

FRBR-Clustering

EC

D

F

A

B

G

BC

AD

C D

B

A C

C

A B

A D

B D

A

praxiswis typo meye

B

Auswertung div.Felderoder Feldelemente=> FRBR-Faktor

...und in swissbib: Säntis

...und in swissbib: Meistersinger

Page 19: Viegener_Swissbib

Projekt swissbibLinking

Verlinkung von Datensätzen

Aufgrund der Struktur und Ausrichtung von CBS problemlos möglich• Indexbasiertes Verfahren• Kontrollnummernbasierte Links• Ausgabe von Hierarchieinformationen möglich

19

=490 0- $a Europäische Hochschulschriften. Reihe 3, Geschichte und ihre Hilfswissenschaften $v Bd. 926 $w (NEBIS)000058577 $9 001756400

=780 00 $t Schweizerische Zeitschrift für Sozialversicherung $x 0036-7877 $w (SNL)vtls001128805 $9 001320661

=710 2- $a Konferenz der kantonalen Stiftungsaufsichtsbehörden $9 140128638

=897 -- $a b $b 883

Page 20: Viegener_Swissbib

Projekt swissbibEinstufig – Mehrstufig – auflagenneutral

Situation IDS:• Bei Sibil und ETHICS

forciert mehrstufig• Bei REKAT nach Kärtchen

forciert einstufig• Grundsätzlich hierarchie-

betont• Neuaufnahmen meist

einstufig

20

001 vtls001163063003 RERO035 -- ‡a 1272888100 1- ‡a Shakespeare, William245 14 ‡a The works of William Shakespeare / ‡c

ed. by William George Clark and William Aldis Wright. ‡n Vol. 3

250 -- ‡a [2nd ed., reprinted]260 -- ‡a London ; ‡a New York : ‡b Macmillan, ‡c

1923300 -- ‡a VIII, 516 p. ; ‡c 24 cm500 -- ‡a Contient: The taming of the shrew ;

All's well that ends well ; Twelfth night, or, What you will ; The winter's tale

800 1- ‡a Shakespeare, William. - ‡t The works of William Shakespeare ‡v 3

Situation RERO:• Sibil-Erbe wurde nivelliert• Neuaufnahmen einstufig

Situation SNL:• Mehrheitlich einstufig• Hierarchische Links für den

internen Gebrauch (990)

Page 21: Viegener_Swissbib

Projekt swissbib

Stratenwerth, Günter. - Schweizerisches Strafrecht. Besonderer Teil / Günter Stratenwerth. - Bern : Stämpfli, 1973- [000097454]Bd. 1: Straftaten gegen Individualinteressen Bd. 2: Straftaten gegen Gemeininteressen[Bd. 3]: Teilrevisionen 1987 bis 1990: Straftaten gegen Leib und Leben, Insiderstrafrecht, Straftaten gegen die Familie, Geldwäscherei

Einstufig – auflagenneutral

• seit 1973 in 6 Auflagen erschienen und im IDS Basel/Bern bei 9 Bibliotheken in 183 Exemplaren vorhanden

• NEBIS: dasselbe Werk ist nach Auflagen getrennt einstufig (Aufl. 3 & 6) und mehrstufig (Aufl. 1, 2, 4 & 5)

• IDS SG: dasselbe Werk ist nach Auflagen getrennt einstufig (Aufl. 6) und mehrstufig (Aufl. 1 - 5)

• SNL: dasselbe Werk ist nach Auflagen getrennt mehrstufig aufgenommen

• RERO: auflagenneutral einstufig für Bde. 1 und 2 sowie eigene Aufnahme für Bd. 3 – in 16 Bibliotheken vorhanden

21...und in swissbib

Page 23: Viegener_Swissbib

Projekt swissbibAltlasten ETHICS

FRBR aus den 80ern

...und in swissbib

23

Page 24: Viegener_Swissbib

Projekt swissbibETHICS Konsequenzen

NEBIS setzt weiter auf diese Praxis:http://opac.nebis.ch/F?func=z103-set&doc_number=001624001

Und in swissbib: Suche nach "Jahr: 1981“ – Sortierung nach Titel A-ZProbleme mit Verwaltungsaufnahmen: z.B. Fernleihe

Page 25: Viegener_Swissbib

Projekt swissbibAltlasten: Sibil - Hierarchie

...und in swissbib

Page 26: Viegener_Swissbib

Projekt swissbib

26

Autoritäten – Die Basis

=100 1- $a Tucholsky $D Kurt $9 141256591 $8 Tucholsky, Kurt $8 AT: Wrobel, Ignaz. Pseudonym von Kurt Tucholsky $8 AT: Tiger, Theobald. Pseudonym von Kurt Tucholsky $8 AT: Panter, Peter. Pseudonym von Kurt Tucholsky $8 AT: Hauser, Kaspar. Pseudonym von Kurt Tucholsky

=600 17 $a Tucholsky, Kurt $9 141256591 $8 Tucholsky, Kurt $8 AT: Wrobel, Ignaz. Pseudonym von Kurt Tucholsky $8 AT: Tiger, Theobald. Pseudonym von Kurt Tucholsky $8 AT: Panter, Peter. Pseudonym von Kurt Tucholsky $8 AT: Hauser, Kaspar. Pseudonym von Kurt Tucholsky $2 ids zbz

Suche nach: Peter Panter schreiben

IDSBB

SNL

RERO

#00 VerfasserIn

#10 Körperschaft

#11 Kongress

Regelbasierte Zuordnung bei String-Match von AUT zu BIB

a)Es gewinnt jene mit den meisten verworfenen Formenb)Ansonsten festgelegte Reihenfolge

Page 27: Viegener_Swissbib

Projekt swissbib

27

Autoritäten – Was wäre wenn

Was können Autoritätsdateien neben der Anreicherung von Suchanfragen bieten?

Verlinkung von DatenquellenAggregation von Informationen

http://www.worldcat.org/wcidentities/lccn-n50-81889http://d-nb.info/gnd/11862444X

Page 28: Viegener_Swissbib

Projekt swissbib

28

Koordinaten

Projekt SwissBib

• Hannes Hug, [email protected]

• Tobias Viegener, [email protected]

• Günter Hipler, [email protected]

Der Service: www.swissbib.chDas Projekt: www.swissbib.org