Upload
christian-aliverti
View
1.249
Download
0
Embed Size (px)
DESCRIPTION
Autor: Tobias Viegener, Projekt swissbib, Universitätsbibliothek Basel. Referat an der Fachtagung Resource Descripton and Acces (RDA) des BIS, der HTW Chur und der Schweizerischen Nationalbibliothek, 6. Mai 2010, Schweizerische Nationalbibliothek, Bern. Welche Probleme stellen sich aus der Zusammenführung der bibliographsichen Daten der verschiedenen Bibliotheksverbünde und der Nationalbibliothek in der Schweiz für die Indexierung und Aufbereitung im Rahmen von swissbib? Anhand von Beispielen aus der Praxis zeigt der Beitrag das Spannungsfeld zwischen den verschiedenen Interpretatioen von Format und Katalogisierungsregeln.
Citation preview
Metadatenstandards und moderne Suchoberflächen Befunde aus dem Projekt swissbib
Tobias Viegener, Projektkoordinator swissbibÖffentliche Bibliothek der Universität Basel
Projekt swissbibDer Vortrag
1. Eckdaten zu swissbib2. Suchoberfläche und Daten3. Datenaufbereitung in swissbib4. Probleme der heterogener Erfassung5. Chancen einheitlicher Autoritätsdaten
2
Projekt swissbibEckdaten
Datenlage:• 8 Bibliographische Datenbanken• 20 Mio. Datensätze• 3 Datenbanken mit Namensautoritäten• Ein Institutional Repository (Zora)• Metadaten von retro.seals• Tägliches Update in MARCXML oder DC (pro Tag c.a. 40‘000 zu
verarbeiten)
3
Stand 2010 (Halbzeit):• System läuft stabil und ist produktiv benutzbar• Im Rahmen Projekts wird weiter an Funktionen und Qualität
gearbeitet – deshalb auch noch „beta“
Projekt swissbibEckdaten
Format und Regelwerk• Format (drei Interpretationen von MARC21, die zwischen nahe an
der „amerikanischen“ Interpretation und eher eigenständig anzusiedeln sind)
• Erfassungsrichtlinien (mit mehr oder weniger Abweichung von AACR2 und mehr oder weniger lokalen Eigenheiten)
4
Projekt swissbibSwissBib-Lösung
5
Datenquellen
CBSDatenaufbe-reitung
FASTIndexierung & Suche
TouchPointOberfläche & Anbindung
Tägliches Update der meisten Quellen
Korrektur/Import > Matching/Merging > Ver-linkung > Gruppierung > Export/Anreicherung
Kontinuierliches Update
Import > Dedublierung „redundanter“ Strings >Indexierung > Anreicherung > Verlinkung
1. Anzeige, Einbindung, Weiterleitung2. SRU-Interface für andere Suchservices
Projekt swissbib
6
Datenaufbereitung und -präsentation in Swissbib
... funktioniert, weil Vieles einfach sauber und gleichartig erledigt wird
... Und das in gut 80% der Fälle
... hat ihre Tücken, weil
• die bestehenden Regelwerke viele Interpretationen zulassen• unter Gesichtspunkten der Zeitersparnis vereinfacht wird• mit Blick auf lokale Gepflogenheiten und die eigene Datenbank gearbeitet
wird• Kataloge historisch gewachsen sind• Bereinigungen nicht kooperativ erfolgen können und so immer zu wenig
Personal vorhanden ist ;-)
Tour d‘horizon
Projekt swissbib
7
Der aktuelle Stand: Was kann‘s?
Projekt swissbibFacetten
8
=ldr cim a22 4u 4500...=007 sd z||g|||||||=008 051222s2006 gw ||n ger|d...=016 7- $a 977875652 $2 GyFmDB=020 -- $a 3-87024-063-6 $c EUR 7.50 (freier Pr.), sfr 70.00=035 -- $a (IDSLU)000498722=040 -- $a DDB $d SzZuIDS LU LUZHB=044 -- $a gw=072 -7 $a 592 $2 IDS LU=100 1- $a Tucholsky $D Kurt $9 141256591 $8 Tucholsky, Kurt $8
AT: Wrobel, Ignaz. Pseudonym von Kurt Tucholsky $8 AT: Tiger, Theobald. Pseudonym von Kurt Tucholsky $8 AT: Panter, Peter. Pseudonym von Kurt Tucholsky $8 AT: Hauser, Kaspar. Pseudonym von Kurt Tucholsky
=245 10 $a Anna Thalbach liest Kurt Tucholsky "Rheinsberg" $h Ton $c Regie: Torsten Feuerstein
=246 10 $a Rheinsberg=260 -- $a Berlin $b Argon-Verl $c 2006=300 -- $a 2 Compact Discs (in 1 Behältnis)=490 0- $a Argon-Hörbuch=691 L6 $u 3.1.3 $a Lyrik, Epik=695 L- $a CD=695 L- $a Hörbuch=700 1- $a Thalbach $D Anna=700 1- $a Feuerstein $D Torsten
=898 -- $a MU030612001
=949 -- $b LUZHB $B IDSLU
Projekt swissbibFacetten: Verfasser
Kleinster gemeinsamer Nenner: 100/700 $a
Einbindung von Namensautoritäten löst einige Inkonsistenzen:
=100 1- $a Beethoven, L. van (Ludwig)=>=100 1- $a Beethoven, Ludwig van
9
=100 1- $a Beethoven $D Ludwig van=100 1- $a Beethoven $D Ludwig van $d 1770-1827=100 1- $a Beethoven $D Ludwig van $d 1770-=700 1- $a Beethoven $D Ludwig van $c Komponist $d 1770 - 1827 $l
ger=700 1- $a Beethoven $D Ludwig van $c Composer $d 1770 - 1827 $l eng=700 1- $a Beethoven $D Ludwig van $c Compositeur $d 1770 - 1827 $l
fre
Projekt swissbibBeschlagwortung - Facetten
http://www.worldcat.org/oclc/255145786http://www.worldcat.org/oclc/560446115
10
Projekt swissbibTiteldaten
11
=ldr cim a22 4u 4500...=007 sd z||g|||||||=008 051222s2006 gw ||n ger|d...=016 7- $a 977875652 $2 GyFmDB=020 -- $a 3-87024-063-6 $c EUR 7.50 (freier Pr.), sfr 70.00=035 -- $a (IDSLU)000498722...=100 1- $a Tucholsky $D Kurt=245 10 $a Anna Thalbach liest Kurt Tucholsky "Rheinsberg" $h
Ton $c Regie: Torsten Feuerstein=246 10 $a Rheinsberg=260 -- $a Berlin $b Argon-Verl $c 2006=300 -- $a 2 Compact Discs (in 1 Behältnis)=490 0- $a Argon-Hörbuch=691 L6 $u 3.1.3 $a Lyrik, Epik=695 L- $a CD=695 L- $a Hörbuch=700 1- $a Thalbach $D Anna=700 1- $a Feuerstein $D Torsten
=898 -- $a MU030612001
=949 -- $b LUZHB $B IDSLU
Projekt swissbibMaterialtypen
=LDR 01135nim 22002894u 4500 =007 sd z||g|||||||=008 990202s1998\\\\gw\\\n\\\\\\\\\\\\\\ger|d =245 10 $a Homo Faber $h Ton ...=300 -- $a 2 Compact Discs + $e Booklet=906 -- $e SR CD
=LDR 01229nim a2200361 a 4500 =007 s| |||||||||||=008 000904s1998\\\\sz\\|||||\|\|||0|0\\ger\d =245 10 $a Homo faber $h [Enregistrement sonore]...=300 -- $a 2 Compact Discs in Behältnis (ca 120 Min.)
$b ADD $c 12 cm
=LDR 01112nim a22002774a 4500 a=008 090223s1998\\\\gw\\\n\\\\\\\\\\f0\\ger\d =245 14 $a Homo faber $h [Tonaufzeichnung] ...=300 -- $a2 Compact Discs (120 Min.) $c 12 cm + $e 1
Booklet ([12] S.)
12
Für die Sortierung ein eigener Code:
MU-03-06-12-001
Für die Dedublierung ein Mindeststandard:
Leader pos. 06 und 07008 pos. 23/29 plus 245 $h
Projekt swissbib245 $h
13
CD, CD-ROM, CD-Rom, CDR, Comic, Computerdiskette, Dia, Dias, Diskette, Filmmmaterial, Folien, Kassette, Maschinenlesbare Daten; Postenkarten, Poster,Posters, Semesterarbeit, Spiele, Tonaufzeichnung, Tonbandkassette, Video, von Dianna Aston ; ill. von Sylvia Long
SNL IDS REROBild Bildmaterial Image fixeBraille BrailleElektronische Ressource Elektronische Daten Ressource électroniqueFilm Filmmaterial Film cinématographiqueHologrammKarteiKartenmaterial Kartenmaterial Document cartographiqueMedienkombination Medienpaket Ensemble multi-supports **Mikroform Mikroform MicroformeMikroskopisches PräparatMusikdruck Noten Musique impriméeMusikmanuskriptObjekt ObjetProjektionsbild Image projetéeSpiel Tonaufzeichnung Ton Enregistrement sonoreVideoaufzeichnung Enregistrement vidéo
Projekt swissbibUpdatevorgang: Garbage in – Garbage out...
Update und Import – was wird nicht geladen?• Aufnahmen mit strukturellen Fehlern (nicht XML-konform, nicht reparierbare
Unterfeldcodes...)• Dummies: http://aleph.unibas.ch/F/?func=find-
b&find_code=SIN&request=ZB%20Hospes%20186• Titelaufnahmen ohne Pflichtfelder (mit Ausnahmen und entsprechenden
Konsequenzen)
14
=LDR 01206nam 22003857u 4500=008 920206s1975\\\\gw\\\\\\\\\\\\00\\\\ger\d=020 -- ‡a3-499-11603-0...=100 -- ‡aBöttger, Barbara=240 -- ‡aSiebenhundert Millionen ohne Zukunft?=245 -- ‡a700 Millionen ohne Zukunft?‡bFaschismus
oder Revolution in Indien und Bangladesh‡cBarbara Böttger
=260 -- ‡aReinbek b. Hamburg‡bRowohlt‡c1975=300 -- ‡a254 S.‡c19 cm=490 -- ‡aRororo‡v1603‡i1603=490 -- ‡aRororo aktuell‡v680‡i680
=LDR 00824nam 2200205uu 4500=008 000000s1975\\\\gw\\\\\\\\\\\\\00\0\ger\\=020 -- ‡a3-499-11603-0=100 -- ‡aBöttger, Barbara...=260 -- ‡aReinbek b. Hamburg‡bRowohlt‡c1975=300 -- ‡a254 S.=730 -- ‡aSiebenhundert Millionen ohne Zukunft?=730 -- ‡a700 Millionen ohne Zukunft?‡bFaschismus
oder Revolution in Indien und Bangladesh
Projekt swissbib
15
=ldr com a22 5u 4500=005 20100408133900.0=007 co |g ||||||||=008 090126s2009 gw ||| b|ger|d=015 -- $a GFR-DNB-09,N07,0137=016 7- $a 992308224 $2 GyFmDB=020 -- $a 978-3-8362-1308-0 $c ...=040 -- $a DDB $d SzZuIDS BS/BE A100=100 1- $a Scholz $D Michael=245 10 $a Java und XML $b Grundlagen, Einsatz, Referenz $c Michael Scholz, Stephan Niedermeier=250 -- $a 2., aktualisierte und vollständig überarb. Aufl=260 -- $a Bonn $b Galileo Press $c 2009=300 -- $a 702 S $b Ill + $e 1 CD-ROM=490 0- $a Galileo Computing=700 1- $a Niedermeier $D Stephan=986 -- $a SWISSBIB $b 046212256
=ldr cam a22 5u 4500=005 20100408181646.0=007 co |g ||||||||=008 091220s2009 gw |00 |ger|d=020 -- $a 978-3-8362-1308-0=040 -- $a SzZuIDS NEBIS ZHAW-T=082 0- $a 005.133=245 00 $a Java und XML $b Grundlagen, Einsatz, Referenz $c Michael Scholz, Stephan Niedermeier=250 -- $a 2., aktual. und vollst. überarb. Aufl=260 -- $a Galileo Press $b Bonn $c 2009=300 -- $a 702 S + $e 1 CD-ROM=490 0- $a Galileo Computing=700 1- $a Scholz $D Michael=700 1- $a Niedermeier $D Stephan=986 -- $a SWISSBIB $b 046212256
• Verwaltungsaufnahmen (Informationen zu ausgeschiedenen Beständen, stornierten Materialien...)
• Daten ohne jede interne Verlinkung, ohne Holding oder Item und ohne externe URL• Erwerbungsaufnahmen:
Projekt swissbibDedublierung
• Kontrollnr.: 020, 022, 024 035• Titel: 245• Verfasser: #00, #10, #11• Jahr: 008 pos. 06/07-14• Format: LDR, 008, 245$h• Hauptsprache: 008 pos. 35-37
16
OK
nein
???
• Bestimmung eines Kandidaten• Definitionsmöglichkeiten
• welche Felder angepasst werden
• wie Felder angepasst werden sollen
• Wie bereits bestehende Dubletten angepasst werden sollen
a b
a b
a
c
Definition von Schwellenwerten0.0-0.77 = keine Dublette0.77-0.9 = evtl. Dublette0.9-1.0 = Dublette
Projekt swissbibBeispiele für Dedublierung
=LDR 01152nas a2200289uu 4500=008 811118c19619999gw\\\\m\\\\\\\0\\\\\mul\d=022 \\$a0721-3433…=245 00$aEuropäische Hochschulschriften.$pReihe
15, Klassische Sprachen und Literaturen=$bPublications universitaireseuropéennes.$nSérie 15, Philologie et littérature classiques = European university studies.$nSeries 15, Classics
…=260 \\$aFrankfurt a.M. ;$aBern ;$aCirencester
:$bPeter D. Lang=300 \\$c21 cm…=906 \\$bSchriftenreihe = Collection
=LDR 00743nas a22001694u 4500=008 991129c19809999sz\\\\m\\\\\\\0\\\\\ger\\=022 \\$a0721-3433…=245 00$aEuropäische Hochschulschriften.$nReihe
15, Klassische Sprachen und Literaturen=$bEuropean university studies. Series 15, Classics = Publications universitaireseuropéennes. Série 15, Philologie et littérature classique
…=260 \\$aBern :$bLang=906 \\$bSchriftenreihe = Collection
=LDR 01609nas a22003732i 4500=007 ta=008 940308cuuuu9999sz\\x\m\\\\\\\0\\\\0ger\d=022 \\$a0721-3433…=245 00$aEuropäische Hochschulschriften.$nReihe
15,$pKlassische Sprachen und Literaturen=$bPublications universitaires européennes. Série 15, Philologie et littératureclassiques = European university studies. Series 15, Classics
…=260 \\$aFrankfurt a.M. ;$aBern [etc.] :$bP. Lang=300 \\$aBd. ;$c21 cm
=LDR 00843nas a22001937a 4500=008 960525u\\\\\\\\\\\|||m||\||||00||\0und\d=022 \\$a0721-3433..=245 00$aEuropäische Hochschulschriften.$pReihe
15, Klassische Sprachen und Literaturen=$bPublications universitaires européennes. Série 15, Philologie et littératureclassiques = European university studies. Series 15, Classics
…=260 \\$aFrankfurt am Main ;$aBern [etc.] :$bP.
Lang
Format als Killerkriterium: Revolution Zahlungsverkehrs Automation
Projekt swissbib
18
FRBR-Clustering
EC
D
F
A
B
G
BC
AD
C D
B
A C
C
A B
A D
B D
A
praxiswis typo meye
B
Auswertung div.Felderoder Feldelemente=> FRBR-Faktor
...und in swissbib: Säntis
...und in swissbib: Meistersinger
Projekt swissbibLinking
Verlinkung von Datensätzen
Aufgrund der Struktur und Ausrichtung von CBS problemlos möglich• Indexbasiertes Verfahren• Kontrollnummernbasierte Links• Ausgabe von Hierarchieinformationen möglich
19
=490 0- $a Europäische Hochschulschriften. Reihe 3, Geschichte und ihre Hilfswissenschaften $v Bd. 926 $w (NEBIS)000058577 $9 001756400
=780 00 $t Schweizerische Zeitschrift für Sozialversicherung $x 0036-7877 $w (SNL)vtls001128805 $9 001320661
=710 2- $a Konferenz der kantonalen Stiftungsaufsichtsbehörden $9 140128638
=897 -- $a b $b 883
Projekt swissbibEinstufig – Mehrstufig – auflagenneutral
Situation IDS:• Bei Sibil und ETHICS
forciert mehrstufig• Bei REKAT nach Kärtchen
forciert einstufig• Grundsätzlich hierarchie-
betont• Neuaufnahmen meist
einstufig
20
001 vtls001163063003 RERO035 -- ‡a 1272888100 1- ‡a Shakespeare, William245 14 ‡a The works of William Shakespeare / ‡c
ed. by William George Clark and William Aldis Wright. ‡n Vol. 3
250 -- ‡a [2nd ed., reprinted]260 -- ‡a London ; ‡a New York : ‡b Macmillan, ‡c
1923300 -- ‡a VIII, 516 p. ; ‡c 24 cm500 -- ‡a Contient: The taming of the shrew ;
All's well that ends well ; Twelfth night, or, What you will ; The winter's tale
800 1- ‡a Shakespeare, William. - ‡t The works of William Shakespeare ‡v 3
Situation RERO:• Sibil-Erbe wurde nivelliert• Neuaufnahmen einstufig
Situation SNL:• Mehrheitlich einstufig• Hierarchische Links für den
internen Gebrauch (990)
Projekt swissbib
Stratenwerth, Günter. - Schweizerisches Strafrecht. Besonderer Teil / Günter Stratenwerth. - Bern : Stämpfli, 1973- [000097454]Bd. 1: Straftaten gegen Individualinteressen Bd. 2: Straftaten gegen Gemeininteressen[Bd. 3]: Teilrevisionen 1987 bis 1990: Straftaten gegen Leib und Leben, Insiderstrafrecht, Straftaten gegen die Familie, Geldwäscherei
Einstufig – auflagenneutral
• seit 1973 in 6 Auflagen erschienen und im IDS Basel/Bern bei 9 Bibliotheken in 183 Exemplaren vorhanden
• NEBIS: dasselbe Werk ist nach Auflagen getrennt einstufig (Aufl. 3 & 6) und mehrstufig (Aufl. 1, 2, 4 & 5)
• IDS SG: dasselbe Werk ist nach Auflagen getrennt einstufig (Aufl. 6) und mehrstufig (Aufl. 1 - 5)
• SNL: dasselbe Werk ist nach Auflagen getrennt mehrstufig aufgenommen
• RERO: auflagenneutral einstufig für Bde. 1 und 2 sowie eigene Aufnahme für Bd. 3 – in 16 Bibliotheken vorhanden
21...und in swissbib
Projekt swissbibAltlasten: ETHICS
...und in swissbib
22
Projekt swissbibAltlasten ETHICS
FRBR aus den 80ern
...und in swissbib
23
Projekt swissbibETHICS Konsequenzen
NEBIS setzt weiter auf diese Praxis:http://opac.nebis.ch/F?func=z103-set&doc_number=001624001
Und in swissbib: Suche nach "Jahr: 1981“ – Sortierung nach Titel A-ZProbleme mit Verwaltungsaufnahmen: z.B. Fernleihe
Projekt swissbibAltlasten: Sibil - Hierarchie
...und in swissbib
Projekt swissbib
26
Autoritäten – Die Basis
=100 1- $a Tucholsky $D Kurt $9 141256591 $8 Tucholsky, Kurt $8 AT: Wrobel, Ignaz. Pseudonym von Kurt Tucholsky $8 AT: Tiger, Theobald. Pseudonym von Kurt Tucholsky $8 AT: Panter, Peter. Pseudonym von Kurt Tucholsky $8 AT: Hauser, Kaspar. Pseudonym von Kurt Tucholsky
=600 17 $a Tucholsky, Kurt $9 141256591 $8 Tucholsky, Kurt $8 AT: Wrobel, Ignaz. Pseudonym von Kurt Tucholsky $8 AT: Tiger, Theobald. Pseudonym von Kurt Tucholsky $8 AT: Panter, Peter. Pseudonym von Kurt Tucholsky $8 AT: Hauser, Kaspar. Pseudonym von Kurt Tucholsky $2 ids zbz
Suche nach: Peter Panter schreiben
IDSBB
SNL
RERO
#00 VerfasserIn
#10 Körperschaft
#11 Kongress
Regelbasierte Zuordnung bei String-Match von AUT zu BIB
a)Es gewinnt jene mit den meisten verworfenen Formenb)Ansonsten festgelegte Reihenfolge
Projekt swissbib
27
Autoritäten – Was wäre wenn
Was können Autoritätsdateien neben der Anreicherung von Suchanfragen bieten?
Verlinkung von DatenquellenAggregation von Informationen
http://www.worldcat.org/wcidentities/lccn-n50-81889http://d-nb.info/gnd/11862444X
Projekt swissbib
28
Koordinaten
Projekt SwissBib
• Hannes Hug, [email protected]
• Tobias Viegener, [email protected]
• Günter Hipler, [email protected]
Der Service: www.swissbib.chDas Projekt: www.swissbib.org