25
Universität zu Köln Der Kölner UniversitätsGesamtkatalog Praxisbericht 'Betrieb einer Recherche-Infrastruktur' Oliver Flimm <[email protected]> ZBIW: DV-Systembetreuung in Hochschulbibliotheken 28.11.2014

KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

  • Upload
    flimm

  • View
    35

  • Download
    1

Embed Size (px)

Citation preview

Page 1: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Der Kölner UniversitätsGesamtkatalog

Praxisbericht 'Betrieb einer Recherche-Infrastruktur'

Oliver Flimm <[email protected]>

ZBIW: DV-Systembetreuung in Hochschulbibliotheken28.11.2014

Page 2: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

„Der KUG“• Zentrale Recherche-Infrastruktur für

die Bestände der Universität zu Köln• Umfang (Stand 11/2014): 17.2 Mio.

Titel in 212 separaten Katalogen• Integriert verschiedene Prinzipien und

Funktionen aus dem Social- und Semantic Web

• Realisiert mit der Open-Source Software OpenBib (GPL, seit 1997)

Page 3: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Page 4: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Besonderheiten

• Open Source als zentrales Prinzip– Softwareverteilung über öffentliches SVN

Repository (Google Code)

• LAPPX (Linux, Apache, PostgreSQL, Perl, Xapian)

• Eine Infrastruktur für effiziente Bereitstellung vieler separater Portale– Objektorientiertes Templating

Page 5: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Flexibles Templating

Verschiedene Abstraktionsebenen (Kataloge, Views, Katalogprofile)Default: 701 Alle: 3621/titles_record

/_databases/mdz/titles_record

/_views/gdz/titles_record

/_profiles/kug/titles_record

/_profiles/kug/_databases/mdz/titles_record

/_profiles/sammlungen/_views/muenzen/titles_record

Page 6: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Page 7: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Infrastruktur: Ziele• Eine Lösung für

– Endnutzer im Web-Browser– Integration in andere Dienste (USB-Portal)– Semantic Web

• Durchgehender 24/7 Betrieb– Möglichst keine Downtimes bei

Erweiterungen/Updates

• Größtmögliche Flexibilität und Erweiterbarkeit

Page 8: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Infrastruktur: Zentrale Prinzipien

• Trennung von Resourcen und verschiedenen Repräsentationen– Content-/Language-Negotiation per 303

Redirect– HTML, INCLUDE, JSON, RDF, RSS, CSV,

TXT, ICAL

• REST für einzelne Resourcen (JSON)– GET, POST, PUT, DELETE

Page 9: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Beispiel: URI's

Resource: – /portal/<view>/databases (GET,POST)

Repräsentationen:– /portal/<view>/databases.html?l=de– /portal/<view>/databases.json?l=de– /portal/<view>/admin/databases.html?l=de– /portal/<view>/admin/databases.json?l=de

Page 10: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Beispiel: URI's II

Resource: – /portal/<view>/databases/id/mdz

(GET,PUT,DELETE)

Repräsentationen:– /portal/<view>/databases/id/mdz.html?l=de– /portal/<view>/databases/id/mdz.json?l=de– /portal/<view>/admin/databases/id/mdz.html?l=de– /portal/<view>/admin/databases/id/mdz.json?l=de

Page 11: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Beispiel: URI's III oder JSON RuleZ{ "link": { "rel": "self", "href": "http://kug.ub.uni-koeln.de/portal/kug/databases.json?l=de" }, "databases": [ { "link": { "rel": "self", "href": "http://kug.ub.uni-koeln.de/portal/kug/databases/id/afrikaans.json?l=de" }, "system": "Sisis", "active": 1, "description": "Sammlung Afrikaans", "dbname": "afrikaans", "sigel": "afri", "url": "http://www.ub.uni-koeln.de", "id": "afrikaans" },

Page 12: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

USB-Portal KUG

S1 S2 S3 S4

Frontend S0

Cluster A

System /User DB

Cluster B

HaProxy

Recherche Update

Architektur für 24/7

Page 13: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Architektur: 24/7 II

• Frontend-Server mit Proxy und externer Steuerung

option httpchk HEAD /portal/openbib/server_is_active

• Alternierende Cluster für Recherche und Updates

Page 14: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Aggregation externer Daten als Kataloge

• Standard-Schnittstellen (OAI) und Formate (DC, MARC21) nutzen, sonst API (YouTube/OER) und/oder eigene Konverter

• Zentrale OAI-Aggregation mit REPOX• Open Data nutzen (BVB, SWB, hbz)

– Beispiel: Nomos Online Premium

Page 15: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Page 16: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Anreicherungen

Problem Sacherschliessung– RVK, DDC, Schlagworte, Links auf

Inhaltsverzeichnisse aus Open Data Dumps– Verschlankung verschiedener Systematiken

zu 20 Themengebieten über Konkordanzen- 370.000 Titel mit BK vs. 1.1 Mio Titel mit

Themengebiet

– Referenzierende Artikelnamen aus der Wikipedia als 'Schlagworte'

Page 17: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Anreicherungen II

Mehr finden:– ISBN10 und ISBN13– „Erscheinungsjahre“ bei Zeitschriften– Schiller-Räuber-Problem– Medientyp, Sprache– Synonym-Wörterbücher

Page 18: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Administration

• Grundlegende Administration muss an Nicht-Techniker delegierbar sein– Web-Oberfläche für Administratoren

• Gleiches gilt für die textuelle Betreuung von Sammlungsportalen durch externe Wissenschaftler (Präsentation von Forschungsdaten)

Page 19: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Page 20: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Page 21: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Elementare Bedürfnisse der Nutzer im Blick behalten

• Relevantes Finden und Einordnen– Rechercheanreicherungen– Livesearch, Rechtschreibkorrektur, Toleranzen– Systematische Einordnung (Themengebiete)

• Wie komme ich dran?– Facettierung nach Standort und Zugriffs-Status– Priorität: Online > ausleihbar > einsehbar

Page 22: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Page 23: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Tools

• REPOX• Yslow• YAML Framework• ORM• CGI::Application

Page 24: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Fragen?

Page 25: KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur

Universität zu Köln

Vielen Dank für Ihre Aufmerksamkeit

Quellen:KUG - http://kug.ub.uni-koeln.de/

OpenBib - http://www.openbib.org/

OpenBib Wiki - http://wiki.openbib.org/

OpenBibBlog - http://blog.openbib.org/

Projektseite – http://code.google.com/p/openbib/

Xapian Suchmaschine - http://www.xapian.org/