8
Problem erkannt, Problem gebannt? Mit SFX Parsern die Verlinkungsqualität verbessern Inga Overkamp, MPDL 15.06.2010

Problem erkannt, Problem gebannt?

Embed Size (px)

Citation preview

Page 1: Problem erkannt, Problem gebannt?

Problem erkannt, Problem gebannt?Mit SFX Parsern die Verlinkungsqualität verbessern

Inga Overkamp, MPDL15.06.2010

Page 2: Problem erkannt, Problem gebannt?

04/15/23 Seite 2

Ausgangssituation

SFX Server

SFX KB

R

R

R

SFX Source SFX Target

R

muss korrekte und vollständige Metadaten liefern

muss fehlerfrei konfiguriert sein und Ausnahmen berücksichtigen

muss Anfragen erwartungsgemäß verarbeiten

Source Parser

TargetParser

Page 3: Problem erkannt, Problem gebannt?

04/15/23 Seite 3

Strategien für den MPG/SFX-Server

Aufwändige Pflege der KnowledgeBase, z.B. durch manuelle Kontrolle der SFX Updates automatisierte Prüfung von Target-URLs (im Verdachtsfall)

Zeitnahe Reaktion auf Fehlermeldungen von Nutzern Prüfung: Einzelfall oder systematisches Problem? Meldung an den Informationsanbieter

Bei systematischen Problemen außerhalb des direkten Einflussbereichs mit „hoher Relevanz“: Implementierung und Betreuung von lokalen Zwischenlösungen.

Page 4: Problem erkannt, Problem gebannt?

04/15/23 Seite 4

Beispiel 1: DOIs aus dem Web of Science, I

Beobachtung: Nutzer melden immer wieder Probleme bei der Volltextverlinkung über SFX auf diversen Plattformen

Analyse: Probleme werden durch fehlerhafte DOIs in Thomsons Web of Science (WoS) ausgelöst.

Status: Thomson behebt einzelne Probleme auf Anfrage; eine grundsätzliche Lösung wird von Thomson nicht angestrebt

Page 5: Problem erkannt, Problem gebannt?

04/15/23 Seite 5

Beispiel 1: DOIs aus dem Web of Science, II

Zwischenlösung: Überprüfung jeder WoS-OpenURL auf DOIs, die über CrossRef

und den globalen DOI Resolver nicht auflösbar sind, um diese aus dem “Context Object” zu löschen.

Admin-Skript zur Ermittlung von „auflösbaren“ DOIs für die geloggten Metadaten und Meldung an Thomson Support.

Ergebnisse: Seit August 2009 wurden > 3.500 nicht auflösbare DOIs ermittelt Für 40% hat das Admin-Skript eine alternative DOI gefunden Die restlichen 60% werden manuell durch Hiwis geprüft, z.B.

fehlende Registrierung durch Verlag (Meldung an CrossRef), unterschiedliche DOIs

Page 6: Problem erkannt, Problem gebannt?

04/15/23 Seite 6

Beispiel 2: inbound OpenURL-Schnittstelle von Wiley, I

Beobachtung: Nach der Einführung der SFX-Verlinkung über die Wiley inbound openURL-Schnittstelle, melden Nutzer verstärkte Probleme.

Analyse: Wileys inbound openURL stellt sich als unzuverlässig heraus. Von außen ist schwer einzuschätzen, welche Anfragen “funktionieren” und welche nicht.

Status: Wiley gesteht Problem ein und versucht sie zu lösen. Dieser Prozess gestaltet sich aber als sehr langwierig, auch weil für den Sommer eine neue Plattform angekündigt ist.

Page 7: Problem erkannt, Problem gebannt?

04/15/23 Seite 7

Beispiel 2: inbound OpenURL-Schnittstelle von Wiley, II

Zwischenlösung:

Prüfung der Target URLs (HTTP Requests) im SFX Target Parser. Falls eine Fehlermeldung zurückkommt, wird der Nutzer auf die Wiley Homepage umgeleitet.

Ergebnisse: Im letzten Monat wurden 360 Fehlermeldungen protokolliert

(nicht dedupliziert) Häufig werden die Probleme durch fehlerhafte Metadaten

ausgelöst. Darüber hinaus gibt es Probleme mit großen Buchstaben in

DOIs (10.1111/J.1364-3703.2007.00384.X) und einer ganzen Reihe von ISSNs früherer Titel

Page 8: Problem erkannt, Problem gebannt?

04/15/23 Seite 8

Diskussion

Alle Zwischenablösung müssen auf Kosten und Nutzen abgewägt werden-> nicht alles was machbar ist, kann mit den verfügbaren Ressourcen gemacht werden!

Darüber hinaus darf man die Informationsanbieter nicht aus der Pflicht nehmen-> Aufnahme technischer Anforderungen in Lizenzverträge, z.B. auch standardgerechte Verwendung HTTP Error Codes

Aber trotzdem: Den Nutzer möglichst wenig “leiden lassen”