26
Vernetzung von verteilten Informationssystemen Michael Hohlfeld Michael Hohlfeld Institute for Science Networking Institute for Science Networking Oldenburg GmbH Oldenburg GmbH an der C.V.O. Universität Oldenburg an der C.V.O. Universität Oldenburg <[email protected]> <[email protected]> Tagung in Ulm, 10. bis 13. März 2002

Vernetzung von verteilten Informationssystemen

  • Upload
    mauve

  • View
    35

  • Download
    0

Embed Size (px)

DESCRIPTION

Iuk Tagung in Ulm, 10. bis 13. März 2002. Vernetzung von verteilten Informationssystemen. Michael Hohlfeld Institute for Science Networking Oldenburg GmbH an der C.V.O. Universität Oldenburg . Vernetzung von verteilten Informationssystemen. - PowerPoint PPT Presentation

Citation preview

Page 1: Vernetzung von verteilten Informationssystemen

Vernetzung von verteiltenInformationssystemen

Michael HohlfeldMichael Hohlfeld

Institute for Science Networking Oldenburg Institute for Science Networking Oldenburg GmbHGmbH

an der C.V.O. Universität Oldenburgan der C.V.O. Universität Oldenburg

<[email protected]><[email protected]>

Iuk Tagung in Ulm, 10. bis 13. März 2002

Page 2: Vernetzung von verteilten Informationssystemen

Übersicht

Verteilte Informationssyteme

PhysNet-Aktivitäten– Das Projekt SINN– OAD: Open Archives Distributed– Ergebnisse aus CARMEN

Ein kleiner Ausblick ...

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 3: Vernetzung von verteilten Informationssystemen

Verteilte Informationssysteme Warum verteilte Informationssysteme?

– riesige Informationsmenge im WWW– Suchmaschinen nicht wissenschaftsspezifisch– zentrale Systeme benötigen große Rechenleistung

– Verteilte Dienste nutzen relevante

(fachspezifische) Webserver als verteilte Datenbank

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 4: Vernetzung von verteilten Informationssystemen

Vorteile verteilter Systeme

durch die Beschränkung des Daten-raumes sind Relevanz und Qualität sichergestellt

Inhalte verbleiben auf den Servern der Erzeuger, diese behalten so die Kontrolle

beliebig skalierbar

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 5: Vernetzung von verteilten Informationssystemen

Anforderungen an verteilte Systeme

Zugriff auf heterogene Datenräume

Vernetzung verschiedener fachspezifischer Informationsdienste

Stabilität und Schnelligkeit

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 6: Vernetzung von verteilten Informationssystemen

Das Projekt SINN

SINN: Suchmaschinennetzwerk im Internationalen

Naturwissenschaftlichen Netz

Aufbau eines weltweiten Spiegel-Systems von PhysNet

Vernetzung von global verteilten Harvest-Brokern und -Gatherern

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 7: Vernetzung von verteilten Informationssystemen

Aufgaben in SINN

Aufbau des Suchmaschinenetzwerkes mittels der Harvest-Replicator Technik

Entwicklung einer Sprache zum Anfragen-austausch (basierend auf XML-Query)

Kommunikation zwischen den Such-maschinen mittels eines XML-Protokolls

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 8: Vernetzung von verteilten Informationssystemen

PhysNet Spiegel weltweit

weltweit neun Spiegel des PhysNet-Dienstes (HTML-Seiten)– in der Schweiz (EPS), den USA, England, Russland,

Frankreich, Indien, Niederlande, Deutschland

weitere Spiegel sind in Vorbereitung

dienen als Vorläufer des späteren Suchmaschinennetzwerkes

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 9: Vernetzung von verteilten Informationssystemen

Stand der Dinge

Einarbeitung in die interne Diskussion der W3C Arbeitsgruppe XML-Query– aktive Mitarbeit geplant– noch kein stabiler Standard

internationaler technischer Workshop im Dezember 2001– Erfahrungsaustausch und intensive Diskussionen

mit den internationalen Partnern von SINN/PhysNet

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 10: Vernetzung von verteilten Informationssystemen

Ergebnisse des Workshops

Verbesserung der Spiegelsoftware Netz-Topologie vorerst zu vernachlässigen regionale Gatherer und unabhängige Broker Synchronisation der Gatherer und Broker Austausch von Konfigurationsdateien bei Ausfall eines Brokers: Liste mit

Verweisen zu den alternativen Brokern der anderen Standorte

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 11: Vernetzung von verteilten Informationssystemen

SINN 2002

Optimierung der Harvest-Suchmaschinen– Einbau eines Rankings– Programmierung eines Harvest-Moduls für die

Kommunikation zwischen den Brokern– Entwicklung eines XML-basierten Query- und

Anwserprotokolles und Programmierung eines Harvest-Moduls, welches XML-Qurey versteht

Planung und Durchführung einer weiteren internationalen Tagung

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 12: Vernetzung von verteilten Informationssystemen

Informationen zu SINN

SINN ist ein Vorhaben in Rahmen des DFN-Projektes „Einsatz von Netzdiensten im wissenschaftlichen Informationswesen“

Mittel des bmb+f und des Landes Niedersachsen

www.isn-oldenburg.de/projects/SINN

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 13: Vernetzung von verteilten Informationssystemen

Das Projekt OAD

Open Archives: Distributed services for physicists and graduate students

DFG/NSF Projekt, gemeinsam mit Virginia Tech

Zugriff auf verteilte Daten + Dokumente

als Austauschprotokoll das OAi-Protokoll

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 14: Vernetzung von verteilten Informationssystemen

PhysDoc als Data-Provider

stellt als Data-Provider Daten OAi-konform zur Verfügung– Harvest-Gatherer sammelt – Daten werden offline konvertiert und in einem

Metadatencontainer (SQL-DB) gespeichert– Normalisierung der Daten– einfache Qualitätsfunktion

– OAi-konforme Ausgabe (XML on-the-fly)– beliebige Ausgabeformate möglich und für

andere Austauschprotokolle gewappnet

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 15: Vernetzung von verteilten Informationssystemen

PhysDoc als Service-Provider stellt als Service-Provider eine

Suchfunktion zur Verfügung, welche die frei zugänglichen (und gut strukturierten) Dokumente bzw. Metadaten von PhysDoc Teilen des arXiv Eprint Archives und von IOPP

umfasst.

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 16: Vernetzung von verteilten Informationssystemen
Page 17: Vernetzung von verteilten Informationssystemen

Das Projekt CARMEN

Content Analysis, Retrieval and MetaData: Effective Networking

Sonderfördermaßnahme im Rahmen von Global-Info mit Mitteln des bmb+f

Weiterentwicklung der Inhaltserschließung durch neue Verfahrenstechniken mit starker Verbindung zum Retrieval

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 18: Vernetzung von verteilten Informationssystemen

Arbeitsbereiche in CARMEN (Weiter-)Entwicklung von Werkzeugen zur Erzeugung

von Metadaten mit Dokumentenupload

Methoden der Authentifizierung und der dauerhaften Adressierung (digitale Signaturen und Persistent Identifier)

Konkordanzen von Klassifikationen und Thesauri

Entwicklung von umfassenden Retrievalkomponenten– Retrieval auf Metadaten, Datensätzen mit XML-Struktur– Suchfunktionen für verschiedene Datentypen, Klassifikationen– automatische Klassifikation, ...

Fachübergreifende Informationssysteme

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 19: Vernetzung von verteilten Informationssystemen

Ergebnisse aus CARMEN

Verknüpfung der Dokumentendienste PhysDoc und MPRESS in AP9

Crosskonkordanzen zwischen PACS und MSC Klassifikationen

Entwicklung einer gemeinsamen Suchoberfläche für PhysDoc und MPRESS

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 20: Vernetzung von verteilten Informationssystemen
Page 21: Vernetzung von verteilten Informationssystemen

Neues PhysDoc Suchinterface findet Anwendung in PhysDoc zusätzlich Anbindung an das OAi-

Protokoll verschiedene Suchmöglichkeiten:

– Quick-Search über gesamten PhysDoc-Datenbestand– Strukturierte Suche über den gesamten Bestand von

PhysDoc und MPRESS– Strukturierte Suche über die mit Metadaten

versehenden Teile von PhysDoc, arXiv und IOPP

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 22: Vernetzung von verteilten Informationssystemen

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 23: Vernetzung von verteilten Informationssystemen

Zum Schluss ein kleiner Ausblick ...

Iuk Tagung in Ulm, 10. bis 13. März 2002Vernetzung von verteilten Informationssystemen

Page 24: Vernetzung von verteilten Informationssystemen
Page 25: Vernetzung von verteilten Informationssystemen

Vortrag Online:

<www.isn-oldenburg.de/talks/ulm_maerz02/>

Weitere Informationen:

Institute for Science Networking <www.isn-oldenburg.de>

Projekt SINN<www.isn-oldenburg.de/projects/SINN>

Projekt CARMEN <www.mathematik.uni-osnabrueck.de/projects/CARMEN>

Projekt Open Archives distributed (OAD)<www.isn-oldenburg.de/projects/OAD>

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen

Page 26: Vernetzung von verteilten Informationssystemen

Vielen Dank für Ihre Aufmerksamkeit !

Iuk Tagung in Ulm, 10. bis 13. März 2002

Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH

Vernetzung von verteilten Informationssystemen