Neue Metadaten braucht das Land (Foliensatz)

Embed Size (px)

Citation preview

Neue Metadaten braucht das Land

Inhalt

Was sind Metadaten?

Design und Ding

Kataloge

INSPIRE und digitale Geodaten

Neue Anforderung: Pragmatik

...und der ganze REST

Arnulf Christl

http://www.metaspatial.net

Metaspatial

Grndung: Mrz 2010Schwerpunkt: In-Wert-Setzung von Geodaten!Beratung: GeodateninfrastrukturenMetadatenProfessioneller Open Source EinsatzNeu: Agiles Projektmanagement

http://www.metaspatial.net

In Anlehnung an:

"Neue Mnner braucht das Land"(Ina Deter Band)

Neue Metadaten braucht das Land!

Was sind Metadaten?

Als Metadaten oder Metainformationen
bezeichnet man allgemein Daten, die Informationen ber andere Daten enthalten.

[]
Eine allgemeingltige Unterscheidung zwischen Metadaten und gewhnlichen Daten existiert allerdings nicht, da die Bezeichnung eine Frage des Standpunkts ist!

Metadaten in Katalogen...

Typische Metadaten zu einem Buch
(Objekt) sind beispielsweise:der Name des Autors

die Auflage

das Erscheinungsjahr

der Verlag

die ISBN ...

Was halt so auf eine Karteikarte passtG !C AL OT A

Es ist naheliegend zu denken, dass Metadaten
in digitalen Katalogen

dann so aussehen mssten:

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Metadaten in digitalen Katalogen...

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A

Was halt so auf eine Karteikarte passtG !C AL OT A


Digitale (Meta)daten

...sind jedoch etwas
gnzlich anderes!

Materie (ein Ding) kann nur an einem Ort sein.

Ein Ding verdeckt das andere.

Ein Ding kann nicht an zwei
Orten gleichzeitig sein.


Digitale (Meta)daten sind anders.

Sie knnen dupliziert
und kopiert werden.

...ein bisschen so wie Open Source...

Copying is not theft!

Information
(Design, Ideen, Konzepte, Daten) knnen gleichzeitig

an mehreren Orten
sein.

...digitale Metadaten?

Zu den Metadaten einer digitalen Datei
zhlen unter anderem:der Dateiname

die Zugriffsrechte

das Datum der letzten nderung

das Dateiformat (odt, shp, kml, xml, rss, rdf)

Aber: da geht viel mehr, weil alles vernetzt ist!

...digitale Geo-Metadaten

Die Datei selbst kann Metadaten enthalten:kml - Keyhole Markup Language (OGC)xml - eXtensible Markup Language (W3C)rss - Really Simple Syndication (W3C)rdf - Resource Description Framework (W3C) Da geht noch viel mehr, weil alles vernetzt ist!

Doch zurck zu INSPIRE:

"Profile! Warum nur, warum?"

...hre ich sie jammern. Ganz einfach: Weil die Idee noch aus dem letzten Jahrhundert stammt.

Nicht alle Ideen aus der Vergangenheit sind schlecht.

Aber sie sollten sich weiterentwickeln drfen.

INSPIRE

Der Begriff "Metadaten" an sich wird nicht definiert, sondern lediglich Inhalte beschrieben:RICHTLINIE 2007/2/EG DES EUROPISCHEN PARLAMENTS UND DES RATESMetadaten umfassen Angaben zu folgenden Aspekten:

a) Entsprechung der Geodatenstze mit den in Artikel 7 Absatz 1 vorgesehenen Durchfhrungsbestimmungen;

Metadaten in INSPIRE

INSPIRE strukturiert bereits auf oberster Ebeben durch eine grobe Kategorie was katalogisiert werden soll, hnlich dem Library Classification System von Dewey aus vor-digitaler Zeit...Die Annexes (thematische Anhnge der EU-Richtlinie) definieren welche Art von Daten und Metadaten wann bereitgestellt werden mssen.Der ISO Standard 19139 beschreibt das wie.

Beispiele aus der Geo-Praxis

Metadaten zu einem Orthophoto enthalten folgende Informationen:

Aufnahmegert Digital

Analog

BearbeitungsschritteAusschnitt, Entzerrung

Schattenaufhellung

Kontrastanpassung

Farbanpassung

etc.

Rumlicher Ausschnitt

Koordinatensystem

Projektion

Format, Zugriffsmglichkeiten

Datum der Aufnahme

Auflsung des Originalbildes

Farbkanle

Beispiele aus der Geo-Praxis

Metadaten zu einem Stau-Informationsdienstes beschreiben folgende Aspekte:

AufnahmeartDatenerhebung durch Verkehrsberwachung (amtlich)

Meldungen durch Autofahrer (freiwillig, verifiziert)

Prognosestatus

Bercksichtigung von Baustellen

etc.

Rumlicher Ausschnitt

Koordinatensystem

Projektion

Format, Zugriffsmglichkeiten

Ursprung der geometrischen Grundlage

Aktualitt der geometrischen Grundlage

Syntax und Semantik

Syntax und Semantik sind Disziplinen der Semiotik. In der Geoinformatik beschreibt die Syntax Geodaten formal, whrend sich die Semantik auf deren Bedeutung bezieht. Um die Bedeutung strukturiert in einem Katalog ablegen und durchsuchen zu knnen, wird eine Indexierung bentigt.

Thesauri und Indexierung

Ein Thesaurus oder Wortnetz ist ein kontrolliertes Vokabular, dessen Begriffe durch Relationen (Beziehungen) miteinander verbunden ist. systematisch geordnete Sammlung von Begriffen, die in thematischer Beziehung zueinander stehen.

Polyhierarchische Indexierung (z.B. fr Kataloge)

Eine gemeinsame Bedeutung wird vorausgesetzt.

Ontologien

Die Ontologie ist die Lehre vom Sein der Dinge. Eine Ontologie beschreibt die Beziehungen von Sinnzusammenhngen (Bedeutungen) und bringt sie in einen definierten und kontrollierten Kontext.

Erst das Akzeptieren und anwenden einer gemeinsamen Ontologie und eines Sinn-zusammenhangs ermglicht Kommunikation.

Pragmatik

Syntax und Semantik werden (in der Semiotik) durch die Lehre von den Beziehungen der Zeichen zu den Zeichenbenutzern (der Pragmatik) vollendet....in der Informatik und Geodatenverwaltung fehlt Pragmatik!

Komplexe Technologie und Formate

Die Situation auf Seite des Anbieters:Geodaten werden durch den kleinsten gemeinsamen Nenner beschrieben (Dublin Core, FGDC, ISO 19115).

Metadatenerfassung und Pflege sind zustzliche, (oft unbeliebte) Aufgaben der Datenanbieter.

Bereitstellung ber komplexe Mechanismen (CSW) und Formate (ISO 19139 und spezielle Profile).

Metadaten-Qualitt ist weitgehend auf Syntax beschrnkt.

Interaktionsmglichkeiten mit den Anwendern sind minimal.

Divergenz zwischen Angebot und Nachfrage

Die Situation auf Seite des Anwenders:Anwender verstehen die "Sprache" der Anbieter nicht.

Beschreibungen der Geodaten und -Dienste reicht nicht aus, um fachliche Themen zu finden.

Dienste-Angebot ist technisch zu kompliziert, inhaltlich inkompatibel und unzuverlssig.

Web-Portale erfllen nicht die Anforderungen der Nutzer.

Die Interaktion zwischen Anbieter und Nutzer ist minimal.

Metadaten zeigen oft ins Leere, sind unvollstndig vernetzt.

Neue Anforderungen

Angebot erweitern und Suche vereinfachen.

Sortieren und "stbern" (browsing) ermglichen.

Option, Ergebnisse bewerten zu knnen.

Einordnung in feste Kategorien durch Kommentierungen (Tagging) ergnzen.

Erstellung und Pflege der Metadaten automatisieren.

Interaktion von Anbieter, Broker und Nutzer deutlich vereinfachen.

Konzepte aus dem Web 2.0

Technik: REST-Architekturen ermglichen flexible, einfache Erhebung, Pflege und Suche.

Prozesse: Aktualisierung von Metadaten erfolgt automatisiert ber Nachrichten wie GeoRSS.

Inhalt: Daten gehren in offene Ablagen, damit Ontologien darauf wachsen knnen.

Die Erzeugung und Pflege von Ontologien muss durch Anwender-Gesellschaften erfolgen.

Filteron theway out!

David Weinberger (2008): Das Ende der Schublade. Die Macht der neuen digitalen Unordnung.

Technik: REST mit Sinn verbinden

Vier Konzepte:die Ressource

ihr Name (URL)

ihre Reprsentation

ihre Verbindungen (Links, Verweise)

Vier Eigenschaften:Adressierbarkeit

Zustandslosigkeit

Verbundenheit

Wohldefinierte Operationen

Das entsprechende Architekturmodell ist die Resource Oriented Architecture (kurz: ROA).

Ausblick

Aktuelle Katalog-Technik wird dem Potential digitaler Daten nicht gerecht. "Ablagen" sind besser geeignet:Das "Ablagen"-Konzept muss in die INSPIRE Richtlinien eingearbeitet werden.

Das "Internet" ist die Basis jeder Geodateninfrastruktur. Es muss lediglich "richtig" genutzt werden:REST-Paradigmen mssen in den Standards des OGC bercksichtigt und in INSPIRE umgesetzt werden.

Herzlichen Dank fr Ihre Aufmerksamkeit

Metaspatial

Dieser Foliensatz darf zu jedem Zweck und kopiert, weiterverwendet und verndert werden. Siehe auch: Copystraight.Copyright: Arnulf Christl 2010

6. bis 9. September 2010Die internationaleOpen Source Konferenz der
Geo-Branche http://2010.foss4g.org

Download: Artikel: http://arnulf.us/publications/neue-metadaten-braucht-das-land_paper.odt (pdf)
Foliensatz: http://arnulf.us/publications/neue-metadaten-braucht-das-land_slides.odt (pdf)

/ 33

Metaspatial.net