172
DISS. ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG zur Erlangung des Titels DOKTOR DER TECHNISCHEN WISSENSCHAFTEN der EIDGENÖSSISCHEN TECHNISCHEN HOCHSCHULE ZÜRICH vorgelegt von BASTIAN GRAEFF Dipl.-Ing., Rheinische Friedrich-Wilhelms-Universität Bonn geboren am 1. Januar 1974 aus Deutschland Angenommen auf Antrag von Referent: Prof. Dr. A. Carosio, Institut für Geodäsie und Photogrammetrie, ETH Zürich Korreferent: Prof. Dr. F. Golay, INTER-Géomatique/SIRS, EPF Lausanne 2002

Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Embed Size (px)

Citation preview

Page 1: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

DISS. ETH Nr. 14864

ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN

A B H A N D L U N Gzur Erlangung des Titels

DOKTOR DER TECHNISCHEN WISSENSCHAFTEN

der

EIDGENÖSSISCHEN TECHNISCHEN HOCHSCHULE ZÜRICH

vorgelegt von

BASTIAN GRAEFF

Dipl.-Ing., Rheinische Friedrich-Wilhelms-Universität Bonn

geboren am 1. Januar 1974

aus Deutschland

Angenommen auf Antrag von

Referent: Prof. Dr. A. Carosio, Institut für Geodäsie und Photogrammetrie, ETH Zürich

Korreferent: Prof. Dr. F. Golay, INTER-Géomatique/SIRS, EPF Lausanne

2002

Page 2: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG
Page 3: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG
Page 4: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG
Page 5: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Inhaltsverzeichnis v

Inhaltsverzeichnis

Abstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix

Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi

1. Einleitung 1

1.1 Einordnung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Problemstellung und Zielsetzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.3 Inhaltsübersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2. Rasterdaten als Träger geometrischer und semantischer Information 5

2.1 Wesen von Rasterdaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.1.1 Diskretisierung des Kontinuums . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.1.2 Raster als Struktur der Rasterdaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.1.3 Geometrische Referenzierung im Raster . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.1.4 Inhalt von Rasterbildern. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.2 Erfassung, Verwaltung und Ausgabe von Rasterdaten. . . . . . . . . . . . . . . . . . . . . 10

2.3 Eigenschaften und Merkmale von Rasterdaten . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

3. Methoden der Bilddatenverarbeitung 17

3.1 Überblick und Systematik der Methoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

3.1.1 Bildmanipulation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183.1.2 Bildinterpretation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233.1.3 Kombination von Bildmanipulation und -interpretation. . . . . . . . . . . . . . . . . . . . 24

3.2 Mustererkennung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.2.1 Numerisch-statistische Verfahren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253.2.2 Strukturelle Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273.2.3 Wissensbasierte Verfahren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

Page 6: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

vi

3.3 Bildkorrelation und Template Matching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.3.1 Korrelation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293.3.2 Matching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323.3.3 Prinzip des Template Matching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333.3.4 Das wissensbasierte Template Matching von Stengele . . . . . . . . . . . . . . . . . . . . . . 37

4. Kartografische Mustererkennung 41

4.1 Definition, Aufgabe und Inhalt der Karte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

4.2 Das System grafischer Zeichen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4.2.1 Restriktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 444.2.2 Darstellungsvielfalt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.3 Die kartografische Wissenbasis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

4.4 Methoden der kartografischen Mustererkennung . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.5 Ausgewählte Konzepte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4.5.1 Konzept von Stengele et al. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 514.5.2 Erweiterungen von Frischknecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 524.5.3 Konzept Illert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 524.5.4 Konzept Mayer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 524.5.5 Konzept Lin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 534.5.6 Konzept Samet und Soffer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

5. Abfrage von Information 55

5.1 Abfragen und Abfragesprachen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

5.2 Einsatzgebiete der Abfragesprachen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

5.2.1 Abfragen als Datenbankwerkzeug . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 585.2.2 Abfragen aus raumbezogenen Datenbanken . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

5.3 Unscharfe Abfragen, Fuzzy-Sets und linguistische Variablen . . . . . . . . . . . . . . . 60

5.3.1 Einführung von Unschärfe in Abfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 605.3.2 Fuzzy-Sets und linguistische Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 615.3.3 Einsatz von Fuzzy-Sets und linguistischen Variablen in Abfragen. . . . . . . . . . . . 675.3.4 Anwendung von unscharfen Abfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

5.4 Abfragen aus Rasterdaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

5.4.1 Indirekte Abfrage aus Rasterdaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 705.4.2 Direkte Abfrage aus Rasterdaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

5.5 Die Abfragesprache „RaQueL“ von Frischknecht . . . . . . . . . . . . . . . . . . . . . . . . . 72

5.5.1 Das Gesamtkonzept . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 725.5.2 Segmentierung und Objektbildung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 735.5.3 Berechnung der Objektmerkmale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 745.5.4 Klassifizierung durch Abfragen in „RaQueL“ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 765.5.5 Übertragung von Abfrageresultaten auf die Objektdatenbank . . . . . . . . . . . . . . . 775.5.6 Visualisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

Page 7: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Inhaltsverzeichnis vii

6. Konzept einer geometrisch-semantischen Abfragemethode mit direk- tem Rasterdatenzugriff 79

6.1 Modellierung des kartografischen Wissens. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

6.1.1 Templatetypen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 836.1.2 Modellierung durch pixel-, profile- und region-Templates . . . . . . . . . . . . . . . . . . 84

6.2 Syntax der Abfragesprache . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

6.3 Auswahl von Rasterbildverarbeitungsmethoden. . . . . . . . . . . . . . . . . . . . . . . . . . 89

6.3.1 Anforderungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 906.3.2 Grundzüge des Mustererkennungsverfahrens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

6.4 Matchingstrategie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

6.4.1 Anforderungen an die Matchingstrategie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 936.4.2 Simulation der Rotations- und Skalierungsinvarianz durch Strukturpunkt-

matching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 946.4.3 Fuzzifiziertes Matching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

6.5 Kombination von direkter und indirekter Abfragemethode . . . . . . . . . . . . . . . 103

7. Realisierung einer Abfragesprache für geometrische und semantische Information 105

7.1 Steuerung der Module durch die Abfragesprache . . . . . . . . . . . . . . . . . . . . . . . . 105

7.1.1 Attribute und Operatoren für die direkte Abfrage . . . . . . . . . . . . . . . . . . . . . . . . 1067.1.2 Der Befehl SELECT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1097.1.3 Der Befehl UNSELECT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1107.1.4 Externe Parametermanipulation durch SET und UNSET . . . . . . . . . . . . . . . . . . . 1107.1.5 Interne Parametermanipulation durch BY-Konstrukte . . . . . . . . . . . . . . . . . . . . . 1127.1.6 Logische Verknüpfungsoperatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1127.1.7 Linguistisch formulierte Mehrfachabfrage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

7.2 Module des direkten Rasterdatenzugriffs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

7.2.1 Präanalyse durch Regionenmarkierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1147.2.2 Strukturpunktmatching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1167.2.3 Fuzzifiziertes Matching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1187.2.4 Alternativentest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1217.2.5 Visualisierung der gefundenen Strukturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1227.2.6 Postprocessingmodule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

7.3 Funktionaler Ablauf und Datenfluss in „GRaQueL“ . . . . . . . . . . . . . . . . . . . . . . 124

7.4 Einbettung in die Softwareumgebung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

8. Anwendungen und Resultate 129

8.1 Leistungsmerkmale der Matchingstrategie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

8.1.1 Untersuchung der Matchingmethodik. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1298.1.2 Leistungsfähigkeit bei grossen Datenmengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

8.2 Abfragen in „GRaQueL“ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136

Page 8: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

viii

8.3 „GRaQueL“ im GIS-Kontext . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140

8.4 Bewertung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

9. Schlussbetrachtung 143

Bibliografie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .147

Dank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .155

Bewilligung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .157

Lebenslauf. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .159

Page 9: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Abstract ix

Abstract

Geo-information systems (GIS) offer nowadays indispensable methods towards theacquisition, the administration, the analysis, and the visualization of geo-spatial data.GIS systems with high performance impress by the possibility to deal with spatial infor-mation of both raster and vector base. Especially dealing with raster-based spatial databelongs nowadays to geo-information systems. In the fields of data acquisition (e.g.scanner technology) and the presentation of data (visualization of raster data), rasterdata are well accepted in GIS. Concerning the administration of raster data in GIS thereexist many approaches, too. However, the functionality of raster data analysis is oftenunderdeveloped.

This dissertation deals with possibilities and approaches of raster data analysis, whichcan be affected by query languages such as SQL in the field of data bases. Therefore, itmainly presents a new developed query language, by means of which a semanticallystructured access to spatial information, embedded in the raster representation ofimages, can be attained.

Thus, pattern recognition methods, a knowledge base, being specific to the documenttype, and a query tool have to be combined and well adapted. Pattern recognitionmethods usually require many tuning parameters for effective and satisfying detectionrates. On the contrary, query languages do neither allow many nor non-linguistic para-meters. Therefore, a fuzzified matching strategy has been developed permitting boththe regulation of recognition methods and the interpretation of linguistic parameters,given in the query formulation.

In the field of cartographic pattern recognition, this dissertation shows successful appli-cations of the new developed prototype query language „GRaQueL“ (= Geo-semanticRaster Query Language) towards a geometrically and semantically structured retrievalof spatial data. The obtained results show that an analysis and interpretation of rasterdata are possible in a suitable computing time. Moreover, the realized query language iswell implemented among other GIS-tools. Thus, the obtained results of querying couldbe processed by both raster and vector-based GIS-applications.

Page 10: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

x

Especially, the collaboration with other raster and vector-based analyzing methodsshows that the proposed approach of a geometrically and semantically structuring que-rying method is suitable for a development of hybrid GIS systems, since the dealingwith both raster and vector data will become more and more important.

Page 11: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Zusammenfassung xi

Zusammenfassung

Geografische Informationssysteme (GIS) sind heutzutage ein unverzichtbares Instru-mentarium zur Erfassung, Verwaltung, Analyse und Darstellung raumbezogener Infor-mation. Leistungsfähige GIS-Systeme zeichnen sich dadurch aus, dass sie raum-bezogene Information sehr unterschiedlicher Formate (auf Vektor- wie auf Rasterbasis)verarbeiten können. Dazu gehört insbesondere die Verwendung von Rasterdaten. ImBereich der Datenerfassung (z.B. betr. Scannertechnologie) und der Datendar-stellung(Visualisierung) stellen Rasterdaten für Geografische Informationssysteme heutzutagekein Problem mehr dar. Auch im Bereich der Rasterdatenverwaltung gibt es bereitsAnsätze. Dagegen besteht in der Analysefunktionalität für Rasterdaten weiterhin Nach-holbedarf.

Vorliegende Arbeit setzt an dieser Stelle an und beschäftigt sich mit neuen Wegen inder Rasterdatenanalyse. Die von der Datenanalyse her bekannte Methodik der Abfrage-sprache (vgl. SQL für die Datenbanktechnologie) liefert hierzu die Intention. Im Mittel-punkt der Arbeit steht daher die Entwicklung einer neuen Abfragesprache für denRasterdatenzugriff.

Die neue Abfragesprache ermöglicht einen strukturierten semantischen Zugang zu denInhalten des Rasterbildes, bei dem rekognitive Mustererkennungsmethoden, die Ver-wendung einer dokumentenspezifischen Wissensbasis und linguistische Sprachele-mente aufeinander abgestimmt und miteinander kombiniert werden. Dabei kommt derEntwicklung einer neuen fuzzifizierten Matchingstrategie eine grosse Bedeutung zu,welche die i.A. parameterarmen Abfrageformulierungen in effektive Mustererkennungumsetzen kann.

Am Beispiel der kartografischen Mustererkennung demonstriert vorliegende Arbeitden erfolgreichen Einsatz einer neuen Prototyp-Abfragesprache „GRaQueL“ (= Geo-Semantic Raster Query Language) zur geometrisch und semantisch strukturiertenErfassung von bekannten Rasterstrukturen. Die erreichten Resultate zeigen, dass esunter Ausnützung der dokumentenspezifischen Wissensbasis gelingt, in akzeptablenRechenzeiten Analysen und Interpretationen in Rasterdaten vorzunehmen. Überdieswird nachgewiesen, dass sich die Abfragesprache in die Umgebung anderer GIS-

Page 12: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

xii

Module einfügt, d.h. dass die hieraus gewonnenen Resultate sowohl auf Raster- wieauch Vektordatenbasis weiterverarbeitet werden können.

Gerade in der Zusammenarbeit mit anderen raster- und vektororientierten Analyseme-thoden ergeben sich aus dem hier vorgestellten Ansatz eines direkten geometrisch undsemantisch strukturierten Rasterdatenzugriffs viele Entwicklungspotenziale, die zurRealisierung hybrider, d.h. Raster- und Vektordaten bearbeitender Geo-Informations-systeme führen.

Page 13: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Kapitel 1

Einleitung

1.1 Einordnung

Die Nachfrage nach raumbezogener Information ist im heutigen Informationszeitaltersehr hoch. Sie besteht nicht nur im Bereich der Vermessung, der Geografie, der Karto-grafie und der Raumplanung, sondern auch in vielen anderen Bereichen wie etwa inder Wirtschaft, der öffentlichen Verwaltung, der Logistik, im Verkehr und in der Kom-munikation. Raumbezogene Informationen in guter Qualität und in möglichst flächen-deckender Verfügbarkeit sind somit ein kostbarer „Rohstoff“ im heutigen Wirtschafts-gefüge.1

Da die flächendeckende Neuerfassung raumbezogener Daten mit enormen Kosten ver-bunden und sehr zeitaufwändig ist, wurde schon sehr früh damit begonnen, bereitsvorhandene, allerdings auf analoge Datenträger geschriebene raumbezogene Informa-tion in digitale Datenbestände zu überführen. Durch die Scannertechnologie könnenheutzutage analoge Dokumente mit geringen Kosten in Rasterdaten hoher Qualitätüberführt werden.2 Rasterdaten, die aus Karten, Plänen oder Luftbildern erhalten wer-den, sind bereits Bestandteile eines Geografischen Informationssystems (GIS), da sieraumbezogene Information repräsentieren.

In Rasterdaten liegt die Information jedoch nur implizit vor, und somit stehen sie fürGeo-Informationssysteme nur eingeschränkt zur Datenanalyse zur Verfügung. Expli-zite raumbezogene Information muss durch Interpretation der Rasterdaten gewonnenwerden - eine Aufgabe, die die Wissenschaft der Mustererkennung übernimmt. Währenddie Überführung analoger Textdokumente in digitale Textinformation bereits dank derfortgeschrittenen Entwicklung von Texterkennungsprogrammen3 einen hohen Ent-

1. vgl. Bill (1999a), Burrough and McDonnel (1998) u.A.2. vgl. Armenakis et al. (1999).3. Einen Überblick über die (primär) textliche Dokumentenanalyse gibt Nagy (2000).

Page 14: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

2 Kapitel 1

wicklungsstandard aufweist, erfordert die Mustererkennung mehrheitlich grafischerInformation aus analog vorliegenden Plänen, Karten, Skizzen und Bildern eine weitergehende Simulation der optischen Wahrnehmungsfähigkeit des Menschen. Raumbezo-gene Information muss aus Rasterbildern sowohl geometrisch (Frage nach dem „Wo?“)als auch semantisch (Frage nach dem „Was?“) erschlossen werden.

1.2 Problemstellung und Zielsetzung

Zunehmend steht in Geografischen Informationssystemen wie auch in konventionellenDatenbanken die Methode der Abfragesprache als Analysewerkzeug zur Verfügung.Abfragesprachen bedienen sich linguistischer Variablen, d.h. aus dem menschlichenSprachgebrauch entnommener Formulierungen, mittels derer Information aus denDaten beschafft werden kann. Sie sind daher besonders benutzerfreundlich und ihrGebrauch ist für Anwender von Informationssystemen sehr leicht erlernbar.

Auch wenn es bereits Ansätze gibt, Rasterdaten mit konventionellen relationalenDatenbanken zu verwalten [z.B. Nebiker (1997)], sind bislang nur wenige Rasterdaten-analysemethoden basierend auf Abfragesprachen entwickelt worden [z.B. Frischknecht(1999) und Lin and Huang (1999)].

Die von Frischknecht (1999) entwickelte Abfragesprache „RaQueL“ ermöglicht inbewusster Anlehnung an die Syntax des SQL eine Analyse von kartografischen Raster-daten basierend auf einer Objektklassifikation nach geometrischen Merkmalen. Sie setzteine rasterbasierte Mustererkennungsmethode, nämlich die Klassifikation, methodischin einer Abfragesprache um.

Kartografische Rasterdaten enthalten raumbezogene Information, die durch grafisch klardefinierte Zeichen kodiert wird. Geometrisch-grafische Strukturen in den Karten sindsomit weitestgehend redundanzfrei semantischen Einheiten zuzuordnen. Sie eignensich besonders für den Aufbau neuer Geo-Informationssysteme und weisen Vorteilegegenüber Luftbildern und anderen Rasterbildern mit raumbezogener Information auf.

An dieser Stelle soll die Frage beantwortet werden, ob nicht ein analytischer Zugriff aufgeometrisch-grafisch zusammenhängende Einheiten, die Träger semantischer Inhaltevon rasterbasierten Karten sind, möglich ist, der benutzerseitig durch Abfragen gesteu-ert wird. In anderen Worten, es geht um die Frage, ob nicht auf kartografische Zeichen,etwa in der Form

SELECT ... FROM <Rasterkarte> WHERE region LIKE <Symbol>

zugegriffen werden kann.

Dieser Frage wurde im Rahmen des Forschungsprojekts „Abfragesprache für die Geo-metrie in raster-orientierten Geo-Informationssystemen“ des Schweizerischen National-fond (SNF/FNS) in ca. dreijähriger Bearbeitungszeit nachgegangen.4 Hierbei geht eshauptsächlich um Weiterentwicklungen der Dissertationen Stengele (1995) und Frisch-

Page 15: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Einleitung 3

knecht (1999), die schliesslich in die Entwicklung einer neuen Abfragesprache semanti-scher und geometrischer Information münden soll. Hierbei werden folgende Ziele insAuge gefasst:

• Entwicklung eines Abfragesprachen-Prototyps für den semantischen Zugriff aufkartografische Rasterdaten (digitale rasterbasierte topografische Karten, nicht Luft-bilder oder andere Rasterdaten).

• Entwicklung dieser Abfragemethode als wissensbasierte Methode. Die Wissensbasiswird von den digitalen topografischen Landeskarten der Schweiz gestellt.

• Die Abfrage nach geometrisch-grafischen Strukturen gleicher Semantik soll auchden Zugriff auf rotierte und skalierte Rasterstrukturen leisten können.

• Einbettung der Abfragesprache in bestehende GIS-Softwarepakete des Instituts fürGeodäsie und Photogrammetrie der ETH Zürich.

• Kompatibilität der neuen Abfragesprache mit der Abfragesprache „RaQueL“ aus derDissertation Frischknecht (1999).

1.3 Inhaltsübersicht

Gegenstand der Interpretation bilden topografische Karten in Rasterdatenform. Daherwidmen sich die ersten Kapitel ausführlich dem Wesen der Rasterdaten sowie denMethoden der Rasterdatenverarbeitung. Hierbei wird die Repräsentation von Informa-tion in (digitalen) Rasterdaten eingehend beleuchtet, die nicht unerhebliche Auswir-kungen auf die Methoden der maschinellen Rasterdateninterpretation haben. Es wirddabei deutlich, dass Bildinformation im Rasterverband nur implizit speicherbar ist(Kapitel 2).

Ausgehend von einem Überblick über die Methoden der Rasterbildverarbeitungbeschreibt Kapitel 3 unterschiedliche Verfahren der Mustererkennung und setzt einenbesonderen Schwerpunkt auf wissensbasierte Matchingmethoden.

Die hier zu Grunde liegenden kartografischen Dokumente weisen eine Reihe vonBesonderheiten in der Kodierung der Information auf. Eine wissensbasierte kartografi-sche Mustererkennung (Kapitel 4) muss hierauf Rücksicht nehmen.

Abfragen und Abfragesprachen sind bekannte Werkzeuge der Datenanalyse. EineErweiterung des Begriffes „Abfrage“ allgemein für die Akquisition von Informationund damit auch für die Interpretation von Informationsträgern steht am Anfang vonKapitel 5. Hier werden die Grundprinzipien der Abfragesprachen vorgestellt, Möglich-keiten unscharfer Abfragen, die auf Methoden der Fuzzy-Logik zurückgreifen, erörtertund Konzepte zur Abfrage in rasterbasierten Informationsträgern vorgestellt. Die

4. SNF-Projekt Nr. 20-55775.98 vom 19.03.1999.

Page 16: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

4 Kapitel 1

Ergebnisse der Dissertation Frischknecht (1999), in der eine indirekte Abfragemethode inrasterbasierten topografischen Karten vorgestellt wird, finden besondere Beachtung.

Kapitel 6 enthält das Konzept einer neu zu entwickelnden direkten Abfragesprache,einer Abfragesprache geometrischer und semantischer Information. Da diese Abfrage-sprache als wissensbasierte Mustererkennungsmethode implementiert wird, fliessendie Aspekte der Kapitel 2 bis 5 ein. Im Mittelpunkt steht die Modellierung kartografi-schen Wissens, die Auswahl der Mustererkennungsmethoden und der Entwurf einerSyntax für die Abfragesprache.

Die Realisierung eines Prototyps dieser Abfragesprache in einem Softwaremodul an derETH Zürich beschreibt Kapitel 7, während Kapitel 8 hierzu Beispiele von Anwendun-gen liefert. Die Schlussbemerkungen in Kapitel 9 geben einen Ausblick auf künftigeErweiterungen und Entwicklungsmöglichkeiten und schliessen diese Arbeit ab.

Page 17: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Kapitel 2

Rasterdaten als Träger geometrischer und semantischer Information

2.1 Wesen von Rasterdaten

Rasterdaten (insbesondere Rastergrafiken bzw. Rasterbilder) stellen zweidimensionale,geometrisch gebundene Information in einer diskreten Zerlegung eines flächenhaftenKontinuums dar. Sie bestehen aus dem Raster selbst, das die Strukturierung der Infor-mation vorgibt, und der Menge der in dieser Struktur abgelegten Information.

2.1.1 Diskretisierung des Kontinuums

Geometrische Information - z.B. aus Luftbildern, Satellitenaufnahmen, Karten und Plä-nen - ist Information, die in einem zweidimensionalen Kontinuum gegeben ist, da diebeiden Ortsvariablen der Fläche reelle Werte annehmen können. Für die Speicherungsolcher Information ergibt sich das Problem, dass zwar jedem Flächenpunkt einebestimmte Information zugeordnet ist, doch ist es wegen der überabzählbar unendlichvielen Flächenpunkte nicht möglich, die Information zu erfassen oder gar zu speichern.

Aus diesem Grunde ist es notwendig, die im zweidimensionalen Kontinuum gegebeneInformation zu strukturieren, was sowohl für Raster- als auch für Vektordaten gilt. BeiVektordaten wird versucht, die Information geometrischen Primitiven zuzuordnen, diesich mit wenigen Parametern und Attributen beschreiben lassen. Hingegen wird beiRasterdaten versucht, das Kontinuum in gleichmässig grosse, abzählbare und damit fürdie Erfassung und Speicherung adressierbare Elemente zu zerlegen. Diese Elemente,auch Rasterelemente und bei Bildern Pixel (von engl. picture element) genannt, sind dieflächenhaften „Atome“, die entstehen, wenn die Fläche mit Hilfe eines Rasters zerlegtwird. Jedes Rasterelement ist insofern ein atomares Gebilde, als dass pro Rasterelementnur genau eine Informationseinheit5 erfasst bzw. gespeichert wird, ohne dass dabei

Page 18: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

6 Kapitel 2

innerhalb des Rasterelementes eine weitere geometrische Ausdifferenzierung mit origi-närer Information möglich ist [Bartelme (1995) S. 46f., Bernhardsen (1999) S. 67-71].

Bei Geländeaufnahmen für das digitale Geländemodell, bei Oberflächentemperatur-messungen und anderen flächenbezogenen Aufnahmen werden abzählbar viele Stütz-punkte auf dem Messfeld bestimmt. Damit wird die Erfassung und Speicherungkontinuierlicher Information ermöglicht. Die Einführung von Stützpunkten entsprichthier ebenfalls einer Diskretisierung des Kontinuums.

2.1.2 Raster als Struktur der Rasterdaten

Die Rasterung einer Fläche, d.h. ihre Einteilung in abzählbar viele atomare Elemente,kann geometrisch unterschiedlich vorgenommen werden. Entscheidend ist, dass dievollständige Fläche in Rasterelemente zerlegt wird (lückenlose Aufrasterung). Meistenswird ebenfalls verlangt, dass die Elemente gleichartig sind und dass die geometrischenElemente aneinander passen. Aus Rechtecken entsteht i.A. ein Rechteckraster bzw. beigleichen Seitenlängen ein Quadratraster, aus Dreiecken das Dreiecksraster und ausSechsecken das Wabenraster [vgl. Zamperoni (1989) S.16]. Andere Raster, denen eineandere flächenausbreitende geometrische Figur zu Grunde liegt, sind ebenfalls denk-bar.

Abb. 2.1: (v.l.n.r.) Quadratraster, Dreiecksraster, Wabenraster.

In der grafischen Datenverarbeitung werden fast ausschliesslich Quadratraster verwen-det, da sie einfach zu verwalten sind und ihre Speicheradressen durch Angabe von Zei-len- und Spaltennummer gegeben werden.6 Sie sind heutzutage die mit Abstand amweitesten verbreitete Repräsentation von Rasterdaten.

2.1.3 Geometrische Referenzierung im Raster

Für die Adressierung im Quadratraster werden die Zeilen und Spalten mit ganzen Zah-len durchnummeriert (meistens bei 0 beginnend). In den Programmiersprachen ent-

5. In einem Rasterelement kann auch multiple Information in Form eines Informationsvektors gespeichertwerden, sie erstreckt sich jedoch über die gesamte Rasterelementfläche.

6. Auch bezüglich des Aspektes der Überlagerung von Rasterbildern haben Quadratraster Vorteile [Bar-telme (1995) S. 46].

Page 19: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Rasterdaten als Träger geometrischer und semantischer Information 7

spricht das der Definition eines zweidimensionalen Feldes (Array), bei dem durch dieIndizierung mit der Zeilen- und Spaltennummer der Zugriff auf den Rasterelementin-halt (Feldinhalt) erfolgt.

Die Angabe einer Zeilen- und Spaltennummer entspricht gleichzeitig einer geometri-schen Zuordnung der unter der entsprechenden Speicheradresse abgelegten Informa-tion (Abb. 2.2).

Abb. 2.2: Adressierung in einem Quadratraster.

Durch die Angabe einer Zeilen- und Spaltenrichtung (bei Quadratrastern sind diesezueinander orthogonal) und eines Ursprungspunktes (Zeilenwert = 0, Spaltenwert = 0)wird ein Bildkoordinatensystem aufgespannt. Dieses lässt sich – vorbehaltlich der Dis-kretisierung – mit jedem beliebigen zweidimensionalen Koordinatensystem in Bezie-hung bringen, wenn Transformationsparameter (Zuordnung des Ursprungs, Massstabund Rotation (bzw. Achsausrichtung)) angegeben werden können. Zu beachten istauch, dass die Zeilennummern meistens von oben nach unten gezählt werden, währendhingegen bei mathematischen und geodätischen Koordinatensystemen die Zählung dernordwärts weisenden Achse von unten nach oben erfolgt.

Der Inhalt der Rasterelemente (Pixel) ist somit geometrisch referenzierte Information.Durch die Diskretisierung entstehen jedoch geometrisch nicht weiter ausdifferenzier-bare Flächenelemente, sogenannte geometrische Atome, die den einzelnen Rasterele-menten entsprechen. Durch die geometrisch-topologischen Beziehungen eines jedenRasterelementes mit Anderen erhält die in diesen Rasterelementen gespeicherte Infor-mation einen geometrischen Bezug.

2.1.4 Inhalt von Rasterbildern

Die in den Rasterelementen gespeicherte Information kann unterschiedlicher Natursein. Die Attribute der einzelnen Rasterelemente bestimmen die Art und die Komplexi-

Page 20: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

8 Kapitel 2

tät der Information. Der begrenzende Faktor hierfür ergibt sich aus dem insgesamt zurVerfügung stehenden Speicherplatz, der, abhängig von der Grösse und Auflösung desRasterbildes, die Komplexität der gespeicherten Information pro Rasterelementbestimmt. Häufig werden in Rasterbildern nur wenige Bits für Information zur Verfü-gung gestellt. Man unterscheidet dabei folgende Kategorien:

Abb. 2.3: Binärbild (Schwarzweissbild und Null-Eins-Belegung).

1-Bit-Rasterbilder oder Binärbilder

Bei Binärbildern wird genau ein Bit pro Rasterelement reserviert. Das erlaubt die Bele-gung des Rasterbildinhaltes mit genau zwei Zuständen, die entweder durch die ZahlenNull und Eins, durch die Wahrheitswerte TRUE (wahr) und FALSE (falsch), oder sym-bolisch durch Schwarz und Weiss repräsentiert werden (Abb. 2.3). Der Speicherplatzbe-darf eines Binärbildes ist bei gleicher Rasterbildgrösse minimal, doch ist die Infor-mation am wenigsten ausdifferenziert. Binärbilder eignen sich zur Darstellung von geo-metrisch angeordneten, aber in Rasterstruktur diskretisierten Wahrheitswerten.

Abb. 2.4: Grauwertbild der Tiefe 8 Bit (Bild und Belegungsmatrix).

n-Bit-Rasterbilder oder Einkanalbilder bzw. Grauwertbilder der Bildtiefe n

Wird die Anzahl der Bits pro Rasterelement auf n Bits erhöht, lässt sich die Informationnunmehr in 2n Zustände differenzieren. In diesem Fall spricht man von Grauwertbil-dern oder Einkanalbildern mit einer Bildtiefe von n Bits. Damit lassen sich die aus denBinärbildern bekannten Farben Schwarz (alle Bits gleich Null) und Weiss (alle Bitsgleich Eins) durch 2n-2 dazwischen liegende Grauwertstufen ergänzen (Abb. 2.4). DieInterpretation muss aber nicht zwangsläufig über Grauwertstufen erfolgen, die einen

Page 21: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Rasterdaten als Träger geometrischer und semantischer Information 9

kontinuierlichen Übergang zwischen zwei Farben in diskrete Stufen zerlegen.7 Denkbarwäre auch die Abspeicherung einer in Rasterform vorliegenden mehrfarbigen Druck-vorlage, bei der jedem Eintrag genau eine Druckfarbe zugeordnet ist (z.B. Pixelwert = 0für weisse, Pixelwert = 1 für schwarze, Pixelwert = 2 für braune, Pixelwert = 3 für blaueDruckfarbe usw.; Abb. 2.5). Bei einem m-Farbendruck (ohne Mischfarben) wird man dieBildtiefe n (Anzahl der Bits) so wählen, dass mit m ≤ 2n ein hinreichende Differenzie-rung der Druckfarben gegeben ist.

Abb. 2.5: Einkanalbild mit wenigen Druckfarben (Bild und Belegungsmatrix).

Grauwertbilder haben häufig eine Bildtiefe von 8 Bits (= 1 Byte) oder ein Vielfachesdavon (für spezielle Anwendungen). In 8-Bit-Grauwertbildern sind somit 256 Grau-wertabstufungen zwischen Schwarz (0) und Weiss (255) möglich.

Mehrkanalbilder und Farbbilder

Bei Farbbildern werden die Farbwerte gemäss eines Farbschemas aus Elementarfarbenzusammengesetzt. Im RGB-Schema sind die Grundfarben Rot, Grün und Blau, im häu-fig für den Druck verwendeten CMY(K)-Schema werden Zyan, Magenta und Gelb (evtl.auch noch Schwarz) als Grundfarben eingesetzt. Jede dieser Grundfarben hat eineneigenen Kanal, und jeder dieser Kanäle hat eine bestimmte Tiefe zur Modellierung desentsprechenden Farbanteils. Die Rasterelemente enthalten somit Vektoren von Ganz-zahlen, in denen jeder Tupelwert den Wert des entsprechenden Kanals repräsentiert.Für Farbbilder werden häufig drei Kanäle (RGB oder CMY) angelegt, die jeweils eineFarbtiefe von 8 Bit aufweisen, was insgesamt über 16 Millionen Farben ermöglicht.

Andere Rasterelementbelegungen

Neben ganzen Zahlen oder Vektoren ganzer Zahlen sind auch andere Rasterelementbezogene Informationseinheitenen vorstellbar: So könnten Fliesskommazahlen, kom-plexe Zahlen, thematische Attribute oder gar komplexe Objektstrukturen in ein Raster-element gespeichert werden. Eine solche Rasterbildrepräsentation hat jedoch dengravierenden Nachteil, dass der Speicherplatzbedarf schnell ins Uferlose wächst. Hierfragt sich, ob die Ansiedlung komplexerer Information an jedem einzelnen Rasterele-ment noch gerechtfertigt ist, oder ob die Information sich dann über ausgedehnte

7. vgl. Bartelme (1995) S. 47.

Page 22: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

10 Kapitel 2

Rastersegmente erstrecken soll. Beim Digitalen Höhenmodell (DHM) bedient man sichbeispielsweise einer Repräsentation mit Ganzzahlen, nämlich den Höhenangaben imDezimetern, die einer Rasterzelle zugeordnet werden (sog. Matrixmodell) [(L+T)(2000)]. Denkbar, allerdings in der Praxis nicht üblich, wären auch Fliesskommazahlen,wenn Höhenangaben mit Nachkommastellen zu speichern sind.

Die Gesamtheit der Rasterdatenstrukturdefinition, die durch die Festlegung des Rasterszusammen mit seiner internen Rasterelementadressierung und seiner sich nach aussenhin wendenden (Geo-)Referenz und durch die Beschreibung der Information einesjeden Rasterelementes erfolgt, stellt ein mathematisches Modell der Rasterdaten dar[Haberäcker (1987), Bartelme (1995)]. Bilder lassen sich aber auch in statistischen Model-len beschreiben, wenn die Information eines jeden Rasterelementes als Realisationeneiner diskreten Zufallsvariable aufgefasst wird [Haberäcker (1995), Koch (1994)].

2.2 Erfassung, Verwaltung und Ausgabe von Rasterdaten

Raserdaten haben in der grafischen Datenverarbeitung schon sehr früh eine grosseBedeutung erhalten. Für die verschiedensten Ein- und Ausgabegeräte und den Speicherbietet sich die Struktur des Quadrat- bzw. Rechteckrasters an, um Daten als digitaleDaten zu erfassen, zu verwalten, weiterzuverarbeiten und auszugeben.

Erfassung und Ausgabe von Rasterdaten

Zu den Eingabegeräten mit Rasterstruktur gehört insbesondere der Scanner bzw. Abta-ster, der aus analogen Vorlagen Informationen in Rasterstruktur erfasst und dem Rech-ner zuführt, der diese strukturierte Information in Dateien abspeichert oderweiterverarbeitet. Bei aller Vielfalt hinsichtlich der Bauarten und des Abtastprinzips[vgl. Hake et al. (2002) , Bill (1999a)] ist ein Scanner grundsätzlich ein Gerät, das analoge,kontinuierliche Daten in ein digitales Bildsignal umwandelt, welches in Rasterdaten-form digital repräsentiert wird. Beim Abtasten analoger Dokumente ist die Abtast- bzw.Scannauflösung eine entscheidende Grösse, die den Informationsverlust charakterisiert,der durch die Umwandlung eines Analogsignals in ein diskretes Signal entsteht. DieAuflösung wird meistens in Linien pro Millimeter (L/mm) oder in dots per inch (dpi) ange-geben und bezeichnet die Anzahl der Rasterelemente pro Längeneinheit der analogenVorlage. Übliche Auflösungen sind heutzutage 20L/mm bis 50L/mm oder 300dpi, 600dpibzw. 1200dpi. Andere Eingabegeräte, die aus der digitalen Photogrammetrie und derFernerkundung bekannt sind, sind z.B. der Abtast-Laserscanner und die Digitalkamera(Arraykamera oder CCD-Kamera).

Zu den Ausgabegeräten mit Rasterausgabe gehören Grafikbildschirme, die meistenDrucker (insbesondere der Matrixdrucker) und der Rasterplotter [Hake et al. (2002), Bill(1999a), Göpfert (1991)]. Auch bei diesen Geräten entscheidet die Auflösung und dieErfassungsgenauigkeit (Genauigkeit der Position) über die Güte der ausgegebenenDaten.

Page 23: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Rasterdaten als Träger geometrischer und semantischer Information 11

Verwaltung von Rasterdaten

In der Rasterdatenverwaltung ist die Datenmenge ein limitierender Faktor. Rasterdatenkönnen als Bitmap gespeichert werden, d.h. sequenziell zeilen- bzw. spaltenweisedurch Aneinanderreihen der Rasterelementinhalte. Diese Bitmap-Speicherung ist un-komprimiert und ihr Speicherbedarf setzt sich multiplikativ aus Zeilenanzahl, Spalten-anzahl und dem Speicherplatzbedarf eines einzelnen Rasterelementes zusammen.

Auch wenn heutzutage grosse Speichermengen durch die immer weiter sinkendenPreise für Speicherbausteine kein Problem mehr darstellen, haben Kompressionsverfah-ren für Rasterdaten weiterhin grosse Bedeutung. Eine besonders bekannte Rasterdaten-kompression ist die Lauflängenkodierung (run length coding, RLC)8 oder die in denDateiformaten TIFF (TIFF = tag image file format),9 JPEG/JFIF (JPEG = joint picture expertsgroup)10 bzw. GIF (GIF = graphics interchange format)11 zu Grunde liegenden Kom-pressionen.12 Hierzu gehören auch geometrische Rasterdatenorganisationen wieKacheln bzw. Superpixeln und Quadtrees, bei denen die Speicherplatzbelegungen nichtzeilen- und spaltenweise angeordnet sind [Bernhardsen (1999) S. 72-75, Hake et al. (2002)S. 245].

Für die Kompression und Speicherung von Rasterdaten stehen heute sehr viele Algo-rithmen und Formate zur Verfügung. Dieses hängt mit den jeweiligen Anforderungenzusammen, die an die Verwaltung des Rasterdatenformates gestellt werden. Gefordertwerden im Allgemeinen13

• eine hohe Kompressionsrate mit dem Ziel, den Speicherplatz gering zu halten,

• ein uneingeschränkter Zugriff auf die Information zu jedem Rastererlement,

• im Falle einer Kompression eine verlustfreie und zugleich schnelle und zuverlässigeDekodierung, d.h. der Algorithmus der Kompression muss möglichst einfach undreversibel sein,

• und zusätzlich die Unabhängigkeit des Kompressionsverfahrens vom Betriebssy-stem oder speziellen Hardwarekomponenten.

Diese Anforderungen bedingen einander oder schliessen sich gegenseitig aus. Z.B.ermöglicht die Lauflängenkodierung einerseits eine deutliche Reduktion des Speicher-platzbedarfs, erschwert andererseits den Zugriff auf die Information eines bestimmtenPixels, da zur Ermittlung der Pixelposition die einzelnen Lauflängen erst durchgezähltwerden müssen. Die Wahl eines Rasterdatenverwaltungssystems muss aus diesemGrunde immer eine anwendungsspezifische Entscheidung sein.

8. vgl. Bill (1999a) S. 322f., Haberäcker (1987) S. 61-64, Haberäcker (1995) S. 263-271, Göpfert (1991) S. 20.9. vgl. Born (1997) S. 1119-1165.10. ebd. S. 1002-1015.11. ebd. S. 901-924.12. Bei den genannten Dateiformaten muss beachtet werden, dass zum Teil Informationsverluste bei der

Kompression auftreten, die nicht mehr rückgängig gemacht werden können.13. nach Giger (2001).

Page 24: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

12 Kapitel 2

2.3 Eigenschaften und Merkmale von Rasterdaten

Bei der Rasterdatenverarbeitung ist es unerlässlich, sich gewisse wichtige Eigenschaftenvon Rasterdaten zu vergegenwärtigen. Aus der Kenntnis dieser Eigenschaften undMerkmale ergeben sich notwendige Konsequenzen für die Rasterdateninterpretationund Rasterdatenmanipulation. Die wichtigsten Eigenschaften und Merkmale sind:

Atomarität des Rasterelementes

Rasterdaten haben Atome, d.h. geometrisch nicht weiter zerteilbare Einheiten, nämlichdie Rasterelemente. Diese Einheiten sind der begrenzende Faktor für die Auflösungund damit auch für die geometrisch-topologischen Beziehungen. Subpixelinformationkann nur durch Interpolation erzeugt werden. Der Interpolation liegt jedoch immer einModell des Bildes bzw. des Objektes zu Grunde [Graeff (2000a) S. 10], wodurch von aus-sen zusätzliche Information herangetragen wird. Ohne zusätzliches Bildmodell lässtsich der Informationsgehalt eines Rasterbildes nicht erhöhen.

Homogenität im Rasterschema

Rasterdaten zeichnen sich durch ein hohes Mass an Homogenität aus: Jedes Rasterele-ment ist gleichwertig und trägt – zumindest von der Struktur her – die gleiche Mengean Information. Im Gegensatz zur Vektorgrafik kann es bei Rasterdaten keine lokaleInformationshäufung geben. Weite zusammenhängende Gebiete mit einheitlicherInformation (bzw. geringer Informationsvariation) wie z.B. ausgedehnte Wald- undSeeflächen auf Rasterkarten werden bezüglich der Informationsspeicherung genausobehandelt wie dicht besiedelte Siedlungsflächen mit grosser lokaler geometrischer undthematischer Variation. Durch die Homogenitätseigenschaft der Rasterdaten werdenvom Informationsgehalt „unwichtige“, d.h. kaum variierende Bildregionen genaugleich gewichtet wie Bildregionen hoher Informationsvariation.

Strukturgebundenheit der Rasterdaten

Rasterdaten sind durch ihr strukturgebendes Element (d.h. durch das Raster) gebun-den. Dieses gilt bezüglich allen affinen Transformationen auf das Rasterbild, d.h.bezüglich der Translation, der Rotation, und der Skalierung des Bildes. Da die Informa-tion bezüglich der Pixelstruktur atomarisiert sind, können die meisten Affintransforma-tionen von Rasterbildern nur mit geeigneten Bildmodellen arbeiten, mit denen diediskrete Rasterstruktur ins Kontinuum ausgeweitet werden kann. Denn durch eine all-gemeine Affintransformation wird einerseits lokal Information verdichtet odergespreizt (dieses gilt für alle Skalierungen) oder so umgeordnet, dass sie zwischen denPixelstellen des Rastergitters angeordnet wird (dieses gilt für alle Translationen miteiner Verschiebung, die in Pixeleinheiten nicht ganzzahlig ist, und für Rotationen ver-schieden von Vielfachen von 90°). Information, die in einer diskreten Rasterstrukturangeordnet ist, lässt sich nicht durch eine stetige Veränderung affiner Abbildungspara-meter transformieren. Das drückt die Strukturgebundenheit aus.

Page 25: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Rasterdaten als Träger geometrischer und semantischer Information 13

Abb. 2.6: Strukturgebundenheit der Rasterinformation: (a) Zwei bis auf die Orientierung identischeLinien sind in der Rasterstruktur strukturell unterschiedlich abgebildet (unterschiedlichegeometrisch-topologische Beziehungen im Detail); (b) der mit Rasterelementen dargestellteKreis ist auf Grund der Rasterstruktur nicht mehr rotationssymmetrisch.

Besonders deutlich wird dieser Zusammenhang in den sogenannten Rasterungseffektenbzw. Diskretisierungseffekten [Zamperoni (1989) S. 8, vgl. auch Abb. 2.7]. Eine analogeVorlage wird unterschiedlich in eine digitale Rasterstruktur überführt, je nachdem wiedas strukturgebende, diskretisierende Raster translatorisch und rotatorisch über dieVorlage gelegt wird. Ebenso spielen Auflösung und Rasterform eine wesentliche Rollefür die erhaltene Information.

Abb. 2.7: Rasterungseffekte: Bei der Digitalisierung verschieden erhaltene Rasterbilder, wobei dasRastergitter zwischen den Bildern nur im Subpixelbereich translatorisch verschoben wurde.

(a) (b)

Page 26: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

14 Kapitel 2

Die Referenzierung des Rasters in Translation, Rasterweite und Orientierung undRasterform determiniert beim Digitalisieren die Information.

Geometrie- und Topologieschwäche

Unabhängig davon, ob Rasterdaten aus einer Rasterung entstanden sind oder ob ihreInformation auf andere Weise erhalten wurde, ist durch die Struktur des Rasters immereine spezielle topologische und geometrische Zuordnung erfolgt. Bei einem Quadratra-ster z.B. wird die Information so angeordnet, das ein Rasterelement mit vier Anderendurch eine Kante benachbart ist (also Informationsnachbarschaft entlang eines Linien-stücks) und mit vier Weiteren eine gemeinsame Ecke teilt (Informationsnachbarschaftüber einen Punkt). In unmittelbarer Pixelumgebung gibt es also nur acht geometrisch-topologische Beziehungsmöglichkeiten.

Hieraus ergeben sich in der sogenannten N8-Umgebung vier Kantennachbarschaften,acht Punktnachbarschaften und acht rasterstrukturabhängige Elementarrichtungen(alle 45°). Bei der N4-Umgebung können nur vier Elementarrichtungen unterschiedenwerden (Abb. 2.8). Kantennachbarschaften bestehen, wenn die Adressierung der beidenPixel in einer Richtung identisch, und in der anderen nur um einen Zähler verschiedenist. Überecknachbarschaften sind hingegen anzutreffen, wenn die Indexierung sowohlin Spalten und Zeilenrichtung um einen Zähler differiert.

Abb. 2.8: Topologische Beziehungen im Quadratraster: N4- und N8-Nachbarschaft

Weiter gehende topologische und geometrische Beziehungen zwischen Rasterelemen-ten sind nur durch sequenzielles Aneinanderreihen dieser elementaren Beziehungenmöglich. Zwar wird hierdurch die geometrische und topologische Variation erhöht (fei-nere Richtungsauflösung, je weiter die betrachteten Pixel voneinander entfernt liegen),doch besteht jede topologisch-geometrische Beziehung aus einer Sequenz von Elemen-tarbeziehungen aus dem N4- bzw. N8-Schema.

Fehlende logische Verbindung zwischen den Rasterelementen

Die Rasterelemente stehen – abgesehen von den schwachen topologischen und geome-trischen Beziehungen mit ihrer Information isoliert im Rasterverband. Es gibt keine ver-knüpfende Information, die es zum Beispiel erlaubt, zusammenhängende Rasterver-bände unmittelbar als ein einheitliches Objekt zu betrachten. Aus diesem Grunde

Page 27: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Rasterdaten als Träger geometrischer und semantischer Information 15

wurde die Rastergrafik auch schon als „unintelligente Grafik“ [Zitat Bill und Fritsch(1994) S. 29] oder „dumme Grafik“ [Zitat Bill (1999a) S. 25] bezeichnet.14

Der fehlende Objektbezug muss erst durch aufwändige Verfahren der Klassifikationund Segmentierung geschaffen werden, bei welchen die Information der Rasterele-mente sukzessiv durch sequenzielles Ausführen der topologisch-geometrischen Bezie-hungen im N4- oder N8-Schema verglichen wird. Gleiche oder ähnliche Information inden Rasterelementen werden im Rahmen der Klassifikation als zu einem Objekt gehö-rig, verschiedenartige Information als zu separaten Objekten gehörig betrachtet.

Der fehlende logische Bezug zeigt sich auch darin, dass es per se keine „Zusammen-schau“ der Information im Rasterverbund gibt, der aber für eine schnelle Objektreko-gnition unerlässlich ist.

Abb. 2.9: Unterschiedliche Rastergrafik-„Wahrnehmung“ bei Mensch und Computer: (a) Rastergrafik inder „Zusammenschau“, (b) „gespreizte“ Rastergrafik, (c) und (d) gleiche Rasterelementadres-sierung, jedoch unterschiedliche geometrische Anordnung auf dem Speicher.

Besonders deutlich wird dieser Aspekt beim Vergleich der menschlich-visuellen Wahr-nehmung von Rastergrafik und der „Wahrnehmung“ durch den Computer: Währendder Mensch durchaus die Fähigkeit besitzt, Rasterdaten in einer „Zusammenschau“ zubetrachten, so zur einer übergreifenden geometrischen und topologischen Wahrneh-mung15 gelangt, und zu einer weitreichenden Objekterkennung fähig ist, werden beider digitalen Rastergrafikinterpretation die Rasterelemente grundsätzlich isoliertbetrachtet. Dieser Umstand lässt sich in folgender Weise schematisch umschreiben:Würden die Rasterelemente in der Rastergrafik auseinander gezogen, so wird mitzunehmender Spreizung die anthropogene Objektwahrnehmung erschwert, weil dietopologische und geometrische Ergänzungsleistung des Gehirns auf Grund der fehlen-

14. Zum Thema „Hinzufügen von Intelligenz“ zu Rasterkarten vgl. Armenakis et al. (1999).

(a) (b) (c) (d)

15. Diese Wahrnehmung lässt sich im Übrigen nur ein wenig durch die Geometrie- und Topologieschwä-che im Detail stören (z.B. dass Kreise nicht ganz rund sind, und gerade Linien gezackte Darstellung auf-weisen).

Page 28: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

16 Kapitel 2

den Zusammenschau nicht mehr möglich ist (Abb. 2.9 (a, b, c)). In der digitalen Bildver-arbeitung werden die Rasterelemente hingegen durch ihre Adressen einzelnangesprochen, die Rasterelemente müssen und werden im Allgemeinen nicht geome-trisch auf dem Speicher angeordnet (Abb. 2.9 (c, d)).

Rasterung bzw. Digitalisierung analoger Vorlagen zerstört also den Objektbezug. AnStelle von Punkten treten singuläre Rasterelemente, an Stelle von Linien treten Rasterele-mentketten und an Stelle von Flächen treten Rasterelementsverbände auf, in denen dieRasterelemente jeweils gleiche Information tragen, allerdings ohne Bezug untereinan-der (Abb. 2.10).

Abb. 2.10: Überführung von (a) analogen Punkten, (b) Linien und (c) Flächen in eine Rasterdatendarstel-lung. Die Rasterelemente tragen anschliessend in allen Fällen nur radiometrische Informa-tion (d.h. Farbinformation weiss oder schwarz), aber keine Objekt(bezugs)information.

Aus den genannten Eigenschaften und Merkmalen der Rasterdaten in Bezug auf ihredigitale Verarbeitung und Interpretation ergibt sich, dass Rasterdaten als Träger bildli-cher Information Vorteile bezüglich der Verwaltung und Speicherung aufweisen,jedoch geometrische und topologische Zusammenhänge, die sich über ausgedehntereBereiche des Bildes erstrecken, nur implizit repräsentieren. Implizite Repräsentationbedeutet, dass zwar die Anordnung der Information in einem homogenen und inRasterelementen atomarisierten, strukturierten Rastertableau Objekte mit topologi-schen und geometrischen Eigenschaften darstellen kann, diese aber nur durch sukzessi-ves Verketten der strukturell bedingt schwachen geometrischen und topologischenBeziehungen in der Detailstruktur logisch erschlossen und als solche interpretiert wer-den können. Geometrie und Topologie müssen also noch aus der Informationsanord-nung beschafft werden, sie sind nicht explizit abrufbar oder als explizite Informationabgespeichert. Verfahren in der automatischen Bildinterpretation und des Bildverste-hens müssen diesem Umstand besonders Rechnung tragen, wenn sie erfolgreich seinwollen.

(a) (b) (c)

Page 29: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Kapitel 3

Methoden der Bilddatenverarbeitung

Mit dem Aufkommen von Rechnern und Rechnersystemen für die elektronische Daten-verarbeitung haben sich auch Möglichkeiten zur digitalen Verwaltung und Verarbei-tung von Bilddaten eröffnet. Die Repräsentation von Bildern aller Art in Form vonRasterdaten (vgl. Kapitel 2) stellt die Grundlage für eine digitale Speicherung und Ver-arbeitung des Bildmaterials dar.

Unter Bilddatenverarbeitung (auch schlicht: Bildverarbeitung) versteht man die Wissen-schaft der Methoden, digital repräsentierte Bilddaten zu manipulieren und zu interpretie-ren. Bilddatenverwaltung und -verarbeitung bedingen sich dabei gegenseitig, da dieMethoden der Bildverarbeitung auf die jeweilige digitale Repräsentation von Bilddatenzurückgreifen. Umgekehrt kann aber auch die Verwaltung von Bilddaten in einem ein-geschränkten Masse den Bedürfnissen der Bildverarbeitung angepasst werden.

Heutzutage ist die Bildverarbeitung ein fundamentaler Bestandteil der Datenverarbei-tung geworden. Dieses zeigt sich in der Vielfalt von Grafikprogrammen, die bereits zurStandardausstattung von Personalcomputern gehören. Auch preiswerte oder als Share-ware abgegebene Grafikprogramme verfügen über einen reichhaltigen Fundus an Bild-verarbeitungsfunktionen. Die Bedürfnisse sind in der Praxis sehr gross: Die Möglich-keit, Bilder durch einfache Operationen zu verbessern, zu transformieren, zuzuschnei-den usw. wird für viele Aufgabenfelder geschätzt und eingesetzt.

Im nächsten Abschnitt wird versucht, die fast unüberschaubar vielfältigen Methodender Bilddatenverarbeitung zu systematisieren und einzuordnen. Gemäss der dort ge-machten Systematik beschreiben die weiteren Abschnitte dieses Kapitels die wichtig-sten Merkmale der jeweiligen Methodengruppen und zeigen Beispiele auf. BesonderesAugenmerk wird auf die komplexeren Methoden der Bildverarbeitung gelegt, die sichmit der Interpretation von Bildern und Rasterdaten bis hin zur Simulation des mensch-lichen Sehens befassen: die Methoden der Mustererkennung.

Page 30: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

18 Kapitel 3

3.1 Überblick und Systematik der Methoden

Die Disziplin der Bilddatenverarbeitung lässt sich nach ihrem Zweck in zwei grosseTeilbereiche gliedern. Einerseits handelt es sich um Methoden, mit denen direkt insBildmaterial eingegriffen werden kann, ohne jedoch dem Bild Information abzugewin-nen. Das Bild wird durch diese Methoden bewusst verändert, und wir sprechen hierbeivon Bildmanipulation.

Der andere Teilbereich betrifft die Bildinterpretation, bei der die Bilddaten nicht verän-dert werden, sondern aus dem Bild strukturierte Information gewonnen werden.

Bildmanipulation und –interpretation schliessen sich nicht gegenseitig aus. Vielmehrgreift die Bildinterpretation sehr oft auf Methoden der Bildmanipulation zurück, umetwa aus manipuliertem Bildmaterial Information zu extrahieren. Auch die Umkehrungist denkbar: Auf eine Bildinterpretation kann gezielt eine Manipulation folgen (z.B. dasAusschneiden von als störend interpretierten Objekten aus einem Bild).

3.1.1 Bildmanipulation

Bildmanipulation bedeutet – schematisch betrachtet – die Transformation eines Einga-bebildes mit Hilfe eines Manipulators oder auch einfach Bildoperators in ein Ausgabebild.Streng genommen ist dieses Ausgabe- bzw. Ergebnisbild das einzige Produkt der Bild-manipulation. Information über das Bild bzw. Information, die sich aus dem Manipula-tionsprozess ergeben könnte, gehört nicht zum Ergebnis der Manipulation, sondern istBestandteil der Interpretation.

Die Anwendungen der Bildmanipulation reichen von Bildverbesserung (Kontrast, Hel-ligkeit, Schärfe, Rauschunterdrückung etc.), Retuschierung bis hin zu bewussten Bild-veränderungen. Zu Letzteren können auch bewusste Qualitätsminderungen gehören,wie z.B. das künstliche Verrauschen oder die Verminderung des Kontrasts.

Bei allen genannten Anwendungen kommt es auf den Einsatz geeigneter Bildoperato-ren an. Diese lassen sich in der gängigen Literatur zur Bildverarbeitung in mehrereGruppen gliedern [Castleman (1979), Zamperoni (1989), Haberäcker (1995)].

Punktoperatoren

Punktoperatoren sind Bildmanipulatoren, bei denen das Ergebnisbild pixelweise ausdem Ursprungsbild berechnet werden kann. Nachbarschaftliche Beziehungen zwischenden Pixeln werden hierbei nicht berücksichtigt.

Beispiele von Punktoperatoren sind Schwellwertbildung bzw. Binarisierung, Kontrast-und Helligkeitsveränderungen (oder allgemeiner sog. Grauwertkennlinientransforma-tionen), die Hintergrundkompensation, Farbwertmanipulationen und Farbtiefenreduk-tion [Zamperoni (1989) S. 30-44, Haberäcker (1995) S. 19-45, Förstner (1998)].

Page 31: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Methoden der Bilddatenverarbeitung 19

Abb. 3.1: Schema des Punktoperators.

Lokale Bildoperatoren

Unter lokalen Bildoperatoren versteht man Operatoren, die eine Bildstelle des Ergebnis-bildes aus einer lokalen Umgebung der Bildstelle des Ursprungsbildes errechnen.Durch den Einbezug der lokalen Umgebung werden in einem beschränktem Umfangnachbarschaftliche Beziehungen zwischen den Pixeln ausgenutzt.

Abb. 3.2: Schema des lokalen Bildoperators.

Zu den lokalen Bildoperatoren gehören Glättungs- und Rauschunterdrückungsopera-toren, Operatoren zur Bildverschärfung und Kantenverstärkung (allgemein: Hoch- undTiefpassfilter), sowie andere lokal begrenzte Filter, im begrenzten Umfang auch morfo-logische16 Grundoperatoren wie Dilatation und Erosion [Zamperoni (1989) S. 45-79,Haberäcker (1995) S. 80-92]. Bei lokalen Bildoperatoren ist sorgfältig zu unterscheiden, obdie berechneten Pixel des Ergebnisbildes direkt ins Ursprungsbild geschrieben werdenoder in einem neuen Bild abgespeichert werden. Werden die Ergebnisse direkt insUrsprungsbild geschrieben, so ist zu beachten, dass sich die lokalen Umgebungenanderer Pixel dadurch verändert haben. In diesem Falle ist die Anwendung lokalerOperatoren abhängig von der Reihenfolge der pixelweisen Berechnungen.

16. von griech. µορϕος = Gestalt.

Page 32: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

20 Kapitel 3

Als ein charakteristisches Merkmal lokaler Bildoperatoren kann festgehalten werden,dass die Berechnung des Ergebnispixels sich aus der Faltung eines begrenzt dimensio-nierten „Fensters“ des Ursprungsbildes mit einem gleichdimensionierten Faltungskern(Filter) ergibt (siehe Abb. 3.3).

Abb. 3.3: Faltung mit 3x3-Fenstern beim arithmetischen Mittel (lokaler Bildoperator).

Faltungen gehören zu den zweidimensionalen digitalen Filtern.17 Eine Filterung kannsowohl im Ortsbereich erfolgen (das entspricht den Faltungen) wie auch im Frequenz-bereich, wenn das Bild einer Spektralanalyse unterzogen worden ist [Kraus (1990) S.507].18 Bekannte Filter sind der Medianoperator und das gleitende Mittel (beide sind Tief-passfilter zur Rauschunterdrückung) sowie der Sobel- und der Laplace-Operator (Hoch-passfilter zur Kantenverstärkung).19

Iterativ lokale Bildoperatoren20

Werden lokale Operatoren miteinander kombiniert, in dem sie hintereinander auf demEingangsbild eingesetzt werden, können eine Reihe von Bildmanipulationen vorge-

17. Weiter führende Grundlagen und allgemeine Definitionen zu zweidimensionalen digitalen Filternbefinden sich in Koch (1994).

18. Siehe auch Haberäcker (1995) S. 81f.19. Formeln zu den genannten Filtern befinden sich z.B. in Kraus (1990) S. 507-513, Koch (1994) S. 143-148,

Zamperoni (1989) S. 62-67.69.91, Förstner (1998).20. Die hier vorgenommene gesonderte Betrachtung iterativ lokaler Bildoperatoren ergibt sich aus den

Schwierigkeiten, die eine negative Definition gemäss Zamperoni (1989) S. 118f. der globalen Operatorenals nicht-lokale bzw. nicht-punktuelle Operatoren mit sich bringt. Die globalen Operatoren von Zampe-roni (1989) entsprechen iterativ-lokalen und globalen Operatoren der obigen Definition.

Page 33: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Methoden der Bilddatenverarbeitung 21

nommen werden, die sich nicht durch eine einmalige Anwendung eines lokalen Opera-tors erzielen lassen.

Skelettierung, Distanztransformationen, aber auch das Regionenwachstum sind Bei-spiele solcher iterativ lokaler Bildoperationen, bei denen sich Bildmanipulationen suk-zessive durch mehrfaches Anwenden lokaler Operatoren ergeben. Im Gegensatz zu dennachfolgend definierten globalen Operatoren verbleibt die Berechnung auch bei der ite-rativen Anwendung der lokalen Operatoren in einem lokal abgegrenzten Bereich.

Globale Bildoperatoren21

Als globale Bildoperatoren sind der Systematik zufolge jene Bildoperatoren zu betrach-ten, bei denen die zur Berechnung eines Ergebnispixel herangezogenen umgebendenPixel die Dimension lokaler Umgebungen deutlich übersteigt.

Abb. 3.4: Schema des globalen Operators.

Operatoren, die zur Berechnung eines Pixels im Ergebnisbild sämtliche, oder nahezusämtliche Pixel benötigen, erfordern hohe Rechenzeiten pro Ergebnispixel. Die Berech-nung von Fourier-Spektren aus Bildern, wie auch gewisse Kompressionsverfahren arbeitenals globale Operatoren. Häufig findet sich auch der Fall, bei dem aus sämtlichen Pixelneinmalig ein Zwischenergebnis berechnet wird (z.B. ein Histogramm, ein mittlererGrauwert o.Ä.), das anschliessend in einem punktoperationellen oder lokal-operatio-nellen Einsatz für jedes Ergebnispixel Berücksichtigung findet (z.B. Bildverbesserungan Hand einer optimalen Grauwertkennlinie, zu der vorgängig das Bildhistogrammbekannt sein muss).

Geometrische Operatoren

Bei geometrischen Bildoperatoren ändert sich die Anordnung der im Bild enthaltenenObjekte zueinander [Castleman (1979) S. 110]. Hierzu gehören Affintransformationen, mitdenen das Bild beliebig gedreht, gestaucht, verschoben, gestreckt, verzerrt werden

21. Der Begriff „globale Operatoren“ weicht von der „negativen“ Definition in Zamperoni (1989) S. 118f. ab.Hier folgen wir einer eigenen positiven Definition, bei denen der globale Aspekt im Mittelpunkt steht(vgl. auch vorhergehende Fussnote).

Page 34: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

22 Kapitel 3

kann. Auch nicht-affine Verzerrungen, bei denen der Bildinhalt anders räumlich ange-ordnet wird, gehören zu den geometrischen Operationen. Für ein einzelnes Pixel desErgebnisbildes werden i.A. Informationen, die sich im Ursprungsbild an ganz andererStelle befinden, herangezogen.

Abb. 3.5: Schema des geometrischen Operators (bezogen auf ein Pixel).

Mehrbildoperatoren

Liegen mehrere Bilder zu Grunde, so sind Mehrbildoperatoren in der Weise denkbar,dass Bilder mittels algebraischer Operationen miteinander verknüpft und das Resultatin einem gemeinsamen Ergebnisbild abgespeichert wird. Die pixelweise Addition, diepixelweise Subtraktion, die pixelweise Multiplikation und die pixelweise Divisionzweier Bilder gehören zu dieser Gruppe. Auch algebraische Operationen, bei denenmehr als zwei Bilder beteiligt sind, können Grundlage für einen Merhbildoperator sein.

Abb. 3.6: Schema des Menrbildoperators.

Mehrbildoperationen ermöglichen es, die Information verschiedener Bilder in einemBild zu vereinigen oder zu verschneiden [Castleman (1979) S. 96f.]. Die Überlagerungeines Rasterbildes mit einem Bild, das die Ergebnisse einer Interpretation festhält(beschreibender Text, Konturen von Flächen, markierte Punkte etc.), ist eine Mehrbild-operation, die häufig in der Visualisierung zum Einsatz kommt.

Page 35: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Methoden der Bilddatenverarbeitung 23

3.1.2 Bildinterpretation

Während bei der Bildmanipulation das Ergebnis in einem neuen, veränderten Bilderhalten wird, ist Bildinterpretation die Gewinnung von Information aus Bildern. Die Infor-mation ist dabei primär explizit zu gewinnen, d.h. das Bild oder Teile davon werden mitsemantischen Inhalten (d.h. Bedeutungen) verknüpft.

Der Bildinterpretation kommt die schwierige Aufgabe zu, die in den Rasterelementenabgelegten und über die Bildfläche gerastert angeordneten, homogenisierten und ato-marisierten Informationsbestandteile durch Ausnützung der nur schwach vorhandengeometrischen und topologischen Beziehungen so umzuordnen und zu transformieren,dass logisch sinnvoll (statt in der Rasterstruktur räumlich sinnvoll) abgegrenzte, d.h.explizite Information entsteht. Es geht beispielsweise darum, dass aus der Anordnungder Pixel in Abb. 2.6(b), die je für sich nur eine Farbinformation tragen, eine geometri-sche Figur (hier der Kreis) erschlossen werden kann.

Interpretation von Rasterdaten bedeutet zum Einen die Überwindung der Rasterstrukturund zum Anderen die Erschliessung der Semantik der in den Rasterdaten abgespeicher-ten Information.

Bildinterpretationsverfahren lassen sich einteilen nach dem Grad der Interpretation. Beieinfachen bzw. niederen Bildinterpretationsverfahren werden die topologischen undgeometrischen Beziehungen nur im kleinräumigen Bereich ausgenutzt. Hierzu gehörendie Linien- und Kantenextraktion als Bestandteil der Raster-Vektor-Konvertierung, Ske-lettierung und einfache Segmentierungen mittels lokaler oder iterativ-lokaler Bildmani-pulationsoperatoren. Die erhaltene explizite Information besteht aus geometrischenPrimitiven wie Linienelementen, Flächenbereichen und Einzelpunkten.

Den mittleren Bereich nehmen die Methoden der technischen Mustererkennung ein, beidem die Interpretation schon tiefer in den semantischen Raum eindringt, aber immernoch eine gewisse Nähe zur Rasterstruktur des Bildes besteht. Durch Mustererkennungkann komplexere Information aus dem Bild entnommen werden (wie etwa die Buchsta-ben- und Symbolwiedererkennung durch Template Matching), die Interpretationbeschränkt sich auf die Detektion von bekannten Mustern (daher der Name „Musterer-kennung“),22 und die Analyse von Texturen und Klassifikationen nach einfach ableitba-ren Merkmalen. In diesen Bereich gehört auch die Weiterinterpretation vonvektorisierten Daten, etwa die Zusammensetzung von geometrischen Primitiven zukomplexeren Gebilden mit eigenständiger Semantik.

Höhere Mustererkennung, die der Computer Vision vorbehalten ist, versucht densemantischen Gehalt eines Bildes gänzlich auszuschöpfen, das Bild vollständig nachder Semantik zu strukturieren, oder schlicht zu verstehen. Hierzu gehören professionelleBildanalyse- und –syntheseverfahren, z.B. Verfahren, die dreidimensionales Verstehenermöglichen, Überlappungen von Gegenstandsobjekten im Bild aufdecken und seman-tisch logisch zuordnen können oder auch Beleuchtungsmodelle implementieren.

22. vgl. die Definitionen von Mustererkennung in Kapitel 3.2 (s.u.).

Page 36: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

24 Kapitel 3

Abb. 3.7: Einteilung von ausgewählten Bildinterpretationsverfahren nach dem Grad der Interpretation.

Mittlere und höhere Bildinterpretation basiert meistens auf Vorarbeiten der jeweils ein-facheren Interpretationsstufen und interpretiert die gewonnene Information zu höherenBedeutungskomplexen weiter.

Einen Sonderfall in der Bildinterpretation stellt die Visualisierung von Bilddaten und dieAusgabe von Bilddaten in Dateien, auf Plottern oder anderen Medien dar. Hier kann manebenso von „Interpretation“ sprechen, da kein Eingriff ins Bildmaterial erfolgt. DieseInterpretation leitet aus den Bilddaten ein Signal ab (lesender Zugriff), das an unter-schiedliche Ausgabekanäle weitergegeben werden kann.

3.1.3 Kombination von Bildmanipulation und -interpretation

Bildmanipulation und Bildinterpretation werden in der Regel miteinander kombinierteingesetzt. Einerseits ermöglicht die Interpretation vorgängig manipulierter Bildergenauere Interpretationsergebnisse. Ein Beispiel dazu ist die Kantenextraktion nachvorgängiger Bildmanipulation mit Sobel-Operatoren. Andererseits können aber auchInterpretationsergebnisse durch Überschreiben des Bildes oder Umfärben entsprechen-der Bildbereiche im Bild dargestellt werden (Visualisierung der Interpretationsergeb-nisse).

3.2 Mustererkennung

Die Mustererkennung umfasst i.o. Systematik eine Reihe von Bildinterpretationsverfah-ren mittlerer und höherer Stufe. Nach Illert (1990) besteht die „Aufgabe der Mustererken-nung [...] im weitesten Sinn in der Simulation der perzeptiven Leistungen von Lebewesen durch

Page 37: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Methoden der Bilddatenverarbeitung 25

Maschinen. Ziel der Aktivitäten ist dabei weniger die Suche nach Erkenntnissen über dieMechanismen der Sinneswahrnehmung bei den Lebewesen selbst als vielmehr die technischeRealisierung solcher Vorgänge mit Hilfe moderner Rechenanlagen. Dabei wird es nicht als not-wendig erachtet, die organischen Prozesse bis ins Detail zu kopieren – lediglich das Resultat istvon Bedeutung“ [zitiert aus ebd. S. 21].

Neben dem Aspekt der Realisierbarkeit durch Rechenanlagen, zu denen auch preis-werte Anlagen und nur zwingend neuronale Netze und Hochleistungs-Simulationsre-chenanlagen gehören, tritt als inhaltlicher Aspekt die Auswertung von Mustern: „DieMustererkennung beschäftigt sich mit den mathematisch-technischen Aspekten der automati-schen Verarbeitung und Auswertung von Mustern. Dazu gehört sowohl die Klassifikation einfa-cher Muster als auch die Analyse komplexer Muster“ [rezitiert aus Lin (1994) S. 5].

Anders ausgedrückt geht es bei der Mustererkennung „darum, ein im Voraus definiertesMuster (entweder ein Musterbild oder eine semantische Definition) in einem Bild zu erkennen,das heisst zu finden und zu interpretieren. Die Mustererkennung transformiert demnach einenBildinhalt – evtl. unter Zuhilfenahme von Zusatzinformation -, in einen semantisch festgelegtenBedeutungsinhalt“ [zitiert aus Kraus (1990) S. 564].

In der Praxis werden Mustererkennungsverfahren vielfältig eingesetzt. Sie reichen vommaschinellen Lesen von Formularen und ganzen Textdokumenten über Fahrzeugnavi-gation (Detektion der Fahrbahnbegrenzungen auf dem Bild, automatisches Lesen vonBeschilderung und Signalisation), Fertigungskontrolle (Produktkontrolle mittels opti-scher Verfahren) bis hin zu Digitalisierungsaufgaben beim Aufbau von Geo-Informati-onssystemen (Interpretation rasterbasierter Karten, Pläne, Luftbilder etc.). BesonderesMerkmal der eingesetzten technischen Mustererkennungsverfahren ist, dass sie pro-blemspezifisch implementiert worden sind. Ein Belegleser bei Banken und Poststellenist auf bestimmte Formulare und Schriftarten zugeschnitten, und kann nicht gleichzei-tig Luftbilder interpretieren. Ebenso wird ein Zielzeichen suchender und einmessenderautomatischer Theodolit nicht fähig sein, Verkehrsschilder im Sichtfeld zu detektierenund interpretieren. In genau diesem Aspekt unterscheiden sich technische Musterer-kennungsverfahren von denen der Computer Vision, bei denen eine höhere Universali-tät im Einsatz angestrebt wird [Humphreys and Bruce (1989), Scholz (1998)].

Mustererkennungsverfahren lassen sich in mehrere Gruppen einteilen (Einteilung nachIllert (1990) bzw. Brügelmann (1998)): Numerisch-statistische Verfahren, zu denen vorallem die Klassifikation gehört, strukturelle Verfahren, bei denen Muster als Strukturenaufgefasst werden und wissensbasierte Verfahren, die sich durch den gezielten Einsatzvon Wissen auszeichnen.

3.2.1 Numerisch-statistische Verfahren

Zu den numerischen Verfahren gehören die Merkmalsextraktion und die Klassifika-tion. Da die Klassifikation häufig auf statistische Methoden zurückgreift [Ballard andBrown (1982)], spricht man auch von numerisch-statistischen Verfahren.

Page 38: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

26 Kapitel 3

Merkmalsextraktion

Die Merkmalsextraktion dient zur Berechnung charakteristischer Merkmale von Bild-objekten und -segmenten. Sie bereitet damit die Klassifikation vor, die die Objektmerk-male z.B. mittels statistischer Methoden auswertet. Merkmalsextraktion ist meistensnumerisch, da die Merkmale in Form von Zahlen bereitgestellt werden. Nach Weber(1988) werden folgende Merkmalsgruppen unterschieden:

Radiometrische Merkmale: Sie werden aus den Farbwerten der Pixel errechnet, z.B.Median und Farbwertvarianz.

Topologische Merkmale: Sie beschreiben Objekteigenschaften, die unter stetigen Defor-mationen invariant bleiben, z.B. Komponentenanzahl, Lochanzahl, Anzahl der Skelett-oder Konturknoten.

Geometrische Merkmale: Sie bestimmen Form und Grösse eines Objekts. Hierunter fal-len Fläche, Umfang, Formfaktoren, Schwerpunkte der Objekte, etc.

Abb. 3.8: Klassifikation unterschiedlicher Objekte nach zwei Merkmalen: (a) Rasterbildvorlage, (b)Merkmalsraum, (c) und (d) Abgrenzungen von Klassen im Merkmalsraum.

(a) (b)

(c) (d)

Page 39: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Methoden der Bilddatenverarbeitung 27

Klassifikation

Nach der Berechnung von charakteristischen Merkmalen für Rastersegmente und –ob-jekte kann klassifiziert werden. Dabei geht es um die Zuordnung bestimmter Merk-malskombinationen zu semantischen Inhalten. Berechnete Merkmale werden in einemsog. Merkmalsvektor zusammengefasst. Seine Dimension entspricht der Anzahl derMerkmale. Alle denkbaren Merkmalskombinationen spannen den Merkmalsraum auf.Sind die Merkmale signifikant und selektiv, können problemlos Teilräume im Merk-malsraum abgegrenzt werden, die charakteristisch für bestimmte Objekte bzw. Objekt-typen unterschiedlicher Bedeutung sind.

In der Bildvorlage von Abb. 3.8(a) kommen unterschiedliche Objekte vor. Zu ihnenwerden jeweils der Umfang und die Fläche errechnet. Trägt man diese Ergebnisse gra-fisch in ein Diagramm auf (Abb. 3.8(b)), bilden sich signifikante Bereiche für die einzel-nen Objekte. Sie können als Klassen voneinander abgegrenzt werden (Abb. 3.8(c) und(d)) und bilden Grundlage für die Einordnung neuer, unbekannter Objekte [Zamperoni(1989) S. 81f.]. Die Abgrenzung der einzelnen Klassen kann nach unterschiedlichenAnsätzen erfolgen. Häufig werden probabilistische und statistische Ansätze ange-wandt, bei denen die Zugehörigkeit einer Merkmalskombination zu einem Merkmals-raum durch Schätzung ermittelt wird.23

3.2.2 Strukturelle Verfahren

Strukturelle Verfahren beinhalten die Analyse und Synthese von Bildobjekten. Ziel ist es,Bildobjekte in ihre Bestandteile, d.h. in geometrische Primitive wie Linienelemente,Bogenelemente etc. zu zerlegen (Analyse), und aus der Anordnung der Bestandteile dieZuordnung zu einer Objektbedeutung zu erschliessen (Synthese). Nach Illert (1990) wer-den strukturelle Verfahren in syntaktische Verfahren einerseits, bei denen die Zusam-mensetzung der geometrischen Primitiven grammatikalisch-syntaktischen Regelnerfolgt, und andererseits in kontextabhängige Verfahren unterschieden. Ein Wörter-buch, das sämtliche erlaubte Zusammensetzungen einzelner Buchstaben beinhaltet, istein Hilfsmittel der kontextabhängigen Verfahren, mit dem die Mustererkennungbeschleunigt werden kann.

Syntaktische Verfahren werden heutzutage für die Rekognition von logischer Informa-tion mit einem komplexen syntaktischen Aufbau bevorzugt, so z.B. bei Dori (1999) fürdie generelle Grafikerkennung oder bei Lopez and Piñaga (2000) für die syntaktischeMustererkennung. Bezogen auf die Textdokumentenanalyse, bei der es insbesondereum die Erkennung generalisierter Fonts-unabhängiger und gar handgeschriebenerSchriftzeichen geht, stellen z.B. Lee et al. (2000) und Gao et al. (2000) Möglichkeiten struk-tureller Verfahren vor. Die gezielte Ausnützung kontextueller Information zur Mus-tererkennung findet sich hingegen z.B. im Konzept der kontextsensitiven Bildinterpre-

23. Beispiele hierzu finden sich in Palenichka et al. (2000). Sogar der Einsatz von neuronalen Netzen zurKlassifikation ist erwogen worden [Segl (1998)].

Page 40: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

28 Kapitel 3

tation von Köster (1995) wieder, wo Kontextbeziehungen mittels Markoff-Zufallsfeldernund Methoden der Bayes-Statistik24 beschrieben werden [vgl. auch Koch (1995), Brügel-mann (1998)].

3.2.3 Wissensbasierte Verfahren

Wissensbasierte Verfahren stehen den Methoden der Künstlichen Intelligenz (KI) nahe,und bezeichnen Verfahren, bei denen das Problemlösen und Schlussfolgern mit Hilfeeiner Wissensbasis erfolgt. Vorwissen und Vorinformation werden gezielt für die Pro-blemlösung eingesetzt.

Abb. 3.9: Prozessablauf (a) prozeduraler und (b) wissensbasierter Methoden.

Im Gegensatz zu prozeduralen Verfahren ist der Problemlösungsprozess der wissens-basierten Verfahren nicht von Anfang an festgelegt,25 sondern ergibt sich sukzessiveaus Zwischenergebnissen. Schematisch kann man sich das wie in Abb. 3.9 dargestelltvorstellen. Ein Initialprozess P1 liefert die Zwischenresultate bzw. Information I1, in

24. Eine Einführung in die Bayes-Statistik findet sich z.B. bei Koch (2000).

(a)

(b)

25. vgl. Illert (1990) S. 40f.

Page 41: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Methoden der Bilddatenverarbeitung 29

deren Abhängigkeit der nächste Bearbeitungsschritt P2(I1) ausgewählt wird. Dieserführt zum Zwischenergebnis bzw. zur Information I2. Der nachfolgende Bearbeitungs-schritt P3 wird in Abhängigkeit von I1 und I2 ausgewählt, usw. Bei prozeduralenMethoden sind alle Bearbeitungsschritte unabhängig vom Resultat des Vorgängerpro-zesses.

Neben den Zwischenresultaten einzelner Bearbeitungsschritte werden in wissensba-sierten Systemen auch unterschiedliche Vorinformationen gezielt eingesetzt. Ein idealeswissensbasiertes Texterkennungssystem würde anfangs mit Hilfe struktureller odernumerischer Verfahren einzelne Buchstaben erkennen, dann aus der Lage der Buchsta-ben den Suchbereich weiterer Buchstaben gezielt eingrenzen (durch Suche auf der glei-chen Zeilenhöhe, in den richtigen Abständen voneinander). Sind dann bereits ersteWorte erkannt, würde ein solches wissensbasiertes System die Sprache erkennen, undzuletzt auf ein kontextbasiertes Verfahren umsteigen, bei dem Wörter bereits aus weni-gen Buchstaben unter Zuhilfenahme des sprachlich-grammatikalischen Kontextes undeines Wörterbuches erkannt werden [vgl. auch Wille (2000)].

Wissensbasierte Systeme bestehen aus zwei Bestandteilen: einer Wissensbasis, in der ingeeigneter Weise das Wissen zu speichern ist, und einer Problemlösungskomponente,die aus dem sukzessive angesammelten Zusatzwissen (bzw. Zwischenresultaten)selbstständig das nächste Verfahren auswählt [Illert (1990) S. 35-38, Bartelme (1995) S.176-184]. Die Wissensbasis ist entweder vorher bekannt oder wird empirisch bestimmt.

Ein Beispiel einer wissensbasierten Bildinterpretation ist die Bildinterpretation mitHilfe eines Bayes-Netzes: Hier wird in vorher gehenden Prozessen entstandene Vorin-formation für nachfolgende Prozesse weiter verarbeitet. Die Zuordnung der Vorinfor-mation erfolgt in Bayes-Netzen, denen die Bayes-Statistik mit ihren Regeln des Folgernsund Schliessens zu Grunde liegt [Koch (1995), Koch (2000)].

Lernfähige Systeme sind eine Erweiterung wissensbasierter Systeme. Die Erfahrungen,die sich aus der Anwendung bestimmter Prozesse ergeben, d.h. die Güte der Zwischen-resultate, werden gesammelt und sukzessive für nachfolgende Strategien berücksich-tigt. Die Strategien werden dadurch i.A. immer besser.

3.3 Bildkorrelation und Template Matching

Korrelieren und Matchen sind spezielle Verfahren der Mustererkennung, bei denennicht ein Bild alleine betrachtet wird, sondern das Verhältnis zwischen zwei oder meh-reren Bildern bzw. Ausschnitten aus Bildern untersucht wird.

3.3.1 Korrelation

Der Begriff der Korrelation stammt aus der Ausgleichungsrechnung und Statistik undbezeichnet ähnlich wie die Kovarianz eine Grösse zur gemeinsamen Beurteilung von

Page 42: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

30 Kapitel 3

mehreren stochastischen Signalen bzw. Variablen. Die Korrelation kann dabei auchzum Vergleich zwischen Bild und Muster herangezogen werden.

Seien X und Y Zufallsvariablen mit einer gemeinsamen Dichte f(x,y), so werden

[3.1]

als (i+j)-tes Moment bezeichnet. Mit den ersten Momenten (i=1, j=0 und umgekehrt)

und [3.2]

erhält man die Erwartungswerte von X und Y. Daraus lassen sich mit

[3.3]

die (i+j)-ten zentralen Momente der Zufallsvariablen X und Y bestimmen.

Das gemischte zweite zentrale Moment (i=1 und j=1) ist die Kovarianz von X und Y

, [3.4]

während aus den reinen zweiten zentralen Momenten (i=2, j=0 bzw. i=0, j=2), den soge-nannten Varianzen, durch Radizieren die Standardabweichungen

(dito für y) [3.5]

resultieren. Bei diskreten Zufallsvariablen X und Y gehen die Integrale in den Formeln[3.1] bis [3.5] in endliche Summen über.26

Aus der Kovarianz [3.4] und den Standardabweichungen [3.5] berechnet sich die Korre-lation zu

. [3.6]

Der Korrelationskoeffizient ρxy nimmt Werte zwischen –1 und +1 an. Betragsmässiggrosse Korrelationen (Beträge nahe bei 1) zeigen eine starke Abhängigkeit der beidenZufallsvariablen an, während betragsmässig geringe Korrelationen (Beträge nahe bei 0)ein Indiz für ihre geringe Abhängigkeit, gar ihrer Unabhängigkeit sind.

26. vgl. hierzu die Formeln von Haberäcker (1995) S. 8-10.

µxyi j( , )

xiy

jf x y,( )⋅ xd y i, j∀ N0∈d

∞–

∫∞–

∫=

µx x f x y,( )⋅ xd yd

∞–

∫∞–

∫= µy y f x y,( )⋅ xd yd

∞–

∫∞–

∫=

µxyi j,( )

x µx–( )iy µy–( )j

f x y,( )⋅ xd y i, ∀ j N0∈d

∞–

∫∞–

∫=

KOV x y,( ) σxy x µx–( ) y µy–( ) f x y,( )⋅ xd yd

∞–

∫∞–

∫= =

σx VAR x( ) KOV x x,( ) x µx–( )2 f x y,( ) xd yd

∞–

∫∞–

∫ 1 2⁄

= = =

KOR x y,( ) ρxy

σxy

σx σy⋅---------------- KOV x y,( )

VAR x( ) VAR y( )⋅---------------------------------------------------= = =

Page 43: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Methoden der Bilddatenverarbeitung 31

Werden Bilder als Signale X und Y aufgefasst und eine gemeinsame Dichte angenom-men, so können auch zwischen ihnen Korrelationen berechnet werden. X sei eine dis-krete Zufallsvariable, zu der die Grauwerte eines abgeschlossenen Bereiches des erstenBildes eine Realisierung sind. Die Grauwerte in einem gleichgrossen Bereich des zwei-ten Bildes werden in der ebenfalls diskreten Zufallsvariable Y modelliert. Mit derDichte der diskreten Gleichverteilung

, [3.7]

bei der n die Anzahl der Pixel im betrachteten Bildbereich bezeichnet, ergeben sich dieErwartungswerte

(dito für y), [3.8]

die als mittlere Grauwerte der Bilder 1 und 2 bezeichnet werden können, sowie dieVarianzen und Kovarianzen

, und [3.9]

.

Hieraus ergibt sich die Korrelationsfunktion für die Grauwerte zweier Bilder:

. [3.10]

Je nach zu Grunde liegender Dichtefunktion ergeben sich andere Korrelationsfunktio-nen zur Berechnung der Bildkorrelation zwischen zwei Bildern bzw. Bildbereichen. DieErfahrung zeigt, dass der Korrelationskoeffizient umso näher an +1 liegt, je ähnlicherdie miteinander korrelierten Bildausschnitte sind. Im Falle der Identität ergibt sichexakt +1. Der Wert –1 wird bei exakt negativen Bildern (bei Grauwertbildern im Sinneeiner Schwarz-Weiss-Vertauschung) erreicht. Bei inhaltlich verschiedenen Bildaus-schnitten erreichen die Korrelationskoeffizienten hingegen betragsmässig kaum mehrals 0.5.

Neben den stochastisch aus einer Dichtefunktion abgeleiteten Korrelationsfunktionengibt es eine Reihe weiterer Korrelatoren, die auf andere Weise die Grauwertbelegungder beteiligten Bilder miteinander in Beziehung setzen. Viele dieser Korrelatoren basie-ren auf einer pixelweisen Differenzbildung der Bilder27 und werten die verbleibenden

27. Dieses entspricht einer algebraischen Bildoperation, vgl. Abschnitt 3.1.1.

f x y,( ) 1

n2

-----=

µx xi f xi yj,( )⋅i 1=

n

∑j 1=

n

∑ 1

n2

----- xii 1=

n

∑ 1

j 1=

n

∑ ⋅ ⋅ 1

n--- xi

i 1=

n

∑⋅= = =

σx2 1

n2

----- xi µy–( )2

i 1=

n

∑⋅= σy2 1

n2

----- yi µy–( )2

i 1=

n

∑⋅=

σxy1

n2

----- xi µx–( ) yj µy–( )⋅j 1=

n

∑i 1=

n

∑⋅=

ρxy

σxy

σx σy⋅----------------

xi µx–( ) yj µy–( )⋅j 1=

n

∑i 1=

n

xi µx–( )2

i 1=

n

∑ yj µy–( )2

j 1=

n

∑⋅

----------------------------------------------------------------------------------------------= =

Page 44: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

32 Kapitel 3

Differenzen aus. Kraus (1990) nennt hier als Beispiel die mittleren relativen Grauwert-differenzen (ebd. S. 579)28

[3.11]

und den quadratischen Mittelwert der Grauwertdifferenzen (ebd. S. 580)29

. [3.12]

Auch bei den nicht-stochastisch motivierten Korrelatoren sind keine Grenzen bei derKreation weiterer und neuer Korrelatoren gesetzt.30

3.3.2 Matching

Den Vergleich zweier Bilder bzw. Bildausschnitte bezeichnet man als Image Matching.Das Wort Matching kommt aus dem Englischen von „to match“ und bedeutet transitiv„etwas miteinander vergleichen“ (im Gebrauch von to match with), „einander entspre-chen“ (als to match), „etwas passend machen, anpassen“ (als to match to oder with), fer-ner „etwas Gleiches oder Passendes finden“. In der passivischen Formulierung „to bematched“ hat es die Bedeutung von „einer Sache ebenbürtig sein, gleichkommen“. Dane-ben hat es als intransitiv gebrauchtes Verb die Bedeutungen „zusammenpassen, über-einstimmen mit“ (als to match with) und „entsprechen” (als to match to) [alleBedeutungsvarianten aus Messinger (1996)].

In allen aufgezählten Bedeutungsvarianten wird deutlich, dass Matching stets auf eineBeziehung von mindestens zwei Objekten angelegt ist. Für die ingenieurstechnischenAnwendungen, insbesondere in der Bilddatenverarbeitung, sind folgende Aspekte ausden o.g. Bedeutungen von Interesse:

A. Matching als Messen der Übereinstimmung

Aufgabe des Matching ist das Bestimmen eines Masses der Übereinstimmung zwischenzwei Objekten, im Bereich der Bildverarbeitung zwischen zwei Bildern. Dieses würdeder Wortbedeutung „miteinander vergleichen“ entsprechen. Das Resultat dieses Vorge-hens ist rein deskriptiv und beinhaltet keine Entscheidungsregel, nach welcher ermitteltwird, ob die beiden Objekte bzw. Bilder als gleich anzusehen sind. Das Mass wird aller-dings eine solche Entscheidung unterstützen können. Die in 3.3.1 besprochenen Korre-latoren bieten eine Möglichkeit an, Masse der Übereinstimmung für Bilder zu

28. Zu beachten ist jedoch, dass bei der Differenzbildung Werte nahe bei Null ein Indikator für die guteÜbereinstimmung der betrachteten Bilder bzw. Bildausschnitte sind.

29. vgl. vorige Fussnote.30. weitere Anmerkungen zu Korrelationsmassen in Antani et al. (1998).

ρxy1n---

xi yi–

xi yi+( )--------------------

i 1=

n

∑⋅=

1

n------- xi yi–( )2

i 1=

n

∑⋅

Page 45: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Methoden der Bilddatenverarbeitung 33

berechnen. Das Messen der Übereinstimmung geschieht zudem ohne Manipulation derObjekte bzw. der Bilder.

B. Matching als (Wieder-)Herstellen der Übereinstimmung

Der Wortbedeutung „etwas passend machen, anpassen“ wäre das Aufeinanderanpas-sen der beiden Objekte bzw. Bilder entsprechend, das notwendigerweise Veränderun-gen von mindestens einem der beiden Objekte bzw. Bilder erfordert. Dieses Verfahrenist somit nicht deskriptiv sondern restriktiv, wobei als Restriktion die Gleichheit bzw.Ebenbürtigkeit der beiden Objekte bzw. Bilder anzuhalten ist. Die Objekte bzw. Bilderwerden soweit verändert und manipuliert, bis der Zustand der Übereinstimmung, derZustand des Zusammenpassens erreicht worden ist. Das Resultat dieser Anwendungist eine aktive Manipulation. Im Bereich der Bildverarbeitung wäre eine solche Aufgabebei der Bildrestauration denkbar, wenn etwa in einem Bilddokument bekannte Objektenur deformiert oder unvollständig erscheinen und sie mit Hilfe eines Bildausschnittes,das das Objekt besser darstellt, restauriert werden.31

C. Matching als Suche nach Übereinstimmungen

Matchen im Sinne „etwas Gleiches oder Passendes finden“ ist als Suchaufgabe zu ver-stehen. Demnach werden in der Menge der Objekte diejenigen Objekte gesucht, die zueinem bestimmten Musterobjekt passen. Im Bereich der Bildverarbeitung bedeutet die-ses, in der Menge möglicher Bilder oder Bildausschnitte diejenigen zu suchen, die zueinem Musterbild32 passen. Das Resultat ist eine Menge von passenden Objekten bzw.Bildausschnitten, die auch leer sein kann. Um übereinstimmende Objekte oder Bildaus-schnitte zu finden, muss natürlich immer wieder ein Mass der Übereinstimmungberechnet werden.

Der üblichen Auffassung von Image Matching, bei dem zwei i.A. gleichgrosse Bilder mit-einander verglichen werden, kommt die Auslegung A (Messen der Übereinstimmung)am nächsten. Der Vergleich zwischen zwei Bildern wird dabei durch Korrelationsbe-rechnungen (siehe 3.3.1) erstellt. Beim Template Matching, auf das im nächsten Unterab-schnitt eingegangen wird, steht die Auslegung C (Suche nach Übereinstimmungen)stärker im Vordergrund. Auslegung B mit dem Aspekt des Aufeinanderanpassens wirdhingegen weniger mit dem Begriff „Matching“ verbunden.

3.3.3 Prinzip des Template Matching

Beim Template Matching ist das eine Bild wesentlich kleiner als das andere. Das kleinereBild, Template oder Muster genannt, ist ein verbessertes Original, eine Referenz bzw. ein

31. Diese Interpretation des Matching mit dem Aspekt der Bildrestaurierung bzw. Bildverbesserung findetsich u.A. in Pfund (1998).

32. Statt „Musterbild“ wird im Bereich der Bildverarbeitung die Bezeichnung „Template“ verwendet.

Page 46: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

34 Kapitel 3

idealer Bildauschnitt, der ein bestimmtes Objekt darstellt. Im grösseren Bild, das wiri.A. als Suchbild bezeichnen, gilt es nun, das Template wiederzufinden.

Die Suche des Templates erfolgt im Suchbild zeilen- und spaltenweise in sämtlichenAusschnitten, die die Dimension des Templates haben (Abb. 3.10(a)). An jeder dieserStelle wird dann das Mass der Übereinstimmung mittels eines Korrelators bestimmt(Abb 3.10(b)). Je nachdem wie aufwändig die Berechnung der Korrelation pro Suchbild-ausschnitt ist, erweist sich das Template-Matching-Verfahren als rechenzeitintensiv.Daher werden in der Praxis möglichst einfache, und damit häufig nicht-stochastischmotivierte, empirische Korrelatoren eingesetzt.

Beim Hinüberschieben eines Templates über ein Suchbild, das in bestimmten Aus-schnitten identische oder nahezu identische Pixelanordnungen enthält wie das Tem-plate, ergibt sich beim Annähern der passenden Position eine signifikante Zunahme derKorrelation (Abb. 3.11). Idealerweise ergibt sich bei der Korrelationsfunktion ein Peak,dessen Spitze die Position des Templates im Suchbild angibt. Das lokale Maximum istdas Kriterium, mit dem aus dem Verlauf der Korrelationsfunktion, die im Bild i.A.zweidimensional ist (Zeilen- und Spaltenrichtung), eine Position im Suchbild angege-ben werden kann, die lokal dem Template entspricht [Ballard and Brown (1982) S. 65-68].

Da die Rasterelemente nur in diskreten Abständen auftreten, werden auch nur für dis-krete Positionen des Templates Werte erhalten. Wird aber die Korrelationsfunktion imSubpixelbereich interpoliert, so können auch Bildkoordinaten im Subpixelbereichgeschätzt werden, bei denen die Korrelation am höchsten ist.

Abb. 3.10: Prinzip des Template Matching: (a) pixelweises Anhalten des Templates über gleichgrosseAusschnitte aus dem Suchbild, (b) Berechnung des Matchingresultats.

Werden Templates so angelegt, dass sie ein Objekt darstellen, dem ganzheitlich einsemantischer Inhalt zugeordnet werden kann, so ist das Template Matching eine geeig-nete Methode zur Interpretation von Bildern, d.h. zur Beschaffung struktureller undlogischer Information aus dem Bild.

(a) (b)

Page 47: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Methoden der Bilddatenverarbeitung 35

Abb. 3.11: Korrelation in der Umgebung eines gut matchenden Bildpaars: (a) Lage Template und Such-bild zueinander, (b) Verlauf der Korrelationsfunktion (reduziert auf Zeilenrichtung).

Da die Rechenzeit mit der Grösse der Templates zunimmt, werden Signaturen kleinerergeometrischer Ausdehnung wie Buchstaben, Ziffern, Symbole und kartografische Zei-chen bevorzugt für das Template Matching ausgewählt. Das Matchen von Bereichengrösserer Ausdehnung hat zur Folge, das die Rechenzeit in keinem Verhältnis mehr zurGüte der Detektion steht.

(a)

(b)

Page 48: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

36 Kapitel 3

Die Vorteile des Template Matching bestehen darin, dass die rasterbasierten Strukturennicht notwendig pixelweise identisch sein müssen, um gefunden zu werden. Denn daslokale Maximum einer Korrelation muss nicht bei optimaler Korrelation (Betrag derKorrelation = 1.0) gegeben sein. Damit aber nicht Maxima bei zu niedrigen Korrelati-onswerten gleich als Übereinstimmungen im Sinne des Template Matching gewertetwerden, sollte ein Schwellwert eingeführt werden, der einen Mindestbetrag an Korrela-tion zur Feststellung der Übereinstimmung vorschreibt. Die Eigenschaft, dass auchähnliche und nicht exakt identische Strukturen durch Template Matching im Suchbildgefunden werden können, bezieht sich insbesondere auf radiometrische und topologi-sche Variationen zwischen Template und Suchbildausschnitt. In verrauschten Bildernlassen sich geometrisch klar definierte Strukturen mittels Matching problemlos wieder-finden.

Für die Mustererkennung von Symbolen in kartografischen Rasterdaten ist diese Eigen-schaft von enormer Bedeutung, denn es können auch solche Symbole durch Matchengefunden werden, deren unmittelbarer nachbarschaftlicher Kontext durch andereSignaturen gestört wird.

Abb. 3.12: Matchingresultate (a) bei einem verrauschten, aber semantisch gleichbedeutenden Zeichenund (b) bei einem geometrisch ähnlichen, aber semantisch verschiedenen Zeichen.

Neben der häufig langen Rechenzeit weist das Template Matching als Methode zurExtraktion von Objekte noch einen weiteren Nachteil auf: Es reagiert sehr empfindlichauf geometrische Deformationen, die in der Semantik aber unbedeutend sind. Umge-kehrt sind kleine Veränderungen an Rasterstrukturen, die aber für die Semantik ent-scheidend sind, kaum durch Korrelatoren zu trennen, wie das Beispiel der Buchstaben„E“ und „F“ in Abb. 3.12 zeigt. Das liegt mitunter daran, dass sich die Berechnung der

(a) (b)

Page 49: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Methoden der Bilddatenverarbeitung 37

Korrelation auf sämtliche Pixel der Rasterstruktur erstreckt, und lokal konzentrierteAbweichungen zu gleichen Matchingresultaten führen wie eine gleichmässige Vertei-lung der Abweichungen über die gesamte Struktur.

Das Template Matching ist zu einem hohen Masse an die Rasterstruktur gebunden,denn das Template wird in der Rasterstruktur mit allen Eigenschaften, die ein rasterba-siertes Bild aufweist (vgl. die Ausführungen in Kap. 2), definiert. Es ist somit starr inBezug auf die Pixelanordnungen, die das dargestellte Objekt definieren. GeometrischeVariationen wie z.B. eine Skalierung oder eine Rotation erfordern für jede VariationAnpassungen am Template, die in den meisten Fällen nur durch eine aufwändigeAffintransformation erreicht werden kann. Weil die Definition des Templates in einer(starren) Rasterstruktur erfolgt, sind die bedeutungsstiftenden Aussagen des im Tem-plate dargestellten Objekts auf die geringen topologisch-relationalen Beziehungen einerRasterdarstellung reduziert worden.

Modifizierungen der Template-Matching-Strategie erlauben es, viele der vorgenanntenNachteile auf ein Minimum zu reduzieren. Sie betreffen die Berechnung der Korrela-tion, das Design von Templates, aber auch den Einsatz zusätzlicher Information (wis-sensbasiertes Template Matching) oder komplexerer Matchingtechniken (Einsatz vonneuronalen Netzen, Fuzzy-Logik etc.). Eine solche modifizierte Matchingstrategie hatStengele (1995) vorgestellt, auf die wir im nächsten Unterabschnitt eingehen.

3.3.4 Das wissensbasierte Template Matching von Stengele

Das klassische Template Matching erweist sich in der praktischen Anwendung alsbedingt einsatzfähig. Zum Einen erweist es seine Stärken nur bei besonders gut undgeometrisch klar definierten Symbolen, zum Anderen gibt die mit Suchbildgrösse undTemplategrösse stark anwachsende Rechenzeit Anlass zu Modifikationen. Stengele hatin seiner Dissertation [Stengele (1995)] eine modifizierte Template-Matching-Strategievorgestellt, die erstens zu einer signifikanten Reduktion der Rechenzeit, zweitens zueiner erfolgreicheren Detektion von leicht geometrisch variierten Mustern und drittenszur Erhöhung der Detektionssicherheit bei geometrisch geringfügig veränderten, abersemantisch verschiedenen, also leicht verwechselbaren Strukturen führt. Die Modifizie-rungen sind im Einzelnen:

Einführung von Signifikanzregionen

Das Template wird in Vorder- und Hintergrundregionen unterschiedlicher Signifikanzzerlegt. Es gibt für eine semantisch richtige Interpretation geometrische Bereiche inner-halb des Templates, die wesentlich zur semantisch einwandfreien Zuordnung sind,andere wiederum sind unbedeutend. Stengele hat für binär definierte Templates eineAufteilung des Vorder- und des Hintergrunds in jeweils drei Signifikanzstufen vorge-schlagen (Abb. 3.13).33

33. Zur separaten Auswertung von Teilregionen vgl. auch Kim et al. (1995).

Page 50: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

38 Kapitel 3

Abb. 3.13: Aufteilung des Templates in Regionen unterschiedlicher Signifikanz.

Geometrische Vorbeugung von Missdetektionen

Zur Vorbeugung von Missdetektionen, die auf geometrisch ähnlichen Strukturen basie-ren, werden die Signifikanzregionen verwechslungsgefährdeter Signaturen dahingehend modifiziert, dass an den signifikant sich unterscheidenden Stellen hohe Signifi-kanzen für den Vordergrund bzw. Hintergrund eingefordert werden (Abb 3.14).

Abb. 3.14: Gezielte Markierung der Unterschiede bei verwechslungsgefährdeten Signaturen durchSignifikanzregionen.

Gestufte Berechnung der Korrelation

Basierend auf die Regionen unterschiedlicher Signifikanz erfolgt die Berechnung dermatchenden Korrelation gestuft. Die in der Signifikanz höher stehenden Pixelbereichewerden vorgängig gematcht, und mit einem hoch angesetzten Schwellwert gefiltert.Die zweite Phase des Matching, die die Regionen mittleren Signifikanzniveaus betrifft,wird nur noch bei denjenigen Suchbildstellen durchgeführt, die im hochsignifikantenBereich positive Resultate erzielt haben. Nach der zweiten Phase folgt die dritte Phasefür den dann noch verbliebenen Rest bezogen auf die wenig signifikanten Bereiche desTemplates. Durch dieses gestufte Verfahren mit Abbruchmöglichkeit bei niedrigerÜbereinstimmung (Abb 3.15) wird gegenüber dem konventionellen Matching erheblichRechenzeit eingespart.

Page 51: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Methoden der Bilddatenverarbeitung 39

Logische Vorbeugung von Missdetektionen

Bei verwechslungsgefährdeten Signaturen wird abschliessend ein Matchingresultat zusämtlichen denkbaren Alternativen berechnet. Sollte sich eine Alternative als überein-stimmender erweisen, wird das an sich gute Resultat für die gesuchte Struktur zugun-sten der Alternative verworfen (Abb 3.15). Welche Alternativen zu einem Template inBetracht zu ziehen ist, wird in der Templatedefinition gespeichert, womit das Verfahrenwissensbasiert wird.

Abb. 3.15: Schematischer Ablauf des wissensbasierten Template Matching.

Die wissensbasierte Template-Matching-Strategie von Stengele kommt im Bereich derautomatischen Interpretation rasterbasierter topografischer Karten zum Einsatz. Aufdie weiter gehenden Verbesserungen gegenüber konventionellem Matching geht Sten-gele (1995) in seiner Dissertation ausführlich ein [ebd. S. 102-119, vgl. auch Stengele et al.(1995) S. 176f. und Stengele (1993)].

Page 52: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG
Page 53: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Kapitel 4

Kartografische Mustererkennung

Rasterbildverfahren wie die Mustererkennung sind in hohem Masse dokumentspezi-fisch. Die der kartografischen Mustererkennung zu Grunde liegenden Dokumente sindallgemein Karten. Sie bilden innerhalb der Dokumente einen speziellen Typus sowohlbetreffend ihrem Informationsgehalt als auch bezüglich der Informationskodierung.

In diesem Kapitel wird auf das spezifisch Kartografische eingegangen. Ausgehend vonder Definition und Aufgabe der Karte als Informationsträger und der kartografischenDokument- und Informationstheorie werden Grundzüge der kartografischen Darstel-lung, aber auch sich hieraus ergebende Eigenschaften kartografischer Rasterdatenbehandelt, um daraus Folgerungen für die spezifisch kartografische Mustererkennungzu formulieren. Der Weg von der Realität zur Karte, den die Disziplin der Kartenher-stellung beschreibt, gibt entscheidende Hinweise für den umgekehrten Weg, den einewissensbasierte Mustererkennung beschreitet: das Herauslösen von Information ausdem Kartendokument unter Zuhilfenahme von kartografischen Vorwissen.

4.1 Definition, Aufgabe und Inhalt der Karte

Das Dokument bzw. der Dokumenttyp, der der kartografischen Mustererkennung zuGrunde liegt, ist die Karte. Für die digitale Bearbeitung sind es Rasterdaten mit karto-grafischem Inhalt.

Die Karte wird nach Hake et al. (2002) definiert als „massgebundenes und strukturiertesModell räumlicher Bezüge. Sie ist im weiteren Sinne ein digitales, grafikbezogenes Modell, imengeren Sinne ein grafisches (analoges) Modell“ [ebd. S. 25], und bezogen auf den kartogra-fischen Ausdruck ist sie „vor allem gekennzeichnet durch ein System geometrisch gebundenergrafischer Zeichen aus einem endlichen, mit vereinbarten Bedeutungen versehenen Zeichenvor-rat“ [Hake et al. (2002) S. 4].

Page 54: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

42 Kapitel 4

In den Zusammenhang der Kommunikationstheorie gestellt, kann die Karte als Trägerder Information angesehen werden, die sich der kartografischen Zeichen bedient, derensemantische Bedeutung dem Kartenhersteller und dem Kartenleser gemeinsambekannt sind. Die kartografischen Symbole bilden, ähnlich wie die Buchstaben des latei-nischen Alphabets und die Satzzeichen, das Grundmaterial zur Kodierung von Infor-mation. Hierbei ist spezielle, d.h. geometrisch gebundene und räumliche Sachverhalteausdrückende Information gemeint.

Abb. 4.1: Bedeutung der Karte in der Kommunikationstheorie.

Aus den oben aufgeführten Definitionen der Karte ergeben sich folgende Aspekte, dieeine Karte auszeichnen:

• Die Karte ist ein Modell räumlicher Bezüge: Das, was in der Karte dargestellt wird,ist raumbezogene Information. Zugleich stellt sie die Bezüge in einem Modell dar -als vereinfachte Realität.

• Die Karte als massgebundenes und strukturiertes Modell: Die Darstellung räumlicherInformation ist gebunden an einen einheitlichen Kartenmassstab und thematischstrukturiert.

• Die Karte als grafisches bzw. grafikbezogenes Modell: Die Information der Karte istgrafische Information.

Page 55: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Kartografische Mustererkennung 43

• Die Kartendarstellung erfolgt durch ein System grafischer Zeichen: Die Bausteineder kartografischen Informationskodierung sind grafische Zeichen. Sie bilden insge-samt ein System.

• Die in der Karte verwandten grafischen Zeichen sind geometrisch gebunden: Durchdie geometrische Bindung ist es möglich, raumbezogene, massgebundene Sachver-halte zur Darstellung zu bringen.

• Die grafischen Zeichen der kartografischen Darstellung stammen aus einem endli-chen Zeichenvorrat: Es gibt nur eine endliche, d.h. begrenzte Anzahl grafischer Zei-chen zur Darstellung raumbezogener Sachverhalte.

• Die grafischen Zeichen haben vereinbarte Bedeutung: Hierdurch wird die Kommuni-kation erst möglich, denn über die in der Kartenlegende vereinbarte Bedeutung (diesog. kartografische Wissensbasis) wird die Kartenbotschaft für den Kartenlesererschliessbar [Imhof (1972) S. 21].

Aus den vorgenannten Eigenschaften ergibt sich, dass die Karte als ein speziellesMedium zum kommunikativen Austausch über raumbezogene (geometrische wie the-matische) Information anzusehen ist (Abb. 4.1).

Bertin (1998) betrachtet noch zusätzlich den Aspekt der geografischen Identifizierung.Er unterscheidet den kartografischen Leseprozess in zwei Bestandteile: die externeOrientierung, die sich aus Übersichtskarten, Kartentitel, -namen, nötigenfalls Gitterli-nien etc. ergibt, und die interne geografische Identifizierung, d.h. das Verstehen desKarteninhalts [ebd. pg. 287]. Letzteres entspricht der Aufgabe der kartografischenMustererkennung.

4.2 Das System grafischer Zeichen

Das System grafischer Zeichen bestimmt den Inhalt der Karte. Für eine kartografischeMustererkennung steht daher die Erfassung dieses Inhaltes im Vordergrund. Da Kartenmassstabsgebundene Darstellungen sind, ist bei dieser Erfassung eine Geo-Referenzie-rung möglich, d.h. für die Mustererkennung des Karteninhalts kann ein räumlicherBezug von Informationsbestandteilen über die Positionsvariablen (Koordinaten im Kar-tensystem) hergestellt werden.

Neben der Wiederherstellung des Raumbezugs, sind weitere Spezifikationen der Karteauszumachen, die ihren Inhalt, nämlich Kartengrafik und Signaturen, betreffen, undden Aufgabenbereich der Mustererkennung genauer umreissen.

Das System der grafischen Zeichen unterliegt einerseits Restriktionen, die sich aus derDefinition des Kartenbegriffes ergeben (siehe 4.2.1). Auf der anderen Seite muss dieKartengrafik der Vielfalt raumbezogener Information gerecht werden (siehe 4.2.2).

Page 56: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

44 Kapitel 4

4.2.1 Restriktionen

In Kapitel 4.1 ist der Begriff Karte definiert und in den Zusammenhang der Kommuni-kationstheorie hineingestellt worden. Für das System grafischer Zeichen ergeben sichdaraus bestimmte Restriktionen:

• Aus dem Modellcharakter einer Karte ergibt sich, dass nicht sämtliche raumrele-vante Informationen über die Wirklichkeit zur Abbildung in der Karte gelangen.Modellbildung bedeutet dabei eine Auswahl raumbezogener Informationen nachvorgegebenen Gesichtspunkten. In der Kartografie richtet sich die Auswahl nach derjeweiligen Kartenthematik. Das System grafischer Zeichen kann daher nur diejenigeraumbezogene Information abbilden, die zum kartografischen Modell gehören.

• Darstellungen raumbezogener Sachverhalte erfolgen mittels geometrischer undtopologischer grafischer Hilfsmittel. Die grafischen Zeichen in der Karte müssengeeignet sein, um die notwendigen geometrischen und topologischen Eigenschaftenzu symbolisieren. Die Variationsbreite grafischer Zeichen muss den Variationenraumbezogener Information angemessen angepasst werden.

• Da eine Karte zwei räumliche Dimensionen aufweist, müssen die in der Realitätdreidimensionalen Objekte auf Darstellungsobjekte mit höchstens zwei Dimensio-nen projiziert werden. Die Abbildung von realen Objekten in darstellbare Objekte istBestandteil des zu definierenden kartografischen Modells.

• Wegen der Komplexität der darzustellenden geometrischen und topologischenBezüge sind Kartografen angehalten, den Zeichenvorrat grafischer Zeichen geringzu halten, sorgfältig auszuwählen und gewisse Hierarchien in der Darstellung zubeachten, um die Lesbarkeit und Übersichtlichkeit einer Karte zu garantieren. Raum-bezogene Information wird dabei strukturiert und klassifiziert, und die entsprechen-den darstellenden grafischen Zeichen geben i.d.R. Objektklassen wieder.

• Ein geringer Zeichenvorrat erschliesst auch einen grösseren Kreis der Kartenleser, dadie kartografische Wissensbasis für den Leser leicht erlernbar ist. Ein Überfrachtenkartografischer Darstellungen sowohl mengenmässig (quantitativ) wie auch typen-mässig (qualitativ, d.h. durch einen zu grossen Zeichenvorrat) erschwert das Lesenund Verstehen kartografischer Dokumente enorm.

• Der Zeichenvorrat grafischer Zeichen, der die Wissensbasis bildet, wird i.A. aufAssoziationen menschlichen Lesens und Interpretierens aufgebaut. Die grafischeAusgestaltung einer fremden Signatur erweckt beim Kartenleser oft die richtigeAssoziation zur Semantik des Zeichens (z.B. die Darstellung der Campingplätzedurch ein Zelt-Symbol). Abstrakte und assoziationsfreie Zeichen werden i.A. ver-mieden. Dadurch wird das Kartenlesen weiterhin vereinfacht, da sich so häufig dasNachschlagen in der kartografischen Legende erübrigt.

• Zu einer klaren Darstellung raumbezogener Sachverhalte gehört auch eine hinrei-chend ausgeprägte Variation grafischer Zeichen in qualitativer und quantitativer

Page 57: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Kartografische Mustererkennung 45

Hinsicht. Grafische Zeichen sollen so definiert werden, dass Verwechslungsgefahrenzwischen Zeichen unterschiedlicher Bedeutung ausgeschlossen sind.

• Die Entschlüsslung der Kartenbotschaft wird beim Kartenleser erleichtert, wenn beiden grafischen Zeichen qualitative bzw. quantitative Darstellungsunterschiede glei-chermassen zu qualitativen resp. quantitativen Variationen der räumlichen Wirk-lichkeit gehören.

• Unter dem Aspekt der Reproduktion kommt noch hinzu, dass bei kartografischenDarstellungen möglichst keine Mischfarben oder Farbverläufe verwendet werdensollten. Kartografische Dokumente zeichnen sich i.A. durch wenige, klar voneinan-der abgegrenzte Farben aus.

• Sowohl unter dem Gesichtspunkt der Reproduktion wie auch aus der Begrenztheitder visuellen Wahrnehmung ergeben sich weitere Einschränkungen, die sich auf dieDimensionierung grafischer Zeichen beziehen. Aus dem physiologischen Aspekt(Trennschärfe, Sehvermögen) sind die sogenannten Minimaldimensionen zu berück-sichtigen, die grafische Zeichen ihrer visuellen Erkennbarkeit wegen nicht unter-schreiten dürfen. Die Mindestgrössen dagegen sind die Grenzen grafischer Variationbzgl. der Reproduzierbarkeit. Die Kartenhersteller bemühen sich, weder die Mini-maldimensionen noch die Mindestgrössen zu unterschreiten, um einem Informati-onsverlust vorzubeugen [Hake et al. (2002), (SGK) (2002)].

4.2.2 Darstellungsvielfalt

Neben den Restriktionen, denen das System grafischer Zeichen unterliegt, besteht derAnspruch auf eine Darstellungsvielfalt, die der Varietät raumbezogener Informationentgegenkommt.

Grafische Zeichen stellen einerseits Raumbezug (räumliche Dimension), andererseitsSachbezug dar (thematische Dimension). Im Allgemeinen lassen sie sich unterteilen inzwei Gruppen, nämlich in grafische Zeichen, die einen unmittelbaren Raumbezug auf-weisen, und in solche mit mittelbarem Raumbezug.

Grafische Zeichen mit unmittelbarem Raumbezug

Die grafischen Zeichen mit unmittelbarem Raumbezug lassen sich untergliedern in Zei-chen für punktbezogenen Raumbezug, linienbezogenen Raumbezug und flächenhaftenRaumbezug [u.A. (SGK) (2002)].

Grafische Zeichen für punktförmige Objekte (Abb. 4.2(a)) sind die sogenannten Einzelsigna-turen, deren räumliche Lage eine Sachinformation den Koordinaten eines Punkteszuordnen. Qualitative und quantitative Variationen sind rein thematischer Natur.

Grafische Zeichen für linienförmige Objekte (Abb. 4.2(b)) zeichnen sich durch eine eindi-mensionale geometrische Variation aus, die zum Raumbezug gehört (der Linienver-lauf). Andere Variationen wie Linienstärke, -art, -farbe etc. sind Variationen in der

Page 58: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

46 Kapitel 4

Thematik. Eine Sonderform der Kodierung linienhafter Information ist die Verkettungpunktförmiger Signaturen in einer Linie.

Grafische Zeichen für flächenhafte Objekte (Abb 4.2(c)) werden in der Kartenebene zweidi-mensional geometrisch variiert. Hierbei kommen zumeist Farbtöne zum Einsatz, denk-bar ist aber auch die Ausbreitung von punkt- oder linienförmigen Signaturen in derFläche (Flächenschraffur durch Linien oder Kachelung der Fläche mit Hilfe von punkt-förmigen Zeichen).

Abb. 4.2: Kartografische Zeichen für Punkt-, Linien- und Flächenobjekte (mit geometrischen Variatio-nen bei linienförmigen und flächenhaften Objekten.

Grafische Zeichen mit mittelbarem Raumbezug

Die grafischen Zeichen mittelbaren Raumbezugs umfassen in der Regel die Beschriftun-gen. Beschriftungen, die semiotisch in der Systematik der Kartenzeichen als artfremdgelten, ergänzen grafische Zeichen unmittelbaren Raumbezugs und ermöglichen so, dieZeichen des grafischen Zeichensystems im Sinne einer Attributisierung durch weitereInformation zu ergänzen. Aus stummen Karten werden nun sprechende Karten.Beschriftungen dienen so zur Orientierung, Erläuterung und inhaltlichen Ergänzungder Karten [Imhof (1972) S. 235]. Dies kommt dadurch zur Geltung, dass die Beschrif-tung einen räumlichen Bezug zum durch sie beschrifteten Objekt aufweist, der sonstnicht eindeutig definiert ist. Der Kartograf nutzt bei der Platzierung der beschriftendenElemente die Assoziationsfähigkeit des Menschen aus, d.h. er platziert die Elemente so,dass der Bezug zum beschrifteten Objekt möglichst frei von Redundanz ist.

Beschriftungen sind der menschlichen Textdokumentierung entnommen, und bestehenaus Buchstaben, Ziffern und Satzzeichen als Singulärelementen, die zu Worten undZahlen als Elemente erster Komplexitätsstufe kombiniert werden. Weitere Komplexi-tätsstufen ergeben sich durch den Aufbau von Sätzen, Abschnitten bis hin zu ganzenTexten. Letztere sind bei kartografischen Dokumenten sehr selten, da sie sonst eineKarte zu einem anderen Dokumenttyp überführen würden. Die Singulärelemente sindi.d.R. begrenzt und abhängig vom verwendeten Alphabet. Komplexere Einheiten wieWörter und Sätze sind sprachspezifisch.

(a) (b) (c)

Page 59: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Kartografische Mustererkennung 47

Die Funktion der Beschriftungen ist vielfältig: Sie kann qualitative oder quantitativeBeschreibungen ermöglichen. Ortsnamen oder andere geografische Namen wie auchnähere Beschreibungen eines Einzelzeichens durch Text sind qualitative Beschreibun-gen. Die Angabe von Höhenzahlen beschreiben hingegen Linien oder punktförmigeObjekte mit Hilfe quantitativer Attribute.

4.3 Die kartografische Wissenbasis

Bevor wir uns der kartografischen Mustererkennung zuwenden, sollen die Bestandteileder kartografischen Wissensbasis erläutert werden. Dies ist insofern von Bedeutung, alsdass die meisten Mustererkennungsmethoden wissensbasiert arbeiten. Die Kenntnisder Wissensbasis für die Rekognitionsaufgabe ist daher unerlässlich.

Abb. 4.3: Zusammenhang von kartografischer und textlicher Wissensbasis.

Die Wissensbasis kartografischer Dokumente besteht aus zwei Teilbereichen. Der ersteBereich ist rein kartografischer Natur und deckt in der Regel den kartografischen Zei-chenvorrat ab. Er besteht aus der Sammlung der für die Kartenkodierung vorkommen-den, relevanten Zeichen in exemplarischer Form (Zeichenwissen). Der zweite Teilhingegen ergibt sich durch die Kartenbeschriftung, und erschliesst somit eine Wissens-basis, die zum Lesen von Textdokumenten benötigt wird (Textwissen).

Zeichenwissen

Das Zeichenwissen besteht aus der Sammlung aller Signaturen des Systems grafischerZeichen, die einen unmittelbaren Raumbezug aufweisen, mit Beschreibung und An-

Page 60: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

48 Kapitel 4

wendungsregeln. Zu jedem Zeichen wird eine geometrische Deklaration angegeben,eine Bedeutung zugeordnet (Semantik des Zeichens) und seine Anwendungsregeln(Syntax des Zeichens) definiert.

Geometrische Variationen der Linien- und Flächenzeichen spielen in der Wissensbasis,d.h. Kartenlegende, keine Rolle. Daher werden diese Signaturen exemplarisch in derLegende aufgeführt. Für die kartografische Wissensbasis ist dabei nur das Schema derlinien- und flächenhaften Kodierung massgeblich.

Das Zeichenwissen ist unabhängig von der Sprache und (Text-)Schrift des Kartenlesers- abgesehen von einigen Signaturen, deren grafische Ausprägungen auf Assoziationentextschriftlicher oder sprachlicher Natur beruhen. Zudem enthält es einen überschauba-ren Vorrat grafischer Zeichen und ist somit leicht erlern- und erwerbbar.

Textwissen

Das Textwissen, das durch die Beschriftungen in die kartografischen Dokumente ein-fliesst, weitet das in seiner Komplexität begrenzte Zeichenwissen aus. Es bestehtzunächst aus dem Wissen um die verwendeten alphanumerischen Text- und Satzzei-chen, welches in seiner Variation noch auf wenige Zeichen beschränkt ist. Die Kombi-nationsvielfalt (Bildung von Wörtern aus Buchstaben, Sätzen aus Wörtern etc.)erschliesst jedoch unzählige Darstellungsmöglichkeiten, denen die Semantik nunmehrsprachabhängig zugeordnet wird.

Trotz der Einbettung von Textwissen bleiben Karten auch für fremdsprachige Leserweitgehend lesbar. Das liegt daran, dass sich die Kartenbeschriftung nur geringfügigdes Textwissens bedient. Sätze und ganze Texte kommen i.d.R. nicht innerhalb derKarte vor, die Komplexität des Textwissens wird meistens nur bis zur Stufe von Wör-tern ausgenutzt.

Abb. 4.4: Ausschnitt aus der Legende der Schweizer Landeskarten [(L+T) (1998)].

In der kartografischen Legende wird hauptsächlich das Zeichenwissen niedergeschrie-ben. Dort werden geometrische Darstellungsformen mit einer semantischen Aussagebzw. einen Bedeutungsinhalt verknüpft (Abb. 4.4).

Weiter gehendes kartografisches Wissen ergibt sich aus den Regeln der Kartierung, ins-besondere der kartografischen Objektauswahl (die Frage, welche Objekte überhaupt

Page 61: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Kartografische Mustererkennung 49

kartiert werden) und der kartografischen Generalisierung (diese schliesst die Hierar-chieregeln bei sich konkurrierenden Darstellungen raumbezogener Information ein).

4.4 Methoden der kartografischen Mustererkennung

Bei der Mustererkennung geht es um die Automatisierung des Lese- und Interpretati-onsprozesses von Dokumenten. In der in Abb. 4.1 dargestellten Kommunikationskettehandelt es sich um die Übernahme des Dekodierungsprozesses des Kartenlesers durchComputer und rechnergestützte Systeme. Mustererkennung als Simulation dermenschlichen Fähigkeit, Bilder und Dokumente aller Art schnell und intuitiv zu erken-nen, zu erfassen, zu strukturieren und zu verstehen, ist eine höchst komplexe Aufga-benstellung der Bildverarbeitung (vgl. Kapitel 3). Da bei Mustererkennungsverfahrenfür ingenieurstechnische Anwendungen die Aufgabenkomplexität reduziert werdenmuss, ist die Betrachtung von spezifisch kartografischer Mustererkennung möglich.

Gleichsam wie das Kodieren von Information bei der Herstellung kartografischer Pro-dukte anders vonstatten läuft als bei gewöhnlichen Textdokumenten, so ist auch derDekodierungsprozess an die Spezifikationen des Dokumententyps gebunden. Mit Hilfeder in der kartografischen Wissensbasis abgespeicherten Regeln der kartografischenSignaturierung gelingt es nun, ähnlich wie bei Texterkennungsprogrammen, die sichauf die Analyse von Textdokumenten ausgerichtet haben, die Komplexität der allge-mein anwendbaren Mustererkennung auf das Kartenlesen zu reduzieren.

Anders ausgedrückt: Kartografische Mustererkennungsverfahren leisten im Wesentli-chen das Lesen und Verstehen kartografischer Dokumente unter Zuhilfenahme der kar-tografischen Wissensbasis. Ein solches System ist dann allerdings auf den Einsatzkartografischer Daten beschränkt und entspricht bei der Anwendung auf anderen Bil-dern und Dokumenten nicht mehr den Anforderungen an ein universelles Musterer-kennungssystem im Sinne der Computer Vision.

Im Gegensatz zur Mustererkennung von Bildern kommt der kartografischen Musterer-kennung zu Gute, dass die verwendeten Kartensignaturen stilisiert sind und unter demGesichtspunkt guter Unterscheidbarkeit entworfen wurden. Allerdings verbleibeneinige spezifische Schwierigkeiten, hauptsächlich als Folge des Umstands, dass sichSignaturen berühren oder schneiden, und ihr Aussehen so lokal erheblich verändertwerden kann [Boesch (1996), Stengele (1995), Weber (1988)].

Aufgabe der kartografischen Mustererkennung ist es, die kodierte (und somit implizitgespeicherte) Information des kartografischen Dokuments in explizit gegebene raumbe-zogene Information zu transformieren. Im Einzelnen umfasst dieses folgende Arbeits-vorgänge:34

34. vgl. auch Brügelmann (1998) und Weber (1988).

Page 62: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

50 Kapitel 4

• Erkennung punkthafter Signaturen in der Karte (auch Punktsignaturen, die einenLinienverlauf bilden, oder eine Fläche aufkacheln), dabei Desymbolisierung durchdie Reduktion auf einen Satz von Koordinaten mit semantischer Zuordnung,

• Erkennung linienhafter Signaturen in der Karte, inklusive Verzweigungen, Unter-brechungen, bei gebogenen Linien Auflösung durch Stützpunkte oder eventuell eineBeschreibung mittels Krümmungsparametern,

• Erkennung von flächenhaften Objekten wie Gebäude, Felsschraffen, Geröll, Wälderund Seen, teilweise durch Ausnutzung radiometrischer Eigenschaften (Farben fürWald und See) , teilweise durch Ausnutzung der Textur (Gebäude, Geröll, Gebirge),

• Erkennung der Beschriftungszeichen (Buchstaben, Ziffern), und die

• Zuordnung erkannter Einzelobjekte zu grösseren Einheiten: Aus Einzelsignaturenwird eine signaturierte Linie geformt, viele parallele Linien ergeben eine Flächen-schraffur, Linienelemente werden zu durchgehenden Linienzügen miteinander ver-bunden, die von anderen Linien berührt oder geschnitten werden, Buchstaben undZiffern ergeben Wörter und Zahlen, Wörter und eine Einzelsignatur sind wiebeschriftetes Objekt und Beschriftung einander zugeordnet etc.

Bei diesen hier grob skizzierten Arbeitsvorgängen lässt sich eine Aufteilung zwischeneiner originären Mustererkennung (Erfassung der Information direkt aus der Kartenvor-lage) und einer sekundären Mustererkennung (Verknüpfung bereits erfasster zu höher-wertiger Information) ausmachen. Neben den genannten Aufgaben treten noch einigespezielle Mustererkennungsaufgaben wie das Finden und Einmessen der Gitterkreuze,Gitternetzlinien oder anderen Lagepasspunkten auf. Diese besonderen Aufgabestellun-gen dienen auch zur Kontrolle der Georeferenzierung der Rasterdatenvorlage und lie-fern hierfür Korrekturwerte, falls sich aus den Gitterkreuzen und Passpunkten eineverfeinerte bildbezogene Georeferenzierung ermitteln lässt.

Bei der Kartografischen Mustererkennung sind laut Stengele et al. (1995) noch spezifi-sche Eigenschaften hervorzuheben:

• Karten sind gross dimensionierte Vorlagen, bei denen demzufolge auch grosseDatenmengen anfallen,

• die grössere Anzahl der Musterklassen infolge der komplexeren Signaturierung,

• das a priori bekannte kartografische Zeichensystem, die eine deterministische Erfas-sung ermöglichen, und

• die Eigenschaft, dass kartografische Bilder nur geringe radiometrische Variation auf-weisen. Vielfach können sie gar als binäre Bilder betrachten werden, wenn nur ein-zelne Layer betrachtet werden.

Methodisch lässt sich die kartografische Mustererkennung unterscheiden in rasterba-sierte und vektorbasierte Methoden, sowie kombinierte raster-vektorbasierte Methoden(sog. hybride Methoden). Bei den rasterbasierten Methoden findet die Mustererken-nung ausschliesslich in Rasterdaten statt, während bei vektorbasierten Methoden die

Page 63: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Kartografische Mustererkennung 51

Mustererkennung erst nach einer Raster-Vektor-Konversion einsetzt. Bei hybridenMethoden wird sowohl direkt auf die Rasterdaten wie auch auf dazugehörige Vektor-daten zurückgegriffen. Häufig kommen in Abhängigkeit von den Gegenständen derMustererkennung verschiedene Methoden zum Einsatz. Für die Signaturerkennungbietet sich z.B. das rasterbasierte Template Matching an. Liniendetektionen sind hinge-gen auf Vektorbasis sehr erfolgreich. Komplexere Objekte wie Gebäude und Felsschraf-fen werden häufig durch eine Kombination mehrerer Teilschritte raster- wievektorbasierter Methoden erkannt und extrahiert.

Mustererkennungsverfahren können überdies über verschiedene Automationsgradeverfügen, die von vollautomatisch bis manuell-interaktiv reichen. Bei der kartografi-schen Mustererkennung gilt jedoch das Bestreben einer möglichst vollautomatischenMustererkennung, da durch die klare und stilisierte Signaturierung viele Mustererken-nungsprobleme (vor allem radiometrischer Natur) nicht auftreten.

4.5 Ausgewählte Konzepte

4.5.1 Konzept von Stengele et al.

Bei den Konzepten der kartografischen Mustererkennung, die am Institut der Geodäsieund Photogrammetrie der Eidgenössischen Technischen Hochschule Zürich entwickeltwurden, steht der Gedanke im Vordergrund, nach dem Einscannen der analog vorlie-genden Karten auf automatisiertem Wege zum Aufbau von strukturiert angelegtenGeo-Informationssystemen zu gelangen [Stengele et al. (1995)]. Da die Erfassung raum-bezogener Daten zeit-, personal- und kostenintensiv ist, daneben aber in Form analogerKarten ein hoher und detailtreuer Bestand raumrelevanter Information vorliegt, kommtder kartografischen Mustererkennung eine Schlüsselrolle bei der preiswerten Beschaf-fung raumbezogener Information zu.

Im Mittelpunkt der Mustererkennungsmethoden steht das wissensbasierte TemplateMatching, ein Verfahren des Bildvergleichs mittels Korrelation, das bereits in 3.3.4beschrieben wurde. Einen weiteren Schwerpunkt bildet der gezielte Einsatz von lokalenRasteroperationen zur Herauslösung der Gebäudeflächen aus dem Schwarzlayer, aufdem Beschriftung, Gebäude und Linienobjekte gemeinsam dargestellt werden. Ziel istes, linienhafte Objekte von flächenförmigen Objekten durch eine Kombination mehre-rer einfacher lokaler Operationen zu trennen. Unter den verwendeten einfachen lokalenOperationen befinden sich Flächenfüllung, Abstandstransformation, Skelettierung, Ero-sion (Ausdünnung) und Dilatation (Verdickung).

Die von Nebiker entwickelte Methode der automatischen Vektorisierung von Gebäu-den eröffnet die Möglichkeit, aus den erhaltenen Gebäudesegmenten in Rasterform eineKonturvektorisierung der Gebäudeumrisslinien mittels Schätzverfahren durchzufüh-ren. Diese Methode führt neben einer Raster-Vektor-Konversion auch eine robuste Aus-

Page 64: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

52 Kapitel 4

gleichung durch, bei der typische Gebäudeeigenschaften wie parallel gegenüberliegende Hausseiten und rechtwinklige Ecken vorrangig angehalten werden [Nebiker(1995), Kanani (2000), Kanani und Carosio (2001)].

4.5.2 Erweiterungen von Frischknecht

Aufbauend auf die Entwicklungen von Stengele (4.5.1) hat Frischknecht im Rahmen sei-ner Dissertation [Frischknecht (1999)] einen neuen Weg der kartografischen Musterer-kennung beschritten. An Stelle konventioneller prozeduraler und wissensbasierterMethodik kommt hier eine merkmalsbasierte Abfragesprache zum Einsatz, mittelsderer gezielt auf Objekte und Inhalte der topografischen Karte zugegriffen werdenkann. Dieses Konzept ist für die vorliegende Arbeit so fundamental, dass es ausführlichim Kapitel 5 (zum Thema „Abfrage von Information“), und dort im Abschnitt 5.4behandelt wird.

4.5.3 Konzept Illert

Illert (1990) hat sich in seiner Dissertation mit der automatischen Erfassung der Karten-schrift, der Kartensymbole und Grundrissobjekte befasst und bezieht seine Arbeiten aufAnwendungen zur Deutschen Grundkarte (DGK) im Massstab 1:5000. Es werden unter-schiedliche Methoden der Mustererkennung eingesetzt. Ein besonderer Stellenwertkommt den Klassifikationsmethoden und den wissensbasierten Verfahren zu. Die vor-gestellten Prozeduren und Methoden zur Objektrekognition und -erfassung sind aufihre Leistungsfähigkeit bzgl. der DGK optimiert. Die Steuerung der dort vorgestelltenRoutinen erfolgt weit gehend prozedural oder wissensbasiert, nicht aber durch lingui-stisch formulierte Abfragen.

4.5.4 Konzept Mayer

Ausgehend von der Erfahrung, dass Menschen Karten jeder Komplexität lesen können,insbesondere auch dann, wenn die Angaben in der Legende nur unvollständig gemachtworden sind (z.B. die Fähigkeit, Trottoir- und Strassenbegrenzungslinie voneinanderunterscheiden zu können), stellt Mayer in seiner Dissertation [Mayer (1994)] die Theseauf, dass weitaus mehr Wissen als nur das Legendenwissen zur Karteninterpretationeingesetzt wird. Ausführlich geht Mayer auf die Modellierung der verschiedenen Wis-sensarten ein, und zeigt Wege zur Explizierung des Hintergrundwissens und ihren Ein-satz in der wissensbasierten Mustererkennung. Er geht hierbei insbesondere detailliertauf den Interpretationsprozess ein und trennt in seinem Modell vier Ebenen voneinan-der: sogenannte „semantische Objekte“, „Grafik und Text“, „Bild-Graf“ und „Bild“. DieKarteninterpretation fusst nunmehr auf Relationen zwischen diesen vier Ebenen. SeinKonzept findet v.A. bei Katasterkarten Anwendung, bei denen viele Objekte nicht inden Legenden explizit deklariert werden [vgl. Mayer et al. (1995) und Mayer (1996)].

Page 65: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Kartografische Mustererkennung 53

4.5.5 Konzept Lin

Lin beschreibt in seiner Dissertation „Ein Beitrag zur kartographischen Mustererken-nung mittels Methoden der Künstlichen Intelligenz“ [Lin (1994)] den Einsatz von FuzzySets und anderer Methoden der Künstlichen Intelligenz für die kartografischeMustererkennung. In seiner Arbeit geht er insbesondere auf die Methoden der Schrift-zeichenerkennung mit Hilfe von künstlichen Neuronalen Netzen ein. In der Grafiker-kennung werden einfache punktförmige Grafiksymbole durch eine direkte, komplexeregrafische Darstellungen hingegen durch eine indirekte Anwendung der Fuzzy-Logikdetektiert. Diese Arbeit versucht durch Methoden der Künstlichen Intelligenz unddurch die mathematisch-formale Beschreibung mit Fuzzy-Sets neue Wege in derMusterinterpretation zu beschreiten.

4.5.6 Konzept Samet und Soffer

Ein legenden-gesteuertes Verfahren zur Mustererkennung in kartografischen Doku-menten haben Samet und Soffer vorgestellt. Die Legende ist in diesem Konzept einewichtige Wissenskomponente für eine wissensbasierte Mustererkennungsmethode. Siewird daher zuerst eingesannt und anschliessend mit der Semantik verknüpft. In einemweiteren Schritt wird die Mustererkennung durchgeführt. Durch statistische Verfahrenund Klassifikationsalgorithmen werden dabei die semantisch verknüpften Signaturender Legende in der Karte wieder gefunden. Der hier zu Grunde liegende Ansatz gehtvon einem gezielten Einsatz des Wissens aus, und versucht Mustererkennungsmetho-den durch Wissensausnützung effizienter zu machen [Samet and Soffer (1994)].

Aus der Vielzahl von Konzepten für die kartografische Musterkennung, von denen hiernur ein kleiner Teil vorgestellt wurde, ist ersichtlich, dass die Interpretation kartografi-scher Karten auf sehr unterschiedliche Weise technische Realisierung erfährt. DieseVielfalt begründet sich darin, dass je nach Konzept schwerpunktmässig unterschiedli-che Problemstellungen im Vordergrund stehen, und die technischen Realisierung zurProblemlösung in unterschiedlichen Musterkennungsansätzen resultiert.

Page 66: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG
Page 67: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Kapitel 5

Abfrage von Information

5.1 Abfragen und Abfragesprachen

Abfragen

Abfragen dienen zur Gewinnung (Akquisition) von Information.35 Sie sind sie einHilfsmittel, um Information aus einem impliziten Zusammenhang herauszulösen undsie als explizite Information darzustellen (Abb. 5.1). Häufig ist Information nur implizitvorhanden, so sind etwa Daten in Form von Datensätzen in einer Datenbank abgespei-chert, die Botschaft eines Textes ist in Form von Buchstaben, Wörtern und Sätzen ineinem Textdokument abgelegt, und auch bei Bildern sind bildlich dargestellte Objekteoder andere Bildinformation auf dem Bildträger (dem Fotofilm, Fotopapier oder digitalim Rasterschema) abgespeichert.

Abb. 5.1: Schema der Informationsakquisition bzw. -gewinnung durch Abfragen.

35. Nach Wille (2000) kann man Information auch als „Daten + Bedeutung“ auffassen, so dass der Abfragedie Aufgabe der Gewinnung von Bedeutung (d.h. Semantik) zukommt.

Page 68: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

56 Kapitel 5

Explizite Information ist erst durch Verarbeitung erhältlich. Datenbanken müssendurch geeignetes Werkzeug ausgewertet werden und bei Bildern wird explizite Infor-mation durch die Betrachtung durch den Menschen (bzw. durch Bildverarbeitung beiComputern) gewonnen. Die Botschaft eines Textes oder einer Karte wird durch das Ent-schlüsseln der Zeichenfolgen bzw. der Signaturierung, was wir gemeinhin als Lesenbezeichnen, erschlossen werden. Wir können also den Zugriff auf Datenbanken, dasLesen von Texten, wie auch das Betrachten von Bildern allgemein als Explizierung vonimplizit gegebener Information bezeichnen. An Stelle von Explizierung verwenden wirauch die Begriffe Informationsakquisition, Informationsgewinnung oder kurz: Interpretation.Die Methoden, mittels derer die Interpretation vonstatten geht, sind je nach Informati-onsträger und Subjekt des Informationsbedürftigen verschieden. Bei Bildern wirdanders auf die Information „zugegriffen“ als bei Textdokumenten (Unterschiede zwi-schen Betrachten, Lesen, etc.). Dazu unterscheiden sich die Methoden bei Mensch undComputer [Cruse et al. (1998)].

Abfrage von Information hingegen ist eine spezielle Methode der Informationsakquisi-tion. Sie ist zielgerichtet und sticht insbesondere durch das rhematische36 Element hervor.Das bedeutet, dass der Abfragende sich durch das Stellen von Fragen zielgerichtet andas System mit der implizit gegebenen Information wendet und von diesem eine Ant-wort erwartet, welche die gewünschte Information explizit beinhaltet. Das Frage-Ant-wort-Schema ist eine ureigene Methode der Informationsgewinnung, die in derLinguistik, d.h. in Form von Sprache, vorkommt.

Abfragesprachen

Die Abfragesprache ist das System, in dem Abfragen sprachlich formuliert werden kön-nen. Es ist ein System von Schlüsselwörtern, die eine Sprachformulierung höherer Ord-nung zulassen, so wie es Samet in seiner Definition von Abfragesprachen (bei ihmbezogen auf Datenbanken) festhält: „A query language is a high-level computer languagewhich is preliminarily oriented towards the retrieval of data held in files or databases“ [zitiertaus Samet (1981)]. In Abfragesprachen bedarf es nun Schlüsselwörter, die es erlauben,Abfragen zu formulieren. In menschlichen Sprachen besteht im Allgemeinen eine aus-geprägte Redundanz, d.h. Fragestellungen können durch verschiedene, wenn auchnicht beliebige Kombinationen von Schlüsselwörtern formuliert werden. Für den Ein-satz bei Computern bemüht man sich hingegen um ein redundanzfreies Formulieren,wodurch Abfragekonstrukte im Allgemeinen schematisch ausfallen und klar struktu-riert sind. Eine solche schematisch aufgebaute Frageform erlaubt es – im Gegensatz zunatürlich gewachsenen und ständig Veränderungen unterworfenen menschlichen Spra-chen – neben der Redundanzfreiheit die Anzahl der Schlüsselwörter, also das Vokabu-lar gering zu halten und ihnen eine einfache Grammatik zu geben. Dieses ist einwichtiger Vorteil, denn so sind Sprachen schnell für neue Benutzerschichten erlernbar.Eine Anlehnung der Schlüsselwörter an Wörter des menschlichen Sprachgebrauchserhöht die Benutzerfreundlichkeit zusätzlich.37

36. von ρηµα [griech.] = Frage

Page 69: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Abfrage von Information 57

Syntax der Abfragesprachen

In Abfragesprachen wie SQL (= Structured Query Language), das sich zu einem Standardin der Datenbankabfragetechnik durchgerungen hat, taucht ein einheitliches Schemaauf, das auch über die Datenbankanwendungen hinaus immer wieder vorkommt: Es istdas dreigliederige SELECT-FROM-WHERE-Schema, mit dessen Hilfe Abfragen formu-liert werden (siehe Abb. 5.2). SELECT, FROM und WHERE sind der englischen Spracheentlehnte Schlüsselwörter, die folgende Bedeutung haben:

Abb. 5.2: Struktur einer SQL-Abfrage.

SELECT leitet den SELECT-Part ein, in welchem das Format und die Beschaffenheit derverlangten Information definiert wird. SELECT schreibt somit die Ausgabe der Infor-mation im Antwortsatz vor. SELECT * steht für die Ausgabe sämtlicher Information,durch SELECT Attr1, Attr2, ..., AttrN gelangen nur die spezifierten Teilattribute derGesamtinformation zur Ausgabe. Man spricht deshalb auch von einer Projektion bzw.Spaltenselektion, da partielle Ansichten auf die verlangte Information möglich werden.

FROM spezifiziert die Herkunft der Information, i.A. handelt es sich um Angabe desInformationsträgers durch seine Adresse (Dateiname, Bildname, Name der Datenbank-tabelle bzw. –entität etc.).

WHERE legt die sogenannten Abfragekriterien fest. Hinter der Angabe des WHERE-Schlüsselwortes steht ein logischer Ausdruck, der für jede Art von implizit gegebenerInformation einen Wahrheitswert liefert. Mit WHERE werden also aus der Gesamt-menge von Information nur diejenigen ausgewählt, bei denen der Wahrheitswert diewahre Aussage liefert (Zeilenselektion). Linguistisch gesehen wird ein komplexer rhe-matischer Baustein (i.e. eine Fragesequenz) durch den WHERE-Part auf eine logischeAussage mit zwei Zuständen (TRUE, FALSE) reduziert, wonach im Falle des Zutreffensder Wahrheitsaussage die Auswahl der Information, im Falle des Nichtzutreffens dasVerwerfen der Information erfolgt. Logische Ausdrücke im WHERE-Part können dabeiohne Weiteres auch aus Kombinationen von logischen Ausdrücken durch AND-, OR-,NOT- und anderen Verknüpfungen entstehen. Durch diese Verknüpfungsmöglichkeitwird die Zielgerichtetheit der Abfrage erhöht, und die Auswahl der Information sehrdetailliert eingegrenzt.

37. vgl. den Unterschied zwischen formalen und natürlichen Abfragesprachen [Bill (1999b) S. 331].

Page 70: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

58 Kapitel 5

5.2 Einsatzgebiete der Abfragesprachen

Abfragesprachen haben ihren Ursprung in der Datenbankanwendung, wie es sichbereits aus der Definition von Samet (1981) (s.o.) ergibt. Daher sind die meisten Anwen-dungen heutzutage in diesem Bereich zu finden. Mit dem Aufkommen von raumbezo-genen Datenbanken, deren Datensätze einen ausgeprägten Bezug zu raumbezogenenObjekten wie Punkt, Linie und Fläche haben, hielten erste Anwendungen raumbezoge-ner Abfragen Einzug. Die Betrachtung geografischer Informationssysteme (GIS) alsDatenbanksysteme mit Raumbezug ermöglichte diese Anwendung, wenn auch funda-mentale Unterschiede zwischen dem SQL-Abfragekonzept und dem GIS verbliebensind [Egenhofer (1992)]. Die Übertragung der Abfragefunktionalität auf andere raumbe-zogene Informationssysteme resultiert in einer Reihe von Konzepten, die unterschied-lich eng an die Abfragetechnik der Datenbanken angelehnt sind.

5.2.1 Abfragen als Datenbankwerkzeug

Die Aufgabe einer Abfragesprache im Bereich von Datenbanken ist es, mit Hilfe vongrammatisch festgelegten Sprachkonstrukten Informationen aus Datenbanken zu ent-nehmen. Da in den Datenbanken enthaltene Information durch das Datenbankschemaeine feste Struktur besitzt, können gezielt Attributswerte in den Datensätzen durchlogische Ausdrücke erfragt werden.

Wie schon in 5.1 erwähnt, sticht im Datenbankbereich die Abfragesprache SQLbesonders hervor. Mit der Entwicklung38 von SQL in den Siebziger Jahren wurde über-haupt erst der Durchbruch nicht-prozeduraler39 Sprachen für die Informationsgewin-nung erzielt. Nach Bill (1999a) besteht SQL im heutigen Standard aus den TeilbereichenDatendefinitions- (DDL, data definition language), Datenmanipulations- (DML, datamanipulation language), und Datenkontrollsprache (DCL, data control language), derDatenbankadministration, dem Datenbankmanagementsystem, den zulässigen Stan-darddatentypen und Standardoperatoren. Ferner enthält es Schnittstellen für die Ein-bindung von SQL in Programmiersprachen wie C/C++, Java, Fortran, Pascal, etc. [Bill(1999a) S. 133f.]. Datendefinition und –manipulation bilden dabei den Kernbereich derAbfragesprache, die Datenkontrolle ist ein Hilfsmittel zur Einhaltung notwendigerKonsistenzen in den Datenbeständen. Der für die gezielte Informationsgewinnung ausDatenbanken entscheidende Teilbereich von SQL ist die Datenmanipulationssprache[u.A. Bartelme (1995) S. 294-309, Carosio (1999) S. 56-64, Matthiesen und Unterstein (1997)S. 116f].

38. Zur Historie von SQL und der Entwicklung des SQL-Standards geben Matthiesen und Unterstein (1997)S. 115f., für die Entwicklungen nach 1997 (Oracle) (2000) Auskunft.

39. "Nicht-prozedural" bedeutet in dem Zusammenhang, dass in der sprachlichen Ausformulierung derAbfragesprachen keine Spezifikation zur konkreten Ausführung der Abfrage enthalten ist [Matthiesenund Unterstein (1997) S. 117f., Frischknecht (1999) S. 59].

Page 71: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Abfrage von Information 59

Die Abfragen mit SQL basieren bei relationalen Datenbanken auf Operationen der Rela-tionalen Algebra, unter denen die Vereinigung, die Differenz, die Projektion, die Selek-tion und das kartesische Produkt zu erwähnen sind [u.A. Matthiesen und Unterstein(1997) S. 75-114, Bartelme (1995) S. 274-277, Bauknecht und Zehnder (1997) S. 131, Carosio(1999) S. 50-55].

Auch für objektorientierte Datenbanken (ODB) gibt es Abfragesprachen, so z.B. OQL(object query language); auf die besonderen Spezifikationen geht hierbei Hohenstein et al.(1996) ein. Allgemeines zu Abfragen und Abfrageprozessen in höheren Datenbanksy-stemen findet sich ferner im Sammelband von Freytag et al. (1994).

5.2.2 Abfragen aus raumbezogenen Datenbanken

So wie Abfragen bei gewöhnlichen Datenbanken eingesetzt werden, ist es auch mög-lich, sie auf raumbezogene Datenbanken anzuwenden. Abfragen können sich dabeistärker auf Abfragen thematischer Natur oder geometrischer Natur beziehen. Raumbe-zogene Datenbanken dienen häufig dazu, thematische Daten mit einem Raumbezug zuversehen. Häufig sind die Abfragen vorwiegend auf rein thematische Attribute geogra-fischer Daten bezogen, und lediglich die Abfrageresultate werden mit den entsprechen-den geografischen Daten verknüpft in einer Karte visualisiert.

Von der Möglichkeit, auch stärker im geometrischen Bereich raumbezogener Informatio-nen abzufragen, machen verschiedene vektor- und rasterbasierte raumbezogene Abfra-gesprachen Gebrauch. Werden punkt-, linien- und flächenhafte Objekte als Objekteeiner Datenbank aufgefasst, so sind auch in solchen speziellen raumbezogenen Daten-banken Abfragen durchführbar. Es geht aber auch um komplexere raumbezogeneInformation wie topologische Objektbeziehungen, geometrische Objekteigenschaften,thematische Attribute und Kombinationen aus diesen. Komplexere Raumbezügebedürfen nach Bill(1999b) nicht nur einer Anpassung bereits existierender Abfragespra-chen, sondern auch einer höherwertigen Sprachkomplexität.40

Zu unterscheiden sind dabei Abfragesprachen für vektorbasierte raumbezogene Daten-banken, wie z.B. „GISQL“ von Costagliola et al. (1995) und Abfragesprachen für rasterba-sierte raumbezogene Datenbanken wie z.B. „RasQL“ von Widmann und Baumann (1998).Eine Auflistung weiterer Abfragesprachen für vektor- bzw. rasterbasierte raumbezo-gene Datenbanken ist bei Bill(1999b) S. 333-336 und bei Frischknecht (1999) S. 63-66 zufinden. In Letzterem wird auch die Abfragesprache „RaQueL“ vorgestellt, die mit einerobjektbezogenen Merkmalsdatenbank räumlich-geometrischer Attribute arbeitet (vgl.Abschnitt 5.5).

40. vgl. ebd. S. 330-336.

Page 72: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

60 Kapitel 5

5.3 Unscharfe Abfragen, Fuzzy-Sets und linguistische Variablen

Bislang wurden nur Abfragen betrachtet, bei denen sich die Information mit Hilfe logi-scher Ausdrücke gezielt eingrenzen lässt. Mit dem Aufkommen der Fuzzy-Sets und derdaraus abgeleiteten Fuzzy-Logik gegen Ende der Sechziger Jahre [Zadeh (1965)] ist esmöglich geworden, im Bereich der Logik neue Wege zu beschreiten. Fuzzy-Sets und dieFuzzy-Logik sind Hilfsmittel, um unscharfe bzw. vage Sachverhalte formal zu beschrei-ben [Wang (1994)]. Dieser Abschnitt behandelt Möglichkeiten, auf diese Weiseunscharfe bzw. vage Abfragen zu formulieren und für Anwendungen bereitzustellen.

5.3.1 Einführung von Unschärfe in Abfragen

Die bisher vorgestellten Abfragen und Abfragemechanismen gehen von einer scharfenAussagenlogik aus und zwar in zweifacher Hinsicht:

• Die Abfrage ist mit aussagenlogisch klaren Schlüsselwörtern, Attributen und Opera-toren formuliert. Es werden keine vagen Ausdrucksweisen verwendet wie „Findealle Orte, an denen es heiss ist“, „Suche alle Gebäude, die ungefähr so hoch sind wieder Kölner Dom“ oder „Extrahiere Linien, die nahezu parallel sind“ (die vagenBegriffe sind hierbei unterstrichen).

• Bei der Durchführung der Abfrage wird die Menge der Gesamtinformation scharf inzwei disjunkte Mengen geteilt: in diejenige Information, die auf die Abfrage zutrifft,und diejenige, die nicht zutrifft. Unter der in Betracht kommende Information wirdnur der Anteil in der Präsentation des Abfrageresultats berücksichtigt, bei dem dieKriterien der Abfrage gänzlich zutreffen. Information, die nur teilweise, „fast“ oder„bis auf Weniges“ zutrifft, findet keine Berücksichtigung im Abfrageresultat.

Nun wäre es aber denkbar, sowohl in der Formulierung der Abfrage als auch beimAbfrageresultat Unschärfe einzuführen und zwar unabhängig voneinander. Es ergebensich folgende vier Konstellationen:

• Scharfe Formulierung der Abfrage und scharfes Abfrageresultat: Der Gegenstand derAbfrage ist klar umrissen (Formulierung beinhaltet keine Unschärfe), und nur dieje-nige Information wird im Abfrageresultat berücksichtigt, die hundertprozentig aufdie gestellte Abfrage zutrifft (Abb. 5.3(a)). Dieses Konzept entspricht den bisher übli-cherweise verwendeten „exakten“ Abfragen.

• Scharfe Formulierung der Abfrage und unscharfes Abfrageresultat: Die Abfrage wirdohne Unschärfe formuliert, die Ausgabe des Abfrageresultats beinhaltet jedoch auchdiejenige Information, die die Abfragekriterien nahezu, aber nicht exakt erfüllt. Hier-bei sollte bei der Ausgabe des Abfrageresultats der Grad des Zutreffens angegebenwerden (Abb. 5.3(b)).

• Unscharfe Formulierung der Abfrage und scharfes Abfrageresultat: Die Abfrageerhält vage Schlüsselwörter, Attribute oder Operatoren. Dadurch wird der Gegen-

Page 73: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Abfrage von Information 61

stand der Abfrage im Bereich des Vagen erweitert. Für die Durchführung derAbfrage gelangen jedoch nur diejenigen Informationen ins Abfrageresultat, die derAbfrage oder ihrer Auslegung im Bereich der Vagheit voll zutreffen (Abb. 5.3(c)).

• Unscharfe Formulierung der Abfrage und unscharfes Abfrageresultat: Sowohl dieFormulierung als auch die Durchführung der Abfrage sind mit Unschärfe belegt. ImResultat ist die Menge der ausgewählten Information durch die Vagheit in der Ab-frageformulierung und der Durchführung am weitesten ausgedehnt (Abb. 5.3(d)).

Die Konstellationen scharfer und unscharfer Abfragen sind in Abb. 5.3 schematisch dar-gestellt.

Abb. 5.3: Konstellationen scharfer und unscharfer Abfragen.

Die Modellierung unscharfer Abfragen (sowohl bezüglich der Formulierung, als auchbezüglich der Resultatfeststellung) kann mit Hilfe der Fuzzy-Logik bzw. der Fuzzy-Setserfolgen, auf die im nächsten Unterabschnitt eingegangen wird.

5.3.2 Fuzzy-Sets und linguistische Variablen

Die Fuzzy-Sets und die Fuzzy-Logik sind erstmals in den Sechziger Jahren von Zadeh(1965) erörtert worden. Das Zugrundelegen einer nicht scharfen Aussagenlogik mit ent-sprechenden Regeln des logischen Schliessens hat sowohl im theoretisch-mathemati-schen wie auch im praktisch-ingenieurwissenschaftlichen Be-reich neue Möglichkeitenzum Verständnis, zur Modellierung und zur Simulierung von Sachverhalten eröffnet.

In der ingenieurwissenschaftlichen Disziplin hat sich die Erkenntnis durchgesetzt, dasssich viele Steuerungs- und Entscheidungsprozesse sehr gut mit den Ansätzen modellie-ren liessen, welche die Fuzzy-Sets boten. Insbesondere ist zu unterstreichen, dass

(a) (b)

(c) (d)

Page 74: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

62 Kapitel 5

Fuzzy-Logik eine weitaus bessere Simulierung menschlichen Verhaltens, Denkens, Fol-gerns und Schliessens zulässt als die Methoden der exakten Wissenschaften. Diesesliegt mitunter daran, dass das menschliche Denken und Entscheiden aufs Engste mitder Sprache bzw. der sprachlichen Formulierung verbunden ist [Böhme (1993) S. 1]. Soist die menschliche Sprache seit je her von Unschärfe geprägt. Die meisten Aussagen,Fragen und Feststellungen implizieren mehr oder weniger Unschärfe, allerdings ohnedass die menschliche Kommunikation darunter leidet. Vielmehr wird menschlicheKommunikation erst ermöglicht, wenn Unschärfe, d.h. Fuzziness in der Sprache enthal-ten ist [Böhme (1993) a.a.O.].

Der Vergleich der gewöhnlichen menschlichen Sprache, in der schwierig zu erfassendeSachverhalte problemlos durch nicht-exakte Begriffe zum Ausdruck gebracht werdenkönnen, mit den auf Exaktheit angelegten Programmier- und Skriptsprachen zeigt dieÜberlegenheit menschlicher Sprache bezüglich der Kommunikation, und damit auchletztlich in Bezug auf die Fähigkeit, Entscheidungen für anstehende Fragestellungenund Probleme zu finden. Die Exaktheit und weit gehende Redundanzlosigkeit der heu-tigen Programmier- und Skriptsprachen ist für eine Kommunikation insofern lähmendund hinderlich, als dass jeder Sachverhalt bis ins letzte Detail nur durch einen einzigenpassenden Ausdruck beschrieben werden kann, unterstütz durch die strengen syntakti-schen Regeln.

Das, was Fuzzy-Sets und die Fuzzy-Logik bieten, ist eine Möglichkeit, menschlichesDenken und Schliessen nunmehr formal methodisch zu beschreiben. Dies haben sowohldie Mathematiker erkannt, die Grundlagenforschung betreiben, als auch in einemerheblich bedeutenderen Masse die Ingenieure, die Expertensysteme für ihre Anwen-dungsbereiche entwickeln [Gottwald (1993)].

Fuzzy-Sets

Fuzzy-Sets lassen sich aus der klassischen Mengenlehre ableiten. Wird, wie in Abb.5.4(a) eine zweidimensionale Grundgesamtheit Ω mit einer in ihr enthaltenen Menge Abetrachtet, so ergibt in der klassischen Mengenlehre für jeden Punkt der zweidimensio-nalen Grundgesamtheit seine Zugehörigkeitsfunktion aus

[5.1]

bzw. aussagenlogisch ausgedrückt

[5.2]

Die Funktion χ gibt die Mitgliedschaft zur Menge A ⊂ Ω an.

χ p( ) 1 wenn p A∈,0 wenn p A∉,

=

χ p( ) 1, wenn die Aussage (p A) wahr ist, d.h. (p A∈ ) = TRUE ∈0, wenn die Aussage p A∈( ) falsch ist, d.h. p A∈( ) = FALSE

=

Page 75: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Abfrage von Information 63

Fuzzy-Sets werden auf einfache Weise dadurch erhalten, dass der Wertebereich derFunktion χ von bisher χ→ [0,1] ⊂ Z, d.h. mit nur ganzzahligen Zuständen 0 und 1, nachχ→ [0...1]⊂ R (mit reellwertigen Zustände) erweitert wird.

Die Menge A würde als Fuzzy-Set in der Weise dargestellt werden, dass es Bereichegibt, in denen ein Punkt p ganz zu A oder ganz ausserhalb von A liegt, aber auch einenÜbergangsbereich, in welchem p teilweise in A als auch teilweise ausserhalb von A liegt(Abb. 5.4(b)).

Abb. 5.4: Zweidimensionale Grundgesamtheit Ω mit Untermenge A mit der Mitgliedschaftfunktion χfür Punkte (a) bei aussagenlogischer Betrachtung und (b) als Fuzzy-Set.

Ein weiteres Beispiel ist die Modellierung der Aussage „Reelle Zahl x ist gleich vier“. Inder klassischen Aussagenlogik würde für die Mitgliedschaftsfunktion χ, angewandt aufreelle Zahlen gelten:

[5.3]

Grafisch ergibt sich für χ(x) die Abbildung 5.5(a).

Mit einem Fuzzy-Set wie

[5.4]

ergibt sich 5.5(b). Die Mitgliedschaftsfunktion, im Falle der Fuzzy-Sets auch Fuzzy-Membership-Funktion genannt, modelliert hier auf andere Weise die Aussage „ReelleZahl x ist gleich vier“. Zahlen, die in der näheren Umgebung der Zahl vier liegen, erhal-ten in der Funktion χ von 0 verschiedene Werte zugeordnet, die sich sprachlich durch„nahe bei vier“ oder „sehr nahe bei vier“ ausdrücken lassen.

(a) (b)

χ x( ) 1, wenn x = 40 wenn x 4≠,

=

χ x( ) 1 x 4–– für 3 x 5≤ ≤0 sonst

=

Page 76: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

64 Kapitel 5

Fuzzy-Sets bieten eine formale Methode, vage Ausdrücke wie „nahe bei“, „ungefähr“oder „fast“ zu beschreiben und zu modellieren (sog. linguistische Variablen, s.u.). Eskönnen sehr unterschiedliche Fuzzy-Sets erzeugt werden – je nach Wahl der Fuzzy-Membership-Funktion. Solche Funktionen sollten allerdings modellgerecht gewähltwerden. Wenn an sich scharfe Sachverhalte wie z.B. im obigen Beispiel die Aussage„Reelle Zahl x ist gleich vier“ bewusst mit Unschärfe belegt werden sollen, spricht manvon Fuzzifizierung.

Abb. 5.5: Modellierung der Aussage „Reelle Zahl x ist gleich vier“ mit Hilfe (a) der klassischen Aussa-genlogik und (b) mit Hilfe eines Fuzzy-Sets.

Fuzzy-Logik ist die den Fuzzy-Sets zu Grunde liegende Logik, nach der neben denWahrheitszuständen TRUE (Wert = 1) und FALSE (Wert = 0) Zwischenzustände (Wertezwischen 0 und 1) eingeführt werden können.

Aus der Einführung von Fuzzy-Sets und Fuzzy-Logik ergeben sich eine ganze Reihevon Konsequenzen für die Mengenlehre und für die Aussagenlogik. Das Rechnen mitFuzzy-Sets (etwa eine Addition von Zahlen, die wie die vier im obigen Beispiel fuzzifi-ziert wurden), die Regeln der Mengenlehre (Vereinigung und Schnitt unscharf definier-ter Mengen), aber auch die Kombination fuzzy-logischer Ausdrücke mit AND- und ORzu neuen fuzzy-logischen Aussagen ist Bestandteil der mathematischen Disziplin, dieauf die Fuzzy-Sets aufbaut. Für weiter gehende Überlegungen und Details wird auf ent-sprechende Literatur verwiesen [Böhme (1993) und Gottwald (1993)].

Fuzzifizierung und Defuzzifizierung

Die Überführung eines exakten Sachverhaltes (z.B. einer exakt definierten Menge oderZahl, einer aussagenlogisch scharfen Aussage) in einen vagen Sachverhalt (Beschrei-bung als Fuzzy-Set bzw. durch Fuzzy-Logik) bezeichnet man als Fuzzifizierung.41

(a) (b)

41. engl. fuzzification, im dt. auch als „Fuzzifikation“ bezeichnet [vgl. Palm (1999), Wang (1994)].

Page 77: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Abfrage von Information 65

Defuzzifizierung42 ist in gewisser Weise die Umkehrung der Fuzzifizierung. Wird beider Fuzzifizierung ein Sachverhalt unscharf modelliert, so bedeutet Defuzzifizierungnichts anderes, als einen unscharf definierten Sachverhalt wieder in den klassisch-aus-sagenlogischen Bereich zurück zu transformieren. Fuzzy-Sets oder fuzzy-logischeSchlüsse werden wieder in scharf abgegrenzte Sachverhalte überführt [Wang (1994)].

Abb. 5.6: Schema zur Fuzzifizierung und Defuzzifizierung am Beispiel einer zweidimensionalenPunktmenge.

Die Fuzzifizierung erfolgt in der Regel durch Modellierung mit Fuzzy-Sets oder durchErweiterung der logischen Wertemenge TRUE; FALSE auf ein reelles Intervall [0...1].Sachverhalte, die sich exakt beschreiben lassen, können problemlos in die Welt derFuzzy-Sets und der Fuzzy-Logik eingebettet werden.

Bei der Defuzzifizierung hingegen besteht das Problem, die Zwischenzustände derMembership-Funktionen bzw. der Wahrheitswerte sinnvoll auf die Werte 1 (TRUE)und 0 (FALSE) aufzuteilen. Dazu bedarf es sogenannter Defuzzifikatoren. Im einfach-sten Falle ist ein Defuzzifikator ein Schwellwertoperator, der den Wertebereich mitHilfe eines Schwellwertes auf die zwei boolschen Zustände (TRUE, FALSE) zuordnet.Kompliziertere Defuzzifikatoren berechnen exakte Zustände durch Gewichtungen,Integrationen oder Normberechnungen im gesamten Bereich des Fuzzy-Sets.

Eine weitere Defuzzifizierungsmöglichkeit besteht im Gegeneinander-Abgrenzenzweier Fuzzy-Sets. Nehmen wir einmal an, es seien alle Zahlen gesucht, die in der Nähevon vier liegen, sich aber signifikant von drei unterscheiden. Mit den Fuzzy-Sets χ4 undχ3 für die Zahlen vier und drei, die gemäss Formel [5.4] gebildet werden, ergibt Abb.5.7. χ3 ist dabei das Alternativ-Fuzzy-Set und konkurriert zu χ4. Eine Defuzzifizierungs-möglichkeit besteht mit dem Maximum positiver Membership-Werte, wonach als Er-gebnis für Zahlen nahe bei vier das asymmetrische Intervall [3.5 ... 5.0[ erhalten wird.43

42. Der Begriff „Defuzzifizierung“ wird von Zimmermann (1999), Lehmann (1999) oder Centeno (1998) ver-wendet. Gleichbedeutend hiermit ist der Begriff „Defuzzifizikation“ [vgl. Palm (1999), Wang (1994)].

43. Die Assymmetrie ergibt sich aus dem Zusatz „... aber signifikant von drei verschiedene Zahlen“.

Page 78: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

66 Kapitel 5

Abb. 5.7: Defuzzifizierung durch das Maximum zweier konkurrierender Fuzzy-Sets.

Fuzzy-Control

Fuzzifizierung und Defuzzifizierung werden bei der Fuzzy-Regelung (Fuzzy-Control)benötigt. Ziel des Fuzzy-Control ist die Regelung komplexer Vorgänge etwa in derAutomation und Robotik. Es wird eingesetzt, wenn die Gesetzmässigkeiten oder Me-thoden zur Regelung so komplex sind, dass der Rechenaufwand für eine exakte Rege-lung in keinem Verhältnis zur Aufgabe steht. Der Regelungsmechanismus beim Fuzzy-Control besteht aus drei Komponenten: Fuzzifizierung, Inferenz (Regelglied) undDefuzzifizierung. Die Entscheidung (Regelung) eines Vorganges erfolgt im unscharfenZustand im Regelglied, und ist erheblich weniger komplex als ohne Fuzzifizierung. Dasdefuzzifizierte Endresultat ergibt nicht zwangsläufig die Lösung des exakten Weges,doch es kommt sehr nahe an sie heran [Palm (1999), Centeno (1998) S. 257].

Ein Beispiel der Fuzzy-Regelung ist der Velofahrer. Die Gesetzmässigkeiten für dasGleichgewicht eines bewegten Systems sind sehr kompliziert, und kaum ein Velofahrerkennt die Abhängigkeiten einzelner Parameter im Detail. Dennoch schafft er es, dasGleichgewicht stets beizubehalten, indem er vage regelt: Er steuert stets dem Ungleich-gewicht entgegen, wenn er entsprechende Lenkbewegungen bzw. eine entsprechendeLagerung des Schwerpunktes seines Körpers vornimmt. So kann er mit einfachenRegelfaktoren (Lenkung, Körperlagerung) einen hochkomplexen Vorgang steuern.

Linguistische Variable

Linguistische Variablen sind Sprachkonstrukte der Alltagssprache, deren Zuordnung zurSemantik nicht exakt, sondern durch Fuzzy-Membership-Funktionen deklariert wird.Abb. 5.8 zeigt ein Beispiel zur Definition linguistischer Variablen.

Für die Temperatur 16°C ergibt sich hieraus eine Aussage

,χ 16°C ist warm( ) 0.5=

χ 16°C ist kalt( ) 0.4=

Page 79: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Abfrage von Information 67

mit welcher die umgangssprachlich gebrauchte Formulierung „16°C ist zwar schoneher warm, aber auch noch ziemlich kalt“ modelliert werden kann.

Abb. 5.8: Linguistische Variable „kalt“ und „warm“ auf der Temperaturskala.

Linguistische Variablen dienen dazu, Sachverhalte mit unscharfer Abgrenzung (wiez.B. die Unschärfe des Begriffes „kalt“ bezogen auf die Temperaturskala) formal zuerfassen. Vage Begriffe werden auf diese Weise für ein methodisch exaktes Vorgehensinnvoll beschrieben und handhabbar.44

5.3.3 Einsatz von Fuzzy-Sets und linguistischen Variablen in Abfragen

Unschärfe kann auf zwei verschiedene Arten in Abfragen eingeführt werden: alsunscharfe Formulierung der Abfrage bzw. in einer Unschärfe tolerierenden Abfrage-ausführung (vgl. 5.3.1). Für beide Fälle sollen hier konkrete Möglichkeiten erörtert wer-den, die gewünschte Unschärfe mit Hilfe von Fuzzy-Sets bzw. linguistischen Variableneinzuführen.

Unscharfe Abfrageformulierung

Abfragen unscharf zu formulieren, gelingt mit Hilfe geeigneter linguistischer Variablen.An die Stelle exakter Abfrageformulierungen treten unscharfe Formulierungen. Dabeibezieht sich die Unschärfe hauptsächlich auf Formulierungen im selektierendenWHERE-Teil der Abfrage. Dem konventionellen Schema der Formulierung logischerAusdrücke folgend, das von einer Abfolge Attributsvariable (attribute) – Vergleichsopera-tor (operator) – Vergleichswert (value) ausgeht, kann Unschärfe sowohl für den Operatorals auch für die Vergleichswerte eingeführt werden.45

44. Weitere Beispiele für linguistische Variablen befinden sich in Lin (1994) und Centeno (1998).45. Nach Wang (1994) ist ein fuzzy-logischer Ausdruck im WHERE-Teil gegeben durch „x is F“, in dem x

das Vergleichsattribut bezeichnet und F ein unscharfer Operator-Wert-Ausdruck ist. Neben unscharfemOperator und unscharfer Wertemenge betrachtet Wang noch unscharfe Modifizierungen „sehr gross“statt „gross“ und implizite Zusammenhänge zwischen den Vergleichsattributen und –werten, diedurch unscharfe wie scharfe Funktionen beschrieben werden können.

Page 80: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

68 Kapitel 5

Mit einem unscharfen Operator wie „NAHE_BEI“ erhält man als Abfrage

SELECT * FROM Student WHERE Alter NAHE_BEI 25, [5.5]

dessen logischer Ausdruck (hinter WHERE) mit Fuzzy-Logik zu interpretieren ist.Unschärfe im Vergleichswert wird bei der Abfrage

SELECT * FROM Student WHERE Körpergrösse = gross [5.6]

durch den linguistischen Term „gross“ erreicht.

Beide Möglichkeiten, die Einführung linguistischer Terme bei der Attributswertemengesowie beim Abfrageoperator, führen zu einer syntaktisch unscharfen Formulierung derAbfrage. Die gleichzeitige Einführung linguistischer Variablen, sowohl bei der Attri-butswertemenge als auch beim Operator, ist ebenso denkbar.

Unscharfe Abfrageausführung

Ungleich schwieriger als die Einführung unscharfer Formulierungen in der Abfrage isteine operationell unscharfe Ausführung der Abfrage.46 Auf der Ebene dieser Abfrage-durchführung ist der Einsatz von Fuzzy-Sets bzw. der Fuzzy-Logik zu überlegen.Fuzzy-Logik kann zum Einsatz kommen, wenn der logische Ausdruck im WHERE-Parteines SQL-Ausdrucks Werte annehmen kann, die nicht mehr ausschliesslich aus denbeiden Zuständen „TRUE“ und „FALSE“ bestehen.47 Der operative Prozess, der zurInterpretation von fuzzy-logischen Ausdrücken führt, erfolgt dann z.B. mit Hilfe vonFuzzy-Sets [Wang (1994)].

An einem Beispiel soll gezeigt werden, wie eine Abfrage unscharf ausgeführt werdenkann. Nehmen wir an, die Abfrage48 sei gegeben durch

SELECT * FROM Student WHERE Körpergrösse = 192[cm] [5.7]

Werden Körpergrössen in der Datenbank „Student“ millimetergenau erfasst, so wird inder Praxis kaum ein Student diesen Wert exakt treffen.

46. Dabei müssen die betrachteten Abfragen nicht notwendig unscharf formuliert sein. Es ist durchausmöglich, eine mathematisch exakt formulierte Abfrage unscharf auszuwerten. Ebenso ist es denkbar,Abfragen mit linguistischen Variablen exakt auszuführen, wenn die linguistischen Variablen vor derAuswertung defuzzifiziert werden.

47. Eine gründliche Erörterung darüber, wo in Abfragen die Einführung von Unschärfe möglich ist, findetsich in Wang (1994).

48. Es sei noch einmal darauf hingewiesen, dass auch exakt formulierte Abfragen unscharf ausgewertetwerden können. An Stelle von [5.7] könnte man sich auch eine unscharf formulierte Abfrage vorstellen,in welcher der Gleichheitsoperator durch „NAHE_BEI“ ersetzt wird.

Page 81: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Abfrage von Information 69

An Stelle des exakten Wertes von 192cm wird jetzt ein Fuzzy-Set eingeführt, ähnlichwie bei Formel [5.4]:

[5.8]

Bei der Ausführung der Abfrage treten bei Datensätzen im Bereich von 190cm bis194cm von (gänzlich) FALSE verschiedene Aussagen auf. Es ergeben sich also i.A. deut-lich mehr Datensätze als bei der logisch exakten Durchführung der Abfrage. Das Abfra-geresultat kann nun entweder unscharf repräsentiert werden, d.h. zu jedem nichtvollständig nicht zutreffenden Datensatz wird das Mass des Zutreffens angegeben,oder das Resultat wird defuzzifiziert. Defuzzifizieren könnte in diesem Fall bedeuten,dass gefordert wird, dass das Zutreffen des logischen Ausdrucks mindestens einenSchwellwert von z.B. 0.5 überschreiten muss, wodurch die Abfrage [5.7] ausgewertetwird wie eine exakte Abfrage:

SELECT * FROM Student [5.9]WHERE Körpergrösse >= 191[cm]

AND Körpergrösse <= 193[cm]

Man erhält somit ein Intervall um den exakten Wert von 192.00cm, und somit auch alsResultat Studenten, deren Wert in der Nähe von 192.00cm liegt.

5.3.4 Anwendung von unscharfen Abfragen

Eine ausführliche Behandlung fuzzifizierter Abfragen findet sich beim Ansatz einesFuzzy Query von Wang (1994). Neben einer ausführlichen theoretischen Erörterung zurEinführung von Fuzzy-Logik bei den Abfragen gibt Wang Beispiele von modifiziertenAbfragesprachen für ein Geo-Informationssystem, das in „ArcInfo“ implementiert ist.Hier werden Abfragen mit vagen Ausdrücken (hohe Temperatur, sehr hohe Tempera-tur, etc.) formuliert. Entscheidend für die Durchführung ist die zu Grunde liegendeDefuzzifizierungsstrategie: Anhand fest vorgegebener Fuzzy-Sets zur Modellierungvager Ausdrücke wird zunächst eine unscharfe Selektion in der Datenbank getroffen.Defuzzifiziert wird mit Hilfe eines einfachen Schwellwerts, der bei 0.75 liegt.

5.4 Abfragen aus Rasterdaten

Abfragesprachen sind, wie oben mehrfach ausgeführt, ein Hilfsmittel zur Informations-gewinnung. Bezogen auf die Informationsbeschaffung aus Rasterdaten, insbesondereaus Bildern im Rasterdatenformat, legt dieses den Ansatz nahe, die Werkzeuge derBildinterpretation durch Abfragen auszudrücken und als solche zu handhaben. Beim

χ1921 1

2--- 192 x–⋅– für x 192– 2≤

0 sonst

=

Page 82: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

70 Kapitel 5

Bemühen, Attribute, Datenbank (als Datenquelle), Bedingungen und Ausgabeformateaus dem Datenbank-Abfragevokabular auf den Bereich der Rasterbildverarbeitung zuübertragen, ergeben sich grundsätzlich zwei Ansätze, die im Folgenden der indirekteund der direkte Abfrageansatz genannt werden.

Abb. 5.9: Schema der indirekten Abfrage aus Rasterdaten mit Hilfe einer Transformation des Raster-bildes in eine Datenbank.

5.4.1 Indirekte Abfrage aus Rasterdaten

Bei der indirekten Abfragemethode wird das Rasterbild mit der darin gespeichertenInformation in eine Datenbankstruktur überführt (Transformation), in welcher derAbfragemechanismus aus der Datenbanktechnologie zur Anwendung kommt. Dieabgefragte Information (in Form von selektierten Datensätzen aus der Datenbank) wirddann durch geeignete Visualisierung (z.B. in einer anderen Farbe) wieder im Rasterbilddargestellt (Retransformation) oder strukturiert einem GIS zugeführt. Transformationund Retransformation stellen den Bezug zwischen Rasterbild und Datenbank her, wäh-rend die eigentliche Abfrage auf der Ebene einer korrespondierenden Datenbank, alsonicht direkt im Rasterbild stattfindet (Abb. 5.9). Vorteil dieses Vorgehens ist, dass nachder Erstellung der zu einem Rasterbild gehörenden Datenbank mit der impliziertenBildinformation die Technik der Datenbankabfragen weitestgehend unverändertAnwendung finden kann. Die Abfragesprache muss demnach nicht neu erfunden wer-den, sondern es geht hierbei lediglich um die Frage der Schaffung einer geeignetenDatenbank und -struktur. Ist die Datenbank einmal vorhanden, lassen sich Abfragenz.B. nach dem Schema von SQL durchführen.

Page 83: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Abfrage von Information 71

Die Schaffung der korrespondierenden Datenbank für Bildinformation ist keine einfa-che Aufgabe, besonders dann wenn die Erzeugung der Datenbank automatisiert erfol-gen soll. Es stellt sich die Frage, nach welchen Regeln das Rasterbild sinnvoll in einerepräsentative Datenbank von Bildobjekten oder Bildinformation abgebildet werdenkann und soll. Schliesslich stellt sich auch noch die Frage nach der Struktur der abge-speicherten Datensätze, also die Frage nach dem Datenbankschema. Wie sollte dieInformation strukturiert sein, um effektive, raumbezogene, geometrische oder gar se-mantische Abfragen zu ermöglichen? Welche Datenbankstruktur erlaubt es, die im Bildimplizit gespeicherte, komplexe Information repräsentativ zu erfassen? Einen Ansatzhierzu liefert Frischknecht (1999), worauf in Abschnitt 5.5 eingegangen wird.

5.4.2 Direkte Abfrage aus Rasterdaten

Bei der direkten Abfragemethode geht es um einen unmittelbaren Zugriff auf die Inhaltedes originären Rasterbildes. Die Abfrage soll sich nicht wie bei der indirekten Abfrage-methode auf transformierte Information, z.B. eine zum Rasterbild korrespondierendeDatenbank, erstrecken, sondern geradewegs im Bild ansetzen. Um Rasterbildern struk-turierte Information abzugewinnen, bedarf es der Methoden der Mustererkennung.Direkte Abfragemechanismen steuern also geeignete Mustererkennungsmethoden, dieden unmittelbaren Zugriff auf das Rasterbild vornehmen und als Resultat strukturierte,explizite (raumbezogene) Information liefern. Schematisch kann man sich die Funkti-onsweise so vorstellen, wie sie in Abb. 5.10 dargestellt ist.

Abb. 5.10: Schema der direkten Abfrage aus Rasterdaten.

Eine Mustererkennungsmethode, die ausgehend vom originären Rasterbild unmittel-bar Resultate semantischer Natur liefert, ist das Matching. Es ermöglicht die direkteZuordnung von semantischen Inhalten zu (beliebig komplexen) Rasterstrukturen. Umein solches Matching durchführen zu können, bedarf es einer Wissensbasis an bekann-ten Strukturen, denn es können ja nur dann semantische Informationen bereitgestelltwerden, wenn über die rasterbasierte Struktur des zugehörigen Objekts Informationbzw. Vorwissen vorliegt [Graeff and Carosio (2002)].

Page 84: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

72 Kapitel 5

Für die Formulierung der Abfrage hat dieses einige Konsequenzen: An die Stellemathematischer Vergleichsoperatoren treten nun Matchingoperatoren oder Korrelatoren,mit denen eine Rasterdatenstruktur aus dem Bild mit einem vorgängig bekanntem (d.h.aus der Wissensbasis stammenden) Muster verglichen wird (Abb. 5.11).

Abb. 5.11: Beispiel einer SQL-ähnlichen Abfrage für den direkten Rasterdatenzugriff.

Die direkte Abfragemethode verzichtet bewusst auf vorgängige Segmentierung undObjektbildung. Dies eröffnet die Möglichkeit, zwischen den Objekten liegende, d.h.durch topologische Anordnung mehrerer Objekte ausgedrückte, semantische Aussagenzu erschliessen. Zu bedenken bleibt allerdings, dass ein unmittelbares Erschliessen derSemantik komplexerer Strukturen mittels Matching und anderer einfacher Bildkorrela-tionsmethoden nur dann erfolgreich ist, wenn die Rasterstrukturen nur geringen Defor-mationen bei ihrer Darstellung ausgesetzt sind. Für kartografische Dokumente, beidenen die Signaturierung streng vorgegeben ist, sind die Voraussetzungen für eindirektes Abfragen günstiger als z.B. bei Luftbildern oder handgeschriebenen Textdoku-menten [Graeff (2001)].

5.5 Die Abfragesprache „RaQueL“ von Frischknecht

5.5.1 Das Gesamtkonzept

Frischknecht hat in seiner Dissertation [Frischknecht (1999)] eine rasterbasierte Abfrage-sprache nach dem Modell der indirekten Abfragemethode (siehe 5.4.1) realisiert. Sieträgt den Namen „RaQueL“, der für Raster Query Language steht.

In diesem Abfragemechanismus wird das Rasterbild nach einer Segmentierung inObjekte zerlegt, deren Zeilen zunächst in einer Datenbank von Lauflängencodes (Exten-sion RLS) abgespeichert werden. Aus dieser Datenbank werden dann zu jedem Objekteine Reihe von geometrischen und topometrischen Merkmalen berechnet, welche unterAngabe des Objektcodes in der Datenbank der Objektmerkmale (Extension MVC) abge-legt werden. In der Merkmalsdatenbank erfolgt schliesslich die Abfrage nach dem SQL-Schema, wodurch eine Auswahl in der Datenbank der Objektmerkmale erfolgt. MitHilfe des Objektcodes wird die Auswahl in der Merkmalsdatenbank auf die Datenbank

Page 85: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Abfrage von Information 73

der Objekte (d.h. der Lauflängenkodes eines jeden Objektes) übertragen. Durch Einfär-ben der ausgewählten Segmente wird die vorgenommene Auswahl im Rasterbildvisualisiert, wodurch die Retransformation von der Datenbank zurück ins Bild abge-schlossen wird (Abb. 5.12).

Es ergeben sich somit fünf Bearbeitungsschritte vom ursprünglichen Rasterbild bis zumRasterbild mit visualisierten Objekten: 1. die Segmentierung des Bildes bzw. die Gene-rierung von Objekten, 2. die Merkmalsberechnung, 3. die eigentliche Abfrage in derMerkmalsdatenbank, 4. die Übertragung der Datensatzauswahl auf die Objektdaten-bank und 5. die Visualisierung im Bild. Auf die Methodik in diesen fünf Schritten wirdin den nachfolgenden Abschnitten eingegangen.

Abb. 5.12: Schema der indirekten Abfrage in „RaQueL“.

5.5.2 Segmentierung und Objektbildung

Durch die Segmentierung wird das Rasterbild in disjunkte Einheiten zerlegt, die alsseparate Objekte weiterbehandelt werden. Die Segmentbildung folgt Regeln, nach de-nen Rasterelemente als zu einem Objekt gehörig bzw. zu verschiedenen Objekten gehö-rig betrachtet werden. Je nachdem welche Kriterien hierbei angelegt werden, ergebensich verschiedene Segmentierungen des Bildes und somit auch verschiedene Objekte.

Frischknecht hat für die Segmentierung ein überwiegend radiometrisch-relationalesKriterium angehalten: Pixel verschiedener Farbe gehören zu verschiedenen Objekten.

Page 86: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

74 Kapitel 5

Innerhalb der gleichen Farbe wird zudem die N4-Nachbarschaft angewandt, d.h. zweizusammenhängende Rasterbereiche gehören zu verschiedenen Objekten, wenn sienicht durch wenigstens ein Pixel mit einer gemeinsamen Pixelkante verbunden sind.

Die Segmentierung bei Frischknecht bezieht sich zusätzlich nur auf Objekte einer zuwählenden Farbe. Pixel anderer Farben werden einheitlich als Hintergrundfarbe inter-pretiert, in welcher keine Objektbildung vorgenommen wird. Es wäre jedoch theore-tisch möglich, die Segmentierung auf Objekte aller vorkommenden Farben auszudeh-nen (ausser vielleicht einer Standard-Hintergrundfarbe) und zu den Objektsegmentenauch die Farbe mit abzuspeichern.

Die Lauflängencodes der Zeilen der segmentierten Objekte (Datensätze der StrukturObjektkode, Zeilennummer, Anfangsspalte, Endspalte, Objektfarbe) werden unter Angabedes Objektkodes in der RLS-Datei abgespeichert.

5.5.3 Berechnung der Objektmerkmale

Aus den durch Segmentierung erhaltenen Objekten in der RLS-Datei werden nunObjektmerkmale berechnet. Diese werden unter Angabe des Objektkodes in einerDatenbank der Merkmale (Extension MVC) abgespeichert.

Der Katalog der berechneten Merkmale besteht bei Frischknecht aus 22 Merkmalen:49

• Schwerpunktkoordinaten (Zeilen- wie Spaltenkoordinate) des Objektes

• die Ausdehnung in x- und y-Richtung

• die Grösse der Fläche, gemessen in der Anzahl der Pixel, die zum Objekt gehören

• die Fläche des kleinstmöglichen umschreibenden Rechtecks (Umfläche), gemessen inPixeln

• der Umfang des Objektes

• ein logischer Wert, der darüber Auskunft gibt, ob der Schwerpunkt inner- oder aus-serhalb des Rastersegmentes liegt

• die Anzahl der Löcher im Objekt

• die Kompaktheit des Objektes, d.h. das Verhältnis von Umfangsquadrat zu Fläche,der bei einem Kreis minimal wird

• die Orientierung des Objektes durch Angabe der Richtung der grossen Hauptträg-heitsachse (sofern bestimmbar, d.h. bei nicht rotationssymmetrischen Objekten)

• der λ-Quotient, d.h. das Verhältnis der Eigenwerte zu den beiden Hauptträgheits-achsen

• einige normierte, zentrierte Momente höherer Ordnung (Beschreibung siehe Frisch-knecht (1999) S. 40f.)

49. zu den Objektmerkmalen vgl. auch Haberäcker (1995) und Kunz et al. (1998).

Page 87: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Abfrage von Information 75

• die Fiberlänge Lf und Fiberbreite Bf eines Objektes, berechnet nach

und [5.12]

Zu den Merkmalen sind später noch Folgende hinzugekommen:

• die Komponentenanzahl (für den Fall, dass mehrere Segmente zusammen betrachtetwerden müssen)

• die kleinste und grösste Zeilenkoordinate des Objektes

• die kleinste und grösste Spaltenkoordinate des Objektes

• der Flächenquotient, d.h. Fläche dividiert durch die Fläche des umschliessendenRechtecks („Umfläche“)

Daraus ergibt sich das Datenbankschema (Tab. 5.13), bei welchem die einzelnen Merk-male die Attribute bilden und somit die Anzahl der Datenbankkolonnen festlegen.

Tab. 5.13: Datenbankschema der Objektmerkmalsdatenbank (MVC).

Attribut Datentyp Beschreibung

&2'(6FKOVVHODWWULEXW LQW 2EMHNWNRGH

;6&+ LQW 6FKZHUSXQNW[.RRUG

<6&+ LQW 6FKZHUSXQNW\.RRUG

800; LQW PD[$XVGHKQXQJ[

800< LQW PD[$XVGHKQXQJ\

)/$(RGHU$5($ LQW )OlFKH

8)/$ LQW 8PIOlFKH

80)$ LQW 8PIDQJ

,11(RGHU63,1 ERROHDQ 6FKZHUSXQNWLQQHUKDOE

.$1= LQW .RPSRQHQWHQDQ]DKO

/2&+ LQW /RFKDQ]DKO

.203 GRXEOH .RPSDNWKHLW

$=,0 GRXEOH $]LPXW+DXSWDFKVH

/482 GRXEOH λ4XRWLHQW

&ELV& GRXEOH 0RPHQWH

),%/ GRXEOH )LEHUOlQJH

),%: GRXEOH )LEHUEUHLWH

0,1; LQW 0LQLPDOHV[

0$;; LQW 0D[LPDOHV[

0,1< LQW 0LQLPDOHV\

0$;< LQW 0D[LPDOHV\

)482 GRXEOH )OlFKHQTXRWLHQW

f14--- Umfang Umfang( )

216 Fläche⋅––⋅= Bf

FlächeLf

-----------------=

Page 88: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

76 Kapitel 5

5.5.4 Klassifizierung durch Abfragen in „RaQueL“

In der Merkmalsdatenbank wird die Abfrage durchgeführt. Sie folgt weit gehend densyntaktischen Regeln von SQL, wenn auch eigene Sprachkonstrukte implementiertwurden. Kernelement der Abfragesprache RaQueL ist das SELECT – FROM – WHERE –Schema, das von SQL her bekannt ist (Abb. 5.14).

Abb. 5.14: Prinzip der SQL-ähnlichen indirekten Abfragesprache „RaQueL“.

Die Abweichungen vom SQL-Standard bei der Anwendung auf Datenbanken besteheneinerseits darin, dass die Anweisung nur mit einem „*“ im SELECT-Part Sinn macht,denn eine Visualisierung der Daten im Rasterbild kann sich nicht auf einzelne Attributeder Datenbank beziehen, andererseits kann nicht auf mehrere, verschiedene Datenquel-len im FROM-Part zugegriffen werden. Im praktischen Gebrauch dieser Sprache ist esgar üblich, den FROM-Part ganz wegzulassen, wenn die Datenquelle durch den vor-gängigen Befehl file für die nachfolgenden Abfrageanwendungen spezifiziert wird. Ver-knüpfungen logischer Ausdrücke sind möglich. Jedoch gibt es nur den AND-Operator.Schliesslich gehören zu diesem speziellen Konzept der Rasterdatenabfrage noch zweiweitere SELECT-Befehle, die die Namen reselect+ und reselect- tragen. Auf weitereUnterschiede weist Frischknecht in seiner Dissertation hin [Frischknecht (1999) S. 76-80].

Die beiden Befehle reselect+ und reselect- sind zusammen mit dem Befehl select die mög-lichen Schlüsselbefehle im SELECT-Part. Während select der üblichen Auswahl vonDatensätzen aus der Gesamtmenge der Datenquelle entspricht, steht reselect+ für eineAuswahl innerhalb der zuletzt vorgenommenen Auswahl und reselect- für eine Aus-wahl innerhalb der bei der letzten Auswahl verworfenen Datensätze. Diese beidenneuen Befehle ersetzen die fehlende Möglichkeit, OR-Verknüpfungen durchzuführenbzw. ergeben einen alternativen Weg, AND-Konstrukte zu gebrauchen. Ihre schemati-sche Funktionsweise ist in Abb. 5.15 kurz erläutert.

Abb. 5.15: Schematische Funktionsweise von reselect+ und reselect-.

Page 89: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Abfrage von Information 77

Die Abfragedurchführung entspricht einer Klassifizierung im Merkmalsraum. Durchdie WHERE-Konstrukte wird die gesamte Objektdatenbank auf bestimmte Merkmalebzw. Merkmalskombinationen eingegrenzt. Wird mittels reselect+ und reselect- mehr-fach selektiert, so entspricht dies einer sukzessiven Eingrenzung des Merkmalsraumsbzw. einer schrittweisen Klassifizierung.

5.5.5 Übertragung von Abfrageresultaten auf die Objektdatenbank

Nach der Auswahl von Datensätzen in der Objektmerkmalsdatenbank (DateiextensionMVC) wird das Abfrageresultat in die Objektdatenbank (Dateiextension RLS) übertra-gen. Die Verbindung zwischen Objektdatenbank und Merkmalsdatenbank erfolgtdurch den Objektkode. Aus der Objektdatenbank werden also alle Einträge (lauflän-genkodierte Objektzeilen) ausgewählt, deren Objektkodes in der resultierenden Merk-malsdatenbank vorkommen.

5.5.6 Visualisierung

Nachdem in der Objektdatenbank (Extension RLS) die ausgewählten Objekte separiertwurden, kann ihre Einfärbung vorgenommen werden. Für das Arbeiten mit kartografi-schen Dokumenten wird eine rote Farbe gewählt. Sie hebt sich am deutlichsten von denin kartografisch-topografischen Dokumenten üblicherweise verwendeten Farbtönen ab.

Page 90: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG
Page 91: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Kapitel 6

Konzept einer geometrisch-semantischen Abfragemethode mit direktem Rasterdatenzu-griff

Für die in der Einleitung aufgegriffene Fragestellung, ob nicht auf grafische Zeichen,die raumbezogene Information auf einem geometrisch-referenzierten Informationsträ-ger kodieren, mittels Abfragen auf die Semantik der Zeichen zugegriffen werden kann,soll an dieser Stelle ein Konzept entworfen werden.

Konkret geht es darum, für kartografische Rasterdaten eine Abfragemethode zu ent-wickeln, die sowohl semantische Information (Frage nach der Bedeutung grafischer Ele-mente) als auch geometrische Information (Frage nach dem räumlichen Bezugs desElementes) liefert, und zwar auf Basis der originären Rasterdaten, d.h. in Form einesdirekten Rasterdatenzugriffs.

Voraussetzung für einen semantischen Zugriff ist eine klar definierte, möglichst redun-danzfreie Zuordnung von geometrisch-grafischer Zeichendefinition und semantischerZeichendefinition. Diese Voraussetzung wird je nach Dokumenttyp unterschiedlich guterfüllt; für kartografische Dokumente ist jedoch anzunehmen, dass die geometrisch-grafi-sche Kodierung semantischer raumbezogener Information diese Voraussetzung erfüllt.

Neben dem semantischen Zugriff erfolgt in raumbezogenen Daten auch ein Zugriff aufdie Geometrie der abzufragenden Elemente. Die Geometrie von kartografischen Zei-chen ermöglicht Rückschlüsse auf ihren Raumbezug. Dabei müssen bestimmte Katego-rien von kartografischen Zeichen unterschieden werden.

Der direkte Rasterdatenzugriff wird durch rasterbildverarbeitende Interpretationsme-thoden (Mustererkennungsmethoden) ermöglicht, die mit dem originären Rasterdaten-material arbeiten. Auf die Verwendung transformierter Daten, wie etwa dem Rasterbildkorrespondierende Datenbanken (indirekte Abfragemethode, vgl. Frischknecht (1999)resp. auch Kapitel 5.5) soll verzichtet werden.

Page 92: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

80 Kapitel 6

Die hierfür zu entwerfende Abfragesprache muss geeignete Mustererkennungsverfah-ren steuern können. Geometrisch-semantische Abfrage bedeutet, dass geometrischkodierende Objekte mittels semantischer Bezeichnervariablen im Bild angesprochenwerden können. Mit einer Abfrage wie

SELECT ... FROM Karte WHERE region like <symbol>

kann sich der Benutzer des Rasterdatenanalysewerkzeuges direkt Zugang zu denjeni-gen Objekten des Bildes beschaffen, die sich semantisch (Frage nach dem „Was?“) undgeometrisch (Frage nach dem „Wo?“) durch den Objektbezeichner <symbol> ergeben.

Wenn aber die Objektadressierung über semantische Variablen (d.h. Objektbezeichner)erfolgt, dann benötigt ein solcher direkter Rasterdatenzugriff eine Verbindung von(Objekt-)Semantik und geometrisch-grafischer Ausprägung des Zeichens für die Dar-stellung in Rasterdatenform. Bei den indirekten Abfragemethoden besteht diese Ver-bindung zwischen (Zeichen-)Geometrie und Semantik darin, dass die geometrischenMerkmale aus den Rasterdaten berechnet werden können, und Vektoren kombinierterMerkmale im semantischen Raum zugeordnet werden. Für die direkte Abfragemethodewird hingegen ein Wissensansatz verfolgt. Die Wissensbasis enthält alle Beschreibun-gen geometrisch-grafischer Art, die zu einem semantischen Objekt gehören.50 Sie istsomit das notwendige Bindeglied zwischen (Zeichen-)Geometrie und Semantik.51

Bei der direkten Abfragemethode ist die Wissensbasis vorgängig zu implementieren.Der Benutzer kann zur gewünschten Bildinformation direkt durch Angabe der semanti-schen Variablen (d.h. der Objektbezeichnung) gelangen, ohne dass das Wissen übergeometrisch-grafische Ausprägungen von Bildobjekten selbst einbringen muss.

Die Wissensbasis ist dokumenttypabhängig und sollte grundsätzlich austauschbar sein.Bei topografischen Karten im Rasterformat, dem in vorliegender Arbeit zu Grunde lie-genden Dokumenttyp, wird die Wissensbasis das kartografische Wissen aufnehmen(Abschnitt 6.1) und speichern.

Die Schnittstelle zum Benutzer ist ein Abfragemodul. Der Benutzer wählt die zu extra-hierenden Objekte durch Formulierung in einer entsprechenden Abfrage aus. Erbenennt die Objekte und Strukturen mit den semantischen Variablen, die sich aus derWissensbasis ergeben (bei Karten: die Legende). Der Entwurf einer Syntax für dieAbfragesprache wird in Abschnitt 6.2 vorgestellt.

Methodisch gilt es nun, vorliegendes Wissen, d.h. geometrische „Muster“-Ausprägun-gen, die durch die Wissensdefinition eine Zuordnung im Raum semantischer Variablenerhalten haben, mit Mustern aus dem Rasterbild zu vergleichen und diesen Vergleichauszuwerten. Das Vergleichen von Mustern bzw. Templates stellt die direkte Abfragemethodisch in die Nähe des Template Matching. Zur Ausführung der direkten Abfrage-

50. Zur Wissensverarbeitung bei der Erfassung grafischer Zeichen vgl. auch Benning und Schindler (2001).51. Gerade durch die Einführung von Wissenskomponenten kann auf Segmentierungsverfahren zur Bild-

analyse und Bildinterpretation (wie sie bei der indirekten Methode benötigt werden), verzichtet werden[Myers et al. (1995)].

Page 93: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Konzept einer geometrisch-semantischen Abfragemethode mit direktem Rasterdatenzugriff 81

methode sind also wissensbasierte Template-Matching-Strategien auszuwählen undzu implementieren (Abschnitte 6.3 und 6.4), die diesen Mustervergleich bewerkstelli-gen können.

Bei der Auswahl und Festlegung der Abfragesprachsyntax (6.2) und der zu Grunde lie-genden Mustererkennungsmethoden (6.3 und 6.4) ist auf ihre gegenseitige Kompatibili-tät besondere Rücksicht zu nehmen. Das bedeutet, dass einerseits für die Abfrage-sprache geeignete linguistische Variablen zu finden sind, die notwendige Parameterdes Mustererkennungsverfahrens repräsentieren, und dass sich andererseits so vieleMustererkennungsparameter aus anderen Quellen (etwa der Wissensbasis) erschliessenlassen, damit die Benutzerfreundlichkeit der Abfragesprache nicht durch die Parame-tervielfalt der Rasterdatenzugriffsmethodik beeinträchtigt wird. Dort, wo dieses Entge-genkommen nicht hinreichend möglich ist, werden Ansätze etwa der fuzzy-logischinterpretierten Abfragen verfolgt.

Die Abfragesprache trägt den Namen

GRaQueL = Geo-semantic Raster Query Language

und basiert auf einem kartografisch-wissensbasierten, rasterorientierten Ausführungs-werkzeug. Somit fliessen in dieses Konzept die Aspekte der Rasterdatenstruktur undder Rasterbildverarbeitung (Kapitel 2 und 3), der kartografischen Wissensbasis (Kapitel4) und der Informationsakquisition durch Abfragen (Kapitel 5) ein (Abb. 6.1).

Abb. 6.1: Konzept von „GRaQueL“ mit den einfliessenden methodischen Komponenten.

Page 94: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

82 Kapitel 6

Grundsätzlich soll die direkte Abfragesprache „GRaQueL“ kompatibel mit der indirek-ten Abfragesprache sein, damit auch die Kombination der beiden Abfrageansätze mög-lich wird. Hierauf geht Abschnitt 6.5 kurz ein.

6.1 Modellierung des kartografischen Wissens

Kartografisches Wissen wird grossenteils in der Kartenlegende festgehalten. Die Legendeenthält Zuordnungen von mustergültigen geometrisch-grafischen Definitionen der Zei-chen (Symbolgrafiken) zu semantischen Variablen, mit denen kartografische Objektebezeichnet werden. Sie ist eine Wissensbasis in analoger Form, denn sie bietet jedemKartenleser die Möglichkeit, das zum Lesen einer Karte benötigte Wissen zu erwerben.Für eine wissensbasierte direkte Abfragemethode bietet es sich an, die kartografischeLegende mit ihrer Wissensvorhaltungsfunktion zu einer digitalen Wissensbasis umzu-setzen. In Bezug auf die Rasterdateninterpretation ergibt sich die Möglichkeit, das Wis-sen mittels Templates zu modellieren.52 Templates sind die Träger geometrisch-grafischer Objektdefinitionen. Sie werden im Bereich von Rasterdaten durch ein Musterdeklariert, das aus zusammenhängenden Rasterelementen (Pixeln) besteht. Durch dasAbspeichern und Zuordnen des Musters zu einer semantischen Definition, die z.B. ineinem Templateheader mit (thematisch) beschreibenden Informationen erfolgen kannoder einfach nur aus einem Dateinamen zur Identifikation gebildet wird, ergibt sich dienotwendige Verbindung von Geometrie und Semantik.53

Abb. 6.2: Verbindung von Zeichengrafik und -semantik am Beispiel einer Punktsignatur in denSchweizer Landeskarten [vgl. (L+T) (2002)].

52. Für nicht auf Templates basierende Wissensrepräsentationen vgl. den Hartog et al. (1995).53. Nach Quint (1998) gibt es neben der Geometrie und der Sematik auch noch die physikalische und topo-

logische Komponente zu berücksichtigen. Physikalische und topologisches Wissen ist in gewisser Hin-sicht in der geometrischen Templatedefintion impliziert, da sowohl die sensorabhängigen Bildeigen-schaften als auch die Lagebeziehungen zwischen Pixeln Eingang ins Template finden.

Page 95: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Konzept einer geometrisch-semantischen Abfragemethode mit direktem Rasterdatenzugriff 83

Es ergeben sich für die vier Grundtypen kartografischer Signaturierung, den semiotischprimär kartografischen Signaturen für die Punkt-, die Linien- und die Flächendarstel-lung einerseits und andererseits – semiotisch artfremd - den Beschriftungen, unter-schiedliche Ansätze der Wissensmodellierung. Die Unterscheidung nach Typen isterforderlich, da z.B. Linien- und Flächendarstellungen nicht in einem starren matrixför-migen Template, wie es vom konventionellen Template Matching her bekannt ist, defi-niert werden können. Linien- und Flächensignaturen werden nämlich in ihren linearenbzw. flächenhaften Ausdehnungsrichtungen geometrisch ausgebreitet.

In den Kartenlegenden werden allein Punktsignaturen und Beschriftungen54 geome-trisch richtig abgebildet. Sie können also nach dem konventionellen Template Matchingbehandelt werden. Zugute kommt dabei, dass die kartografische Darstellung durcheine Einheitlichkeit gleicher Signaturen gekennzeichnet ist, so dass ein exaktes Verglei-chen geometrischer Ausprägungen auch methodisch Sinn macht.

Bei Linien- und Flächensignaturen wird in der Legende nur ein exemplarisches Linien-bzw. Flächenstück angegeben, das als solches kaum geometrisch exakt in der Karte vor-zufinden ist. Zum Erschliessen ihrer semantisch-geometrischen Information kommt es nurauf das Kodierungsschema für eine Linie bzw. Fläche an, während die geometrischeAusbreitung in Linienrichtung bzw. Flächenform Bestandteil der raumbezogen-geometri-schen Information ist. Um auch solche Signaturen durch Matching erfassbar zu machen,muss der Templatebegriff erweitert werden (6.1.1), bevor – getrennt nach Objekttyp –die Modellierung kartografischer Information abschliessend erfolgen kann (6.1.2).

6.1.1 Templatetypen

Templates als musterhafte zusammenhängende Pixelbereiche zur geometrisch-grafi-schen Definition von Bildobjekten erfolgen in der Regel in einer begrenzt zweidimen-sionalen Rasteranordnung. Sie eignen sich, um diejenigen Rasterstrukturen einesRasterbildes durch eine einheitliche Semantik auszuzeichnen, die nur geringe Abwei-chungen vom Muster haben. An genau diesem Punkt entsteht jedoch die Schwierigkeit,allgemeine Linien und Flächen durch Templates zu modellieren. Linien und Flächenhaben nicht nur eine grafisch-symbolische Ausprägung zur Identifikation ihrer thema-tischen Bedeutung, sondern zusätzlich bei Linien eine und bei Flächen zwei grafischeDimensionen des Raumbezugs.

Für viele Linien hat dies zur Folge, dass ihre thematische Definition nur entlang desLinienprofils erfolgt, das senkrecht zur geometrisch-räumlichen Ausbreitung der Liniesteht. Da es bei diesen Linien zur Erschliessung ihrer Semantik offenbar nur auf das

54. Beschriftungen entstammen dem Textwissen (vgl. Kapitel 4). Die geometrisch richtige Abbildungbezieht sich i.A. nur auf die Einzelbestandteile des Textwissens, d.h. Buchstaben und Ziffern. IhreAnordnung zu Wörtern und Zahlen kann dagegen auch raumbezogene Information kodieren, z.B.Beschriftung eines Flusses entlang seines Verlaufs, Höhenlinienzahlen entlang einer Höhenkurve,Gebirgsnamen entlang einer Gebirgsgratrichtung etc.

Page 96: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

84 Kapitel 6

Profil ankommt, wird nun vorgeschlagen, dieses in Form eines eindimensionalen Templa-tes abzuspeichern und mit der semantischen Variable zu verknüpfen.

Nun werden Punktobjekte, bei denen die Ausbreitung im Raum nulldimensional ist,durch Signaturen mit thematisch-grafischer Definition in zweidimensionalen Templatesdargestellt, und die Darstellung von Linienobjekten mit eindimensional-raumausbreiten-der Information erfolgt durch eindimensionale Templates (sog. Profile). Der Logik nachmüssten Flächenobjekte (zweidimensional ausgebreitete Raumformation) durch nulldi-mensionale Templates modelliert werden. Nulldimensionale Templates sind jedoch ein-zelne Pixel, also schlichtweg die Pixelinformation selbst. Diese Modellierung trifft z.B.auf die Flächenobjekte mit vollem Farbton zu.

Um die drei Templatetypen zu unterscheiden, bezeichnen wir nulldimensionale Tem-plates für Flächen als Pixel (pixels), eindimensionale Templates als Profile (profiles) undzweidimensionale Templates als Regionen (regions).

Abb. 6.3: Beispiele für 0- (pixel), 1- (profile) und 2-dim. Templates (region) mit Referenzpunkten.

Da für die Erfassung neben der Erschliessung der Semantik des Zeichens auch die geo-metrische Definition (Raumbezug des Zeichens) eine Rolle spielt, muss der Raumbezugin den einzelnen Templatetypen durch Referenzpunkte zugeordnet werden. Bei denpixels ist der Raumbezug klar durch die Koordinaten des einzelnen Pixels definiert,womit der Referenzpunkt durch das gesamte Template gegeben ist. Im Profil (profile)wird ein ausgezeichneter Referenzpunkt angegeben, der die Mittelachse des linienför-migen Objekts charakterisiert. Ebenso gibt es zu einer Punktsignatur (region) einen aus-gezeichneten Referenzpunkt, dessen Bildkoordinaten den Standort des dargestelltenObjekts repräsentiert.

6.1.2 Modellierung durch pixel-, profile- und region-Templates

Mit den Templates unterschiedlicher Dimension, deren Ausprägungstypen mit pixel,profile bzw. region bezeichnet werden, können wir das kartografische Wissen modellie-ren.

Page 97: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Konzept einer geometrisch-semantischen Abfragemethode mit direktem Rasterdatenzugriff 85

Punktsignaturen

Dass Punktsignaturen durch regions dargestellt werden können, wurde schon erwähnt.Zu überlegen wäre noch, ob sie nicht auch durch pixels oder profiles definiert werdenkönnen. Dass dies aber nicht möglich ist, kann leicht eingesehen werden, wenn ange-nommen wird, eine Punksignatur bestehe aus einem Rasterpunkt bzw. einer begrenz-ten Rasterlinie. Wenn eine Punktsignatur nur aus einem einzelnen Pixel besteht, somuss in der Umgebung dieses Pixels zwingend Hintergrundinformation stehen, damitder Punkt überhaupt als (isolierter) Punkt identifizierbar ist. Da aber die Umgebungzweidimensional ist, ist ein zweidimensionales Template erforderlich. Gleiches gilt fürdie begrenzte Rasterlinie als Punktsignatur.

Punktsignaturen lassen sich also nur durch regions darstellen (Tab. 6.4).

Liniensignaturen

Linien mit gleichbleibendem Querschnitt werden durch ihr Profil charakterisiert, dasim eindimensionalen Template profile gespeichert und semantisch deklariert werdenkann. Ein Beispiel für eine solche Linie ist die Darstellung von mehrstreifigen National-strassen und Autobahnen, die üblicherweise in dreiliniger Signatur erfolgt.

Nun gibt es aber auch Linien, bei denen im geometrisch-raumbezogenen Verlauf Varia-tionen auftreten. Die Liniensignatur für Eisenbahn55 beispielsweise besteht aus einerAbfolge schwarzer und weisser Linienstücke, Linien können in ihrem Verlauf gestri-chelt sein, oder sie können aus in einer Linie angeordneten Einzelsignaturen (Grenzli-nie, Hecke etc.) dargestellt sein. Um auch zu solchen Linien eine Wissensbasis erzeugenzu können, müssen vier Fälle unterschieden werden:

• Linien mit kontinuierlicher, dem Linienverlauf angepasster Signaturierung und miteinheitlichem Profil (Bsp.: Autobahn).

• Linien mit kontinuierlicher, dem Linienverlauf angepasster Signaturierung und mitwechselnden Profilen (Bsp.: Eisenbahn, zwei Profile, die sich regelmässig im Linien-verlauf abwechseln).

• Linien, deren Verlauf in diskrete Punkte zerlegt wurde, auf die während des gesam-ten Linienverlaufs einheitliche Punktsignaturen (regions) platziert wurden (Bsp.:Grenzlinie, geformt aus Grenzkreuzzeichen).

• Linien, deren Verlauf in diskrete Punkte zerlegt wurde, auf die verschiedene Punkt-signaturen (regions) platziert wurden (Bsp.: Hecke, geformt aus grünen Punkten undKreisen unterschiedlicher Grösse).

Für die ersten beiden Fälle kann das Wissen mit profiles, in den anderen mit regionsdefiniert werden (vgl. Tab. 6.4).56 Für die Fälle mit wechselnden Profilen und wechseln-

55. in den Schweizer Landeskarten bezogen auf Schmalspureisenbahnen, vgl. (L+T) (2002).56. Liniendarstellungen mit dem Templatetyp pixel sind aus ähnlichen Überlegungen, die bei den Punkt-

signaturen angestellt wurden, nicht sinnvoll.

Page 98: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

86 Kapitel 6

den Punktsignaturen gehören die Regeln der Verkettung der profiles bzw. regions zurWissensbasis.

Flächensignaturen

Bei Flächensignaturen erhöht sich die Vielfalt der Wissensrepräsentation, da Flächensowohl kontinuierlich als Volltonflächen (Wissensbasis modelliert durch pixels), alsSchraffuren bestehend aus angeordneten Linien (Wissensbasis vom Typ profile,Abstände der Linien diskret), als auch als Ansammlungen bzw. Kachelungen vonPunktsignaturen (Wissensbasis vom Typ region, Abstände der Signaturen diskret) defi-niert werden können. Auch hier kann die zu Grunde liegende Wissensbasis einheitlichsein oder aus mehreren Templates bestehen. In Tab. 6.4 sind für alle Möglichkeiten Bei-spiele angegeben.

Tab. 6.4: Übersicht zur Modellierung kartografischen Wissens durch Templates.

9HUPSW

$XWREDKQ (LVHQEDKQ *UHQ]OLQLH+HFNH

9ROOWRQIO6FKXPPH

UXQJ 6FKUDIIXUXQHLQKHLWO6FKUDIIXU 1DGHOZDOG 0LVFKZDOG

(LQ]HO]HLFKHQ

=DKO

Page 99: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Konzept einer geometrisch-semantischen Abfragemethode mit direktem Rasterdatenzugriff 87

Beschriftungen

Beschriftungen gehören nicht zum eigentlichen Zeichenvorrat kartografischer Darstel-lungen, sind aber zur Unterscheidung gleicher Zeichen (z.B. Ortszeichen) durch eineidentifizierende Beschriftung unerlässlich. Sie entstammen dem Textwissen (siehe Kap.4.2), von dem aber in der Karte nur Einzelbuchstaben und –ziffern, sowie ihre Anord-nung zu Wörtern und Zahlen verwendet werden.

Sie sind für die Wissensrepräsentation methodisch ähnlich zu behandeln wie Punktsig-naturen (für Einzelbuchstaben und -ziffern) bzw. wie Signaturlinien, wenn Buchstabenund Ziffern, die linienförmig mit diskreten Abständen nach gewissen Regeln (Abstand,Zeichenhöhe, -ausrichtung) zu Wörtern und Zahlen verkettet sind. Beschriftungen wer-den somit zeichenweise durch den Templatetyp region modelliert.

6.2 Syntax der Abfragesprache

Die Syntax der Abfragesprache soll so gestaltet sein, dass sie leicht erlernbar ist, und inAssoziation zur menschlichen Sprache oder anderen Abfragesprachen (etwa aus demBereich der Datenbanktechnik) steht. Für das Konzept bietet sich eine Syntax an, die derDatenbankabfragesprache SQL nahe steht (vgl. Abschnitt 5.1). Wichtigster Befehl füreine gezielte Informationsakquisition ist der SELECT-Befehl, dessen Grundgerüst ausden drei Schlüsselwörtern SELECT, FROM und WHERE besteht. Er ist der für dieAbfrageformulierung entscheidende Befehl. Daneben können auch weitere Befehle ausdem SQL-Standard in Analogie übernommen werden.

Der Befehl SELECT kann ähnlich wie bei der indirekten Abfragemethode von Frisch-knecht (1999) nicht ohne Anpassungen und Einschränkungen übernommen werden.Trotzdem wird versucht, das bekannte Syntaxschema beizubehalten und auf dieBelange der direkten Abfragesprache „GRaQueL“ abzustimmen.

Der erste Teil des Abfragebefehls besteht aus dem Schlüsselwort SELECT und dennachfolgenden SELECT-Attributen. Hier wird das Ausgabeformat der durch dieAbfrage erhaltenen Information spezifiziert. Beim Datenbank-SQL erfolgt dies in derAngabe der auszugebenden Attribute und ihrer Reihenfolge, ggf. auch ihrer Formate,auf die die abgefragte Information hinprojiziert wird. Danach folgt die Angabe derDatenquelle durch das Schlüsselwort FROM. Letzter Teil des Grundgerüstes ist derWHERE-Part, eingeleitet durch das Schlüsselwort WHERE, in dem die Bedingungen fürdie Informationsauswahl in Form logischer Aussagen festgelegt werden.

Auf die direkte Abfragesprache „GRaQueL“ übertragen, ergibt sich nachfolgende Ver-wendungsmöglichkeit des Abfragebefehls:

Im SELECT-Part wird das Ausgabeformat abgefragter Information festgelegt. Diesesergibt sich nicht eindeutig aus den Templatetypen pixel, profile und region, da z.B. ausregion-Abfrageresultaten Einzelsignaturen, Linien oder Flächen erzeugt werden kön-

Page 100: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

88 Kapitel 6

nen. Es werden daher fünf neue SELECT-Attribute definiert, die das Ausgabeformatfestlegen:

Der FROM-Part legt die Datenquelle fest. In „GRaQueL“ tritt an diese Stelle die Angabeder Rasterdatendatei, die die kartografische Information enthält.

WHERE-Konstrukte enthalten die eigentliche Informationsauswahl, indem logischeAussagen formuliert werden, denen die Information entsprechen muss. Für „GRa-QueL“ ist hier der Bildvergleich mittels logischer Ausdrücke zu formulieren. Die drei-gliedrige Abfolge Vergleichsattribut - Vergleichsoperator - Vergleichswert kann auf dasMatchen von Rasterstrukturen übertragen werden. Die Vergleichsattribute sind dieTypen der Templates, d.h. pixel, profile oder region und die Vergleichswerte sind die inder Wissensbasis abgespeicherten und dort adressierten Templates der entsprechendenAusprägung. An Stelle der mathematischen Vergleichsoperatoren, die im Datenbank-SQL und auch bei Frischknecht (1999) in der indirekten Abfragesprache „RaQueL“ vor-kommen, treten jedoch spezielle Matchingoperatoren, die den Vergleich zwischen Bild-stelle und Template ausführen und einer aussagenlogischen Variable zuordnen.

Bildobjekte, die aus mehreren Templates zusammengesetzt werden, wie etwa die Hek-kenlinie aus Tab. 6.4 benötigen dementsprechend mehrere WHERE-Abfragen, die mitOR zu verknüpfen sind. Für einige Objekte aus Tab 6.4 werden beispielshaft „GRa-QueL“-Abfragen formuliert:

Eine Punktsignatur wie der Vermessungspunkt wird durch Bildvergleich im Typ regiongefunden, sein Ergebnis wird im Ausgabeformat point erwartet. Die zugehörigeAbfrage lautet57

SELECT point FROM <Dateiname> WHERE region „LIKE“ Vermessungspunkt

SELECT point Formatierung als Einzelsignatur: Koordinaten des Referenz-punktes

SELECT line Formatierung als Linie: Liste mit Stützpunktkkordinaten aufdem Linienweg

SELECT area Formatierung als Fläche: Liste mit Koordinaten des um-schliessenden Polygons

SELECT char Formatierung als Einzelbuchstabe/-ziffer: Koordinaten desReferenzpunktes (entspricht methodisch SELECT point)

SELECT word Formatierung als Wort bzw. Zahl (verkettete Einzelbuchsta-ben bzw. Ziffern unter Berücksichtigung der speziellen Ver-kettungsregeln)

57. Der Matchingoperator werde hier der Einfachheit halber „LIKE“ genannt. Variationen in der Matching-strategie erfolgen durch Angabe entsprechender Matchingoperatoren. Ebenso werden hier exemplari-sche Bezeichnervariablen für die zu Grunde liegenden Templates eingeführt, die das Prinzip der Abfra-geformulierung unterstreichen.

Page 101: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Konzept einer geometrisch-semantischen Abfragemethode mit direktem Rasterdatenzugriff 89

Die Grenzlinie ergibt sich demzufolge aus

SELECT line FROM <Dateiname> WHERE region „LIKE“ Grenzkreuz.

Die Heckenlinie, die aus insgesamt drei Einzeltemplates zusammengesetzt wird, mussmit

SELECT line FROM <Dateiname> WHERE region „LIKE“ grBaum OR region „LIKE“ klBaum OR region „LIKE“ Busch

abgefragt werden und die Autobahnsignatur wird mit einem Profilvergleich erfragt:

SELECT line FROM <Dateiname> WHERE profile „LIKE“ Autobahn.

Eine Volltonfläche wie eine Seefläche ergibt sich aus

SELECT area FROM <Dateiname> WHERE pixel „LIKE“ hellblau,

wo das Attribut pixel zur Anwendung gelangt.

Hingegen muss bei der Umsetzung des Konzeptes beachtet werden, dass eine Abfragevom Ausgabeformat point nicht durch einen Vergleich von profiles oder pixels erfolgenkann.

6.3 Auswahl von Rasterbildverarbeitungsmethoden

Die Umsetzung von Abfragen der direkten Zugriffsmethode erfolgt durch Methodender digitalen Rasterdatenverarbeitung. Wenn auch aus dem Bereich der KünstlichenIntelligenz (artificial intelligence) und der Entwicklung neuronaler Netze mehr undmehr Methoden zur wissensbasierten Mustererkennung zur Verfügung gestellt werdenkönnen, die eine Modellierung anthropogener Bildinterpretationsmechanismen ermög-lichen, soll die Abfragemethode grundsätzlich als Ingenieurverfahren konzipiert werden.Die Abfragemethode soll auf gewöhnlichen Rechneranlagen (UNIX-Systemen, evtl.auch PC), allenfalls mit Speichererweiterungen, funktionieren.

In der Einleitung zu diesem Kapitel wurde bereits erwähnt, dass der direkte geome-trisch-semantische Zugriff auf Bildobjekte durch einen Vergleich mit Mustern aus derWissensbasis gebildet wird. Hieraus ergibt sich, dass der Kern der Mustererkennungs-methode durch ein Template-Matching-Verfahren gebildet wird. Template Matching istim Bereich kartografischer Rasterdaten gut geeignet, da die zu vergleichenden Mustersich durch eine hohe Einheitlichkeit auszeichnen und geometrische wie radiometrischeDeformationen gering sind.

Template-Matching-Verfahren bedürfen immer einer aufgabenspezifischen Implemen-tierung. Nachfolgend werden die wichtigsten Anforderungen an ein Matchingverfah-ren genannt, die bei der Realisierung der Abfragesprache „GRaQueL“ zu berücksichti-gen sind.

Page 102: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

90 Kapitel 6

6.3.1 Anforderungen

Matchen von Pixeln und Profilen

Die Erweiterung des Template-Begriffes auf Templates der Typen region, profile undpixel erfordert Anpassungen in der Matchingmethode. Matchen von regions entsprichtmethodisch dem klassischen Template Matching mit zweidimensionalen Templates inzweidimensionalen Rasterbildern. Das Matchen von pixels entspricht einer Auswahlvon Pixel nach ihrer Pixelinformation und ist somit einfach zu realisieren. Hingegenmüssen beim profile-Matching verschiedene Ansätze untersucht werden, die neben demklassischen Matchingverfahren auch Linienverfolgungsmethoden einschliessen.

Matchingaufgabe

Template Matching wird mit verschiedenen Absichten eingesetzt, die sich im Span-nungsfeld zwischen rein qualitativer Objektrekognition (Texterkennung, Schwerpunktsemantisch) und sehr präziser quantitativer Objektausmessung (Messmarkeneinmes-sung, Schwerpunkt geometrisch) bewegen. Für die kartografische Information ergibtsich für Punkt-, Linien- und Flächenobjekte ein etwa gleichgewichtiger Bedarf an geo-metrischem und semantischem Matching. Lediglich bei Beschriftungen, die nur einenschwachen Raumbezug besitzen tritt die geometrische Komponente gegenüber dersemantischen in den Hintergrund.

Präselektionen vor dem Template Matching

Das Template Matching ist ein sehr zeitaufwändiges Verfahren: Zur Berechnung derKorrelation müssen an jeder Bildstelle des Suchbildes so viele Paare von Pixeln (Such-bild und Template) in die Korrelationsfunktion eingeführt werden, wie die Anzahl derPixel im Template beträgt. Ein zweidimensionales Template mit „nur“ zehn Zeilen undSpalten erzeugt schon hundert Pixelpaare, die einzuführen sind. Je nach Anwendungs-gebiet können Templates durchaus aus Tausenden von Pixeln bestehen. Wird einesolch hohe Zahl von Pixelpaaren noch zusätzlich in komplexe Korrelationsfunktioneneingesetzt, erhöht dies die Rechenzeit enorm. Um diese zu gering zu halten, müssenPräselektoren eingesetzt werden. Präselektoren sind Bildoperatoren, die den Suchbe-reich, d.h. den Bereich, in dem das Template Matching zur Anwendung kommt, vor-gängig auf einen möglichst geringen Bereich eingrenzen.

Generelle Modifikation des Template Matching

Für gewöhnlich reagiert das Template Matching sehr empfindlich auf geometrischeDeformationen, die zwischen dem Template und einem gleichbedeutenden Suchbild-ausschnitt bestehen. Da solche Deformationen durch die vielfältigen Informationstrans-formationen (Ungenauigkeit beim Druck der analogen Vorlage, Rauscheinfluss beimScannen, Rasterungseffekte etc.) der Regelfall sind, ist eine Robustheit des TemplateMatching gegenüber diesen Effekten anzustreben.

Page 103: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Konzept einer geometrisch-semantischen Abfragemethode mit direktem Rasterdatenzugriff 91

Ausnutzung des kartografischen Wissens

Neben der generellen Modifikation des Template Matching kann die Matchingstrategiedurch das kartografische Wissen weiter modifiziert und unterstützt werden. Der konse-quente Einsatz kartografischen Wissens beschleunigt das Matchingverfahren.

Parameterarmes Verfahren

Die Steuerung der Interpretationsmethode durch Abfragesprachen erlaubt i.A. keinegrosse Anzahl von Tuningparametern. Die für das Matching notwendigen Parametermüssen sich vorderhand aus der Wissensbasis und aus den linguistischen Variablen inder Abfrageformulierung ableiten lassen, bevor der Benutzer zur Angabe von Parame-tern gezwungen wird.

Rotiertes und skaliertes Template Matching

Das Matchen von Strukturen, die in unterschiedlicher Orientierung gegenüber derRasterausrichtung und in unterschiedlicher Skalierung gegenüber der massstabdeter-minierenden Pixelgrösse auftreten können, führt beim konventionellen TemplateMatching zu erheblicher Zunahme der Rechenzeit, da die gesamte Templatematrix geo-metrisch zu transformieren ist. Es werden Strategien benötigt, die entweder auf rotati-ons- und skalierungsinvarianten Templates oder auf Präselektoren beruhen.

Austauschbare Wissensbasis

Die Abfragemethode wird für die Interpretation rasterbasierter Karten eingesetzt undauf das kartografische Wissen schweizerischer Landeskarten optimiert. Die Spezifikadieser Landeskarten sollen nach Möglichkeit nicht methodisch sondern ausschliesslichin der Wissensbasis deklariert werden.

6.3.2 Grundzüge des Mustererkennungsverfahrens

Aus den genannten Anforderungen ergeben sich die Grundzüge der Mustererken-nungsmethodik. Sie ist abhängig vom jeweiligen Templatetyp (region, profile, pixel).

Mustererkennung für den Templatetyp r e g i o n

Für Templates vom Typ region zeichnet sich folgender Ablauf von Mustererkennungs-verfahren ab:

A. Präanalyse

B. Rotations- und skalierungsinvariantes Template Matching

C. Alternativentest

D. Postprocessing und Visualisierung

Page 104: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

92 Kapitel 6

Die Präanalyse, deren Ziel die vorgängige Eingrenzung des Suchbereiches für region-Templates im Rasterbild ist, ergibt sich aus der Erfahrung, dass in ausgedehnten, einfar-bigen, flächenhaften Bildbereichen kaum Resultate zu erwarten sind. Sie können bereitsdurch einfache radiometrische Kriterien ermittelt werden und für die mit der Anzahlder zu untersuchenden Bildstellen zeitaufwändiger werdende Matchingstrategie ausge-blendet werden [Frischknecht (1996)].

Das rotations- und skalierungsinvariante Template-Matching bildet das Herzstück derMustererkennungsmethode. Auf die Grundzüge dieser Methode wird in Abschnitt 6.4eingegangen.

Der Alternativentest führt eine gezielte Probe der im Matching endgültig gefundenenMuster mit in der Wissensbasis deklarierten Alternativmustern durch, bei denen aufGrund der grossen geometrisch-grafischen Ähnlichkeit Verwechslungsgefahr besteht.Sollte hierin eine Alternative ein besseres Matchingresultat als das abgefragte Musterliefern, wird die Bildstelle der Alternative zugeordnet.58

Im Falle von Linien, Flächen und Wörtern endet die Mustererkennung nicht mit derAuffindung der Templates. Die Stützstellen der Templates müssen durch Postproces-singmodule wie Linien-, Flächen- und Wortkomposer unter Berücksichtigung ihrer Ver-kettungsregeln zu Linien, Flächen resp. Wörtern zusammengesetzt werden.

Die Visualisierung färbt die detektierten Rasterstrukturen im Bild ein und liefert eineanschauliche Repräsentation des Resultats im Rasterbild.

Mustererkennung für den Templatetyp p r o f i l e

Da profiles über eine lineare Ausbreitungsdimension verfügen, bietet sich eine Kombi-nation mit Linienextraktoren an. Der Ablauf der Mustererkennung kann folgendeGestalt annehmen:

A. Präanalyse

B. Linienverfolgung mit stützstellenweisem Matching der Linienprofile

C. Alternativentest

D. Postprocessing und Visualisierung

Präanalyse, Alternativentest, Postprocessing und Visualisierung entsprechen den Bear-beitungsschritten aus der Mustererkennung für regions. Dagegen kommt es bei der Lini-enverfolgung mit Profilmatching darauf an, beide Verfahren gut miteinander zukombinieren. Die Linienextraktion kann z.B. durch Skelettierung erhalten werden. Ent-lang des Verlaufs extrahierter Linien sind senkrecht entsprechende Profile zu matchen.Im Gegensatz zum Matchen von regions ist bei den profiles die Orientierung des Templa-tes vorbestimmt; das profile steht nämlich in etwa senkrecht zum Linienverlauf. DieMatchingstrategie kann - abgesehen von der vorbestimmten Orientierung und der

58. vgl. Anquetil et al. (1999).

Page 105: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Konzept einer geometrisch-semantischen Abfragemethode mit direktem Rasterdatenzugriff 93

Behandlung eindimensionaler Templates - von der Mustererkennung der regions über-nommen werden [Badard (1999)].

Mustererkennung für den Templatetyp p i x e l

Da der Templatetyp pixel nur aus einem einzigen Pixel besteht, ist keine Matchingstra-tegie erforderlich. Einfache Formen der Mustererkennung für diesen Typ sind die Lay-ertrennung oder die Schwellwertbildung. Wünschenswert wäre bei der Extraktion vonFlächen, dass die Methode die in Flächen enthaltene Linien- und Punktsignaturenerkennen und zusammengehörige Flächensegmente zusammenführen kann.

6.4 Matchingstrategie

6.4.1 Anforderungen an die Matchingstrategie

Für das rotations- und skalierungsinvariante Template Matching, das zur Mustererken-nung von regions und in abgeschwächter Weise auch von profiles benötigt wird, ist eineStrategie zu entwickeln, die folgenden Anforderungen gerecht wird:

• Die für ein gesuchtes Muster gültige geometrisch-grafische Definition ist aus derWissensbasis, d.h. dem Template zu entnehmen.

• Matchingparameter müssen sich vorderhand aus dem Matchingoperator, der in derAbfrage verwendet wird, oder - falls sie templatespezifisch sind - aus der Wissensba-sis ableiten lassen.

• Viele kartografische Signaturen sowie Buchstaben und Zahlen treten in kartografi-schen Dokumenten in verschiedenen Grössen und/oder Orientierungen gegenüberdem Kartenmassstab resp. der Kartenausrichtung und damit auch gegenüber demRaster bei kartografischen Rasterdaten auf. Das Template Matching hingegen istmethodisch sehr stark an das Raster gebunden und erlaubt nur das Auffindengleichgrosser und gleichorientierter Strukturen im Raster. Da die gestellten Abfra-gen nach raumbezogener Information nicht an das Raster gebunden sind, muss dieTemplate-Matching-Strategie allfällige Rotations- und Skalierungsinvarianzen simu-lieren.

• Das Matchen beliebig rotierter und skalierter Symbole soll nicht zu inakzeptabel lan-gen Rechenzeiten führen.

• Von der Matchingstrategie wird erwartet, dass sie gegen die in den Rasterdaten auf-tretenden Rasterungseffekten und dem Bildrauschen robust ist. Im klassischen Pixel-vergleich muss entsprechende Unschärfe implementiert werden. Dabei ist derAnsatz von Stengele (1995) aufzunehmen, nach dem innerhalb eines TemplatesRegionen unterschiedlicher Signifikanz (d.h. mit unterschiedlicher Relevanz für dieObjektdefinition) zu unterscheiden sind.

Page 106: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

94 Kapitel 6

• Die Interpretation der Abfragen muss diejenige Unschärfe berücksichtigen, diedurch die Verwendung linguistischer Variablen entsteht.

Die Verwendung von Templates, in denen die Träger semantischer Information geome-trisch-grafisch definiert werden, ist bereits vom konventionellen Matching her bekannt.Eine Abfrage nach einem bestimmten kartografischen Zeichen wird durch das Einlesender geometrisch-grafischen Templatedefinition, d.h. der Wissensbasis initiiert. DieOperatoren, die in der Abfragesprache zum Einsatz kommen, sind Repräsentaten derMatchingparameter. Sinnvoll ist es, für die üblicherweise in kartografischen Dokumen-ten vorkommenden Fälle (nichtrotierbare und nichtskalierbare Strukturen, rotierbareaber nicht skalierbare Strukturen, nichtrotierbare aber skalierbare Strukturen undgleichwohl rotierbare wie skalierbare Strukturen) je eigene Operatoren anzulegen, zudenen sich Matchingparameter zuordnen lassen.

Die Simulation der Rotationsinvarianz und die Berücksichtigung von Unschärfe bedür-fen eines Einsatzes besonderer Matchingstrategien, auf die wir in den nächsten Unter-abschnitten eingehen.

6.4.2 Simulation der Rotations- und Skalierungsinvarianz durch Struktur-punktmatching

Template Matching beruht auf der Durchführung räumlich begrenzter Pixelvergleiche(zwischen einem Bildausschnitt und dem Template) und ist somit sehr stark an dieRasterstruktur gebunden. So ist eine Rekognition von Rasterstrukturen, die sich durcheine Drehung oder eine Skalierung gegenüber der Templatedefinition unterscheiden,strukturell nicht möglich.59 Im konventionellen Template Matching ist das Auffindender gegenüber der Grundstellung rotierten oder skalierten Muster nur durch eine vor-gängige Ähnlichkeitstransformation des Templates möglich. Diese Templatetransfor-mation muss für jede Orientierung und Skalierung neu durchgeführt werden, undanschliessend muss mit diesem angepassten Template erneut der gesamte Suchbereichabgetastet werden. Selbst wenn nur wenige Orientierungen und Grössen abseits derGrundstellung verlangt werden, nimmt die Rechenzeit multiplikativ mit der Anzahlder vorzunehmenden Transformationen zu, die Rechenzeit für die Transformation desTemplates (d.h. seine Anpassung an aktuelle Grössen- und Orientierungsparameter)noch nicht berücksichtigt.

Bei den meisten kartografischen Signaturen ist die Grösse festgelegt, so dass Skalierun-gen nicht notwendig sind. Die übrigen Signaturen können zwar unterschiedliche Grös-sen aufweisen, allerdings nur in wenigen in der Legende vordefinierten diskretenGrössenstufen. Bei den Orientierungen hingegen gibt es entweder nicht-rotierbareSignaturen oder solche, die über kontinuierliche Orientierungsbereiche rotiert werden

59. Es gibt jedoch Möglichkeiten zur Erfassung rotierter und skalierter Muster, jedoch nicht auf Basis des(starren) Template-Matching [Adam et al. (1999)]. Ebenso gibt es Ansätze zu einem flexiblen, deformier-baren Template Matching [Valveny and Martí (1999)].

Page 107: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Konzept einer geometrisch-semantischen Abfragemethode mit direktem Rasterdatenzugriff 95

können. Für die Orientierungen müssen daher so feine diskrete Abstufungen vorge-nommen werden, dass Rasterstrukturen im gesamten kontinuierlichen Winkelbereichdetektiert werden können.60 Bei der Orientierung können zudem Symmetrieeigen-schaften genutzt werden (beispielsweise sind Kreise rotationssymmetrisch, andereSignaturen haben Symmetrieachsen, welche die Suchbereiche reduzieren helfen).

Die Abfrage nach beliebig rotierten und/oder beliebig grossen Signaturen führt trotzEinführung dieser Wissensbestandteile zu inakzeptabel hohen Rechenzeiten. Sie sindproportional zur Anzahl der Pixelvergleiche und der Suchstellen im Bild, die nach all-fälliger Regionenmarkierung nicht ausgeschieden wurden. Zu einer grundlegendenReduktion der Rechenzeit bei der Suche beliebig rotierter resp. beliebig grosser Raster-strukturen führt eine weitere Präselektionsstufe, die im Gegensatz zur rein radiometri-schen Präanalyse (Punkt A im Ablauf, Abschnitt 6.3.2) eine template-abhängige Ein-grenzung des Bildbereiches ist.

Aufgabe der Präselektoren ist es, den Suchbereich für das (zeitaufwändige) endgültigeTemplate Matching möglichst schnell und effizient auf möglichst wenige Bereiche vor-gängig einzuschränken. Da die Zeit des Matchens wesentlich von der Anzahl der vor-zunehmenden Pixelvergleiche abhängt, sollen Präselektoren in gewissen aussagekräfti-gen Teilbereichen eines Templates Voruntersuchungen durchführen. Diese Teilbereichesollen nach Möglichkeit aus Pixelregionen bestehen, die auch bei stärkeren Deformatio-nen mit hoher Wahrscheinlichkeit zum Hinter- bzw. Vordergrundbereich des Templa-tes gehören.

Abb. 6.5: Reduktion der Bildvergleiche eines Templates (a) durch (b) Reduktion auf Skelettlinien und(c) weitergehende Reduktion auf wenige charakteristische Punkte.

60. Versuche haben gezeigt, dass eine Abstufung der Orientierung in 3°- bis 5°-Schritten und eine Grössen-abstufung von 5% bis 10% der Signaturgrösse für eine quasikontinuierliche Abdeckung ausreichen.Diese Werte können jedoch je nach Template variieren.

(a) (b) (c)

Page 108: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

96 Kapitel 6

Die Reduktion des Templates auf wenige Vergleichspixel für einen Präselektor kanndurch Ausdünnen der zweidimensionalen Templatematrix (Eingrenzen auf wenige flä-chenhafte Teilregionen) erfolgen oder durch Reduktion auf Skelettlinien (linienhaft)bzw. charakteristische Punkte (punktförmig). Besonders vorteilhaft ist die Reduktiondes Templates auf wenige charakteristische Punkte, denn bei einer Skalierung bzw.Rotation einer solchen Auswahl bleibt die Anzahl der Pixelvergleiche konstant und dieTransformation beschränkt sich auf Punkttransformationen. Bei Linien- und Flächenbe-reichen ist die Anzahl der Vergleichspunkte nicht nur generell höher sondern ändertsich auch je nach Transformation.

Tests haben ergeben, dass das Matchen charakteristischer Punkte (sog. Strukturpunkt-matching) ein äusserst effizienter Präselektor für Template-Matching-Verfahren dar-stellt.

Für das Template Matching eines Templates in mehreren Orientierungen und Grössenwird zunächst in allen Orientierungen und Grössen nur das Strukturpunktmatchingdurchgeführt. Diejenigen Pixelvergleiche, zu denen der Satz charakteristischer Punktepositiv korreliert ist, werden als Rohresultate bestehend aus Bildstelle (Koordinaten),aktueller Orientierung und aktueller Grösse zwischengespeichert. Im anschliessendenTemplate Matching über die gesamte Templatedefinition werden nur noch die zwi-schengespeicherten Rohresultate berücksichtigt.

Die durch das Strukturpunktmatching ermöglicht die Simulation des rotations- undskalierungsinvarianten Template Matching.

6.4.3 Fuzzifiziertes Matching

In den Anforderungen an die Matchingstrategie (6.4.1) verbleiben noch zwei Aspekte,die bislang nicht berücksichtigt wurden. Ihnen wird durch das sog. fuzzifizierteMatching Rechnung getragen.

Fuzzifiziertes Matching bedeutet, dass der Bildvergleich zwischen Template und Bildaus-schnitt mit Unschärfe berücksichtigenden Komponenten versehen wird. Unterschiedenwird dabei in die äussere Fuzziness, die sich auf die Interpretation der Matchingpara-meter und die geometrische Lagerung des Musters im Bild bezieht, und in die innereFuzziness betreffend radiometrischer Ungenauigkeiten, die vom Bildrauschen und vonden Rasterungseffekten verursacht werden.

Äussere Fuzziness

Die Parameter für Grösse und Orientierung werden i.A. nicht explizit in der Abfrage-formulierung angegeben. Die zu verwendenden Matchingoperatoren verweisen aufentsprechende Parameter, die sich aus der Wissensbasis ableiten lassen. Viele kartogra-fische Signaturen haben nur eine feste Grösse und/oder Orientierung, andere weisenfestgelegte Stufen in diesen Lagerungsparametern auf.

Page 109: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Konzept einer geometrisch-semantischen Abfragemethode mit direktem Rasterdatenzugriff 97

Die Erfahrung mit dem Matchen in Rasterdaten zeigt jedoch, dass das Maximum derKorrelation, d.h. die beste Übereinstimmung zwischen Bildausschnitt und Template inden seltensten Fällen beim angehaltenen Orientierungs- und Grössenparameter ange-nommen wird. Wird beispielsweise durch eine Abfrage nach einem Muster der Grösse14pt und der Orientierung 0° gefragt, so dürften logischerweise sämtliche Bildstellen,bei denen sich das Muster mit ähnlichen, aber nicht exakt gleichen für das Korrleations-maximum optimalen Parametern, z.B. Grösse 14.3pt und Orientierung -2° nicht detek-tiert werden. Dieses macht aber in den meisten Fällen keinen Sinn, da solcheAbweichungen im Bereich der Rasterungseffekte liegen oder gar auf Druckungenauig-keiten in der analogen Vorlage zurückzuführen sind. Ein Muster mit den Parametern16.0pt und einer Orientierung von 30° hat hingegen signifikant andere Lagerungspara-meter und sollte nicht zu o.g. Abfrage passen.

Die „strenge Exaktheit“ des Template-Matching-Verfahrens muss durch Aufweichungder Lagerungsparameter beseitigt bzw. fuzzifiziert werden. Eine Bildstelle, die einMuster mit ungefähr den in der Abfrage geforderten Parametern enthält, ist in gewis-sen Toleranzbereichen als konform zur Abfrage zu betrachten.

Abb. 6.6: Äussere Fuzziness beim Matchen (hier reduziert auf den zweidimensionalen Parameterraum,der von Signaturgrösse und –orientierung aufgespannt wird).

Neben den Lagerungsparametern Orientierung und Grösse sollten auch noch die Orts-lagerungsparameter (Zeilen- und Spaltenposition des Suchbildes) mit einbezogen wer-den, da das Strukturpunktmatching (6.4.2) nur ungefähre Orte liefert. Die äussereFuzziness besteht also in der Überführung der vier Lagerungsparameter Grösse S, Ori-entierung W, Zeilen- und Spaltenwert X und Y in Toleranzintervalle S±dS, W±dW,X±dX und Y±dY.

Wird innerhalb dieses vierdimensionalen Parameterraums, d.h. des durch die Toleranz-intervalle aufgespannten Toleranzfensters, ein Korrelationsmaximum gefunden, sowird es als Ergebnis, das der Abfrage entspricht, betrachtet (Abb. 6.6). Dieses Vorgehenentspricht der unscharfen Abfrageausführung auf eine scharf formulierte Abfrage (vgl.5.3.1 bzw. Abb. 5.3(b)).

Page 110: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

98 Kapitel 6

Der sonst bei der Mustererkennung häufig vorkommende Fall, wonach ein Musterallgemein affin61 und nicht nur im Sinne einer Ähnlichkeit (Skalierung und Rotation)deformiert ist, wird hier nicht berücksichtigt, da diese Effekte bei Rasterdaten mit karto-grafischen Signaturen nur eine untergeordnete Rolle spielen.

Innere Fuzziness

Die Einführung von innerer Fuzziness soll radiometrischen Ungenauigkeiten zwischenBildausschnitt und Template entgegentreten. Für gewöhnlich werden beim Matcheneines zum Template passenden Bildausschnittes mit seinem Template keine Korrelatio-nen von exakt 100% erhalten. Konventionelle Template-Matching-Verfahren begegnendiesem Effekt durch Einführung eines Schwellwertes bei der Korrelationsberechnung,indem beim pixelweisen Vergleich nicht zwingend 100%-ige sondern durchaus gerin-gere Übereinstimmung für eine erfolgreiche Detektion resultieren darf.

Stengele (1995) hat bei diesem Vorgehen zu Recht bemängelt, dass die Korrelationsbe-rechnung, die sich ja auf das gesamte Template bezieht, keine Rücksicht auf für diesemantische Bedeutung des Zeichens mehr oder weniger signifikante Teilbereicheinnerhalb des Templates nimmt. Basierend auf seinem Ansatz, der von unterschiedlichsignifikanten Teilbereichen im Template ausgeht (vgl. 3.3.4), soll eine neue Methodeentwickelt werden, die dem ebenso Rechnung trägt.

Werden Binärtemplates betrachtet, bei denen lediglich zwischen einem Vordergrund-bereich und einem Hintergrundbereich unterschieden wird62, bestehen Template undBildauschnitt aus einer geometrisch starren Anordnung von Vordergrund und Hinter-grund definierenden Pixeln. Die Grundidee der Einführung innerer Fuzziness bestehtnun darin, die klassische Zuteilung der Pixel zu Vorder- resp. Hintergrund sowohl imBildauschnitt wie auch im Template durch Einführung einer Fuzzy-Membership-Funk-tion aufzuweichen. Diese Fuzzy-Membership-Funktion wird im Falle von region-Tem-plates flächenhaft, im Falle von profiles linienhaft definiert.

Diese Aufweichung erfolgt im Template wissensbasiert, da es für die geometrisch-gra-fische Definition einer Rasterstruktur mehr oder weniger signifikante Bereiche der Vor-der- wie Hintergrunddefinition gibt. Im Bildausschnitt erfolgt sie hingegen modell-basiert, indem ein die Rasterungseffekte und das dadurch auftretende Rauschenberücksichtigendes Bildmodell zu Grunde gelegt wird.

Die Fuzzy-Membership-Funktion nimmt an jeder Template- bzw. Bildausschnittstelleeinen Wert zwischen 0.0 und 1.0 an, der den Grad der Zugehörigkeit zum Vordergrundangibt. Fuzzy-Membership-Werte (FM-Werte) von 0.0 bis 0.5 stehen für Hintergrundbe-reiche, Werte zwischen 0.5 und 1.0 hingegen für Vordergrundbereiche.

Durch wissensbasierte Festlegung entsprechender FM-Werte kann nun ein Templatedefiniert werden (Abb. 6.7). Bildstellen mit FM-Werten nahe bei 0.0 gelten als hochsi-

61. Z.B. Scherungen, Massstabsvariationen in ausgeprägten Richtungen, Verzerrungen etc.62. Diese Annahme kann für kartografische Signaturen allgemein angenommen werden.

Page 111: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Konzept einer geometrisch-semantischen Abfragemethode mit direktem Rasterdatenzugriff 99

gnifikanter Hintergrundbereich, der essenziell zur Definition des Templates gehört.Hingegen nimmt die Signifikanz für den Hintergrund bei Werten bis 0.5 ab, bis sie imFM-Wert 0.5 den indifferenten Fall erreicht, wo Vorder- wie Hintergrund gleiche Signi-fikanz zukommt. Von dort an nimmt die Signifikanz des Vordergrund bei steigendenFM-Werten zu, bis sie bei 1.0 im höchst signifikanten Vordergrund angelangt ist.

Abb. 6.7: (a) region-Template mit Signifikanzregionen nach Stengele (1995) und (a),(b) daraus erzeugteFuzzy-Membership-Funktion in verschiedenen 3D-Ansichten. Die Zuordnung zwischen ih-nen ist in (c) schematisch angedeutet.

Die modellbasierte Fuzzifizierung des Bildausschnittes hingegen erfolgt durch Anwen-dung eines Glättungsoperators, um Rasterungseffekte und das Bildrauschen zu berück-sichtigen. Ohne Fuzzifizierung haben die Vordergrundbereiche des Bildausschnitteseinheitlich den Fuzzy-Membership-Wert 1.0, die Hintergrundbereiche63 den Wert 0.0.Der Glättungsoperator hängt vom Modell des Bildrauschens und der Rasterungseffekte

(b)

(a)

(c)

63. Als Hintergrundbereiche werden Pixel sämtlicher Farben bezeichnet, die nicht identisch mit der Vor-dergrundfarbe des Templates sind. Die Vordergrundfarbe ist in der Wissensbasis, d.h. dem Template-header vermerkt.

Page 112: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

100 Kapitel 6

ab, sollte allerdings nur für eine geringe Fuzzifizierung, d.h. eine geringe Glättung desBildauschschnittes sorgen.

Berechnung und Auswertung der Matchingdifferenz

Bei der Berechnung der Matchingkorrelation kommt es auf den Vergleich zwischenTemplate und Bildausschnitt an. Es werden pixelweise die Beträge der Differenzen zwi-schen Template und leicht fuzzifiziertem Bildauschnitt berechnet (Matchingdifferenz).

Abb. 6.8: Bilden der Matchingdifferenz bei einem region-Template (Differenzbeträge zwischen fuzzifi-ziertem Bildausschnitt und fuzzifiziertem Template)

Die so erhaltene Flächenfunktion (vgl. Abb. 6.8) repräsentiert pixelweise die lokalen Dif-ferenzen zwischen dem Bildausschnitt und dem Template. Sie müssen für die Ermitt-lung der Übereinstimmung, d.h. für die Berechnung der Matchingkorrelationausgewertet werden. Stengele (1995) hat jedoch erkannt, dass eine undifferenzierteBetrachtung der pixelweisen Differenzen der im Template lokal unterschiedlich starkausgeprägten Signifikanz (Templatedefinition) nicht gerecht wird.

Daher wird seinem Ansatz Rechnung getragen, die Auswertung der Pixelvergleiche ineiner hierarchischen Abstufung von einzelnen Teilbereichen (den sog. Signifikanzregio-nen) des Templates vorzunehmen. Für die Anzahl der betrachteten Signifikanzstufenund für die Abgrenzung entsprechender Teilbereiche des Templates können keine all-gemein gültigen Regeln angegeben werden, sondern sie ergeben sich aus entsprechen-den Versuchen mit dem Template. Die Signifikanzregionen sollten jedoch nicht zu klein

Bild-ausschnitt

modellbasierte Fuzzifizierung

(durch Glättung)

Template

wissensbasierte Fuzzifizierung

(Templatedefinition)

Beträge der Differenzaus den Fuzzymembership-

Flächenfunktionen

Page 113: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Konzept einer geometrisch-semantischen Abfragemethode mit direktem Rasterdatenzugriff 101

gewählt werden, da sonst zufällige Rauscheffekte stark ins Gewicht fallen. Signifikanz-regionen werden für alle Templatebereiche betrachtet, bei denen Vorder- und Hinter-grund nicht indifferent, d.h. nicht mit dem Fuzzy-Membershipwert 0.5 belegt werden.

Zur Auswertung werden in jeder Signifikanzzone die Mittelwerte der Differenzbeträgegebildet. Sie fassen die Differenzen einer jeden Zone stellvertretend zu einem Skalarzwischen 0.0 und 1.0 zusammen.

Defuzzifizierung durch Schwellwertbildung und vorzeitigen Abbruch

Beginnend mit den Zonen höchster Signifikanz bis zur am wenigsten signifikantenZone werden die Mittelwerte mit dem zonenabhängigen Schwellwert verglichen. Liegtder Mittelwert betragsmässig unter dem für die Signifikanzzone gültigen Schwellwert,so gilt die Übereinstimmung zwischen Template und Bildausschnitt in der Zone als hin-reichend. Andernfalls wird das Matchingverfahren für den aktuellen Bildvergleich vor-zeitig abgebrochen, ohne dass die Mittelwerte in den weiteren, noch nichtausgewerteten Signifikanzzonen oder gar die gesamthafte Matchingkorrelation berech-net wird. Die Schwellwerte zum vorzeitigen Abbruch sind für die höher signifikantenBereiche niedriger gesetzt, da in diesen Bereichen höhere Übereinstimmungen undgeringere Differenzen zwischen Template und Suchbild erwartet werden.

Defuzzifizierung durch lokale Filterung

Neben der generellen Entscheidung darüber, ob ein Bildausschnitt als „mit dem Tem-plate übereinstimmend“ angenommen oder andernfalls durch den oben beschriebenenvorzeitigen Abbruch abgelehnt wird, muss berücksichtigt werden, dass in der Umge-bung eines gut passenden Bildausschnittes sehr viele im Matchingverfahren angenom-mene Resultate erhalten werden, die sich untereinander nur geringfügig in denLagerungsparametern (Grösse, Orientierung, Ortsvariablen) unterscheiden. Dies istu.A. eine Folge der äusseren Fuzziness. Da aber für die lokale Bildstelle nur ein einzi-ges, nämlich das am besten passende Matchingresultat berücksichtigt werden kann, müs-sen die Ergebnisse in lokalen Bereichen gefiltert werden.

Zu denjenigen Bildstellen, die nach der Defuzzifizierung mittels Schwellwertbildung inden Signifikanzzonen erhalten bleiben, werden noch Korrelationswerte (gemäss 3.3.1,z.B. nach den Formeln [3.10] bis [3.12]) errechnet. Dann kann die Filterung von mehre-ren, sich in lokal begrenzter Umgebung befindenden und somit konkurrierendenMatchingresultaten nach dem maximalen Korrelationswert erfolgen (Defuzzifizierungdurch das Maximum).

Zusammenfassung: Fuzzifizierung und Defuzzifizierung im Matchingprozess

Bei dem hier vorgestellten Matchingverfahren handelt es sich um eine Methode, diewährend ihres Prozesses Unschärfe einführt (Fuzzifizierung), dann eine Entscheidungfällt und die Resultate wieder in den aussagenlogisch scharfen Bereich abbildet (Defuz-zifizierung). Dieses Vorgehen entspricht dem Regelungsvorgang eines Fuzzy-Controlers

Page 114: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

102 Kapitel 6

in der Fuzzy-Regelung, bei dem Fuzzifizierung und Defuzzifizierung Bestandteile desÜbertragungsglieds sind (vgl. 5.3.2).

Fuzzifizierende, d.h. Unschärfe einführende Komponenten des Systems sind die äus-sere Fuzziness (Aufweichung der Rohergebnisse aus dem Strukturpunktmatchingdurch Toleranzfenster für die Lagerungsparameter, das gleichzeitig als liguistischeInterpretation des in der Abfrage formulierten Matchingoperators angesehen werdenkann) und die innere Fuzziness (modellbasiert bezüglich Bildausschnitt und wissensba-siert bezüglich Template). Defuzzifizierend ist der vorzeitige Abbruch durch Schwell-wertbildung in den Signifikanzzonen und die Filterung in der lokal begrenztenUmgebung nach dem Korrelationsmaximum.

Abb. 6.9: Fuzzifizierung und Defuzzifizierung im Matchingprozess (inkl. Alternativentest).

Führt man noch zusätzlich an dieser Stelle den Alternativentest ein, so ist die Berück-sichtigung von mehreren Alternativen zu einem Muster ein weiterer fuzzifizierenderFaktor und die Entscheidung für das bessere Korrelationsmaximum zwischen Templateund Alternativtemplates ein weiterer defuzzifizierender Faktor.

Diese Einführung von Unschärfe macht sich in einer temporären Erhöhung der Daten-menge bemerkbar, was sich aus Abb. 6.9 schematisch ergibt.

Page 115: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Konzept einer geometrisch-semantischen Abfragemethode mit direktem Rasterdatenzugriff 103

6.5 Kombination von direkter und indirekter Abfragemethode

Die Kombination der direkten Abfragesprache („GRaQueL“) und der indirekten Abfra-gesprache von Frischknecht (1999) („RaQueL“) ist erstrebenswert. Zwei verschiede Kon-zepte nämlich Matchingstrategie und Merkmalsklassifikation können sich so metho-disch ergänzen.

Es wird in der Interpretation von Rasterdaten immer wieder Fälle geben, bei denen dieMerkmalsklassifikation dem Matching vorzuziehen ist und umgekehrt. Die Merkmals-klassifikation verbucht ihre Stärken in einer geometrieinvarianten Interpretation und istauch bei stärkeren geometrischen Deformationen robust. Matchingstrategien sindimmer dann vorzuziehen, wenn bei der Segmentierung des Bildes semantische Einhei-ten zerschnitten werden. Dies ist häufig der Fall, wenn ein Zeichen aus mehreren von-einander getrennten grafischen Komponenten besteht wie z.B. Buchstaben mitdiakritischen Zeichen.

Um eine solche Kombination zu ermöglichen, muss die Konsistenz der Informations-quelle beider Abfragemethoden gewährleistet werden. Mit jeder Abfrage in „GRa-QueL“ ändern sich die Bereiche zusammenhängender Pixel. Die für „RaQueL“ durch-zuführende Segmentation liefert andere Objekte, und mit diesen ändert sich auch dieDatenbank der Objektmerkmale. Beide Abfragesprachen können in einer gemeinsamenAbfragemaske gesteuert werden, jedoch muss aus vorgenanntem Grunde gesichertwerden, dass bei jedem Wechsel von einem „GRaQueL“- zu einem „RaQueL“-Abfrage-befehl die Objektmerkmalsdatenbank ggf. neu erzeugt wird. Umgekehrt kann „GRa-QueL“ problemlos nach jeder „RaQueL“-Abfrage benutzt werden, da „GRaQueL“ nurauf originäre Bilddaten zugreift und keine zwischenabbildende Datenbank benötigt.

Page 116: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG
Page 117: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Kapitel 7

Realisierung einer Abfragesprache für geome-trische und semantische Information

Die konkrete Umsetzung der Abfragesprache „GRaQueL“ in einem Softwaremodul amInstitut für Geodäsie und Photogrammetrie der ETH Zürich betrifft die Schaffung einesAbfragesprachwortschatzes (Abschnitt 7.1), mit dem die Abfragen für „GRaQueL“ for-muliert werden können, und die Realisierung der Rasterdaten verarbeitenden Module(Abschnitt 7.2). Die Verbindung zwischen dem vom Benutzer eingegebenen Abfragebe-fehl und der rasterbasierten Mustererkennung erklärt sich im funktionellen Ablauf undim Datenfluss in „GRaQueL“, was im Abschnitt 7.3 thematisiert wird. Der letzteAbschnitt 7.4 geht auf die Einbettung von „GRaQueL“ in den Kontext weiterer bereitsbestehender Softwaremodule und Programme ein und zeigt Möglichkeiten ihrer Inter-aktion auf.

Die Realisierung erfordert eine sorgfältige Abstimmung von Wissensvorhaltung (karto-grafische Wissensbasis), geeigneten Rasterdatenverarbeitungsmethoden und einemodellgerechte Implementierung einer Abfragesprache. In einer ersten Etappe, dieBestandteil dieser vorliegenden Arbeit ist, wird „GRaQueL“ für den Templatetypusregion implementiert. Mit diesem Templatetypus können Punktsignaturen, Linien undFlächen, bestehend aus Einzelzeichen sowie Beschriftungen (Einzelbuchstaben bzw. -ziffern sowie Wörter und Zahlen) erfasst werden. Die Erweiterung auf Templatetypenprofile und pixel wird sowohl methodisch als auch syntaktisch in der Realisierung vorbe-reitet.

7.1 Steuerung der Module durch die Abfragesprache

Wie die Syntax von „RaQueL“ [Frischknecht (1999)] wird auch für die Syntax von „GRa-QueL“ die Nähe zum SQL-Standard gesucht, um die Benutzerfreundlichkeit und diemethodische Verwandschaft zum Analysewerkzeug in Datenbanken zu unterstreichen.

Page 118: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

106 Kapitel 7

Der zentrale Befehl für die Ausführung von Abfragen ist der SELECT-Befehl. Seinebenutzerfreundliche Syntax bildet - dem Vorschlag aus Kapitel 6.2 gemäss - auch für„GRaQueL“ das Grundgerüst für die Formulierung von Abfragen. Trotz der weitge-hend bestehenden Analogie zwischen „GRaQueL“-Abfragen und dem Datenbank-SQLmüssen einige Abweichungen, die durch den Mechanismus der Abfragedurchführungbestimmt sind, in Kauf genommen werden.

Die wohl wichtigste Abweichung besteht in den neuen Attributen und Operatoren fürden SELECT-Befehl (7.1.1). Die grundsätzliche Syntax, die sich aus den Schlüsselwör-tern select, from und where zusammensetzt, die das Vokabular zur Abfrageformulierungliefern, bleibt hingegen erhalten (7.1.2).

Das Gegenstück zum Befehl select ist der neugeschaffene Befehl unselect, der die Visuali-sierung ausgewählter Information zurücknimmt (7.1.3). Für den von „RaQueL“ herbekannten Befehl reselect+ bzw. reselect- ist in „GRaQueL“ keine Entsprechung gefun-den worden.

Die neu einzuführenden Operatoren von „GRaQueL“ benötigen zur Ausführung Para-meter, die durch weitere Befehle manipuliert werden können (7.1.4 und 7.1.5). Ver-knüpfungen von mehreren Abfragen sind bei gewöhnlichen Abfragesprachen bekannt.Die beiden letzten Unterabschnitte (7.1.6 und 7.1.7) widmen sich den Möglichkeiten, die„GRaQueL“ diesbezüglich bietet.

7.1.1 Attribute und Operatoren für die direkte Abfrage

Gemäss Kapitel 6.2 sind für die direkte Abfragesprache neue Attribute und neue Opera-toren zu implementieren. Attribute treten im SELECT-Befehl sowohl bei der Datenfor-matierung im SELECT-Teil wie auch bei der Datenadressierung im WHERE-Part auf.Sie beziehen sich hierbei auf den Gegenstand bzw. den Gegenstandstyp der Abfrageund die Operatoren regeln die Methodik der Abfrageausführung.

Attribute im SELECT-Part für die direkte Abfrage

Die SELECT-Attribute geben die Formatierung der abgefragten Information an. Hiersind fünf Attribute gemäss Kapitel 6.2 einzuführen, die nach der Mustererfassungunterschiedliche Postprocessingmodule (7.2.6) aufrufen. Es handelt sich um point, lineund area für die kartografischen Zeichen und um char und word für Beschriftungen (vgl.auch Abb. 6.4).

Nach der Mustererfassung liegen die Abfrageergebnisse zunächst als gesammelte Listegefundener Bildstellen vor, bei denen zwischen dem jeweiligen Template und demBildausschnitt eine gute Übereinstimmung festgestellt wurde. Die Überführung dieserResultate in die gewünschte Form liefern ggf. Postprozessoren. In Abhängigkeit desangegebenen SELECT-Attributes werden nachfolgende Postprozessoren gestartet:

Page 119: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Realisierung einer Abfragesprache für geometrische und semantische Information 107

Attribute im WHERE-Part für die direkte Abfrage

Das WHERE-Attribut spezifiziert den Typ des Vergleichsgegenstands. Da in der erstenRealisierungsstufe nur Templates vom Typ region implementiert werden, ist region daseinzige WHERE-Attribut in „GRaQueL“. Die Typen profile und pixel können zwar schonangegeben werden, sie werden aber nicht ausgeführt, da die korrespondierende Wis-sensbasis und Methodik noch nicht angelegt wurden.

Operatoren für die direkte Abfrage

Wenn die direkte Abfrage mittels Matching durchgeführt wird, so treten an die Stelleder mathematischen Vergleichsoperatoren die Matchingoperatoren, die ein aussagenlo-gisches Resultat zur Aussage „Template und Bildausschnitt passen zueinander“ liefern.

In Kapitel 6.2 sind die Matchingoperatoren vorläufig einheitlich mit „LIKE“ bezeichnetworden. Für den Einsatz der Abfragesprache in der Praxis ist es jedoch sinnvoll, meh-rere Matchingoperatoren einzuführen, die zu unterschiedlichen Matchingparameternführen.

Die Motivation für diese Differenzierung ergibt sich aus der Tatsache, dass es kartogra-fische Zeichen gibt, die über eine einheitliche, feste Grösse verfügen, andere wiederumtreten in verschiedenen Signaturgrössen auf. Ebenso verhält es sich mit der Orientie-rung der Zeichen gegenüber der Nordrichtung. Zwar können die Variationsmöglich-keiten der einzelnen kartografischen Muster in der Wissensbasis abgelegt werden undsomit einem allgemein gültigen Matchingoperator zugänglich gemacht werden, dochkann es auch Sinn machen, die Grössen- bzw. Orientierungsvariation im Einzelfall nichtzuzulassen.

SELECT point kein Postprocessing (Format Einzelpunkte, d.h. Angabe des Referenzpunktes dergefundenen Muster und der Parameter wie Grösse, Orientie-rung, Farbe etc.)

SELECT line Postprocessing Linienbildung (Ausgabe als DXF-File mit Polygonlinien, die die Referenz-punkte der einzelnen gefundenen Muster verbinden)

SELECT area Postprocessing flächenumschliessendes Polygon(Ausgabe als DXF-File mit Polygonen, welche die von gefun-denen Einzelsignaturen gebildete Fläche repräsentieren)

SELECT char kein Postprocessing (wie Format Einzelpunkte, jedoch befindet sich der Referenz-punkt nicht in der Signaturmitte, sondern auf der Fussliniedes Zeichens)

SELECT word Postprocessing Wortkomposition(Ausgabe zusammengesetzter Wörter und Zahlen mit mittle-rer Position und Orientierung)

Page 120: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

108 Kapitel 7

Aus dieser Überlegung ergeben sich vier Matchingoperatoren:

LIKE steht für einen Matchingoperator mit fester Grösse und fester Orientierung. Eswird kein rotiertes und skaliertes Template Matching angewandt. Als Matchingpara-meter für die feste Grösse und die feste Orientierung werden die Standardwerte aus derWissensbasis übernommen. Im Falle der Signaturgrösse wird bei nicht-skalierbarenSignaturen die Standardgrösse der Legende verwendet und bei skalierbaren Signaturendie im Allgemeinen am häufigsten vorkommende Grösse. Die Signaturorientierung desMusters beträgt 0°.

Tab. 7.1: Matchingoperatoren für Einzelsignaturen und ihre Variabilität bezüglich der Grösse und derOrientierung des Templates.

SIMILAR steht für einen Matchingoperator mit variabler Grösse und fester Orientie-rung. Bei den skalierbaren Signaturen werden alle laut Legende vorkommenden Grös-senstufen berücksichtigt, bei nicht-skalierbaren Signaturen fällt dieser Operator mitdem LIKE-Operator zusammen

Der ROTATED-Zusatz, der SIMILAR oder LIKE nachgestellt werden kann, eröffnet dieMöglichkeit, rotierbare Signaturen zu erfassen. Es wird ein um 0° symmetrischer Win-kelbereich in gestufter Abfolge gematcht. Durch die Angaben in der Wissensbasis kön-nen die Winkelbereiche festgelegt werden. Bei rotationssymmetrischen Signaturen

6WDQGDUGZHUW

%HUHLFKJHPlVV:LVVHQVEDVLV

6WDQGDUGZHUWDXV:LVVHQVEDVLV

%HUHLFKJHPlVV:LVVHQVEDVLV

Page 121: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Realisierung einer Abfragesprache für geometrische und semantische Information 109

(Kreise, Ringe etc.) muss keine Rotation durchgeführt werden. Auch bei bestimmtenanderen Signaturen wie z.B. Kreuze, Dreiecke etc. können Symmetrieeigenschaften aus-genutzt werden um den Rotationsbereich gering zu halten. Bei denjenigen Signaturen,die nur in nicht-rotierter Darstellung vorkommen, fällt der Befehl mit dem Befehl LIKEbzw. SIMILAR (ohne ROTATED-Zusatz) zusammen.

7.1.2 Der Befehl SELECT

Der Befehl SELECT ist der eigentliche Befehl für die Abfrage. Dies gilt für „GRaQueL“ebenso wie für das Datenbank-SQL und die Abfragesprache „RaQueL“ von Frischknecht(1999). Die Syntax ist durch die Abfolge der Schlüsselwörter select - from - where gege-ben.64 Beispiele für „GRaQueL“-Abfragen sind bereits in Kapitel 6.2 vorgestellt wor-den.

Abb. 7.2: Jackson-Diagramm des SELECT-Befehls bis zum Aufruf der einzelnen Abfragesprachen.

Bei der Realisierung der Abfragesprache „GRaQueL“ wird dasselbe Abfragefenster ver-wendet wie für „RaQueL“. Jede dort gemachte Abfrage, die dem Syntaxschema

SELECT <SELECT-Attribut>

FROM <Dateiname>

WHERE <Bedingungen>

folgt, muss nun in einem Befehlsinterpreter (Parser) ausgewertet und der jeweiligenAbfragesprache („GRaQueL“ oder „RaQueL“) zugeordnet werden. Die Auswertungdurchläuft folgende Schritte:

64. vgl. Kap. 5.1 und insbes. Abb. 5.2.

Page 122: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

110 Kapitel 7

• Zerlegung des Befehlsstrings in einzelne Bestandteile und Zuordnung zu Attributen,Operatoren, Werten, Angabe der Datenquelle etc.

• Prüfung der Syntax: Hier wird geprüft, ob nur zulässige Attribute und Operatorenverwendet wurden, sowie ob die Kombination der Angaben in den SELECT-,FROM- und WHERE-Parts zulässig ist.

• Prüfung des FROM-Parts: Dort entscheidet sich, ob eine Abfrage in „GRaQueL“ oder„RaQueL“ vorliegt. Wird als Datenquelle ein Rasterbild (Dateiname des Bildes) oderdas Schlüsselwort image angegeben (Zugriff auf das aktuell geladene Bild), handeltes sich um eine direkte Abfrage (gemäss „GRaQueL“). Bei Angabe einer MVC-Merk-maldatei hingegen wird die Abfrage der indirekten Methode nach „RaQueL“ zuge-ordnet.

• Übergabe der Abfrage an „GRaQueL“ oder an „RaQueL“ zur Ausführung.

Durch diese Interpretation des FROM-Parts ist es möglich geworden, beide Abfrage-sprachen, die neue direkte Abfragesprache „GRaQueL“ und die bereits bestehendeindirekte Abfragesprache „RaQueL“ von Frischknecht (1999) unter dem Dach einer ein-heitlichen Abfragemaske zu steuern.

7.1.3 Der Befehl UNSELECT

Mit dem Befehl UNSELECT können Visualisierungen wieder rückgängig gemacht wer-den. Seine Syntax entspricht der von SELECT:

UNSELECT * FROM image WHERE region like 1202

färbt bereits visualisierte Rasterdatenbereiche, die die Struktur 1202 darstellen wiederzurück, und

UNSELECT * FROM image

nimmt sämtliche Visualisierungen, die mit „GRaQueL“ vorgenommen wurden, wiederzurück.65

7.1.4 Externe Parametermanipulation durch SET und UNSET

Auch wenn sich die Parameter der einzelnen Matchingoperatoren i.A. aus der Wissens-basis ergeben, sollte dem Benutzer die Möglichkeit gegeben werden, sie zu manipulie-ren. Dieses erfolgt aus zwei Gründen:

Zum Einen kann der Benutzer den Suchbereich eines SIMILAR-Operators oder einesROTATED-Operatorzusatzes einschränken. Das kann der Fall sein, wenn nur die Orts-

65. Ein SELECT-Attribut muss bei UNSELECT nicht angegeben werden, da sich UNSELECT nur auf dieVisualisierung bezieht. Der Stern tritt als Platzhalter für beliebiges Ausgabeformat auf.

Page 123: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Realisierung einer Abfragesprache für geometrische und semantische Information 111

namen grösserer Ortschaften Gegenstand der Interpretation sind. Zum Anderen eröff-net die Manipulation der Parameter auch die Möglichkeit, Signaturen in anderenGrössen und Winkelbereichen zu finden, was besonders dann sinnvoll ist, wenn neueTemplates kreiert werden und die vorkommenden Parametersätze erst noch empirischgefunden werden müssen.

Die Dateien mit der Extension *.def enthalten die Defaultwerte, die nicht verändert wer-den können. Das für die „GRaQueL“-Session jeweils massgebende Parameterfile *.setwird durch einen vorgängigen SET-Befehl manipuliert (vgl. Abb. 7.3). Dabei werdennur diejenigen Parameter überschrieben, die im SET-Befehl genannt worden sind.

Die Syntax von SET ist

SET parameters for <opr> <Parameterliste> 66

wobei <opr> der zu manipulierende Operator ist (z.B. <opr> = like), und darananschliessend die zu verändernden Matchingparameter angegeben werden.

SET kann auch Parametersätze, die für bestimmte Aufgaben eingerichtet worden sind,in Dateiform speichern und wieder laden. Die Syntax lautet

SET parameters for <opr> from <filename> (Laden eines User-Setfiles)

SET parameters for <opr> into <filename> (Speichern eines User-Setfiles)

Der Befehl UNSET hebt benutzerseitig vorgenommene Manipulationen der Parameterwieder auf und ersetzt sie durch die vordefinierten Defaultwerte. Die Syntax vonUNSET ist

UNSET parameters for <opr> (Zurücksetzen des Operators <opr>)

UNSET all parameters (Zurücksetzen von allen Operatoren)

Abb. 7.3: Schema der Parametermanipulationen durch SET/UNSET und BY

66. Eine Liste der Matchingparameter befindet sich in Graeff (2000b).

Page 124: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

112 Kapitel 7

Mit VIEW können die jeweils aktuellen Parametersätze auf dem Terminal angezeigtwerden.

VIEW parameters for <opr> (Ansicht der Parameter von <opr>)

VIEW all parameters (Ansicht der Parameter aller Operatoren)

Mit SET vorgenommene Manipulationen behalten ihre Gültigkeit solange, bis sie durchden UNSET-Befehl widerrufen worden sind oder ihr Widerruf durch Programmendeerfolgt.

7.1.5 Interne Parametermanipulation durch BY-Konstrukte

Eine andere Möglichkeit der Parametermanipulation besteht in der Angabe veränderterMatchingparameter in einem BY-Konstrukt, der zusammen mit der SELECT-Abfrageübergeben wird.

Der Abfragebefehl

SELECT * FROM image WHERE region like 1202 BY –s=14 67

wird mit verändertem Parameter size (size = 14pt) ausgeführt.

Der wesentliche Unterschied zum SET-Befehl ist, dass die Parametermanipulationdurch BY nur für die eine Abfrage gilt, in der sie formuliert wird. Die BY-Parameterma-nipulation ist also im Gegensatz zur SET-Parametermanipulation nicht dauerhaft.

7.1.6 Logische Verknüpfungsoperatoren

In SQL ist es üblich, dass mehrere Abfragekriterien (WHERE-Konstrukte) durch logi-sche Operatoren wie AND und OR verknüpft werden. Auch in „GRaQueL“ soll esmöglich sein sinnvolle Verknüpfungen anzuwenden.

AND-Verknüpfungen sind wenig sinnvoll, da Rasterstrukturen durch ihre geometrischeAusprägung so gut wie eindeutig festgelegt sind und eine Schnittmenge aus verschie-denen geometrisch-semantischen Definitionen nicht zu einer neuen Rasterstruktur mitselbstständiger semantischer Bedeutung führt.68

Hingegen sind OR-Verknüpfungen durchaus denkbar, wenn mehrere Rasterstrukturenin einer gemeinsamen Abfrage durch Mustererkennung gesucht werden sollen.

67. Eine Liste der Matchingparameter findet sich in Graeff (2000b).68. Im Hinblick auf linguistisch formulierte Mehrfachabfragen bei thematischen Oberbegriffen von Signa-

turen (Unterabschnitt 7.1.7) könnte die Zulassung des AND-Operators wieder interessant werden:Wenn nämlich Signaturen in mehreren verschiedenen linguistischen Variablen enthalten sind, sindSchnittmengen dieser linguistischen Variablen durchaus denkbar, die abfragetechnisch durch einenAND-Operators erzeugt werden können.

Page 125: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Realisierung einer Abfragesprache für geometrische und semantische Information 113

7.1.7 Linguistisch formulierte Mehrfachabfrage

Bislang erlaubt „GRaQueL“, abgesehen von der Möglichkeit einer Mehrfachabfragedurch die OR-Verknüpfung, nur die Abfrage einzelner Rasterstrukturen. Bei der Reko-gnition von Rasterstrukturen des Types line, area oder word ist es aber sinnvoll, sämtli-che Templates, die zum Abfragegegenstand gehören, in einer Abfrage zu finden. AuchGruppen von Signaturen, die unter einem thematischen Oberbegriff stehen (z.B. Zif-fern, Buchstaben etc.), sollen durch eine gemeinsame Abfrage erfassbar sein.

Hierzu helfen einige linguistische Variablen wie z.B. &ziffer oder &buchstabe.

Abb. 7.4 zeigt ein Beispiel einer liguistischen Variable. Die Variable &ziffer („&“ ist hier-bei das Kennzeichen dafür, dass es sich um ein Metatemplate handelt) verweist auf diezehn Templates der einzelnen Ziffern. Mit einer Abfrage

SELECT char

FROM image

WHERE region like &ziffer

wird also de facto die Abfrage

SELECT char

FROM image

WHERE region like 1001 OR region like 1002 OR .. OR .. OR region like 1010

umgesetzt.69 Konkret sucht “GRaQueL” zu einer linguistischen Variable die zugehörigeDefinitionsdatei (ziffer.grp), in denen die einzelnen Templates aufgeführt sind, undführt die Abfrage der linguistischen Variable mittels OR-Verknüpfung der Abfragennach einzelnen Templates durch.

Abb. 7.4: Linguistische Variable „&ziffer“ mit Zuordnung von entsprechenden Templates.

69. Die Templates der Ziffern 1 bis 9 und 0 tragen die Templatenummern 1001 bis 1010. Templatenummernsind eingeführt worden, um auch kartografische Symbole adressierbar zu machen, die der Benutzernicht als ASCII-Zeichen eingeben kann.

Page 126: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

114 Kapitel 7

7.2 Module des direkten Rasterdatenzugriffs

Für den direkten Rasterdatenzugriff auf Rasterstrukturen des Types region ist bereits in6.3.2 resp. in 6.4 der Ablauf des zu Grunde liegenden Mustererkennungsverfahrensbeschrieben worden. Dem Ablauf nach handelt es sich um die Präanalyse (7.2.1), umdas Strukturpunktmatching (7.2.2), die das Matchen beliebig rotierter und skalierterRasterstrukturen beschleunigt, und um das fuzzifizierte Matchen (7.2.3) mit Alternati-ventest (7.2.4). Die Realisierung im Rahmen eines Softwaremodules ist Gegenstand die-ses Abschnittes. Weiter werden hier die konkrete Umsetzung der Visualisierung (7.2.5)und allfälliger Postprocessingmodule (7.2.6) vorgestellt.

7.2.1 Präanalyse durch Regionenmarkierung

Aufgabe der Präselektion bzw. Präanalyse ist eine erste Eingrenzung des Bildbereichsfür die nachfolgenden Matchingschritte. Bekanntlich sind Matchingverfahren zeitinten-siv, so dass jede vorgängige Eingrenzung des Suchbereiches die Geschwindigkeit desVerfahrens erhöht.

Bei der Präanalyse wird in negativer Weise angesetzt: Ziel ist es, diejenigen Bildregio-nen den nachfolgenden Operationen nicht mehr zuzuführen, in denen die gesuchteStruktur mit an Sicherheit grenzender Wahrscheinlichkeit nicht auftritt. Bei Templatesdes Types region handelt es sich vor Allem um regionale Bildbereiche, die einfarbig miteiner Vorder- oder Hintergrundfarbe ausgefüllt sind.

Abb. 7.5: Berechnung der SWR in den über das Bild bewegten Fenstern (regionale Bildbereiche).

Da es sich um eine grobe und operativ schnell ablaufende Präanalyse handelt, werdenFenster einer festen Grösse (Breite n, Höhe m) mit einer bestimmten Abtastschrittweite s(sowohl für Spalten- wie Zeilenrichtung) über das Bild gezogen, in denen die Schwarz-Weiss-Relation (SWR) als Quotient aus der Anzahl der Vordergrundpixel (VG) und derGesamtanzahl m·n der Pixel im Fenster berechnet wird (Abb. 7.5).

Page 127: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Realisierung einer Abfragesprache für geometrische und semantische Information 115

Durch empirisch zu ermittelnde Schwellwerte u und o für die SWR-Werte können nunalle diejenigen Regionen ausgeschieden werden, bei denen zu viele Hintergrund- (SWR< u) oder zu viele Vordergrundfarben vorkommen (SWR > o). Bei allen Regionen, derenSWR sich zwischen den Schwellwerten befindet, wird eine Markierung im Fenster vor-genommen. Die Markierung besteht darin, dass die im Fenster vorkommenden Farbendurch neue Farben ersetzt werden, die sich aber eindeutig zu den ursprünglichen Far-ben zuordnen lassen (vgl. Abb. 7.6).70

Abb. 7.6: Ergebnis einer Präanalyse mit den Parametern m=30, n=30, s=10, u=0.3, o=0.7.

Diese zu wählenden Schwellwerte sind abhängig von der Signaturdichte, ihrer Farbsät-tigung und der Grösse in der kartografischen Darstellung. Zudem spielt auch dieGrösse der Fenster und die Schrittweite, mit der sie über das Bild gezogen werden, eineRolle. Tests haben jedoch ergeben, dass es trotz dieser Abhängigkeiten möglich ist,Schwellwerte, Fenstergrössen und Schrittweiten zu wählen, bei denen eine allgemeinePräselektion im Kartenbild erfolgt, die gleichermassen für eine grosse Bandbreite vonSignaturgrössen und –typen gilt.

So muss diese Präanalyse nur ein einziges Mal, nämlich am Anfang der ersten Bildab-frage durchgeführt werden. Alle weiteren Abfragen, die sich auch auf andere Signatu-ren und Signaturgrössen beziehen, können sich auf die einmal markierten Bildregionenstützen.71

70. vgl. Frischknecht (1996).71. Rein theoretisch könnten die nach der Präanalyse übrig bleibenden Bildstellen in Form einer Liste unter

Angabe der Bildorte gespeichert werden. Da die Präanalyse nur für eine erste grobe Eingrenzung desSuchbereiches sorgt, die sich je nach Bildinhalt in der Grössenordnung von 20% bis 80% des Ursprungs-bildes bewegt, fallen in Dateiform geschriebene Listen weiter zu behandelnder Bildorte i.A. sehr grossaus. Der Speicherplatz sparenden Methode der Umfärbung im Bild wird der Vorzug gegeben.

Page 128: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

116 Kapitel 7

7.2.2 Strukturpunktmatching

Das Matchen von Strukturpunkten dient zum schnellen Auffinden von Positionen, indenen sich eine bestimmte Struktur im Bild befinden kann. Es stellt einen weiterenSchritt auf dem Weg zur Eingrenzung des gesamten Bildbereichs auf abgefragte Struk-turen dar. Dies entspricht einem Präselektor auf Basis charakteristischer Punkte.

Definition und Festlegung der Strukturpunkte

Unter Strukturpunkten werden gemäss 6.4.2 einige wenige charakteristische Punkteeiner im Raster definierten geometrischen Struktur verstanden, die stellvertretend fürlokale Bereiche von Vorder- und Hintergrundfarben stehen und die wesentlich zur geo-metrischen Definition der Signatur beitragen. Sie sind Bestandteil der geometrischenWissensbasis der Rasterstruktur, und werden ebenso im Template abgespeichert.

Abb. 7.7: Strukturpunkte für ein kartografisches Zeichen: Gute Strukturpunktdefinitionen (a) im Vor-dergrundbereich und (b) im Hintergrundbereich und schlechte Strukturpunktdefintionen (c)am Templaterand und ungleichmässig verteilt sowie (d) durch zuviele Strukturpunkte.

Strukturpunkte des Vordergrundbereichs liegen i.A. auf den Skelettlinien und markie-ren vielfach Kreuzungs- und Endpunkte dieser Skelettlinien. Strukturpunkte des Hin-tergrundbereiches markieren stichpunktartig einige wesentliche Hintergrundbereiche,vornehmlich Löcher innerhalb von Vordergrundbereichen. Sie können aber auch ananderen sinvollen Stellen platziert werden. Bei der Platzierung von Strukturpunkten istzu beachten, dass die Strukturpunkte bzw. ihre unmittelbare Umgebung nicht geradean den Rändern von Vordergrund- und Hintergrundbereichen liegen, da diese naturge-mäss stärkeren radiometrischen Deformationen ausgesetzt sind als Kernbereiche.

Bei der Festlegung von geeigneten Strukturpunkten sollte die Wahl eher auf wenige,die Charakteristik des Zeichens grob umschreibende Punkte als auf viele, das Zeichen

(a) (b) (c) (d)

Page 129: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Realisierung einer Abfragesprache für geometrische und semantische Information 117

fast schon eindeutig deklarierende Punkte fallen. Das hängt damit zusammen, dass dasMatchen der Strukturpunkte um so schneller abläuft, je weniger Strukturpunkte defi-niert werden.

Bei der Punktwahl gilt es, alle Bildstellen zu detektieren, die die betrachtete Strukturenthalten, und gleichzeitig die Anzahl der anderen Bildstellen gering zu halten.

Matchen von Strukturpunkten

Die zu den in der Abfrage angegebenen Rasterstrukturen gehörenden Strukturpunkt-definitionen werden aus der Wissensbasis eingelesen. In gleicher Weise werden dieMatchingparameter, die sich aus den Matchingoperatoren ergeben, ermittelt.

Abb. 7.8: Beispiel des Strukturpunktmatchens im bereits markierten Bild (gelbe Markierung) mit gege-bener Strukturpunktdefinition, Suchparametern und einem Schwellwert zur Resultatsfest-stellung von 20%. Das Resultat der Suche (im Bild orange markiert) wird in eine Liste inDateiform geschrieben.

Die Strukturpunkte werden bzgl. der Matchingparameter (Grösse und Orientierung)transformiert. Anschliessend erfolgt die Suche nach denjenigen Stellen im Bild, beidenen korrespondierende Bildpixel mit denen der Strukturpunktdefinition überein-stimmen. Werden wie etwa im Falle des Matchingoperators similar, like rotated odersimilar rotated Bereiche von Grössen bzw. Orientierungen der Rasterstruktur erfragt, sowerden diese Parameterbereiche in eine Abfolge von diskreten Abfrageparametern zer-legt, deren Schrittweite sich ebenfalls aus den Matchingparametern ergibt.72 Die Aus-

Page 130: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

118 Kapitel 7

führung dieser Abfrage erfolgt durch ein Hintereinanderausführen der Einzelabfragenmit den diskreten Grössen- und Orientierungsparametern.

Das Strukturpunktmatching wird nur in den Bildbereichen eingesetzt, die in der Präan-alyse (Regionenmarkierung gemäss 7.2.1) beibehalten werden. Unter übereinstimmendmit der Strukturpunktdefinition des Templates werden diejenigen präanalysierten Bild-stellen verstanden, bei denen die Summe der Abweichungen der Farbbelegungen inden Strukturpunkten unter einem festgelegten Schwellwert liegen. Schwellwerte vonbis zu maximal 20% der Anzahl der Strukturpunkte erscheinen als geeignet, die weitergehende aber immer noch grobe Eingrenzung des Bildraumes vorzunehmen. Ein grös-serer Schwellwert würde den weiterhin zu betrachtenden Bildbereich zu wenig ein-grenzen, und bei einem Schwellwert von 0%, der faktisch bedeuten würde, dasssämtliche Strukturpunkte lagerichtig vorliegen müssen, läuft man Gefahr, die ein oderandere Stelle mit der gesuchten Struktur nicht zu finden, wenn per Zufall an einerStrukturpunktstelle eine Abweichung auftritt, die z.B. durch Rauschen hervorgerufensein könnte.

Mit der Strukturpunktdefinition übereinstimmende Bildstellen werden nicht im Bildmarkiert, sondern unter Angabe des Bildortes (Zeile und Spalte eines Referenzpunktesdes Bildausschnitts), des Templatenamens und der Templateparameter (Orientierungund Grösse) listenförmig in einer Datei provisorischer Resultate (Extension SPT)abgespeichert (vgl. Abb. 7.8).73

7.2.3 Fuzzifiziertes Matching

Durch Präanalyse (7.2.1) und Präselektion mittels Strukturpunkten (7.2.2) ist der Such-bereich im Bild mit wenig Rechenzeit bereits erheblich eingegrenzt worden. Dieserlaubt nun den Einsatz der zeitaufwändigeren Fuzzifizierten Template-Matching-Strategie (vgl. 6.4.3) zur endgültigen Detektion gesuchter Strukturen. Das fuzzifizierteMatching besteht aus den Teilschritten äussere Fuzzifizierung, innere Fuzzifizierung, demMatching und den Defuzzifizierungen durch Schwellwertbildung bzw. durch lokale Filte-rung der Ergebnisse. Die Funktionsweise dieser Abläufe ist bereits in 6.4.3 ausführlichbeschrieben worden. Bei der Realisierung dieser Matchingstrategie geht es um die Fest-legung entsprechender Parameter.

Parameter für die äussere Fuzziness

Zu Beginn werden die Ergebnisse des Strukturpunktmatching eingelesen. Sie beinhaltetneben der Angabe der Bildorte auch die Angabe der geometrischen Lagerungsparame-

72. Die Schrittweite für die diskrete Zerlegung kontinuierlicher Grössen- und Orientierungsbereiche wirddurch empirische Tests ermittelt und in der Definition der Matchingparameter resp. der Wissensbasishinterlegt.

73. Die Abspeicherung der Suchresultate in einer Datei bedingt eine hinreichend gute Eingrenzung desSuchbereichs, da andernfalls zu grosse Datenmengen anfallen. Der Schwellwert für die Annahme vonBildbereichen sollte vor Allem aus diesem Grunde nicht zu gross gewählt werden.

Page 131: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Realisierung einer Abfragesprache für geometrische und semantische Information 119

ter Grösse und Orientierung. Äussere Fuzziness bedeutet, dass diese exakten Parameterin Parameterintervalle übergehen.

Durch Versuche mit verschiedenen Templates wurden die Toleranzbereiche für die ein-zelnen Parameter mit dS = 1pt für die Signaturgrösse S, dW = 3° für die Orientierung Wund dX = dY = 1pixel für die Ortsvariablen X und Y festgelegt, wodurch der Parameter-satz (S, W, X, Y) eines jeden Resultats aus dem Strukturpunktmatching in den vierdi-mensionalen kontinuierlichen Parameterraum ([S±dS], [W±dW], [X±dX], [Y±dY])überführt wird. Die kontinuierlichen Intervalle werden ähnlich wie bei den kontinuier-lichen Abfrageparametern diskret umgesetzt und zwar in je drei Stufen für X, Y und Wund fünf Stufen für S. Dadurch erhöht sich die Anzahl der Bildvergleiche um den Fak-tor 135.

Einstellungen für die innere Fuzziness

Die innere Fuzziness besteht gemäss 6.4.3 aus zwei Teilen. Die wissensbasierte Fuzzifi-zierung betrifft die Definition von Vorder- und Hintergrundbereichen des Templates.Im einfachsten Fall kann die Fuzzy-Membership-Funktion des Templates aus Umrech-nung der Templates von Stengele (1995) erfolgen. Für die drei Signifikanzstufen desVordergrundes werden hierbei die Fuzzy-Membership-Werte 0.7, 0.85 und 0.95 (mitzunehmender Signifikanz) angesetzt, die Signifikanzstufen des Hintergrundes erhaltendie Werte 0.3, 0.15 und 0.05. Diejenigen schwach-signifikanten Hintergrundbereiche,die weit ausserhalb der Signatur liegen, erhalten neu den Indifferenzwert 0.5 zugeord-net (vgl. Abb. 6.7). Diese grobe Umrechnung kann in den einzelnen Templates nochverfeinert werden, da nun das gesamte reellwertige Intervall von 0.0 bis 1.0 zur Model-lierung der Signifikanz vorliegt. Die Wahl der Fuzzy-Membership-Funktionswerteerfolgt grundsätzlich empirisch.

Der zweite Teil der inneren Fuzziness betrifft die modellbasierte Fuzzifizierung desBildausschnittes durch Glättung. Da im Falle kartografischer Rasterdaten, die als Bilderweniger Farbkanäle verwaltet werden, die Rasterungseffekte die Rauscheffekte weitüberwiegen, wird nur eine leichte Korrektur mit einem lokalen Glättungsoperatorerwogen. Der bei der Umsetzung von „GRaQueL“ verwendete Glättungsoperator hatdie Gestalt

[7.1]

und bezieht in den Fuzzy-Membership-Wert eines Pixels in einem geringen Umfangdiejenigen der unmittelbar umgebenden Pixel mit ein. Die Glättung ist schwach, da einursprünglicher Pixelwert höchstens um ein Drittel verzerrt wird74. Sie wirkt sich über-dies nur in den Randbereichen (Übergang von Vorder- und Hintergrund) aus, dieinfolge der Rasterungseffekte als unsicherer gelten als Pixel inmitten gleichfarbigerUmgebungspixel.

74. Dieser Maximalwert tritt nur bei isolierten Vordergrund- bzw. Hintergrundpixeln auf.

G1 36⁄ 1 18⁄ 1 36⁄1 18⁄ 2 3⁄ 1 18⁄1 36⁄ 1 18⁄ 1 36⁄

=

Page 132: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

120 Kapitel 7

Schwellwerte für die Defuzzifizierung durch vorzeitigen Abbruch

Die Berechnung und die Auswertung der Matchingdifferenzen, d.h. der pixelweisenDifferenzen aus der Fuzzy-Membership-Funktion des Templates und des mit [7.1]leicht geglätteten Bildausschnittes erfolgt getrennt in mehreren Signifikanzbereichen.Diese werden aus der Definition von Stengele (1995) übernommen. Es handelt sich hier-bei um sechs Signifikanzstufen (je drei für den Vorder- und Hintergrund). Beginnendmit dem hochsignifikanten Vordergrundbereich über den hochsignifikanten Hinter-grundbereich bis hin zum niedrigsignifikanten Hintergrundbereich erfolgt die Auswer-tung der Matchingdifferenzen, d.h. die Berechnung des Mittelwerts, hierarchischabgestuft. Die Schwellwerte für die beiden Hochsignifikanzbereiche betragen S = 0.075,für die mittleren Signifikanzbereiche S = 0.15 und für die niedrigsignifikanten BereicheS=0.25. Zum vorzeitigen Abbruch kommt es, wenn bei der Auswertung einer Signifi-kanzzone der Schwellwert überschritten wird. Der aktuelle Bildvergleich wird verwor-fen und das Matchingverfahren mit dem nächsten Bildvergleich fortgesetzt.

Berechnung der Matchingkorrelation

Die Berechnung der Matchingkorrelation wird nur für diejenigen Bildvergleiche durch-geführt, die im hierarchisch gestuften Ablauf der Auswertung der Matchingdifferenzennicht verworfen wurden. Sie errechnet sich aus den Mittelwerten der Matchingdifferen-zen der einzelnen Signifikanzzonen nach der Formel

, [7.2]

worin ψ die Gewichte und s die Mittelwerte der Differenzbeträge in den einzelnenSignifikanzregionen bedeuten. Die Gewichte sind zurzeit einheitlich für alle Templatesmit ψ = 4 für die Hochsignifikanzbereiche, ψ = 2 für die Bereiche mittlerer Signifkanzund ψ = 1 für die niedrigsignifikanten Bereiche festgelegt. Auf eine komplizierteRechenformel für die Korrelation wie z.B. [3.10] wird aus numerischen Gründen ver-zichtet. Dadurch kann die Rechenzeit zusätzlich niedrig gehalten werden.

Lokale Filterung

Bedingt durch die äussere Fuzziness aber auch durch die Strukturpunktsuche treten ander Stelle eines Bildvergleiches mit hoher Korrelation zwischen Template und Bildaus-schnitt oder in dessen unmittelbarer lokaler Umgebung i.A. weitere Bildvergleiche mitähnlich hoher Korrelation auf. Sie werden nach dem Maximum der Matchingkorrela-tion [7.2] gefiltert. Die gefilterten Resultate werden in die Datei endgültiger Resultate(Extension ERG) geschrieben.

ρ 1ψi s⋅

i∑ψi∑

---------------------

–=

Page 133: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Realisierung einer Abfragesprache für geometrische und semantische Information 121

7.2.4 Alternativentest

Die Erfahrung mit dem Matching zeigt, dass geometrisch sehr ähnliche, aber seman-tisch verschiedene Strukturen häufig die Ursache von Missdetektionen sind. Sie könnennicht alleine durch optimale Wahl von allgemein gültigen Matchingparametern beho-ben werden. Ein wissensbasiertes Testen zwischen Alternativen ist daher zu empfehlen.

Das Testen zwischen Alternativen wird in doppelter Hinsicht umgesetzt: Einerseits kanndie Verwechslungsgefahr zwischen geometrisch ähnlichen, aber semantisch verschie-denen Strukturen ähnlich wie bei Stengele (1995) vermieden werden. Hierzu müssenentsprechende Fuzzy-Membership-Funktionswerte und entsprechende hochsignifi-kante Zonen festgelegt werden.

Abb. 7.9: Berücksichtigung der Alternativen als weitere Fuzzifizierungsstufe.

Andererseits wird das Berücksichtigen von Alternativen als weitere Fuzzifizierungs-stufe im Matchingverfahren eingebaut (vgl. Abb. 6.9 und Abb. 7.9). Die Fuzzifizierungwird dadurch erreicht, dass zu jedem Ergebnis des Strukturpunktmatchings (Daten-speicher SPT) für jede Alternative des betreffenden Templates weitere „Resultate“ imDatenspeicher ALT erzeugt werden, die über gleiche Parameter (Bildort, Grössen- undOrientierungsparameter) verfügen. Welche Templates für ein Template als Alternati-ven in Betracht gezogen werden, ergibt sich aus der Wissensbasis (d.h. dem Template-header) bzw. dem sog. „Alternativengrafen“ (vgl. Abb. 7.10).

Abb. 7.10: Ausschnitt aus dem „Alternativengrafen“ im Bereich von Kleinbuchstaben.

Page 134: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

122 Kapitel 7

Für die Rohresultate in SPT und in ALT wird das Fuzzifizierte Matching bishin zurlokalen Filterung separat hintereinander durchgeführt. Sollten dann Template undmindestens eine Alternative an einer Bildstelle konkurrieren, so endscheidet erneut diebessere Matchingkorrelation über die Annahme des Templates oder des Alternativtem-plates. Wird das Template zu Gunsten eines Alternativtemplates verworfen, so wirddas Alternativtemplate zwar in die Ergebnismenge ERG aufgenommen, aber nichtvisualisiert, da sich die Abfrage nicht auf das Alternativtemplate bezieht. Dieser letzteSchritt entspricht der dritten Defuzzifizierungsstufe aus Abb. 6.9, die auch in dieserHinsicht zu einem eindeutigen und scharfen Abfrageresultat führt.

7.2.5 Visualisierung der gefundenen Strukturen

Am Ende des Interpretationsprozesses, der durch die Abfrage ausgelöst wurde, stehtdie Visualisierung der angefragten Rasterstrukturen. Das Visualisierungstool greift aufdie Datenbank ERG der endgültigen Ergebnisse zu, speichert die zur Abfrage passen-den Datensätze in einen temporären Datenspeicher VIS temporär ab, lädt die Orts- undLagerungsparameter der darin enthaltenen Muster und platziert sie mit roter Farbe imRasterbild.

Abb. 7.11: Schema zum Ablauf der Visualisierung.

Alternativmuster, die eventuell im Laufe der Abfrage nach einem Muster gefundenwurden, werden bei der Visualisierung nicht berücksichtigt. Sie sind zwar in derDatenbank eingetragen, können aber nur durch eine Abfrage, die sich explizit auf dasAlternativmuster bezieht, visualisiert werden.

!"#

! $ $ %$ !&'

& $" ( ) *!%! %+, ! -

Page 135: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Realisierung einer Abfragesprache für geometrische und semantische Information 123

Der Effekt, dass in den seltensten Fällen das korrekt gelagerte Template und Bildaus-schnitt exakt übereinstimmen, wird ebenso berücksichtigt. Im Bildausschnitt gegenüberdem Template fehlende Pixel werden nicht visualisiert, hingegen werden in einerUmgebung von 5% der Templategrösse überschüssige, d.h. über die Ränder der Vor-dergrunddefinition im Template hinausragende Pixel ebenfalls eingefärbt.

7.2.6 Postprocessingmodule

Für die SELECT-Attribute line, word und area wird das als Auflistung punktförmigerDetektionsstellen erhaltene Ergebnis weiter interpretiert.

Beim SELECT-Attribut line werden die in der Abfrage gefundenen Muster zu einerLinie zusammengesetzt. Die Ausgabe der Linien erfolgt in einem DXF-File. Kriteriumfür die Linienbildung ist dabei der Abstand zwischen den gefundenen Mustern.

Bei Signaturflächen (SELECT-Attribut area) werden die gefundenen Einzelzeichennicht miteinander verkettet. Vielmehr werden Gruppen gebildet, bei denen die relati-ven Abstände der Zeichen gering sind. Zu diesen Punktgruppen wird das Randpoly-gon bestimmt, das durch ein Buffering um den Betrag der Zeichengrösse nach aussenhin ausgedehnt wird (vgl. Abb. 7.12).

Abb. 7.12: Schema der Postprocessing-Prozeduren für line und area.

Ist das SELECT-Attribut word das Ausgabeformat der Abfrage, werden die gefunde-nen Buchstaben und Zahlen ähnlich wie bei der Linienkomposition linear miteinanderverbunden. Hierbei werden die (strengeren) Regeln der Wort- und Zahlbildung berück-sichtigt, d.h. neben dem Abstand und der Orientierung der Einzelzeichen spielt hierbeidie Ausrichtung der Zeichen auf einer gemeinsamen Linie eine Rolle.75

/,1(3RVWSURFHVVLQJ

$5($3RVWSURFHVVLQJ

75. Hierzu wurden bereits in der Wissensbasis Referenzpunkte für Buchstaben und Zahlen eingeführt, diesich bei allen Zeichen auf der Grundlinie befinden. Buchstaben und Ziffern werden nur dann zu Wör-tern resp. Zahlen zusammengesetzt, wenn neben den richtigen Zeichenabständen und der (allenfallsgeringfügig veränderten) Orientierung auch die Referenzpunkte in nahezu einer Linie liegen.

Page 136: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

124 Kapitel 7

7.3 Funktionaler Ablauf und Datenfluss in „GRaQueL“

Wenn der SELECT-Befehl nach Syntaxprüfung und Auswertung der Datenquelle(FROM-Part) an „GRaQueL“ zugewiesen wird (vgl. 7.1.2), dann beginnt die eigentlicheAbfrageausführung, die von mehreren, in 7.2 beschriebenen Funktionsmodulen über-nommen wird (vgl. das Jackson-Diagramm von „GRaQueL“, Abb. 7.13).

Abb. 7.13: Jackson-Diagramm der direkten Abfragesprache „GRaQueL“. In gestrichelten Kreisen sinddie Funktionsmodule dargestellt, auf die im Datenflussmodell (Abb. 7.14) verwiesen wird.

Page 137: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Realisierung einer Abfragesprache für geometrische und semantische Information 125

Erster Schritt ist - falls erforderlich - die Aufsplittung der Gesamtabfrage in Einzelabfra-gen, die hintereinander ausgeführt werden. Dies ist bei verknüpften logischen Aus-drücken im WHERE-Part (7.1.6) und bei linguistisch formulierten Mehrfachabfragen(7.1.7) notwendig. Für jede dieser einzelnen Abfragen werden danach die Matchingpa-rameter geladen. Falls eine Abfrage mit einem BY-Konstrukt versehen ist, werden diesegemäss 7.1.5 manipuliert (Modul GRaQueL_gramm()).

Abb. 7.14: Datenflussmodell der „GRaQueL“-Module: Dargestellt sind die Funktionsmodule (kreisför-mig, vgl. auch Abb. 7.13) und die Datenmodule. Die Pfeile geben den Datenfluss an, der zwi-schen den Modulen besteht.

Das anschliessende Modul GRaQueL_pruef() vergleicht die aktuelle, vereinzelte Abfragemit den in einer Datenbank gespeicherten bereits durchgeführten Abfragen (Datenspei-cher ABF, zum Datenflussmodell vgl. Abb. 7.14). Sollte die Abfrage bereits schon ein-mal durchgeführt worden sein, können die bereits gefundenen Resultate direkt aus derResultatsdatenbank (ERG) geladen und visualisiert werden, ohne die zeitaufwändigeMustererkennung wiederholen zu müssen. Sollte die Abfrage hingegen erstmaliggestellt worden sein, beginnt der direkte Zugriff auf das Rasterbild, der von drei Funk-tionsmodulen vorgenommen wird.

Das erste dieser Module (GRaQueL_praea()) führt gegebenenfalls eine Präanalyse durch(7.2.1), die durch das Strukturpunktmatchen (7.2.2) im Modul GRaQueL_point() weiter-

Page 138: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

126 Kapitel 7

geführt wird, das auf die markierten Bildstellen zugreift. Die Ergebnisse SPT und ALTwerden vom eigentlichen Matchingtool GRaQueL_match() weiterverarbeitet, das nebendem fuzzifizierten Matching (7.2.3) auch den Alternativentest enthält (7.2.4). Die end-gültigen Matchingresultate werden in einem Datenspeicher (ERG) abgelegt, dessenVerwaltung dem Funktionsmodul GRaQueL_dbase() obliegt. Dieses stellt dem Visuali-sierungstool GRaQueL_visio() die zu visualisierenden Einträge in Form eines Zwischen-speichers VIS zur Verfügung (7.2.5). Ebenso können auch die Postprocessingmodule(aufgerufen von GRaQueL_postp()) für Linien, Wörter und Flächen diese Daten weiter-verarbeiten.

Abb. 7.15: Überblick über die Funktionen von „KaMu“.

7.4 Einbettung in die Softwareumgebung

Die in den vorangehenden Abschnitten beschriebene Realisierung der Abfragesprache„GRaQueL“ wurde in eine bereits vorhandene Softwareumgebung eingebettet. Dasbeschränkt sich nicht nur darauf, dass „GRaQueL“ und die von Frischknecht (1999) ent-wickelte indirekte Abfragesprache „RaQueL“ in einem gemeinsamen Abfragefensterverfügbar sind. Am Institut für Geodäsie und Photogrammetrie (IGP) der Eidgenössi-

Page 139: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Realisierung einer Abfragesprache für geometrische und semantische Information 127

schen Technischen Hochschule (ETH) Zürich sind beide Abfragesprachen Bestandteilder Software „KaMu“ (Kartografische Mustererkennung), die massgeblich von Stengeleentwickelt wurde. Daher erklärt sich auch die Verwandtschaft der hier vorgestelltenfuzzifizierten Template-Matching-Strategie mit der Strategie von Stengele, die gleicher-massen in „KaMu“ verfügbar bleibt. „KaMu“ verfügt somit über einige Werkzeuge zurBildinterpretation, dessen Reservoir im Laufe der Zeit und im Laufe der Dissertationenangewachsen ist (Abb. 7.15).76

Die Abfragesprachenmaske wird im „KaMu“-Fenster durch den Befehl query aufgeru-fen. „RaQueL“ und „GRaQueL“ stehen somit gleichzeitig und gemeinsam zur Verfü-gung. Durch ein abschliessendes quit wird wieder in das „KaMu“-Standardfensterumgeschaltet. Die Abfragesprachen sind überdies skriptfähig, d.h. sie können bei längerdauernden Bearbeitungsprozessen mittels Skripten, die in Batchdateien abgelegt wer-den, automatisch gesteuert werden, ohne dass der Benutzer die Befehle jedesmal ein-zeln von Hand eingeben muss.

„KaMu“ selber steht wiederum in einem Softwarekontext, der allgemein der Erfassung,Analyse und Visualisierung von Geodaten zu Gute kommt. Es korrespondiert unterAnderem mit der Software „RobVec“ (Robuste Vektorisierung), die rasterbasierteGebäudesegmente, die mittels „KaMu“-Bildverarbeitungsfunktionen im Rasterbildgefunden werden können, in robust ausgeglichene Vektordaten (Gebäudekonturen)überführt. Die Entwicklung von „RobVec“ geht auf die Arbeit von Kanani (1998) zu-rück.

Ein weiteres Softwaremodul ist „RaVis“ (Rasterdaten-Visualisierung), das auf Entwick-lungen von Zanini (1998) zurückgeht. Dieses ermöglicht die Visualisierung von Raster-und Vektordaten und bietet neben einer zweidimensionalen Betrachtung auch die Mög-lichkeit, kartografische Rasterdaten dreidimensional unter Zuhilfenahme eines Gelän-demodells darzustellen. Im derzeitigen Softwareumfang ist neben einer perspektivi-schen Ansicht auch eine Zylinderprojektion für Panoramen implementiert. Vektordatenverschiedener Formate, wie z.B. DXF-Dateien, können in „RaVis“ mit Rasterdaten über-lagert und gemeinsam dargestellt werden. Mit „KaMu“ (inkl. „RaQueL“ und „GRa-QueL“) extrahierte Objekte (wie z.B. Punktobjekte) können in „RaVis“ mittelsdreidimensionaler Symbole aus einer Symbolbibliothek zusammen mit einer perspekti-vischen Ansicht des Geländes visualisiert werden.

„RaVis“ steht somit in einem sehr engen Zusammenhang zu „KaMu“. Da in „KaMu“mitsamt seinen Abfragesprachen die zweidimensionale Visualisierung ein wichtigesArbeitshilfsmittel ist, wurde eine Version von „KaMu“ geschaffen, die zusammen mit„RaVis“ als „KmRv“ aufgerufen wird. Die im dortigen „RaVis“-Fenster geladene Kartewird durch Aufruf von „KaMu“ aus dem Funktionsmenue direkt an „KaMu“ überge-ben. Im „KaMu“-Bearbeitungsfenster (inklusive der Abfragsprachmasken) kann dannjederzeit die sich in Bearbeitung befindende Karte mit einem speziellen Visualisie-rungsbefehl refresh bzw. „@“ neu visualisiert werden. Diese Schnittstelle erspart den

76. Nähere Auskünfte zu den Funktionen in „KaMu“ finden sich im Handbuch Graeff (2000b).

Page 140: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

128 Kapitel 7

Anwendern das ständige Zwischenspeichern, Verlassen von „KaMu“ und Starten von„RaVis“, nur um die Zwischenresultate der Mustererkennung anzuschauen.

Abb. 7.16: Kontext der Softwaremodule zur Geodatenverarbeitung am IGP der ETH Zürich.

Da alle miteinander korrespondierenden Programme mit einem speziellen internenRasterdatenformat (Extension RLC) in Lauflängenkodierung arbeiten, ist zusätzlich dasProgramm „tifframe“ entwickelt worden, mit dessen Hilfe das RLC-Format in ein gän-giges TIFF-Format transformiert und retransformiert werden kann.

Die Ergebnisse der Mustererkennung in „KaMu“ sowie der Abfragesprachen „GRa-QueL“ und „RaQueL“ können auch in externen GIS-Applikationen weiter verarbeitetwerden. Die Ausgabe der strukturierten Daten in Form von Leerzeichen getrenntenListen (Punktsignaturen, Einzelbuchstaben) bzw. in DXF-Files stellt eine Schnittstellezu anderen GIS-Modulen dar. Rasterbasierte Ergebnisse der Mustererkennung könnenebenso anderen GIS-Anwendungen zur Verfügung gestellt werden, indem interpre-tierte Rasterbilder (mit entsprechenden Markierungen) mit „tifframe“ wieder in eingängiges TIFF-Rasterbildformat überführt werden.

Page 141: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Kapitel 8

Anwendungen und Resultate

Anwendungen und aus Anwendungen erhaltene Resultate dienen zur Bewertung undBeurteilung der neu entwickelten Abfragesprache „GRaQueL“. Drei Aspekte stehendabei im Vordergrund: Erstens bedarf es einer Untersuchung der Leistungsmerkmaleder in „GRaQueL“ verwendeten Matchingstrategie (Abschnitt 8.1), zweitens einesNachweises, dass die Abfragesprache grundsätzlich ein geeignetes Mittel zur Erfassungstrukturierter raumbezogener Information aus Rasterdaten ist (Abschnitt 8.2), undschliesslich soll die Zusammenarbeit von „GRaQueL“ im Kontext anderer GIS-Moduleerörtert werden (Abschnitt 8.3). Abschliessend erfolgt eine zusammenfassende Bewer-tung (Abschnitt 8.4), die sich aus diesen drei Aspekten ergibt.

8.1 Leistungsmerkmale der Matchingstrategie

Mit „GRaQueL“ ist eine neue Matchingstrategie eingeführt worden. Dieser Abschnittbefasst sich mit der Untersuchung ihrer Funktionalität und Leistungsfähigkeit. Diehierfür durchgeführten Versuche erfolgen allesamt auf einer IBM-Rechenmaschine desRISC System (RISC 6000). Das Betriebssystem ist eine UNIX-Plattform von AIX.

Die Untersuchung gliedert sich in zwei Teile: Im ersten Teil (8.1.1) wird die MethodikSchritt für Schritt analysiert und mit anderen Methoden verglichen. Im zweiten Teil(8.1.2) wird die Zuverlässigkeit der Methode an Hand eines grösseren Versuchsdaten-satzes untersucht, bei dem Höhenkoten in einer Rasterkarte zu detektieren sind.

8.1.1 Untersuchung der Matchingmethodik

Die Abfrageausführung in „GRaQueL“ erfolgt durch einen mehrstufigen Matchingpro-zess, der durch die präanalysierende Regionenmarkierung eingeleitet wird, vom an-

Page 142: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

130 Kapitel 8

schliessenden Strukturpunktmatching über das Fuzzifizierten Matching, und demAlternativentest bis hin zur Visualisierung reicht. An einem Testtemplate des Typsregion und eines Versuchsrasterbildes werden die einzelnen Komponenten untersucht.

Als Testbild wird die Pixelkarte „eth.ARRAY“ (Grösse 960 x 960 Pixel) verwendet. Eshandelt sich um einen Ausschnitt aus der Schweizer Landeskarte 1:25‘000 (Blatt 1091„Zürich“) in Rasterdatenform, wobei die Scannerauflösung 20L/mm beträgt (vgl. Abb.8.2 (A.)). Das Testtemplate ist das Template Nr. 1005, das die Ziffer „5“ in kursiver Dar-stellung enthält. Dieses ist verwechslungsgefährdet mit den Ziffern „3“ (Template Nr.1003) und „6“ (Template Nr. 1006)77, so dass auch der Alternativentest Bestandteil derUntersuchung sein wird. Die Grösse des Templates (Definitionsgrösse in der Wissens-basis) beträgt 127 x 134 Pixel, das einer Zeichengrösse von 56pt entspricht.

Abb. 8.1: Testtemplate Nr. 1005 mit (a) Definition nach Stengele (1995), (b) Strukturpunktbelegung, (c)Fuzzy-Membership-Belegung und die seiner Alternativen (d) Nr. 1003 bzw. (e) Nr. 1006.

Neben der Templatedefinition von Stengele (1995) in Abb. 8.1(a) werden Strukturpunktegemäss 7.2.2 definiert (Abb. 8.1(b)). Von der Templatedefinition wird gemäss 7.2.3 dieflächenhafte Fuzzy-Membership-Belegung des Templates abgeleitet (Abb. 8.1(c)). Ausden Fuzzy-Membership-Belegungen der Alternativen (Abb. 8.1(d,e)) können rechtdeutlich die zur gegenseitigen Abgrenzung wissensbasiert eingeführten Hochsignifi-kanzbereiche des Vorder- bzw. Hintergrundes entnommen werden.

Die Abfrage zur Detektion des Einzelzeichens lautet

SELECT char FROM image WHERE region like 1005 78 [8.1]

Die Regionenmarkierung (7.2.1) führt zu einer ersten Einschränkung des Suchbereiches(Abb. 8.2 (B.)), die sich auf ca. 60% des Ursprungsbildes beläuft. Die hierfür benötigteRechenzeit von 1.76s vermag auf den ersten Blick als gross erschienen, sie fällt jedochnur beim ersten Matching in einer „GRaQueL“-Session an.

Der Operator like entspricht bei diesem Template einer zu matchenden Signaturgrössevon 12pt und einer Orientierung von 0°. Auf diese Lagerungsparameter wird nun dieStrukturpunktdefinition eingestellt und im Bild gesucht.

77. Eine Liste der Templateadressen befindet sich im KaMu-Handbuch Graeff (2000b).

(a) (b) (c) (d) (e)

78. Die Karte „eth.ARRAY“ ist in „KaMu“ vorgängig geladen worden, so dass „FROM image“ nur nochden Zugriff auf das geladene Bild regelt.

Page 143: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Anwendungen und Resultate 131

Abb. 8.2: Testbild „eth.ARRAY“ vor (A.) und nach der Regionenmarkierung (B.) und nach dem Struk-turpunktmatching (C.).

Für das Template 1005 sind 14 Strukturpunkte im Vordergrund und 15 Punkte im Hin-tergrund definiert (vgl. Abb. 8.1(b)). Die Suche nach passenden Strukturpunktbelegun-gen (vgl. 7.2.2) führt zu einer ersten Sammlung möglicher Bildorte in Dateiform. DieOperationszeit beträgt hierfür 0.22s und im temporären Puffer 1005.SPT werden neun

"!./

*,

"!. 012

3401/567$!8900: 0;5 67$!%

*"%8&!<!%%,

"!. 054

88=8 //3*>4/6,5

!=!8!.

5?!= //35?!= //@*,5?!= //2*,

*.;1?!,

Page 144: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

132 Kapitel 8

Einträge notiert, deren Bildstellen (symbolisch durch Farbkreise dargestellt) aus Abb.8.2 (C.) hervorgehen. Zur Alternativenberücksichtigung werden die Strukturpunkter-gebnisse mit identischen Orts- und Lagerungsparametern für die Alternativen 1003 und1006 in 1005.ALT kopiert, so dass bis dahin 27 Zwischenergebnisse vorliegen.

Abb. 8.3: Testbild „eth.ARRAY“ (D.) nach dem Matching und (E.) nach der Visualisierung.

Die 27 positiven Resultate des Strukturpunktmatching werden im fuzzifizierten Mat-ching durch die äussere Fuzzifizierung in 3645 Bildvergleichen umgesetzt. Dabei sind135 Variationen in den Lagerungsparametern berücksichtigt worden (3645 = 27 x 135).Die Berechnung der Matchingdifferenzen in den einzelnen Signifikanzregionen hat nurbei 167 Bildvergleichen nicht zum vorzeitigen Abbruch geführt. Ihre Filterung in örtli-cher Umgebung reduziert den Bestand auf fünf. Darunter befinden sich vier Stellen mitdem gesuchten Template (1005) und an einer Stelle setzte sich ein Alternativtemplatedurch (1003). Der Vorgang des Fuzzifizierten Matching dauert hierbei 1.46s (vgl. auchAbb. 8.3 (D.)). Für die Visualisierung der vier abfragekonformen Resultate werden wei-tere 0.25s Sekunden benötigt (vgl. Abb. 8.3 (E.)).

!""" #

"!.@0::

?!.

0$<.@2:37! ;0 !%!

8%. 21

@0 !<"!A.3*:"= //39 "= //@,0

$%

"!.@025

&:"= //380BA

Page 145: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Anwendungen und Resultate 133

Für den Vergleich der hier gefunden Rechenzeiten wurden ebenso Rechenzeiten mitder Methode Stengele und mit einem konventionellen Korrelator (Formel [3.10]) aufge-zeichnet. Bei der Methode Stengele findet eine Alternativenberücksichtigung gemäss3.3.4 mit denselben Alternativtemplates statt, während sie beim konventionellen Korre-lator fehlt. Da die Präanalyse (Regionenmarkierung) in „GRaQueL“ nur beim erstenMatching einer Session anfällt, ergeben sich für „GRaQueL“ zwei verschiedene Rechen-zeiten (präanalysiert und nicht-präanalysiert, vgl. Abb. 8.4).

Abb. 8.4: Rechenzeiten verschiedener Matchingstrategien

Interessant ist auch die Gegenüberstellung von Rechenzeiten, wenn bestimmte Teil-schritte der Matchingstrategie fortgelassen werden. In Abb. 8.5 sind vier Variantenuntersucht worden. Varianten A und B entsprechen der normalen „GRaQueL“-Abfra-geausführung. Sie unterscheiden sich nur dadurch, dass Variante A mit einer Präana-lyse (Regionenmarkierung) ausgeführt wird, die allerdings nur bei der ersten Abfragenotwendig ist. Variante C zeigt die Rechenzeit, wenn die Strukturpunktsuche imgesamten Bild, und nicht nur an den bei der Präanalyse markierten Regionen ausge-führt wird. Variante D schliesslich stellt einen Versuch dar, bei dem über das gesamteBild mit der vorgestellten Methode gematcht wird (keine Präselektoren).

Abb. 8.5: Rechenzeiten in „GRaQueL“ bei den untersuchten Varianten A, B, C und D.

Page 146: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

134 Kapitel 8

8.1.2 Leistungsfähigkeit bei grossen Datenmengen

Für den zweiten Versuch steht ein Ausschnitt aus der Schweizerischen Landeskarte1:25‘000 Blattnummer 1152 („Ibergeregg“) zur Verfügung, dass einen 3.75km x 3.75kmgrossen Ausschnitt (Schwyz und Mythen) abdeckt (fortan als Testbild „Schwyz“bezeichnet, Dateiname „schwyz.ARRAY“). Mit einer Rasterauflösung von 20 Linien proMillimeter ergibt dieses eine Fläche von 3000 x 3000 Pixeln (vgl. Abb. 8.6).

Mit der Matchingmethode von „GRaQueL“ wurden auf der Schwarzfolie die Höhenko-tenziffern gesucht (10 Templates, vorwiegend ohne Rotation).

Abb. 8.6: Testbild „Schwyz“ mit visualisierten Resultaten.

Page 147: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Anwendungen und Resultate 135

Aufgeschlüsselt nach den einzelnen Templates werden folgende Kennziffern ermittelt:

A = die Anzahl der gefundenen und endgültig angenommenen Resultate (Detektionen)

B = Sollanzahl der jeweiligen Muster, aus der Rasterkarte abgezählt

C = die Anzahl der richtigen Detektionen (Ist-Anzahl) absolut und in % von B

D = die Anzahl der Missdetektionen 1. Art, d.h. die Anzahl der unter den Sollmustern nicht gefun-denen Resultate (D = B - C)

E = die Anzahl der Missdetektionen 2. Art, d.h. die Anzahl der gefundenen Strukturen, die nichtdem Muster entsprechen (E = A - C)

Im Versuch ergeben sich hierbei folgende Kennziffern:

Tab. 8.7: Kennziffern aus dem Versuch mit dem Testbild „Schwyz“.

Es fällt auf, dass die prozentualen Detektionsraten (Kennziffer C) grundsätzlich sehrhoch ausfallen. Das erklärt sich mit der Verwandschaft der Matchingmethode mit dervon Stengele (1995), bei dem ähnlich gute Resultate erhalten wurden. Die Abweichun-gen vom Soll, die getrennt nach Missdetektionen 1. Art und 2. Art ausgewiesen wurdenerklären sich folgendermassen:

• Bei den Ziffern „1“ und „7“ ist die Verwechslungsgefahr mit Linienelementen beson-ders gross.

• Bei der Ziffer „0“ gab es in drei Fällen Verwechslungen mit dem Buchstaben „o“.

• Bei der Ziffer „9“ ist in einem Fall ein Buchstabe „g“ als „9“ interpretiert worden.

• Je ein Sollmuster mit den Ziffern „8“ und „0“ wurde im Matchingprozess verworfen,da in einer Signifikanzzone ein Schwellwert nur knapp überschritten wurde.

Template Ziffer Kennziffern

A B C D E

1001 1 45 47 44 ( 93.6%) 3 1

1002 2 13 13 13 (100.0%) - -

1003 3 19 19 19 (100.0%) - -

1004 4 24 24 24 (100.0%) - -

1005 5 35 35 35 (100.0%) - -

1006 6 27 27 27 (100.0%) - -

1007 7 29 29 27 ( 93.1%) 2 2

1008 8 24 26 24 ( 92.3%) 2 -

1009 9 16 15 15 (100.0%) - 1

1010 0 24 20 19 ( 95.0%) 1 5

Total (&ziffer) 256 255 247 ( 96.9%) 8 9

Page 148: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

136 Kapitel 8

Hingegen sind die geometrisch weniger verwechslungsgefährdeten Ziffern „2“, „3“,„4“, „5“, „6“ und „9“ problemlos gefunden worden.

8.2 Abfragen in „GRaQueL“

Zu den Abfragen in der direkten Abfragesprache „GRaQueL“ werden nachfolgendeinige Beispiele aufgeführt. Dabei wird je eine Abfrage mit den SELECT-Attributenpoint, line, area, char und word vorgestellt, die allesamt mit dem WHERE-Attribut regionausgeführt werden.

Abb. 8.8: Ausführung der Abfrage [8.2] in der Rasterkarte „eth.ARRAY“.

Abfrage von Punktsignaturen

Ein Beispiel für die Abfrage von Punktsignaturen stellt die Abfrage nach der Vermes-sungspunktsignatur dar (Dreieck mit Mittelpunkt, Template-Nummer 5004). Da dieseSignatur nur in einer Orientierung und einer Grösse in den Karten vorkommt, wird dieAbfrage mit dem Operator LIKE ausgeführt. Die zugehörige Abfrage lautet:

SELECT point FROM image WHERE region like 5004 79 [8.2]

In der in Abb. 8.8 abgebildeten Rasterkarte wird die eine Vermessungspunktsignaturgefunden und in Punktformat abgelegt.

79. Auch hier ist die zu Grunde liegende Karte („eth.ARRAY“) bereits vorgängig geladen worden. Durch„FROM image“ wird daher nur noch der Zugriff auf das geladene Bild gelenkt.

Page 149: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Anwendungen und Resultate 137

Abfrage von Liniensignaturen

In der Karte „ptresa.ARRAY“80, die den Ort Ponte Tresa abbildet, verläuft die Grenzezwischen der Schweiz und Italien. Die Grenzlinie wird dabei aus kreuzförmigen Einzel-zeichen zusammengesetzt. Das Grenzkreuz ist in der Wissensbasis unter der Adresse5505 abgelegt. Während die Grenzkreuze annähernd dieselbe Grösse aufweisen, kön-nen sie jedoch - dem Linienverlauf angepasst - rotiert in der Karte vorkommen. Daherwird der Matchingoperator LIKE ROTATED verwendet. Neben einer Visualisierungder Grenzkreuze im Kartenbild sollen die einzelnen Grenzkreuze in einer Datei zurGrenzlinie verbunden werden, was durch das SELECT-Attribut line angegeben wird.Die Abfrage lautet:

SELECT line FROM image WHERE region like rotated 5505 [8.3]

Während im Rasterbild die einzelnen Grenzkreuze visualisiert werden (Abb. 8.9(a)),wird die Grenzlinie in einem DXF-File ausgegeben, das im Programm „RaVis“ zusam-men mit der Rasterkarte visualisiert werden kann (Abb. 8.9(b)).

Abb. 8.9: Ausführung der Abfrage [8.3] in der Rasterkarte „ptresa.ARRAY“, (a) ohne und (b) mit Visua-lisierung des DXF-Linienfiles.

Abfrage von Flächensignaturen

Ein Beispiel für die Abfrage von Flächensignaturen ist

SELECT area FROM image WHERE region like 8893, [8.4]

bei der Obstbaumsignaturen (Templatenummer 8893) in dunkelgrüner Farbe81 erfragtwerden. Diese Signaturen stehen in vielen Fällen in Gruppen zusammen, für dieumschliessende Polygone ausgegeben werden können (vgl. Abb. 8.10).

80. Ausschnitt aus der Schweizerischen Landeskarte 1:25‘000 Blattnr. 1353 („Lugano“).

(a) (b)

81. Die Referenzfarbe ist im Templateheader notiert.

Page 150: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

138 Kapitel 8

Abb. 8.10: Ausführung der Abfrage [8.4] in der Rasterkarte „eth.ARRAY“, (a) ohne und (b) mit Visuali-sierung des DXF-Flächenfiles.

Abfrage von Einzelbuchstaben bzw. -ziffern

In der Abfrage

SELECT char FROM image WHERE region similar 1004 [8.5]

liefert der Operator similar die Ziffern „4“ (Template Nr. 1004) in den verschiedenen, fürkartografische Darstellungen üblichen Schriftgrössen (vgl. Abb. 8.11(a)).

Abb. 8.11: Einschränkung der Abfrageparameter für similar durch den BY-Zusatz: (a) Ausführung derAbfrage [8.5] (ohne BY-Einschränkung) und (b) der Abfrage [8.6] mit BY-Zusatz.

(a) (b)

(a) (b)

Page 151: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Anwendungen und Resultate 139

Sollen hingegen nur die kleineren Ziffern abgefragt werden, so kann mittels eines BY-Operators (oder durch Ändern der Parametersätze in der Definitionsdatei SIMILAR.setmit dem SET-Befehl, vgl. 7.1.2) der Grössenbereich eingeschränkt werden. Die Abfrage

SELECT char FROM image WHERE region similar 1004 [8.6]BY -sa=8,-se=10

liefert jetzt nur noch die Ziffern „4“ der Grössen zwischen 8 und 10 Punkten (vgl. Abb.8.11(b)).

Werden alle Ziffern abgefragt, so kann dies entweder durch zehn hintereinander ausge-führte Einzelabfragen oder durch eine Abfrage mit OR-Verknüpfungen wie

SELECT char FROM image WHERE region like 1001 [8.7] OR region like 1002

OR ... OR ...

OR region like 1010

oder noch kürzer durch Verwendung der linguistischen Variablen &ziffer durch

SELECT char FROM image WHERE region like &ziffer [8.8]

erfolgen. Sie führen allesamt auf diesselben in Abb. 8.12 gezeigten Resultate.82

Abb. 8.12: Ausführung der Abfrage [8.7] bzw. [8.8] in der Karte „eth.ARRAY“.

Abfrage von Wörtern bzw. Zahlen

Wenn Ziffern und Buchstaben nicht einzeln, sondern als Zahlen resp. Wörter erfasstwerden sollen, werden mit dem SELECT-Attribut word die gefundenen Zeichen gemässder Abstands- und Ausrichtungsregeln zusammengesetzt. Die Abfrage

SELECT word FROM image WHERE region like &ziffer [8.9]

82. Mit der gleichen Abfrage wurde auch der Testdatensatz „Schwyz“ (Abb. 8.6) bearbeitet.

Page 152: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

140 Kapitel 8

führt für die Visualisierung zum gleichen Resultat wie in Abb. 8.12, jedoch werdennicht Einzelziffern sondern zusammengesetzte Zahlen im Resultatfile vermerkt. An die-ser Stelle wird der Vorteil linguistischer Variablen wie &ziffer sichtbar. In den Fällen,wo sich semantische Einheiten über mehrere Einzelzeichen erstrecken, können durchlinguistische Variablen lange OR-Verkettungen in Abfragen ersetzt werden.

8.3 „GRaQueL“ im GIS-Kontext

Die Abfragesprache „GRaQueL“ als Analysewerkzeug für Rasterdaten ist in den Kon-text bestehender GIS-Module eingebettet. Dies betrifft die Implementation im Software-modul „KaMu“ und die Verbindung mit „RaQueL“. Aber auch im weiter gehendenKontext der in 7.4 beschriebenen GIS-Module erhält „GRaQueL“ seinen Platz.

Gemeinsames Abfragen in „GRaQueL“ und „RaQueL“

Mit der Realisierung des „GRaQueL“-Prototyps im gleichen Abfragefenster wie„RaQueL“ (und damit auch im Kontext von „KaMu“) ergibt sich die interessante Mög-lichkeit, die geometrisch-merkmalbezogene und die geometrisch-semantische Abfrageme-thode zu kombinieren. „RaQueL“ ist bei der Interpretation der Rasterdaten im Bereichder merkmalsbasierten Analyse und Klassifikation abgegrenzter Bildbereiche (Raster-segmente) behilflich, während „GRaQueL“ eine Zerlegung des Bildes in semantischeEinheiten ermöglicht.

Nachfolgend werden zwei Anwendungsbeispiele genannt, bei denen die Abfrageme-thoden kombiniert werden:

Abb. 8.13: Gemeinsames Abfragen in „GRaQueL“ und „RaQueL“: (a) Ausschnitt aus dem Höhenlayerder Karte „schwyz.ARRAY“, (b) Klassifizierung mit „RaQueL“ ( rot = Linien, schwarz =Punkte, grün = Ziffern), (c) anschliessende Interpretation mit „GRaQueL“: Zahlen- und Lini-enbildung.

• Auf einem Höhenlayer (Abb. 8.13(a)), die ausgezogene und punktierte Höhenkur-ven und Höhenzahlen enthält, werden mit „RaQueL“-Abfragen drei Klassen gebil-

(a) (b) (c)

Page 153: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Anwendungen und Resultate 141

det: Zuerst werden die Punkte mit einer Fläche kleiner als 20 Pixel selektiert. Diezweite Klasse wird von den Ziffern gebildet, deren Flächenquotient signifikant grös-ser ist als bei Linien. Die übrig bleibenden Linien bilden die dritte Klasse (vgl. Abb.8.13(b)). Die umgefärbten Abfrageresultate werden dann mit „GRaQueL“ seman-tisch analysiert: Die Punkte der ersten Klasse werden mit einer Linienabfrage in„GRaQueL“ zu Linienstücken zusammengesetzt, und die Rastersegmente mit denZiffern werden interpretiert und als Höhenzahlen ausgegeben (vgl. Abb. 8.13(c)).

• Da die Objektdefinition für die Merkmalsberechnung in „RaQueL“ vom zu Grundeliegenden Segmentierungsverfahren abhängt, entsteht hin und wieder eine ungün-stige Bildeinteilung in Rastersegmente. Häufig stehen Signaturen in so unmittelbarerNachbarschaft zu anderen gleichfarbigen Objekten, dass sie sich berühren. Durchdas Segmantierungsverfahren werden solche Verschmelzungen nur als ein ganzesObjekt betrachtet und der Merkmalsanalyse in „RaQueL“ zur Verfügung gestellt.Mit „GRaQueL“ können miteinander verbundene Objekte semantisch getrennt wer-den und als vereinzelte Objekte weiter betrachtet werden. Einige Anwendungensind die Trennung von Symbolen an angrenzenden Linien, das Herauslösen vonSymbolen aus dem Gebäudeverband (z.B. Kirchturm aus Kirchengebäude), aberauch die Trennung sich berührender Buchstaben in einem Wort (vgl. Abb. 8.14).

Abb. 8.14: Segmentierung eines Bildausschnittes (a) aus der Karte „schwyz.ARRAY“: (b) Segmentierungin „RaQueL“, (c) semantisch günstigere Segmentierung in „GRaQueL“.

Visualisierung in „RaVis“

Wie in 7.4 schon erläutert, besteht eine enge Verbindung zwischen dem Mustererken-nungsmodul „KaMu“ und dem Visualisierungsmodul „RaVis“. Neben einer direktenVisualisierungsmöglichkeit für Resultate von „KaMu“ bzw. „GRaQuel“ und „RaQueL“durch den refresh-Befehl („@“) können auch die Abfrageresultate visualisiert werden:

Punktförmige Resultate (aus den SELECT-Attributen point und char) können mit Sym-bolen aus einer Symbolbibliothek revisualisiert werden. Für die 3D-Ansicht in „RaVis“besteht die Möglichkeit, Punktdaten auch mit dreidimensionalen Symbolen darzustel-len [Zanini (1998)]. Die DXF-Vektordateien, in denen Linien und Flächen (SELECT-Attribute line bzw. area) abgelegt werden, können in „RaVis“ getrennt oder gemeinsamvisualisiert und mit der zugehörigen Karte überlagert werden (vgl. Abb. 8.9 und 8.10).

(a) (b) (c)

Page 154: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

142 Kapitel 8

8.4 Bewertung

Die Bewertung der neu entwickelten Abfragemethode für Rasterdaten, die im Prototyp„GRaQueL“ realisiert worden ist, ist unter drei Aspekten vorgenommen worden.

Betreffend der Funktionsweise und der Leistungsfähigkeit der Matchingmethode kannfestgehalten werden,

• dass es gelungen ist, die Diskrepanz einer i.A. reich parametrisierten Steuerung vonMustererkennungsverfahren einerseits und linguistisch formulierten und damitweitgehend parameterfreien Abfragen andererseits durch die Verwendung von Wis-senskomponenten (Wissensbasis) und durch die Fuzzifizierung der Mustererken-nungsmethode zu überbrücken,

• dass die Verwendung von Präselektoren zur Eingrenzung des Suchbereiches auchzu Einsparung von Rechenzeit führt,

• dass die Strategien der Fuzzifizierung (Alternativenberücksichtigung, äussere undinnere Fuzziness) und der Defuzzifizierung (Schwellwert für Signifikanzzonen,lokale Filterung und Ausscheiden von Alternativen) problemgerecht angelegt wur-den, und dass dadurch die Rekognition von aus der Wissensbasis bekannten Struk-turen effizient erreicht werden kann, und

• dass die Güte der erhaltenen Resultate (vgl. Tab. 8.7) im erheblichen Masse davonabhängt, wie gut die Wissenskomponenten definiert werden (Schwellwerte, Signifi-kanzregionen, Strukturpunktdefinitionen etc.). Nachbesserungen müssen also nichtprimär methodisch, sondern in Bezug auf die Wissensdefinition erfolgen.

Die Funktionalität der Abfragesprache beweist,

• dass ein strukturierter direkter Zugriff auf die Inhalte einer Rasterkarte möglich ist.Durch die Wahl des SELECT-Attributes kann das Ausgabeformat und damit dieStruktur der resultierenden Information festgelegt werden;

• dass mit den eingeführten Operatoren like, like rotated, similar und similar rotatedSchlüsselwörter gefunden wurden, die ohne explizite benutzerseitige Parameteran-gaben verschiedene Matchingaufgaben ermöglichen,

• dass mit Hilfe der linguistischen Variablen auf bequeme Weise und höchst benutzer-freundlich semantische Mehrfachabfragen durchführbar sind, und

• dass trotzdem Manipulationsmöglichkeiten für die Parameter der zu Grunde liegen-den Mustererkennungsmethode bestehen, wenn spezielle Aufgaben dies erfordern.

Schliesslich zeigt sich, dass der Prototyp von „GRaQueL“ durch die Einbettung in dieSoftwareumgebung von „KaMu“, „RaQueL“, „RaVis“ und „RobVec“ zur Interoperabi-lität mit anderen GIS-Modulen fähig ist. Dies ist eine wichtige Voraussetzung für wei-tere Entwicklungen basierend auf dem Ansatz von „GRaQueL“.

Page 155: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Kapitel 9

Schlussbetrachtung

Die zunehmende Verwendung von Abfragewerkzeugen für die Datenanalyse hatwesentlich zur Benutzerfreundlichkeit und Akzeptanz von Geografischen Informati-onssystemen (GIS) beigetragen. Das Arbeiten mit raumbezogenen Daten ist durch dieMöglichkeit eines analytischen Zugriffs mittels formaler sprachverwandter Formulie-rungen erleichtert worden. Obwohl auch Rasterdaten wichtige Träger raumbezogenerInformation sind, sind rasterbasierte Abfragemodule in herkömmlichen GIS-Applika-tionen bislang entweder gar nicht oder nur unterentwickelt vorhanden. Der Grundhierfür scheint in der Struktur von Mustererkennungsmethoden zu liegen, die nichtzum Schema formaler Abfragen passt.

Die Entwicklung neuer Analysemehoden für Rasterdaten, basierend auf dem Mecha-nismus von Abfragesprachen, hat die Intention zu einigen Forschungsarbeiten am IGPder ETH Zürich und damit auch zu vorliegender Arbeit gegeben. Absicht dieser For-schungen ist es, die Diskrepanz zwischen dem Abfrageformalismus und der Parametri-sierung von Mustererkennungsmethoden z.B. durch Wissenskomponenten zuüberwinden.

Frischknecht (1999) geht dieser Diskrepanz durch die Schaffung einer dem Bild korre-spondierenden Datenbank aus dem Weg, in welcher zu segmentierten Objekten geome-trische und topologische Merkmale gespeichert werden. In dieser Merkmalsdatenbankist der Einsatz von Abfragesprachen in Analogie zu herkömmlichen Datenbanken mög-lich geworden. Seine Methode entspricht einer abfragegesteuerten Klassifizierung fürRastersegmente.

Vorliegender Arbeit liegt das Matching als Mustererkennungsmethode zu Grunde. Esgreift unmittelbar auf das originäre Rasterbildmaterial zu und erlaubt das Auffindenvon bekannten, d.h. in einer Wissensbasis vorgehaltenen Rasterstrukturen. Abfragenmüssen sich bei dieser Methode nicht auf eine dazwischen abgebildete Datenbankbeziehen, sondern sie steuern die Matchingmethode [Graeff (2002)]. Das Grundprinzipdes Matching basiert auf einem Vergleich bekannter Rasterstrukturen mit denen im

Page 156: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

144 Kapitel 9

Bild. Bekannte Rasterstrukturen werden i.A. mit der Semantik, d.h. der Objektbedeu-tung verknüpft. Eine Abfragemethode basierend auf diesem Prinzip ermöglicht daherden Zugriff auf Bildinhalte über die Semantik.

Das hat zum Einen einen sehr konsequenten Einsatz und eine geschickte Kombinationvon Wissen erfordert: Da in der Abfrageformulierung Rasterstrukturen nach ihrerSemantik erfragt werden, musste die Verknüpfung zwischen Semantik (d.h. der Zei-chenbedeutung) und der Zeichengeometrie in der Wissensbasis geschaffen werden.Auch für die vielen geometrischen Parameter, die für ein Matching beliebig rotierterund beliebig skalierter Strukturen notwendig sind, musste eine Wissenskomponentebereit gestellt werden. Letztere gehört teilweise zur Wissensbasis der einzelnen Tem-plates (z.B. Standardzeichengrösse, Rotationsbereiche im Falle von Symmetrieeigen-schaften) und teilweise zur Definition der neu geschaffenen Matchingoperatoren like,similar, like rotated und similar rotated.

Zum Anderen musste die Matchingstrategie grundlegend optimiert werden: Dies isterforderlich geworden, um die Diskrepanz zwischen der reichlich parametrisiertenMatchingmethode und der linguistisch motivierten Abfrageformulierung effizient zuüberwinden. Mit der Ausgestaltung des direkten Bildzugriffs als wissensverarbeitendeund fuzzifizierte Matchingmethode ist es gelungen, eine gewisse Simulation des wis-sensbasierten Lesens und Erkennens von Zeichen zu schaffen. Ebenso wie der Menschbei der Rekognition auf wichtige Wahrnehmungs- und Verarbeitungsfähigkeitenzurückgreift, sind auch in „GRaQueL“ entsprechende Teilschritte implementiert wor-den - und dies ohne Neuronale Netze oder Methoden der Künstlichen Intelligenz. Zudiesen Wahrnehmungs- und Verarbeitungsfähigkeiten gehören das Vergleichen mitbekannten Strukturen (realisiert im Matching), das Wissen um wesentlich und unwe-sentlich zur Zeichendefintion gehörende geometrische Bestandteile (realisiert in derFuzzy-Membership-Definition der Templates), das Wissen um Unterschiede zwischenZeichen und das um Verwechslungen (realisiert im Alternativentest) und das Eingren-zen des Suchbereichs durch grobes, flüchtiges Bildwahrnehmen (realisiert in den Präse-lektionsschritten). Weiteren Schwächen des Matching konnte durch die Fuzzifizierungdes Matchingverfahrens begegnet werden: Die Einführung von äusserer und innererFuzziness im Matching haben wesentlich dazu beigetragen, dass die Entscheidung überdie Übereinstimmung von Bildausschnitt und abgefragter Rasterstruktur nur nochschwach von zufälligen oder systematischen geometrischen Deformationen im Bildabhängig ist.

Mit „GRaQueL“ steht nun ein rasterbasiertes Analysewerkzeug zur Verfügung, dassich nicht allein auf die Rekognition flächenhaft definierter räumlicher Strukturen(Templatetyp region) im Rasterbild beschränkt. Bei entsprechender Abfrageformulie-rung werden zu gefundenen Resultaten auch übergeordnete geometrische Strukturengeliefert. So werden einzelne Zeichen, die Bestandteile von Linien, Flächen und Wör-tern sind, bei entsprechender Abfrageformulierung zu Linien, Flächen resp. Wörternzusammengefasst und entsprechend ausgegeben.

Page 157: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Schlussbetrachtung 145

Die Einbettung von „GRaQueL“ in den Kontext weiterer GIS- und Mustererkennungs-module am IGP der ETH Zürich, die Schnittstellen sowohl für Rasterdaten wie für Vek-tordaten aufweisen, ermöglicht den Einsatz der Methode für ein breites Spektrum vonAnwendungen.

Ausblick

Mit „GRaQueL“ liegt der Prototyp eines rasterbasierten Analysewerkzeuges vor, das ineiner Abfragemaske gesteuert wird. Mit diesem Prototyp können zurzeit auf Basiszweidimensionaler Templates geometrisch-semantische Abfragen durchgeführt wer-den. Damit sind die in den topografischen Karten vorkommenden Fälle geometrischerKodierung abgedeckt, bei denen Templates des Types region zu Grunde liegen. Abfra-gegegenstände können Einzelsignaturen, aus Einzelsignaturen bestehende Linien undFlächen sowie die Elemente der Beschriftung sein.

Für einen universellen Einsatz von „GRaQueL“ in rasterbasierten topografischen Kar-ten bedarf es noch folgender Entwicklungen:

• Erweiterung der Abfragefunktionalität auf das Abfragen von Linien, die kontinuier-lich verlaufen und nicht diskret aus Einzelsignaturen zusammengesetzt werden.Hierzu ist ein aufeinander abgestimmter Einsatz von Liniendetektoren (vgl. Mayer(1996)) und Matchingmethoden für das Linienprofil zu überlegen.

• Erweiterung auf die Abfrage von einigen Flächentypen: Vollton-, Schummerungs-und Schraffurflächen.

Eine andere Perspektive für die Weiterentwicklung ergibt sich aus der Problematik derSchriftzuordnung. Beschriftungen gelten als semiotisch artfremde Elemente in karto-grafischen Darstellungen und haben immer nur attributive Funktion, indem sie sich aufgeometrische Objekte der Typen Punkt, Linie oder Fläche beziehen. Hierzu muss stär-ker die Topologie der topografischen Karte berücksichtigt werden.

„GRaQueL“ ist als Methode unabhängig vom Einsatz für Schweizer Landeskarten ent-worfen worden, da zwischen methodischer Komponente und dokumentspezifischerWissenskomponente getrennt wurde. Der Austausch der Wissensbasis (i.e. derLegende) eröffnet die Möglichkeit zum Einsatz in anderen digitalen Karten.

Inwieweit der Einsatz dieser Abfragemethode auch für generelle digitale Bilder mitraumbezogener Information (z.B. Luftbilder, Satellitenbilder, photogrammetrischeFotografien raumbezogener Objekte) möglich ist, hängt erstens davon ab, inwieweit zusolchen Bildern das Wissen geeignet modelliert werden kann, und zweitens ob die in„GRaQueL“ favorisierten Mustererkennungsmethoden dort zu akzeptablen Resultatenführen. Aus der Übertragung der Abfragemethode auf solche und andere Rasterbilddo-kumente ergeben sich noch eine Reihe von Forschungsansätzen.

Bezogen auf die Analyse kartografischer Rasterdaten in Geografischen Informationssy-stemen (GIS) stellt vorliegende Arbeit einen interessanten Ansatz vor, der insbesonderehybriden Geo-Informationssystemen zu Gute kommt.

Page 158: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG
Page 159: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Bibliografie

Abkürzungen:

Adam, S.; J.-M. Ogier; C. Cariou; J. Gardes; R. Mullot; and Y. Lecourtier (1999): Com-bination of Invariant Pattern Recognition Primitives on Technical Documents. In:Chhabra, A.K. and D. Dori (eds.) (1999): Graphics Recognition. Recent Advances. LNCS1941, Berlin, Springer, pp. 238-245.

Anquetil, É.; B. Coüasnon; and F. Dambreville (1999): A Symbol Classifier Able ToReject Wrong Shapes for Document Recognition Systems. In: Chhabra, A.K. and D.Dori (eds.) (1999): Graphics Recognition. Recent Advances. LNCS 1941, Berlin, Sprin-ger, pp. 209-218.

DGK Deutsche Geodätische Kommission bei der Bayerischen Akademie der Wissenschaften (München)

ETH Eidgenössische Technische Hochschule (Zürich)

FIG Fédération Internationale des Géomètres (International Federation of Surveyors, Internationale Vereinigung der Vermessungsingenieure)

IAPR International Association of Pattern Recognition

IAPRS International Archives of Photogrammetry and Remote Sensing

ICA International Cartographic Association

IEEE Institute of Electrical and Electronics Engineers

IGP Institut für Geodäsie und Photogrammetrie

IJGIS International Journal of Geographical Information Systems

LNCS Lecture Notes in Computer Sciences

VPK Vermessung Photogrammetrie Kulturtechnik / Mensuration Photo-grammétrie Génie Rural (Schweiz)

ZfV Zeitschrift für das Vermessungswesen (Deutschland)

Page 160: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

148

Antani, S.; R. Kasturi; and R. Jain (1998): Pattern Recognition Methods in Image andVideo Databases: Past, Present and Future. In: Amin, A.; D. Dori; P. Pudil; and H.Freeman (eds.) (1998): Advances in Pattern Recognition. LNCS 1451, Berlin, Springer,pp. 31-53.

Armenakis, C.; E. Siekierska; F. Hegyi; and P. Pilon (1999): Production and „Intelli-gence“ of Rasater [SIC!] Maps. In: Proceedings ICA 1999, Ottawa.

Badard, T. (1999): On the automatic retrieval of updates in geographic databases basedon geographic data matching tools. In: Proceedings ICA 1999, Ottawa.

Ballard, D.H. and C.M. Brown (1982): Computer Vision. New Jersey, Prentice-Hall.

Bartelme, N. (1995): Geoinformatik. Modelle, Strukturen, Funktionen. Berlin, Heidel-berg, Springer.

Bauknecht, K. und C.A. Zehnder (1997): Grundlagen für den Informatikeinsatz. Stutt-gart, Teubner, 5. Auflage.

Benning, W. und R. Schindler (2001): Wissensbasierte Analyse von Vermessungsris-sen. In: ZfV Vol. 126, Nr. 2, S. 65-73.

Bernhardsen, T. (1999): Geographic Information Systems. An Introduction. New York,Wiley, 2nd edition.

Bertin, J. (1998): Sémiologie graphique. Les diagrammes, les réseaux, les cartes. Paris,Les ré-impressions des éditions de l’école des hautes études en sciences sociales(l’EHESS), 3ème édition.

Bill, R. und D. Fritsch (1994): Grundlagen der Geo-Informationssysteme. Band 1: Hard-ware, Software und Daten. Heidelberg, Wichmann, 2. Auflage.

Bill, R. (1999a): Grundlagen der Geo-Informationssysteme. Band 1: Hardware, Softwareund Daten. Heidelberg, Wichmann, 4. Auflage.

Bill, R. (1999b): Grundlagen der Geo-Informationssysteme. Band 2: Analysen, Anwen-dungen und neue Entwicklungen. Heidelberg, Wichmann, 2. Auflage.

Boesch, R. (1996): Detection and extraction of complex map symbols. In: IAPRS, Vol.XXXI, Part B3, Vienna, pp. 65-69.

Böhme, G. (1993): Fuzzy-Logik. Einführung in die algebraischen und logischen Grund-lagen. Berlin, Springer.

Born, G. (1997): Referenzhandbuch Dateiformate. Datenbanken, Tabellenkalkulation,Text, Grafik, Multimedia, Sound und Internet. Bonn, Addison-Wesley, 5. Auflage.

Brügelmann, R. (1998): Analyse gescannter Karten. In: Bähr, H.-P. und T. Vögtle (Hrsg.)(1998): Digitale Bildverarbeitung. Anwendungen in Photogrammetrie, Kartographie undFernerkundung. Heidelberg, Wichmann, 3. Auflage, S. 69-107 (ebd. Kap. 5.1).

Burrough, P.A. and R.A. McDonnell (1998): Principles of Geographical InformationSystems. Oxford University Press.

Page 161: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Bibliografie 149

Carosio, A. (1999): Geoinformationssysteme. Band 1. Skript zur Vorlesung „Raumbezo-gene Informationssysteme“ an der ETH Zürich.

Castleman K.R. (1979): Digital Image Processing. New Jersey, Prentice-Hall.

Centeno, J.S. (1998): Integrierte Verarbeitung von Satellitenbild- und gerasterter Kar-teninformation. In: Bähr, H.-P. und T. Vögtle (Hrsg.) (1998): Digitale Bildverarbei-tung. Anwendungen in Photogrammetrie, Kartographie und Fernerkundung. Heidelberg,Wichmann, 3. Auflage, S. 243-262 (ebd. Kap. 6.4).

Costagliola, G.; G. Tortora; and M. Tucci (1995): GISQL – A Query Language Interpre-ter for Geographical Information Systems. In: Spaccapietra, S. and R. Jain (eds.)(1995): Visual Database Systems 3, Chapman&Hall, pp. 275-286.

Cruse, H., J. Dean und H. Ritter (1998): Die Entdeckung der Intelligenz oder KönnenAmeisen denken? München, C.H.Beck.

den Hartog, J.; T. ten Kate; and J. Gerbrands (1995): Knowledge-Based Segmentationfor Automatic Map Interpretation. In: Chhabra, A.K. and D. Dori (eds.) (1995): Gra-phics recognition. Methods and Applications. LNCS 1072, Berlin, Springer, pp. 159-178.

Dori, D. (1999): Syntactic and Semantic Graphics Recognition: The Role of the Object-Process Methodology. In: Chhabra, A.K. and D. Dori (eds.) (1999) : Graphics Recogni-tion. Recent Advances. LNCS 1941, Berlin, Springer, pp. 277-287.

Egenhofer, M.J. (1992): Why not SQL! In: IJGIS, Vol. 6, No. 2, pp. 71-85.

Förstner, W. (1998): Unterlagen zur Vorlesung Photogrammetrie an der RheinischenFriedrich-Wilhelms-Universität Bonn.

Freytag, J.C.; D. Maier; and G. Vossen (1994): Query Processing for Advanced Data-base Systems. San Mateo, Morgan Kaufmann.

Frischknecht, S. (1996): Extraktion beliebig orientierter Kartensymbole und Schriftele-mente aus gescannten topographischen Karten durch rotationsinvariante Filter-funktionen und Template Matching. In: Kartographie im Umbruch - neue Heraus-forderungen, neue Technologien. Beiträge zum Kartographiekongress Interlaken 1996.

Frischknecht, S. (1999): Eine Abfragesprache für die Geometrie von Rasterelementenfür die rasterorientierte Kartographische Mustererkennung und Datenanalyse.Mitteilungen Nr. 69 des IGP an der ETH Zürich.

Gao, J.; X. Ding; and J. Zheng (2000): Image Pattern Recognition Based on Examples –A Combined Statistical and Structural-Syntactic Approach. In: Ferri, F.J.; J.M. Iñe-sta; A. Amin; and P. Pudil (eds.) (2000): Advances in Pattern Recognition. LNCS 1876,Berlin, Springer, pp. 57-66.

Giger, C. (2001): Vorlesung Rasterdaten I. Unterlagen zur Vorlesung RIS II an der ETHZürich, Wintersemester 2001/2002.

Page 162: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

150

Göpfert, W. (1991): Raumbezogene Informationssysteme. Datenverarbeitung, Verarbei-tung, Integration, Ausgabe auf der Grundlage digitaler Bild- und Kartenverarbei-tung. Karlsruhe, Wichmann, 2. Auflage.

Gottwald, S. (1993): Fuzzy Sets and Fuzzy Logic. The Foundations of Application –from a Mathematical Point of View. Braunschweig, Wiesbaden, Vieweg.

Graeff, B. (2000a): Mehrbildzuordnung von projektiv verzerrten Bildern für die Quali-tätsbewertung von Bildanalyseprozessen. Diplomarbeit an der LandwirtschaftlichenFakultät der Rheinischen Friedrich-Wilhelms-Universität Bonn.

Graeff, B. (2000b): Benutzerhandbuch für „KaMu“, IGP, ETH Zürich, unveröffentlicht.

Graeff, B. (2001): Querying Raster Data Structures - Probabilistic and Non-probabilisticApproaches On Knowledge Based Template Matching Methods. In: Ádám, J. andK.-P. Schwarz (eds.) (2002): Vistas for Geodesy in the New Millennium. IAG ScientificAssembly Budapest, September 2-7, 2001. Berlin, Heidelberg, Springer, pp. 371-376.

Graeff, B. and A. Carosio (2002): Automatic Interpretation of Raster-Based Topogra-phic Maps by Means of Queries. Proceedings Commission 3, XXII. FIG-CongressWashington D.C.

Haberäcker, P. (1987): Digitale Bildverarbeitung. Grundlagen und Anwendungen.München, Hanser, 2. Auflage.

Haberäcker, P. (1995): Praxis der Digitalen Bildverarbeitung und Mustererkennung.München, Hanser.

Hake, G., D. Grünreich und L. Meng (2002): Kartographie. Visualisierung raum-zeitli-cher Informationen. Berlin, New York, De Gruyter, 8. Auflage.

Hohenstein, U., R. Lauffer, K.-D. Schmatz und P. Weikert (1996): ObjektorientierteDatenbanksysteme. ODGM-Standard, Produkte, Systembewertung, Benchmarks,Tuning. Braunschweig, Vieweg.

Humphreys, G.W. and V. Bruce (1989): Visual Cognition. Computational, Experimen-tal, and Neuropsychological Perspectives. Lawrence Erlbaum Associates, Hove.

Illert, A. (1990): Automatische Erfassung von Kartenschrift, Symbolen und Grundriss-objekten aus der Deutschen Grundrisskarte 1:5000. Wissenschaftliche Arbeiten derFachrichtung Vermessungswesen der Universität Hannover Nr. 166.

Imhof, E. (1972): Thematische Kartographie. Berlin, New York, De Gruyter.

Kanani, E. und A. Carosio (2001): Automatische Vektorisierung von flächenhaftenObjekten mit robuster Schätzung. In: VPK 3/2001, S. 156-160.

Kanani, E. (1998): User Manual of „RobVec“, IGP, ETH Zürich, unpublished.

Kanani, E. (2000): Robust Estimators for Geodetic Transformations and GIS. Mitteilun-gen Nr. 70 des IGP an der ETH Zürich.

Page 163: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Bibliografie 151

Kim, M.-K.; M.-K. Park; O.-S. Kwon; and Y.-B. Kwon (1995): Automatic Region Label-ling of the Layered Map. In: Chhabra, A.K. and D. Dori (eds.) (1995): Advances in Pat-tern Recognition. LNCS 1451, Berlin, Springer, pp. 532-539.

Koch, K.R. (1994): Deterministische und stochastische Signale mit Anwendungen in derdigitalen Bildverarbeitung. Bonn, Dümmler.

Koch, K.R. (1995): Bildinterpretation mit Hilfe eines Bayes-Netzes. In: ZfV Vol. 120, Nr.6, S. 277-285.

Koch, K.R. (2000): Einführung in die Bayes-Statistik. Berlin, Springer.

Köster, M. (1995): Kontextsensitive Bildinterpretation mit Markoff-Zufallsfeldern. DGKReihe C, Nr. 444, München.

Kraus, K. (1990): Fernerkundung. Band 2: Auswertung photographischer und digitalerBilder. Dümmler, Bonn.

Kunz, D., T. Vögtle und K.-J. Schilling (1998): Integrierte Verarbeitung von Satelliten-bild- und vektorieller Karteninformation. In: Bähr, H.-P. und T. Vögtle (Hrsg.)(1998): Digitale Bildverarbeitung. Anwendungen in Photogrammetrie, Kartographie undFernerkundung. Heidelberg, Wichmann, 3. Auflage, S. 220-242 (ebd. Kap. 6.3).

Lee, K.-H.; Y.-C. Choy; and S.-B. Cho (2000): Geometric Structure Analysis of Docu-ment Images: A Knowledge-Based Approach. In: IEEE Transactions on PatternAnalysis and Machine Intelligence, Vol. 22, No. 11, pp. 1224-1240.

Lehmann, F. (1999): Behandlung von Ungewissheit und Vagheit in Kommunikations-netzen. In: Seising, R. (Hrsg.) (1999): Fuzzy Theorie und Stochastik. Modelle undAnwendungen in der Diskussion. Braunschweig, Wiesbaden, Vieweg, S. 335-354 (ebd.Kap. 15).

Lin, W. (1994): Ein Beitrag zur kartographischen Mustererkennung mittels Methodender Künstlichen Intelligenz. DGK Reihe C, Nr. 419, München.

Lin, H. and B. Huang (1999): Vector-Raster Interoperation: A Spatial Query LanguageApproach. In: Geomatica Vol. 53, No. 3, pp. 307-316.

Lopéz, D. and I. Piñaga (2000): Syntactic Pattern Recognition by Error Correcting Ana-lysis on Tree Automata. In: Ferri, F.J.; J.M. Iñesta; A. Amin; and P. Pudil (eds.) (2000):Advances in Pattern Recognition. LNCS 1876, Berlin, Springer, pp. 133-142.

Matthiesen, G. und M. Unterstein (1997): Relationale Datenbanken und SQL. Konzepteder Entwicklung und Anwendung. Bonn, Addison-Wesley.

Mayer, H. (1994): Automatische wissensbasierte Extraktion von semantischer Informa-tion aus gescannten Karten. DGK Reihe C, Nr. 417, München.

Mayer, H., C. Heipke und H. Ebner (1995): Wissensbasierte Bildanalyse zur Extraktionvon topographischen Objekten – Grundlagen und Interpretation von Katasterkar-ten. In: ZfV Vol. 120, Nr. 6, S. 285-298.

Page 164: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

152

Mayer, H. (1996): Using Real World Knowledge for the Automatic Acquisition of GISObjects from Scanned Maps. In: GIS 2/1996, pp. 14-20.

Messinger H. (Hrsg.) (1996): Langenscheidts Handwörterbuch Englisch. Teil I: Eng-lisch-Deutsch. Langenscheidt.

Myers, G.K.; P.G. Mulgaonkar; C.-H. Chen; J.L. DeCurtins; and E. Chen (1995): Verifi-cation-Based Approach for Automated Text and Feature Extraction from Raster-Scanned Maps. In: Chhabra, A.K. and D. Dori (eds.) (1995): Graphics Recognition.Methods and Applications. LNCS 1072, Berlin, Springer, pp. 190-203.

Nagy, G. (2000): Twenty Years of Document Image Analysis in PAMI. In: IEEE Transac-tions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 1, pp. 38-62.

Nebiker, S. (1995): User Manual of „AutoVec“, IGP, ETH Zürich, unpublished.

Nebiker, S. (1997): Spatial Raster Data Management for Geo-Information Systems. ADatabase Perspective. Mitteilungen Nr. 63 des IGP an der ETH Zürich.

Palenichka, R.M.; P. Zinterhof; and I.B. Ivanesko (2000): Adaptive Filtering and Seg-mentation Using Robust Estimation of Intensity. In: Ferri, F.J.; J.M. Iñesta; A. Amin;and P. Pudil (eds.) (2000): Advances in Pattern Recognition. LNCS 1876, Berlin, Sprin-ger, pp. 888-897.

Palm, R. (1999): Fuzzy Regelung. In: Seising, R. (Hrsg.) (1999): Fuzzy Theorie und Stocha-stik. Modelle und Anwendungen in der Diskussion. Braunschweig, Wiesbaden, Vieweg,S. 302-334 (ebd. Kap. 14).

Pfund, M. (1998): Rasterbasierte Erneuerung der Kartenschrift digitaler topographi-scher Karten. IGP Bericht Nr. 275, Zürich.

Quint, F. (1998): Objekterfassung aus Karte und Bild. In: Bähr, H.-P. und T. Vögtle (Hrsg.)(1998): Digitale Bildverarbeitung. Anwendungen in Photogrammetrie, Kartografie undFernerkundung. Heidelberg, Wichmann, 3. Auflage, S. 108-144 (ebd. Kap. 5.2).

Samet, P.A. (1981): Query Languages. An Unified Approach. British Computer SocietyMonographs in Informatics.

Samet, H. and A. Soffer (1994): A Legend-Driven Geographic Symbol RecognitionSystem. In: Proceedings IAPR Pattern Recognition and Neural Networks, Vol II, Jerusa-lem, pp. 350-355.

Scholz, O. (1998): Was heißt es, ein Bild zu verstehen? In: Sachs-Hombach, K. und K. Reh-kämper (Hrsg.) (1998): Bild - Bildwahrnehmung - Bildverarbeitung. InterdisziplinäreBeiträge zur Bildwissenschaft. Wiesbaden, Deutscher Universitäts-Verlag, S. 105-117.

Segl, K. (1998): Klassifizierung mit neuronalen Netzen. In: Bähr, H.-P. und T. Vögtle(Hrsg.) (1998): Digitale Bildverarbeitung. Anwendungen in Photogrammetrie, Kartogra-phie und Fernerkundung. Heidelberg, Wichmann, 3. Auflage, S. 186-219 (ebd. Kap. 6.2).

Stengele, R. (1993): Kartographische Mustererkennung durch Template Matching. IGPBericht Nr. 230, Zürich.

Page 165: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Bibliografie 153

Stengele, R., S. Nebiker und M. Zanini (1995): Vom Pixel zum Objekt. Strukturierungund Modellierung von Geo-Informationen. In: VPK Nr. 4, 1995, S. 174-182.

Stengele, R. (1995): Kartographische Mustererkennung. Rasterorientierte Verfahren zurErfassung von Geo-Informationen. Mitteilungen Nr. 54 des IGP an der ETH Zürich.

Valveny, E. and E. Martí (1999): Deformable Template Matching within a Bayesian Fra-mework for Hand-Written Graphic Symbol Recognition. In: Chhabra, A.K. and D.Dori (eds.) (1999): Graphics Recognition. Recent Advances. LNCS 1941, Berlin, Sprin-ger, pp. 193-208.

Wang, F. (1994): Towards a Natural Language User Interface: An Approach of FuzzyQuery. In: IJGIS, Vol. 8, No. 2, pp. 143-162.

Weber, W. (1988): Kartographische Mustererkennung. In: Kartographische Nachrichten 3/88, S. 113-120.

Widmann, N. and P. Baumann (1998): Towards Comprehensive Database Support forGeoScientific Raster Data. In: Proceedings of the ACM-GIS 97, Las Vegas, Nevada,USA, November 1997. [http://www.forwiss.tu-muenchen.de/~rasdaman/public/pr-veroeff.html]

Wille, R. (2000): Begriffliche Wissensverarbeitung: Theorie und Praxis. In: InformatikSpektrum, Vol. 23, Nr. 6, Berlin, Springer, S. 357-369.

Zadeh, L.A. (1965): Fuzzy Sets. In: Information and Control 8, pp. 338-353.

Zamperoni, P. (1989): Methoden der digitalen Bildsignalverarbeitung. Braunschweig,Vieweg.

Zanini, M. (1998): Dreidimensionale synthetische Landschaften. Wissensbasierte drei-dimensionale Rekonstruktion und Visualisierung raumbezogener Informationen.Mitteilungen Nr. 66 des IGP an der ETH Zürich.

Zimmermann, H.-J. (1999): Von der Fuzzy Set Theorie zur Computational Intelligence.In: Seising, R. (Hrsg.) (1999): Fuzzy Theorie und Stochastik. Modelle und Anwendungenin der Diskussion. Braunschweig, Wiesbaden, Vieweg, S. 161-181 (ebd. Kap. 5).

(L+T) ----- (1998): Zeichenerklärung und weitere Informationen zu den Landeskartender Schweiz. Hrsg. vom Bundesamt für Landestopographie , Wabern.

(L+T) ----- (2000): DHM25 - Das digitale Höhenmodell der Schweiz. MNT25 Le modèlenumérique du terrain de la Suisse. Hrsg. vom Bundeamt für Landetopographie,Wabern.

(L+T) ----- (2002): Zeichenerklärung und weitere Informationen zu den Landeskartender Schweiz. Hrsg. vom Bundesamt für Landestopographie , Wabern.

(Oracle) ----- (2000): Oracle i, SQL Reference. Release 3 (8.1.7), September 2000.

(SGK) ----- (2002): Topografische Karten. Kartengrafik und Generalisierung. Hrsg. vonder Schweizerischen Gesellschaft für Kartographie (SGK). Kartografische Publikations-reihe Nr. 16 [CD-Rom].

Page 166: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG
Page 167: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Dank

Folgenden Personen möchte ich im Rahmen meiner Dissertation danken:

• dem Referenten Herrn Prof. Dr. Alessandro Carosio für die fachliche und menschli-che Unterstützung, ganz besonders für die Möglichkeit, die Resultate meiner Arbei-ten auf diversen internationalen Fachkonferenzen präsentieren zu dürfen;

• dem Korreferenten Herrn Prof. Dr. François Golay, der sich schon früh zur Über-nahme des Korreferats bereit erklärt hatte und meine Arbeiten während vielerGespräche an der EPF Lausanne begleitet hat;

• meinen Kolleginnen und Kollegen in der Gruppe Geo-Informationssysteme undFehlertheorie, aber auch der anderen Gruppen im IGP für die Zusammenarbeit. Einganz besonderer Dank gebührt der Sekretärin Frau Gertrud Rothenberger, die sichstets um viele administrative Belange sorgte;

• den Kolleginnen und Kollegen aus dem Institut für Kartografie, die mir in vielenkartografischen Fragen beratend zur Seite standen;

• meiner lieben Gerda, die mir besonders im Endspurt dieser Arbeit eine wichtige see-lische Stütze gewesen ist und mir in Zeiten des Stresses immer wieder Mut zuge-sprochen hat;

• allen hier nicht besonders aufgeführten Personen, die mich ideell und materiell beidieser Arbeit unterstützt haben.

Diese Arbeit wurde vom Schweizerischen Nationalfonds im Rahmen der Forschungs-projekte Nr. 20-55775.98 finanziell unterstützt.

Page 168: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG
Page 169: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Bewilligung

Die Reproduktion von Ausschnitten aus der Schweizer Landeskarte 1:25‘000 und derZeichenerklärung in den Abb. 2.7, 4.4, 5.9, 5.10, 5.12, 6.1, 7.5, 7.6, 7.8, 7.11, 8.2, 8.3, 8.6,8.8, 8.9, 8.10, 8.11, 8.12, 8.13 und 8.14 erfolgt mit freundlicher Bewilligung durch dasBundesamt für Landestopographie, Wabern, vom 03.10.2002 (Az. BA024719).

Page 170: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG
Page 171: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG

Lebenslauf

Name Bastian Graeff

Geburtsdatum 1. Januar 1974

Geburtsort Siegburg (Deutschland)

Zivilstand ledig

1980-1984 Grundschule

1984-1993 Gymnasium

26. Mai 1993 Allgemeine Hochschulreife (Abitur)

Okt. 1993 - Sept. 1995 Studium der Fächer Mathematik und Kath. Religions-lehre an der Rheinischen Friedrich-Wilhelms-Universi-tät Bonn

Okt. 1995 - Jan. 2000 Studium des Vermessungswesens an der Rheinischen Friedrich-Wilhelms-Universität Bonn

März 1999 - Juli 1999 Austauschstudium an der ETH Zürich im Rahmen des ERASMUS/SOKRATES-Programmes

31. Januar 2000 Diplom

seit Mai 2000 Assistent und Doktorand am Institut für Geodäsie und Photogrammetrie (IGP) der ETH Zürich

Okt. 2000 - Mai 2001 Nachdiplomkurs Räumliche Informationssysteme an der ETH Zürich

Page 172: Abfragesprache für geometrische und semantische .... ETH Nr. 14864 ABFRAGESPRACHE FÜR GEOMETRISCHE UND SEMANTISCHE INFORMATION AUS RASTERBASIERTEN TOPOGRAFISCHEN KARTEN ABHANDLUNG