20
Dialektologie HSK 1.1

HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

DialektologieHSK 1.1

Page 2: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

Handbücher zurSprach- und Kommunikationswissenschaft Herausgegeben von Gerold Ungeheuer und Herbert Ernst Wiegand

Band 1.1

Walter de Gruyter · Berlin · New York1982

Page 3: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

DialektologieEin Handbuch zur deutschenund allgemeinen Dialektforschung

Herausgegeben vonWerner Besch · Ulrich KnoopWolfgang Putschke · Herbert Ernst Wiegand

Erster Halbband

Walter de Gruyter · Berlin · New York1989

Page 4: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

CIP-Kurztitelaufnahme der Deutschen Bibliothek

Handbücher zur Sprach- und Kommunikations-wissenschaft / hrsg. von Gerold Ungeheuer u.Herbert Ernst Wiegand. — Berlin; New York:de GruyterNE: Ungeheuer, Gerold [Hrsg.]Bd. 1. — Dialektologie

Dialektologie: e. Handbuch zur dt. u. allg. Dia-lektforschung / hrsg. von Werner Besch ... —Berlin; New York: de Gruyter

(Handbücher zur Sprach- und Kommunika-tionswissenschaft; Bd. 1)

NE: Besch, Werner [Hrsg.]Halbbd. 1 (1982).

ISBN 3—11—005977—0

© Copyright 1982 by Walter de Gruyter & Co., vormals G. J. Göschen'sche Verlagshandlung — J. Guttenberg,Verlagsbuchhandlung — Georg Reimer — Karl J. Trübner — Veit & Comp., Berlin 30. Printed in GermanyAlle Rechte des Nachdrucks, der photomechanischen Wiedergabe, der Herstellung von Photokopien — auchauszugsweise — vorbehalten.Satz und Druck: H. Heenemann GmbH & Co, BerlinBindearbeiten: Lüderitz & Bauer, Berlin

Page 5: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

778 VII. Computative Arbeitsverfahren in der Dialektologie

Viereck 1980 = Wolfgang Viereck: Dialektometrieund englische Dialektologie. In: Grazer Linguisti-sche Studien 11/12. 1980, 335—356.Vorwerk 1977 = Erich Vorwerk: Untersuchungenüber die Ähnlichkeit von Zeichenketten in großenDatenbeständen. In: Bericht Nr. 114 der Gesell-schaft für Mathematik und Datenverarbeitung.1977.Weinreich 1964 = Uriel Weinreich: Machine aidsin the compilation of linguistic atlases. In: Ameri-can Philosophical Society. Year Book 1963. Phila-delphia 1964, 622—625.Westerhoff 1977 = Wilfried Westerhoff: Zur Be-handlung von Mehrfachmeldungen in der Auto-matischen Wortkartographie. In: GermanistischeLinguistik 3—4/77, 211—224.Westerhoff 1979 = Wilfried Westerhoff: Ein Pro-grammpaket zur automatischen Erzeugungsprachgeographischer Karten. Münster 1979.Schriftenreihe des Rechenzentrums der Universi-tät Münster Nr. 39.Wood 1969 = Gordon R. Wood: Dialectology bycomputer. International Conference on Compu-tational Linguistics. Preprint No. 19. Stockholm1969.Wood 1972 = Gordon R. Wood: The computer inanalysis and plotting. In: American Speech 47.1972, 195—202.

Wolfgang Putschke, Robert Neumann,Marburg

Tokugawa/Yamamoto 1967 = Munemasa Toku-gawa/Takeshi Yamamoto: An attempt to draw alinguistic map with a computer. In: MathematicalLinguistics 40. 1967, 27—30.Tollenaere 1969 = F. de Tollenaere: Automationund Mundartforschung. In: Korrespondenzblattdes Vereins für niederdeutsche Sprachforschung76. 1969, 57—59.Uskup/Al-Azzawi 1972 = Frances Land Uskup/Mary Lee Al-Azzawi: Editing and printing a dia-lect atlas by computer. In: American Speech 47.1972, 203—210.Vasilyev 1979 = A. S. Vasilyev: Algorithm for ma-chine reading of normalized demographic maps.In: M. Remmel (Hrsg.): Symposium. Mathemati-cal Processing of Cartographic Data (Tallinn, De-cember 18—19, 1979). Summaries. Tallinn 1979,93—97.Veith 1970 = Werner Veith: [— explikative,+ applikative, + komputative] Dialektkartogra-phie. Ihre wissenschaftlichen Voraussetzungenund Möglichkeiten auf der Grundlage der kontra-stivtransformationellen Methode und der automa-tischen Datenverarbeitung. (= GermanistischeLinguistik 4. 1970).Veith 1977 = Werner H. Veith: Probleme der Da-tenauswahl für phonologische Dialektatlanten.Unter besonderer Berücksichtigung des DeutschenSprachatlas. In: Germanistische Linguistik3—4/77, 137—144.

45. Ansätze zu einer computativen Dialektometrie

Probleme der empirischen Sozialforschung(vgl. dazu etwa König 1974), an andere -me-trien wie etwa die Biometrie (Cavalli-Sfor-za/Lorenz 1972), die Statistik im weitestenSinn (Schaich 1977) und die quantitativ ar-beitende Geographie (Bahrenberg/Giese1975, Cole/King 1968, Haggett 1973, Ham-mond/McCullagh 1974) kommt. In diesemSinn als ‘dialektometrisch’ anzusprechendeArbeiten liegen vor von Goebl (1976, 1977,1978 a, b; 1979 a, 1980) und von Séguy(1971, 1973 a, 1973 b).

Es darf wohl mit Recht behauptet wer-den, daß sämtliche bislang in allen Teilphi-lologien vorliegenden Sprachatlanten, dieausgezeichnete empirische Datenbasen dar-stellen, in bezug auf die ihnen innewohnen-de Datenstruktur noch unzulänglich bekanntsind (‘Datenfriedhöfe’). Dies deshalb, weil eserst seit der verallgemeinerten Verwendungder EDV möglich geworden ist, die Sprach-

1. Problemstellung2. Meßansatz3. Q-analytische Meßmomente4. R-analytische Meßmomente5. Literatur (in Auswahl)

1. ProblemstellungWort und Sache sind überaus rezent und ge-hen auf den Tolosaner Romanisten J. Séguy(1973 a, 1) zurück. Demnach ist die Dialekto-metrie im vollsten Wortsinn in statu nascen-di und vorderhand mehr Programm als eta-blierte Realität. Die in der Folge gezeigtenAnsätze (Séguy verwendet noch keine EDV)weisen die Dialektometrie als eine quantifi-zierend arbeitende Sprachgeographie aus(vgl. Art. 38), wobei es methodologisch zustarken Anlehnungen an die numerische Ta-xonomie (Taxometrie) (Sneath/Sokal 1973,Sodeur 1974, Vogel 1975), an allgemeine

Page 6: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

45.  Ansätze zu einer computativen Dialektometrie 779

lektometers jene Datenmenge herausgeschältwerden, die aus disjunkten Einheiten be-steht, die ihrerseits sich direkt in die Zellender Meßmatrix einfüllen lassen (datum taxa-tum > Taxat). Dieser vom Taxandum zumTaxat fortgeführte Taxierungsprozeß erfor-dert noch viel tiefgreifendere datenreduktio-nistische Eingriffe vonseiten des Dialekto-meters, als dies bei der Auswahl des Taxan-dums der Fall war. Beispiel: Gegeben sei eine‘Sprachatlaskarte’ mit 3 Atlaspunkten zumKonzept ‘Bruder’ (frei nach AIS I 13):Punkt 1: fradęl, Punkt 2: frar, Punkt 3: fra-tęllo. Soweit das Taxandum. Wie daraus diefür die Matrizenbeschickung geeigneten Ta-xate ableiten? Der Dialektometer kann da-bei auf die grammatischen Kategorien Pho-netik, Morphologie, Syntax und Lexikon zu-rückgreifen und die Taxanda wahlweise alsTräger phonetischer, morphologischer, etc.Eigenschaften auffassen. Fradęl, fratęllo(< lat. FRATĚLLU) und frar (< lat. FRǍ-TRE) zeigen als gemeinsame phonetische Ei-genschaft die Erhaltung von lateinischFRA-, stellen also insofern identische Taxatedar, wenn man dabei von der verschiedenenAkzentstruktur absieht. Aber derartige auto-ritativ gesetzte, also nach eigenem Dafürhal-ten vorzunehmende Analyseeinschränkun-gen sind einfach unvermeidbar. Ein entspre-chender Matrizeneintrag (vgl. Abb. 45.1)würde eine identisch besetzte Zeile ergeben.Alle drei Atlaspunkte tragen das gleiche no-minale Taxat, etwa a. Eine andere Möglich-keit bestünde darin, unter Ausnützung derallgemeinen Kenntnisse der diachronen Ent-wicklung der romanischen Sprachen die Ta-xanda fradęl und fratęllo als Nachfolgefor-men von FRATĚLLU einerseits und das Ta-xandum frar als Nachfolgeform von FRǍ-TRE andererseits als je ein Taxat zu betrach-ten und somit zu einem Matrizeneintrag mitzwei nominalen Taxaten (etwa a und b) proZeile zu gelangen. Der Dialektometer kannderartige Analysen kategoriell getrennt vor-nehmen (also etwa nur phonetische Analy-sen durchführen), aber auch seine Meßma-trix mit Taxaten verschiedener grammati-scher Kategorien beschicken. — Die beidenBeispielsanalysen zeigen zudem deutlich,daß man aus einer Sprachatlaskarte durchentsprechende Taxierung mehrere Arbeits-karten ziehen kann. Dabei wird klar, daß derTaxierungsprozeß von forschungsautoritati-ven Direktiven gesteuert wird, die als Zu-satzinformation mit dem ursprünglichen In-formationsgehalt des Taxandums additivund subtraktiv interferieren. Hier werden

atlasdaten in kumulativer Synopse zu be-trachten. Allerdings ist diese neu eröffneteMöglichkeit zur Synthese ein überaus ar-beits- und methodenaufwendiger For-schungskomplex.

2. MeßansatzSprachatlanten lassen sich ihrem Aufbaunach als zweidimensionale Matrizen darstel-len: Atlaspunkte mal Atlaskarten (vgl. Abb.45.1 und 45.2). Üblicherweise müssen die zurVermessung anstehenden empirischen Roh-daten in eine derartige Matrix ‘eingefüllt’werden, um so in der für die Verrechnungnotwendigen Ordnung zur Verfügung zu ste-hen. Zu diesem Vorgang einige terminologi-sche und sachliche Klarstellungen.

2.1. Taxandum vs. Taxat

2.1.1. TaxandumDie erste Überlegung des Dialektometers zuArbeitsbeginn hat den zu klassifizierenden(data taxanda) empirischen Rohdaten zu gel-ten. Welchen Objektbereich, welchenSprachatlas vermessen? Das gesamte Punk-tenetz über alle Atlaskarten hinweg oder nurüber jeweils Teilbereiche davon? Notge-drungenermaßen werden derartige Überle-gungen weniger objektbezogen (mit Blickauf die Qualität der Rohdaten) als vielmehrmethoden- und arbeitsaufwandbezogen er-folgen. Dies muß man unbedingt bedenken,um bei der Interpretation der dialektometri-schen Resultate nicht in zu weitgehende Ge-neralisierungen zu verfallen. Man sollte ei-nen praktikablen Kompromiß aus möglichstviel Atlaspunkten (mehr als 100) und Atlas-karten (mehr als 200) schließen, dabei abernie vergessen, daß die Bedingungen des Zu-standekommens dieses Kompromisses kei-neswegs als aleatorisch gesteuerte Auswahl-verfahren interpretiert werden können, wiesie etwa aus der empirischen Sozialfor-schung bekannt sind (vgl. Scheuch 1974).Die Wahl des Taxandums befrachtet den zuvermessenden Objektbereich unweigerlichmit einer aus dem Wissensstand des Dialek-tometers einfließenden Information, die zu-dem selbst kaum meßbar ist (Problem derReliabilität und der Repräsentativität; vgl.dazu Altmann/Lehfeldt 1973, 71 f.).

2.1.2. TaxatAus dem Taxandum muß unter Fortführungdes Taxierungsprozesses vonseiten des Dia-

Page 7: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

780 VII. Computative Arbeitsverfahren in der Dialektologie

2.3. MeßmatrixDiese besteht aus einem durch die Atlas-punkte (= zeilenweise) und die Atlaskarten(= spaltenweise) aufgespannten Merkmals-raum. Taxometrischer Terminologie zufolge(Sodeur 1974, 9) spricht man auch von Ele-menten oder Objekten (= Atlaspunkte) undvon Merkmalen oder Variablen (= Atlas-/Arbeitskarten). Wenn man qualitativ beur-teilte Daten zum Zweck der taxometrischenVerdichtung in eine Matrix einsortiert, er-folgt damit der erste quantifizierende Schritt.Es erhebt sich dabei das meßtheoretischeProblem, ob die Relationen der qualitativaussortierten Taxate zueinander (empiri-sches Relativ) adäquat durch Relationen vonZahlen (numerisches Relativ) wiedergegebenwerden, die diesen Taxaten zugeordnet wer-den. Es geht um die „homomorphe Abbil-dung eines empirischen Relativs in ein nu-merisches„ (Orth 1974, 17). Dabei ist zu ent-scheiden, welche numerischen Eigenschaftenden Taxaten zuerkannt werden können. Esentsteht das Problem der Wahl der Meßskala(vgl. Cicourel 1970, Orth 1974, 26 f.; Schaich1977, 4; Scheuch/Zehnpfennig 1974). Vonden vier meistgenannten Meßskalen (Nomi-nal-, Ordinal-, Intervall-, Verhältnisskala)kommen hierfür die Nominal- und die Inter-vallskala in Frage.

2.3.1. Meßmatrix auf Nominalskalenniveau

Abb. 45.1: Meßmatrix auf Nominalskalenniveau(erfundener Datensatz)

Die Taxate werden als Träger einer Eigen-schaft mit der Ausprägung ‘voneinander ver-schieden’ betrachtet. Sie sind sozusagen Trä-ger verschiedener Namen (nomina), hier re-präsentiert durch verschiedene Buchstaben.Aber auch Zahlen/Ziffern wären dafür ver-wendbar. Es handelt sich bei der Nominal-skala um die am wenigsten eindeutige undzugleich meßtheoretisch niedrigste Skala. —Zu beachten ist noch der Eintrag eines feh-

kommende Dialektometer genauso, wie diesin anderen empirischen Sozialwissenschaf-ten geschehen ist (Cartwright 1953), im inter-subjektiven Dialog versuchen müssen, we-nigstens innerhalb des Rahmens ihrer jewei-ligen Teilphilologie zu einer möglichst gros-sen ‘Objektivität’ bei der Taxierung zu gelan-gen: „Perhaps the foremost challenge is thedevelopment of a generally acceptable sys-tem for coding and scaling characters.”(Sneath/Sokal 1973, 427). Die TerminologieTaxandum-Taxat wurde nach einem bei En-gelien (1971, 12) referierten Vorschlag ge-prägt.

2.2. Gleichgewichtung oder Ungleichge-wichtung der Taxate: zum Problemdes Adansonismus

Bei der Erstellung biologischer Klassifikatio-nen wurde vom französischen Botaniker Mi-chel Adanson (1727—1806) erstmals explizitdas Prinzip aufgestellt, daß alle an den zuklassifizierenden Objekten beobachtbarenMerkmale gleich zu gewichten seien (vgl.Sneath/Sokal 1973, 5; Sodeur 1974, 42 f.;Vogel 1975, 57 f.). Dieses Prinzip wurde undwird zwar bis heute mehrheitlich befolgt (vorallem bei den numerischen Taxonomen), istaber im Grunde doch kontrovers geblieben.So könnte man sich rechtens fragen, ob imFalle der Dialektometrie nicht phonetischrelevante Taxate innerhalb der Meßmatrixhöher zu gewichten seien als etwa lexikaleTaxate. Innerhalb der Sprachwissenschaftfehlt es diesbezüglich ja nicht an z. T. höchstdivergierenden Meinungen, denen zufolgeetwa „Wörter leicht wandern„ (= geringestypologisches Gewicht des Lexikons), die„Dialektsyntax kaum landschaftliche Va-rianten zeige„ (= geringe Bedeutung derSyntax für typlogische Abgrenzungen), aberdie „Phonetik überaus stabile Raumkamme-rungen ergebe„ (= hohes typologisches Ge-wicht der Phonetik). Der hier verwendetedialektometrische Ansatz arbeitet mit demPrinzip der Gleichgewichtung, ist also adan-sonistisch und folgt damit dem in Taxome-trie und Biologie mehrheitlich etabliertenBrauch. Im übrigen sind mit gleichgewichte-ten Taxaten besetzte Meßmatrizen statistischeinfacher zu behandeln und daher für eineNeudisziplin vorzuziehen. Inwieweit aberverschiedene grammatische Kategorien ty-pologisch (unter ansonsten gleichen Meßbe-dingungen) unterschiedliche Meßerträge lie-fern, müßte durch entsprechende dialekto-metrische Untersuchungen geklärt werden.

Page 8: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

45.  Ansätze zu einer computativen Dialektometrie 781

98). Gemäß den allgemeinen Postulatender Sprachgeographie, die die Verteilungsprachlicher Phänomene im Raum, also überverschiedene Sprachatlaspunkte hinweg, un-tersucht, betreibt die Dialektometrie über-wiegend Q-Analyse.

3. Q-analytische Meßmomente

3.1. Identitätstest (Berechnung des Relati-ven Identitätswerts — RIW; vgl. dieKarten 45.1 und 45.2)

Auszugehen ist von der Nominalmatrix (vgl.Abb. 45.1). Ein Atlaspunkt wird als Prüfbe-zugspunkt vorgewählt. Von diesem sind zuden restlichen Atlaspunkten Paarvergleichedurchzuführen, wobei jedesmal ein vorherfestzulegender Ähnlichkeitskoeffizient zurVerrechnung kommt. Bei n Atlaspunktenkönnen also n—l Paarvergleiche durchge-führt werden. Der hier vorgestellte Ähnlich-keitskoeffizient ist der einfachst mögliche(entspricht dem „simple matching coeffi-cient”; vgl. Vogel 1975, 95 f.) und beruht aufder Division der Anzahl der taxatgleichen(Ix, y) durch die Anzahl der insgesamt vergli-chenen (Ux, y) Matrizenzellen mit anschlies-sender Prozentuierung:

Einsetzbeispiel nach Abb. 45.1: RIW1, 2: (a, f,i/b, f, i): 2/3.100 = 66,6%; RIW1, 3: (a, f, i/c, g, i): 1/3.100 = 33,3%. Die Anwendunganderer Ähnlichkeitskoeffizienten ist mög-lich und ist bei hybriden und/oder kleinerenDatensätzen (Cowan 1964, Ellegård 1959,Houck 1967, Reed/Spicer 1952) oder beisprachtypologischen Versuchen (Kroeber/Chrétien 1937, Muljačić 1967) schon mehr-fach versucht worden. Neu ist allerdings diehier gezeigte Zusammenstellung aller durchpaarweise Anwendung eines Ähnlichkeits-koeffizienten ermittelten Ähnlichkeitswertezu einer empirischen Häufigkeitsverteilung,deren Weiterverarbeitung in Form einer sta-tistischen Wertkarte (vgl. Karte 45.2) und dieanschließende kartographische Behandlungnach dem Choroplethenprinzip (vgl. Karte45.1). In weiterer Zukunft müßten nun dieverschiedensten Ähnlichkeitskoeffizientenan verschiedenen Datensätzen ausprobiertwerden, um deren Tauglichkeit für dialekto-metrische Untersuchungen zu prüfen (vgl. et-wa Altmann 1978).

lenden Datums, womit schematisch auf ei-nen für die Dialektometrie zwar unangeneh-men, aber praktisch kaum vermeidbarenSachverhalt hingewiesen wird, nämlich je-nen fehlender Daten in Sprachatlanten (vgl.3.1., 3.1.2. und Vogel 1975, 77 f.).

2.3.2. Meßmatrix auf Intervallskalenniveau

Abb. 45.2: Meßmatrix auf Intervallskalenniveau(abgeleitet aus Abb. 45.1).

Jedes Taxat wird als Träger der Eigenschaft‘Raumanteil’ (meßbar in Atlaspunkten) be-trachtet, wobei dieser Raumanteil numerischverschieden stark ausgeprägt sein kann. Un-ter dieser Voraussetzung kann die Nominal-matrix (vgl. Abb. 45.1) in eine metrische Ma-trix (auf Intervallskalenniveau) transformiertwerden (vgl. Abb. 45.2). Man beachte, daßdabei die Raumanteilswerte (in Atlaskarte 1:1; in Atlaskarte 2: 2 bzw. 1; in Atlaskar-te 3: 5) zeilenweise relativiert werden, umsolcherart den Nullstelleneffekt wenigstensteilweise aufzufangen. Intervallskalen sinddefiniert durch eine klar erkennbare Rang-ordnung von Meßwerten (hier: 1/5, 1/4,2/4, 5/5) und durch Invarianz der Intervallezwischen den Meßwerten (hier: natürlicheZahlen). Diese Transformation hat zur Vor-aussetzung, daß wir aus sprachgeographi-scher Sicht und Vorkenntnis bereit sind, denAtlaspunkten die meßbare Größe ‘Rauman-teil’ als sprachwissenschaftlich relevantesMerkmal zuzuerkennen.

2.4. Q-Analyse vs. R-AnalyseMan spricht im Fall der Analyse von Zusam-menhängen zwischen Elementen (hier vonAtlaspunkten) üblicherweise von einer Q-Analyse, im Falle der Analyse von Zusam-menhängen zwischen Merkmalen (hier vonAtlas-/Arbeitskarten) von einer R-Analyse(Sneath/Sokal 1973, 114 f.; Sodeur 1974,

Page 9: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

782 VII. Computative Arbeitsverfahren in der Dialektologie

Konkret geschieht dies so, daß charakteristi-sche Kennwerte der Häufigkeitsverteilungbestimmt werden: Minimalwert, Mittelwert,Maximalwert (daneben auch Standardab-weichung und Median). Dann wird die ge-wünschte Intervallanzahl festgelegt. UnterBerücksichtigung sehpsychologischer, ar-beitspraktischer und numerischer Gründefiel die Entscheidung hier auf 6 (bzw. 12) In-tervalle. Es folgt die Festlegung der anzu-wendenden Intervallalgorithmen. Es sind diesin dem Beispiel 3 Stück (MINMWMAX,MEDMW, MED), wobei im Fall des Inter-vallalgorithmus MINMWMAX (vgl. denKopf der Karte 45.2) die Spannen zwischenMittelwert und Minimalwert und zwischenMaximalwert und Mittelwert jeweils gedrit-telt (für Sechsfachintervallisierung), bzw. ge-sechstelt (für Zwölffachintervallisierung)werden. Im Falle einer Sechsfachinterval-leinteilung ergeben sich 7 Intervalleckwerte,die am Kopf der Karte 45.2, ZeileMINMWMAX, vermerkt sind. Der einge-rückt darunterliegende, nur ganze Zahlenenthaltende dreizeilige Ausdruckblock gibtan, wieviele Meßpunkte die einzelnen Inter-valle enthalten. Im Falle von MINMWMAX(sechsfach) sind das bei Intervall 1 11 + 3 =14 Meßpunkte, bei Intervall 2 7 + 1 = 8Meßpunkte, etc. Anhand dieser Angabenläßt sich (etwa nach dem bei Schaich1977, 17—19 vermerkten Vorgang) das die-ser Häufigkeitsverteilung entsprechendeSäulendiagramm (Histogramm) erstellen. —Die Entscheidung zwischen mehreren Inter-vallalgorithmen muß autoritativ getroffenwerden und ist somit Teil des gesamten taxo-nomischen Prozesses. Doch wird man dabeiso verfahren, daß die algorithmisch ermittel-ten Raumtypen den aus der klassischenSprachgeographie bekannten Dialekträumenmöglichst angenähert werden. (Zur Technikder statistischen Intervalleinteilung sieheDickinson 1973, 82 f.; Jenks/Caspall 1971,Jenks/Coulson 1963, Kishimoto 1972; Pud-latz 1976, 16 f. Zur Erklärung der in Karte45.2 neben MINMWMAX verwendeten In-tervallalgorithmen MEDMW und MED vgl.Goebl 1978 a, 346 f.)

3.1.4. Romanistische Interpretation vonKarte 45.1

Die Intervalle 6 und 5 geben das nähere pie-montesische Umfeld von Punkt 172 wieder.Intervall 4 zeigt die Hauptvernetzungsrich-tung der Dialektizität von Punkt 172 in dasNordwest- und Südostlombardische, sowie— gegen Westen — in das Gebiet des Alpin-

3.1.1. Oberitalienischer Datensatz (vgl. dieKarten 45.1 und 45.2)

Maximale Matrixmaße: 251 Meßpunkte mal696 Arbeitskarten (gezogen aus AIS Bd. I,II, IV). Von den 251 Meßpunkten entspre-chen 247 originalen AIS-Atlaspunkten (zu-gleich die Nordhälfte des gesamten AIS-Punktfeldes von insgesamt 405 Atlaspunk-ten); 4 Stück sind als ‘Kunstpunkte’ zusätz-lich eingesteuert worden (neben Punkt 999= Hochitalienisch die Punkte 154, 262, 524).Die Meßmatrix ist mit 4836 nach lexikalen,morphologischen und syntaktischen Krite-rien isolierten Taxaten besetzt. Vom Prüfbe-zugspunkt 172 aus (im südlichen Piemont ge-legen; vgl. Jaberg/Jud 1928, 59) könnennulleintragsbedingt nur 693 (von insgesamt696 verkodeten) Arbeitskarten verrechnetwerden.

3.1.2. Kartographisches Beispiel (Karte 45.2,links unten)

Paarvergleich 172 → 176.172 693 176 691100.000 80.0297—, G—, 7— 5+, F+, 6+Der Ausdruckblock bei Punkt 176 ist wiefolgt zu interpretieren: „Von 693 vergleich-baren Arbeitskarten (bei Punkt 172 und amKopf von Karte 45.2 vermerkt) sind 691auch im Meßpunkt 176 nulleintragsfrei. Da-von sind 80,029% (= 553 Stück) in der Prüf-gabel zwischen dem Prüfbezugspunkt 172und dem verglichenen Punkt 176 nominalidentisch.„ Die letzte Zeile des Ausdruck-blocks gibt die Intervallzugehörigkeit (vgl.3.1.3.) an. Punkt 176 gehört gemäß Intervall-algorithmus MINMWMAX zum Intervall5 + .

3.1.3. IntervallalgorithmusEine statistische Wertkarte und die darinenthaltene empirische Häufigkeitsverteilungführen allein noch nicht zu jener erwünsch-ten Informationsverdichtung, bzw. Raumty-pisierung. Das kann erst durch Erstellung ei-ner Choroplethenkarte (oder einer anderenanschaulichen Darstellungsform; vgl. Arn-berger 1977) geschehen. Damit wird eine vi-suelle Typisierung durchgeführt und man ge-langt — je nach Art des dabei verwendetenTypisierungsverfahrens — zu einem abge-stuften empirischen Typusbegriff (bezogenauf ‘Dialekte, Sprachlandschaften’, etc.) imSinne von Hempel/Oppenheim (1936). —

Page 10: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

45.  Ansätze zu einer computativen Dialektometrie 783

Karte 45.1: Identitätsprofil zum Prüfbezugspunkt 172 (Villafalletto, Provinz Cuneo) anhand von 693 Ar-beitskarten nach AIS; zum numerischen Ertrag vgl. Karte 45.2 und 3.1. — Erstellung der Graurasterkarte(Choroplethenkarte MINMWMAX 6fach): anhand Intervallalgorithmus MINMWMAX 6fach (vgl. 3.1.2.)— Erstellung des Stabdiagramms (Häufigkeitsverteilung MINMWMAX 12fach): anhand Intervallalgo-rithmus MINMWMAX 12fach, entspricht Halbierung von MINMWMAX 6fach; Rechen- und Darstel-

lungsmodus nach Schaich 1977, 17—19. Elektronische Kartographie: W.-D. Rase, Bonnschen Graubündens (wobei sich das Engadinals typologisch ‘weicheres’ Gebiet gegenüberWest- und Mittelbünden abhebt) und Südti-rols (Punkt 305), dem Friaulischen, dem Ve-nezianischen und dem Toskanischen. Derar-tige punktbezogene Identitätskarten erlau-ben es, gewisse traditionelle Fragestellungender Sprachgeographie („Die Stellung desDialekts von X zwischen Y und Z„) in neu-em Licht zu sehen.

provenzalischen (Meßpunkte 170, 160, 152,150). Vereinzelte Meßpunkte in Intervall 4(v. a. im venezianischen Raum) verdankenihren atypisch hohen RI-Wert den in ihrenMerkmalsvektoren allzu häufigen Nullein-trägen. Unterdurchschnittliche Ähnlichkei-ten (Intervalle 3,2,1) existieren gegenüberdem Frankoprovenzalischen des Aostatals,gegenüber gewissen Teilen des Alpinproven-zalischen (Punkt 140), dem Rätoromani-

Page 11: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

784 VII. Computative Arbeitsverfahren in der Dialektologie

tel, Median; der Streuung: Standardabwei-chung, Quantilabstände, etc.; der Symme-trie: Schiefe) besitzt, liegt es nahe, Synopsendieser jeweils n Parameter zu erstellen. Be-sonders anschauliche Resultate liefern dieSynopsen der Maximalwerte (zeigt Dialekt-kerne), der Standardabweichungen (zeigtüberaus deutlich den identitätsspezifischenDurchmischungsgrad eines Untersuchungs-gebiets, wobei sich zentrale und periphereDialektstände graduell entflechten), derSchiefe und eines Quotienten aus Maximal-wert und arithmetischem Mittel (MAX/)(ergibt eine in beiden Fällen ‘automatische’Dialektgruppierung: systemzentrale Zonenhaben niedere, systemperiphere Rand- undEinschlußgebiete hohe Meßwerte. Die taxo-metrische Wertigkeit der Schiefe ist dabeidurch das Zusammenwirken von Vorzei-chenvariation — positive vs. negative Schie-fewerte — und Meßwertausprägung beson-ders hoch.). Aus Karte 45.3 ist die gute Ver-

3.1.5. Heuristik der IdentitätskartenPrinzipiell sollen ebenso viele Identitätskar-ten errechnet werden, wie die Meßmatrix At-laspunkte enthält. Wenn die vom Dialekto-meter unterhaltene kartographische Infra-struktur es erlaubt, können durch sukzessiveVorführung (mittels Trickfilmtechnik, Über-blendprojektion, etc.; vgl. Goebl 1978 a,335 f.) einander eng benachbarter Identitäts-profile sehr anschauliche Fließbildeffekte er-zielt werden, die für den akademischen Un-terricht und die wissenschaftliche Hypothe-senbildung überaus ertragreich sind.

3.1.6. Fortführung des IdentitätstestsDa bei n Meßpunkten n Identitätsverteilun-gen ermittelt werden können, von denen je-de spezifische charakteristische Parameter(der Lage: Extremwerte, arithmetisches Mit-

Karte 45.3: Digitales Geländemodell einer numerischen Synopse von 251 Schiefewerten (Korpus wie bei Karte 45.1; vgl. 3.1.6. und 3.1.7.). Zu den 251 Identitätsverteilungen (zu je 250 Ähnlichkeitswerten -RIW) der (aus der Meß- oder Datenmatrix mittels Ähnlichkeitsmessung abgeleiteten; vgl. 3.1.) Ähnlichkeitsmatrix (vgl. 3.1.7.) wurden 251 Schiefen (Formel nach Bahrenberg/Giese 1975, 54) errechnet und computerkarto- graphisch zu einer geglätteten statistischen Oberfläche synthetisiert (Betrachtung aus Südwesten unter einem Winkel von 45°). Elektronische Kartographie: W.-D. Rase, Bonn

Page 12: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

Karte 45.2: Relative Identitätswerte (RIW) zum Prüfbezugspunkt 172 (Villafalletto,Provintz Cuneo) anhand von 693 Arbeitskarten nach AIS (vgl. 3.3. und Karte 45.1)

Page 13: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

45.  Ansätze zu einer computativen Dialektometrie 785

freuende multivariate Analyseverfahren ver-sucht, Elemente (hier: Atlaspunkte), die sichuntereinander bezüglich eines Ähnlichkeits-oder Distanzmaßes (hier: RI-Wert) unter-scheiden, in Klassen (Cluster, Gruppen,Haufen) so einzuteilen, daß die einer Klassezugeteilten Elemente voneinander wenigerdifferieren als gegenüber ‘außen’ (d. h. ge-genüber Elementen, die außerhalb der Klas-se liegen oder gegenüber anderen Klassen).Aus der großen Vielfalt der derzeit verwen-deten clusteranalytischen Verfahren (vgl.Anderberg 1973, Bock 1974, Späth 1975, Vo-gel 1975) eignen sich die hierarchisch-agglo-merativen Verfahren (Anderberg 1973,132 f.; Bock 1974, 383 f.; Späth 1975, 162 f.;Vogel 1975, 249 f.) besonders gut für dialek-tometrische Klassifikationsaufgaben (Karten45.4 und 45.5). Üblicherweise starten dieseVerfahren den Prozeß der Klassenbildungmit n zunächst unverbunden dastehendenElementen (hier mit 71 Atlaspunkten). Dannfolgt der erste Klassifizierungsschritt, dessenZiel und Ergebnis die Verschmelzung jenerbeiden Elemente zu einem Elementenpaar(Cluster Nr. 1) ist, die einander in bezug aufdas verwendete Ähnlichkeitsmaß am ähn-lichsten sind. Als Resultat dieser Fusion wirddie Anzahl der für den zweiten Klassifizie-rungsschritt verbleibenden Elemente zu-nächst um 2 verringert, dann aber nach er-folgter Verschmelzung dieser zwei Elementezu einem Cluster um den einen neugebilde-ten Cluster vermehrt, so daß de facto für denzweiten Klassifikationsschritt n — 2 + 1 =n — 1 Elemente und/oder Cluster verblei-ben. Es sind insgesamt n — 1 Klassifika-tionsschritte möglich (hier 70), deren Resul-tat eine in Dendrogrammform ausgegebeneClusterhierarchie ist. Jeder Cluster liegt aufeinem genau festgelegten Wertniveau. —Auf Karte 45.4 sind von den 70 berechnetenWertniveaus platzbedingt nur 2 auf dreiKommastellen genau und 4 auf ganze Zah-len gerundet angeführt. Die quantitativenModalitäten der n — 1 Fusionen werdendurch bestimmte vorgegebene numerischeKriterien gesteuert (hier: complete linkage;vgl. Anderson 1973, 138 f.; Bock 1974,392 f.; Vogel 1975, 300 f.). Der Taxometerkommt dabei aber nicht um die Aufgabe her-um, bei der Verclusterung eines Datensatzesdiese numerischen Kriterien — die ja stetsdie Ergebnisse in eine bestimmte Richtunglenken — experimentell an seine persönl i-chen klassifikatorischen Erwartungen anzu-passen. — Das errechnete Dendrogramm(vgl. Karte 45.4) zeigt deutlich, daß sich die

wendbarkeit dieser Klassifikation mittelsSchiefe für die jetzt ein gutes Jahrhundert al-te Frage ersichtlich, ob das Frankoprovenza-lische, Alpinokzitanische, Bündnerromani-sche, Ladinische und Friaulische ‘italieni-sche Dialekte’ seien oder nicht. Die höchstenGebirgserhebungen (positive Schiefe) in die-sem Geländemodell entsprechen (im Uhrzei-gersinn) dem Alpinprovenzalischen, demFrankoprovenzalischen des Aostatales (unddiesem südlich vorgelagerter Täler) und demRätoromanischen Graubündens, Ladinienssowie (weniger deutlich ausgeprägt) Friauls.Damit sind jene Bereiche des AIS erfaßt, indenen aus der Sicht der klassischen romani-schen Sprachgeographie schon immer nicht-italienische Sprachstände angenommen wor-den waren. Demgegenüber sind die Meß-wertminima (kleinste negative Schiefen) imVerlauf des Apennins einerseits und parallelzur Etsch andererseits anzutreffen, woraussich eine eigenartige scherenförmige Gliede-rung des Zentrums dieses Untersuchungsge-bietes ergibt. Auf der Karte 45.3 sind diefraglichen Depressionen aus Gründen derBildsyntax weniger deutlich als die peripherenElevationensichtbar. Die genannten Ergebnis-se (vgl. dazu Goebl 1979 a, 163 f.) wurdenrein empirisch gefunden, woraus mit Popper(1973, 389) einmal mehr deutlich wird, daßder „Gang der Wissenschaft (...) im Probie-ren, Irrtum und Weiterprobieren„ besteht.

3.1.7. Symmetrische ÄhnlichkeitsmatrixMan kann eine symmetrische (i. e. quadrati-sche) Matrix erstellen, deren Seiten jeweilsaus den n Elementen (Meßpunkten) des Un-tersuchungsgebietes bestehen, so daß darinalle n Identitätskarten (vgl. 3.1.) enthaltensind und daher die RI-Werte aller Meßpunk-te zu allen anderen abgelesen werden kön-nen. Die Diagonale dieser quadratischenÄhnlichkeitsmatrix enthält den RI-Wert100%. Eine derartige Ähnlichkeitsmatrixkann unter Verwendung verschiedensterÄhnlichkeits-, Abstands- und Korrelations-maße gebildet werden. Einzige Vorausset-zung: das gewählte Maß sollte die Bedingun-gen einer Metrik erfüllen (Späth 1975, 11).Im Falle des RI-Werts trifft dies zu (vgl.Späth 1975, 15; Sodeur 1974, 77 f.). Diesesymmetrische Ähnlichkeitsmatrix ist Grund-lage der Clusteranalyse.

3.2. ClusteranalyseDieses sich heute großer Beliebtheit er-

Page 14: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

786 VII. Computative Arbeitsverfahren in der Dialektologie

Karte 45.4: Dendrogramm einer hierarchisch-agglomerativen Clusteranalyse (71 Atlaspunkte nach ALF)anhand RIW und 1468 Arbeitskarten nach ALF (vgl. 3.2.)

3.2.3. Romanistische Interpretation der Kar-ten 45.4 und 45.5

Der durch unser Prüffenster sichtbare TeilNordwestfrankreichs umfaßt herrschenderLehre zufolge das Westpikardische (Départe-ments Pas-de-Calais, Somme, Oise), dasNormandische (wozu die dialektal oft ex-trem liegenden anglonormandischen Inselngezählt werden), Anteile des Westfranzösi-schen (Départements Ille-et-Vilaine, Mayen-ne, Sarthe) und zentralfranzösische Varietä-ten (vor allem im SO). Diesem Vorwissenentspricht der clusteranalytische Befund wei-testgehend. — Der höchstrangige Clusterumfaßt (und trennt) die jeweils wohlsepa-rierten Einzugsgebiete des Westpikardischen(Fläche 1) und des Westfranzösisch-Nor-mandischen (Clusterast 2 auf Karte 45.4). Inweiterer Folge fallen die anglonormandi-schen Inseln (Fläche 3) und das Westfranzö-sische (Fläche 5) aus. Als wohlseparierteGruppen erscheinen ferner das Westnor-mandische (Flächen 11 und 12) und das Ost-normandische (Flächen 9 und 10), womit

70 Cluster zwanglos und de visu in hierar-chisch verschiedenrangige Großklassen zu-sammenfassen lassen. Das hier vorliegendeDendrogramm entspricht weitgehend der inder galloromanischen Dialektologie übli-chen Dialektklassifikation dieses Gebiets.

3.2.1. Nordwestfranzösischer Datensatz (vgl.die Karten 45.4—45.7)

Maximale Matrixmaße: 71 Meßpunkte mal1468 Arbeitskarten (gezogen aus ALFBd. I—IX). Von den 71 Meßpunkten ent-sprechen 70 originalen ALF-Atlaspunkten(zugleich ein kleiner Ausschnitt im NW desgesamten ALF-Punktefeldes von 639 Atlas-punkten); Punkt 999 gibt das Hochfranzösi-sche wieder. Die Meßmatrix ist mit 3959nach lexikalen, morphologischen und syn-taktischen Kriterien isolierten Taxaten be-setzt.

3.2.2. Symmetrische ÄhnlichkeitsmatrixDiese wurde nach den Prinzipien des Identi-tätstests (vgl. 3.1.) erstellt.

Page 15: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

45.  Ansätze zu einer computativen Dialektometrie 787

Karte 45.5: Kartographische Darstellung des clusteranalytischen Dendrogramms (vgl. Karte 45.4 und 3.2.)3.3.2. Intervallalgorithmus (Karte 45.6)Wie in 3.1.3. beschrieben (MINMWMAX).

3.3.3. Romanistische Interpretation vonKarte 45.6

Wiederum sind die dialektometrischen Meß-ergebnisse unter Rückgriff auf dialektologi-sches Vorwissen plausibel zu interpretieren.Man erkennt sofort, daß das Epizentrum desdurch den RKM erfaßten raumgreifendenDynamismus im SO, also um Paris liegt. Dievon dort ausgehende Kohärenztendenz ver-flacht gegen NW und bricht sich deutlich anden schon auf den Karten 45.4 und 45.5 alsextrem ausgewiesenen Dialektgebieten deranglonormandischen Inseln, des Westfran-zösischen und des Westpikardischen. Damitist ein innerhalb der nordfranzösischenSprachgeschichtsschreibung immer wie-der aufgegriffener Vorgang (Homogeni-sierung der galloromanischen Sprachland-schaften ab Paris) deutlich sichtbar gemachtworden.

durchaus plausible und grosso modo in die-ser Form akzeptable Ergebnisse geliefertwerden.

3.3. Kohärenztest (Berechnung des Relati-ven Kohärenzmittels — RKM; vgl.die Karten 45.6 und 45.7)

Auszugehen ist von der Meßmatrix auf In-tervallskalenniveau (vgl. Abb. 45.2). Ein At-laspunkt wird vorgewählt, das arithmetischeMittel der über ihm in der entsprechendenMatrizenspalte enthaltenen Meßwertserie er-mittelt und auf Prozente gebracht. Der Vor-gang wird für alle anderen Atlaspunkte wie-derholt und das Resultat in kartographischeSynopse gebracht. Beispiel: RKM1 = 100/3.(1/5 + 2/4 + 5/5) = 56,6%; RKM4 =100/2. (5/5 + 1/5) = 60%. Eine derartigeSynopse liegt in den Karten 45.6 und 45.7vor.

3.3.1. Datensatz (vgl. die Karten 45.6 und45.7)

Wie in 3.2.1. beschrieben.

Page 16: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

788 VII. Computative Arbeitsverfahren in der Dialektologie

Karte 45.6: Kohärenzprofil der Normandie anhand von 1468 Arbeitskarten nach ALF; zum numerischenErtrag vgl. Karte 45.7 und 3.3. — Erstellung der Graurasterkarte (Choroplethenkarte MINMWMAX6fach): anhand Intervallalgorithmus MINMWMAX 6fach (vgl. 3.1.2.) — Erstellung des Stabdiagramms(Häufigkeitsverteilung MINMWMAX 12fach): anhand Intervallalgorithmus MINMWMAX 12fach, ent-spricht Halbierung von MINMWMAX 6fach; Rechen- und Darstellungsmodus nach Schaich 1977, 17—19. Elektronische Kartographie: W.-D. Rase, Bonn

beschrieben) unter Einsatz korrelations- undregressionsanalytischer Verfahren (Schaich1977, 255 f.). Konkret bedeutet dies, daß(vgl. dazu die Abb. 45.1 und 45.2) im Paar-vergleich z. B. der Atlaspunkte 2 und 3 nichtdie nominalen Meßwertserien (b, f, i) und(c, g, i), sondern die metrischen Meßwertse-rien (1/5, 2/4, 5/5) und (1/5, 1/4, 5/5) ver-

3.4. Q-analytische Meßmomente anhandder Meßmatrix auf Intervallskalen-niveau

Der eigentliche Mehrwert der metrischenMeßmatrix gegenüber der nominalen bestehtin der Möglichkeit der Durchführung paar-weiser Atlaspunktvergleiche (wie unter 3.1.

Page 17: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

45.  Ansätze zu einer computativen Dialektometrie 789

Karte 45.7: Relative Kohärenzmittel (RKM) anhand von 1468 Arbeitskarten nach ALF (vgl. 3.3.)sprachlich gleich besetzt). Solcherart kanndas Isoglossenproblem computativ behandeltwerden. Zwar ist die rein rechentechnischeSeite dieses Problems einfach lösbar, dochergaben sich früher kartographische Schwie-rigkeiten bei der optisch ansprechenden Ge-staltung der Ergebnisse (vgl. dazu Guiter1973, Goebl 1979 b sowie neuerdings Goebl1981).

4. R-analytische MeßmomenteDarunter sind Klassifikationsprozeduren zuverstehen, die Ordnungsstrukturen entlangder von den Atlaskarten (Merkmalen) — vgl.die Abb. 45.1 und 45.2 und 2.4. — besetztenMatrizenseite entdecken sollen. Dazu beste-hen vorderhand erst rudimentäre dialekto-metrische Erfahrungen.

glichen werden und deren numerischer Zu-sammenhang durch einen entsprechendenKoeffizienten ausgedrückt wird. Noch liegendazu keine genuin ‘dialektometrisch’ durch-geführten Arbeiten vor, doch dürfte hier eineder Hauptentwicklungsrichtungen dieserjungen Disziplin vorliegen (vgl. Bock1974, 35 f.).

3.5. ZwischenpunkttestMan kann ein Atlaspunktfeld dreiecksartigvernetzen und jede solcherart gezogene Ver-bindungslinie in der Mitte mit einem Zwi-schenpunkt besetzen. Wenn das von diesemZwischenpunkt aus ‘überwachte’ Atlaspunk-tepaar sprachlich als verschieden einzustu-fende Taxate trägt, vermerkt der Zwischen-punkt pro Arbeitskarte den Wert 1, im ande-ren Fall 0 (d. h.: das Atlaspunktepaar ist

Page 18: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

790 VII. Computative Arbeitsverfahren in der Dialektologie

rend eine weitgehende Stabilisierung in denGliederungsdetails bei ca. 200 bis 300 Ar-beitskarten erfolgt. Diese Versuche wurdenanhand des nordwestfranzösischen Daten-satzes wiederholt und dabei bestätigt. — Ge-gebenenfalls kann auch — wie in 4.1. be-schrieben — eine korrelations- und anschlie-ßend clusteranalytische Untersuchung hierzudurchgeführt werden.

5. Literatur (in Auswahl)AIS: Sprach- und Sachatlas Italiens und der Süd-schweiz. Hrsg. v. Karl Jaberg. Jakob Jud. Bd. I—VIII. Zofingen 1928—1940.ALF: Atlas linguistique de la France. Hrsg. v. Ju-les Gilliéron. Edmond Edmont. Bd. I—IX. Paris1902—1910.Altmann 1978 = Gabriel Altmann: Zur Ähnlich-keitsmessung in der Dialektologie. In: Germani-stische Linguistik 3—4/77, 305—310.Altmann/Lehfeldt 1973 = Gabriel Altmann/Wer-ner Lehfeldt: Allgemeine Sprachtypologie. Prinzi-pien und Meßverfahren. München 1973.Anderberg 1973 = Michael R. Anderberg: Clusteranalysis for applications. New York. San Francis-co. London 1973.Arnberger 1977 = Erik Arnberger: ThematischeKartographie. Mit einer Kurzeinführung über Au-tomation in der thematischen Kartographie.Braunschweig 1977.Bahrenberg/Giese 1975 = Gerhard Bahrenberg/Ernst Giese: Statistische Methoden und ihre An-wendungen in der Geographie. Stuttgart 1975.Bock 1974 = Hans Hermann Bock: AutomatischeKlassifikation. Theoretische und praktische Me-thoden zur Gruppierung und Strukturierung vonDaten (Cluster-Analyse). Göttingen 1974.Cartwright 1953 = Darwin P. Cartwright: Analy-sis of qualitative material. In: Research methodsin the behavioral sciences. Hrsg. v. Leon Festin-ger. Daniel Katz. New York. Chicago. San Fran-cisco 1953. 2. unveränderte Auflage 1966,421—470.Cavalli-Sforza/Lorenz 1972 = Luigi Cavalli-Sfor-za: Biometrie. Grundzüge biologisch-medizini-scher Statistik. Bearb. v. Rolf J. Lorenz. 3. durch-gesehene Aufl. Stuttgart 1972.Cicourel 1970 = Aaron V. Cicourel: Methode undMessung in der Soziologie. Übers. v. Frigga Haug.Frankfurt am Main 1970.Cole/King 1968 = J. B. Cole/C. A. M. King:Quantitative geography. Techniques and theoriesin geography. London 1968.Cowan 1964 = H. K. J. Cowan: Old limburgianand the quantitative classification of west germa-nic dialects. In: Leuvense Bijdragen 53. 1964,1—21.

4.1. Das Problem der ‘semantischen Kate-gorien’

Sprachatlanten enthalten die Sprachkartenentweder in alphabetischer (Fall von ALF)oder in sachgruppenbezogener Ordnung(Fall von AIS). Man kann nun — eine ent-sprechende Indizierung vorausgesetzt — ge-wisse Q-analytische Meßmomente getrenntnach einzelnen Sachgruppen („semantischenKategorien„: z. B. Wortschatz des Familien-lebens, der Körperteile, von Handwerk undHandel, von Zahlen, Zeit und Raum, etc.)durchführen und die Resultate miteinanderde visu oder korrelations- bzw. regressions-analytisch vergleichen. In letzterem Fall er-gibt sich wiederum die Möglichkeit, einesymmetrische Korrelationsmatrix (n Sach-gruppen mal n Sachgruppen; jeweils auf derBasis eines Q-analytischen Meßmoments) zuerstellen und diese clusteranalytisch weiter-zuverarbeiten. — Bislang angestellte de visu-Vergleiche haben eine relative Invarianz in-nerhalb der verglichenen Sachgruppenkor-pora ergeben (Goebl 1976). Sollte man aller-dings das in 2.2. angesprochene Problem dertypologischen Valenz verschiedener gram-matischer Kategorien hypothesengestütztuntersuchen wollen, muß man darauf ach-ten, pro Subkorpus eine gewisse Mindest-anzahl von Arbeitskarten zur Verfügung zuhaben und andererseits auch die Mächtigkeitder verschiedenen Subkorpora einandermöglichst anzugleichen.

4.2. Das Problem der KorpusmächtigkeitAlle taxometrischen Handbücher enthaltenAngaben darüber, wieviele Merkmale manim Falle einer Q-Analyse mindestens be-rücksichtigen sollte, um zu verläßlichen Re-sultaten zu gelangen (Sneath/Sokal 1973,106 f.). Seltener jedoch wird darauf hinge-wiesen (Vogel 1975, 50 f.), daß dieses Pro-blem am ehesten dadurch untersucht werdenkann, daß man die Meßmatrix ausgehendvom Vollstand teilweise reduziert (Zufalls-prinzip beachten!) und dabei stets erneut dasgewählte Meßmoment anwendet. — Im Fal-le des oberitalienischen Datensatzes wurdenaus dem vollen Korpus (696 Arbeitskarten)nach dem Prinzip eines Urnenmodells mitZurücklegung (Schaich 1977, 76) und unterWahrung strenger Zufälligkeit bei der Aus-wahl Teilkorpora von 25, 50, 75, 100, 150,200, 300 und 450 Arbeitskarten gezogen undjeweils mit mehreren Meßmomenten ver-rechnet. Dabei zeigt sich, daß sich dieGrundzüge des Raumgliederungstypus be-reits bei 25 Arbeitskarten einstellen, wäh-

Page 19: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

45.  Ansätze zu einer computativen Dialektometrie 791

en Logik. Wissenschaftstheoretische Untersuchun-gen zur Konstitutionsforschung und Psychologie.Leiden 1936.Houck 1967 = Charles L. Houck: A computerizedstatistical methodology for linguistic geography: apilot study. In: Folia linguistica 1. 1967, 80—95.Jaberg/Jud 1928 = Karl Jaberg/Jakob Jud: DerSprachatlas als Forschungsinstrument. KritischeGrundlegung und Einführung in den Sprach- undSachatlas Italiens und der Südschweiz. Halle 1928.Jenks/Caspall 1971 = George F. Jenks/Fred C.Caspall: Error on choroplethic maps: definition,measurement, reduction. In: Annals of the asso-ciation of American geographers 61. 1971,217—244.Jenks/Coulson 1963 = George F. Jenks/MichaelR. C. Coulson: Class intervalls for statisticalmaps. In: Internationales Jahrbuch für Kartogra-phie 3. 1963, 119—134.Kishimoto 1972 = Haruko Kishimoto: Ein Beitragzur Klassenbildung in statistischer Kartographieunter besonderer Berücksichtigung der maschinel-len Herstellung von Choroplethenkarten. In: Kar-tographische Nachrichten 22. 1972, 224—239.König 1974 = René König (Hrsg.): Handbuch derempirischen Sozialforschung. Bd. III a. III b.3. Auflage. Stuttgart 1974.Kroeber/Chrétien 1937 = A. L. Kroeber/C. D.Chrétien: Quantitative classification of indo-euro-pean languages. In: Language 13. 1937, 83—103.Muljačić 1967 = Žarko Muljačić: Die Klassifika-tion der romanischen Sprachen. In: Romanisti-sches Jahrbuch 18. 1967, 23—37.Orth 1974 = Bernhard Orth: Einführung in dieTheorie des Messens. Stuttgart 1974.Popper 1973 = Karl Raimund Popper: ObjektiveErkenntnis. Ein evolutionärer Entwurf. Übers. v.Hermann Vetter. Hamburg 1973.Pudlatz 1976 = Hilmar Pudlatz: GEOMAP. EinFORTRAN-Programm zur Erzeugung von Cho-roplethen- und Isolinienkarten auf dem Schnell-drucker. Münster 1976 (Schriftenreihe des Re-chenzentrums der Universität Münster 16).Reed/Spicer 1952 = David W. Reed/John L. Spi-cer: Correlation methods of comparing idiolectsin a transition area. In: Language 28. 1952,348—359.Schaich 1977 = Eberhard Schaich: Schätz- undTestmethoden für Sozialwissenschaftler. München1977.Scheuch 1974 = Erwin K. Scheuch: Auswahlver-fahren in der Sozialforschung. In: Handbuch derempirischen Sozialforschung. Hrsg. v. René Kö-nig. Stuttgart 1974. Bd. III a, 1—96.Scheuch/Zehnpfennig 1974 = Erwin K. Scheuch/Helmut Zehnpfennig: Skalierungsverfahren in derSozialforschung. In: Handbuch der empirischenSozialforschung. Hrsg. v. René König. Stuttgart1974. Bd. III a, 97—203.

Dickinson 1973 = G. C. Dickinson: Statisticalmapping and the presentation of statistics. 2. Aufl.London 1973.Ellegård 1959 = Alvar Ellegård: Statistical mea-surement of linguistic relationship. In: Language35. 1959, 131—156.Engelien 1971 = Gerhard Engelien: Der Begriffder Klassifikation. Hamburg 1971 (Forschungsbe-richte des Institutes für Kommunikationsfor-schung und Phonetik der Universität Bonn 36).Goebl 1976 = Hans Goebl: La dialectométrie ap-pliquée à l’ALF (Normandie). In: XIV Congressointernazionale di linguistica e filologia romanza(Neapel 1974). Atti. Neapel. Amsterdam 1976.Bd. II, 165—195.Goebl 1977 = Hans Goebl: Rätoromanisch versusHochitalienisch versus Oberitalienisch. Dialekto-metrische Beobachtungen innerhalb eines Diasy-stems. In: Ladinia 1. 1977, 39—71.Goebl 1978 a = Hans Goebl: Zu Methoden undProblemen einiger dialektometrischer Meßverfah-ren. In: Germanistische Linguistik 3—4/77, 335—365.Goebl 1978 b = Hans Goebl: Analyse dialectomé-trique de quelques points de l’AIS (italien stand-ard, valdotain, provençal alpin, turinois, mila-nais). In: Convegno internazionale di studio sulingue e dialetti nell’arco alpino occidentale: lostato presente delle ricerche, diacronia e sincronia(Turin 1976). Atti. Turin 1978, 282—294.Goebl 1979 a = Hans Goebl: DialektometrischeStudien. Habil. (masch.). Regensburg 1979.Goebl 1979 b = Hans Goebl: La méthode des in-terpoints appliquée à l’AIS (essai de dialectomé-trie). In: Mélanges de philologie et de toponymieromanes offerts à Henri Guiter. Montpellier 1979,137—172.Goebl 1980 = Hans Goebl: Dialektgeographie +Numerische Taxonomie = Dialektometrie. An-hand rätoromanischer und oberitalienischer Dia-lektmaterialien (AIS). In: Ladinia 4. 1980, 31—95.Goebl 1981 = Hans Goebl: Isoglossen, Distanzenund Zwischenpunkte. Die dialektale Kammerungder Rötoromania und Oberitaliens aus dialekto-metrischer Sicht. In: Ladinia 5. 1981, 23—55.Guiter 1973 = Henri Guiter: Atlas et frontièreslinguistiques. In: Dialectes romans de France à lalumière des atlas régionaux (Colloque du CNRS.Straßburg 1971). Hrsg. v. Georges Straka. Paris1973, 61—109.Haggett 1973 = Peter Haggett: Einführung in diekultur- und sozialgeographische Regionalanalyse.Übers. v. Dietrich Bartels/Barbara und VolkerKreibich. Berlin. New York 1973.Hammond/McCullagh 1974 = Robert Hammond/Patrick McCullagh: Quantitative techniques ingeography: an introduction. Oxford 1974.Hempel/Oppenheim 1936 = Carl G. Hempel/PaulOppenheim: Der Typusbegriff im Lichte der neu-

Page 20: HSK 1 - sbg.ac.at 1982 Ansätze zu einer... · 1. Problemstellung 2. Meßansatz 3. Q-analytische Meßmomente 4. R-analytische Meßmomente 5. Literatur (in Auswahl) 1. Problemstellung

792 VII. Computative Arbeitsverfahren in der Dialektologie

cisco 1973.Sodeur 1974 = Wolfgang Sodeur: EmpirischeVerfahren zur Klassifikation. Stuttgart 1974.Späth 1975 = Helmut Späth: Cluster-Analyse-Al-gorithmen zur Objektklassifizierung und Datenre-duktion. München. Wien 1975.Vogel 1975 = Friedrich Vogel: Probleme und Ver-fahren der numerischen Klassifikation. Unter be-sonderer Berücksichtigung von Alternativmerk-malen. Göttingen 1975.

Hans Goebl, Regensburg

Séguy 1971 = Jean Séguy: La relation entre la di-stance spatiale et la distance lexicale. In: Revue delinguistique romane 35. 1971, 335—357.Séguy 1973 a = Jean Séguy: La dialectométriedans l’Atlas linguistique de la Gascogne. In: Re-vue de linguistique romane 37. 1973, 1—24.Séguy 1973 b = Jean Séguy: Atlas linguistique etethnographique de la Gascogne. Bd. VI (1 + 2). Pa-ris 1973.Sneath/Sokal 1973 = Peter H. A. Sneath/RobertR. Sokal: Numerical taxonomy. The principlesand practice of numerical classification. San Fran-

46. Entwürfe zu dialektalen Informationssystemen

scheidend aber an dem Umstand, daß dieThematik im Schnittfeld zweier sich fremderDisziplinen liegt, der Dialektologie und derInformatik. Gerade bei letzterer ist in jüng-ster Zeit eine dynamische Entwicklung zubeobachten, in Verlaufe derer selbst Grund-begriffe wie z. B. der des Informationssy-stems neue Konturen anzunehmen beginnen.Dies bedeutet für das hier zu behandelndeThema, daß der Prozeß, mit dem die Infor-matik die empirischen Wissenschaftendurchdringt, nicht problemlos zu fassen ist.Hinzu kommt, daß Computeranwendungeninnerhalb der Dialektologie, aufs Ganze ge-sehen, bisher eher sporadisch und punktuellerfolgten; eine durchgängige Systematik läßtsich hier gegenwärtig noch nicht erkennen.

Für die weitergehende Behandlung desThemas hat dies zur Folge, daß sie sich nichtausschließlich auf dem Boden erprobter undanerkannter Tatbestände bewegen kann,sondern auch über sie hinaus extrapolierenmuß. Es wird versucht, aufgrund der er-wähnten Erörterungen — besonders zur dia-lektalen Datenstruktur —, die Umrisse einesSystemrahmens zu entwickeln, in den sichdie wichtigsten Arbeiten einordnen lassen,aus dem heraus aber auch weitergehendePerspektiven sichtbar werden. Zielpunkt da-bei ist die Definition eines dialektalen Infor-mationssystems im Rahmen einer dafür zuentwickelnden Terminologie und deren An-wendung auf sich abzeichnende Weiterent-wicklungsmöglichkeiten.

Dieses Vorgehen hängt mit der Spezifikdialektologischer Forschungsinteressen zu-sammen, die, soweit sie den empirischenAspekt betreffen, durch Arealität und aus-drucksseitige Orientierung geprägt sind. Ei-ne systematische Standortbestimmung im

1. Einleitung2. Der Begriff des Informationssystems3. Datenaspekte dialektologischer Materialbe-

arbeitung4. Zur Systematisierung des DV-Einsatzes in

der Dialektologie5. Perspektiven dialektaler Informationssysteme6. Literatur (in Auswahl)

1. EinleitungDie explosive Entwicklung, die sich in derelektronischen Datenverarbeitung vor allemauch im nichtnumerischen Bereich vollzieht,hat dazu geführt, daß computergestützte For-schungsmethoden immer stärker auch in gei-steswissenschaftliche Disziplinen eindrin-gen. Dies gilt nicht zuletzt für die Dialekto-logie, die es, soweit sie sich als empirischeWissenschaft versteht, mit beträchlichtenMaterialmengen zu tun hat und deswegenfür einen weitreichenden DV-Einsatz gera-dezu prädestiniert ist.

Der vorliegende Beitrag will versuchen,eine Skizze der sich gegenwärtig abzeichnen-den Möglichkeiten eines Rechnereinsatzesbei dialektologischen Materialbearbeitungennachzuziehen und Perspektiven aufzuzeigen.Ausgegangen wird dabei von einer ansatz-weisen Klärung des Informationssystembe-griffs, von einer Analyse der Struktur undBearbeitung dialektaler Ausgangsdaten undeinem kursorischen Überblick über rechner-gestützte Aktivitäten in der Dialektologie.Bei allen diesen Punkten sind starke inhaltli-che Verkürzungen und Beschränkungen aufexemplarische Einzelphänomene unver-meidlich. Dies liegt zum einen an der hiergebotenen Kürze, zum anderen und ent-