261
Mechanismen des Echogedächtnisses: Studien mit periodischem Rauschen als minimal strukturiertem Stimulus Von der Fakultät für Biowissenschaften, Pharmazie und Psychologie der Universität Leipzig genehmigte HABILITATIONSSCHRIFT zur Erlangung des akademischen Grades doctor habilitatus (Dr. habil.) vorgelegt von Dr. Christian Kaernbach geboren am 4. 10. 1960 in Bonn

Präattentives Gedächtnis - Allgemeine und Biologische ... · Web viewAbb. 5.2: Beispiel für das Ergebnis der maximum-likelihood Analyse. Die x-Achse repräsentiert den 6-s Rauschzyklus

Embed Size (px)

Citation preview

Mechanismen desEchogedächtnisses:

Studien mit periodischem Rauschen als minimal strukturiertem Stimulus

Von der Fakultät für Biowissenschaften, Pharmazie und Psychologie

der Universität Leipzig

genehmigte

H A B I L I T AT I O N S S C H R I F T

zur Erlangung des akademischen Grades

doctor habilitatus

(Dr. habil.)

vorgelegt

von Dr. Christian Kaernbach

geboren am 4. 10. 1960 in BonnTag der Verleihung: 07. 06. 1999

Vorlage zum Nachdruck der Habilitationsschrift von Christian Kaernbach.

Diese Datei mit MS Word und dem Druckertreiber für den LaserJet III drucken, wechselseitig kopieren, und das Papier auf 18 cm Breite und 23,6 cm Höhe beschneiden.

Die letzte bedruckte Seite sollte die Seitenzahl 160 tragen.

Gutachter:

Prof. Dr. Hans-Georg Geißler / Prof. Dr. Erich Schröger, Institut für Allgemeine Psychologie, Universität Leipzig

Prof. Dr. Hans Colonius, Institut für Kognitionsforschung, Universität Oldenburg

Prof. Dr. Rainer Mausfeld, Institut für Psychologie, Universität Kiel

Bibliographische Beschreibung:

Kaernbach, Christian

Mechanismen des Echogedächtnisses:Studien mit periodischem Rauschen als minimal strukturiertem Stimulus

Universität Leipzig, Habilitationsschrift160 Seiten, 85 Lit., 35 Abb.

Die vorliegende Schrift beschäftigt sich mit den ersten Stufen der Informationsverarbeitung beim Hören und den dabei auftretenden Gedächtnisphänomenen. Nachdem die Interpretation dieser Vorgänge im Sinne eigenständiger sensorischer Register zugunsten eines kontinuierlichen Modells aufgegeben worden ist, findet sich heute zunehmend Evidenz für eine Zweiteilung innerhalb der sensorischen Register. Cowan teilt diese in kurze und lange Speicher, wobei die langen Speicher eine Variante des Kurzzeitgedächtnisses für sensorische Inhalte darstellen.

Die Arbeit unternimmt den Versuch, das Erinnern sensorischer Information am Beispiel desjenigen auditiven Stimulus zu untersuchen, der am wenigsten Anlaß für eine nichtsensorische, kategoriale Kodierung der Information bietet: Weißes Rauschen, ein minimal strukturiertes Signal. Die gewonnenen Schlußfolgerungen weisen in einzigartiger Weise auf ein wirklich sensorisches Gedächtnis hin, da bei sprachlichem oder musikalischem Material eine höhere kognitive Verarbeitung nicht auszuschließen, ja wahrscheinlich ist.

Zunächst werden die bei diesem Stimulus zu beobachtenden Grundphänomene untersucht. In weiteren Experimenten gelingt der Nachweis, daß bei einem einheitlichen Vorgang, nämlich dem Entdecken der Periodizität langer Zyklen, einerseits eine Lebensdauer im Bereich von mehreren Sekunden, aber andererseits eine Kapazitätsgrenze deutlich unter einer Sekunde vorliegen. Mit Hilfe evozierter elektroenzephalographischer Potentiale kann schließlich zwischen verschiedenen Modellvorstellungen des Echogedächtnisses entschieden werden. Abschließend werden Bezüge zu Modellen des Kurzzeitgedächtnisses und zum Paradigma des primings hergestellt. Ein Anhang behandelt technische Fragen der Signalerzeugung.

Inhaltsverzeichnis

Vorwort..........................................................................................................

1 Sensorisches Gedächtnis im Kontext moderner Gedächtnistheorien............

2 Langer und kurzer auditiver Speicher.........................................................

3 Grundphänomene der Wahrnehmung von periodischem Rauschen..............3.1 Rauschen als minimal strukturierter Stimulus......................................3.2 Klassische Versuche mit periodischem Rauschen................................3.3 Experiment 1: Reproduzierbarkeit des Mittappens..............................

I. Methodik...........................................................................................II. Ergebnisse........................................................................................III. Zusammenfassung..........................................................................

3.4 Holistische vs. lokale Verarbeitung von periodischem Rauschen.........3.5 Experiment 2: Temporale Eingrenzung................................................

I. Methodik...........................................................................................II. Ergebnisse........................................................................................

3.6 Experiment 3: Spektrale Eingrenzung.................................................I. Methodik...........................................................................................II. Ergebnisse........................................................................................

3.7 Analyse des Spektrogramms................................................................3.8 Auditive feature Detektoren.................................................................

4 Lebensdauer des Echogedächtnisses...........................................................4.1 Lebensdauer: ein typischer Gedächtnisparameter................................4.2 Experiment 4: Grenze der PR-Detektion für lange Zyklen..................

I. Methodik...........................................................................................II. Ergebnisse........................................................................................

4.3 PR-Wahrnehmung: ein Phänomen des langen auditiven Speichers......

5 Kapazität des Echogedächtnisses................................................................5.1 Kapazität: eine Zeitkonstante?.............................................................5.2 Austausch von Segmenten zur Kapazitätsmessung..............................5.3 Experiment 5: Abhängigkeit von der Zykluslänge...............................

I. Methodik...........................................................................................II. Ergebnisse........................................................................................

5.4 Experiment 6: Abhängigkeit von der Segmentlänge............................

1

I. Methodik...........................................................................................II. Ergebnisse........................................................................................

5.5 Kapazität und kurzer Speicher: Koinzidenz oder Zusammenhang?......

6 Mechanismen des Echogedächtnisses..........................................................6.1 Phänomene der PR-Wahrnehmung......................................................6.2 Restaktivierung versus sensorische Vorbereitung.................................6.3 Stimulusmaterial für EEG-Untersuchungen.........................................

6.3.1 Periodisches und semiperiodisches Rauschen...............................6.3.2 Experiment 7: Detektierbarkeit von SPR.....................................

I. Methodik......................................................................................II. Ergebnisse...................................................................................

6.4 Elektrophysiologische Überprüfung der Modelle................................6.4.1 Experiment 8: Signifikanz einzelner Segmente............................

I. Methodik......................................................................................II. Ergebnisse...................................................................................

6.4.2 Experiment 9: Ereigniskorrelierte Potentiale zu SPR...................I. Methodik......................................................................................II. Ergebnisse...................................................................................

6.5 NLN: Aktivierung sensorischer Verarbeitungsstufen...........................6.6 Ein Modell des Echogedächtnisses......................................................6.7 Echogedächtnis, priming und Repräsentation......................................

Zusammenfassung.........................................................................................Anhang A: Erzeugung von digitalem Rauschen.............................................

A.1 Digitalisierte Wellenformen................................................................A.2 Digitales weißes Rauschen.................................................................A.3 Iteriertes (periodisches) Rauschen......................................................A.4 Zufallszahlen: Algorithmen................................................................

Literaturverzeichnis.......................................................................................

Erklärung.......................................................................................................

Lebenslauf und wissenschaftlicher Werdegang..............................................

Veröffentlichungen........................................................................................

Einwerbung von Drittmitteln.........................................................................

Register..........................................................................................................

2

VorwortDie vorliegende Schrift beschäftigt sich mit den ersten Stufen der Informationsverarbeitung beim Hören und den dabei auftretenden Behaltensprozessen. Nachdem die Interpretation dieser Vorgänge im Sinne eigenständiger sensorischer Register (Neisser: „Ikone“, „Echo“) zugunsten eines kontinuierlichen Modells (z.B. das Einspeichermodell von Shiffrin und Schneider) aufgegeben worden ist, findet sich heute wieder zunehmend Evidenz für eine Zweiteilung. Diese verläuft mitten durch die klassischen sensorischen Register: Cowan teilt sie in kurze und lange sensorische Speicher, wobei die kurzen Speicher als ein eigenständiges Phänomen wenig mit den anderen Gedächtnissystemen gemein haben, während die langen Speicher eine Variante des Kurzzeitgedächtnisses für sensorische Inhalte darstellen (siehe Kapitel 1-2).Während die kurzen sensorischen Speicher schon gut untersucht sind, bedarf es bei den langen Speichern, in Abgrenzung vom Kurzzeitgedächtnis einerseits und von den kurzen Speichern andererseits, genauerer Quantifizierung als Voraussetzung späterer Modellbildung. Dabei bietet sich im auditiven Fall ein Stimulus besonders an, der als minimal strukturiertes Signal eine präkategoriale Kodierung erzwingt: weißes Rauschen. In ite-rierter Form als „periodisches Rauschen“ (PR) dargeboten, dient es als De-monstration für das Echogedächtnis. In der vorliegenden Arbeit wird zunächst das Phänomen der PR-Wahrnehmung selbst untersucht (Kapitel 3) und dann dazu benutzt, um mit einer neuen Methodik Lebensdauer und Kapazität des Echogedächtnisses zu quantifizieren (Kapitel 4-5). In Kapitel 6 werden auf der Basis der Verhaltensdaten Modellvorstellungen für das Echogedächtnis entwickelt, zwischen denen mittels elektrophysiologischer Daten entschieden wird. Es werden offene Modellfragen diskutiert und Anregungen für verwandte Experimente aus dem Bereich der masked prim-ing Paradigmen gegeben. Ein Anhang behandelt technische Fragen der Signalerzeugung.Von den seit meiner Promotion behandelten Themen (Signalentdeckungs-theorie, adaptive Verfahren in der Psychophysik, Tonhöhenwahrnehmung, auditive Szenenanalyse, Suchprozesse im Kurzzeitgedächtnis, visueller Teilbericht, Stereorivalität), die ihren Niederschlag in insgesamt 9 international publizierten bzw. akzeptierten Erstautorpublikationen mit

3

peer-review System gefunden haben, stellt die Forschung zum Echogedächtnis den in sich abgeschlossensten Zug meiner Forschung dar. Deshalb habe ich sie für meine Habilitationsschrift ausgewählt. Die dabei vorgestellten Untersuchungen haben bereits teilweise internationale Publikationen ergeben. Das Kapitel über die Grundphänomene der Wahrnehmung periodischen Rauschens (Kapitel 3) baut auf älteren Vorarbeiten auf: Kaernbach, C. (1992). On the consistency of tapping to repeated noise, Journal of the

Acoustical Society of America 92, 788-793. Kaernbach, C. (1993). Temporal and spectral basis of the features perceived in re-

peated noise, Journal of the Acoustical Society of America 94, 91-97.

Die in Kapitel 4 und 5 beschriebenen Untersuchungen zu kognitionspsychologischen Parametern des Echogedächtnis (Lebensdauer und Kapazität) sollen ebenfalls publiziert werden: Kaernbach, C. (1998). Lifetime and capacity of echoic memory for random wave

forms, eingereicht bei Perception & Psychophysics

Der experimentelle Teil von Kapitel 6 (Mechanismen des Echogedächtnisses) ist teilweise publiziert in: Kaernbach, C., Schröger, E., Gunter, T.C. (1998). Human event-related brain poten-

tials to auditory periodic noise stimuli, Neuroscience Letters 242, 17-20während die hier vorliegende theoretische Aufarbeitung und Modellbildung bisher nicht publiziert ist.Ein wesentlicher Grund, in Leipzig Echogedächtnisforschung zu betreiben, lag darin, daß keine schalldichte Kabine verfügbar war. Experimente mit Rauschen boten sich an, weil dazu keine Kabine vonnöten ist. Es war mir ein besonderes Anliegen, während meiner Assistenzzeit für eine gute Ausrüstung der Abteilung zu sorgen (siehe „Drittmitteleinwerbungen“, Seite 165).Ich möchte mich bedanken bei Herrn Prof. Dr. Hans-Georg Geißler, ohne dessen Betreuung diese Arbeit nicht zustande gekommen wäre. Sein Rat war mir nicht nur für diese Arbeit, sondern auch in allgemeinen Fragen des beruflichen Werdeganges wichtig und hilfreich. Ich danke Herrn Dr. Laurent Demany, der mich auf periodisches Rauschen als auditiven Stimulus aufmerksam gemacht hat. Danken möchte ich den Kollegen am Institut für Allgemeine Psychologie für ihre Unterstützung, Herrn Dr. Thomas Gunter und Herrn PD Dr. Axel Mecklinger für ihre Beratung bei der Durchführung des EEG-Experimentes, Frau Prof. Dr. Angela Friederici

4

für die Genehmigung einer Pilotstudie am Max-Planck-Instiut für Neuropsychologische Forschung, Herrn Dr. Jan Vorbrüggen für die Diskussion der Methodik des Kapazitätsexperimentes, und den vielen Studenten, die an den Experimenten mit Engagement und Sorgfalt mitgewirkt haben.

5

1 Sensorisches Gedächtnis im Kontext moderner Gedächtnistheorien

In seiner vielbeachteten Arbeit zum visuellen Kurzzeitgedächtnis (Sperling, 1960) hat George Sperling nachgewiesen, daß im Fall einer Teilberichtsinstruktion nach der visuellen Darbietung eines Buchstabenfeldes für eine kurze Zeit (etwa 250 ms) erheblich mehr Information verfügbar ist, als die vier bis fünf Buchstaben, die Versuchspersonen typischerweise von diesem Buchstabenfeld noch wiedergeben können. Diese Untersuchung wurde mehr als ein Jahrzehnt zur meistzitiertesten Arbeit der experimentellen Psychologie, und es gab viele Folgeuntersuchungen zu Parametern und Varianten dieses Phänomens sowie zu verwandten Phänomenen. Zur Popularität dieser Arbeit hat ihre Interpretation durch Ulric Neisser in seinem Buch Cognitive Psychology (Neisser, 1967) beigetragen. Neisser interpretierte den Befund als Indiz für die Existenz eines sensorischen Registers, in dem sämtliche sensorische Information zwischengespeichert wird. Als eine notwendige Station auf dem Weg der Informationsverarbeitung vom Wahrnehmungsorgan zum Bewußtsein war dieses sensorische Register gekennzeichnet durch eine sehr hohe Kapazität und einen sehr schnellen Zerfall. In dem klassischen Mehrspeichermodell von Atkinson und Shiffrin (1968) wurde dem sensorischen Register die Rolle der ersten strukturellen Komponente nach der Reiztransformation zugewiesen (siehe Abb. 1.1). Die Aufmerksamkeit sollte als Kontrollprozeß dafür verantwortlich sein, welche Information vom sensorischen Register in den Kurzzeitspeicher gelangt.

Anfang der achtziger Jahre wurde dieses Konzept zunehmend kritisiert. Ein einflußreicher Artikel von Ralph Norman Haber (Haber, 1983) war betitelt: The impending demise of the icon. In diesem Artikel versucht Haber aufzuzeigen, warum wir einen ikonischen Speicher nicht benötigen, und weshalb er uns sogar stören würde. Der Artikel erschien bei The Behavioral and Brain Sciences zusammen mit 31 Kommentaren. Während der größere Teil der Kommentatoren sich nicht Habers radikaler Sichtweise anschließen mochte, daß die Ikone keinen Platz in zukünftigen Lehrbüchern haben solle, wurde durch diese und weitere Literaturbeiträge deutlich, daß die

6

sensorischen Register nicht mehr als eine einheitliche und obligatorische Station auf dem Weg der Informationsverarbeitung angesehen wurden.

Sicherlich wird man sich nicht der radikalen Sichtweise Gibsons anschließen (Gibson, 1966, 1979: „direkte Wahrnehmung“), demnach keinerlei Verarbeitungsprozesse stattfinden, sondern statt dessen das Gehirn in „Resonanz“ mit dem Reiz tritt. Doch hat diese provokante These immerhin soweit auf das Verständnis der Wahrnehmungsvorgänge eingewirkt, daß heute davon ausgegangen wird, daß im Normalfall die Information vom Retinabild zu höheren Zentren direkt weiterverarbeitet wird (unter gegebenenfalls erfolgender Rückkoppelung im Sinne von top-down Prozessen), ohne daß ein eigenes Speichersystem interveniert, von dem diese Information erst abgerufen werden muß.

Dementsprechend haben spätere Modelle des Gedächtnisses die Bedeutung der sensorischen Register zurückgenommen. Im Einspeichermodell von Shiffrin und Schneider (1977, siehe Abb. 1.2) wird der Begriff (wie im

Aufmerksamkeit

sensorischer Input

Kurzzeitgedächtnis

sensorische Register

Langzeitgedächtnis

elaborierendesWiederholen

Abruf

Abb. 1.1: Schematische Darstellung des Mehrspeichermodells (nach Atkinson und Shiffrin, 1968). Die sensorischen Register stellen als eine eigene Einheit eine obligatorische Durchgangsstation auf dem Weg der Informationsverarbeitung dar.

7

übrigen auch der des Kurzzeitspeichers) nicht mehr benötigt. Wenn man in diesem Modell nach Entsprechungen zu den klassischen Strukturkomponenten sucht, wird deutlich, daß dem Kurzzeitspeicher der aktivierte Teil des Langzeitspeichers entspricht, und den sensorischen Registern wiederum die ersten, sensorischen Ebenen des Kurzzeitspeichers. Der Begriff des sensorischen Registers ist aber nicht mehr notwendig zur Erläuterung des Konzepts. Aus einem sensorischen Register wird somit ein sensorischer Kode, der gegebenenfalls auch erinnert werden kann.

Ein Nachteil des Einspeichermodells ist, daß man mit der Aufgabe fester Grenzen und der Annahme eines Kontinuums vielen experimentellen Befunden, die den früheren Strukturkomponenten eindeutig zuordenbar waren, nicht gerecht wird. Nelson Cowan hat viele Befunde zu den sensorischen Speichern gesichtet und in neue Strukturen eingeteilt (Cowan 1984, 1988, 1995). Demnach verläuft die eindeutigste Grenze mitten durch die ehemals einheitlichen sensorischen Register: Cowan findet zwei Hauptklassen mit Zeitkonstanten im Bereich um 200 ms bzw. bei ca. 10

Abb. 1.2: Schematische Darstellung des Einspeichermodells (nach Shiffrin und Schneider, 1977). Das Kurzzeitgedächtnis ist der aktivierte Teil des Langzeitgedächtnisses. Die sensorischen Register sind die ersten Verarbeitungsstufen der automatischen Kodierungskaskade.

8

Langzeitgedächtnis

Kurzzeitgedächtnis

Ebene 1 Ebene 2 Ebene 3 Ebene nautomatische Kodierung

automatischeReaktion

kontrollierteReaktion

kontrollierte VerarbeitungAufmerksamkeitssteuerung

Sekunden. Seine Analyse basiert hauptsächlich auf Daten zu den auditiven Registern, doch argumentiert er analog für den visuellen Bereich.

Interessante MEG-Befunde bestätigen die Existenz verschiedener Zeitkonstanten für sensorische Register. Der Ansatz dabei ist, im MEG die evozierten Potentiale zu repetierten Stimuli in Funktion von der Repetitionsfrequenz zu messen. Je schneller die Stimuli aufeinander folgen, desto geringer fallen die Potentiale aus. Dies wird interpretiert als Anzeichen für eine noch vorhandene Spur. Die Potentiale seien proportional derjenigen Aktivität, die neu hervorgerufen werden müsse, und das ist weniger, wenn der Stimulus vor kurzem noch da war und die Spur noch frisch ist. Durch den Vergleich der so erhobenen Lebensdauern von Spuren im primären auditiven Kortex mit psychophysisch gemessenen Lebensdauern des sensorischen Gedächtnisses für die Lautstärke eines Tones bei denselben Versuchspersonen (Lu et al., 1992) konnte das dahinterstehende Modell validiert werden. In einer Untersuchung von Uusitalo et al. (1996) wird auf der Basis dieser Methodik gezeigt, daß es eine Dichotomie von Zeitkonstanten des Zerfalls sensorischer Spuren mit den Bereichen um 0.1-0.3 bzw. um 5-10 Sekunden gibt.

Nelson Cowan versucht in seiner Arbeit von 1988 eine Zusammenschau verschiedener aktueller Modellvorstellungen des Gedächtnisses, die aus ganz verschiedenen experimentellen Paradigmen hervorgegangen sind und ganz unterschiedliche Leistungen des Gedächtnisses nachbilden sollen. In seinem Modell (Abb. 1.3) gibt es eine zentrale Exekutive wie in dem Arbeitsgedächtnismodell von Baddeley und Hitch (1974), und das Kurzzeitgedächtnis ist wie beim Einspeichermodell von Shiffrin und Schneider als aktivierte Form des Langzeitgedächtnisses interpretiert. Zusätzlich gibt es verschiedene Mechanismen zur Aufmerksamkeitssteuerung, orientiert an dem Filtermodell der Aufmerksamkeit von Treisman (1960, 1964). Dabei ist aktiviertes Gedächtnis und Bewußtsein nicht gleichgesetzt (siehe hierzu auch die Diskussion in Kapitel 6.2 und 6.6). Man erhält somit eine konzentrisch verschachtelte Struktur von Langzeitgedächtnis, aktiviertem Gedächtnis und beachteten Aktivationszuständen. Eine Übersicht über die Ableitung seines Modells gibt Cowan in seinem Buch Attention and Memory: An Integrated Framework (1995).

9

Für die vorliegende Arbeit ist interessant, wie er die beiden sensorischen Speicher (kurz versus lang) in dieses Modell integriert hat. Für den kurzen sensorischen Speicher reserviert Cowan eine eigene Komponente außerhalb des Langzeitgedächtnisses, während der lange Teil wie bei Shiffrin und Schneider als aktivierte Elemente des Langzeitgedächtnisses gesehen werden. Man könnte somit auch von einem sensorischen Langzeitgedächtnis sprechen.

Aus der Sonderposition, die Cowan den kurzen sensorischen Speichern einräumt, wird deutlich, daß es sich bei diesen Phänomenen um weitgehend eigenständige Vorgänge handelt, die sich nicht in ein kontinuierliches Modell wie das Einspeichermodell integrieren lassen. Cowan führt als ein

Abb. 1.3: Auszüge aus einer schematischen Darstellung des Modells von Cowan (1988). Der lange sensorische Speicher ist aktiviertes Gedächtnis genau wie das Kurzzeitgedächtnis. Der kurze sensorische Speicher bildet eine Einheit für sich. Aktivierte Zustände des Gedächtnisses können (müssen aber nicht) in den Fokusder Aufmerksamkeit gelangen.

10

Zentrale Exekutive

Langzeitgedächtnis

aktiviertes Gedächtnis

(Kurzzeitgedächtnis)

Fokus der

Aufmerksamkeit

kurzer sensorischer Speicher

auch langer sensorischer

Speicher

Reiz

Kennzeichen dieser Stufe an, daß die dort eingeordneten Vorgänge nicht als Erinnern erfahren werden. Dazu muß angemerkt werden, daß auch Phänomene des langen sensorischen Speichers (z.B. bei der Wahrnehmung periodischen Rauschens, siehe die vorliegende Arbeit) oder des Kurzzeit– oder Langzeitgedächtnisses nicht notwendig als Erinnern erfahren werden. Dies wird auch deutlich im Zusammenhang mit dem neuerlich viel Aufmerksamkeit erfahrenden Thema des impliziten Gedächtnisses (z.B. Roediger, 1990, Tulving und Schacter, 1990). Auch hier wird operational nachweisbares Gedächtnis nicht als solches erfahren. Glenberg beantwortet (1997) in seinem Artikel What memory is for die Frage nach dem Sinn des Gedächtnisses dahingehend, daß es evolutionär gesehen zunächst nur zur Bereitstellung von Handlungsalternativen benötigt wurde und in dieser Funktion nicht als Erinnern erfahren wird. Freies Erinnern sei eine späte Erfindung der Evolution.

Ein anderes Kriterium erscheint geeigneter, die kurzen sensorischen Speicher von anderen Gedächtnissystemen zu unterscheiden. Es beruht jedoch auf Vorannahmen über die zugrundeliegenden Repräsentationen. Diese genügen demnach für bewußt erfahrene versus unbewußt bleibende Gedächtnisinhalte des Kurzzeitgedächtnisses (bzw. der langen sensorischen Speicher) gleichen Gesetzmäßigkeiten, wie dies schon Fechner (1860) vermutet hat. Unter dieser Voraussetzung kann man über die kurzen sensorischen Speicher sagen, daß die zugrundeliegenden Repräsentationen auch unter günstigsten Voraussetzungen (stärkere Reizausprägung, längere Präsentationsdauer, keine Interferenz etc.) nicht durch kognitive Vorgänge aufrechterhalten werden können. Dies ist für die Repräsentationen im Kurzzeitgedächtnis und den langen sensorischen Registern hingegen möglich.

Die vorliegenden Arbeit beschäftigt sich mit dem langen sensorischen Speicher beim Hören und versucht, ihn möglichst gut gegen kategorial geprägte Formen des Erinnerns im Kurzzeitgedächtnis abzugrenzen. Dabei ist es angeraten, mit Stimuli zu arbeiten, bei denen möglichst wenig Langzeitinformation ausgenutzt werden kann. Daher kommt dasjenige auditive Stimulusmaterial zum Einsatz, das am wenigsten inhärente Struktur aufweist und damit am wenigsten Anlaß zur gestaltmäßigen Organisation gibt: weißes Rauschen. Damit soll versucht werden, einen Beitrag zum Verständnis der präkategorialen Prozesse der Informationsverarbeitung und -speicherung zu leisten.

11

2 Langer und kurzer auditiver Speicher

Die Existenz des Echogedächtnisses, also des sensorischen Gedächtnisses beim Hören, wurde 1967 von Neisser im Zusammenhang mit der Definition der sensorischen Register gefordert. Er führte – anders als bei der Ikone – keine experimentellen Befunde auf, die diese Annahme stützten, sondern projizierte die Entdeckung des Echogedächtnisses in die Zukunft. NelsonCowan führt in seiner vielbeachteten Übersichtsarbeit zum Echogedächtnis von 1984 mehr als 160 Referenzen auf, von denen etliche älter sind als Neissers Buch, und stellt sie in den Zusammenhang des Echogedächtnisses, ohne daß die damaligen Autoren diesen Begriff gekannt hätten.

Ein Hauptargument, das in der Diskussion um die Ikone aufkam, hat keine Gültigkeit für das Echogedächtnis. Während in der visuellen Welt gefragt werden kann, wozu ein sensorisches Register gut sein soll, wenn das Retinabild immer noch anliegt, man also nur „noch einmal hinzuschauen braucht“, um an die gewünschte Information zu kommen, ist beim Hören eindeutig feststellbar, wo der Nutzen eines sensorischen Registers liegen könnte. Die vom Hörsystem auszuwertende Information kommt als Informationsfluß in der Zeit an, und bei der Interpretation muß zwangsläufig auf kurz zuvor verstrichene Information zurückgegriffen werden. Bei der Sprache steckt z. B. viel Information in den Transienten, den Übergängen, die erst die Konsonanten definieren. Wenn ein Übergang beurteilt werden soll, dann muß sowohl klar sein, wohin er führt, als auch, woher er kommt. Einem sensorischen Register könnte hier die Funktion zugewiesen sein, zeitlich kurz aufeinander folgende Information zu integrieren.

Cowan teilt die Gedächtnisphänomene, die er dem Echogedächtniszuordnet, in zwei Kategorien ein: den kurzen und den langen auditiven Speicher. Im kurzen auditiven Speicher spielen sich Phänomene ab, deren Zeitkonstanten unterhalb von typischerweise 200 ms liegen. Diese Phänomene werden subjektiv nicht als Gedächtnis erfahren, sondern als Veränderung der Wahrnehmungsqualität, z.B. als Zunahme der Lautheit. Hierher gehören drei Klassen von Phänomenen: Zunächst die auditive Persistenz, wobei die Dauer eines Stimulus abgeschätzt werden soll, etwa durch Synchronisation des Offsets mit einem anderen Stimulus. Unterhalb

12

von 180 ms Dauer des Zielreizes wird dessen Länge systematisch überschätzt, und zwar so als ob er 180 ms lang wäre (z.B. Efron, 1970). Ähnlich können Versuche von George von Békésy (Békésy, 1933) eingestuft werden, bei denen die Steilheit der Offset-Rampe eines 800-Hz Tones eingestellt werden konnte. Unterhalb von 140 ms konnte keine Steigerung der Abruptheit des Offsets mehr festgestellt werden. Als zweites wird das Phänomen der Informationsintegration aufgeführt. Wenn z.B. ein kurzes, leises Geräusch nahe der Hörschwelle dargeboten wird, dann entscheidet über die Wahrnehmbarkeit die Gesamtenergie, solange diese über nicht mehr als 200 ms verteilt ist. Ist sie hingegen über mehr als 200 ms verteilt, dann wird das Geräusch schlechter hörbar, da Information über längere Zeitabschnitte nicht mehr so optimal integriert werden kann (z.B. Békésy, 1933). Die dritte Klasse von Phänomenen zum kurzen auditiven Speicher sind die Vorwärts- und Rückwärtsmaskierung (z.B. Zwislocki, 1972). Hierbei wird ein leises Signal unhörbar, wenn zuvor (Vorwärtsmas-kierung) oder danach (Rückwärtsmaskierung) ein lauterer Maskierungsreiz gegeben wurde. Die Vorwärtsmaskierung funktioniert bis ca. 200 ms nach dem Maskierungsreiz. Die Rückwärtsmaskierung ist deutlich geringer ausgeprägt und verdeckt lediglich 30-40 ms vor dem Reiz.

Für den langen auditiven Speicher, bei dem das Erinnern in der Regel subjektiv als solches erfahren wird (siehe hierzu aber die Diskussion in Kapitel 4.3), führt Cowan vier Klassen von Phänomenen an. Bei den Suffixeffekten beim Listenlernen wird nach der Liste ein Suffix dargeboten, das nicht mehr gelernt werden soll. Dieses interferiert bei auditorisch dargebotenen Listen dennoch mit dem Lernerfolg für die Liste, und zwar selbst nach 20 Sekunden (z.B. Watkins und Watkins, 1980). In die zweite Klasse von Phänomenen ordnet Cowan Ergebnisse von Studien mit dichotischen Beschattungsparadigmen (irrelevant speech) ein. Hierbei wird beschrieben, daß die Informationen des nichtbeschatteten Kanals nur noch für ungefähr zwei Sekunden zur Verfügung stehen (z.B. Treisman, 1964). Als dritte Klasse führt Cowan Teilberichtsstudien analog zum visuellen Fall an. Hier werden Zeiten bis zu vier Sekunden gemessen. (Es gibt allerdings in neuerer Zeit methodische Zweifel an diesen Studien.) Das vierte, und für diese Arbeit interessanteste Phänomen des langen auditiven Speichers ist die Wahrnehmung von periodischem Rauschen, welche zuerst von Guttman und Julesz (1963) beschrieben wurde. Guttman und Julesz hatten den Stimulus entwickelt, um der Frage nachzugehen, bis zu welcher unteren Grenze das

13

auditive System Periodizitäten analysieren kann. Dabei waren sie von Periodizitäten im 100-Hz Bereich ausgegangen, die einen Tonhöheneindruck hervorrufen. Etliche Nachfolgepublikationen betitelten das Phänomen denn auch als „Infra-Tonhöhe“, (infrapitch, z.B. Warren und Bashford, 1981). Nelson Cowan stellt richtig heraus, daß die bei diesem Stimulus auftretenden Phänomene auf Gedächtnismechanismen beruhen. Während in den ersten Arbeiten für die Wahrnehmung periodischen Rauschens Zeitkonstanten um eine Sekunde berichtet wurden, wurden in späteren Studien für trainierte Versuchspersonen Zeitkonstanten von 10 Sekunden beobachtet (z.B. Warren und Bashford, 1981).

Bei den Phänomenen des langen auditiven Speichers findet Cowan eine Variabilität der gemessenen Zeitkonstanten von ein bis zwei Sekunden am einen Extrem und bis zu 20 Sekunden am anderen Extrem. Er erklärt diese Variabilität mit den teilweise nicht vergleichbaren Versuchsbedingungen, die in unterschiedlichem Maße eine Interferenz mit neuem Stimulusmaterial erzeugen. Wenn man dies berücksichtige, komme man auf eine Abschätzung der Lebensdauer des langen auditorischen Speichers von zehn bis zwanzig Sekunden für den Fall der Nichtinterferenz.

Viele der von Cowan zitierten Arbeiten für den Bereich des langen auditiven Speichers arbeiten mit sprachlichem Material: bei Teilberichtsstudien, Beschattungsparadigmen und Listenlernen kamen Worte (oft Zahlworte) oder Silben zum Einsatz. Das liegt an der einfachen Präsentierbarkeit bzw. Abfragbarkeit von sprachlichem Material. Hinzu kommt die Möglichkeit des intermodalen Vergleichs bei visueller Präsentation desselben sprachlichen Materials. Eine Schwierigkeit bei der Interpretation solcher Experimente rührt daher, daß der lange sensorische Speicher dem Kurzzeitgedächtnis für kategoriale Informationen sehr verwandt ist. So weisen z.B. beide Behaltensvorgänge in etwa dieselbe Lebensdauer auf (z.B. Murdock, 1961: ca. 10 s für das Kurzzeitgedächtnis). In Cowans Gedächtnismodell sind sowohl klassisches Kurzzeitgedächtnis als auch die langen sensorischen Speicher Aktivierungszustände des Langzeitgedächtnisses. Es muß daher bei jedem Experiment geklärt werden, ob es sich bei den beobachteten Gedächtnisphänomenen um kategoriale oder präkategoriale Formen des Erinnerns handelt.

Dies ist bei den von Cowan angeführten Untersuchungen nicht immer stringent nachgewiesen. So gilt es etwa als Beweis für die sensorische

14

Repräsentation eines Stimulus, wenn er zwar durch eine auditive, nicht aber durch eine visuelle Interferenz gestört werden kann. Wenn mal einmal akzeptiert, daß es zwischen rein präkategorialer und amodal kategorialer Repräsentation auch Übergänge gibt, so beweist dies lediglich, daß die Repräsentation nicht vollständig amodal kategorial war. Sie kann sehr wohl schon auf auditiven Kategorien wie Phonemen etc. basiert sein. Ähnliches gilt für das Argument, daß beim Beschatten nur dann angegeben werden kann, ob auf dem nicht beachteten Ohr eine Ziffer gesprochen wurde, wenn diese auch richtig wiedergegeben werden kann. Auch hier ist eine auditiv kategoriale Repräsentation nicht nur möglich, sondern sogar wahrscheinlich.

Will man den Unterschied zwischen präkategorialen (Kurzzeitgedächtnis) und kategorialen (Echogedächtnis) Speicherprozessen möglichst gut herausarbeiten, dann stellt man am besten schon vom verwendeten Material her sicher, daß kategoriale Speicherung eine möglichst geringe Rolle spielt. Unter diesem Gesichtspunkt ist weißes Rauschen ein idealer Stimulus, da bei diesem Signal keine inhärente Struktur vorliegt, die Anlaß zu kategorialer Verarbeitung geben könnte (siehe aber die Diskussion in Kapitel 3.1). Von allen von Cowan aufgeführten Experimenten zum langen auditiven Speicher ist nur bei Experimenten mit periodischem Rauschen sichergestellt, daß eine weitgehend präkategoriale Repräsentation vorliegt.

Mit dem von Guttman und Julesz eingeführten Stimulus sind schon einige Experimente durchgeführt worden, aber bei weitem nicht so systematisch wie mit Sprachmaterial o.ä. Einige qualitative Effekte sind erhoben worden (siehe Kapitel 3.2). Dringend not tut eine präzise Quantifizierung der bei periodischem Rauschen zu beobachtenden Gedächtnisphänomene. Dies geschieht in Kapitel 4 und 5, nachdem zuvor in Kapitel 3 Grundphänomene der Wahrnehmung von periodischem Rauschen analysiert worden sind. In Kapitel 6 werden verschiedene Modellvorstellungen zum sensorischen Gedächtnis verglichen und mit Hilfe elektrophysiologischer Daten zur PR-Wahrnehmung überprüft. Dabei ergeben sich wegen der engen Beziehung der langen sensorischen Speicher zum kategorialen Kurzzeitgedächtnis auch Konsequenzen für Modelle des Kurzzeitgedächtnisses.

15

3 Grundphänomene der Wahrnehmung von periodischem Rauschen

Dieses Kapitel stellt in den ersten beiden Abschnitten den verwendeten Stimulus, das weiße und insbesondere das periodische weiße Rauschen vor. Dabei werden auch klassische Versuche zu diesem Stimulus zitiert (3.2). In Abschnitt 3.3 wird eine methodische Frage behandelt, ob nämlich Tappen zu periodischem Rauschen intra– bzw. interindividuell reproduzierbar ist. Diese Frage war in der bisherigen Literatur nicht behandelt worden, und ihre Beantwortung stellt eine notwendige Voraussetzung für weitere Untersuchungen dar, da der Tappzeitpunkt der einzige objektivierbare Parameter ist, der uns etwas über das Perzept der Versuchsperson sagen kann. In den folgenden Abschnitten (3.4-3.6) wird versucht, auf der Basis der erhobenen Tappzeitpunkte die Basismechanismen der Verarbeitung von periodischem Rauschen näher einzugrenzen. Dies führt schließlich zu einem ersten Modell der Wahrnehmung periodischen Rauschens (Abschnitt 3.7).

3.1 Rauschen als minimal strukturierter StimulusRauschen ist ein allgegenwärtiges Signal. Um sich das zu verdeutlichen, braucht man nur den Verstärker seiner HiFi-Anlage ganz aufzudrehen, wenn kein anderes Signal anliegt: Man wird ein deutliches Rauschen hören. Für die Signaltechniker ist Rauschen der zu bekämpfende Feind, denn es enthält keine Information, erschwert aber das Verständnis des informationstragenden Signals. Daher werden Signalübertragungsanlagen aller Art (z.B. HiFi-Anlagen) durch den Signal-Rausch-Abstand gekennzeichnet. Rauschen kommt eben überall vor: selbst bei guten Anlagen ist es nur einen gewissen (möglichst großen) Abstand leiser als das erwünschte Signal.

Rauschen ist darüber hinaus das Endprodukt, wenn man möglichst viele Signale der unterschiedlichsten Art mischt. Dies folgt aus dem sogenannten „Gesetz der großen Zahl“. Wenn man möglichst viele Sprachaufnahmen oder Musikaufnahmen zusammenmischt, wird das Signal immer ähnlicher zu einem Rauschen. Einen Eindruck davon bekommt man, wenn man mit etwas Abstand zu einer sich unterhaltenden Menschenmenge auf das Gesamtgeräusch achtet.

16

Rauschen ist ein breitbandiges Signal, enthält also Energie nicht nur in einigen wenigen Frequenzbändern, sondern kontinuierlich über einen breiten Bereich. In Analogie zur Optik hat sich eingebürgert, je nach spektraler Zusammensetzung des Rauschens Farbattribute zu vergeben. Üblich sind die Bezeichnungen „weißes Rauschen“, „rosa Rauschen“ und „braunes Rauschen“. Dabei bedeutet „weißes Rauschen“, daß alle Frequenzen im Hörbereich ungefähr gleich stark vertreten sind. Während eines gewissen Beobachtungszeitraums können sie wegen der zufälligen Natur des Signals nicht genau gleich stark auftreten, aber über lange Zeit gemittelt sollte es keine Unterschiede zwischen den Frequenzbändern geben. Die anderen beiden Bezeichnungen beziehen sich auf Rauschen mit einem zunehmenden Übergewicht der tiefen („roten“) Frequenzen. Rosa Rauschen verwendet man, um auszugleichen, daß die cochleären Frequenzkanäle nicht gleich breit sind, sondern in der Breite zu den oberen Frequenzen hin zunehmen. Rosa Rauschen bedenkt alle Frequenzkanäle mit gleich viel Energie. Weißes Rauschen hingegen erregt die oberen Frequenzkanäle mehr als die unteren. Dies ist für unsere Untersuchungen kein Nachteil und wird durch die leichtere Erzeugung und Verarbeitung von weißem Rauschen (Anhang Anhang A:) aufgehoben.

Wenn man Struktur definiert als inneren Zusammenhang, so folgt, daß weißes Rauschen maximal unstrukturiert ist. Wie aus Anhang Anhang A: hervorgeht, kann man es aus einer Folge von Zufallszahlen erzeugen, also aus Zahlen, zwischen denen kein Zusammenhang besteht. Nun ist der menschliche Wahrnehmungsapparat darauf ausgelegt, Strukturen zu erkennen, und das tut er selbst da, wo keine Strukturen sind. Wenn man z.B. lange genug auf ein Zufallsmuster wie in Abb. 3.1 schaut, werden unwillkürlich Strukturen sichtbar, die nicht in das Bild hineingelegt worden sind.

Eine andere Demonstration der Unfähigkeit des menschlichen Wahrnehmungsapparates, Zufall als solchen zu akzeptieren, gibt Donald E. Knuth in seinem Buch The Art of Computer Programming (1981) bei der Frage, wie man Zufallsgeneratoren darauf überprüft, ob sie tatsächlich (pseudo–) zufällige Zahlenfolgen erzeugen: jedenfalls nicht durch Inspektion. Als Beispiel führt er die Ziffernfolge der Zahl an. Diese gilt als hochgradig seriell unabhängig: bisher bestand sie alle Tests auf serielle Abhängigkeiten, denen sie unterworfen wurde. Das hat nicht verhindert, daß Zahlenmystiker in dieser Folge Strukturen sahen (siehe Abb. 3.4), die sie

17

als Beleg dafür ansahen, daß diese Zahl etwas Geheimnisvolles zu bedeuten habe. Sie glaubten, man finde in der Zahl die Geschichte der Menschheit in Vergangenheit und Zukunft kodiert, man müsse den Kode nur entschlüsseln.

Abb. 3.1: Dieses Zufallsmuster entstand, indem für jeden der 256160 Punkte ein Grauwert zwischen 0 (Schwarz) und 255 (Weiß) gewürfelt wurde. Bei längerer Betrachtung vermeint man Strukturen wie z.B. Kreise, Tiergesichter, oder Körperteile zu erkennen.Wenn bei der visuellen Wahrnehmung und bei so etwas abstraktem wie der ZahlenwahrnehmungStrukturen in zufällige Signale hineingesehen werden, dann ist es nicht verwunderlich, daß auch der auditive Wahrnehmungsapparat versucht, aus einem zufälligen Signal wie weißem Rauschen Strukturen herauszuhören. Daß ihm das gelingt, wird durch die Wahrnehmbarkeit der sich

3.14159265358979323846264338327950....

Abb. 3.4: Beispiel für vermeintliche Strukturen in der Zahl . Die erste Doppelziffer, die sich wiederholt, ist die 26 (fett hervorgehoben). Um das zweite Vorkommen der 26 ist eine konzentrische Gruppe von sich wiederholenden Doppelziffern angeordnet.

18

wiederholenden Struktur von periodischem Rauschen bewiesen. Es gelingt ihm allerdings nicht für normales, nichtrepetitives Rauschen (dieses Phänomen wird in Kapitel 6.1 und 6.2 ausführlicher diskutiert). Wenn es dem Wahrnehmungsapparat erst einmal gelungen ist, Strukturen zu entdecken, so werden diese Strukturen in kategorialere Kodes transferiert und auch so memoriert. Der Vorteil von Rauschen als Stimulus der Echogedächtnisforschung ist, daß der Transfer in kategoriale Kodes so gering wie eben möglich ist. Jedes andere Stimulusmaterial weist inhärent mehr Struktur auf und erleichtert daher dem Wahrnehmungsapparat diesen Transfer. Beim Versuch, mehr über das sensorische Ende der Verarbeitungskette herauszufinden, ist weißes Rauschen daher der optimale Stimulus.

3.2 Klassische Versuche mit periodischem RauschenDie erste Beschreibung von periodischem Rauschen erfolgte nicht in Zusammenhang mit Forschung zum Echogedächtnis, sondern zur Tonhöhenwahrnehmung. Guttman und Julesz (1963) haben diesen Stimulus in einem Kurzbeitrag vorgestellt, als sie auf der Suche nach der unteren Grenze der Tonhöhenwahrnehmung waren. Tonhöhe hängt normalerweise nicht vom Vorhandensein des Grundtons ab (missing fundamental). Also stellten sie sich die Frage, ob Periodizität auch noch für Töne festgestellt werden kann, deren Grundton außerhalb des Hörbereichs liegt. Dabei muß man sich überlegen, in welcher Phasenbeziehung die im Hörbereich liegenden Obertöne zueinander stehen sollen. Spezielle Phasenbeziehungen wie z.B. die Sinusphase (alle Obertöne haben ihren Nulldurchgang gleichzeitig mit dem Grundton) erzeugen spezielle Signale (in diesem Fall eine Klickfolge), für die es trivial ist, daß sie auch noch bei sehr langen Grundperioden als periodisch erkannt werden können. Um solche Signalauffälligkeiten zu vermeiden, kann man die Phasenbeziehungen aller Obertöne zufällig wählen. Das entspricht im Zeitbereich einer zufällig schwankenden Amplitude. So kann man z.B. für einen Ton mit einer Periode von zehn Millisekunden (bei einer Digitalisierungsfrequenz von 44.1 kHz wie bei einem CD-Player) 441 Amplitudenwerte zufällig würfeln. Wenn diese nun zyklisch wiederholt werden, entsteht ein Ton mit einem Grundton von 100 Hz und Obertönen von n  100 Hz in zufälliger Phasenbeziehung. Beim Hören erzeugt dieser Ton einen eindeutigen Tonhöheneindruck, der dem eines 100-Hz Sinustones entspricht. Nun kann

19

man die Periode verlängern (siehe auch Anhang Anhang A:.A.3), und erhält so einen gleichmäßigen Übergang bis hin zu weißem Rauschen für die Periodenlänge „unendlich“. Bei welcher Periodenlänge würde der Tonhöheneindruck enden?

Das Ergebnis war zugleich enttäuschend und überraschend. Der Tonhöheneindruck endete unweit der Hörschwelle für den Grundton, bei Periodenlängen von 50 ms (20 Hz). Die Wahrnehmbarkeit der Periodizität ging jedoch viel weiter. Erst bei Periodenlängen von 1-2 Sekunden wurde die rhythmische Struktur nicht mehr gehört. Guttman und Julesz unterteilten den Bereich der subtonalen Periodizitätsdetektion: Perioden kürzer als ca. 250 ms (schneller als 4 Hz) erzeugten einen Eindruck, der an das Laufen eines Außenbordmotors erinnerte (motorboating), während bei längeren Perioden ein rhythmisches Hauchen (whooshing) zu hören ist. Bei genauerem Hinhören bleibt es nicht dabei: Man erkennt eine Fülle von kleinen Details wie Klicken, Raspeln oder Summen, die im Rhythmus der Periode wiederkehren.

Die Wahrnehmung von periodischem Rauschen wurde vielfältig untersucht. Guttman und Julesz zeigten, daß Hochpaß- oder Tiefpaßfiltern das Phänomen nicht beeinträchtigten. Warren und Bashford (1981) konnten das Phänomen auch dann noch nachweisen, wenn der Stimulus auf ein 1/3-Oktavband beliebiger Mittenfrequenz beschränkt wurde. Außerdem untersuchten sie die Wahrnehmung von harmonischen Mischungen von periodischem Rauschen. Sie bildeten Mischungen, in denen die Periodenlängen in kleinen ganzzahligen Verhältnissen zueinander standen (1:2, 2:3, 3:4). In mehr als 65% aller Darbietungen konnten zwei oder mehr Rhythmen gehört werden. Dabei mußte allerdings das Verhältnis ganz genau eingehalten werden. Wenn sie z.B. zwei Rauschen mit fast gleicher Periodenlänge mischten, wurde der Periodizitätseindruck durch einen Unterschied der Perioden von nur 1/1000 zerstört. Im Unterschied zu Guttman und Julesz konnte ihre beste Versuchsperson auch noch Perioden bis zu zehn Sekunden Länge detektieren. Warren und Wrightson (1981), Warren (1982), und Patterson, Milroy und Lutfi (1983) untersuchten den Einfluß der Phase auf die Wahrnehmung von periodischem Rauschen. So wurde z.B. in aufeinander folgenden Zyklen die Rauschprobe invertiert (mit -1 multipliziert, d.h. um 180° gedreht) oder um andere Winkel (z.B. 90°) gedreht. Das änderte in dem für die vorliegende Arbeit relevanten Bereich von Periodenlängen jenseits der Tonhöhenempfindung nichts an der

20

Wahrnehmung der Periodizität. Warren, Wrightson und Puretz (1988) fanden eine Kontinuitätsillusion für periodisches Rauschen, d.h. der Stimulus wurde für eine kurze Zeit als periodisch empfunden, nachdem die Periodizität abgestellt worden war. Limbert (1984) konnte nachweisen, daß die Periodizität auch dann noch hörbar ist, wenn zugleich ein lauteres maskierendes kontinuierliches Rauschen gegeben wird. Pollack (1990) untersuchte Unterschiedsschwellen für periodisches Rauschen in der Gegenwart von maskierendem kontinuierlichem Rauschen im Bereich von 0.1 bis 10000 Hz.

Während viele Studien den Aspekt der Periodizitätsanalyse in den Vordergrund stellen (bis hin zur Verwendung des Begriffs infrapitch), stellt Nelson Cowan (1984) dieses Experiment richtig in den Zusammenhang von Gedächtnisexperimenten. Eine kleine informelle Beobachtung möge dies verdeutlichen: Wenn die Periodenlänge zufällig variiert wird, in dem ein wechselnd langes Teil am Ende der Rauschprobe weggelassen wird, dann ist die Periodizität zwar massiv gestört, der Wahrnehmungseindruck ändert sich jedoch nicht wesentlich. Man hört immer noch eine sich wiederholende Struktur, die jetzt keine genaue Periodizität mehr einhält, aber dadurch an Deutlichkeit nichts verliert. Für einen Mechanismus zur Periodizitätsanalyse ist das nicht verständlich, während ein Gedächtnismechanismus dies plausibel erklären kann, da er nicht darauf angewiesen ist, daß das Erinnerte in einem bestimmten Rhythmus wiederkehrt.

Limbert (1984) konnte nachweisen, daß nur zwei Wiederholungen benötigt werden, um eine spezielle Rauschprobe zu erlernen, und daß die Spurinnerhalb einiger Sekunden zerfällt. Bashford und Warren (1990) untersuchten das Wiedererkennen erlernter Segmente von periodischem in Breibandrauschen eingebetteten Bandpaßrauschen. Brubaker und Warren (1990) fanden, daß ein einmal erlerntes Segment wiedererkannt werden kann, wenn es in einem längeren Stück gefrorenen Rauschen eingebettet ist.

Auch einige Studien zu anderen repetierenden Stimuli (außer weißem Rauschen) sind in diesem Zusammenhang relevant. Preusser et al. (1970) und Preusser (1972) untersuchten, wie repetierte auditive Muster organisiert werden, wo z.B. der Startzeitpunkt gehört wird (siehe Abschnitt 3.4). Schubert und West (1969) verwendeten moduliertes weißes Rauschen und bestimmten die Anzahl der Wiederholungen, die nötig war, um sich wiederholende Muster von sich nicht wiederholenden Mustern zu

21

unterscheiden. Pollack (1972, 1975) zeigte, daß das Gedächtnis für Zufallsklickfolgen innerhalb einiger Sekunden zerfällt und anfällig ist gegen Interferenz im Retentionsintervall. Zyklische Muster hoher und tiefer Töne können unterschieden werden, aber die Ordnung der Elemente kann nicht angegeben werden (Broadbent und Ladefoged, 1959; Warren und Obusek, 1972; Warren und Ackroff, 1976). Die Bildung perzeptueller „Ströme“ (streams) hängt von der Periodenlänge, Ähnlichkeit, und anderen Gestaltprinzipien ab (einen Überblick bietet Bregman, 1990).

3.3 Experiment 1: Reproduzierbarkeit des MittappensWenn man periodisches Rauschen hört, ist es eine ganz natürliche Reaktion, daß man den Rhythmus der gehörten Struktur durch rhythmische Bewegungen, z.B. durch Mittappen des Rhythmus anzeigt. Auf diese Weise läßt sich schnell und informell überprüfen, ob zwei Personen das Gleiche in diesem Rauschen hören: dann würden sie im gleichen Rhythmus tappen. Außerdem handelt es sich um eine von den Versuchspersonen als leicht empfundene Tätigkeit. Der Tappzeitpunkt ist ein Indikator für das subjektive Perzept der Versuchsperson, der einfach zu erheben und gut mathematisch zu behandeln ist (z.B. Korrelation o.ä.).

Andere Versuche, die Perzepte zu objektivieren, schlagen regelmäßig fehl. So kann man den Versuchspersonen z.B. die Möglichkeit der freien, verbalen Beschreibung der von ihnen gehörten Struktur geben, oder sie Frequenzverläufe und Rauhigkeiten graphisch darstellen lassen. Man wird dabei auf eine derartige Fülle von verschiedenen Arten, ein und dasselbe darzustellen, stoßen, daß der Versuch des Vergleichs zwischen Versuchspersonen sich als aussichtslos erweist. Wenn man andererseits versucht, durch vorgegebene Kategorien diese Vielzahl einzuschränken, wird man wiederum nicht der Fülle der möglichen Perzepte gerecht. Am ehesten können sich zwei Versuchspersonen noch durch den Versuch der lautlichen Imitation darüber verständigen, ob sie dasselbe hören, aber diese Methode entzieht sich einer exakten wissenschaftlichen Quantifizierbarkeit.

Limbert und Patterson (1982, Limbert 1984) haben gezeigt, daß man zu periodischem Rauschen während einer Darbietung zuverlässig zu ein und derselben Phase tappt. Dazu boten sie ihren Versuchspersonen sehr lange Darbietungen periodischen Rauschens (über 100 Zyklen) und erhoben die Konsistenz des Tappens in einer solchen Darbietung. Es zeigte sich, daß die

22

Versuchspersonen überwiegend ganz konsistent zu ein und derselben Phase des Zyklus tappen konnten. Da aus der Rhythmusforschung bekannt ist, daß ein einmal vorgegebener Rhythmus nicht sehr konstant weiterproduziert werden kann, ist schon nach wenigen Zyklen überprüfbar, ob die Periodizität entdeckt worden ist oder nicht. Im folgenden werden in der Regel acht Zyklen als ausreichend gewertet. Auf diese Weise wird eine höhere Zahl getrennter Darbietungen erzielt als bei Limbert (1984). Deren Statistik war nicht ausreichend, um die Frage zu beantworten, ob Versuchspersonen in verschiedenen Darbietungen desselben Rauschens denselben Tappzeitpunkt wählen.

Es ist ein wichtiges Anliegen, die Verwendbarkeit des erhobenen Tappzeit-punktes für die Objektivierbarkeit der Perzepte systematisch zu untersuchen. Zumindest eine gewisse Korrelation der Tappzeitpunkte in verschiedenen Präsentationen desselben periodischen Rauschens (z.B. an verschiedenen Tagen) ist Voraussetzung dafür, daß mittels kleiner Variationen des Stimulus untersucht werden kann, inwieweit diese Manipulationen einen Einfluß auf die Perzeption des periodischen Rauschens haben. Wenn man darüber hinaus allgemeine Gesetzmäßigkeiten über die zugrundeliegenden Strukturbildungsprozesse ableiten will, müßte eine gewisse Korrelation der Tappzeitpunkte zwischen Versuchspersonen gegeben sein. Diese könnte allerdings vom kulturellen Hintergrund (siehe hierzu die Diskussion in Abschnitt F) und/oder vom Geschlecht der Versuchspersonen abhängen. Somit kommen wir zu folgenden drei aufeinander aufbauendenHYPOTHESEN:

1.) Die hörbar werdenden Perzepte beruhen auf Gesetzmäßigkeiten der Strukturbildung, die für eine bestimmte Versuchsperson konstant in der Zeit sind. Wenn dieselbe Versuchsperson in verschiedenen Darbietungen dasselbe periodische Rauschen geboten bekommt, müßten daher die in diesen verschiedenen Darbietungen erhobenen Tappzeitpunkte zu einem gewissen Grade miteinander korreliert sein.

2.) Die Gesetzmäßigkeiten der Strukturbildung sind für verschiedene Versuchspersonen ähnlich. Wenn für zwei Versuchspersonen ein Profil der möglichen Tappzeitpunkte für eine bestimmte Rauschprobe erhoben wird, sollten die Profile dieser beiden Versuchspersonen miteinander korreliert sein.

3.) Die individuellen Ausprägungen der Strukturbildung sind teilweise angeboren bzw. Ergebnis biologischer Reifungsprozesse, teilweise gelernt. Daher könnte ein unterschiedlicher kultureller Hintergrund (z.B. verschiedene Muttersprache) bzw. eine andere genetische Ausstattung (z.B. Geschlecht) zu meßbaren Unterschieden in diesen

23

Ausprägungen führen. Empirisch sollten die Korrelationen zwischen Versuchspersonen mit gleicher Muttersprache bzw. gleichem Geschlecht meßbar höher ausfallen.

I. Methodik

A. Versuchspersonen

Um einen Vergleich des kulturellen Einflusses verschiedener Muttersprachen zu ermöglichen, wurden die Versuchspersonen im Alter von 24 bis 40 Jahren aus drei verschiedenen Herkunftsländern ausgewählt (D: Deutschland, F: Frankreich und C: China, genauer: Peking, mit gleichem Dialekt). Jede Nationalitätengruppe bestand aus zwei männlichen (Index 1 und 2) und einer weiblichen (Index 3) Versuchsperson. Versuchsperson D1, F1 und F2 hatten schon an psychoakustischen Experimenten teilgenommen. Zum Zeitpunkt des Experiments lebten alle Versuchspersonen seit mindestens einem Jahr in Frankreich und waren des Französischen (und im übrigen auch des Englischen) mächtig.

B. Stimuli

Das periodische Rauschen wurde mit cosinusoidalen Rampen ein- bzw. ausgeschaltet. Die Rauschproben wurden digital erzeugt wie im Anhang A beschrieben. Sie wurden von 16-bit Konvertern mit 20 kHz gewandelt. Die Standardabweichung des Gaußschen Rauschen war 10% des Konvertierbereichs, die spektrale Energiedichte war 24 dB SPL pro Hz. Die verwendeten Rauschproben können mit dem in Anhang A beschriebenen Zufallsgenerator in nachfolgenden Studien exakt reproduziert werden. Neun verschiedene Rauschproben wurden erzeugt (PR1-PR9), und zwar mit den Indizes 1-9 des Algorithmus. Die Zykluslänge war 500 ms für PR1-PR3, 600 ms für PR4-PR6, und 700 ms für PR7-PR8. Das heißt, für PR1 wurden die ersten 10000 Punkte (= 500 ms) der mit Index 1 erzeugten Zufallszahlenfolge immer wieder aneinandergehängt und diese Zahlenfolge konvertiert. Es ist offensichtlich, daß bei diesem Vorgehen die „Schnittstelle“ (der Anfang der Zufallszahlenfolge) kein hörbares Artefakt produziert, da die Zufallszahlen seriell unabhängig sind. Ein zufälliger Anteil des ersten Zyklus wurde weggelassen, so daß zwei verschiedene Darbietungen desselben Stimulus (z.B. PR1) nicht mit demselben Startpunkt anfingen.

24

C. Verfahren

Die Versuchspersonen saßen in einer schalldichten Kammer und hörten das periodische Rauschen über Sennheiser 2002 Kopfhörer. Sie wurden instruiert, dem Stimulus zunächst einige Sekunden zuzuhören ohne mitzutappen. Dann sollten sie im Rhythmus mit der gehörten Periodizität mittappen, und zwar einmal pro Periode. Wenn sie mehrere Ereignisse pro Periode hörten, sollten sie zu demjenigen Ereignis tappen, das sie als besonders betont empfinden. Wenn einmal zwei Ereignisse nahezu gleichgewichtig empfunden wurden, sollten sie zu demjenigen Ereignis tappen, das besser zeitlich definiert war (also eher das Klicken als das Raspeln). Neun verschiedene Stimuli wurden in Zufallsordnung angeboten, unter Vermeidung einer direkten Wiederholung ein und desselben Stimulus. Die Darbietung eines Stimulus (Einzelversuch) startete automatisch zwei Sekunden nach der vorhergehenden und endete, wenn die Versuchsperson achtmal getappt hatte. Obwohl Pilotuntersuchungen gezeigt hatten, daß es keinen Unterschied macht, ob die Einzelversuche am selben Tag oder nach zwei Monaten erfolgten, wurde ein fester Versuchsplan eingehalten, bei dem 300 Einzelversuche in drei Sitzungen zu je 100 Einzelversuchen an drei verschiedenen Tagen innerhalb einer Woche stattfanden.

II. Ergebnisse

A. Histogramme der Tappzeitpunkte

In jedem Einzelversuch wurden n = 8 Tappzeitpunkte ti bestimmt. Sie wurden als n komplexe Einheitsvektoren vi = exp(2iti/) aufgefaßt. Dabei ist die Länge des Rauschzyklus (500, 600 oder 700 ms) in diesem Einzelversuch. Aus der Phase des Summenvektors V = vi errechnet sich der mittlere Tappzeitpunkt <t>:  = 2<t>/. Die Länge L = ||V|| des Summenvektors ist maximal (L=n) bei Tappen perfekt im Rhythmus der Periodizität, und von der Größenordnung n bei zufälligem Tappen. Für fast perfektes Tappen (2ti/ = , mit kleinem ) ergibt sich für L

Gl. 3.1: L = n cos() n (1 ²/2), (2 2L/n)½.

Das Ausschlußkriterium für einen Einzelversuch war 0.2 . Das war relativ selten der Fall (6%), d.h. in 94% der Einzelversuche konnte der

25

mittlere Tappzeitpunkt zuverlässig aus den Daten bestimmt werden. Abb.3.2 zeigt Histogramme für jede Versuchsperson und Rauschprobe. Die Abszisse zeigt die Tappzeitpunkte <t> (Binweite 25 ms), und die Ordinate die Häufigkeit, mit der dieser Tappzeitpunkt gewählt wurde.

Man erkennt, daß in der Regel im Sinne von Hypothese 1 ein bis zwei bevorzugte Tappzeitpunkte je Rauschprobe gewählt wurden. Dabei ist die zyklische Natur der Abszisse zu beachten: liegen wie bei <PR2,C2> zwei Häufungen an den Enden der Abszisse, dann beziehen sie sich doch auf nur einen Tappzeitpunkt. Vergleicht man die Histogramme für eine bestimmte Rauschprobe zwischen den Versuchspersonen, dann zeigt sich oft eine bemerkenswerte, allerdings nicht perfekte Korrelation. Die folgenden Abschnitte leiten Korrelationsmaße ab, die dies genauer quantifizieren sollen.

B. Varianzbrüche

Sei kj (j=1,...,m) die Anzahl der Einträge in eines der m Bins eines bestimmten Histogramms (m=20, 24, oder 28). Der Erwartungswert E(k) = kj/m ist gleich K/m, wobei K = kj die Gesamtzahl aller Einträge in dieses Histogramm ist. Die Wahrscheinlichkeitsdichte pj sei (über Bins der Weite 1/m) definiert als

Gl. 3.2: pj = kj m / K.

Der Erwartungswert E(p) ist gleich eins. Die Varianz Vp ist

Gl. 3.3: Vp = E(p²) E²(p) = E(p²) 1.

Zufallstappen würde eine durchschnittliche Varianz von Vpr m/K

erzeugen. Wenn es im Histogramm jedoch eine Häufung von Tappzeitpunkten gibt, ist die gemessene Varianz Vp größer. Das Verhältnis Vp/Vp

r von beobachteter zu zufälliger Varianz ist ein Maß dafür, inwieweit die Versuchsperson (VP) für diese Rauschprobe ihr Tappen in verschiedenen Darbietungen auf einige wenige Bins konzentrieren konnte. In Tab. 3.1 ist in der zweiten Zeile für jede VP das über alle neun Rauschproben gemittelte Varianzverhältnis wiedergegeben. Daraus geht hervor, daß es für alle Versuchspersonen deutliche Häufungen der Tappzeitpunkte im Histogramm entsprechend Hypothese 1 gibt. Insbesondere die Versuchspersonen D1, F2

26

und C1 zeigen eine hohe Konzentration ihrer Tappzeitpunkte auf wenige Bins.PR1 PR2 PR3 PR4 PR5 PR6 PR7 PR8 PR9

500 ms 600 ms 700 ms

Abb. 3.2: Histogramme der Tappzeitpunkte in Experiment 1. Die Histogramme zeigen die Häufigkeit (Ordinate) eines bestimmten Tappzeitpunktes (Abszisse, eingeteilt in Bins zu je 25 ms).

VP D1 D2 D3 F1 F2 F3 C1 C2 C3 MittelVp / Vp

r 8.1 2.4 4.7 4.1 7.5 3.7 7.7 4.4 3.6 5.1 ± 2Vx / Vx

r 18.2 5.2 10.5 11.9 15.1 10.4 17.5 8.8 8.2 11.8 ± 4.1

27

D1

D2

D3

F1

F2

F3

C1

C2

C3

Tab. 3.1: Mittlere Varianzbrüche je Versuchsperson. In der zweiten Zeile sind die gewichteten Varianzbrüche dargestellt, siehe Abschnitt D.

C. Autokorrelation

Sei pjt die um t Bins rotierte Wahrscheinlichkeitsdichte eines Histogramms.

Die Autokovarianz Vpp(t) und der Autokorrelationskoeffizient a(t) sind dann

Gl. 3.4: Vpp(t) = E(ppt) 1, a(t) = Vpp(t) / (VpVpt)½ = Vpp(t) / Vp.

Die Autokorrelation ist im Mittel über alle Bins gleich Null. Abb. 3.3 zeigt die Autokorrelation gemittelt über alle Rauschproben gleicher Länge als Funktion der Verschiebung t. Die drei Teilbilder entsprechen den verschiedenen Längen der Rauschproben (500, 600 bzw. 700 ms). Die schraffierten Histogrammbalken entsprechen dem Mittel über alle Versuchspersonen, die fett gezeichneten Histogrammbalken den Mittelwerten nur für die besten drei Versuchspersonen (D1, F2, C1). Ganz offensichtlich sind eng benachbarte Bins gut korreliert, wie der Gipfel bei Null zeigt. Auch dies ist eine Bestätigung von Hypothese 1. Die Breite dieses Gipfels entspricht der Genauigkeit, mit der dieser Tappzeitpunkt in einer späteren Darbietung wiedergefunden werden konnte. Ein Bin entspricht 25 ms.

Die Autokorrelationsfunktionen für die drei besten Versuchspersonen fallen etwas schneller gegen Null. Außerdem erkennt man hier einen Nebeneffekt etwas deutlicher: Wenn die Versuchsperson nicht den bevorzugten Tappzeitpunkt reproduziert, dann hat sie eine leicht erhöhte Wahrscheinlichkeit, genau in Gegenphase zu tappen. Limbert (1984) hatte dies schon vermutet, konnte es aber auf Grund der geringen Statistik seiner Untersuchung nicht nachweisen. Dies wird besonders für 700 ms deutlich. Abb. 3.4 zeigt einen Fit einer Funktion aus zwei Gaußschen Normalverteilungen mit Schwerpunkt bei 0 und 0.5 (Zykluslänge = 1). Dabei macht die Höhe des Nebengipfels bei 0.5 bereits 11% der Höhe des Hauptgipfels bei 0 aus. Die Standardabweichung ist mit 0.05 für den Hauptgipfel recht schmal, was die hohe Reproduzierbarkeit des Tappzeitpunktes in einer späteren Darbietung widerspiegelt. Dies gilt auch für den Nebengipfel (Standardabweichung 0.06), so daß es sich bei diesem Nebengipfel wohl nicht ein Artefakt, bedingt durch die den Hauptgipfel begleitenden Täler, sondern um ein eigenständiges Phänomen handelt. Eine

28

mögliche Interpretation ist, daß ein stark ausgeprägtes Detail der Wellenform, das ein gut hörbares Perzept auslöst, durch eine Art „rhythmischer Verstärkung“ andere Details der Wellenform ins Blickfeld bringt, die genau eine halbe Zykluslänge von ihnen entfernt sind.

-0.5

0

0.5

1

AlleBeste

-0.5

0

0.5

1

AlleBeste

-0.5

0

0.5

1

AlleBeste

Abb. 3.3: Autokorrelation der Bins in den Histogrammen der Tappzeitpunkte (Abb.3.2), getrennt für die verschiedenen Längen der Rauschzyklen (500, 600 bzw. 700 ms), über alle (schraffiert) bzw. nur die drei besten Versuchspersonen (fett) gemittelt.

-0.5

0

0.5

1

-0.5 0 0.5

29

Abb. 3.4: Fit einer Funktion aus zwei Normalverteilungen an das Autokorrelationshistogramm für die besten drei Versuchspersonen für 700 ms, aufgetragen über der relativen Zykluslänge. Man erkennt deutlich den zweigeteilten Nebengipfel bei 0.5 Zykluslängen.

D. Gewichtete Korrelation

Die in der zweiten Zeile von Tab. 3.1 aufgelisteten Varianzbrüche haben bisher Nachbarschaftsbeziehungen zwischen den Bins nicht berücksichtigt: es spielte keine Rolle, ob zwei Tappzeitpunkte in die Histogrammbins 8 und 9 oder 8 und 17 eingingen. Im folgenden soll eine gewichtete Varianzberechnung durchgeführt werden, bei der benachbarte bins miteinander verbunden werden. Die gewichtete Wahrscheinlichkeitsdichte xJ sei

Gl. 3.5: xj = d=3...3 wd (kj+d m/K), wobei d=3...3 wd = 1.

Dabei ist d der Abstand zwischen zwei bins, und wd der Gewichtsfaktor, der zwei Histogrammeinträge im Abstand d verbinden soll. Der Erwartungswert E(x) ist wiederum gleich eins. Die im folgenden verwendeten Gewichte sind 0.25, 0.20, 0.125 und 0.05 für ||k|| = 0,1,2,3 (siehe auch Abb. 3.5). Sie wurden entsprechend dem Hauptgipfel der Autokorrelationsfunktionen(Abb. 3.3) gewählt. Anders ausgedrückt, handelt es sich bei den xj um eine verschmierte Version der originalen Schätzer pj. Sie ist bereinigt von kurzreichweitigen zufälligen Fluktuationen. Dadurch kann man Strukturen in den Histogrammen besser analysieren, die die Größe dieser Gewichtsfunktion haben oder größer sind. Kleinere Strukturen sollten auch gar nicht meßbar sein, da sie durch die Tappungenauigkeit verdeckt werden müßten. Die Varianz Vx für die verschmierte Wahrscheinlichkeitsdichte ist

30

Gl. 3.6: Vx = E(x²) 1.

Für diese verschmierten Wahrscheinlichkeitswerte xj ist die für eine zufällige Verteilung der Tappzeitpunkte zu erwartende Varianz erheblich kleiner als für die originalen pj, da viele der zufälligen Fluktuationen geglättet werden. Die tatsächlichen Tappzeitpunktshistogramme jedoch zeigen Strukturen, die nicht geglättet werden, da sie die Breite der Glättungsfunktion haben. Berechnet man daher die Varianzbrüche von Tab.3.1 mit diesen gewichteten Wahrscheinlichkeitsdichten, ergeben sich weitaus höhere Varianzbrüche (dritte Zeile von Tab. 3.1). Dies wäre bei Zufallstappen nicht zu erwarten und bestätigt daher erneut Hypothese 1. Da die Entfernung der zufälligen Fluktuationen durchaus im Sinne dieser Datenanalyse ist, werden im folgenden die gewichteten Wahrscheinlichkeitsdichten verwendet.

In Tab. 3.1 wurden die Varianzbrüche über die Rauschproben gemittelt, so daß die unterschiedliche Tappräzision der Versuchspersonen deutlich wurde. In Tab. 3.2 wurden die gewichteten Varianzbrüche über Versuchspersonen gemittelt. So wird für jede Rauschprobe die „Eindeutigkeit“ ermittelt, mit der diese Rauschprobe (jeweils in einer bestimmten Versuchsperson) immer ein und denselben Tappzeitpunkt auslöst. Die Standardabweichung der Werte in Tab. 3.2 ist 1.9, in der entsprechenden Zeile von Tab. 3.1 ist sie 4.1; daraus wird deutlich, daß die Reproduzierleistung der Versuchspersonen erheblich mehr variiert als die Eindeutigkeit der Rauschproben. Die Leistung der Versuchspersonen könnte durch Training

0

0.1

0.2

0.3

-5 -4 -3 -2 -1 0 1 2 3 4 5

Abb. 3.5: Die Gewichte, die bei der Berechnung der gewichteten Korrelationen Anwendung fanden.

31

bzw. durch Vorauswahl (nach Musikalität, oder auf Grund eines kurzen Tests) deutlich gesteigert werden.

Stimulus PR1 PR2 PR3 PR4 PR5 PR6 PR7 PR8 PR9 Mittel

Vx / Vxr 10.6 12.9 13.5 10.2 10.8 13.7 8.1 14.4 11.6 11.8 ± 1.9

Tab. 3.2: Gewichtete Varianzbrüche gemittelt über Versuchspersonen. Diese Werte streuen weniger als die über die Rauschproben gemittelten gewichteten Varianzbrüche: die Rauschproben sind weniger unterschiedlich als die Versuchspersonen.

E. Korrelationen zwischen Versuchspersonen

Sei yj die gewichtete Wahrscheinlichkeitsdichte eines zweiten Histogramms. Die Kovarianz Vxy und der Korrelationskoeffizient sind dann

Gl. 3.7: Vxy = E(xy) 1, r = Vxy / (VxVy)½.

Rhythmisches Tappen erfolgt in dem in Frage kommenden Frequenzbereich (hier ca. 2 Hz) im allgemeinen antizipatorisch zu den wahrgenommenen Ereignissen. Wenn man z.B. einen eindeutig definierten Stimulus wie eine rhythmische Klickfolge abspielt, dann wird rhythmisches Mittappen ca. 30 ms vor dem Klick erfolgen. Dies liegt an dem Versuch der Versuchsperson, die beiden Perzepte zu synchronisieren. Da aber die Übertragung der taktilen Wahrnehmung deutlich länger braucht als die der auditiven Wahrnehmung, tappt die Versuchsperson etwas zu früh. Der genaue Betrag der Antizipation ist von Versuchsperson zu Versuchsperson unterschiedlich (einen Überblick gibt Schmidt, 1968). In den Daten von Experiment 1 (Abb. 3.2) sehen wir diesen Effekt am deutlichsten beim Vergleich von F1 und F2. Diese beiden zeigen eine gute Übereinstimmung ihrer Tappzeitpunkte. Dabei tappt F2 allerdings immer etwas später als F1. Um vor einem Vergleich der Versuchspersonen einen Ausgleich solcher Unterschiede zu ermöglichen, wurden je Versuchsperson kleine Verschiebungen der Histogramme um ein oder höchstens zwei Bins zugelassen. Diese Verschiebungen (Shifts) wurden dann auf alle Histogramme dieser Versuchsperson angewandt. Der Betrag dieser Verschiebung ist in der zweiten Zeile von Tab. 3.3 wiedergegeben. Er wurde so gewählt, daß die Gesamtkorrelation maximal wurde. Die Korrelationen zwischen verschiedenen Versuchspersonen nach Gewichtung (siehe oben,

32

Abschnitt D) und Korrektur auf Antizipationszeitdifferenzen sind in der Matrix von Tab. 3.3 wiedergegeben.

VP D1 D2 D3 F1 F2 F3 C1 C2 C3

Shift (Bins) 1 0 0 2 -1 1 0 -1 2

D2 .36

D3 .56 .26

F1 .38 .25 .47

F2 .37 .43 .47 .63

F3 .50 .44 .38 .49 .60

C1 .53 .32 .43 .20 .26 .29

C2 .30 .69 .41 .33 .53 .50 .40

C3 .60 .40 .59 .51 .37 .40 .49 .37Tab. 3.3: Korrelationen zwischen Versuchspersonen nach Wichtung der Wahrscheinlichkeitsdichten (Abschnitt D) und Korrektur der Antizipationszeitdifferenzen (2. Zeile). Die durchschnittliche Korrelation beträgt 0.43.

Wie aus der Matrix von Tab. 3.3 hervorgeht, gibt es ganz im Sinne von Hypothese 2 beachtliche Korrelationen zwischen verschiedenen Versuchspersonen. Jeder dieser Korrelationskoeffizienten geht aus 216 Wertepaaren entsprechend der Zahl der Histogrammbalken pro Versuchsperson hervor. Wenn man berücksichtigt, daß diese nicht unabhängig voneinander sind, kommt man bei der beobachteten Breite der Autokorrelationsfunktion auf ca. 100 unabhängige Werte. Für n=100 ist eine positiv zu erwartende Korrelation signifikant größer als Null auf einem 5%-Niveau (einseitiger Test) ab r>0.1645. Somit ist selbst der kleinste Korrelationswert aus Tab. 3.3 (0.2 zwischen C1 und F1) eindeutig signifikant. Als zusätzlicher Test wurden dieselben Daten randomisiert korreliert (nach Vertauschen und Rotieren der Rauschproben). Dabei ergaben sich in Übereinstimmung mit obiger Abschätzung Werte zwischen -0.1 und 0.1.

33

F. Einfluß von Muttersprache und Geschlecht

Es ist bekannt, daß sich die sensorischen Systeme in Abhängigkeit von der Exposition mit Reizen entwickeln. So können z.B. junge Katzen, die in einer künstlichen Welt mit ausschließlich vertikalen Linien aufgewachsen sind, später horizontalen Linien nur erschwert erkennen. Für den auditiven Bereich bietet besonders das sprachliche Material, mit dem wir konfrontiert werden, eine Quelle für mögliche Unterschiede. Unser Wissen um Sprachproduktion leitet z.B. unsere Wahrnehmung des Betonungszeitpunktes bei Sprachmaterial: Fowler (1979) und Marcus (1981) ließen ihre Versuchspersonen die einzelnen Abstände zwischen gesprochenen Ziffern so einstellen, daß diese die Ziffernfolge als gleichabständig empfanden. Dabei traten systematische Unterschiede zur physikalischen Gleichabständigkeit auf, die durch das Wissen der Versuchspersonen um Sprachproduktion (angenommene artikulatorische Bewegungen zur Erzeugung des Wortes) erklärbar sind. Somit könnte der verschiedene kulturelle Hintergrund der Versuchspersonen zu Unterschieden in der Wahrnehmung von periodischem Rauschen führen. Auch Cutler et al. (1983; Cutler, 1991) konnten Unterschiede bei der Entdeckung und Erkennung komplexer Schalleigenschaften sowie bei deren gestaltmäßigerOrganisation finden. Die Auswahl der Versuchspersonen aus unterschiedlichen Ländern sollte einen Vergleich zwischen der Wahrnehmung von periodischem Rauschen bei verschiedenen Muttersprachen ermöglichen.

Der Durchschnitt aller Korrelationskoeffizienten in Tab. 3.3 ist 0.43. Die Korrelation zwischen Versuchspersonen mit der selben Muttersprache ist geringfügig höher (0.463) als die Durchschnittskorrelation, aber dieser Effekt ist nicht signifikant. Er wird hauptsächlich durch die Untergruppe der Franzosen hervorgerufen, die mit 0.575 signifikant besser korrelieren als die anderen. Die weiblichen Versuchspersonen zeigen ebenfalls eine geringfügig erhöhte Gruppenkorrelation (0.456), die allerdings ebenfalls nicht signifikant ist. Somit kann Hypothese 3 auf der Basis der hier vorliegenden Daten nicht bestätigt werden.

34

Abb. 3.6 gibt die Korrelationen zwischen den Versuchspersonen graphisch wieder. Die zweidimensionalen Positionen wurden so gewählt, daß die Abstände so gut wie möglich proportional zu -log(r) sind. Je besser die Korrelation, desto geringer der Abstand. Außerdem wurde die Linienstärke entsprechend der Korrelation gewählt. Aus Abb. 3.6 wird deutlich, daß kulturelle oder geschlechtsspezifische Abhängigkeiten im Sinne von Hypothese 3, wenn sie überhaupt existieren, vernachlässigbar sind. Lediglich die Untergruppe der Franzosen ist auch in dieser Abbildung gut vom Rest separierbar. Dies könnte ein Zufall sein. Man muß allerdings berücksichtigen, daß zum Zeitpunkt des Experiments alle Versuchspersonen seit mindestens einem Jahr in Frankreich lebten. Somit lebten die beiden anderen Untergruppen in einem sprachlichen Umfeld, daß ihrer Muttersprache nicht entspricht. Würde man die Studie wiederholen, aber in

Abb. 3.6: Graphische Darstellung der Korrelationen zwischen den verschiedenen Versuchspersonen. Eine gute Korrelation zwischen zwei Versuchspersonen drückt sich zum einen in der Nähe der Positionen, zum anderen in der Linienstärke aus. Es ist keine kulturelle Gruppierung erkennbar.

35

drei verschiedenen Ländern durchführen, so könnten eventuell vorhandene Unterschiede besser herauskommen.

III. Zusammenfassung

Das Tappen zu periodischem Rauschen ist nicht nur konsistent innerhalb einer Darbietung (Limbert und Patterson, 1982), sondern auch in einem hohen Grad reproduzibel in späteren Darbietungen desselben Stimulus (Hypothese 1). Zweideutige Rauschproben rufen eventuell zwei verschiedene bevorzugte Tappzeitpunkte hervor. In diesem Fall ist der zweite Tappzeitpunkt oft eine halbe Periode vom ersten entfernt. Dies spricht für eine Art „rhythmischer Verstärkung“ eines weniger salienten Details durch ein stark salientes Detail, wenn der Abstand zwischen ihnen genau einen halben Zyklus beträgt. Wenn z.B. in einer Rauschprobe vier Perzepte (a,b,c,d) ungefähr gleichabständig verteilt sind, und wenn für die Versuchsperson Perzept (a) am salientesten klingt (also: ... d a b c d a b c d a b c ...), dann würde sie auf die Frage nach dem zweitbesten Perzept wahrscheinlich (c) benennen.

Darüber hinaus gibt es eine überzufällige Korrelation zwischen den Tappzeitpunkten verschiedener Versuchspersonen (Hypothese 2). Die unterstellten Abhängigkeiten von der Muttersprache bzw. dem Geschlecht (Hypothese 3) konnten hingegen nicht bestätigt werden. Offensichtlich beruhen die Vorgänge, die bei periodischem Rauschen zur Wahrnehmung der Perzepte führen, auf vergleichbaren Analysen der physikalisch gegebenen Stimulusmuster. Daher kann (auch und gerade mit Mittappen als methodischem Ansatz) die Frage angegangen werden, welche physikalischen Eigenschaften der zufälligen Wellenform bei weißem Rauschen zu einem salienten Perzept führen, und welche nicht. Dies ist das Anliegen der nächsten vier Abschnitte (3.4-3.7). Selbst wenn die Wahrnehmung von periodischem Rauschen für alle Zuhörer eindeutig und dieselbe wäre, würde man keine perfekte Korrelation erwarten. Auch die rhythmische Organisation des Gehörten unterliegt interindividuellenSchwankungen. Zyklische Muster besitzen keinen gut definierten Startpunkt. Um Unterschiede in der Wahrnehmung (im Gegensatz zu solchen in der perzeptuellen Organisation) herauszuarbeiten, werden die lokalen physikalischen Träger der Perzepte in den nächsten Abschnitten herausgearbeitet.

36

3.4 Holistische vs. lokale Verarbeitung von periodischem RauschenBrubaker und Warren (1987) untersuchten die Frage, ob die Wahrnehmung von periodischem Rauschen auf Singularitätsentdeckung oder auf ganzheitlicher (holistic) Musterverarbeitung beruhe. Sie konnten nachweisen, daß Versuchspersonen leicht zwischen zyklischen Darbietungen von Folgen von drei Rauschsegmenten unterscheiden konnten, die sich nur in der Anordnung dieser drei Segmente (ABC versus CBA) unterschieden. Sie folgerten, daß die Wahrnehmung von periodischem Rauschen nicht nur auf Singularitätsentdeckung beruhen könne, sondern mindestens auch eine holistische Verarbeitung des gesamten Musters beinhaltet. Dies ist vergleichbar zu ähnlichen Effekten, wie sie bei Studien mit schnellen zyklischen Folgen kurzer Töne (z.B. Warren und Ackroff, 1976) gefunden wurden. Es zeigt sich in der Regel, daß die Folgen unterschieden werden können, auch wenn die Reihenfolge der Töne nicht korrekt wiedergegeben werden kann.

Mit ihrer Studie haben Brubaker und Warren gezeigt, daß eine holistische Mustererkennung eine Rolle spielt. Sie haben die Beteiligung einer Singularitätsentdeckung jedoch weder bewiesen noch ausgeschlossen. Es ist nicht ganz abwegig, zu unterstellen, daß es sich bei periodischem Rauschen vorwiegend um eine holistische Verarbeitung handelt. Schließlich sind die einzelnen Elemente nicht hörbar, wenn sie nicht in zyklischer Wiederholung geboten werden. Dies ist anders als bei den anderen zum Vergleich herangezogenen schnellen zyklischen Folgen, bei denen jedes einzelne Element für sich genommen gut hörbar ist und daher eines davon die anderen im Sinne einer Singularität an Salienz übertreffen könnte.

Um zu erläutern, was eine holistische Verarbeitung für Konsequenzen hätte, sei eine Studie von Preusser (1972) zitiert. Preusser verwendete Tonfolgen, die aus lediglich zwei verschiedenen Tönen (nennen wie sie A und B) bestehen. Eine kurze Abfolge dieser beiden Töne (z.B. AABABBBBABA) wurde nun zyklisch präsentiert, und die Versuchspersonen sollten angeben, wo sie den Startpunkt dieser zyklischen Folge hören. In diesem Fall ist eine Singularitätsverarbeitung weitestgehend ausgeschlossen, da die einzelnen Elemente kaum unterschiedlich salient sein können, solange der

37

Frequenzabstand zwischen A und B gering gehalten wird. Selbst ein geringfügiger Salienzunterschied zwischen A und B besäße kaum Erklärungswert, da sowohl A als auch B viele Male in der Abfolge vorkommen. Preusser beobachtete nun, daß als Startpunkt am häufigsten der Start (und etwas weniger häufig: das Ende) der längsten Folge von identischen Tönen gewählt wurde, in diesem Beispiel also das erste oder das letzte B des Vierer-B-Blocks. Dies ist in der Tat eine holistische Regel, denn nur, wenn das ganze Muster bekannt ist und berücksichtigt wird, kann bestimmt werden, wo die längste Folge identischer Töne beginnt bzw. endet. Wenn man einen einzigen Ton so einer Folge ändert, stört man evtl. die längste Sequenz, oder man erzeugt eine längere Folge an anderer Stelle (z.B. durch Verändern des ersten B's zu A erzeugt man einen Fünfer-A-Block: AA A A BBBBABA).

Für die weitere Theoriebildung zur Wahrnehmung von periodischem Rauschen ist es wichtig, zu überprüfen, ob Singularitätsentdeckung eine Rolle spielt oder nicht. Wenn nämlich Singularitäten die Basis der Verarbeitung bilden, dann stellt sich die Frage, warum man diese normalerweise nicht hört. Eine ausführlichere Diskussion dieser Frage findet sich in Kapitel 6.1 und 6.2. Als Kriterium einer rein holistischen Interpretation kann man festhalten, daß geringfügige Änderungen zu deutlichen Veränderungen der gehörten Struktur führen. Ist die holistische Verarbeitung jedoch lediglich einer lokalen Verarbeitung nachgeschaltet (z.B. Rhythmisierung von lokal hörbar gewordenen Details), dann sollten auch große Veränderungen der Wellenform, solange sie nur bestimmte lokale Bereiche intakt lassen, die Reaktion der Versuchsperson kaum beeinflussen. Da in Experiment 1 gezeigt worden ist, daß die Versuchspersonen in der Regel in der Lage sind, dieselben Tappzeitpunkte in späteren Darbietungen zu reproduzieren, können in den beiden folgenden Experimenten die dargebotenen Rauschproben verändert werden und es kann beobachtet werden, inwieweit diese Veränderung das Tappen der Versuchspersonen beeinflußt. Dabei soll die folgende Hypothese überprüft werden:

HYPOTHESE:

Die Wahrnehmung der Perzepte in periodischem Rauschen, die auf intraindividuell reproduzierbaren und interindividuell korrelierten Gesetzmäßigkeiten der Strukturbildung beruht, bezieht sich dabei auf lokale Eigenschaften des Stimulus, und nicht auf die Gesamtheit der Periode. Dabei wird lokal sowohl im temporalen

38

als auch im spektralen Sinne verstanden, d.h. es läßt sich im Spektrogramm eine Region eingrenzen, die Träger derjenigen Merkmale ist, die das Perzept hervorrufen. Empirisch müßte sich das daran erweisen, daß Manipulationen an anderen Stellen des Spektrogramms den Tappzeitpunkt nicht verändern.

3.5 Experiment 2: Temporale Eingrenzung

I. Methodik

Die Erzeugung des Rauschens erfolgte wie in Experiment 1. Diesmal kam aber nur Index 1 zur Anwendung. Sechs Sekunden von Index-1-Rauschen wurden erzeugt und im Speicher des Computers abgelegt. Zu jedem Einzelversuch wurde an einer zufällig gewählten Stelle ein Segment aus diesem Rauschen herausgeschnitten und zyklisch präsentiert. Dabei wurde darauf geachtet, daß aufeinanderfolgende Einzelversuche nie einander überlappende Segmente verwendeten. Die Länge des Segments war 400, 600 oder 800 ms, in zufälliger Reihenfolge. Die Schalldarbietung erfolgte wie in Experiment 1. Die gesamte 6 Sekunden lange Rauschprobe würde, zyklisch präsentiert, kaum als periodisch wahrgenommen werden. Die kurzen Segmente hingegen erzeugen gut wahrnehmbare periodische Strukturen. Indem gemessen wird, wo darin jeweils der Schwerpunkt gehört wird, kann untersucht werden, inwieweit dies vom Startpunkt und der Länge abhängt. Abb. 3.7 erläutert die Generierung des Rausches graphisch.

Die Versuchspersonen wurden instruiert, im gehörten Rhythmus mitzutappen. Im Gegensatz zu Experiment 1 wurde diesmal nicht dazu angehalten, eine bestimmte Komponente (weil kürzer oder prägnanter) den anderen vorzuziehen, sondern sie sollten tappen zu was immer ihnen gerade

Abb. 3.7: Graphische Erläuterung der Stimulusgenerierung in Experiment 2 am Beispiel eines 800-ms periodischen Rauschens.

39

und als Zyklus präsentieren

6 Sekunden weißes Rauschen im Speicher des Computers

800 ms Segment an zufälliger Stelle herausschneiden

passend vorkam. Jeder Einzelversuch startete zwei Sekunden nach dem vorhergehenden und endete, wenn die Versuchsperson achtmal getappt hatte. Das nachträgliche Ausschlußkriterium bzgl. der Tappräzision war wie in Experiment 1.

Ein Einzelversuch dauerte etwa 12 Sekunden. Die Versuchspersonen führten jeweils ca. 1000 Einzelversuche durch. Onset- und Offsetrampen waren cosinusoidal über 20 ms, und ein zufälliger Anteil des ersten Zyklus wurde weggelassen, um nicht schon durch den Einstiegspunkt einen Biasauszulösen.

Fünf Versuchspersonen nahmen an dieser Studie teil. Zwei hatten bereits an Experiment 1 teilgenommen (CK=D1, ME=D3). Die anderen Versuchspersonen erhielten zuvor mindestens eine Stunde entsprechendes Training.

II. Ergebnisse

Jeder Einzelversuch ist vollständig beschrieben durch die Angabe der Startposition des herausgeschnittenen Segments, seiner Länge, und dem von der Versuchsperson gewählten Tappzeitpunkt. Abb. 3.8 zeigt die Ergebnisse von Experiment 2. Die horizontale Achse entspricht den sechs Sekunden weißen Rauschens, die im Computerspeicher abgelegt waren. Jeder Tappzeitpunkt in einem Segment läßt sich unter Berücksichtigung des Startpunktes dieses Segmentes auf die sechs Sekunden beziehen: er entspricht einen Zeitpunkt innerhalb dieser sechs Sekunden auf der x-Achse. Die Punkte wurde entsprechend der Startzeitpunkte der Segmente vertikal versetzt. Dadurch liegen die Daten zu einer Versuchsperson in einem diagonalen Balken.

Ein Beispiel möge diese Art der Darstellung erläutern. Nehmen wir an, in einem Einzelversuch sei das Segment von 3.4 bis 4.2 Sekunden zyklisch präsentiert worden. Die Versuchsperson habe den Zeitpunkt 0.2 (bezogen auf dieses Segment) getappt. Bezogen auf die gesamte 6-s Rauschprobe, kann ihr Tappzeitpunkt als 3.6 angegeben werden. In Abb. 3.8 ist dieses Beispiel im diagonalen Balken unten rechts dargestellt. Die obere der beiden horizontalen Linien wurde so gewählt, daß das Segment [3.4,4.2] im diagonalen Balken liegt. Sie beschreibt das Segment über seine ganze Länge, so daß das Versuchsergebnis irgendwo auf dieser Linie liegen muß. Konkret liegt es bei dem mit A bezeichneten Kreis, da die Versuchsperson

40

bei 3.6 getappt hat. Wenn in einer anderen Darbietung das Segment 3.2 bis 4 Sekunden herausgeschnitten und angeboten wird (untere der beiden horizontalen Linien), und die Versuchsperson tappt wieder bei 3.6, dann liegt dieser Punkt (B) vertikal unter dem Punkt A. Vertikal angeordnete Punkte deuten also darauf hin, daß die Versuchsperson einen bestimmten Zeitpunkt im Rauschen signifikant findet, obwohl andere Teile des Rauschens ausgetauscht worden sind.

41

Abb. 3.8: Punktplot der getappten Zeitpunkte, bezogen auf die 6-s Rauschprobe (horizontale Achse). Die Ordinate entspricht dem Startzeitpunkt des Segmentes innerhalb der 6-s Rauschprobe. Für jede VP sind drei diagonale Balken für die Segmentlängen 400/600/800 ms eingezeichnet. Das Beispiel rechts unten wird im Text erläutert. Die vertikale Ausrichtung der Punkte zeigt, daß die Wahrnehmung der Perzepte von der kontinuierlichen Darbietung nur eines kleinen Stückchens der Rauschprobe abhängt.

42

Für jede Versuchsperson sind drei solcher diagonaler Balken eingetragen, entsprechend den drei verschiedenen Periodenlängen. Man erkennt eine starke Tendenz zur vertikalen Ausrichtung der Punkte. Die vertikalen Linien gehen bis knapp an den Rand der diagonalen Balken, was anzeigt, daß der größte Teil der Rauschprobe ausgetauscht werden kann, ohne daß das saliente Detail seine Signifikanz verliert. Versucht man, anhand der Linien die Ausdehnung der lokalen physikalischen Basis für das Perzept abzuschätzen, dann kommt man zu einem Wert unterhalb von 100 ms. Bei einer größeren Ausdehnung müßte ein Abbrechen der Linien vor dem Erreichen des Randes beobachtet werden. Wenn z.B. für ein bestimmtes Perzept ein kontinuierliches Stück von 400 ms Länge erforderlich wäre, dann wäre die vertikale Linie höchstens so lang wie das Segment minus 400 ms. Bezogen auf die Zeitachse kann die Hypothese der lokalen Verarbeitung bestätigt werden.

Auch die Größe des Segmentes hat wenig Einfluß auf die Salienz der enthaltenen lokalen Eigenschaften: Vertikale Linien, die sich im 800-ms Balken finden, setzen sich meistens auch in den 600- und den 400-ms Balken fort. Umgekehrt finden sich allerdings für die kürzeren Segmentlängen saliente Tappzeitpunkte, die sich bei den längeren Segmenten nicht mehr wiederfinden. Dies ist aber leicht zu verstehen, wenn man sich vorstellt, daß z.B. 300 ms vor und nach so einem salienten Detail etwas stärker saliente Eigenschaften in der Wellenform vorkommen. Bei der größeren Segmentlänge wäre dann das schwach saliente Detail immer in Begleitung von stärker salienten Eigenschaften und würde daher nie als Schwerpunkt empfunden.

Die Übereinstimmung zwischen Linien bei verschiedenen Versuchspersonen ist teilweise bemerkenswert. Mehrere Linien können für drei oder mehr Versuchspersonen gefunden werden (0.3, 0.8, 2.4, 3.6, 4.2, 5.2). Aber es gibt auch deutliche Unterschiede zwischen den Versuchspersonen. So ist z.B. bei 5.0 nichts Auffälliges für Versuchsperson CK, während für Versuchsperson ME dort ein sehr deutliches Perzept hervorgerufen wird. Dies kann mit den Ergebnissen von Experiment 1 verglichen werden, wo ebenfalls eine gewisse, aber nicht vollständige Korrelation zwischen den Versuchspersonen bestand.

43

3.6 Experiment 3: Spektrale EingrenzungNachdem in Experiment 2 deutlich wurde, daß ein zeitlich eng begrenztes Stück des Rauschens die Basis für ein hörbar gewordenes Perzept enthält, stellt sich die Frage, ob man die physikalische Basis auch spektral eingrenzen kann. Bisherige Experimente konnten zeigen, daß auch bei tief-, hoch- und bandpaßgefilterten Versionen von periodischem Rauschen die Periodizität entdeckt werden kann (z.B. Warren und Bashford, 1981). Dadurch wissen wir allerdings nicht, inwieweit sich dabei die Perzepte änderten, ob also durch das Filtern andere Details der Wellenform salient wurden. Somit können wir nicht abschätzen, ob in normalen weißem Rauschen breitbandige oder eher schmalbandige Signaleigenschaften ausgenutzt werden.

I. Methodik

A. Stimulus und Datenanalyse

Die oberen Teilbilder von Abb. 3.9 zeigen, wie der Stimulus für Experiment 3 konstruiert wurde. Links oben sehen wir die Darstellung des Spektrogramms einer fiktiven Rauschprobe der Länge . Die Symbole (Dreiecke, Quadrate, Kreise) sollen für fiktive, temporal und spektral gut eingrenzbare Details der Wellenform stehen, die gut hörbare Perzepte auslösen. Nun wird bei einer zufällige gewählten Frequenz f (gleichverteilt auf einer logarithmischen Skala zwischen 100 und 10000 Hz, hier: 700 Hz) in einen Hochpaß– und einen Tiefpaßteil getrennt (gestrichelte Linie). Dies erfolgte mit Hilfe eines FFT-Algorithmus mit rechteckigen Flanken. Dann wird der Tiefpaßteil gegenüber dem Hochpaßteil um einen zufälligen Betrag t verschoben (dies läßt sich durch Drehung der FFT-Komponenten bewerkstelligen) und die beiden Teile wieder zusammengesetzt. Die Symbole im Tiefpaßteil sind nun gegenüber dem Hochpaßteil verschoben.

Der Tappzeitpunkt kann nun wahlweise bezüglich des Hochpaßteils (t) oder des Tiefpaßteils (t' = t t) beschrieben werden. Wenn das Element oberhalb der Schnittfrequenz (im Hochpaßteil) lag, dann sollte sich bei einer nachfolgenden Präsentation mit ähnlicher Schnittfrequenz (aber anderem t) derselbe Wert für t ergeben. Der Wert für t' sollte hingegen randomisiert werden, da er sich aus dem konstanten t und dem zufälligen t zusammen setzt. Wenn das Element dagegen im Tiefpaßteil enthalten ist,

44

dann würde bei ähnlichen Schnittfrequenzen t' konstant bleiben und t randomisiert werden. Jeder Einzelversuch wird komplett beschrieben durch die Angabe dreier Parameter: der Schnittfrequenz f, der Koordinate t des Tappzeitpunktes bzgl. des Hochpaßteils, und der Koordinate t' bzgl. des Tiefpaßteils. Die beiden letzten Parametern sind über die Verschiebung t = t t' miteinander verknüpft.

In den unteren Teilbildern von Abb. 3.9 wird anhand von Beispielsdaten beschrieben, wie die Daten bzgl. dieser drei Parameter geplottet wurden. Wenn wir wüßten, ob ein bestimmter Einzelversuch ein Tappen zu einem Element im Hochpaßteil oder im Tiefpaßteil ausgelöst hat, dann könnten wir auf einen der drei Parameter verzichten, da er ja ohnehin randomisiert ist. Wir würden dann die Daten zweidimensional plotten (Ordinate: Schnittfrequenz, Abszisse: relevante Koordinate, t oder t'), und nur durch die Farbe oder Punktgröße deutlich machen, ob es sich um ein Hochpaßtappen oder ein Tiefpaßtappen handelte.

Abb. 3.9: Stimuluskonstruktion und Datenanalyse für Experiment 3. Die Ordinate repräsentiert die Schnittfrequenz zwischen Hoch- und Tiefpaßteil, die Abszisse den Zeitpunkt innerhalb der Rauschprobe der Länge . Die oberen beiden Teilbilder beschreiben die Stimuluskonstruktion (siehe Text). In den beiden ersten Teilbildern der unteren Reihe sind beispielhafte Daten bzgl. der Hochpaßkoordinate t, bzw.

45

bzgl. der Tiefpaßkoordinate t' dargestellt. Das letzte Teilbild kombiniert diese beiden Darstellungen (siehe Text).

Im Teilbild links unten sind die Beispielsdaten bzgl. der Hochpaßkoordinatet geplottet (Ordinate: Schnittfrequenz), im Teilbild unten Mitte hingegen bzgl. der Tiefpaßkoordinate t'. Man erkennt, daß konsistentes Hochpaßtappen auftritt, solange die Schnittfrequenz unterhalb von 500 Hz liegt. Liegt sie oberhalb von 1200 Hz, tritt konsistentes Tiefpaßtappen auf. Zwischen 500 und 1200 Hz scheint sich das Element aufzuteilen, denn es wird teilweise konsistent in t, teilweise konsistent in t' getappt. Das erkennt man daran, daß keine vollständige Randomisierung auftritt, sondern sich die vertikalen Linien teilweise in dieses Gebiet fortsetzen. Man kann allerdings nicht erkennen, ob alle Punkte in diesem Bereich entweder zu t oder zu t' konsistent sind.

Im Teilbild rechts unten sind dieselben Daten entweder bzgl. t (große graue Punkte) oder bzgl. t' (kleine schwarze Punkte) dargestellt. Dazu wurde für jeden Punkt ermittelt, ob er mehr Nachbarn im t-Plot oder im t'-Plot hat. Dabei wurden in beiden Plots für jeden Punkt attraktive Potentiale aufsummiert, wobei benachbarte Punkte größere Beiträge lieferten als weniger benachbarte Punkte. Die Ausdehnung des attraktiven Potentials war ca. 1 Oktave auf der Ordinate, und ca. /6 auf der Abszisse. Als relevante Koordinate wurde dann diejenige Koordinate ausgewählt, für die sich mehr attraktives Potential aufsummiert hatte. Zur Kennzeichnung, welche Koordinate dies sei, wurde der Farbwert (schwarz/grau) und die Punktgröße verändert. In diesem Teilbild erkennt man, daß fast alle Punkte einem konsistenten Tappen entweder in t oder in t' entsprechen, mit Ausnahme des Punktes bei 2000 Hz am rechten Rand. Zwischen 500 und 1200 Hz überlagern sich die Punktwolken: Hier ist konsistentes Tappen zu t oder zu t' möglich. Die Konsistenz des Tappens läßt im Überlagerungsgebiet nach: die vertikalen Punktwolken fächern sich auf.

B. Versuchspersonen und Prozedur

An diesem Experiment wirkten dieselben fünf Versuchspersonen wie bei Experiment 2 mit. Sie waren somit schon hochtrainiert und brauchten kein weiteres Training. Die Instruktion war wieder wie bei Experiment 1: Möglichst genau überlegen, welches Perzept am deutlichsten, lautesten, betontesten ist, bzw. bei Zweideutigkeiten sich für das zeitlich begrenztere entscheiden. Der Grund dafür ist, daß daran gelegen war, daß sich das

46

Tappen auf ein und dieselben Elemente bezieht. In Pilotuntersuchungen war deutlich geworden, daß es schwierig ist, mit einer einzigen Rauschprobe zu arbeiten, da die teilweise, aber nicht vollständige Ähnlichkeit bei aufeinander folgenden Einzelversuchen irritierte und Voreinstellungen auslöste (wie etwa den Versuch, konsistenzhalber etwas wiederzufinden, was im letzten Einzelversuch eine Rolle spielte, nun aber vielleicht gar nicht existiert). Daher wurden fünf verschiedene Rauschproben in zufälliger Reihenfolge ausgewählt. Um den FFT-Algorithmus anwenden zu können, wurde die Länge so gewählt, daß die Anzahl der Sampledaten eine Zweierpotenz ergab: 819.2 ms entsprechen 214 Datenpunkten bei einer Digitalisierungsfrequenz von 20 kHz. Die Rauschproben waren aus den sechs Sekunden weißen Rauschens, die bei Experiment 2 verwendet wurden, an folgenden Positionen herausgeschnitten: [0.2,1.0192] (A), [1.2,2.0192] (B), [3.0,3.8192] (C), [4.0,4.8192] (D), und [4.8,5.6192] (E). Die Versuchspersonen führten zwischen 700 und 1700 Einzelversuche durch.

II. Ergebnisse

In Abb. 3.10 sind die Daten der fünf Versuchspersonen für die fünf verschiedenen Rauschproben in Form von t/t’-Plots aufgetragen. Betrachten wir zunächst Teilbild <B,FC>. Das Perzept erscheint eindeutig, solange die Schnittfrequenz oberhalb von 2200 oder unterhalb von 500 Hz ist. Zwischen diesen beiden Frequenzen ist das Perzept zerstört, und die Versuchsperson wählt einen anderen Tappzeitpunkt. Es findet kein langsames Ausschleichen (etwa gelegentliches konsistentes Hochpaßtappenbei einer Schnittfrequenz von 700 Hz) statt, sondern ein recht abrupter Wechsel. Hier handelt es sich offensichtlich um ein Merkmal, daß durch die Interaktion zwischen zwei Kanälen definiert wird. Es könnte sich um Amplitudenkomodulationen zweier getrennter Kanäle handeln, wie sie in der derzeitigen Diskussion als Konstituenten der auditiven Szenenanalyse sehr aktuell sind (einen Überblick gibt Moore, 1990). Wird die Zeitbeziehung der interagierenden Kanäle gestört, dann ist das Merkmal verschwunden. In zwei anderen Teilbildern kann man ähnliches finden: <D,DM> und <E,ME>. Bei dem in <E,ME> erfaßten Merkmal handelt es sich im übrigen um das schon in Experiment 2 erwähnte, für Versuchsperson CK nicht saliente Merkmal. Die Statistik der fünf pro Versuchsperson erfaßten Merkmale reicht leider nicht aus, um zu

47

entscheiden, ob es konsistente interindividuelle Unterschiede bei der Wahrnehmbarkeit solcher Interaktionen gibt.

In den anderen Teilbildern finden sich meist mehr oder weniger breite Übergangsregionen, wo konsistentes Tappen zu t oder t' auftreten kann. Der Übergang kann ziemlich scharf sein (z.B. innerhalb eines Dritteloktavbandes in <D,FC>), oder sich über 1.5 Oktaven erstrecken wie in <A,ME>. In diesem letzteren Falle muß man wohl eine Art spektraler Informationsintegration annehmen, bei der die Salienz des Perzepts aus über einen breiten Spektralbereich verteilten Eigenschaften der Wellenform abgeleitet wird. Bei einem Schnitt in der Mitte dieses Bereiches bleiben in jedem Teilbereich genügend Merkmale übrig, um ein salientes Perzept zu ergeben.

Abb. 3.10: Daten für fünf Versuchspersonen und fünf verschiedene Rauschproben (A-E) in Experiment 3. Die Ordinate gibt für jeden Einzelversuch die Schnittfrequenz wieder, die Abszisse gibt den Tappzeitpunkt entweder in der Hochpaßkoordinate t (graue Punkte) oder in der Tiefpaßkoordinate t' (schwarze

48

Punkte) wieder. Anhand der Breite der Übergangsregion kann die spektrale Ausdehnung des Elements bestimmt werden.

Einige Teilbilder zeigen für eine bestimmte Rauschprobe eine bemerkenswerte Übereinstimmung für verschiedene Versuchspersonen. So weisen in <D,MC/FC>, <E,FC/DM> und <A,CK/ME/DM> die salienten Elemente eine fast identische spektrotemporale Lokalisation auf. Es fällt allerdings auf, daß nicht immer eine gute zeitliche Übereinstimmung auch eine gleiche spektrale Lokalisation des Elementes bedeuten muß: so haben bei Rauschprobe C Versuchspersonen CK und ME wohl auf verschiedene Perzepte geachtet, die nur zufällig zum gleichen Zeitpunkt eintraten.

3.7 Analyse des SpektrogrammsMit Experiment 2 und 3 konnte die am Ende von Abschnitt 3.4 aufgestellte Hypothese bestätigt werden. Beim Hören von sich wiederholendem weißen Rauschen verstärkt das auditorische System temporal und spektral begrenzte Details der Wellenform, die wir sonst nicht wahrnehmen würden. Die physikalische Basis der resultierenden Perzepte läßt sich zeitlich auf 100 ms eingrenzen. Die spektrale Ausdehnung liegt zwischen 1/3 und 1.5 Oktavbändern. Guttman und Julesz (1963) haben angenommen, daß die Wahrnehmung von periodischem Rauschen auf Energiegipfeln im Kurzzeitspektrum basiert. Limbert (1984) hat vergeblich versucht, solche Energiegipfel zu finden. Auf der Basis der Experimente 2 und 3 kann nun genauer hingeschaut werden, da für einige Perzepte sowohl das Zeitfenster als auch die spektrale Ausdehnung bekannt sind. Man kann an der entsprechenden Stelle im Spektrogramm nachschauen, welche Auffälligkeit zu einem salienten Perzept geführt haben mag. Abb. 3.11 zeigt exemplarisch das Spektrogramm der Rauschprobe E. Das für FC und DM salienteste Perzept, spektral auf 1/3 Oktave eingrenzbar, basiert auf der eingekreisten Region des Spektrogramms.

Man findet an dieser Stelle keinen deutlichen Energiegipfel. Der im rechten unteren Quadranten des Kreises befindliche kleine schwarze Fleck ist nicht besonders auffällig: Es gibt viele andere Gebiete ähnlicher Ausdehung und Schwärzung. Das gilt auch für die für andere Versuchspersonen signifikanten Regionen, z.B. CK: <450ms, 700Hz>. – Eigentlich ist es nicht überraschend, daß man mit dem Auge nicht ausmachen kann, welche Region eines Spektrogramms als salient empfunden werden wird. Die

49

visuelle Beurteilung erfolgt mit Hilfe visueller Gestaltgesetze, die den auditiven Gestaltgesetzen nicht ähnlich sein müssen. Bei <E,ME> liegt ein Element vor, das auf einer Interaktion verschiedener, getrennter Kanäle beruht: Bei ca. 200 ms könnte eine Komodulation zwischen den Frequenzen 300-500 Hz einerseits und 2000-3000 Hz andererseits vorliegen. Es ist kaum vorstellbar, daß man diese Interaktion mittels visueller Inspektion des Spektrogramms erkennt.

50

Andererseits macht die visuelle Inspektion des Histogramms deutlich, daß es hinreichend viele Möglichkeiten für das auditive System gäbe, saliente Perzepte zu erzeugen. Die Art von Schwankungen, die in dem weißen Kreis liegen, sind auch an vielen anderen Stellen zu finden.

Abb. 3.11: Spektrogramm der Rauschprobe E aus Experiment 3. Der Kreis entspricht dem für Versuchspersonen FC und DM signifikanten Perzept. Er enthält keinen deutlich aus dem Grauwertmuster herausstechenden Energiegipfel. – Die Frequenzskala ist logarithmisch, da dies der Ordinate in Abb. 3.10 und der Frequenztransformation auf der Basilarmembran entspricht. Aus jeweils 512 Punkten (25.6 ms) wurde ein Spektrum berechnet, mit einem cosinusoidalen Fenster (raised cosine). Dadurch werden effektiv 12.8 ms repräsentiert. Alle 5.12 ms (40% der effektiven Fensterbreite) wurde ein Spektrum berechnet, und zwar mit vierfachem oversampling, um bei der logarithmischen Transformation der Ordinate nicht zu viele Details im oberen Frequenzbereich zu verlieren. Die Grauwerte repräsentieren die logarithmierte Energie über einen Bereich von 60 dB.

51

1000 200 300 400 500 600 700 ms800

100

1000

10000Hz

3.8 Auditive feature DetektorenDie Energiegipfel im Spektrogramm einer periodischen Rauschprobe kommen zwar ebenfalls periodisch vor und sind somit grundsätzlich geeignet, die Entdeckbarkeit der Periodizität in periodischem Rauschen zu erklären. Sie können hingegen nicht erklären, wieso gerade diese oder jene Stelle im Spektrogramm mit einiger Zuverlässigkeit ein Perzept auslöst. (Die darüber hinausgehende Frage, warum nichtrepetiertes Rauschen nicht gleichfalls vielfältige Perzepte auslöst, wird hier noch nicht behandelt. Siehe hierzu Kapitel 6.1 und 6.2). Es wäre wünschenswert, die Charakteristiken der auditiven Detektoren zu kennen, die aus dem Schallsignal die für den Hörer relevanten Eigenschaften (features) herausfiltern. Dann könnte sozusagen das „innere“ Spektrogramm bestimmt werden, mit dessen Hilfe die möglichen Perzepte vorhersagbar wären.Es sei vorweg angemerkt, daß dieses Ziel zur Zeit nicht erreichbar ist. Aber die vorhandene empirische Evidenz erlaubt es immerhin, über die Eigenschaften der Detektoren nachzudenken, die zu der beobachteten inter– und (in gewissem Maße) intraindividuellen Reproduzierbarkeit führen. Zunächst sollen jedoch Ergebnisse aus der visuellen Wahrnehmung vorgestellt werden, die einen Ausblick auf die Art der zu erwartenden fea-ture Detektoren geben.

Visuelle Information kann in bildverarbeitenden Systemen pixelweise als Farbinformation gespeichert werden. Dies ist aber nur für unkorrelierte

Abb. 3.12: Ein Gabor wavelet wird gekennzeichnet durch die Orientierung (hier: 45°) und die Raumauflösung. Das hier gezeigte wavelet wäre ungeeignet, die Buchstaben dieses Textes aufzulösen, aber gut geeignet für gröbere Strukturen, z.B. den Seitenrand.

52

Bilder (z.B. Zufallspunktemuster) optimal. Wenn man eine große Zahl „nor-maler“ Bilder, wie sie in der Umwelt vorkommen, auf ihre Hauptkompo-nenten analysiert, erhält man Filter ähnlich den Gabor wavelets (Abb. 3.12). Jedes Bild kann anstelle der Pixelkodierung als Satz von Gabor-Filterkoef-fizienten kodiert werden. Es hat sich herausgestellt, daß das visuelle System Bilder in Form derartiger wavelets verarbeitet, d.h. daß die Rezeptoren des primären visuellen Kortex Bilder wavelet-artig zerlegen (Daugman, 1980, 1985, MacKay, 1981, DeValois und DeValois, 1988).

Es liegt nahe, zu prüfen, ob ähnliche Typen von Detektoren auch im auditiven System gefunden werden können. Bisher hat es keine Hauptkomponenten-Analyse auditiver Umweltstimuli gegeben. Es gibt aber aus der Physiologie Hinweise, daß wavelet–ähnliche Strukturen im Spektrogramm eine Rolle spielen können. So ist seit einiger Zeit bekannt, daß Töne nicht nur eine spektrale Zerlegung im Innenohr erfahren, sondern daß auch die zeitliche Feinstruktur der Erregung analysiert wird. Wenn die Prinzipien dieser Wirkmechanismen auch noch nicht verstanden sind (Kaernbach und Demany, 1998), so sind doch schon seit einiger Zeit aus elektrophysiologischen Untersuchungen tonotop/periodotopeRepräsentationen bekannt (Langner, 1992), also Karten in Bereichen des Mittelhirns, die entlang zweier Dimensionen geordnet sind: spektrale Tonhöhe und temporale Feinstruktur. Der optimale Stimulus für ein derartiges Neuron ist offensichtlich eine Art wavelet im Spektrogramm. Andererseits reichen wavelets sicher nicht aus, um die für die auditive Signalverarbeitung so wichtigen Transienten zu erfassen. Hier wurden Kombinationen aus zwei wavelets vorgeschlagen, die unterschiedliche Frequenzbereiche mit einer voreingestellten zeitlichen Verzögerung erfassen.

Am Anfang dieses Abschnitts war die Frage aufgeworfen worden, wie die beobachtete Reproduzierbarkeit der Tappzeitpunkte erklärt werden kann. Es gibt ganz offensichtlich erheblich mehr feature Detektoren als Frequenzkanäle. Das „innere“ Spektrogramm enthält also im Vergleich zu Abb. 3.11 eine viel längere Ordinate und damit zunächst einmal mehr Möglichkeiten für Vieldeutigkeiten. Der Ausgang eines Detektors, der mit weißem Rauschen stimuliert wird, ist ebenfalls ein Rauschen. Allerdings ist für Detektoren, die ihre Information über die Zeit integrieren, zu erwarten, daß sie als eine Art Tiefpaß fungieren, d.h. daß am Ausgang ein tieffrequenteres Rauschen anliegt als am Eingang. Dies reduziert wiederum

53

die Zahl der möglichen Vieldeutigkeiten. Insgesamt ergibt sich jedoch ein Bild, das ähnlich wie in Abb. 3.11 viele mögliche Perzepte zuläßt, und aus dem heraus sich noch nicht die Reproduzierbarkeit der Tappzeitpunkte verstehen läßt.

Die Vieldeutigkeit kann reduziert werden, wenn ein Schwellenprozeß angenommen wird, der dazu führt, daß ein Detektor nur selten einen von Null verschiedenen Ausgang erzeugt. So kann man z.B. annehmen, daß der mit Rauschen stimulierte Detektor zwar grundsätzlich ebenfalls mit Rauschen antwortet (tiefpaßgefiltert bei z.B. 10 Hz), daß aber ein nachgeschalteter Schwellenprozeß den Ausgang unterdrückt, wenn er eine bestimmte Mindestgröße nicht überschreitet. Abb. 3.13 erläutert, wie ein Schwellenprozeß zu einer Verarmung der möglichen Perzepte führt.

54

Kann so ein Schwellenprozeß die Reproduzierbarkeit des Tappzeitpunktes erklären? Zunächst kann man einmal die genaue Form des Rauschens (Amplitudenverteilung, z.B. Gaußisch) außer Acht lassen und den Detektor durch die Wahrscheinlichkeit pD

beschreiben, mit der eine Detektion während einer Sekunde Rauschstimulation ausgelöst wird. Wenn man annimmt, daß diese Wahrscheinlichkeit sehr klein ist, daß aber die Zahl N der Detektoren sehr hoch ist, dann ergibt sich eine neue Zahl m=N·pD der durchschnittlich in einer Sekunde erregten Detektoren. Nun könnte man annehmen, daß m sehr klein ist, so daß die beobachtete Reproduzierbarkeit resultiert. Betrachtet man die Daten aus Abb.3.2, dann würde man auf m 2 schließen.

Abb. 3.13: Veranschaulichung eines Schwellenprozesses auf dem Spektrogramm von Abb. 3.11. Die Übersetzung der Amplituden in Grauwerte wurde für die oberen 30, 15 bzw. 10 dB der vorkommenden Amplituden reskaliert. Es bleiben nur noch wenige signifikante Stellen übrig. Daß diese nicht den Tappzeitpunkten entsprechen, darf nicht verwundern, da der unterstellte Schwellenprozeß ja auf dem „inneren“ Spektrogramm ablaufen soll.

55

Andererseits kann die Verarmung der potentiellen Merkmale durch einen Schwellenprozeß nicht erklären, warum praktisch jede Rauschprobe signifikante Stellen enthält. Bei m 2 müßte es Rauschproben geben, die zufälligerweise keine Detektion auslösen, und daher homogen wie nichtperiodisches Rauschen klingen müßten. Die folgende informelle Beobachtung macht einen weiteren Mechanismus deutlich: Im Anschluß an Experiment 7, wo die Signifikanz einzelner isolierter Rauschteilstücke erhoben worden war, wurde versucht, zwei extreme Fälle von periodischem Rauschen zu erzeugen, a) einen Zyklus aus insignifikanten, und b) einen Zyklus aus signifikanten Rauschteilstücken. Es wurde erwartet, daß der erste evtl. gar nicht als periodisch auffällt, während der zweite ein Übermaß an salienten Merkmalen enthalten müßte. Die so produzierten Stimuli klangen jedoch ähnlich. Ein geringfügiger Salienzunterschied war feststellbar, aber auch Rauschen a) ergab eine gute Periodizitätswahrnehmung, während in Rauschprobe b) etwa ein Element mehr als sonst üblich zu hören war.

Aus dieser Beobachtung wird deutlich, daß es einerseits eine deutlich höhere Anzahl m von möglichen Perzepten geben muß, daß es aber andererseits zu einer Interaktion der verschiedenen Merkmale im Sinne einer Konkurrenz kommt. Salient oder nicht salient sind die Teilstücke nur im Vergleich zu benachbarten Elementen. Daher wird bei einem aus nicht salienten Teilstücken zusammengesetzten Zyklus etliches salient, was ansonsten von dominanteren Elementen überspielt worden wäre. Umgekehrt setzen sich bei vielen salienten Elementen doch nur drei oder vier durch. Die genauen Mechanismen der Konkurrenz sind bei der Vielfalt der beteiligten Detektortypen kaum sicher zu bestimmen. Sie muß jedoch so regelhaft verlaufen, daß bei einer wiederholten Darbietung derselben Rauschprobe ein ähnliches Resultat wahrscheinlich ist, und daß verschiedene Versuchspersonen neben ähnlichen Detektionsmechanismen auch ähnliche Dominanzen aufweisen.

Man kommt dem Phänomen der Wahrnehmung periodischen Rauschens nicht mit simplen physikalischen Analysen der dargebotenen Stimuli auf den Grund. Es ist als Gedächtnisphänomen auf einer zwar frühen, aber doch schon komplexen sensorischen Verarbeitungsstufe des auditiven Systems angeordnet, und solange diese ersten Verarbeitungsschritte nicht vollständig verstanden sind, wäre es illusorisch, aus den Stimuluseigenschaften auf die Perzepte schließen zu wollen. Die Merkmalsdetektoren auf diesen Stufen

56

sind durch das zufällige Rauschsignal nicht deutlich erregt, sondern befinden sich in einem nur knapp über der Schwelle liegenden Erregungszustand. Zwischen diesen schwachen Erregungszuständen kommt es zu Interaktionen, an deren Ende feststeht, welche sich durchsetzen, und welche unterdrückt werden. So gesehen ist bei periodischem weißen Rauschen die Perzeptbildung ein sehr komplexer Vorgang.

In diesem Kapitel wurde der Vorgang der Perzeptbildung bei periodischem Rauschen näher untersucht. Dabei wurde vorläufig außer acht gelassen, daß diese Perzepte nicht in normalem, nichtperiodischem Rauschen, sondern nur bei iterierter Präsentation desselben Rauschsegmentes hörbar werden. Offensichtlich werden diese Perzepte nur hörbar durch die Beteiligung des Echogedächtnisses. Dies wird in den folgenden Kapiteln deutlich, wo typische Gedächtnisparameter wie Lebensdauer und Kapazität des Echogedächtnisses anhand von periodischem Rauschen erhoben werden. Die Frage, wie das Echogedächtnis mit den Detektoren zusammenarbeitet, um die Perzepte in periodischem Rauschen zu erzeugen, wird in Kapitel 6 behandelt.

57

4 Lebensdauer des Echogedächtnisses

Dieses und das nachfolgende Kapitel versuchen, zwei Zeitkonstanten des auditiven sensorischen Gedächtnisses zu erfassen, die nicht nur unterschiedliche Werte, sondern auch verschiedene Bedeutung haben. Durch das genauere Beschreiben der Funktion dieser beiden Zeitkonstanten soll ihre Rolle beim Erinnern sensorischer Information besser erfaßt werden, um präzisere Modellvorstellungen zu ermöglichen.

4.1 Lebensdauer: ein typischer GedächtnisparameterSeit den berühmten gedächtnispsychologischen Untersuchungen von Hermann Ebbinghaus (1885) steht bei der Untersuchung von Gedächtnisphänomenen immer wieder ein Parameter eines Gedächtnisses im Mittelpunkt: die Lebensdauer. Sie dient der Abgrenzung von Gedächtnissystemen (z.B. Langzeit–/Kurzzeitgedächtnis), an ihrer Beeinflussung durch interferierende Störaufgaben wird die Zuständigkeit des Gedächtnissystems für das Störmaterial abgelesen, und aus der Dynamik soll der Mechanismus, der für die Speicherung zuständig ist, ablesbar werden. Dabei ist es eigentlich unpräzise, von einer Konstanten (der Lebensdauer) zu sprechen, da es sich oft nicht um einfach exponentielle Abfälle handelt, so z.B. beim Abfall des Ersparnismaßes über die Zeit (Ebbinghaus, 1885: „Vergessenskurve“). Aber wie die Angabe einer Schwelle den genauen Verlauf der psychometrischen Funktion verschweigt und doch oft eine ausreichende Beschreibung liefert, so wird der Abfall der Gedächtnisleistung über die Zeit meist mit derjenigen Zeit beschrieben, bei der die Leistung auf die Hälfte gesunken ist.

Das folgende Experiment zur Lebensdauer des Echogedächtnisses untersucht dementsprechend die naheliegende Fragestellung, bis zu welcher Zykluslänge periodisches Rauschen noch als periodisch erfaßt werden kann. Diese Untersuchung ist notwendig zur genauen Erfassung der Rolle der Lebensdauer des Echogedächtnisses bei der Wahrnehmung periodischen Rauschens, um sie dann abgrenzen zu können gegen eine andere Zeitkonstante, die sich bei der in Kapitel 5 geschilderten Untersuchung ergeben wird.

58

4.2 Experiment 4: Grenze der PR-Detektion für lange ZyklenGuttman und Julesz (1963) beschrieben den von ihnen entdeckten Stimulus als wahrnehmbar bis hin zu Periodenlängen von ein bis zwei Sekunden. Längere Perioden seien nur mit Training zu erreichen. Warren und Bashford (1981) beschrieben informelle Beobachtungen, demzufolge ihre beste Versuchsperson nach langem Training Rauschzyklen bis zu einer Länge von 10 Sekunden wahrnehmen konnte. Eigene informelle Beobachtungen hatten ergeben, daß es nur sehr wenig Trainings bedarf, um sehr lange Periodizitäten als solche wahrzunehmen. Das folgende Experiment soll bei genau quantifiziertem Training festhalten, welche Perioden mit welcher Wahrscheinlichkeit korrekt detektiert werden. Dabei soll die folgende Hypothese überprüft werden:

HYPOTHESE:

Die Behaltensleistung des Echogedächtnisses, die die Basis für die PR-Wahrneh-mung bildet, hat eine Lebensdauer von mehreren Sekunden. Um diese Behaltensleistung zu vollbringen, müssen nicht erst besondere Strategien (re-hearsal Strategien o.ä.) erlernt werden, da sie auf dem gewöhnlichen Spurzerfallim Echogedächtnis beruht. Dies sollte sich empirisch daran erweisen, daß bereits mit sehr wenig Training PR-Zyklen von mehreren Sekunden Dauer detektiert werden können.

I. Methodik

A. Versuchspersonen

An dem Experiment wirkten 20 untrainierte Versuchspersonen (11mal weiblich, 9mal männlich) mit, die noch nie an einem psychoakustischen Experiment teilgenommen hatten. Es handelte sich um Psychologiestudenten im zweiten Studienjahr mit (laut Eigenbericht) normalem Hörvermögen. Sie wurden über das Ziel der Untersuchung in Kenntnis gesetzt.

B. Stimuli

Das Rauschen wurde mit demselben Algorithmus für Gaußsches weißes Rauschen wie bei den anderen Experimenten erzeugt (siehe Anhang AnhangA:). Die Darbietung erfolgte über Sennheiser HD 435 Kopfhörer 60 dB oberhalb der Schwelle. Für jede Versuchsperson und jeden Einzelversuch

59

wurde ein anderes Rauschen erzeugt, indem der Index des Zufallszahlenalgorithmus (siehe Anhang A:.A.4) zufällig gewählt wurde. Die Zykluslängen reichten von 0.5 bis 20 Sekunden (siehe Tab. 4.1).

C. Verfahren

Die Versuchspersonen hörten keinerlei Demonstration von periodischem Rauschen vorab, sondern begannen sofort mit dem Experiment. Vor jedem Einzelversuch wurde ihnen auf dem Computermonitor der ungefähre Bereich der zu erwartenden Periodizität (-10% bis +20% der tatsächlichen Zykluslänge) angezeigt. Dies sollte ihnen erleichtern, sich auf die richtige Periodizität zu konzentrieren. Informelle Tests hatten gezeigt, daß es auf Grund dieser Angabe allein nicht möglich ist, den Rhythmus zu „erraten“ und so korrekt zu tappen, daß die unten beschriebenen Kriterien erfüllt würden. Die Instruktion an die Versuchspersonen lautete, sie sollten die von ihnen gehörte Struktur auf der Leertaste der Computertastatur wiedergeben. Der Zeitpunkt dieses Tappens konnte vom Computerprogramm auf unter einer Millisekunde genau festgehalten werden. Wenn die Versuchsperson nicht nach einer gewissen Zeit mit Tappen angefangen hatte (5 Sekunden plus 7 Zyklen), wurde dieser Einzelversuch als erfolglos gewertet und abgebrochen. Wenn die Versuchsperson angefangen hatte, den Rhythmus zu tappen, dann wurde das Rauschen so lange dargeboten, bis sie zu acht Zyklen getappt hatte. Nach dem Einzelversuch konnte die Versuchsperson selbst durch Tastendruck den nächsten Einzelversuch starten.

Die Versuchspersonen wurden zufällig einer von zwei Gruppen zu je 10 Versuchspersonen zugeteilt. Gruppe A absolvierte die verschiedenen Zykluslängen der Tab. 4.1 in aufsteigender Reihenfolge, Gruppe B in absteigender Reihenfolge. Die Zykluslänge wurde nach jedem Einzelversuch verändert, unabhängig vom Ausgang des Vorversuchs. Dies könnte mit der Grenzwertmethode ohne Abbruchskriterium, oder mit der Konstanzmethode ohne Randomisierung verglichen werden. Alle Versuchspersonen führten drei solcher Durchläufe („Blöcke“) durch, d.h. sie führten insgesamt zu jeder Zykluslänge drei Einzelversuche durch.

D. Datenanalyse

Aus den gemessenen Tappzeitpunkten wurde bestimmt, ob die Versuchsperson die Periode korrekt wiedergegeben hat. Dies wurde zunächst von einem Computerprogramm automatisch, dann zur Kontrolle

60

auch noch visuell über eine graphische Darbietung der Tappzeitpunkte auf dem Computermonitor getan. Die Unterschiede zwischen diesen beiden Vorgehensweisen waren gering. Letztlich wurde den visuell erhobenen Daten der Vorzug gegeben.

Der Regel des automatischen Algorithmus lautete: mindestens viermal mußte sich der Tappzeitpunkt eines Zyklus im darauffolgenden Zyklus auf 10% genau wiederfinden. Für die visuelle Inspektion wurden die Daten auf dem Computermonitor so dargestellt, daß die horizontale Position den Tappzeitpunkt modulo der Zykluslänge und die vertikale Position aufeinander folgende Zyklen repräsentierte. Es ist in dieser Darstellung einfach, an der vertikalen Ausrichtung der Tappzeitpunkte zu erkennen, ob die Periode korrekt erkannt wurde. Die visuelle Inspektion wurde eigentlich zu dem Zweck entwickelt, das automatische Verfahren zu überprüfen. Beide Methoden liefern weitgehend übereinstimmende Ergebnisse: in 1243 von 1320 (94%) der Fälle war das Ergebnis der automatischen Prozedur dasselbe wie das der visuellen Inspektion. In 51 Fällen war das Ergebnis der visuellen Inspektion positiv und der automatischen Regel negativ (V+/A-), und in 26 Fällen war es umgekehrt. Die Differenz (51-26=25) gibt den Nettoeffekt des Unterschieds der beiden Verfahren auf das Ergebnis wieder: er ist von der Größenordnung von 2%. V-/A+ Urteile kamen in der Regel durch Zufallstappen zustande, das zufällig die Kriterien der automatischen Regel erfüllte. V+/A- Urteile kamen oft durch recht genaue harmonische Unterteilungen beim Tappen zustande (z.B. 2/3), die vom automatischen Algorithmus nicht entdeckt wurden. Alles in allem ist die visuelle Methode vorzuziehen, da es unmöglich ist, alle Fälle im Computerprogramm zu berücksichtigen, bei denen eine visuelle Inspektion ein klares positives Urteil fällen würde. Eine Wiederholung der visuellen Methode nach acht Monaten ergab in 98% der Fälle dasselbe Ergebnis, mit einem Nettoeffekt von 0.4%.

II. Ergebnisse

In Tab. 4.1 sind die Ergebnisse, summiert über die 10 Versuchspersonen jeder Gruppe, aufgeführt. Jeweils drei Zeilen geben für jede der beiden Gruppen die Ergebnisse im ersten, zweiten und dritten Block (Durchlauf) wieder. In Abb. 4.1 sind dieselben Daten nach Anwendung eines pool-adja-cent-violators Verfahrens graphisch wiedergegeben. Dabei werden benachbarte Bins zusammengeworfen, wenn sie eine angenommene Monotonität verletzen. Das wird solange iteriert, bis eine monotone Funktion erreicht wird. So werden zufällige Fluktuationen, die das Beurteilen der Kurven erschweren würden, beseitigt. Dieses Verfahren wurde auf alle Punkte bis auf den ersten Punkt des ersten Blocks der Gruppe A angewendet. Die hier beobachtbare Nonmonotonität ist darauf zurückzuführen, daß dies der erste Einzelversuch des Experiments war, wo

61

die

Versuchspersonen noch nicht genau wußten, was sie erwartete. Da dies aber (für Gruppe A) bei einer leicht durchzuführenden Aufgabe geschah, wurde dadurch eine Nichtmonotonität eingeführt.

Bevor man ein pool-adjacent-violators Verfahren anwendet, muß man überprüfen, ob dies gerechtfertigt ist. Eine Vorbedingung ist, daß es gute Gründe gibt, anzunehmen, daß die Daten sich monoton verhalten. Dies ist bei periodischem Rauschen der Fall: Guttman und Julesz (1963) haben gezeigt, daß lange Zyklen schwieriger zu detektieren sind als kurze. Nach Anwendung des Verfahrens sollte man überprüfen, ob die Originaldaten mit dem Ergebnis kompatibel sind. Dazu wurde ein ²-Wert berechnet. Dieser gibt den Unterschied zwischen den originalen Daten (Tab. 4.1) und den geglätteten Daten (Abb. 4.1) wieder. In der Summe über alle 132 Einträge in Tab. 4.1 ist ² gleich 48.35. Als nächstes muß die Zahl der Freiheitsgrade bestimmt werden. Im Falle des pool-adjacent-violators Verfahrens wird bei jedem pooling von p Bins eine Anzahl von p-1 zu der Zahl der Freiheitsgrade k-1 beigetragen. Summiert über alle durchgeführten pooling Vorgänge ergibt sich ein k-1 von 62. Für diese hohe Zahl von Freiheitsgraden ist ein ²-Wert von 48.35 ziemlich klein: ein größerer ²-Wert wäre mit einer Wahrscheinlichkeit von 70% zu erwarten. Die Abweichungen von der Monotonität in Tab. 4.1 sind daher gut mit Zufallsfluktuationen zu erklären.

Im ersten Durchlauf von Gruppe A werden noch Zyklen bis 2.8 Sekunden korrekt getappt. Aber auch Zyklen bis 10 oder 20 Sekunden Länge können von einigen Versuchspersonen richtig wiedergegeben werden, obwohl das einzige Training in der Präsentation einiger kürzerer Periodizitäten bestanden hatte (ca. 10 Minuten Gesamtdauer für 10 s, und 20 Minuten für

.5 .6 .7 .8 1 1.2 1.4 1.6 2 2.4 2.8 3.2 4 5 6 7 8 10 12 14 16 20 Gruppe A: aufsteigend

B1 5 8 8 9 6 8 8 7 4 6 5 2 3 2 3 4 2 1 3 0 0B2 8 9 9 9 10 6 8 6 6 7 6 5 4 7 3 2 2 3 3 2 3B3 9 8 10 10 9 9 8 9 10 7 9 7 8 7 6 6 2 4 3 4 3

Gruppe B: absteigend B1 8 9 9 10 9 9 9 6 8 5 3 2 6 4 3 1 2 2 2 0 0B2 9 9 8 10 9 9 8 9 7 6 8 5 7 5 2 3 2 1 1 1 1B3 9 9 7 9 9 9 8 10 8 8 7 6 6 2 3 4 4 3 2 2 1

Tab. 4.1: Ergebnisse von Experiment 4. Jeder der beiden Gruppen (A und B) umfaßte 10 Versuchspersonen. In der Tabelle ist aufgeführt, wieviel davon die Periode korrekt wiedergaben, und zwar im ersten, zweiten, bzw. dritten Block (B1,B2,B3), als Funktion der Zykluslänge. Gruppe A durchlief die Zykluslängen in aufsteigender Reihenfolge, Gruppe B in absteigender Reihenfolge. Diese Daten wurden dann monotonisiert für Abb. 4.1.

62

20 s). Der zweite und der dritte Block zeigen Trainingseffekte: die 50%-Schwelle liegt beim zweiten Block bei fünf und beim dritten Block bei sieben Sekunden.

Die Daten von Gruppe B sind ähnlich. Der Trainingseffekt zwischen den Blöcken ist deutlich geringer: absteigende Periodizitäten sind als Training offensichtlich weniger gut geeignet. Um so bemerkenswerter ist es, daß in dieser Gruppe es zwei Versuchspersonen gelang, zu einem 12-s Zyklus im ersten Durchlauf korrekt zu tappen. Das einzige Training dieser Versuchspersonen hatte darin bestanden, vorher (ca. 6 Minuten) noch längere Zyklen zu hören, bei denen sie keinerlei Periodizität ausmachen konnten und das ihnen daher wie weißes Rauschen vorkommen mußte.

Abb. 4.1: Graphische Darstellung der Daten aus Tab. 4.1 nach Anwendung eines pool-adjacent-violators Verfahrens. Die Ordinate zeigt den Prozentsatz der Gruppe, der die Periodizität korrekt entdeckt hat, die Abszisse gibt die Zykluslänge wieder. Die durchgezogenen Linien mit Symbolen beziehen sich auf Gruppe A (aufsteigende Reihenfolge). Es ist ein deutlicher Trainingseffektzwischen den einzelnen Durchläufen erkennbar. In Gruppe B (gepunktete Linien) ist der Trainingseffekt deutlich kleiner.

63

4.3 PR-Wahrnehmung: ein Phänomen des langen auditiven SpeichersGuttman und Julesz (1963) geben als Grenze der Detektion von periodischem Rauschen durch naive Versuchspersonen eine bis zwei Sekunden an. Dies erweist sich ganz im Sinne der eingangs aufgestellten Hypothese mit ganz geringem Aufwand auf mehrere Sekunden ausdehnbar. Es handelt sich offensichtlich nicht um eine wirkliche Grenze, da die Versuchspersonen bei Guttman und Julesz zwar einerseits um das Paradigma wußten, andererseits nicht mit Konzentration einige Minuten Versuchszeit investierten. Es wäre interessant, ein Paradigma zu entwerfen, mit dem für naive, nicht informierte und nicht aufmerksam auf das Rauschen achtende Versuchspersonen erhoben wird, bis zu welcher Grenze sie spontan einen Unterschied zwischen nicht periodischem und periodischem Rauschen entdecken. Dies könnte dann wesentlich näher bei 250 ms (der von Guttman und Julesz gefundenen Grenze zwischen motor-boating und whooshing Perzepten) liegen, und damit auch in der Größenordnung der im nächsten Kapitel abzuleitenden Zeitkonstanten für die Kapazität des Echogedächtnisses.

Durch Experiment 4 ist klar geworden, daß informierte und aufmerksame Versuchspersonen mit ganz geringem Trainingsaufwand Zyklen von bis zu sieben Sekunden Länge entdecken können. Zeitkonstanten dieser Größe ordnet Nelson Cowan (1984) dem langen auditiven Speicher zu. Daher soll verglichen werden, inwieweit das Phänomen des periodischen Rauschens auf der Grundlage der bisher erhobenen Daten mit dem von Cowan postulierten Speichersystem kompatibel ist.

Ein Kennzeichen von Phänomenen des langen auditiven Speichers ist nach Cowan, daß diese Phänomene subjektiv als Erinnern erfahren werden. Dies gilt nicht für periodisches Rauschen: Das erste Vorkommen eines Perzeptes wird nicht als Erinnern, sondern als Wahrnehmung erfahren. In weiteren Zyklen wiederholen sich dann diese Perzepte, und nun kann dies in der Erinnerung mit den früheren Zyklen verglichen werden. Aber hier ist – wie beim erstmaligen Hörbarwerden – das Echogedächtnis für die Wahrnehmung zuständig. Das Erinnern des Wahrgenommenen kommt hinzu und ist nicht ursächlich.

64

Diese Besonderheit von periodischem Rauschen liegt an der unstrukturierten Art des Stimulus, die den Anstoß zu seiner Verwendung in der Echogedächtnisforschung gegeben hat. Sobald strukturiertere Stimuli zur Anwendung kommen, wird bereits deren erstes Vorkommen bewußt erfahren und kann mit einem späteren Vorkommen verglichen werden. Mit weißem Rauschen haben wir uns an ein Extrem der Verarbeitungskette gestellt, wo Gedächtnisphänomene zwar schon nachweisbar sind, aber nicht bewußt erfahren werden. Dies muß keinen wesentlichen Unterschied ausmachen. So gibt es fließende Übergänge, wie z.B. bei Experimenten zum Zeitordnungsgedächtnis: Bei ganz schnellen Abfolgen können Änderungen der Reihenfolge zwar detektiert werden, die korrekte Reihenfolge kann aber nicht reproduziert werden. Es wäre zu fragen, ob hier von einem bewußten Erinnern im Sinne von Cowan gesprochen werden kann, da die Tonfolge als solche zwar gut hörbar ist, die Abfolge der Töne aber nicht aufgelöst werden kann. In Abweichung von dem von Cowan benannten Kennzeichen erscheint es sinnvoll, auch solche Phänomene dem langen auditiven Speicher zuzuordnen, die nicht bewußt als Erinnern erfahren werden. Umgekehrt ist es sicherlich weiterhin sinnvoll, als Kennzeichen des kurzen auditiven Speichers das Fehlen der Erfahrung einer Erinnerung beizubehalten.

Die hier gemessenen maximalen Zyklusdauern sind etwas geringer als die von Cowan für den langen auditiven Speicher angenommene Zeitkonstante (20 s). Aber auch Cowan hat viele Phänomene mit ähnlichen Zeitkonstanten beim langen auditiven Speicher eingeordnet. Er erklärt diese Diskrepanz mit einer Störung des Gedächtnismechanismus durch zwischenzeitlich präsentiertes Stimulusmaterial. Auch bei periodischem Rauschen wäre eine solche Erklärung möglich. Cowan hatte schon die 1-2 s Grenze von Guttman und Julesz in die Klasse der Phänomene des langen auditiven Speichers eingeordnet. Von daher bedeutet es einen großen Fortschritt, daß mit der vorliegenden Arbeit nachgewiesen wird, daß diese Grenze mit nur wenig Training auf 5-7 Sekunden erweiterbar ist. Die größenordnungsmäßige Übereinstimmung der hier abgeleiteten Konstante mit der von Cowan postulierten Zeitkonstante des langen auditiven Speichers ist ausreichend, um die PR-Wahrnehmung in die Klasse der Phänomene des langen auditiven Speichers einordnen zu können.

Wie schon am Anfang dieses Kapitels bemerkt, ist es problematisch, den Abfall der Gedächtnisleistung mit einer einzigen Zahl zu beschreiben. Der

65

Verlauf der in Abb. 4.1 gezeigten Kurven ist signifikant von einem exponentiellen Abfall verschieden und erinnert eher an s-förmige Verläufe wie bei Funktionen aus der Klasse der tanh. Solche Kurven kommen in quantitativen Modellen des Gedächtnisses dann zustande, wenn neben Zerfallsprozessen auch Selbsterregungs– und Sättigungsprozesse berücksichtigt werden. Altmann (1997) untersucht einen autokatalytischen Selbsterregungsprozeß mit zeitverzögerter Hemmung nach Vorschlägen von Geißler (1995) und kann damit psychophysisch gemessene Verläufe für das Blochsche Gesetz, die Helligkeitsskalierung nach Brocca und Sulzer, die Maskierung eines Lichtblitzes durch einen großflächigeren, zeitversetzten Maskierungsreiz nach Sperling und die Scheinbewegung nach Kolers im Modell replizieren. Es erscheint allerdings schwierig, auf Grund der in Experiment 4 erhobenen Daten einen Schluß auf ein zugrundeliegendes Modell zu versuchen, da die gemessenen Prozentsätze (wie viele Versuchspersonen der Gruppe haben die Aufgabe lösen können?) mit der Aktivierung der Gedächtnisspur nicht in einem einfach auflösbaren Zusammenhang stehen. Der Verlauf der Kurven in Abb. 4.1 würde sich außerdem wahrscheinlich ändern, wenn man andere Abbruchskriterien (statt der „5 Sekunden plus 7 Zyklen“) wählen würde.

66

67

5 Kapazität des Echogedächtnisses

In diesem Kapitel wird untersucht, wieviel von dem Rauschen bei einer Darbietung periodischen Rauschens sich tatsächlich erinnern läßt. Erfaßt man dies in einer zeitlichen Meßeinheit, so ergibt sich eine erstaunlich kleine Zahl, die Anlaß zur Definition einer neuen Zeitkonstanten für das Echogedächtnis gibt: der Kapazität. In Abschnitt 5.1 wird diese Größe zunächst theoretisch diskutiert, in Abschnitt 5.2 werden Grundidee und Methodik der folgenden Experimente besprochen, die dann in den Abschnitten 5.3 und 5.4 beschrieben werden. In Abschnitt 5.5 werden die Ergebnisse dieser beiden Experimente zusammengefaßt und die möglichen theoretischen Implikationen diskutiert.

5.1 Kapazität: eine Zeitkonstante?In der Gedächtnisforschung dient neben der Messung der Lebensdauerimmer auch die Messung des Fassungsvermögens eines Gedächtnissystems, der Kapazität, zur Charakterisierung und Abgrenzung verschiedener Systeme voneinander. Berühmt ist die Arbeit von Miller (1956), in der viele relevante Arbeiten besprochen werden und die Kapazität des Kurzzeitgedächtnisses mit sieben plus minus zwei Einheiten (items) abgeschätzt wurde. Lediglich beim Langzeitgedächtnis gibt es solche Untersuchungen nicht, da man davon ausgeht, daß hier die Kapazität so groß ist, daß sie nicht experimentell erfaßt werden kann.

Die Kapazität eines Gedächtnissystems wird in der Regel in Einheiten des zu lernenden Materials, z.B. als Anzahl der behaltbaren Ziffern oder sinnlosen Silben angegeben. Dabei stellt man fest, daß die Kapazität des Kurzzeitgedächtnisses von der Art des zu behaltenden Materials abhängt. So können z.B. wesentlich weniger sinnlose Silben als Ziffern gemerkt werden. Es liegt nahe, zu vermuten, daß dieses Gedächtnissystem zwar schon eine einheitliche Kapazität hat, daß aber je nach Material unterschiedlich viel pro Einheit davon verbraucht wird. Dies könnte daran liegen, daß ein kategorialer Kode abgespeichert wird, und daß die einzelnen Einheiten in diesen Kode übersetzt unterschiedlich viel Kode ergeben. In Analogie zur automatischen Datenverarbeitung könnte man davon sprechen, daß eine einzelne Einheit je nach Material unterschiedlich viele Bits an Information

68

zur Kodierung braucht, und daß die Kapazität des Kurzzeitgedächtnisses, gemessen in Bits, konstant ist. Das Problem liegt darin, daß man den zur Speicherung verwendeten Kode nicht kennt und daher die Kapazität nicht in diesem Maß ausdrücken kann. Daher muß man auf operational definierte Maße, wie z.B. die Anzahl der Einheiten, zurückgreifen.

Wenn man sich dem sensorischen Gedächtnis zuwendet, stößt man beim Versuch, die Kapazität in Anzahl der Einheiten zu messen, auf Schwierigkeiten. Wie viele Einheiten ist „eine Sekunde weißes Rauschen“? Beim klassischen Versuch von George Sperling (1960) zum visuellen sensorischen Gedächtnis wurde zwar eine Matrix mit einer abzählbaren Anzahl von Buchstaben dargeboten, aber da das Konzept des ikonischen Gedächtnisses von Neisser (1967) eine äußerst hohe Kapazität der Ikone vorsah, kann man diese nicht mit der Zahl der Buchstaben in Zusammenhang bringen. Es ist zudem so, daß man im Teilbericht nicht nur den Buchstaben, sondern auch seine Größe, seine Farbe, ja evtl. ob er Serifen hat, berichten könnte. Mit dem visuellen sensorischen Speicher ist es möglich, Zufallspunktemuster zu erinnern (z.B. Eriksen und Collins, 1967), wo die Anzahl der Einheiten (wenn man in dieser Maßzahl messen will) sehr hoch ist. Das Einprägen der Buchstabenmatrix im Fall von Sperling ist nicht vergleichbar mit Experimenten zum Kurzzeitgedächtnis, wo in der Regel nur der Buchstabenwert, also seine Bedeutung, erinnert wird. Zu diesem Zweck erfolgt hier eine Transformation in kategoriale Kodes, die (ebenfalls ein Postulat Neissers) bei der Ikone noch nicht stattgefunden hat. Es ist daher nicht einfach, auf die Frage der Kapazität der Ikone eine Antwort zu geben, ja es ist noch nicht einmal klar, in welcher Einheit (Steradian? Pixel?) diese Antwort ausfallen müßte.

Beim auditiven sensorischen Gedächtnis bietet es sich an, diejenige Menge weißen Rauschens zu bestimmen, die im Echogedächtnis gespeichert werden kann. Als Maß dafür kommt die Zeitdauer dieser Menge weißen Rauschens in Frage. Natürlich würden sich für anderes, redundanteresStimulusmaterial andere Werte ergeben, aber da unser Ansatz war, sich ganz an das eine Extrem der Signalverarbeitungskette zu stellen, ist mit der Angabe der Kapazität in Millisekunden weißen Rauschens eine sinnvolle Eckgröße für die Kapazität des Echogedächtnisses ermittelt.

Welche Größe könnte man für die so zu ermittelnde Kapazität vermuten? In vielen Abhandlungen über periodisches Rauschen wird angegeben, daß das

69

Echogedächtnis 1 Sekunde weißes Rauschen speichern könne. Dies orientiert sich sicherlich an der ursprünglich von Guttman und Julesz angegebenen Grenze von 1-2 Sekunden für die maximale Zykluslänge. Da sich diese Grenze sehr leicht auf mehrere Sekunden erweitern läßt, müßte man analogerweise vermuten, daß die Versuchsperson sehr leicht lernt, mehrere Sekunden weißes Rauschen im Echogedächtnis zu speichern. Beim Verfolgen langer Periodizitäten wie in Experiment 4 fällt jedoch introspektiv auf, daß man lediglich einen ganz kleinen Teil des Rauschzyklus strukturiert erlebt, während der Rest des Zyklus wie ganz normales weißes Rauschen klingt. Dies war die Motivation für die folgende Untersuchung. Der nächste Abschnitt bespricht, wie die Kapazität des Echogedächtnisses mit Hilfe der PR-Wahrnehmung ermittelt werden kann. Mit der vorgestellten Methodik wird dann in Abschnitt 5.3 und 5.4 die folgende Hypothese überprüft:

HYPOTHESE:

Die Kapazität des Echogedächtnisses für weißes Rauschen ist äußerst gering. Drückt man sie als Zeitmaß aus („Wie viele Millisekunden weißes Rauschen können erinnert werden?“), dann ist sie um eine Größenordnung kleiner als die Lebensdauer des Echogedächtnisses. Empirisch sollte sich finden lassen, daß bei der PR-Wahrnehmung große Teile des Zyklus ausgetauscht werden können, ohne daß dies der Versuchsperson auffällt.

5.2 Austausch von Segmenten zur KapazitätsmessungUm auszumessen, wieviel von dem Rauschen während einer PR-Darbietung wirklich erinnert wird, wurden während der Darbietung Teile des Zyklus ausgetauscht und der Versuchsperson die Aufgabe gestellt, anzuzeigen, wann immer sie einen solchen Wechsel bemerkt. In Vorversuchen stellte sich heraus, daß man dabei keine längeren Teilstücke am Stück austauschen sollte, da man damit nicht erfassen kann, wenn z.B. zwei Elemente gemerkt werden, zwischen denen eine nicht erinnerte Lücke ist. Wenn die Teilstücke länger als diese Lücke sind, ist sie nicht meßbar, und würde fälschlich der erinnerten Menge zugeschlagen. Wenn man hingegen nur ein kurzes Stück austauscht, ist die Wahrscheinlichkeit sehr hoch, daß dieser Austausch nicht bemerkt wird, und man muß sehr viele Versuche machen, bevor man anhand positiver Reaktionen der Versuchsperson weiß, welche Teilstücke relevant sind. In den folgenden Experimenten wurden daher jeweils mehrere kleine Teilstücke an unabhängigen Stellen ausgetauscht, und die Anzahl

70

dieser Teilstücke wurde adaptiv so geregelt, daß in 50% der Fälle der Austausch bemerkt wurde. Abb. 5.1 erläutert den Aufbau eines Einzelversuchs, wie sie in Experiment 5 und 6 zum Einsatz kamen.

Ein Einzelversuch begann damit, daß mitten in der Darbietung periodischen Rauschens ein Zyklus durch den Austausch einer gewissen Zahl von Segmenten verändert wurde. Diesem veränderten Zyklus folgte ein intakter Zyklus, und die Versuchsperson hatte mit ihrer Antwort Zeit, bis dieser intakte Zyklus vorbei war. So konnte sie nach dem veränderten Zyklus noch einmal den intakten Zyklus abwarten, bevor sie sich zu der Mitteilung entschied, tatsächlich eine Veränderung wahrgenommen zu haben. Bevor dann der nächste Einzelversuch begann, wurde ein weiterer intakter Zwischenzyklus eingeschoben, um die gedächtnismäßige Repräsentationdes erinnerten Rauschsegmentes aufzufrischen bzw. zu festigen. Somit war also jeder dritte Zyklus der Beginn eines Einzelversuchs, und der Versuchsperson wurde dieser Beginn am Computermonitor angezeigt.

Wenn die Versuchsperson eine Veränderung gehört zu haben meinte, signalisierte sie das durch einen Tastendruck auf der Leertaste der Computertastatur. Diese Reaktion wird im folgenden als Ja-Reaktion bezeichnet, während keine Reaktion (keine Taste gedrückt) als Nein-Reaktion bezeichnet wird. Bei einer Ja-Reaktion wurde die Zahl der auszutauschenden Elemente beim nächsten Einzelversuch um eins reduziert (wie in Abb. 5.1: statt zweier Elemente wird im nächsten Einzelversuch nur noch ein Element ausgetauscht), bei einer Nein-Reaktion wurde sie um eins erhöht. Dadurch wird gewährleistet, daß der Anteil der Ja-Antworten ungefähr 50% ausmacht. Dies ist für die maximum-likelihood Auswertung von Vorteil. Mit einer Wahrscheinlichkeit von 20% wurde ein Kontrollversuch eingeführt, bei dem kein Element ausgetauscht wurde. Eine Ja-Antwort auf einen Kontrollversuch wurde als falscher Alarm gewertet.

ein Einzelversuch Zwischenzyklus nächster EinzelversuchC D E F A B C x E y A B C D E F A B C D E F A z C D E F A B C

Testzyklus intakter ZyklusAntwortintervall

Abb. 5.1: Aufbau eines Einzelversuchs für Experimente 5 und 6. Der Zyklus sei in eine Anzahl von (hier: sechs) Segmenten unterteilt. Ein Einzelversuch besteht aus einem veränderten Zyklus (hier: zwei Segmente ausgetauscht) und einem darauf folgenden intakten Zyklus. Zwischen je zwei Einzelversuchen liegt noch ein weiterer Zwischenzyklus, damit die Versuchsperson sich besser an den intakten Zyklus gewöhnen kann.

71

Waren im gesamten Versuch (60 Einzelversuche) mehr als 2 falsche Alarme, dann wurde der Versuch als ungültig bewertet und mußte wiederholt werden. Dies sollte ein strenges Entscheidungskriterium induzieren, bei dem nur dann eine Veränderung angezeigt wurde, wenn sie mit großer Sicherheit wahrgenommen wurde, da eine hohe Falsch-Alarm-Rate die Ergebnisse des maximum-likelihood Verfahrens in Frage gestellt hätte.

Zusätzlich wurde vor und nach dieser Phase zu dem selben periodischen Rauschen mittels Tappen erhoben, wann die Versuchsperson die für sie relevanten Perzepte hört. Ein kompletter Versuch begann also mit einer Darbietung periodischen Rauschens, zu der die Versuchsperson nach einer gewissen Zeit des Zuhörens den von ihr gehörten Rhythmus mit Tappen anzeigen sollte. Es war erlaubt, auch mehrmals pro Periode zu tappen, wenn mehrere Elemente hörbar wurden. Wenn die Versuchsperson zu 10 Zyklen dieses Rauschens mitgetappt hatte, wurde bei fortlaufender Darbietung die Aufgabe geändert, und sie mußte nun Veränderungen wie in Abb. 5.1 beschrieben detektieren. Waren 60 solcher Einzelversuche vorbei, dann mußte sie noch einmal den von ihr gehörten Rhythmus tappen. Ein solcher Versuch konnte für die längste getestete Periode (6 Sekunden) 20 Minuten dauern.

Die Log-Datei eines Versuchs konnte dann aussehen wie in Tab. 5.1 für Beispielsdaten. Am Anfang und am Ende findet man die Zeiten, zu denen die Versuchsperson den von ihr gehörten Rhythmus getappt hat. Da es sich hier um einen sechs Sekunden langen Zyklus handelte, werden in der rechten Kommentarspalte diese Zeiten modulo sechs dargestellt. Daraus geht hervor, daß die Versuchsperson am Anfang zu zwei Zeitpunkten im Zyklus tappt, ungefähr bei 4.0 und 5.8, und am Ende des gesamten Versuchs zu einem Zeitpunkt, bei 4.0. Dazwischen liegen die Beschreibungen der Einzelversuche. Diese beginnen mit der Zahl der ausgetauschten Segmente (erste Zeile: 5 Segmente wurden ausgetauscht) und der Antwort der Versuchsperson („j“ für Ja und „n“ für Nein, erste Zeile: Ja, also der Wechsel wurde bemerkt). Dann folgen die Kennzahlen derjenigen Segmente, die ausgetauscht worden waren (erste Zeile: 0,1,3,11,14). In der nächsten Zeile werden nur noch vier Segmente ausgetauscht, da im Vorversuch eine Ja-Reaktion erfolgte. In der vierten Zeile ist ein Kontrollversuch wiedergegeben, den die Versuchsperson korrekt zurückgewiesen hat. Die Kommentare zu den Einzelversuchen in der

72

rechten Spalte beziehen sich auf das maximum-likelihood Verfahren, das im folgenden beschrieben wird.

Nehmen wir an, jedes Segment i sei gekennzeichnet durch eine gewisse Wahrscheinlichkeit pi, daß der Austausch dieses Segmentes bemerkt wird, wenn sonst nichts an dem Rauschzyklus geändert wird. Dies war natürlich normalerweise nicht der Fall, da ja mehrere Segmente ausgetauscht wurden. Die Wahrscheinlichkeit, den Austausch dieses einen Segmentes zu verpassen, ist dann 1 pi. Die Wahrscheinlichkeit, einen Austausch mehrerer Segmente im Einzelversuch t zu verpassen, ist dann

Gl. 5.1: pt(„Nein“) = i=a,b,c...(1 pi),

wobei a,b,c... die Kennzahlen der in Einzelversuch t ausgetauschten Segmente sind. Die Wahrscheinlichkeit pt(„Ja“), den Austausch zu bemerken, ist dann 1 pt(„Nein“). Somit kann für jeden Einzelversuch t die Wahrscheinlichkeit für die tatsächlich beobachtete Antwort („Ja“ oder „Nein“) berechnet werden. Dies ist in der rechten Spalte von Tab. 5.1 neben jedem Einzelversuch demonstriert.

Es ist das Ziel der maximum-likelihood Analyse, die einzelnen Wahrscheinlichkeiten pi von der Antwort der Versuchsperson auf Multisegmentaustausche abzuleiten, also den Beitrag der pi aus der Entdeckungswahrscheinlichkeit für eine Austausch mehrerer Segmente herauszulösen. Dazu wurden die pi zunächst auf Zufallswerte gesetzt. Für jeden Einzelversuch t eines bestimmten Versuches konnte nun für diese hypothetischen pi die Wahrscheinlichkeit pt(„Ja“) oder pt(„Nein“) für die beobachtete Antwort in diesem Einzelversuch berechnet werden. Das Produkt aller dieser Wahrscheinlichkeiten ist gleich der Wahrscheinlichkeit ps für den ganzen Versuch aus 60 Einzelversuchen. Diese Wahrscheinlichkeit ps hängt natürlich von den gewählten Werten der pi ab, und diese sind ja noch nicht sinnvoll, sondern erst einmal zufällig. Indem man nun die Werte der pi variiert, kann die Wahrscheinlichkeit ps optimiert werden. Diejenigen Werte für die pi, die den optimalen Wert für ps liefern, werden dann als wahrscheinlichste Werte für die pi akzeptiert.

Die Optimierungsmethode konvergiert für verschiedene Startwerte immer gegen dieselben Werte der pi. Diese werden als Anzeichen für die Relevanz dieses Elementes für die Gedächtnisaufgabe angesehen. Die Summe pi

73

S der Wahrscheinlichkeiten pi multipliziert mit der Segmentlänge S hat die Einheit Sekunden und ist ein Maß für die Kapazität des insgesamt erinnerten weißen Rauschens. Dieses Maß verändert sich nicht, wenn die Versuchsperson während des Versuchs ihre Strategie ändert und andere Segmente erinnert: die pi der alten Segmente werden abnehmen, und dafür werden an anderer Stelle die pi zunehmen, und die Summe bleibt gleich.

In Simulationen wurde nachgewiesen, daß die durch die maximum-likeli-hood Abschätzung der pi eingeführten Fehler gering sind: 13% für die pi

bzw. zwischen 12 und 19% für die Summe.Um den durch das maximum-likelihood Verfahren eingeführten Fehler abzuschätzen, wurden Simulationen mit „virtuellen Versuchspersonen“ durchgeführt. Die in Experiment 5 ermittelten Werte für die p i wurden für diese virtuellen Versuchspersonen als tatsächlich gegeben angenommen. Deren Reaktion sollte nur von diesen pi abhängen wie in Gl. 5.1 beschrieben. 5800 virtuelle

Auszug aus Log-Datei Kommentare... Tappzeitpunkt modulo 6 SekundenTapp bei 124.20 4.20Tapp bei 125.81 5.81Tapp bei 129.87 3.87Tapp bei 131.87 5.87Tapp bei 135.91 3.91Tapp bei 137.81 5.81

... Wahrscheinlichk. pt für Resultat von Einzelversuch t5 y 0 1 3 11 14 pt(„ja“) = 1- (1-p0)(1-p1)(1-p3)(1-p11)(1-p14)4 n 6 8 10 11 pt(„nein“) = (1-p6)(1-p8)(1-p10)(1-p11)5 n 3 5 14 15 19 pt(„nein“) = (1-p3)(1-p5)(1-p14)(1-p15)(1-p19)0 n Kontrollversuch, korrekt zurückgewiesen6 y 0 1 4 11 15 18 pt(„ja“) = 1- (1-p0)(1-p1)(1-p4)(1-p11)(1-p15)(1-

p18)5 n 2 9 11 17 18 pt(„nein“) = (1-p2)(1-p9)(1-p11)(1-p17)(1-p18)6 n 2 3 4 5 7 17 pt(„nein“) = (1-p2)(1-p3)(1-p4)(1-p5)(1-p7)(1-

p17)... ps = pt

... Tappzeitpunkt modulo 6 SekundenTapp bei 1222.04 4.04Tapp bei 1228.12 4.12Tapp bei 1234.03 4.03Tapp bei 1239.96 3.96Tapp bei 1245.97 3.97

Tab. 5.1: Auszug aus einer beispielhaften Log-Datei für Experiment 5 oder 6. Erläuterungen siehe Text.

74

Einzelversuche wurden durchgeführt (100mal jeder gemessene Satz von p i). Jede Sitzung hatte 48 Einzelversuche (60 minus 20% Kontrollversuche), und es wurde die Abweichung der mittels maximum-likelihood Verfahren errechneten Schätzwerte qi von den als wirklich gegeben angenommenen p i ermittelt. Die Standardabweichung für die einzelnen qi war im Mittel 13%. Wären die Fehler der qi voneinander unabhängig, dann müßte der Fehler der Summe pi S gleich 0.13  S B sein, wo B die Anzahl der Segmente im Rauschzyklus ist. Der tatsächlich gemessene Fehler für die Summe beträgt 12% für die kürzesten verwendeten Zykluslängen und 19% für die längsten. Er ist deutlich kleiner als 0.13  S B und entspricht ungefähr 0.13  S Bnn, wo Bnn die mittlere Anzahl der von Null verschiedenen Segmente ist. Der Fehler der Summe wird weiterhin ungefähr um einen Faktor 4 reduziert durch den Umstand, daß insgesamt ca. 16 Messungen pro Zykluslänge durchgeführt wurden. Er macht somit ca. 5% bei den Daten von Experiment 5 und 6 aus.

In den folgenden beiden Experimenten wurde überprüft, wie das so erhaltene Kapazitätsmaß sich in Funktion der Zykluslänge (Experiment 5) bzw. der Segmentlänge (Experiment 6) verhält.

5.3 Experiment 5: Abhängigkeit von der Zykluslänge

I. Methodik

Fünf untrainierte Versuchspersonen lernten mit einer kurzen Trainingsprozedur, in 6-s langen Zyklen die Periodizität wahrzunehmen.

Dazu wurde ihnen leicht wahrnehmbares periodisches Rauschen einer Zykluslänge von 0.6 Sekunden vorgespielt. Sie wurden aufgefordert, den gehörten Rhythmus mitzutappen. Mit jedem Tapp der Versuchsperson verlängerte sich der Zyklus um ein kleines Stück. Wenn sich dadurch das Perzept zu sehr änderte, durfte die Versuchsperson mit Tappen aufhören und noch einmal genau hinhören, um evtl. einen anderen Tappzeitpunkt zu wählen. Wenn die Versuchsperson nicht innerhalb von 10 Zyklen wieder mit Tappen startete, wurde der Versuch abgebrochen. Wenn das Programm die Länge von sechs Sekunden erreicht hatte, wurden noch weitere 10 Zyklen präsentiert, dann war ein Trainingslauf (ca. 3 Minuten) beendet. Mittels visueller Inspektion einer graphischen Darstellung der Tappzeitpunkte wurde kontrolliert, ob die Versuchsperson tatsächlich erfolgreich bis zum Schluß den Rhythmus gehört hatte. Vier erfolgreich abgeschlossene Trainingsdurchläufe waren Voraussetzung für den Start des Experimentes.

Die Stimuli wurden auf einer NeXT workstation erzeugt und mit 44.1 kHz gewandelt. Es kam die im vorigen Abschnitt beschriebene Methodik des Austauschs von Segmenten zur Anwendung. Die Segmentlänge sollte nicht kürzer als die in Experiment 2 abgeschätzten 100 ms sein, und nicht so

75

groß, daß nicht erinnerte Lücken zwischen zwei Segmenten nicht mehr ausgetastet werden können. Sie wurde für dieses Experiment auf 300 ms gesetzt. Als Zykluslängen kamen 1.2, 2.4, 4.2 und 6 Sekunden zum Einsatz, das bedeutet, daß die Zyklen in 4, 8, 14, bzw. 20 Segmente unterteilt wurden. Für jeden Versuch (der 60 Einzelversuche enthielt) wurde eine neue Rauschprobe der benötigten Länge gewürfelt. Wenn eine Versuchsperson mit einem Stimulus nicht zurechtkam, also keine deutliche Periodizität heraushören konnte, dann durfte sie den Versuch abbrechen und einen neuen Stimulus würfeln lassen. Diese Möglichkeit wurde von den Versuchspersonen begrüßt und in etwa 1/3 aller Fälle in Anspruch genommen. Die Versuchspersonen sollten die verschiedenen Zykluslängen in aufsteigender Reihenfolge dreimal durchführen, was eine Summe von 60 Versuchen ergibt. Die Studenten haben sich nicht ganz an diesen Plan gehalten und insgesamt 58 valide Datensätze erzeugt (1.2s: 17, 2.4s: 15, 4.2s:14, 6s:12).

II. Ergebnisse

Der größte Teil von langen Zyklen konnte ausgetauscht werden, ohne daß die Versuchspersonen es bemerkt hätten: 2/3 aller pi waren gleich Null. Die relevanten Segmente (pi > 0.5) waren in der Regel an denselben Stellen, an denen die Versuchspersonen auch getappt hatten. In der Hälfte der Fälle war das Tappen vor und nach den Einzelversuchen identisch. Abb. 5.2 zeigt für einen der 58 Datensätze das Ergebnis der Einzelauswertung.

Abb. 5.3 zeigt die Ergebnisse gemittelt über die fünf Versuchspersonen als Funktion der Zykluslänge. Die Fehlerbalken zeigen die Größe der Standard-abweichung der Daten an. Die Hauptquelle der Varianz ist die interindividuelle Variabilität. Wenn die Versuchspersonen 100% des Rauschzyklus erinnert hätten, müßten die Daten auf der Diagonalen liegen. In Wirklichkeit aber haben die Versuchspersonen nur einen kleinen Teil der Rauschprobe erinnern können, und zwar unabhängig von der Zykluslänge ca. eine halbe Sekunde.

Das so gewonnene Ergebnis kann aber noch nicht als valider Schätzwert der Kapazität des Echogedächtnisses für weißes Rauschen gesehen werden. Wenn die Versuchspersonen sich z.B. nur einen unendlich kleinen Bruchteil der Wellenform gemerkt hätten, diesen aber perfekt, dann hätten sie immer den Austausch eines ganzen 300 ms langen Segmentes entdeckt, und als

76

Schätzwert hätten wir 300 ms erhalten. In Experiment 6 wird daher die Segmentlänge variiert und überprüft, wie die gemessene Kapazität davon abhängt.

77

Abb. 5.2: Beispiel für das Ergebnis der maximum-likelihood Analyse. Die x-Achse repräsentiert den 6-s Rauschzyklus und ist wie dieser in 20 Segmente unterteilt. Die y-Achse gibt die Werte für die Wahrscheinlichkeit pi wieder, daß das Segment bei Austausch eine Ja-Reaktion auslöst (graue Balken). Die meisten pi sind gleich Null, d.h. diese Segmente hätten unbemerkt ausgetauscht werden können. Die Fehlerbalken wurden mit einer Simulationsmethode bestimmt (siehe Abschnitt 5.2). Die vor und nach den 60 Einzelversuchen erhobenen Tappzeitpunkte sind durch die obere bzw. untere Gruppe von schwarzen Punkten dargestellt. Dabei wurde die y-Koordinate willkürlich so gewählt, daß die Punkte nicht aufeinander fallen. In diesem Versuch hat die Versuchsperson ihr Tappverhalten (zwei kurz aufeinander folgende Tapps pro Periode) am Ende (20 Minuten später) reproduziert. Die Tappzeitpunkte und die Relevanz der Segmente (d.h. die p i) stimmen in diesem Versuch überein.

78

Versuchsperson AS, Versuch 16. pi S = 0.534 Sekunden.

Segmentposition im Rauschzyklus [s]

Abb. 5.3: Ergebnis von Experiment 5. Erinnerter Teil eines Zyklus weißen Rauschens, gemittelt über fünf Versuchspersonen, als Funktion der Zykluslänge. Die Segmentlänge betrug 300 ms. Die Fehlerbalken entsprechen der Standardabweichung der Daten. Es ergibt sich unabhängig von der Zykluslänge ein Wert von ungefähr 500 ms.

5.4 Experiment 6: Abhängigkeit von der SegmentlängeWir wollen eine einfache Beziehung zwischen der tatsächlichen Kapazität des Echogedächtnisses und dem mit der beschriebenen Methode des Austauschs von Segmenten erhaltenen Maß M ableiten und nehmen dazu ein einfaches Modell des Speicher- und Vergleichprozesses an. Die Versuchsperson sei in der Lage, ein kohärentes Stück der Länge zu erinnern (siehe Abb. 5.4). Ein kleiner, auch nur partieller Austausch von diesem Segment führe mit Sicherheit zur Ja-Reaktion, jeder andere Austausch bleibe unbemerkt.

Wenn kleiner ist als die Segmentlänge S, dann kann das Stück der Länge entweder ganz in ein Segment fallen (Fall a von Abb. 5.4), und das Ergebnis wäre M=S. Oder es überschreitet eine Segmentgrenze, so daß der Austausch von jedem dieser beiden Segmente entdeckt würde (Fall b). Das würde zu einem Maß M=2S führen. Die Wahrscheinlichkeit p2S dafür ist gleich /S, nimmt also mit wachsender Länge zu bis hin zu eins für =S (Fall c). In diesem Fall würde das Stück mit an Sicherheit grenzender Wahrscheinlichkeit eine Segmentgrenze passieren. Im Mittel ergibt sich

79

Zykluslänge des periodischen Rauschens [s]

Gl. 5.2: M = (1p2S)  S + p2S  2S = S + p2S  S = S + (/S)  S = S + ,

wie man leicht aus der Annahme einer Gleichverteilung der Startposition des gelernten Stücks der Länge in Bezug auf die Segmentgrenzen beweisen kann. Wenn die Versuchsperson nun nicht nur ein, sondern mehrere (n) Stücke der Länge erinnern kann, ergibt sich

Gl. 5.3: M = n (S + ).

Aus dem Modell von Abb. 5.4 folgt also eine lineare Beziehung zwischen der Segmentlänge S und dem sich ergebenden Kapazitätsmaß M. In Experiment 6 wurde S variiert, um zu überprüfen, ob sich diese lineare Relation ergibt.

Abb. 5.4: Einfaches Modell der Sensitivität der Versuchsperson gegenüber dem Austausch von Segmenten (Kästen) als Funktion der Länge und Position des erinnerten Stücks. Ist die Länge dieses Stücks kleiner als die Segmentlänge S, dann gibt es zwei Möglichkeiten: Es kann ganz in ein Segment fallen (Fall a), und dann wird nur der Austausch dieses Segmentes bemerkt (graue Schattierung). Oder es überschreitet eine Grenze zwischen zwei Segmenten (Fall b) und führt dazu, daß der Austausch von jedem der beiden Segmente bemerkt wird. Die Wahrscheinlichkeit für Fall b ist /S und erreicht eins für =S (Fall c), wo mit an Sicherheit grenzender Wahrscheinlichkeit eine Segmentgrenze überschritten wird.

I. Methodik

Vier der fünf Versuchspersonen von Experiment 5 nahmen an Experiment 6 teil. Ein Training war nicht mehr erforderlich. Stimuli und Verfahren waren identisch zu Experiment 5, mit der Ausnahme, daß nur zwei Zykluslängen (2.4 und 4.8 s) getestet wurden, dafür aber zwei Segmentlängen (200 und

80

S a)

b)

c)

400 ms). Die Reihenfolge der Versuche war 4.8/400, 4.8/200, 2.4/400, 2.4/200, und mußte von jeder Versuchsperson viermal absolviert werden, um insgesamt 64 Datensätze zu erzielen. Tatsächlich wurden 62 gültige Datensätze erzielt.

II. Ergebnisse

Abb. 5.5 zeigt die Ergebnisse, gemittelt über die vier Versuchspersonen, für die zwei verschiedenen Werte der Zykluslänge, als Funktion der Segmentlänge. Die leeren Symbole zeigen die Ergebnisse von Experiment 6 für S=200 ms und S=400 ms. Die vollen Symbole zeigen die Ergebnisse aus Experiment 5 für S=300 ms. Die Werte aus Experiment 5 wurden dabei nur über diejenigen Versuchspersonen gemittelt, die auch an Experiment 6 teilgenommen haben. Der Wert 4.8/300 wurde mittels einer linearen Interpolation der Werte 4.2/300 und 6.0/300 bestimmt.

Wie schon in Experiment 5 sind auch hier die Ergebnisse unabhängig von der Zykluslänge. Die Daten für 2.4 und 4.8 Sekunden liegen fast übereinander. Vor allem aber ergibt sich in der Tat eine lineare Beziehung zwischen M und S, mit der Steigung 1.35, und dem y-Achsenabschnitt 130 ms. Dieser y-Achsenabschnitt entspricht nach Gl. 5.3 der Menge des erinnerten weißen Rauschens n, also Anzahl der erinnerten Teilstücke mal Länge dieser Teilstücke. Aus den Daten von Experiment 5 folgt somit, daß die Versuchspersonen im Durchschnitt n=1.35 Stücke der Länge =95 ms, im Ganzen also 130 ms weißes Rauschen erinnern konnten.

81

Abb. 5.5: Ergebnisse von Experiment 6. Abhängigkeit des errechneten Kapazitätsmaßes von der Segmentlänge, gemittelt über vier Versuchspersonen, für zwei verschiedene Zykluslängen. Die Standardabweichungen sind ähnlich zu denen in Abb. 5.3 und werden hier nicht gezeigt. Die gefüllten Symbole sind aus Experiment 5 interpolierte Daten. – Die beiden Kurven für 2.4 und 4.8 s fallen fast aufeinander. Die lineare Beziehung zwischen dem Kapazitätsmaß und der Segmentlänge (gepunktete Linie) legt nahe, daß der y-Achsenabschnitt (130 ms) ein valides Maß für die Kapazität des Echogedächtnis für weißes Rauschen darstellt.

Um ein Konfidenzintervall für den y-Achsenabschnitt zu erhalten, wurde eine ²-Analyse durchgeführt. Dabei wurde angenommen, daß der y-Ach-senabschnitt positiv sein müsse, da negative Kapazitätswerte im Sinne der Gl. 5.3 keinen Sinn ergeben. Außerdem wurde angenommen, daß die Steigung (das entspricht n in Gl. 5.3) größer oder gleich eins sein müsse, denn man muß ja mindestens ein Stück erinnern, um die Aufgabe lösen zu können. Das so ermittelte 95%-Konfidenzintervall für den y-

82

Segmentlänge [s]

Achsenabschnitt (und somit für die Kapazität M=n des Echogedächtnisses für weißes Rauschen) ist [0,265]ms.

5.5 Kapazität und kurzer Speicher: Koinzidenz oder Zusammenhang?Die Kapazität des Echogedächtnisses für weißes Rauschen, als Zeitkonstante ausgedrückt, ist ganz im Sinne der Hypothese erheblich kleiner als die Lebensdauer. Ein solches Ergebnis läßt sich freilich nur erzielen, wenn man mit möglichst strukturlosem Stimulusmaterial wie weißem Rauschen arbeitet. Stimuli mit mehr inhärenter Struktur (Spachstimuli, Töne) provozieren eine weitergehende Verarbeitung des Materials (Kategorisierung, chunking), die eine Kapazität für dieses Stimulusmaterial von mehreren Sekunden vortäuschen. Tatsächlich ist in diesen Fällen aber nicht mehr das unverarbeitete Signal, sondern eine halb kategoriale, halb sensorische Repräsentation desselben gespeichert worden. Die Kapazität für weitgehend unverarbeitete Repräsentationen ist offensichtlich sehr gering. Sie liegt von ihrer Größe her in dem Bereich, den Nelson Cowan dem kurzen auditiven Speichers zuordnet. Ist dies ein Zufall, oder folgt dies aus der Interaktion zwischen kurzem und langem auditiven Speicher?

Zunächst muß man sich fragen, wie genau der vermessene Wert ist, d.h. ob die Übereinstimmung durch die Meßgenauigkeit gedeckt wird. Das Konfidenzintervall beträgt [0,265] ms. Sehr kleine Werte wären schwierig zu erklären, da sie bedeuten würden, daß die Versuchsperson sich fast nichts merken kann, dies aber perfekt. Es ist interessanter, sich die obere Grenze anzuschauen, die trotz der relativ großen Meßunsicherheit bei dem erstaunlich geringen Wert von 265 ms liegt, selbst für Zyklen von 6 Sekunden Länge. Um genauere Werte zu erhalten, müßten deutlich mehr Versuchspersonen vermessen werden, da die interindividuelle Variabilität hoch ist. Das Problem dabei ist der hohe Versuchsaufwand, der durch das Verfahren bedingt ist. Um zu einem zuverlässigen Wert zu kommen, muß jede Versuchsperson mindestens sechs unabhängige Sitzungen, die jeweils recht hohe Konzentration über einen langen Zeitraum erfordern, absolvieren. Dies ist erheblich mehr, als z.B. zur Erhebung einer Kurzzeitgedächtnisspanne erforderlich ist.

83

Eine andere Frage ist, ob sich mit anderen Methoden dasselbe Maß für die Kapazität des Echogedächtnisses für weißes Rauschen ergibt. Ein Kritikpunkt an dem in Experiment 5 und 6 gewählten Verfahren könnte sein, daß durch das induzierte konservative Entscheidungsverhalten weniger Ja-Antworten gegeben worden sind als Veränderungen detektiert wurden. Bislang ist dies unvermeidbar, da der Aussagewert des maximum-likelihood Verfahrens unter falschen Alarmen enorm leiden würde. Es wäre begrüßenswert, wenn es gelänge, eine Methode zu finden, die die entscheidungsstrategischen Parameter des Experimentes besser in den Griff bekommt, und dabei vielleicht auch noch mit weniger Meßaufwand auskommt, so daß auch eine höhere Statistik und dadurch eine genauere Abschätzung erzielt werden kann.

Natürlich gilt die in diesem Kapitel ermittelte Kapazitätskonstante nur für weißes Rauschen. Für redundanteres Material werden sich höhere Werte finden lassen. Hier stellt sich die Frage, ob die Kapazität sinnvoll in einer Zeiteinheit oder nicht besser in einer Informationseinheit gemessen werden müsse. Das Problem dabei wurde schon im einleitenden Abschnitt 5.1 angesprochen: Solange die neuronalen Kodes und ihre Informationseinheiten nicht bekannt sind, muß Kapazität in am Stimulus orientierten Einheiten definiert werden. Auch ist keineswegs klar, daß für anderes Stimulusmaterial überhaupt dieselben Kapazitätsgrenzen gelten müssen, selbst wenn man die neuronalen Informationseinheiten kennt. Daher erscheint es gerechtfertigt, die für weißes Rauschen gefundene Zeitkonstante als Maß für die Kapazität des sensorischen Endes der Verarbeitungskette anzunehmen.

Es muß betont werden, daß die Kapazität bei einer Aufgabe vermessen worden ist, bei der gleichzeitig ein Erinnern über bis zu sechs Sekunden nötig war, um sie richtig zu lösen. Die Lebensdauer von mehreren Sekunden qualifiziert die PR-Wahrnehmung eindeutig als Phänomen des langen auditiven Speichers (siehe auch Abschnitt 4.3). Da sich beide Zeitkonstanten bei ein und derselben Aufgabe zeigen, handelt es sich bei der Kapazität nicht um ein Überbleibsel der Lebensdauer, unter anderen Umständen gemessen, sondern um eine gleichzeitig gültige Zeitkonstante, wirksam im selben Phänomen. Dies wird auch aus der Unabhängigkeit dieser beiden Zeitkonstanten deutlich: Die mittels periodischem Rauschen gemessene Kapazität bleibt konstant für Periodenlängen zwischen 1.2 und 6 Sekunden. Es kann daher davon ausgegangen werden, daß sie eine eigene

84

Zeitkonstante darstellt, die die zeitliche Dynamik eines zweiten, vom Spur-zerfall unabhängigen Vorgangs beschreibt. Dieser Vorgang hängt wie der Spurzerfall mit dem Erinnern zusammen, und erst beide zusammen beschreiben die zeitliche Dynamik des Erinnerns vollständig.

Man kann es als zufällige Koinzidenz ansehen, daß die Größe der Kapazität des langen auditiven Speichers für weißes Rauschen in dem Bereich liegt, den Nelson Cowan dem kurzen auditiven Speicher zuordnet. Andererseits ist es denkbar, daß die selektive Informationsweitergabe vom kurzen an den langen sensorischen Speicher durch die Lebensdauer des kurzen Speichers beschränkt ist. Diese Begrenzung der Informationsselektion würde sich im langen Speicher als Kapazitätsgrenze ausdrücken. Damit solche Überlegungen aber nicht im Bereich des Spekulativen bleiben, ist es wichtig, Anhaltspunkte über die Art der Prozesse zu gewinnen, die der PR-Wahrnehmung zugrundeliegen. Dies ist das Anliegen des nächsten Kapitels.

85

86

6 Mechanismen des Echogedächtnisses

Dieses Kapitel beschäftigt sich mit dem Mechanismus des Echogedächtnisses am Beispiel der PR-Wahrnehmung. Dazu werden im Abschnitt 6.1 introspektive Beobachtungen bei der PR-Wahrnehmung geschildert. In Abschnitt 6.2 werden verschiedene Modelle vorgestellt, die die Unterschiede in der Wahrnehmung periodischen und nichtperiodischen Rauschens erklären können. Es wird deutlich, daß die Entscheidung zwischen diesen Modellen nur mit psychophysiologischen Methoden getroffen werden kann. Abschnitt 6.3 führt eine Variante von periodischem Rauschen ein, die besonders geeignet für EEG-Untersuchungen ist: das semiperiodische Rauschen. Zwei Verhaltensexperimente zu diesem Stimulus werden vorgestellt. Dies kann als Vorarbeit gesehen werden für das Experiment 9, das in Abschnitt 6.4 beschrieben wird und zwischen den in Abschnitt 6.2 beschriebenen Modellen unterscheiden soll. Nachdem das Ergebnis in Abschnitt 6.5 diskutiert wird, folgt in Abschnitt 6.6 basierend auf den in dieser Arbeit erhobenen Befunden ein Modell des Echogedächtnisses, das Implikationen auch für Modelle des Kurzzeitgedächtnisses hat. In Abschnitt 6.7 werden Bezüge zum verwandten Paradigma des primings diskutiert.

6.1 Phänomene der PR-WahrnehmungDie Wahrnehmung von kontinuierlichem weißem Rauschen wird im wesentlichen durch einen einzigen perzeptuellen Parameter charakterisiert: die Lautstärke (entsprechend dem physikalischen Parameter der Amplitude). Ansonsten klingt weißes Rauschen homogen. Bei genauerem Hören gelingt es, das Vorhandensein von Fluktuationen wahrzunehmen, allerdings mehr auf einem allgemeinem Niveau („es fluktuiert“), und ohne daß die einzelnen Fluktuationen deutlich genug wahrgenommen werden, um Gestalt anzunehmen und beschrieben werden zu können. Das ist völlig anders bei der Wahrnehmung von periodischem Rauschen, wo die einzelnen Fluktuationen gut beschreibbare Perzepte auslösen, die auch gerne mit Vergleichen aus dem Alltag („Scheibenwischer“, „Säge“) belegt werden.

Dieser Unterschied soll durch eine kleine Anekdote verdeutlicht werden: Als ich das erste Mal periodisches Rauschen auf dem Computer erzeugt hatte und mir diesen Stimulus anhörte, war ich davon überzeugt, falsch programmiert zu haben.

87

Es hörte sich nicht nach Rauschen an. Normales weißes Rauschen hatte ich schon erfolgreich programmiert und wußte, wie es klingt. Bei dem periodischen Rauschen hörte man zwar auch das Rauschen, darin aber periodisch wiederkehrend deutliche Strukturen. Ich war sicher, daß dies an Artefakten lag, die ich beim Periodisieren des weißen Rauschens eingebaut hatte. Enttäuscht gab ich die Kopfhörer meinem Kollegen. Ich schilderte ihm den Grund meiner Enttäuschung und meinen Höreindruck. Er hörte sich die Sache an und bestätigte mir, das ich etwas falsch gemacht haben müsse, denn er könne ganz deutlich die Artefakte hören. Er beschrieb sie mir, und zu meiner Überraschung hörte er völlig andere „Artefakte“ als ich. Wir kamen schließlich zu dem Ergebnis, daß es vielleicht doch nicht an meinen Programmierfähigkeiten lag, sondern daran, daß jeder von uns auf seine eigene Weise den an und für sich perfekt zyklischen Stimulus strukturierte.

Zunächst drängt sich die Frage auf, warum periodisches Rauschen so anders klingt. Bei genauer Betrachtung erscheint aber die strukturierte Wahrnehmung von periodischem Rauschen nicht mehr so unplausibel. Das Signal ist in Wirklichkeit nicht homogen, ganz im Gegenteil, es ist sozusagen maximal inhomogen, es fluktuiert so stark als eben möglich. Es ist ein Leichtes, sich vorzustellen, daß diese Fluktuationen zu wahrnehmbaren Perzepten führen (siehe auch die Diskussion zu Abb. 3.11). Die Frage lautet also eigentlich: Warum klingt weißes Rauschen im Normalfall (d.h. nicht iteriert) homogen?

Ein Modell des Echogedächtnisses müßte neben diesem Grundphänomen der Hörbarwerdung von Perzepten in periodischem Rauschen einige weitere introspektive Beobachtungen zu den Wahrnehmungsunterschieden von weißem und periodischem Rauschen erklären können:

Wenn ein periodischer Rauschstimulus aus genau vier Iterationen eines bestimmten Rauschsegmentes aufgebaut ist, also z.B. bei einer Periodenlänge von 0.8 Sekunden genau 3.2 Sekunden dauert, dann hört auch eine hochtrainierte Versuchsperson nicht viermal ein bestimmtes perzeptuelles Ereignis, sondern nur dreimal. Während des ersten Zyklus ist das Perzept nicht vorhanden. Das liegt nicht etwa an der Überraschung beim Einschalten des Rauschens, denn wenn man diesen 3.2-Sekunden-Stimulus zweimal kurz nacheinander darbietet, dann kann man beim zweiten Mal in allen vier Zyklen das Perzept wahrnehmen. Liegt dazwischen jedoch eine Störaufgabe, dann kann es sein, daß man es wieder nur dreimal hört, ja evtl. etwas ganz anderes aus dem Rauschen heraushört (siehe Experiment 1). Es muß also einen wesentlichen Unterschied machen, ob der entsprechende Abschnitt der Wellenform

88

schon vor kurzem zu hören war oder nicht. Im ersten Zyklus liegt noch keine Wiederholung vor, und ohne diese Wiederholung klingt er wie nicht repetiertes Rauschen: homogen.

In Experimenten mit langen Rauschzyklen (z.B. Experiment 4, 5, 6) geben die Versuchspersonen immer an, daß der größte Teil des Rauschzyklus homogen klingt. Lediglich ein kurzer Moment des Rauschzyklus klingt anders: hier hört man etwas heraus. In diesem Fall werden alle Teile des Rauschzyklus bereits zum wiederholten Male präsentiert, aber nur ein kleiner Teil (entsprechend dem Fassungsvermögen, der Kapazität des Echogedächtnisses) wird wiedererkannt und löst die Perzepte aus. Was nicht in das Echogedächtnis aufgenommen werden kann, klingt homogen.

Bei erschwerten Situationen, wie z.B. der Wahrnehmung semiperiodischen Rauschens (Abschnitt 6.3), oder auch bei langen Zyklen, tritt immer wieder ein introspektiv erfahrbarer Lerneffekt auf: Man hat viele Zyklen lang zugehört und nichts heraushören können. Dann kommt das Perzept, erst schwach, und dann immer deutlicher, so daß man sich am Ende fragt, warum man es nicht gleich gehört hat. Aber bevor dieses Detail „gelernt“ ist, klingt das Rauschen homogen.

Der nächste Abschnitt stellt verschiedene mögliche Erklärungen für die beobachteten Wahrnehmungsunterschiede vor.

6.2 Restaktivierung versus sensorische VorbereitungEs ist für die folgenden Überlegungen nützlich, sich einen kurzen Augenblick mit Filtermodellen der Aufmerksamkeit zu beschäftigen, auch wenn die später vorgestellten Modelle der PR-Wahrnehmung für diesen Zweck keine expliziten Filter benötigen. Broadbent (1958) beschäftigte sich mit Aufmerksamkeitseffekten beim dichotischen Hören. Den Versuchspersonen wurde ein Kopfhörersignal mit verschiedenen Sprachsignalen auf den beiden Kanälen präsentiert, und sie sollten einen der beiden Kanäle „beschatten“ (d.h. nachsprechen). Sie konnten dann in der Regel keine Angaben über das Sprachsignal auf dem nicht beachteten Ohr machen, es sei denn, dort wechselte die Tonlage des Sprechers o.ä. Broadbent entwarf darauf ein Modell eines frühen, vorsemantischen Filters, der zur besseren Erfüllung der eigentlichen Aufgabe (Beschatten des eines

89

der beiden Kanäle) regelmäßige Signale auf dem irrelevanten Ohr (sogenannte habituierte Signale) ausfiltert. Dieses Modell kann Beobachtungen nicht erklären, die auf eine semantische Verarbeitung der irrelevanten Kanäle hindeuteten, wie z.B. das Erkennen des eigenen Namens im irrelevanten Sprachsignal.

Treisman (1960, 1964) nahm an, daß der Filter die unterdrückten Eingangskanäle nicht vollständig auslösche, sondern nur abschwäche. Semantisch signifikante Gedächtniselemente wie z.B. der eigene Name würden trotz der Abschwächung Beachtung finden. Cowan (1988) schlug vor, diese Annahme wie folgt zu interpretieren: Ein durch den Filter abgeschwächtes Eingangssignal führt nicht etwa nur bedingt (bei semantisch relevanten Elementen) zur Aktivierung und dann aber auch automatisch zur Bewußtwerdung, sondern sie führt in jedem Falle zu einer Aktivierung. Aber nur bei semantisch relevanten Elementen reicht das Ausmaß der Aktivierung aus, um Beachtung und Bewußtheit zu erreichen. Bei dieser Interpretation wird also eine Trennung von Aktivierung und

Abb. 6.1: Schematische Darstellung der Cowanschen (1988) Interpretation des Treismanschen Modells. Drei Fälle werden unterschieden: a) Der Eingang wird willentlich beachtet oder stellt ein neues Signal dar. Er wird nicht durch das Filter abgeschwächt. Die ausgelöste Aktivierung ist stark genug, um die Bewußtseinsschwelle zu überschreiten. b) Der Eingang wird nicht beachtet und stellt kein neues Signal dar (d.h. er ist habituiert). Seine Erregungswirkung wird durch das Filter abgeschwächt, die Aktivierung ist zu schwach, um die Bewußtseinsschwelle zu überschreiten. c) Der Eingang wird durch das Filter geschwächt, aber er aktiviert ein semantisch relevantes Element (z.B. den eigenen Namen). Die schwache Erregung reicht aus, um eine starke, die Bewußtseinsschwelle überschreitende Aktivierung auszulösen.

90

Filter

Bewußt seins schwelle

ab

c

Aufmerksamkeit angenommen: nicht jeder aktivierte Zustand wird auch beachtet. Diese Interpretation ist in Abb. 6.1 schematisch dargestellt. In Cowans bereits in Kapitel 1 in Auszügen vorgestellten Gedächtnismodell (siehe auch Abb. 1.3 auf Seite 10) gibt es dementsprechend aktive Zustände des langen sensorischen Speichers, die den Fokus der Aufmerksamkeit erreichen, und solche, die dies nicht schaffen.

Im Gegensatz zu den Experimenten zur Aufmerksamkeit geht es bei der PR-Wahrnehmung nicht um gut hörbare Perzepte, sondern um schwellennahe Erregungen. Cowans Vorstellung der unter– bzw. überschwelligen Aktivierung ist aber auch hier von Nutzen. Man benötigt allerdings keinen Filter, da die durch die Fluktuationen ausgelösten Eingangssignale schon von sich aus so schwach sind, daß sie die Bewußtseinsschwelle nicht erreichen. Dies würde erklären, warum bei normalem nichtperiodischen Rauschen keine Perzepte hörbar werden. Dies ist in Abb. 6.2a dargestellt.

Abb. 6.2 b)-d) stellt verschiedene Ansätze vor, die die bei der PR-Wahrneh-mung hörbar werdenden Perzepte erklären sollen. Wenn man annimmt (Teil-bild b), daß die bei der ersten Präsentation eines Rauschsegments erfolgte schwache Aktivierung von Gedächtniselementen eine Zeitlang erhalten bleibt, wird bei der erneuten Präsentation desselben Segmentes die Erregung auf noch schwach aktive Elemente treffen, die dadurch verstärkt aktiviert werden und die Schwelle zum Bewußtsein überschreiten. Bei diesem Ansatz wird allerdings nicht verständlich, warum nur eine begrenzte Anzahl von Elementen zu Perzepten führt. Beim Hören eines sechs Sekunden langen Zyklus müßten, wenn die Lebensdauer der Aktivierung ausreicht, die ganzen sechs Sekunden strukturiert klingen. Wenn die Lebensdauer nicht mehr reicht, müßten die ganzen sechs Sekunden homogen klingen. Die in Kapitel 5 über einen breiten Bereich von Zykluslängen für konstant befundene Kapazität widerspricht diesem Ansatz.

In Teilbild c) wird daher angenommen, daß die unbewußt bleibende Vorerregung ebenso wie stärkere, bewußt werdende Aktivierungen derselben Elemente an die Kapazitätsgrenzen des Kurzzeitgedächtnisses gebunden sind. Nur eine gewisse Anzahl von Elementen bleibt aktiviert, die übrigen werden im Sinne einer Interferenz gehemmt. Die hemmenden Interferenzen sind in Teilbild c) in Analogie zu Verknüpfungsdiagrammen in der Neurophysiologie als Verknüpfungen mit Querbalken dargestellt. Es ist sicherlich nicht intuitiv plausibel, von einem zwar nicht bewußten, aber

91

selektiven Prozeß auszugehen, doch stimmt diese These durchaus mit der introspektiven Erfahrung bei willentlicher Periodizitätsentdeckung in längeren Zyklen überein. Bei diesem Modell stellt die Vorerregung den alleinigen Mechanismus der Hörbarkeit der wiederholt angebotenen Rauschsegmente dar. Die zweite Aktivierung fällt nur deshalb stärker aus, weil sie auf noch leicht aktive Elemente im langen sensorischen Speicher trifft.

92

Eine alternative Erklärung wird in Teilbild d) angeboten. Es wird angenommen, daß die Erregung aller Elemente (wie bei b) noch eine Zeitlang anhält, aber daß diese Tatsache alleine nicht ausreicht, um bei der nächsten Präsentation bei gleichschwachem Eingang eine verstärkte Aktivierung auszulösen. Einige Elemente konnten jedoch im Sinne einer

Abb. 6.2: Cowans Aktivierungshypothese angewandt auf die PR-Wahrnehmung. Dabei wurde Abb. 6.1 um den kurzen sensorischen Speicher (KSS) ergänzt.

a) Bei gewöhnlichem Rauschen werden die entsprechenden Elemente im sensorischen Langzeitgedächtnis schwach erregt. Die Aktivierung reicht nicht aus, um die Schwelle zum Bewußtsein zu überschreiten. Das Rauschen klingt homogen.

b) Wenn die in a) schwach erregten Elemente hinreichend lange erregt bleiben, kann dasselbe Signal beim nächsten Mal eine stärkere, überschwellige Aktivierung auslösen. Dies widerspricht der Kapazitätsbeschränkung des Echogedächtnisses, da alle aktivierten Elemente beim zweiten Mal hörbar werden müßten.

c) Eine Modifikation von Annahme b) ist, daß nur für einige wenige Elemente der Erregungszustand erhalten werden kann, so daß nur diese hörbar werden. Die anderen Elemente werden gehemmt (graue Linien mit Querbalken).

d) Ein alternativer Vorschlag ist, daß eine in ihrer Kapazität begrenzte sensorische Vorbereitung stattfindet, so daß bei der nächsten Darbietung die Erregung der (wenigen) vorbereiteten Elemente stärker ausfällt.

93

KSS

a)nichtperiodisches Rauschen

KSS

b) Restaktivierung

KSS

c) kapazitiv begrenzteRestaktivierung

KSS

KSS

d) sensorischeVorbereitung

Vorbereitung top-down auf vorgeschaltete sensorische Stufen (nach Cowans Modell: im kurzen sensorischen Speicher) einwirken. Bei der nächsten Darbietung erfahren diese Elemente einen verstärkten Eingang (beachte die Pfeilfarbe des Eingangs im rechten unteren Teilbild) und lösen eine ausreichende Aktivierung aus.

Dieser Vorbereitungsmechanismus muß eine Kapazitätsgrenze aufweisen, um mit den Befunden von Kapitel 5 übereinzustimmen. Der Mechanismus, der zu dieser Kapazitätsbegrenzung führt, wird zunächst noch offengelassen. Der Zeitpunkt der top-down Aktivierung der sensorischen Areale muß in der Nähe des Wiederauftretens des Signals liegen, da die Information sich nicht lange genug im kurzen sensorischen Speicher halten kann. Bei unbekannter Periode erfordert dies eine Art dauernder Auffrischung, während bei bekannter Periode eventuell eine gezielte Aktivierung zum erwarteten Zeitpunkt des Auftretens erfolgt.

Beide Modelle (Restaktivierung und sensorische Vorbereitung) sind mit den introspektiven Beobachtungen aus Abschnitt 6.1 vereinbar. Der erste Zyklus führt nicht zu Perzepten, da er, wie in Teilbild a) gezeigt, zu schwache Aktivierungen auslöst. Der überwiegende Teil von langen Zyklen klingt homogen, da beide Mechanismen eine Kapazitätsbeschränkung vorsehen und daher nur wenige Elemente zu Perzepten führen. Der für normales periodisches Rauschen bei aufmerksamem Zuhören wahrnehmbare allgemeine „Fluktuationseindruck“ erklärt sich aus den schwachen, gerade noch nicht zu bewußten Perzepten führenden Aktivierungen. Der wesentliche Unterschied zwischen diesen beiden Ansätzen ist, daß es bei dem Vorbereitungsmodell zu einer Beeinflussung früher sensorischer Stufen kommt, die bei dem auf einer Restaktivierung beruhenden Modell nicht stattfindet. Die Unterscheidung zwischen diesen beiden grundverschiedenen Annahmen kann nicht auf der Basis von Verhaltensexperimenten getroffen werden. Es ist allerdings möglich, die Entscheidung mit Hilfe elektrophysiologischer Methoden zu treffen, da sich beim Restaktivierungsmodell bei unveränderter sensorischer Verarbeitung der Fluktuationen keine veränderten sensorischen Potentiale im Zusammenhang mit der erfolgreichen Detektion periodischen Rauschens finden lassen sollten, während beim Vorbereitungsmodell gerade die sensorischen Areale erregt werden müßten. Bevor aber das entscheidende Experiment durchgeführt werden kann (Abschnitt 6.4), muß zunächst ein für EEG-Un-

94

tersuchungen geeignetes Stimulusmaterial gefunden werden. Davon handelt der nächste Abschnitt.

6.3 Stimulusmaterial für EEG-UntersuchungenDieser Abschnitt beschreibt eine besonders für EEG-Untersuchungen geeignete Variante von periodischem Rauschen, das semiperiodische Rauschen (Abschnitt 6.3.1), sowie ein Verhaltensexperiment mit diesem Stimulus (Abschnitt 6.3.2), das Unterschiede zu normalem periodischen Rauschen aufzeigen soll.

6.3.1 Periodisches und semiperiodisches Rauschen

Bei der Erhebung ereigniskorrelierter Potentiale (EKPs) im Elektroenzephalogramm (EEG) ist es ganz wesentlich, daß man den Zeitpunkt des Ereignisses kennt, zu dem die Potentiale korreliert werden sollen. Im Falle von periodischem Rauschen bietet sich an, die Potentiale zu demjenigen Zeitpunkt zu korrelieren, der in der Rauschprobe als Träger der das Perzept auslösenden Fluktuation angesehen werden kann. Bei dem bisher verwendeten periodischen Rauschen stellt dies ein Problem dar, da wir nicht genau wissen, welches Teilstück des Rauschens das Perzept ausgelöst hat. Die in den Experimenten 2 und 3 vorgenommenen Untersuchungen zu den das Perzept auslösenden Teilen des Spektrogrammswären für diesen Zweck nicht genau genug. Sie müßten im übrigen für jede Rauschprobe und jede Versuchsperson getrennt erhoben werden, was einen ziemlichen Aufwand bedeuten würde. Die zeitliche Zuordnung leidet insbesondere unter dem Umstand, daß die einzelnen Versuchspersonen unterschiedliche Antizipationszeiten (bzw. bei langen Zyklen, wo Antizipation nicht mehr funktioniert: Reaktionszeiten) haben, so daß aus dem Tappzeitpunkt nicht zuverlässig auf den Perzeptzeitpunkt geschlossen werden kann. Außerdem ist das Tappen auch nicht so präzise, so daß auch deshalb eine nur ungenaue Bestimmung des Perzeptzeitpunktes erfolgen kann. Dies alles würde dazu führen, daß durch die ungenaue Bestimmung des Ereigniszeitpunktes die korrelierten Potentiale verschmiert würden, bis hin zur Unterdrückung von Komponenten.

Eine spezielle Variante des Stimulus ist besser für die Erhebung von EKPs geeignet, das sogenannte semiperiodische Rauschen (SPR). Hierbei ist nur ein kleiner Teil der Periode repetitiv, der Rest ist neues, kontinuierliches

95

Rauschen. Abb. 6.3 erläutert die Konstruktion dieses Stimulus. Semiperiodisches Rauschen bedarf erhöhter Aufmerksamkeit seitens der Versuchsperson, da ihr die partielle Regelmäßigkeit leicht entgehen kann und es sich dann wie normales weißes Rauschen anhört. Der Vorteil für die Erhebung ereigniskorrelierter Potentiale ist offensichtlich: Wenn die Versuchsperson überhaupt ein Perzept wahrnimmt, dann ist der zeitliche Träger mit Sicherheit auf das konstante Segment beschränkt. Da zudem wegen des insgesamt geringeren Informationsgehalts die Variabilität bei der Interpretation deutlich eingeschränkt ist, und da eine gewisse Mindestlänge des zeitlichen Trägers gegeben sein muß, um überhaupt ein Perzept auszulösen, ist der tatsächliche Ereigniszeitpunkt sogar besser definiert als im Rahmen der Länge des konstanten Segments.

Bevor dieser Stimulus aber in EEG-Untersuchungen angewendet wird, soll zunächst in Verhaltensexperimenten überprüft werden, welche Veränderungen sich für semiperiodisches Rauschen ergeben. Dabei soll folgende Hypothese überprüft werden:

HYPOTHESE:

Die PR-Wahrnehmung beruht auf der Verarbeitung und Speicherung von Details der Wellenform, die sich auf kleine Zeitbereiche eingrenzen lassen. Diese „Träger“ der Perzepte wirken auch in Isolierung (d.h. wenn das benachbarte Rauschen sich nicht gleichfalls wiederholt), und weisen eine unterschiedliche Signifikanz auf.

6.3.2 Experiment 7: Detektierbarkeit von SPR

I. Methodik

Zwei der fünf Versuchspersonen von Experiment 2 nahmen an diesem Experiment teil (CK=D1, ME=D3). Dieselben sechs Sekunden periodisches Rauschen wie in Experiment 2 wurden vorbereitet und im Speicher des Computers abgelegt. Als Digitalisierungsfrequenz wurde wieder 20 kHz verwendet. An einer zufälligen Stelle wurde ein 200 ms langes Segment

K A K B K C

Abb. 6.3: Erläuterung der Konstruktion von semiperiodischem Rauschen. Jeder Buchstabe stehe für ein Stück weißes Rauschen, dabei sei K ein Stück von 200 ms Länge, und A,B,C... andere Stücke der Länge 600 ms. Die Periode beträgt in diesem Fall 800 ms. Wenn man nicht aufmerksam zuhört, entgeht einem die partielle Regelmäßigkeit, und es hört sich wie normales weißes Rauschen an.

96

herausgeschnitten und als konstantes Segment in semiperiodischem Rauschen (siehe Abb. 6.3) verwendet. Die Periodenlänge war zufällig zwischen 600 und 1000 ms gewählt, der Rest der Periode wurde mit nicht repetitivem, gleich lautem weißem Rauschen aufgefüllt (das nicht aus der sechs Sekunden langen Gesamtrauschprobe stammte). Die Aufgabe der Versuchsperson war, den gehörten Rhythmus mit Tappen anzuzeigen. Die Versuchsperson hatte nach dem Start der Darbietung des semiperiodischen Rauschens zwölf Sekunden Zeit, mit dem Tappen anzufangen. Fing die Versuchsperson rechtzeitig mit Tappen an, so wurde die Darbietung falls nötig verlängert, um ihr das Mittappen in acht Zyklen zu ermöglichen. Hatte sie nach 12 Sekunden nicht mit Tappen angefangen, oder stimmte die getappte Periode nicht mit der wirklichen Periode überein (wobei dasselbe Kriterium wie in Experiment 2 angewandt wurde), so wurde dieser Einzelversuch als Mißerfolg gewertet. Ausgewertet wurde die Häufigkeit, mit der eine bestimmte Rauschprobe erfolgreich getappt werden konnte, in Abhängigkeit von ihrer Position in den sechs Sekunden der Gesamt-rauschprobe. Beide Versuchspersonen absolvierten 1000 Einzelversuche. Daraus folgt, daß jeder Zeitpunkt in der Gesamtrauschprobe in ungefähr 33 6 Einzelversuchen vorkam.

II. Ergebnisse

In Abb. 6.4 sind die Ergebnisse von Experiment 7 wiedergegeben. Die y-Achse repräsentiert die Häufigkeit korrekten Tappens, und die x-Achse die Position des Segmentes in der Gesamtrauschprobe. Im oberen Teilbild werden die beiden Kurven für Versuchsperson CK und ME verglichen, während in den beiden unteren Teilbildern für jede der beiden Versuchspersonen die Leistung in Experiment 7 mit der Verteilung der Tappzeitpunkte in Experiment 2 verglichen wird.

Die Erfolgsquote war im Mittel besser als 50%, aber es wurden große Unterschiede zwischen den verschiedenen Segmenten deutlich. Während einige Segmente fast sicher entdeckt wurden, waren andere schwierig zu entdecken. Somit kann die Hypothese als bestätigt angesehen werden. Die Signifikanz der Segmente ist in bemerkenswerter, wenn auch nicht perfekter Weise zwischen den beiden Versuchspersonen korreliert. So sind die Kurven im Bereich von 0.5 bis 2.1 fast deckungsgleich, während in anderen Bereichen ([2.3,2.6], [4.1,4.8]) die Kurve von ME diejenige von CK auf einem etwas niedrigeren Niveau parallel verfolgt. Das ist von dem

97

verschiedenen Ausmaß des Trainings her zu erwarten, denn CK ist der Autor und daher in noch weitaus höherem Maße trainiert als ME.

Abb. 6.4: Ergebnisse von Experiment 7. Im oberen Teilbild werden die Leistungen der beiden Versuchspersonen (in Prozent korrekten Mittappens) beim Mittappen zu semiperiodischem Rauschen als Funktion der Position des konstanten Segmentes in der Gesamtrauschprobe verglichen. Die unteren beiden Teilbilder vergleichen für jede der beiden Versuchspersonen diese Leistung mit der Verteilung der Tappzeitpunkte in Experiment 2.

Es gibt eine bemerkenswerte Ausnahme von diesem Trend: bei 5.0 ist die Leistung für Versuchsperson CK recht niedrig (15%), während ME in 45% der Fälle erfolgreich ist. Dies entspricht der fehlenden Linie bei 5.0 in

98

Experiment 2, die auch in Rauschprobe E in Experiment 3 von CK nicht gewählt wurde. Die spektrale Analyse hatte in Experiment 3 für <E,ME> eine Interaktion zwischen verschiedenen Kanälen ausgemacht, die für CK offensichtlich nicht signifikant war. Jetzt können wir in der Interpretation noch weiter gehen: sie war nicht nur nicht signifikant, sondern konnte von CK auch bei isolierter Präsentation nicht wahrgenommen werden.

In den unteren beiden Teilbildern von Abb. 6.4 werden die Leistungen der beiden Versuchspersonen in Experiment 7 mit den histogrammierten Tappzeitpunkten aus Experiment 2 verglichen. Hohe Histogrammbalken entsprechen stets guten Entdeckungsleistungen für das entsprechende Segment in semiperiodischem Rauschen, aber das Umgekehrte gilt nicht. Hohe Erfolgsquoten bei 3.45 haben nicht zu erhöhter Tapphäufigkeit in Experiment 2 geführt. Die Perzepte, die bei 3.1 und 3.6 ausgelöst werden, scheinen stärker zu sein und das ansonsten gut hörbare Perzept bei 3.45 zu unterdrücken.

Während diese grundsätzliche Untersuchung eine schöne Übereinstimmung der Tappzeitpunkte und der Entdeckungshäufigkeit gezeigt hat und damit eine gute nachträgliche Rechtfertigung für die Verwendung der Tappaufgabe geliefert hat, hat sie doch auch eine Notwendigkeit deutlich gemacht: Wegen der großen perzeptuellen Unterschiede verschiedener Rauschsegmente muß die Auswahl von Segmenten für ein EEG-Experiment gut überlegt sein und den jeweiligen Versuchspersonen angepaßt werden.

6.4 Elektrophysiologische Überprüfung der ModelleIm folgenden wird mit Hilfe elektrophysiologischer Untersuchungen die in Abschnitt 6.2 aufgeworfene Frage beantwortet, ob ein kognitiver Aktivierungserhalt oder eine sensorische Vorbereitung die Wahrnehmung von periodischem Rauschen besser beschreibt. Dabei ist zunächst eine Voruntersuchung nötig (Abschnitt 6.4.1), in der besonders geeignete Segmente speziell für die an der EEG-Untersuchung (Abschnitt 6.4.2) teilnehmenden Versuchspersonen selektiert werden.

99

6.4.1 Experiment 8: Signifikanz einzelner Segmente

Bei diesem Experiment sollte für die Versuchspersonen des EEG-Experi-mentes solche Segmente gefunden werden, bei denen im Durchschnitt eine hohe Erkennungsleistung stattfand. Das war wichtig, weil im Gegensatz zu Experiment 7 nur 100-ms lange konstante Segmente zum Einsatz kommen sollten, um eine möglichst gute Ereigniskorrelation im EEG-Experiment zu realisieren. Für derart kurze Segmente ist es recht schwer, die Periode zu entdecken. Daher wurde eine Art der Präsentation gewählt, bei der das Detektieren des wiederkehrenden Segmentes erleichtert wird. Diese Art von Einzelversuch wird im folgenden als „leichter“ Einzelversuch bezeichnet. Er korrespondiert zu der Art von Einzelversuchen, die schließlich im EEG-Experiment zum Einsatz kamen. Andererseits muß man aufpassen, daß man nicht überselektiert: Wenn man lange genug würfelt, kommt auch einmal zufällig ein Sinuston heraus. Die Segmente sollten nicht so signifikant sein, daß die Entdeckung trivial ist, denn dann wäre nicht die Beteiligung des Echogedächtnisses nötig gewesen, um sie zu hören. Daher wurde eine „schwere“ Vergleichsaufgabe eingeführt, die im Idealfall für das Segment nicht zu lösen ist. Es sollten solche Segmente gefunden werden, bei denen die leichten Einzelversuche zuverlässig gelöst wurden, die schweren hingegen nicht. Gleichzeitig diente dieses Experiment auch als Training für das EEG-Experiment.

I. Methodik

Als Versuchspersonen nahmen die 20 Studenten aus dem zweiten Studienjahr in Psychologie teil, die auch schon an Experiment 4 teilgenommen hatten. Als Reizmaterial kam semiperiodisches Rauschen zum Einsatz. Für die fixen Segmente wurden die sechs schon bekannten Sekunden weißes Rauschen (Experimente 2,3,7: 120000 Punkte Gaußsches Rauschen mit Index 1 des Zufallszahlengenerators aus dem Anhang AnhangA:.A.4, gewandelt mit 20 kHz.) in 60 verschiedene 100-ms Bruchstücke zerlegt, also [0,0.1],[0.1,0.2],... Unter diesen 60 Segmenten sollten nun die geeignetsten herausgefunden werden.

Dazu wurden mit jedem zufällig aus dem 60-er Pool ausgewählten Segment nacheinander zwei Einzelversuche durchgeführt, die im folgenden „schwer“ und „leicht“ genannt werden. Im „schweren“ Einzelversuch startete der Stimulus mit 1-2 Sekunden kontinuierlichem Rauschen, bevor das erste Mal

100

das fixe Segment vorkam. Dadurch wurde verhindert, daß die Versuchsperson im voraus wußte, an welcher Stelle des Rauschens das fixe Segment vorkommt. Dann folgte fünfmal das konstante Segment von 100 ms, mit jeweils 900 ms Füllrauschen dazwischen (also semiperiodisches Rauschen mit 10% fix und 90% variabel), und dann, wiederum nach 900ms Füllrauschen, evtl. (mit 50% Wahrscheinlichkeit) ein sechstes Mal das konstante Segment, sonst andere 100 ms Rauschen. Dann folgte wiederum weißes Rauschen bis zur Gesamtstimulusdauer von 8.1 Sekunden. Zeitgleich mit dem sechsten Vorkommen des Segmentes (oder seiner Auslassung) wurde auf dem Computermonitor ein Fragezeichen ausgegeben. Abb. 6.5 erläutert den Stimulusaufbau.

Die Versuchsperson sollte angeben, ob ihrer Meinung nach zeitgleich mit dem Fragezeichen ein Segment da war („Ja“), ob definitiv kein Segment da war („Nein“), oder ob sie das nicht entscheiden konnte („weiß nicht“). Wenn sie bis dahin das Segment gefunden hatte, dann fiel ihr diese Antwort leicht, d.h. sie konnte sowohl Anwesenheit als auch Abwesenheit des Segmentes eindeutig feststellen. Wenn sie das Segment dagegen noch nicht gefunden hatte, konnte sie nur raten bzw. mit „weiß nicht“ antworten.

Danach wurde mit demselben Segment ein „leichter“ Einzelversuch durchgeführt, bei dem der Versuchsperson das Finden des Segmentes deutlich erleichtert wurde. Dazu startete wiederum nach einer Einleitphase weißen Rauschens das semiperiodische Rauschen mit einer sehr kurzen Periodenlänge von 200 ms (100 ms fix, 100 ms variabel). Dieses 50%-semiperiodische Rauschen ist erheblich leichter zu finden als 10%-semiperiodisches Rauschen. Zusätzlich wurde bei jedem Vorkommen des

900 ms

1-2 s K V K V K V K V K V ? 1-2 s

Gesamtstimulusdauer 8.1 SekundenAbb. 6.5: Erläuterung des Stimulusaufbaus im „schweren“ Einzelversuch von Experiment 8. Die Stimulusgesamtdauer unterteil sich in eine Einleitung mit zufälligem weißem Rauschen von 1-2 Sekunden, einer Phase semiperiodischenRauschens (K: 100 ms fix, V: 900 ms variabel) mit 5 oder 6 Vorkommen des fixen Segmentes, und einer Ausleitphase von 1-2 Sekunden. Ein- und Ausleitung betragen zusammen 3 Sekunden. Zeitgleich mit der Stelle, an der evtl. das sechste Mal Segment K vorkommt, erscheint auf dem Computermonitor ein Fragezeichen.

101

Segmentes zeitgleich auf dem Computermonitor ein optisches Signal gegeben. Nach etwa 2 Sekunden in dem schnellen 200-ms Rhythmus wurde das variable Segment allmählich verlängert, so daß die Gesamtperiode im Laufe von 25 Sekunden anwuchs bis auf 1000 ms. Dabei wurde weiterhin zeitgleich mit dem fixen Segment das optische Signal gegeben, so daß das nun immer seltener vorkommende Segment K trotzdem gut zu verfolgen war. Dann wurde ein besonderes optisches Signal gegeben, und das semiperiodische Rauschen (100 ms fix, 900 ms variabel) lief nun noch 4 Perioden weiter ohne visuelles Begleitsignal. Dann folgte mit einer Wahrscheinlichkeit von 50% ein fünftes Mal das fixe Segment, und zeitgleich zu diesem Moment ein Fragezeichen auf dem Bildschirm. Abb.6.6 erläutert den Stimulusaufbau.

Abb. 6.6: Schematische Erläuterung des Stimulusaufbau im „leichten“ Einzelversuch von Experiment 8. Das semiperiodische Rauschen beginnt in einem raschen Rhythmus, der sich dann verlangsamt. Ein visuelles Signal zeigt den Rhythmus an (kleine graue Quadrate). Wenn ein 1-Hz Rhythmus erreicht ist, wird ein besonderes visuelles Signal (kleiner schwarzer Balken) gegeben, der signalisiert, daß ab jetzt keine visuelle Unterstützung mehr erfolgt. Gleichzeitig zu dem Zeitpunkt, an dem evtl. ein letztes fixes Segment vorkommt (langer grauer Balken), erscheint auf dem Bildschirm ein Fragezeichen.

Die Aufgabe der Versuchsperson war die gleiche wie vorher: Sie sollte angeben, ob beim Fragezeichen das konstante Segment da war oder nicht, konnte aber auch mit „weiß nicht“ reagieren. In einer Sitzung wurden 120 Einzelversuche absolviert, d.h. jedes der 60 Segmente in einem leichten und einem schweren Einzelversuch, wobei die Reihenfolge der Segmente zufällig war. Ein leichter Einzelversuch dauerte inklusive der durchschnittlichen Antwortzeit 10 Sekunden, ein schwerer 35 Sekunden, so daß eine komplette Sitzung ca. 45 Minuten dauerte. Es wurde feedback gegeben.

Jede Versuchsperson absolvierte 3 solcher Blöcke an verschiedenen Tagen. Um die Statistik für die in Frage kommenden Segmente zu verbessern, wurde nach einer Zwischenauswertung im dritten Block die Auswahl der

102

?visuell:

auditiv:

Segmente auf die 20 besten eingeschränkt, die dafür jeweils dreimal getestet wurden.

II. Ergebnisse

In Abb. 6.7 sind die Ergebnisse von Experiment 8 dargestellt. Der erste Block wurde als Training gewertet und nicht ausgewertet. Die Ergebnisse des zweiten Blocks sind im linken Teilbild dargestellt. Da es darum ging, solche Segmente herauszufinden, die im leichten Einzelversuch eine gute Erkennbarkeit aufwiesen, im schweren dagegen nicht, wurde eine Darstellung gewählt, bei der die Leistung im leichten Einzelversuch über der im schweren aufgetragen wird. Der Trefferüberschuß (richtige Antworten minus falsche oder „weiß nicht“ Anworten) wurde getrennt für schwere (Abszisse) und leichte (Ordinate) Einzelversuche ermittelt. Er kann maximal 19 betragen, da 19 Versuchspersonen an Block 2 teilgenommen hatten und jedes Segment einmal pro Versuchsperson getestet wurde. Die einzelnen Segmente sind mit Zahlen von 00 bis 59 gekennzeichnet, die dem Startpunkt des Segments in der 6-s Gesamtrauschprobe entsprechen (00 = 0.0 Sekunden, 59 = 5.9 Sekunden). Im obigen Sinne waren solche Segmente ideal, die möglichst weit weg von der Diagonale lagen, wo also der Unterschied zwischen der Leistung im schweren und im leichten Einzelversuch möglichst groß ist. 20 solche Segmente wurde für Block drei ausgewählt, wo sie jeweils dreimal getestet wurden. Hier nahmen alle 20 Versuchspersonen teil, somit war die maximal erreichbare Trefferdifferenz 60.

Aus dem rechten Teilbild von Abb. 6.7 geht hervor, daß Segmente 20 und 53 sehr gut geeignet sind, da sie offensichtlich keine markanten Auffälligkeiten haben, die zu einer sofortigen Entdeckung in der schweren Aufgabe geführt hätten, aber mit etwas Hilfestellung ins Echogedächtnisaufgenommen werden können und dann leicht wiederzuerkennen sind.

6.4.2 Experiment 9: Ereigniskorrelierte Potentiale zu SPR

Beim nun folgenden EEG-Experiment ging es darum, aufzuzeigen, was sich im EEG verändert, wenn ein ansonsten unauffälliges Segment im Echogedächtnis gespeichert und bei der Wiederholung wiedererkannt wird. Dafür ist es günstig, daß die ausgewählten Segmente gut, aber nicht perfekt wiedererkannt wurden, und daß dies auch für die verschiedenen

103

Versuchspersonen verschieden war. So kann zwischen Versuchspersonen unterschieden werden, welche die Aufgabe gut, mittel oder schlecht lösen können. Mit diesem Experiment soll zwischen den folgenden Hypothesen unterschieden werden:

104

kognitiver

Abb. 6.7: Ergebnisse von Experiment 8. Trefferüberschuß im leichten (Ordinate) bzw. im schweren (Abszisse) Einzelversuch für alle 60 Segmente des zweiten Blocks (linkes Teilbild) bzw. für die 20 im dritten Block verwendeten Segmente (rechtes Teilbild). Auf Grund der höheren Statistik im dritten Block sind hier höhere Trefferüberschüsse möglich. Da Segmente gesucht wurden, die im schweren Einzelversuch nicht gut abschneiden, im leichten dagegen sehr gut, sind Segmente 20 und 53 am besten geeignet.

105

Trefferüberschuß im schweren Einzelversuch

Aktivierungserhalt: Die Wahrnehmung der Perzepte in periodischem Rauschen beruht auf dem kognitiven Erhalt der Aktivierung einiger der vormals erregten Elemente. Dabei wird die sensorische Verarbeitung nicht verändert. Es sollten sich daher nur späte, kognitive Potentiale als Anzeichen der Aktivität des Echogedächtnisses finden lassen.

Sensorische Vorbereitung: Die Elemente, die im Echogedächtnis gespeichert sind, lösen eine sensorische Vorbereitung aus, so daß bei einer späteren Präsentation diese Elemente einen verstärkten Eingang erfahren und dadurch eine für die Bewußtwerdung ausreichende Aktivierung auslösen können. Demzufolge müssen sich frühe sensorische Potentiale als Ausdruck der Aktivität des Echogedächtnisses zeigen.

I. Methodik

A. Versuchspersonen

Die Versuchspersonen waren dieselben wie in Experiment 8. Sie waren über den Zweck der Untersuchung aufgeklärt und gaben ihr Einverständnis zu der Untersuchung. Sie wurden darüber aufgeklärt, daß der Versuch auch abgebrochen werden konnte. Eine Versuchsperson machte davon Gebrauch. Drei weitere Versuchspersonen nahmen an Pilotuntersuchungen teil, so daß die Auswertungen sich auf die verbleibenden 16 Versuchspersonen beziehen (9 weiblich, 7 männlich).

B. Stimuli und Verfahren

Der Stimulus war ähnlich zu dem in Experiment für den leichten Einzelversuch beschriebenen Stimulus (siehe Abb. 6.5), mit folgenden Unterschieden: Als festes Segment kam immer entweder Segment 20 (8 Versuchspersonen) oder Segment 53 (8 Versuchspersonen) zum Einsatz. Das visuelle Signal wurde nicht mehr über den Computer, sondern über LEDs gegeben, von denen eine auch als Fixierpunkt diente. Nach dem Sondersignal, das das Erreichen des Endrhythmus anzeigte, wurde das visuelle Signal nicht ausgesetzt, sondern blinkte noch 20 weitere Zyklen lang regelmäßig mit. Dabei wurde es meist, aber nicht immer von dem konstanten Segment begleitet, d.h. manchmal setzte der Rhythmus des semiperiodischen Rauschens aus in dem Sinne, daß das konstante Segment durch ein anderes gleichlautes Rauschen ersetzt worden war. Perzeptuell spricht man von einer Auslassung (im folgenden wird der englische Ausdruck omission verwendet, um Verwechslungen mit dem „Auslasser“

106

der Signaldetektionstheorie, s.u., zu vermeiden). Die Aufgabe der Versuchsperson war, die Anzahl der omissions zu zählen.

Bei jedem der 20 Zyklen in dieser Endphase wurde mit einer Rate von 1:4 zufällig bestimmt, ob er eine omission enthalten sollte. Nach jeder omission folgten mindestens zwei Präsentationen des konstanten Segmentes, so daß die effektive omission–Rate 1:6 betrug. In einem Block mit 20 Zyklen konnten entsprechend dieser Regel maximal 6 omissions vorkommen. Der Fall, daß keine omission vorkommt, wurde allerdings ausgeschlossen. Nach jedem solchen Block sollten die Versuchspersonen die Zahl der omissions nennen, und dann wurde ihnen die richtige Zahl genannt. Ein Block dauerte inkl. Antwortintervall ca. eine Minute.

Die Versuchspersonen absolvierten 40 Blöcke, in denen jeweils 20 relevante Ereignisse lagen, mithin 800 relevante Ereignisse. Davon waren ca. 130 omissions. Präsentationen direkt nach einer omission wurden nicht als Standard gezählt, da hier nicht die für die PR-Wahrnehmung typische Situation der Wiederholung gegeben war. Somit ergaben sich ca. 530 Standardstimuli pro Versuchsperson.

C. EEG-Messung

Die Versuchspersonen saßen in einem bequemen Stuhl in einem elektrisch abgeschirmten Raum. Von Umgebungsgeräuschen wurden sie durch den Stimulus selbst abgeschirmt, der 60 dB oberhalb der Schwelle lag.

Das EEG wurde mit Zinnelektroden an 19 Positionen des 10-20 Systems gemessen: FP1, FP2, F7, F3, FZ, F4, F8, T3, C3, CZ, C4, T3, T5, P3, PZ, P4, T6, O1, und O2. Das horizontale und vertikale EOG wurde mittels bipolaren Elektrodenpaaren vom äußeren Kanthus des linken Auges zum äußeren Kanthus des rechten Auges bzw. von oberhalb und unterhalb des rechten Auges erhoben. Die Referenzelektrode wurde an der Nase angebracht. EEG und EOG wurden mit 200 Hz im kontinuierlichen Modus digitalisiert (Bandpaß 0.1-40 Hz). Die Epochen (Länge 1000 ms, inkl. 100-ms baseline vor dem Stimulus) wurden off-line berechnet. Epochen, bei denen das EOG 50 µV überstieg, wurden von der weiteren Analyse ausgeschlossen. Dies kam in weniger als 15% der Epochen vor. Ereigniskorrelierte Potentiale (EKPs) wurden getrennt für Standardstimuli und omissions berechnet.

107

D. Verhaltensauswertung

In jedem Block mit nb omissions wurde die von der Versuchsperson angegebene Anzahl nv der von ihr gezählten omissions festgehalten. Es gab dementsprechend pro Versuchsperson 40 Wertepaare (nb,nv), entsprechend den 40 Blöcken. Um festzustellen, wie gut die Versuchsperson mit der Aufgabe zurecht gekommen war, wurde der Korrelationskoeffizient r über diese 40 Wertepaare ermittelt. Je größer r, desto besser konnte die Versuchsperson die Aufgabe lösen. Um auch das Entscheidungskriterium der Versuchsperson zu erfassen, wurde der Bruch q = nv/nw über die 40 Wertepaare gemittelt. Aus diesen beiden Größen (r und q) lassen sich die beiden Signaldetektionsparameter der Versuchsperson (Treffer-Rate pT und die Falsch-Alarm-Rate pFA) ableiten, indem festgestellt wird, welche Werte von pT und pFA zu den beobachteten Werten von r und q geführt hätten. Dies läßt sich im Prinzip analytisch berechnen, aber das ist vergleichsweise kompliziert wegen der Randbedingungen, insbesondere der Regel für die omissions. Es ist einfacher, pT und pFA mittels einer Monte-Carlo Simulationzu bestimmen. Die Werte von pT und pFA werden im folgenden der besseren Verständlichkeit halber als Treffer bzw. falsche Alarme bezüglich der omis-sions und nicht der Standardstimuli ausgedrückt.

Bei der Monte-Carlo Simulation durchlief eine virtuelle Versuchsperson 10000-mal das Experiment, das je aus 40 Blöcken mit je 20 Einzelversuchen bestand. Die Regel für die omissions war genau dieselbe wie im Experiment. Die Versuchsperson wurde durch pT und pFA charakterisiert. Gemittelt über die 10000 Experimente ergaben sich recht genaue Mittelwerte für die bei dieser Konstellation von pT und pFA folgenden Werte von r und q. Durch Verändern von pT und pFA

wurden r und q verändert, bis sich die experimentell gefundenen Werte ergaben. Die dazu benötigten Werte für pT und pFA wurden als Signalentdeckungsparameter der realen Versuchsperson angenommen.

II. Ergebnisse

A. Verhaltensauswertung

Der mittlere Korrelationkoeffizient war 0.24, und der mittlere Wert für q war 0.9, d.h. die Versuchspersonen zählten im Durchschnitt 10% weniger omissions als wirklich vorhanden waren. Dies entspricht einer Trefferrate (für omissions) von 54% und einer Falsch-Alarm-Rate von 14%, bzw. einer Leistung von 70% in einem Paarvergleich. Die Versuchspersonen, die mit der Aufgabe am besten zurechtkamen, erzielten Korrelationskoeffizienten

108

von bis zu 0.79, was einer Leistung im Paarvergleich von 90% entspricht, während diejenigen, die nicht gut mit der Aufgabe zurechtkamen, Korrelationskoeffizienten erzielten, die mit dem Zufallsniveau vereinbar sind.

Bei dem nun folgenden Extremgruppenvergleich werden die signifikant über dem Zufallsniveau operierenden Versuchspersonen zu einer guten Leistungsgruppe zusammengefaßt. Bei der pro Versuchsperson gegebenen Zahl von Wertepaaren (N=40) sind Korrelationskoeffizienten r>0.24 auf einem 5%-Niveau signifikant von Null verschieden. Dies traf für 7 Versuchspersonen zu. Diese Gruppe weist einen mittleren Korrelationskoeffizienten von 0.45 auf. Dies entspricht pT = 0.92 und pFA = 0.31 (Paarvergleich: 80%). Um einen deutlichen Abstand zwischen der guten und der schlechten Leistungsgruppe zu gewährleisten, wurden in die schlechte Leistungsgruppe nur diejenigen Versuchspersonen aufgenommen, die das Kriterium (r>0.24) um die Hälfte verfehlten, also mit r<0.12. Dies betraf 5 Versuchspersonen. Es ergab sich eine mittlere Leistungsgruppe (0.12<r<0.24) von 4 Versuchspersonen, die nicht weiter analysiert wurden. Dabei soll ausdrücklich betont werden, daß diese Einteilung nicht mit sonstigen Leistungen der Versuchspersonen korreliert, sondern die individuelle Hörbarkeit der verwendeten Segmente für diese eine Versuchsperson widerspiegelt.

B. Ereigniskorrelierte Potentiale

Abb. 6.8 zeigt die ereigniskorrelierten Potentiale (EKPs), die durch Standardstimuli (wenn das Segment also da war) bzw. omissions ausgelöst werden, im Vergleich für die gute und die schlechte Leistungsgruppe.

Die beiden Kurven für die schlechte Leistungsgruppe (gepunktet bzw. gestrichelt) fallen fast aufeinander, d.h., für das EKP macht es keinen Unterschied, ob das konstante Segment präsentiert wurde oder ein anderes. In beiden Kurven erkennt man ab 190 ms nach Stimulusbeginn eine vor allem okzipital ausgeprägte Negativität, die sich frontal umkehrt zu einer Positivität. Es handelt sich sowohl von der Skalpverteilung als auch vom Zeitpunkt her eindeutig um visuelle Potentiale, die durch die LEDs ausgelöst werden. Auditive sensorische Potentiale treten regelmäßig früher auf als visuelle Potentiale. Es ist bemerkenswert, daß die Kurven für die schlechte Leistungsgruppe vor 190 ms, also dort, wo man auditive

109

sensorische Potentiale erwarten würde, nicht signifikant von der Nullinie abweichen.

Die beiden Kurven für die gute Leistungsgruppe (durchgezogene Linien) zeigen für beide Arten von Stimuli (Standards und omissions) eine deutliche Negativität während der ersten 300 ms, die bei der schlechten Leistungsgruppe nicht zu finden ist. Diese Negativität wird im folgenden NLN genannt (für noise-locked negativity, siehe auch die hellgraue Schattierung in Abb. 6.8). Sie ist am größten über C3/CZ/C4. In Abb. 6.9 ist die Differenz zwischen den EKPs für die gute und die schlechte Leistungsgruppe für Standardstimuli dargestellt. Die NLN erstreckt sich ungefähr bis 300 ms und ist am größten bei 200 ms.

Für die folgenden ANOVA wurde die NLN gemessen als Mittelwert des Intervalls [180,200] ms (bezogen auf den Start des konstanten Segments). Die ANOVA berücksichtigte die Variablen Leistung (Gut versus Schlecht), Stimulusart (Standard versus omission), und Elektrode (C3/CZ/C4). Es ergab sich ein Haupteffekt der Leistung (F(1,10) = 12.61, p < .005), also eine stärkere NLN für die gute als für die schlechte Leistungsgruppe. Die NLN ist also ein Indikator für die Entdeckung der Periodizität.

110

Bei der guten Leistungsgruppe zeigt sich ein klarer Effekt in Abhängigkeit von dem Präsentieren des konstanten Segmentes. Im Falle einer omission findet man eine weitere Negativität bei ca. 395 ms (dunkelgraue Schattierung in Abb. 6.8) und eine Positivität, die bei 590 ms am größten ist (mittelgraue Schattierung). Dieser Komplex aus Negativität und Positivität, im folgenden N-P-Komplex genannt, wurde für die ANOVA ermittelt als Differenz zwischen den mittleren Amplituden der Positivität ([570,610] ms)

Abb. 6.8: EKPs zu Standardstimuli (zum wiederkehrenden Segment) und omis-sions (an dessen Stelle ein Zufallssegment). Mittel über die gute (r > 0.2) und schlechte (r < 0.1) Leistungsgruppe. Die Potentiale sind im Intervall von -100 bis 900 ms relativ zum onset des konstanten Segmentes dargestellt.

111

und der Negativität ([375,415] ms). Die ANOVA ergab Haupteffekte der Leistung (F(1,10) = 5.43, p < .042) und der Stimulusart (F(1,10) = 9.38, p < .012), und eine Interaktion Leistung × Stimulus (F(1,10) = 7.01, p < .024).

Diese Effekte rühren daher, daß der N-P-Komplex von omissions in der guten Leistungsgruppe hervorgerufen wird. Der N-P-Komplex repräsentiert die wohlbekannten Komponenten P3 und N2b, die typischerweise von devianten Stimuli bei repetitiver Stimulation und aufmerksamem Zuhören ausgelöst werden (Ritter und Ruchkin, 1992). Daß der N-P-Komplex nur bei der guten Leistungsgruppe vorkommt, ist eine gute nachträgliche Rechtfertigung der verhaltensbasierten Einteilung der Versuchspersonen in Leistungsgruppen.

Abb. 6.9: Differenz der EKPs von der guten und der schlechten Leistungsgruppe zum Standardstimulus. Abszisse wie in Abb. 6.8.

112

6.5 NLN: Aktivierung sensorischer VerarbeitungsstufenNimmt man die NLN als Anzeichen der Aktivität des Echogedächtnisses, dann kann man ausschließen, daß sie einen späten, modalitätsunspezifischenProzeß wiedergibt, denn dafür tritt sie zu früh auf. Das konstante Segment erstreckt sich über 100 ms, und die NLN hat ihren Gipfel schon bei 200 ms nach Anfang des Segmentes. Da für die Entdeckung der Wiederholung ein gewisser Anteil der Wellenform präsentiert worden sein muß (sagen wir: 50 ms), tritt die NLN schon 150 ms nach der Übermittlung des notwendigen Signalanteils auf. Das ist zu früh für ein spätes, kognitives Potential. Auch ein Zusammenhang mit dem visuellen Stimulus im Sinne einer visuell getriggerten kognitiven oder sensorischen Aktivität kann wegen des frühen Zeitpunktes ausgeschlossen werden. Das wird aus dem Vergleich mit dem visuell evozierten Potential deutlich: Die ersten deutlich sichtbaren visuellen Potentiale beginnen nach 200 ms, während die NLN nach 300 ms bereits beendet ist. Da der Zusammenhang mit dem visuellen Signal erlernt werden mußte und daher kognitiv repräsentiert ist, würden 100 ms noch nicht einmal ausreichen, um z.B. auch nur das Ende der NLN zu triggern.

Die NLN ist von ihrem Zeitpunkt her eindeutig ein sensorisches Potential. Sie könnte eine top-down beeinflußte Aktivierung von sensorischen Arealen zur Verstärkung der auditiven Signalverarbeitung repräsentieren. Dies wäre eine sensorische Analogie zu der bekannten contingent negative variation (CNV, Hillyard, 1973), auch als Erwartungspotential bekannt. Solche Erwartungspotentiale beginnen meist nach Ende des vorhergehenden Reizes und bauen sich allmählich auf bis zum Eintreten des erwarteten Reizes. Es ist möglich, daß der Beginn der NLN wie bei einer klassischen CNV am Ende des vorhergehenden Segmentes liegt. Der Nulldurchgang bei 0 ms wird durch die baseline Korrektur im Intervall [-100,0] ms erzwungen. Es kann allerdings auch sein, daß die Versuchsperson die sensorischen Areale nur um den zu erwartenden Zeitpunkt des nächsten Auftretens des Segmentes aktiviert. Sie kennt den Zeitpunkt auf Grund des konstanten, visuell unterstützten Rhythmus und könnte dieses Wissen strategisch nützen. In diesem Fall müssen bei einem nicht genau bekannten Rhythmus die sensorischen Areale eher und dauerhafter aktiviert werden als bei bekanntem Rhythmus.

Was könnte in Nachfolgeexperimenten verändert werden, um die Aussagekraft der Ergebnisse zu erhöhen und die hier gegebene

113

Interpretation zu überprüfen? Zunächst sollte die blockweise Struktur der Versuche aufgegeben werden. Das reduziert zwar die Zahl der Einzelversuche, die pro Zeiteinheit durchgeführt werden können, ermöglicht aber eine Sortierung der Einzelversuche nach Verhaltensdaten (korrekt/inkorrekt). Um die NLN mit bekannten Verlaufsformen der CNV besser in Beziehung setzen zu können, sollte kein vorhersagbarer visuell unterstützter Rhythmus vorgegeben sein, den die Versuchsperson strategisch nutzen könnte. Dann sollte sich wie bei der klassischen CNV eine stetige Negativierung auf hohem Niveau ergeben. Für die CNV ist bekannt, daß diese beim Auftreten des erwarteten Signals abbricht. Interessant wäre daher der Vergleich, wie die NLN bei Standardstimuli und omissions endet. Dazu müssen allerdings omissions und Standardstimuli gleich häufig sein, so daß keine veränderungsgenerierten Potentiale (N2b, P3) den Vergleich erschweren. Bei den in Abb. 6.8 vorgestellten Ergebnissen findet sich in den Kurven für die omissions der angesprochene N-P-Komplex, so daß bei einer Differenzbildung zwischen guter und schlechter Leistungsgruppe wie in Abb. 6.9 das Ende der NLN durch den Beginn der N2b überlagert wird und daher nicht bestimmt werden kann. Das war der Grund dafür, daß in Abb.6.9 nur die Differenz für die Standardstimuli dargestellt worden ist.

Eine weitere Verbesserungsmöglichkeit besteht darin, daß statt einer Sortierung der Versuchspersonen in eine schlechte und eine gute Leistungsgruppe für jede einzelne Versuchsperson ein leichtes und ein schwieriges Segment getestet wird, so daß die NLN als Unterschied zwischen verschiedenen Stimulusbedingungen ermittelt wird. Dadurch vermeidet man die Kritik, daß die Versuchspersonen in den verschiedenen Leistungsgruppen eventuell jeweils verschiedene Strategien eingesetzt haben könnten.

6.6 Ein Modell des EchogedächtnissesEin Modell, das ursächlich auf einer kognitiven Restaktivierung beruht (Abb. 6.2c), sollte die sensorische Verarbeitung des Stimulus nicht beeinflussen. In diesem Fall dürfte es nicht zu einer frühen Erregung bei der guten Leistungsgruppe kommen, da die sensorische Verarbeitung bei der guten und der schlechten Leistungsgruppe identisch ist. Der Unterschied würde erst beim Inhalt des langen sensorischen Speichers ansetzen: bei der guten Leistungsgruppe wird die Aktivität der richtigen Elemente aufrecht

114

erhalten, und diese sind daher bei der Wiederholung noch aktiv. Bei der schlechten Leistungsgruppe werden die guten Elemente durch Interferenz gehemmt und falsche Elemente aktiv gehalten, und daher rufen die sich wiederholenden Fluktuationen des konstanten Segments keine hinreichende Aktivierung hervor. Die sensorische Verarbeitung wäre dagegen in beiden Fällen identisch, und es sollten keine Unterschiede bei den sensorischen Potentialen auftreten. Auf der Basis der in Experiment 9 erhobenen Daten kann diese Vorstellung verworfen werden. Die Möglichkeit der Ausnutzung kognitiver Restaktivierung im Dienste der sensorischen Vorbereitung ist hingegen denkbar (s.u.).

Wenn man dagegen davon ausgeht, daß das Echogedächtnis bei der PR-Wahrnehmung sensorische Areale aktiviert, erhebt sich die Frage, warum dies nur für eine begrenzte Anzahl von Gedächtniselementen möglich ist. In Abb. 6.2 war ausgeklammert worden, wie die Kapazitätsgrenze zustande kommt. Man könnte sich vorstellen, daß sie auf irgendeine Weise vom kurzen sensorischen Speicher bzw. vom Informationstransfer zu diesem vorgegeben wird. Zwar würden alle vormals aktivierten Elemente über die Voraussetzungen verfügen, die entsprechenden Strukturen im kurzen sensorischen Speicher zu aktivieren, aber bedingt durch einen Engpaß („Flaschenhals“) beim top-down Transfer der Informationen würden nur einige davon tatsächlich eine sensorische Vorbereitung auslösen (siehe Abb.6.10a). Diese Vorstellung wirkt angesichts der Übereinstimmung zwischen der in Kapitel 5 etablierten Kapazität des Echogedächtnisses und der Zeitkonstante des kurzen sensorischen Speichers suggestiv. Sie wirft aber andererseits Fragen auf, wodurch dieser Engpaß ausgelöst wird, und warum er mit der Zeitkonstante des kurzen sensorischen Speichers übereinstimmt. Im Grunde besitzt sie wenig Erklärungswert.

Im folgenden wird statt dessen der Standpunkt angenommen, daß auch bei einer sensorischen Vorbereitung die Kapazitätsgrenze durch den langen sensorischen Speicher vorgegeben wird (Abb. 6.10b). Da die top-down gesteuerte Aktivierung sensorischer Areale zum Zeitpunkt des Wiederauftretens des relevanten Signalanteils erfolgen muß, würde sich eine Beschränkung der im langen sensorischen Speicher haltbaren Information automatisch auch auf die durch diesen vermittelte Vorbereitung der sensorischen Areale auswirken. Zunächst wird argumentiert, daß wie in Abb. 6.2c nur eine begrenzte Zahl von Elementen im langen sensorischen Speicher aktiv gehalten werden kann. Dabei geht es diesmal allerdings nur

115

um die Voraussetzung zu einer effektiven sensorischen Vorbereitung, nicht wie in Abb. 6.2c um den Mechanismus der Hörbarwerdung der Perzepte selbst. Das Argument basiert auf der bereits von Fechner (1860) formulierten Vermutung, daß schwach aktivierte und daher unbewußt gebliebene Repräsentationen denselben Gesetzmäßigkeiten genügen wie stärker aktivierte, bewußt wahrnehmbare Repräsentationen. Diese Vermutung ist kompatibel mit dem in dieser Arbeit etablierten Befund, daß es für die noch nicht bewußt wahrgenommenen Fluktuationen bei der PR-Wahrnehmung eine Kapazitätsgrenze gibt gerade wie bei bewußt wahrgenommenen Perzepten.

Als weiterer Ausgangspunkt dient die Cowansche Vorstellung, daß es keinen prinzipiellen Unterschied zwischen den Mechanismen des langen sensorischen Speichers und denen des Kurzzeitgedächtnisses (KZG) gibt. Dies wird gestützt durch die in dieser Studie herausgearbeiteten Ähnlichkeiten zwischen der PR-Wahrnehmung und bekannten KZG-Phänomenen: Die in Kapitel 4 berichtete Lebensdauer der Information im

Abb. 6.10: Alternative Vorstellungen zur Erklärung der Kapazitätsgrenze bei der sensorischen Vorbereitung. a) Man kann annehmen, daß grundsätzlich jedes aktivierte Element auf die vorgeschalteten sensorischen Areale einwirken kann, aber der Vorbereitungsmechanismus läßt nur eine begrenzte Zahl von Elementen wirksam werden (Flaschenhalsprinzip). Dies könnte an der Kapazität des kurzen sensorischen Speichers (KSS) liegen, oder an dem Transfermechanismus, mit dem die frühen sensorischen Stufen von der Art der zu erwartenden Elemente informiert werden. b) Die Kapazitätsgrenze könnte durch die Beschränkung der Zahl gleichzeitig kognitiv aktiver Elemente im langen sensorischen Speicher analog zu Abb. 6.2c gegeben sein. Eine solche Begrenzung ist wahrscheinlich wie im KZG vorhanden und daher als Ursache für die Kapazitätsgrenze des Echogedächtnissessehr plausibel. Als Ursache für die geringe Kapazität wird Interferenz zwischen gleichartigen Elementen angenommen. Im Unterschied zu Abb. 6.2c ist hier die Restaktivierung lediglich Mittel zum Zweck. c) Beim längeren Verfolgen eines periodischen Rauschens, dessen Periodizität inzwischen entdeckt worden ist, kann als Mechanismus der Aktiverhaltung ein rehearsal der hörbar gewordenen Perzepte in Frage kommen.

116

b) kapazitiv begrenzte Restaktivierung + Vorbereitung

a)Vorbereitung +

Flaschenhalsprinzip

KSS

c)rehearsal +

Vorbereitung KSS

KSS

Echogedächtnis entspricht den im KZG gemessenen Zeiten bei unterbleibendem oder verhindertem rehearsal (z.B. Murdock, 1961), und auch die geringe Kapazität (Kapitel 5) des Echogedächtnisses entspricht der geringen Kapazität des KZG.

Bei der Hörbarwerdung von Perzepten in periodischem Rauschen spielen sich also wohl Vorgänge ab, die am ehesten Speichervorgängen im KZG bei unterbleibendem (oder verhindertem) rehearsal ähneln. Zudem ist rehearsal von nicht bewußt wahrgenommenen Perzepten kaum vorstellbar. Daher soll zunächst die Kapazität des KZG ohne rehearsal diskutiert werden. Dabei sei betont, daß in der Literatur die Kapazität des KZG oft mit dem rehearsal in Verbindung gebracht wird. Demnach konkurrieren Spurzerfall und zyklisches Auffrischen der Information. Anderson (1996) vergleicht die Situation mit der eines Artisten, der rotierende Teller auf Stäben balancieren soll und wieder beim ersten Stab sein muß, bevor dort der Teller herunterfällt. Man könnte annehmen, daß im KZG eine große Menge gleichartiger Information gleichzeitig aktiv sein kann (Lebensdauer ca. 10 Sekunden), daß aber nur ein kleiner Teil davon via rehearsal dauerhaft (> 10 Sekunden) erhalten werden kann. Dem widerspricht eine Reihe von Befunden zur Interferenz auch ohne rehearsal. So fanden Shepard und Teghtsoonian (1961) bei einer Liste von 200 dreistelligen Zahlen, daß bekannte Zahlen vor allem dann richtig erkannt wurden, wenn der Abstand bis zur erneuten Präsentation sehr klein ist (1-4 Zahlen). Dies ist deutlich weniger, als aus der Lebensdauer folgen würde. Ein weiteres Gegenargument ist, daß die Zahl der in der artikulatorischen Schleife haltbaren Elemente eine Gesamtsprechdauer von unter 2 Sekunden aufweist (Baddeley, 1986), deutlich weniger als die Lebensdauer nicht aufgefrischter Information. Die Kapazitätsgrenze des KZG ist im Vergleich zur Lebensdauer zu klein, um sich aus der Konkurrenz von Zerfall und re-hearsal zu erklären. Wahrscheinlich kann von vornherein nur eine begrenzte Zahl von gleichartigen Elementen ohne Interferenz koexistieren. Diese stehen dann der rehearsal Schleife zur Verfügung. (Es ist zu beachten, daß es sich hierbei um gleichartige Information handelt. Verschiedenartige Informationen können im Cowanschen Modell in hoher Zahl gleichzeitig im KZG aktiv sein, wobei sie nicht automatisch auch im Fokus der Aufmerksamkeit stehen, s. Abb. 1.3.)

Da beim Vorbereitungsmodell des Echogedächtnisses der lange sensorische Speicher die relevanten sensorischen Aktivierungen bis zum

117

Wiederauftreten halten muß, und da anzunehmen ist, daß es dabei wie im KZG zu Interferenz zwischen gleichartigen Elementen kommt, ergibt sich für das Echogedächtnis automatisch eine Kapazitätsbegrenzung. Bei dieser Interpretation wäre die Tatsache, daß die Kapazität für weißes Rauschen in der Größenordnung der Zeitkonstante des kurzen sensorischen Speichers liegt, eine zufällige Koinzidenz. – Wenn die Periodizität eines periodischen Rauschens erst einmal entdeckt worden ist, indem die wiederkehrenden Fluktuationen hörbare Perzepte ausgelöst haben, kann auch rehearsal ins Spiel kommen. Dies ist in Abb. 6.10c dargestellt. Wie oben gezeigt wurde, ist nicht davon auszugehen, daß dieser Vorgang eine zusätzliche Kapazitätsbeschränkung darstellt, so daß die in Kapitel 5 gefundene Kapazität weiterhin durch die Menge der unbewußt aktiv haltbaren Elemente bestimmt wird.

Eine spannende Frage ist, wie man Kapazitätsbeschränkungen durch Interferenz bei einem nicht bewußt erlebten Gedächtnisvorgang interpretieren muß. Wäre der Vorgang bewußt, würde man ohne zu zögern vom begrenzten Fokus der Aufmerksamkeit sprechen. Die Existenz einer Kapazitätsgrenze für diese vorbewußten Fluktuationen legt das Konzept eines präattentiven Fokus nahe. Offensichtlich sind ähnliche Mechanismen am Werk wie beim Aufmerksamkeitsfokus für bewußte Repräsentationen. In der Konsequenz könnte dies dazu führen, daß die oft vertretene Gleichsetzung von Aufmerksamkeit und Bewußtsein aufgegeben werden müßte. Dann würde auch verständlich, wie es dem Echogedächtnis gelingen kann, „Aufmerksamkeit“ auf ein nicht bewußt erfahrenes Perzept zu richten und es gegen Interferenz zu schützen.

Was ist es, das die Kapazität für gleichzeitig aktivierte gleichartige Information wie z.B. die sensorischen Repräsentationen von Fluktuationen in weißem Rauschen so beschneidet? Ein Mangel an Ressourcen scheint bei der großen Menge vorhandener Ressourcen unwahrscheinlich. Eine Eigenschaft eines Algorithmus? Häufig werden Aufmerksamkeitsphänomene mit Synchronisation neuronaler Erregung in Verbindung gebracht. Horn und Opher (1996) haben für Systeme chaotisch gekoppelter Oszillatoren die Frage untersucht, wieviel unterschiedliche Synchronisations-Kodes gleichzeitig koexistieren können, und fanden im Höchstfall vier verschieden synchronisierte Populationen. Dies entspricht der Vollberichtsleistung im Sperling-Versuch. Dies könnte auch die Kapazität des Echogedächtnisses widerspiegeln, wenn sich 130-200 ms

118

weißes Rauschen auf irgend eine Art und Weise in eine Itemzahl umrechnen lassen.

Somit sind wir bei einem Modell des Echogedächtnisses angelangt, bei dem aktivierte Elemente im langen sensorischen Speicher in begrenzter Zahl für ca. 10 Sekunden aktiv gehalten werden können und zum richtigen Zeitpunkt den kurzen auditiven Speicher so voreinstellen können, daß der repetitive Signaleingang nun stärkere, hörbar werdende Aktivierungen auslöst. Solange noch keine Perzepte bewußt wurden, geschieht dies ohne rehearsal, aber intentional steuerbar, indem auf Grund einer willentlichen Anstrengung Interferenz mit nachfolgenden Elementen verhindert wird. Im Unterschied zum Modell von Abb. 6.2c stellt die Restaktivierung noch nicht selbst den Mechanismus dar, der für die schwellenüberschreitende Aktivität beim zweiten Auftreten des Signals sorgt, sondern ist lediglich eine notwendige Voraussetzung für die sensorische Vorbereitung. Dieses Modell unterscheidet sich in einigen Punkten von gängigen Vorstellungen des Gedächtnisses:

Im Kurzzeitgedächtnis (= aktiviertes Langzeitgedächtnis) sind sehr viele Zustände auf verschiedenen Verarbeitungsebenen gleichzeitig aktiv, aber nur wenige davon sind bewußt. Dies entspricht der von Cowan vertretenen Auffassung, zwischen Aktivierung und Bewußtsein zu unterscheiden.

Dabei sind pro Verarbeitungsebene nur wenige Zustände gleichzeitig aktiv. Weitere Zustände der gleichen Verarbeitungsebene werden durch die aktiven Zustände im Sinne einer Interferenz gehemmt. Dies ergibt sich aus der Notwendigkeit, die obige Vorstellung mit den bekannten Befunden zur Kapazität im Kurzzeitgedächtnis zu verbinden.

Die Interferenz betrifft auch Aktivierungen, die in ihrer Stärke nicht ausreichen, um die Schwelle zum Bewußtsein zu überschreiten. Diese Annahme liegt auf der Linie der Fechnerschen Vermutung einer Äquivalenz zwischen bewußten und unbewußten Zuständen. Sie dient hier dazu, die bei der PR-Wahrnehmung beobachteten Kapazitätsphänomene zu erklären.

Es ist im Sinne einer Art vorbewußter Aufmerksamkeit möglich, die unbewußt bleibenden Aktivierungen gegen Interferenz zu schützen. Auch

119

dies ist hier analog zu bewußten Zuständen angenommen und folgt aus der Möglichkeit der intentional gesteuerten Wahrnehmung langer Zyklen.

Unbewußt gebliebene Aktivierungen können auf vorgeschaltete Zustände vorbereitend einwirken und dadurch die Wahrnehmbarkeit beim Wiederauftreten erleichtern. Dies ist der hier angenommene kausale Mechanismus der Hörbarwerdung der Perzepte in periodischem Rauschen.

Die Annahme einer Äquivalenz von bewußten und unbewußten Zuständen wird hier gestützt durch die beobachtete Ähnlichkeit von Lebensdauer und Kapazität bei der PR-Wahrnehmung bzw. im Kurzzeitgedächtnis. Auch beim letzten Punkt (sensorische Vorbereitung) ergeben sich Parallelen zu EEG-Befunden bei bewußt wahrgenommenen Perzepten. So ist es bemerkenswert, daß bei der guten Leistungsgruppe die sensorischen Areale unabhängig vom Stimulustyp aktiviert wurden. Diese Beobachtung deckt sich mit einer Studie (Raij, 1997), die eine Aktivierung des auditiven Kortex auch bei omissions (im Falle gut wahrnehmbarer Standardstimuli) nachweist. Aus theoretischen Überlegungen heraus hat MacKay (1960) gefordert, es müsse in vielen Situationen ökonomischer sein, kognitive Repräsentationen zu den zugrundeliegenden sensorischen Repräsentationen zurückzutransformieren und Vergleichsoperationen auf der sensorischen Ebene vorzunehmen. Diese Vermutung wird gedeckt durch experimentelle Befunde zur Unterdrückung des –Rhythmus in sensorischen Arealen bei Suchprozessen im KZG für Töne (Kaufman et al., 1992) bzw. für visuell präsentierte Listen (Williamson et al., 1996), sowie bei Aufgaben zur mentalen Rotation (Michel et al., 1994).

Die in dieser Arbeit vorgestellten Befunde und Modellvorstellungen konnten so nur zustande kommen, weil die Verwendung eines unstrukturierten Stimulusmaterials eine kategoriale Verarbeitung weitgehend ausschloß. Dadurch war sichergestellt, daß das sensorische Extrem der auditiven Informationsverarbeitungskette angesprochen wurde. Es ist auffällig, daß bei all dieser Bemühung um Abgrenzung gegen spätere Verarbeitungsstufen sich dennoch vergleichbare Charakteristika zu kategorialen Speichervorgängen ergeben haben. Dies legt eine Sichtweise nahe, derzufolge Vorgänge in ganz verschiedenen Ebenen der Verarbeitung ähnlichen Gesetzmäßigkeiten genügen und demzufolge wohl auch auf ähnlichen Wirkmechanismen beruhen.

120

Sensorische Areale sind bei vielen kognitiven Leistungen eingebunden. Wenn dies wie im vorliegenden Fall zu einer Wahrnehmungserleichterungführt, ist es in anderen Paradigmen üblich, von priming zu sprechen. Dies ist ein ganz eigenes Forschungsfeld, und der nächste Abschnitt stellt abschließend einige Bezüge der hier vorgestellten Untersuchungen zu diesem Gebiet her.

6.7 Echogedächtnis, priming und RepräsentationLaut Anderson (1996) bezeichnet priming „die Verbesserung der Verarbeitung eines Stimulus als Funktion einer vorherigen Darbietung“. Von dieser Definition her würde das im vorhergehenden Abschnitt vorgestellte Modell des Echogedächtnisses als priming bezeichnet werden können. Das priming wird meist als Verbesserung einer Reaktionszeit gemessen, aber eine Erhöhung der Detektionswahrscheinlichkeit ist ebenfalls ein übliches Kriterium. Von perceptual learning grenzt es sich durch die Geschwindigkeit ab: Meist ist eine einzige Präsentation ausreichend, während beim perceptual learning durch viele Wiederholungen eine Verbesserung erreicht wird (z.B. beim Tragen einer Prismenbrille). Daher bietet sich bei der PR-Wahrnehmung der Begriff des primings eher an. Im folgenden sollen Gemeinsamkeiten und Unterschiede zu üblichen priming Paradigmen besprochen werden.

Sehr unterschiedliche Phänomene werden mit dem Begriff des priming belegt. Der größte Unterschied betrifft die Wahrnehmbarkeit des primes. Bei einigen Versuchen wird der prime neben dem Zielreiz als nicht zu beachtender, aber gut wahrzunehmender Reiz dargeboten, bei anderen Versuchen wird die Wahrnehmbarkeit des prime erschwert oder verhindert (z.B. masked priming, Forster und Davis, 1994). Wenn der Reiz wahrnehmbar ist, findet man wochenlange Nachwirkungen für eine große Anzahl gleichzeitig aktiver primes (DeSchepper und Treisman, 1996). Das Phänomen der PR-Wahrnehmung ähnelt eher Experimenten mit nicht wahrnehmbaren primes. Daher soll diskutiert werden, inwieweit sich Charakteristika der PR-Wahrnehmung (Lebensdauer und Kapazität) bei dieser Art von priming wiederfinden.

In priming Experimenten mit nicht bewußt verarbeiteten Reizen spielt eine Dynamik in einem Zeitbereich ähnlich dem der PR-Wahrnehmung eine Rolle: Die Wirkung des primes dauert Sekunden. Oft wird die Dynamik

121

nicht vollständig vermessen, da in den Paradigmen keine langen Intervalle zwischen prime und Zielreiz vorgesehen sind. In den untersuchten Zeitabschnitten werden teilweise Umschlageffekte zwischen positivem und negativem priming beobachtet. Roth und Roscher (1990) finden eine Wahrnehmungserleichterung bei periodisch gebotenen unterschwelligen Reizen bis zu der längsten von ihnen verwendeten Periode von 8 Sekunden.

Während die Dynamik des primings durch unbewußte Reize gelegentlich thematisiert wird, ist die Kapazität des primings nur bei bewußt wahrgenommenen Reizen untersucht worden (und für sehr groß befunden worden: DeSchepper und Treisman, 1996). Bei den hier relevanteren masked priming Experimenten wird meist ein einziger prime verwendet, so daß nicht erfaßt wird, ob mehrere primes sich gegenseitig stören, oder wie viele gleichzeitig in voller Stärke wirksam werden. Ein Problem dabei ist, daß solche Untersuchungen nur möglich sind, wenn Menge und Dimensionalität der verwendeten primes hinreichend groß sind. So können kaum mehrere Richtungen unabhängig geprimt werden, ohne daß sie schon von der Natur der Sache her interferieren. In Frage käme semantisches priming, da hier ausreichend viele unabhängige Assoziationen gleichzeitig geprimt werden könnten.

Umgekehrt läßt sich fragen, inwieweit sich im Zusammenhang mit dem priming formulierte Vorstellungen auf die PR-Wahrnehmung übertragen lassen. Priming wird oft als Aktivierung eines bereits existenten Konzepts (z.B. einer Farbe oder einer Richtung) angesehen. Kann man im Falle der PR-Wahrnehmung davon sprechen, daß durch das stets neu gewürfelte Rauschen ein präexistentes Konzept aktiviert wird? Einen Hinweis gibt hier die partielle Korrelation verschiedener Versuchspersonen, wie sie in Experiment 1 beobachtet wurde. Die tatsächliche Korrelation der Perzepte ist dabei noch höher, als man aus Experiment 1 folgern würde: Es wäre keine perfekte Korrelation zu erwarten, selbst wenn alle Versuchspersonen auf der Basis von exakt denselben präexistenten Kategorien operieren würden, da die rhythmische Strukturierung der gehörten Perzepte unterschiedlich sein könnte. Das weiß man aus Experimenten mit zyklischen Abfolgen von gut wahrnehmbaren Einzeltönen (z.B. Preusser, 1972). Wenn man bereit ist, nach festen Regeln vorverdrahtete Merkmalsdetektoren wie in Abschnitt 3.8 besprochen als präexistente Konzepte zu akzeptieren, dann genügt die PR-Wahrnehmung diesem

122

Kriterium. Vom Wortsinn („Vorbereiten“) her jedenfalls trifft priming exakt die Vorgänge, die sich bei der PR-Wahrnehmung abspielen.

Bei klassischen Gedächtnisexperimenten wird meist nicht eine Wahrnehmungserleichterung o.ä. gemessen, sondern per recall oder Erkennung explizit geprüft, ob die Repräsentation noch aktiv ist. Wenn man die Prüfung auf eine noch aktive Repräsentation des Reizes hingegen mittelbar vornimmt, z.B. über eine Reaktionszeitverkürzung oder Wahrnehmungserleichterung, werden auch Phänomene des implizitenGedächtnisses zugänglich. Dies ist sowohl für priming Experimente als auch bei der PR-Wahrnehmung der Fall. Man könnte bei der PR-Wahrneh-mung von einem impliziten sensorischen Gedächtnis sprechen, im Gegensatz zum expliziten sensorischen Gedächtnis, wie es bei Teilberichtsinstruktionen abgefragt wird.

Das eigentlich im Hintergrund stehende Konzept ist die Repräsentation des Reizes. Gedächtnis und priming sind zwei verschieden Aspekte davon: die Dynamik bzw. die Wirkung. Auf den verschiedenen Ebenen der Informationsverarbeitung ist der Reiz jeweils verschieden repräsentiert. Auf der frühesten Stufe könnte man von einer präkognitiven Repräsentation sprechen. Ein Kennzeichen dieser Stufe ist, daß hierauf keine höheren kognitiven Prozesse dynamisch einwirken können. Damit sind nicht Prozesse im Sinne einer allgemeinen Voreinstellung wie z.B. das tuning von rezeptiven Feldern gemeint. Letztere können durchaus auch auf die präkognitiven Stufen einwirken. Vielmehr ist der wichtigste Unterschied, daß die Repräsentationen auf diesen Stufen auch unter günstigsten Bedingungen nicht willentlich am Leben gehalten werden können, etwa im Sinne einer Schleife wie die Repräsentationen des Arbeitsgedächtnis. Diese Repräsentationen zerfallen sehr rasch, in der Regel in weniger als einer Sekunde. Wenn gelegentlich höherkognitive Spuren ebenfalls rasch zerfallen, liegt das in der Regel daran, daß sie nicht im Fokus der Aufmerksamkeit liegen. So kann es sein, daß der Aufmerksamkeitsfokus kapazitiv überfordert ist, oder daß diese Repräsentationen wegen mangelnder Ausprägung nicht bewußt erfahren werden (z.B. masked prim-ing oder PR-Wahrnehmung). Solche Spuren wären unter günstigeren Bedingungen (und unter der Voraussetzung, daß sich bewußte und unbewußte Repräsentationen nicht grundsätzlich unterscheiden) durchaus länger erhaltbar.

123

Zu den präkognitiven Speichern zählen die von Cowan zum kurzen auditiven Speicher gerechneten Phänomene wie Maskierung oder Persistenz und ihre Analoga beim Sehen. Es ist eine Frage der Terminologie, ob man solchen Phänomenen das Attribut Gedächtnis zugestehen will. Sie werden sicherlich nicht als Erinnern erfahren, aber das sollte kein Kriterium sein, da dies z.B. auch für implizites Gedächtnis gilt.

Eine Sonderstellung nimmt das Paradigma des Teilberichtsvorteils (visuell: Sperling, 1960) ein. Dabei geht es um eine nachträgliche Aufmerksamkeitszuwendung bei kapazitiver Überforderung der Aufmerksamkeit. Sie ist nur möglich auf der Basis einer noch nicht zerfallenen präkognitiven Repräsentation. Die mit diesem Paradigma vermessenen Charakteristika (Lebensdauer, Kapazität) spiegeln nicht unbedingt die Eigenschaften des zugrundeliegenden Speichersystems wieder: Es ist möglich, daß neben dem Zerfall der Repräsentation auch aufmerksamkeitsdynamische Beschränkungen eine Rolle spielen. Als Beispiel für aufmerksamkeitsdynamische Effekte seien Untersuchungen zum Aufmerksamkeitswechsel zwischen globalen und lokalen Aufgaben (Vorberg, 1994) angeführt. Aufmerksamkeit ist ebenso wie der Zerfall ein dynamischer Prozeß, und bei den im Teilbericht gemessenen Zeiten ist es schwierig, die beiden Prozesse zu trennen.

Während der visuelle Teilbericht Zeitkonstanten im Bereich der präkognitiven Speichersysteme liefert, werden für Teilberichtsexperimenteim auditiven Bereich häufig viel längere Zeitkonstanten zitiert (z.B. Darwin et al., 1972: 4-5 s). Diese Befunde werden zur Zeit eher kritisch gesehen, da sie sich teilweise nicht reproduzieren lassen und da die methodische Durchführung nicht ohne Kritikpunkte ist. Andere Studien (Treisman und Rostron, 1972) kommen auf deutlich kleinere Werte (<1.6 s). Damit nähert man sich zwar den Zeitkonstanten der präkognitiven Systeme, aber der Abstand ist noch zu groß, um eine eindeutige Interpretation in diese Richtung hin zuzulassen. Vielleicht erfassen visueller und auditiver Teilbericht in der Tat Repräsentationen auf unterschiedlichem Niveau.

Auf höheren Verarbeitungsstufen sind die Repräsentationen zum einen langlebiger und zum anderen kognitiv zugänglich. Das muß nicht heißen, daß sie bewußt erfahren werden. Periodisches Rauschen ist ein gutes Beispiel dafür: Im ersten Zyklus hört man die Fluktuation nicht, aber sie wird in eine wirksame Repräsentation (sensorische Vorbereitung!)

124

überführt. Dies geschieht für lange Zyklen nicht automatisch, sondern mit definitiver Willensanstrengung. Es ist faszinierend, sich vor Augen zu halten, was dabei passiert: Ein Detail der Wellenform wird im Echogedächtnis gespeichert und gegen Interferenz durch weiteres Rauschen geschützt, obwohl es kein bewußtes Perzept ausgelöst hat, nur weil man eine Regelmäßigkeit entdecken will.

Mit kürzeren Zyklen wird das Echogedächtnis von sich aus aktiv: Es bedarf keiner Aufmerksamkeitszuwendung. Das entspricht Befunden, wonach für diese Periodizitäten auch bei unbeachteten tonalen Mustern veränderungssensitive Potentiale im EEG gefunden wurden (Schröger et al., 1994; Schröger, 1997). Darin spiegelt sich die willkürliche/unwillkürliche Doppelrolle der Aufmerksamkeit wieder. Unwillkürliche Aufmerksamkeitszuwendung sollte aber nicht mit den Automatismen der präkognitiven Stufe verwechselt werden, da sie nicht wie diese starr festgelegten Mustern folgt, sondern wesentlich flexibler lernen kann, was unwillkürliche Aufmerksamkeit erfordert. So ist das Hinhören bei Nennung des eigenen Namens erlernt, und auch bei den oben zitierten EEG-Befunden hängt die automatische Zuwendung von dem vorherigen Erlernen eines Standards ab.

Die hier angeführte Dichotomie in kurzlebige präkognitive und langlebige kognitive Speichersysteme wird durch die bereits zitierten MEG-Befunde von Lu et al. (1992) gestützt. Cowans Gedächtnismodell von 1988 ist am Einspeichermodell orientiert, mit einem Langzeitgedächtnis, darin als aktivierte Form das Kurzzeitgedächtnis, einiges davon im Fokus der Aufmerksamkeit. Die kurzen sensorischen Speicher stellt Cowan außerhalb des Langzeitgedächtnisses als eine eigene Einheit. Dies spiegelt die präkognitive Stellung dieser Systeme. Es ist schon mehrfach angesprochen worden, daß die langen sensorischen Register vergleichbare Zeiten ( 10 s) wie das Kurzzeitgedächtnis aufweisen (Murdock, 1961). Das führt zu der Vermutung gleicher Speichermechanismen für sensorische und kategoriale Kodes.

Bei dieser Charakterisierung der Repräsentationen ist es offensichtlich, daß priming auf die Mechanismen der langen sensorischen Speicher und des Kurzzeitgedächtnisses einwirkt. Bei den präkognitiven Gedächtnissystemen (wenn man das Wort Gedächtnis überhaupt dafür verwenden will) herrscht bestenfalls eine Erleichterung im Sinne von Bahnung oder

125

Informationsintegration vor. Während nun priming im Kurzzeitgedächtnis häufig untersucht worden ist, ist priming bei weitgehender Verhinderung kategorialer Kodes („sensorisches priming“) hier zum ersten Mal thematisiert. Experimente zum kategorialen und sensorischen priming könnten dabei produktiv aufeinander einwirken. So könnte der Zeitverlauf beim kategorialen und beim sensorischen priming miteinander verglichen werden. Kapazität ist, wie schon angesprochen, für kategoriales priming (mit nicht bewußt wahrgenommenen Reizen) bisher nicht untersucht.

Umgekehrt wäre beim sensorischen priming zu untersuchen, ob außer perzeptuellem priming auch assoziatives priming auftritt. Dann würde der Nutzen des Echogedächtnisses sofort weitaus einleuchtender: Es ginge nicht um das Erinnern des sensorischen Kodes als solchen (evtl. für eine spätere Re-Interpretation) oder um Wahrnehmungserleichterung bei repetitiven Reizen, sondern zumindest auch um Wahrnehmungserleichterung bei assoziativ verwandten Perzepten, z.B. das Ende eines Transienten, wenn der Anfang bereits verarbeitet ist. Es würde sich sozusagen um eine Art präkategorialer Assoziationen handeln. Während man allerdings die Assoziationen kategorialer Stimuli kennt und das Experiment darauf abstellt, müßte noch überlegt werden, welche Reize präkategorial assoziiert sein könnten. Letztlich ist dies die Frage nach den jeweils wirksamen Gestaltgesetzen.

Es ist nichts Ungewöhnliches, daß priming durch Stimuli ausgelöst wird, die selbst nicht bewußt erfahren werden. So war schon wiederholt das masked priming (Forster und Davis, 1984) angesprochen worden, wo die vorher gebotene Maske und der direkt auf den prime folgende Zielreiz die Wahrnehmung des primes verhindern. Bei periodischem Rauschen findet solch ein priming durch einen nicht bewußt erfahrenen Reiz ohne großen methodischen Aufwand, geradezu „natürlicherweise“ statt. Die Fluktuationen, die in periodischem Rauschen leicht und für jedermann hörbar werden, sind in weißem Rauschen auch geübten Hörern verborgen (bis auf einen allgemeinen, unbestimmten Eindruck „es fluktuiert“, siehe auch die Diskussion in Kapitel 6.1). Im Unterschied zu masked priming und subliminalen primes muß dazu nicht erst eine Schwelle für die jeweilige Versuchsperson erhoben werden, oder verifiziert werden, daß die gewählten Intensitäten für die betreffende Versuchsperson in der Tat unbewußt bleiben. So gesehen stellen Experimente mit periodischem Rauschen ein günstiges

126

Paradigma für priming Effekte mit nicht bewußt wahrnehmbaren primes dar.

In der Forschung mit periodischem Rauschen als Stimulus stecken ein Reihe vielversprechender Möglichkeiten. Verbindungen zum priming, zur Aufmerksamkeitsforschung und zu Paradigmen sensorischen Behaltens, sowie neue Aspekte wie die Kapazitätsbegrenzung präattentiver Verarbeitung lassen darauf hoffen, daß von dieser Forschungsrichtung wertvolle Impulse für ein weitergehendes Verständnis früher sensorischer Verarbeitung ausgehen.

127

Zusammenfassung

Das Teilberichtsparadigma von Sperling wurde von Neisser in seinem Buch Cognitive Psychology als Indiz für ein sensorisches Register (Ikone) als notwendige Station der Informationsverarbeitung interpretiert. In klassischen Gedächtnismodellen wie dem Mehrspeichermodell von Atkinson und Shiffrin wurden die sensorischen Register als fester struktureller Bestandteil integriert. Der Informationsfluß zu höheren Stufen der Informationsverarbeitung sollte durch die Aufmerksamkeit geregelt werden.

Seit dem einflußreichen Artikel von Haber The impending demise of the icon wurde dieses Konzept zunehmend kritisiert. Dabei erfuhr allerdings die Vorstellung des sensorischen Speichers beim Hören, des Echogedächtnisses, weitaus weniger Kritik als die der Ikone, da der Nutzen im Fall von über die Zeit verteilter Information weitaus einleuchtender ist. Heute werden die sensorischen Register nicht als eine obligatorische Station auf dem Weg der Informationsverarbeitung angesehen. Im Einspeichermodell von Shiffrin und Schneider werden die sensorischen Register (wie auch das Kurzzeitgedächtnis) als eine Aktivationsform des Langzeitgedächtnissesaufgefaßt. Statt eines sensorischen Registers gibt es einen sensorischen Kode, der gegebenenfalls auch erinnert werden kann.

In letzter Zeit wird, z.B. von Cowan, zusätzlich zu den aktivierten sensorischen Zuständen des Langzeitgedächtnisses (lange sensorische Speicher) ein vorgeschaltetes System angenommen, die kurzen sensorischen Speicher außerhalb des Langzeitgedächtnisses. Im Fall der auditiven sensorischen Speicher teilt Nelson Cowan die Phänomene kurzfristigen sensorischen Behaltens wie folgt: Im kurzen auditiven Speicher spielen sich Phänomene wie Maskierung, Persistenz und Informationsintegration ab, im langen auditiven Speicher unter anderem Suffixeffekte beim Listenlernen, nachträgliche Aufmerksamkeitszuwendung beim dichotischen Beschatten, Teilberichtsparadigmen und die für diese Arbeit wichtige Wahrnehmung periodischen Rauschens.

Diese Einteilung wird durch MEG-Untersuchungen zu den sensorischen Spuren, z.B. von Lu et al., bestätigt. Inwieweit Phänomene der kurzen sensorischen Speicher als Gedächtnis bezeichnet werden, ist auch eine

128

terminologische Frage. Die bewußte Erfahrbarkeit des Gedächtnisprozesses ist als Kriterium nicht tauglich, da auch beim impliziten Gedächtnis keine subjektive Erinnerungserfahrung vorliegt.

Die Übergänge zwischen sensorischen Verarbeitungsstufen und Arbeitsgedächtnis sind fließend. Forschung zu den sensorischen Registern wird zur Charakterisierung eines Verarbeitungsprozesses auf einem Kontinuum von Verarbeitungsstufen. Um sich an das sensorische Ende des Kontinuums zu begeben, muß man mit Stimuli arbeiten, bei denen möglichst wenig Langzeitinformation ausgenutzt werden kann. Die vorliegende Arbeit verwendet periodisches weißes Rauschen als minimal strukturiertes Stimulusmaterial.

Periodisches Rauschen entsteht, wenn man Segmente weißen Rauschens nahtlos aneinanderhängt. Dabei werden an den Fügestellen keinerlei Artefakte hörbar, was an der stochastischen Natur von weißem Rauschen liegt. Wenn die Periode (d.h. die Länge des Segmentes) hinreichend lang gewählt wurde, hört ein ungeübter Hörer zunächst keinerlei besondere Struktur. Das periodische Rauschen klingt für ihn wie normales weißes Rauschen, was demonstriert, daß die Schnittstellen tatsächlich nicht hörbar sind. Wenn die Periode unter einer Sekunde liegt, wird allerdings für jeden Zuhörer der Unterschied zu nichtperiodischem Rauschen sofort klar: Man hört rhythmisch wiederkehrende Perzepte, die von Rauschen zu Rauschen sehr verschieden sein können, und die bei ein und demselben Rauschen sich auch von Zuhörer zu Zuhörer unterscheiden können. Guttman und Julesz, die diesen Stimulus in die Literatur einführten, unterschieden zwei Bereiche: für Perioden kürzer als 250 ms höre sich das Geräusch wie ein Außenbordmotor an, für längere Perioden wie ein rhythmisches Hauchen. Je länger man so einer Rauschprobe zuhört, desto mehr Details hört man heraus.

Die durchgeführten Untersuchungen konzentrierten sich auf folgende Aspekte: In Experiment 1-3 wurden Grundphänomene der Wahrnehmung periodischen Rauschens erfaßt. Dabei ging es um Fragen, die typischerweise gestellt werden, wenn man diesen Stimulus einem größeren Auditorium vorspielt: Hören wir jetzt alle dasselbe? Hören wir morgen für dasselbe Rauschen dasselbe? Was sind die physikalischen Grundlagen im Rauschsignal, die die Perzepte auslösen? In den Experimenten 4-6 wurden zwei verschiedene Zeitkonstanten vermessen, die bei diesem Phänomen

129

gleichzeitig aktiv sind und doch eine ganz andere Bedeutung und sehr verschiedene Werte haben: Lebensdauer und Kapazität der Echogedächtnisspur, die diese Perzepte hörbar werden läßt. Die Befunde führen zu Modellen sensorischen Behaltens, zwischen denen nicht mit Verhaltensexperimenten entschieden werden kann. Daher wurde es notwendig, die physiologische Basis der Wahrnehmung periodischen Rauschens mittels elektrophysiologischer Untersuchungen auf der Basis von evozierten Potentialen näher einzugrenzen. Dazu mußte aber erst eine geeignete Variante des Stimulus erarbeitet werden, die auch ansonsten von theoretischem Interesse ist: semiperiodisches Rauschen (Experiment 7 und 8). Das eigentliche EEG-Experiment (Experiment 9) bildet dann den Abschluß der experimentellen Untersuchungen. Anschließend werden die theoretischen Konsequenzen diskutiert.

Im ersten Experiment sollte untersucht werden, ob bei späterer Präsentation derselben Rauschprobe dieselbe rhythmische Struktur gehört wird, und ob es eine gewisse Korrelation zwischen Versuchspersonen gibt. Zudem sollte die zum Einsatz kommende Aufgabe validiert werden, das rhythmische Mittappen zu den gehörten Strukturen.

Der beschriebene Zufallszahlenalgorithmus erlaubt, ein und dieselbe Rauschprobe bei einer späteren Präsentation exakt wieder zu reproduzieren. Er wird durch ein Indexsystem gesteuert, und für Experiment 1 kamen neun Rauschproben, die mit den Indizes 1-9 erzeugt worden waren, zum Einsatz. Diese wurden als 500 (Probe 1-3), 600 (Probe 4-6) bzw. 700 (Probe 7-9) ms lange Segmente zyklisch dargeboten, wobei ein zufälliges Stück des ersten Zyklus weggelassen wurde, um identische Startpunkte zu vermeiden. Neun Versuchspersonen nahmen an der Studie teil, und um evtl. kulturelle Zusammenhänge mit untersuchen zu können, waren je drei Versuchspersonen (2xmännlich, 1xweiblich) aus drei verschiedenen Nationen (Deutschland, Frankreich, China). Alle Versuchspersonen lebten zum Zeitpunkt des Experiments seit mindestens einem Jahr in Frankreich und waren neben ihrer jeweiligen Muttersprache des Französischen und des Englischen mächtig.

Jede Versuchsperson absolvierte 3 Sitzungen mit je 100 Einzelversuchen, bei denen zufällig eine der neun Rauschproben unter Vermeidung direkter Abfolge identischer Proben präsentiert wurde. Die Versuchsperson sollte zunächst ein paar Sekunden ruhig zuhören, und dann den gehörten

130

Rhythmus tappen. Aus den Tappzeitpunkten konnte später ermittelt werden, ob die Periodizität richtig erkannt worden war. Das war fast immer der Fall. Außerdem konnte der Zeitpunkt innerhalb der Periode bestimmt werden, an dem getappt wurde. Dieser wurde dann pro Versuchsperson und Rauschprobe histogrammiert. Mittels statistischer Varianzanalysen konnte gezeigt werden, daß dabei keine Gleichverteilung von Tappzeitpunkten vorlag, sondern einige wenige (in der Regel 1-2) Tappzeitpunkte allen anderen Möglichkeiten vorgezogen wurden. Die Korrelation zwischen den Versuchspersonen lag zwischen 0.2 und 0.7 (Mittelwert 0.43). Dabei waren selbst die kleinsten Werte signifikant von Null verschieden. Es gab keine besonders hervorstechende Gruppenstruktur (entsprechend den Nationenoder dem Geschlecht), mit der Ausnahme einer evtl. vorhandenen engeren Gruppierung der französischen Versuchspersonen. Eine mögliche Verbesserung des interkulturellen Vergleichs würde darin bestehen, diese Untersuchung nicht mit verschiedenen Nationalitäten in einem Land, sondern in drei verschiedenen Ländern durchzuführen. Außerdem müßte die Zahl der Teilnehmer deutlich erhöht werden.

Im zweiten und dritten Experiment sollte die physikalische Basis für die hörbar werdenden Perzepte zeitlich und spektral eingegrenzt werden. Dazu wurde in Experiment 2 eine einzige Rauschprobe von insgesamt sechs Sekunden Länge erzeugt und im Speicher des Computers abgelegt. Für die Einzelversuche wurde dann aus dieser Hauptprobe an zufälliger Stelle ein kurzes Stück von 400, 600 oder 800 ms Länge herausgeschnitten und als periodisches Rauschen präsentiert. Wieder wurde (für fünf Versuchspersonen) der Tappzeitpunkt zu jedem Einzelversuch erhoben. Als Ergebnis des Experiments konnte eine These verworfen werden, die im Vorfeld bestanden hatte, daß nämlich ein Perzept, das bei periodischem Rauschen hörbar wird, aus einer holistischen Interpretation der gesamten Rauschprobe hervorgeht, auch wenn es selbst einen zeitlich begrenzten Eindruck hervorruft. Es wurde deutlich, daß für die Wahrnehmung eines bestimmten Perzeptes nur ein kleiner physikalischer Träger in unmittelbarer zeitlicher Nachbarschaft (ca. 100 ms) zum Tappzeitpunkt in Frage kommt.

Für die spektrale Eingrenzung (Experiment 3) wurde eine Rauschprobe an einer zufälligen Stelle in einen Hochpaß– und in einen Tiefpaßteil geteilt, und diese wurden um ein zufälliges Stück gegeneinander verschoben, bevor die Rauschprobe wieder zusammengesetzt und den fünf Versuchspersonen präsentiert wurde. Insgesamt gab es fünf Rauschproben, und diese erzeugten

131

in der Regel eindeutige Tappzeitpunkte. Die Idee war nun, daß wenn der Schnitt genau in die Gegend des spektrotemporalen Trägers kommt, er das Perzept zerteilt oder zerstört. Durch eine statistische Analyse der Tappzeitpunkte in Abhängigkeit von der Schnittfrequenz und des Verschiebungsbetrages konnte für jedes der 25 Perzepte (5 Rauschproben x 5 Versuchspersonen) ermittelt werden, in welcher spektralen Region es angesiedelt ist. Es ergaben sich häufig eng umschrieben Bereiche (1/3 bis 1 Oktave ), die für das Perzept zuständig sein mußten. Gelegentlich waren die Perzepte jedoch über bis zu 2 Oktaven verteilt, oder es kamen auch Interaktionsperzepte vor, die auf einem gleichzeitigen Vorgang in zwei recht weit entfernten Frequenzkanälen beruhen. Bei letzteren wurde bei einem Schnitt zwischen diesen beiden Kanälen der Zeitzusammenhang gestört, und das Perzept verschwand. Als mögliche Interaktion wird die Amplitudenkomodulation, wie in letzter Zeit häufig diskutiert, angenommen. Die Korrelation zwischen Versuchspersonen war wiederum im mittleren Bereich.

Nachdem nun zumindest für einige Perzepte der Bereich des Spektrogramms näher eingegrenzt werden konnte, der als physikalischer Träger des Signals in Frage kommt, lag es nahe, sich diesen Bereich näher anzuschauen, um die Art der Besonderheit (Energiegipfel o.ä.) verstehen zu können. Es zeigte sich aber, daß man hier mit physikalischer Signalanalyse nicht weiterkommt. Zwar findet man in den umschrieben Gebieten bemerkenswerte Fluktuationen, aber auch an anderen Stellen sind solche Fluktuationen vorhanden, und man kann aus dem Spektrogramm heraus nicht vorhersagen, welche Tappzeitpunkte gewählt werden. Überlegungen zu den möglichen Detektortypen ergaben, daß dies im Grunde auch kaum zu erwarten ist. Daher wurde im folgenden auf den Ansatz einer physikalischen Signalanalyse verzichtet und statt dessen versucht, mit kognitionspsychologischen Methoden die Parameter des Echogedächtnisseszu erfassen, das die Wahrnehmung der Perzepte ermöglicht.

In den Experimenten 4-6 sollten dazu zwei verschiedene Zeitkonstanten erfaßt werden. Zunächst (Experiment 4) ging es um die Lebensdauer des Echogedächtnisses im Falle von weißem Rauschen. Dazu sollte die maximale Zykluslänge erhoben werden, die noch als periodisch entdeckt werden kann. In der Originalpublikation von Guttman und Julesz wurde angenommen, daß bei 1-2 Sekunden für den ungeübten Hörer die Grenze erreicht ist. Spätere Publikationen aus dem Labor von Richard Warren

132

berichteten informell, daß einige Versuchspersonen mit viel Training bis zu 10 Sekunden lange Perioden als periodisch entdecken. Es war das Ziel von Experiment 4, zu erheben, mit wieviel Trainingsaufwand welche Periodenlängen noch erfaßbar sind.

Dazu wurden zwei Versuchspersonengruppen mit je 10 Teilnehmern gebildet. Keine der Versuchspersonen hatte zuvor je an einem psychoakustischen Experiment teilgenommen. Gruppe A hörte periodisches Rauschen mit Perioden, die von 0.5 s im ersten Einzelversuch in kleinen Schritten zu 20 Sekunden im 22. Einzelversuch anstiegen. In jedem Einzelversuch sollte die Versuchsperson sich bemühen, den Rhythmus zu entdecken und durch Mittappen anzuzeigen. Mit einer automatischen und einer visuellen off-line Analyse wurde dann entschieden, ob sie den Rhythmus in diesem Einzelversuch korrekt wiedergegeben hat. Wenn die Versuchsperson bis zu einem bestimmten Zeitpunkt (5 Sekunden plus 7 Zyklen) den Rhythmus nicht entdeckt hatte, wurde der Versuch als Mißerfolg gezählt und abgebrochen. Insgesamt absolvierten die Versuchspersonen von Gruppe A den Block aus 22 Einzelversuchen dreimal, jeweils in aufsteigender Reihenfolge. Bei Gruppe B war es identisch, nur daß sie in allen drei Blöcken die Einzelversuche in absteigender Reihenfolge (von 20 s zu 0.5 s) absolvierten.

Als Ergebnis läßt sich festhalten, daß bereits mit sehr wenig Training(wenige Minuten) beachtliche Periodenlängen erreicht werden. Für Gruppe A steigerte sich die Leistung über die drei Blöcke von 5 auf 7 Sekunden, wobei einige wenige Versuchspersonen auch mit 20 Sekunden langen Zyklen zurecht kamen. In Gruppe B war es ähnlich, nur war der Trainingserfolg weniger stark: die Leistungen des dritten Blocks waren nicht sehr von denen des ersten verschieden. Hier ist als Bestleistung bemerkenswert, daß zwei Versuchspersonen bereits im ersten Block 12 Sekunden lange Perioden korrekt entdecken konnten. Von einem Training kann man in diesem Fall eigentlich nicht sprechen, da sie keine kürzeren Perioden zuvor gehört hatten. Diese Leistung beruht somit auf aufmerksamer Befolgung der Instruktion.

Neben der Lebensdauer des Echogedächtnisses interessiert auch die Kapazität, wobei sich im Falle weißen Rauschens als operationale Definition diejenige Zeitmenge von Rauschen anbietet, die erinnert werden kann. Eine naheliegende Verwechslung ist, daß angenommen wird, die

133

Kapazität betrage 1-2 Sekunden, da dies die von Guttman und Juleszberichtete Grenze ist. Diese Grenze war in Experiment 4 mit nur wenig Training auf etliche Sekunden ausgedehnt worden, woraus dann folgen würde, daß auch die Kapazität sich entsprechend erweitert hätte. Eine introspektive Beobachtung beim Hören derart langer Rauschzyklen ist jedoch, daß nur ein äußerst geringer Anteil der Rauschprobe wirklich erinnert wird. Der größere Teil klingt für die Versuchsperson genauso unstrukturiert wie normales weißes Rauschen. Um den erinnerten Anteil zu quantifizieren, wurde in Experiment 5 und 6 während einer fortlaufenden Präsentation von periodischem Rauschen Segmente der Länge 200, 300 oder 400 ms aus Zyklen der Länge 1.2, 2.4, 4.2 und 6 Sekunden herausgeschnitten und durch andere ersetzt. Fünf (Experiment 5) bzw. vier (Experiment 6) Versuchspersonen nahmen an den Experimenten teil. Es war die Aufgabe der Versuchsperson, zu beurteilen, ob der Zyklus sich geändert hat. Jede Versuchsperson absolvierte in einer Sitzung 60 Einzelversuche pro Rauschprobe. Insgesamt wurden vier Konditionen in Experiment 5 (Segmentlänge 300 ms, Zyklus 1.2/2.4/4.2/6 s) und vier weitere Konditionen in Experiment 6 (Segmentlänge 200/400 ms, Zyklus 2.4/4.8 s) getestet, und zwar drei– (Experiment 5) bis viermal (Experiment 6) pro Versuchsperson. Für jede einzelne Sitzung wurde dann mit einer maximum-likelihood Methode ermittelt, welche der Segmente von der Versuchsperson erinnert wurden, und welche ausgetauscht werden konnten ohne eine für die Versuchsperson spürbare Veränderung auszulösen.

Es stellte sich heraus, daß nur ein kleiner Teil der Periode wirklich erinnert wurde. Der größte Teil des Zyklus konnte ausgetauscht werden, ohne daß die Versuchsperson etwas davon merkte. Der genaue Betrag ergibt sich aus Interpolation über die verschiedenen Segmentlängen (400, 300, 200 ms) gegen Null. Es ergibt sich eine Kapazität des Echogedächtnisses von 130 130 ms. Dieser Wert war völlig stabil gegenüber Variationen der Zykluslänge. Daher kann man davon ausgehen, daß hier der Zerfall der Spur keine Rolle spielt, daß die so gemessene Kapazität also eine genuine Zeitkonstante des Echogedächtnisses für weißes Rauschen darstellt. Für andere Stimulusarten, die redundanter sind und sich leichter in kategoriale Kodes übersetzen, würden sich sicherlich andere Zeitkonstanten ergeben. Die Kapazität von 130 ms repräsentiert das Fassungsvermögen am sensorischen Ende der Verarbeitungskette.

134

Die behavioral erhobenen Befunde lassen zwei unterschiedliche Modellvorstellungen über die Funktion des Echogedächtnisses zu. Das Entdecken von Fluktuationen im Rauschen, die bei einmaliger Präsentation nicht hörbar werden, bei wiederholtem Auftreten jedoch schon, könnte an einem (kapazitiv begrenzten) kognitiven Aktivierungserhalt im langen sensorischen Speicher liegen, der beim Wiederauftreten zu verstärkter Aktivität führt. Es könnte jedoch auch eine sensorische Vorbereitung einiger weniger Elemente im kurzen sensorischen Speicher erfolgen, die dann beim Wiederauftreten zu einer höheren Aktivierung der entsprechenden Elemente des langen sensorischen Speichers führt. Diese Frage konnte nicht mit behavioralen Messungen entschieden werden.

Daher sollte eine EEG-Untersuchung durchgeführt werden. Im Vorfeld dazu mußte jedoch zunächst nach einer Variante des Stimulus gesucht werden, die für die Erhebung evozierter Potentiale geeignet ist. Das bisher verwendete periodische Rauschen ist nicht geeignet, da wegen der Vieldeutigkeit des Stimulus jede Versuchsperson andere Schwerpunkte hört und die für die Mittelung der evozierten Potentiale wichtige Information über den Zeitpunkt des perzeptuellen Ereignisses nicht genau feststeht. Um diesen Zeitpunkt so genau wie möglich festzulegen, wurde sogenanntes semiperiodisches Rauschen eingesetzt. Diesen Stimulus erhält man, wenn man nur einen Bruchteil der Periode wirklich konstant hält, während der Rest der Periode mit stets neuem, anderem Rauschen aufgefüllt wird. Während periodisches Rauschen mit Perioden einer Länge von 1 Sekunde immer problemlos als periodisch wahrgenommen wird, fällt dies bei semiperiodischem Rauschen deutlich schwerer.

In einer ersten Studie (Experiment 7) wurden aus denselben sechs Sekunden Rauschen, die auch schon in Experiment 2 verwendet wurden, Segmente der Länge 200 ms herausgeschnitten und mit variabel gefüllten Zwischenstücken zu einer Periode von 600 bis 1000 ms ergänzt. Das so entstandene semiperiodische Rauschen wurde für mindestens 12 Sekunden dargeboten. Wenn die Versuchsperson bis dahin angefangen hatte, den Rhythmus mitzutappen, wurde die Präsentation verlängert, bis der getappte Rhythmus sicher gemessen worden war. Zwei Versuchspersonen absolvierten jeweils ca. 1000 Versuche. Dann wurde als Funktion der herausgeschnittenen Segmente ermittelt, wie häufig dieses Segment zu einer erfolgreichen Detektion führte.

135

Es stellte sich heraus, daß es große Unterschiede zwischen den verschiedenen Segmenten gibt, wobei einige für beide Versuchspersonen zu guter Detektion führten, andere hingegen von beiden Versuchspersonen nur schwer gefunden wurden. Es gab auch Unterschiede zwischen den beiden Versuchspersonen, aber die Übereinstimmung war deutlich größer als z.B. in Experiment 1. Das liegt daran, daß bei semiperiodischem Rauschen die Interpretationsvielfalt eingeschränkt ist. Es geht hier nur noch um die Merkmalsdetektoren und ihre Fähigkeit, das Wiederkehren dieses Merkmals zu entdecken.

Bei der gegebenen Variabilität der einzelnen Segmente schien es geraten, für die 20 Versuchspersonen des EEG-Experimentes genau solche Segmente auszuwählen, die zwar nicht überauffällig waren, aber mit etwas Hilfestellung leicht gefunden und behalten werden konnten. Dies geschah in Experiment 8, das zugleich das Training für Experiment 9 darstellte. Diesmal kamen 100-ms Segmente (in Zyklen von 1000 ms) zum Einsatz, um beim EEG-Experiment eine optimale Lokalisation des Zeitpunktes, an dem das Perzept wahrgenommen wird, zu ermöglichen. Dieselben sechs Sekunden wurden in 60 Stücke zu je 100 ms zerlegt, und für jedes dieser 60 Stücke wurden pro Versuchsperson 2 verschiedene Einzelversuche hintereinander absolviert. Der erste Einzelversuch war „schwer“ (ohne zusätzliche Hilfestellung sollte der Rhythmus gefunden werden), der zweite war „leicht“ (es wurde mit einem schnelleren, leicht detektierbaren Rhythmus angefangen, und dieser wurde erst allmählich auf 1 Hz gesenkt; zusätzlich wurden visuelle Signale gegeben, die das Auffinden des Rhythmus erleichterten). In beiden Arten von Einzelversuchen war die Aufgabe dieselbe, nämlich das Beurteilen, ob in der letzten Sekunde des Stimulus das Segment ebenfalls zugegen war (50%) oder durch ein anderes ersetzt worden war.

Es ergaben sich tatsächlich große Unterschiede zwischen den Segmenten. Die erste Sitzung (2x60 Einzelversuche pro Versuchsperson) wurde als Training gewertet, die zweite (gleicher Aufbau) wurde ausgewertet, um aus den 60 Segmenten die 20 besten auszusuchen. „Gut“ waren dabei diejenigen Segmente, die keine besondere Detektierbarkeit im schweren Einzelversuch, hingegen eine gute Detektierbarkeit im leichten Einzelversuch aufwiesen. Die dritte Trainingssitzung wurde nur mit diesen 20 Segmenten durchgeführt (aber mit derselben Versuchszahl, also dreimal höhere Statistik pro Segment). Aus den letzten 20 wurden zwei Segmente bestimmt, die

136

beide eine Zufallsleistung im schweren Einzelversuch und eine hohe Leistung im leichten Einzelversuch aufwiesen. Mit diesen beiden Segmenten wurde dann das EEG-Experiment durchgeführt.

Das EEG-Experiment sollte die Frage klären, ob bei der Tätigkeit des Echogedächtnisses sensorische Areale aktiviert werden oder nicht. Wenn die Wahrnehmung periodischen Rauschens auf einer rein kognitiven Restaktivierung beruht, würde die sensorische Verarbeitung weitgehend unbeeinflußt von der Detektion einer Periodizität des Rauschens erfolgen. Nimmt man hingegen an, daß eine Vorbereitung sensorischer Areale erfolgt, dann müßte sich bei erfolgreicher Detektion von periodischem Rauschen eine andere sensorische Verarbeitung nachweisen lassen. Es war die Aufgabe des folgenden Experimentes, diese Frage mittels evozierter Potentiale zu klären.

Beim EEG-Experiment (Experiment 9) wurde semiperiodisches Rauschen wie beim „leichten“ Einzelversuch von Experiment 8 zunächst mit einem schnellen Rhythmus von 5 Hz (200 ms, d.h. 100 ms konstantes Segment, 100 ms variabel) präsentiert, und dieser Rhythmus wurde allmählich im Lauf von 25 Sekunden durch Verlängern des variablen Teils auf 1 Hz gesenkt. Der Rhythmus wurde zudem durch blinkende LEDs signalisiert. Wenn der Rhythmus von 1 Hz erreicht worden war, blinkten Sonder-LEDs auf, die der Versuchsperson signalisierten, daß jetzt der eigentliche Versuch beginnt. Die LEDs blinkten dann noch 20-mal in dem selben Rhythmus, und meist, aber nicht immer, war dabei das konstante Segment zugegen. Wenn es fehlte (d.h. durch ein anderes Segment ersetzt wurde), entstand das Perzept einer Auslassung, da das an dieses Segment gekoppelte Perzept wegfiel. Die Versuchspersonen sollten die Auslasser zählen. Am Ende eines solchen Blocks nannten sie ihre Zahl und wurden dann über die tatsächliche Zahl der Auslasser aufgeklärt.

Eine Verhaltensauswertung ergab, daß die Versuchspersonen unterschiedlich gut mit der Aufgabe zurecht gekommen waren. Dies ist bei der interindividuellen Variabilität der Wahrnehmung von periodischem Rauschen nicht verwunderlich. Drei von den 20 Versuchspersonen wurden zu Pilotversuchen benötigt, eine weitere Versuchsperson machte von ihrem Recht auf Abbruch des Versuchs Gebrauch. Von den verbleibenden 16 Versuchspersonen (7 männlich) wurden entsprechend den Verhaltensdaten sieben in eine gute Leistungsklasse eingeteilt, vier in eine mittlere, und fünf

137

in eine schlechte Leistungsklasse. Dabei handelt es sich ausschließlich um das Zurechtkommen der Versuchspersonen mit dem jeweiligen Segment, nicht um die allgemeine Leistungsbereitschaft der Versuchspersonen. Die mittlere Leistungsgruppe wurde nicht ausgewertet. Die gute und die schlechte Leistungsgruppe wurden miteinander verglichen, und zwar getrennt für Standardreize (d.h. das Segment war da) und für Auslasser (d.h. das Segment war ersetzt worden).

Es ergab sich, daß nur bei den guten Versuchspersonen ein Unterschied zwischen den beiden Stimulusbedingungen zu finden war, und zwar ganz im Sinne klassischer Deviantpotentiale. Bei den schlechten Versuchspersonen waren die Kurven für Standards und Auslasser im wesentlichen deckungsgleich. Das war eine post-hoc Bestätigung der Einteilung der Versuchspersonen in Leistungsgruppen: die schlechte Leistungsgruppe zeigte auch nicht die evozierten Potentiale, die die Lösung der Aufgabe begleiten.

Der wichtige Unterschied zwischen den beiden Leistungsgruppen war, daß die schlechte Gruppe keinerlei Aktivierung zeitgleich mit dem Stimulus zeigte (Nullinie), während sich dort bei der guten Leistungsgruppe eine ausgeprägte Negativität zeigte. Die Versuchspersonen der guten Leistungsgruppe hatten offensichtlich das relevante Segment erlernen können und in ihr Echogedächtnis aufgenommen, um dann über das Echogedächtnis eine sensorische Aktivierung genau im richtigen Zeitpunkt für die Wiederholung auslösen zu können. Die Versuchspersonen der schlechten Leistungsgruppe hatten hingegen dieses Segment nicht in ihrem Echogedächtnis ablegen können und daher konnte dieses nicht die sensorischen Areale aktivieren.

Die beobachtete Aktivität zeitgleich mit dem Auftreten des Reizes spricht für die Hypothese, daß bei der Hörbarwerdung der Fluktuationen in periodischem Rauschen sensorische Aktivität im Sinne einer Vorbereitung (priming) eine Rolle spielt. Ungeklärt ist hingegen die Frage, wodurch die Kapazitätsbeschränkung zustande kommt. Man kann sich vorstellen, daß das Limit vom kurzen sensorischen Speicher vorgegeben wird. Naheliegender ist jedoch die Vermutung, daß es sich um ein durchgängiges Phänomen der aktivierten Zustände des Gedächtnisses (Einspeichermodell) handelt: Die Zahl der aktivierten Zustände einer bestimmten Verarbeitungstiefe ist begrenzt, und weitere Zustände werden im Sinne einer

138

Interferenz gehemmt. Interessant an dieser Interpretation ist, daß es sich bei den in dieser Arbeit vorgestellten Befunden um unbewußt ablaufende Prozesse handeln würde, da die fraglichen Fluktuationen ja beim ersten Auftreten zwar erinnert, aber noch nicht bewußt bemerkt werden. Dies entspricht der Fechnerschen Vermutung einer Äquivalenz zwischen bewußten und nichtbewußten Empfindungen. Diese nichtbewußten Aktivierungen von Gedächtniszuständen können gegen Interferenz durch weiteres Stimulusmaterial geschützt werden. In Konsequenz muß man die Existenz einer vorbewußten Aufmerksamkeitssteuerung annehmen.

Die Befunde und Modellbildung zum Echogedächtnis ist in dieser Form nur möglich geworden durch die Verwendung eines weitgehend strukturlosen Stimulusmaterials. Dadurch war eine kategoriale Verarbeitung und chunk Bildung weitgehend ausgeschlossen und eine sensorische Speicherung erzwungen worden. Die sich dabei dennoch einstellende Ähnlichkeit zu Prozessen kategorialer Speicherung, was Kapazität und Lebensdauer angeht, ermöglicht eine Integration der Vorgänge sensorischen Behaltens in ein einheitliches Modell des kurzzeitigen Behaltens.

139

Anhang A: Erzeugung von digitalem Rauschen

Dieser Anhang führt in technische Grundbegriffe zur Schallerzeugung ein, soweit sie für das Verständnis der vorhergehenden Kapitel benötigt werden. Es geht um das Digitalisieren einer Wellenform (Anhang A:.A.1), um digitales weißes Rauschen (Anhang A:.A.2) und periodisches Rauschen (Anhang A:.A.3). Zuletzt wird der in dieser Arbeit verwendete Zufallszahlen-Algorithmus erläutert (Anhang A:.A.4).

A.1 Digitalisierte WellenformenEine Schallwelle ist ein kontinuierlicher Vorgang in der Zeit. Für die meisten Zwecke ist es ausreichend, den Schalldruck zu diskreten Zeitpunkten zu kennen. Bei der digitalen Musikaufzeichnung wird der Schalldruck 44100 mal pro Sekunde analysiert. Damit können Schwingungen bis zu einer Frequenz von 22050 Hz festgehalten werden. Da unser Gehör nur Frequenzen bis 20 kHz hört, gewährleistet dies selbst für hohe Ansprüche eine gute Schallaufzeichnung. Die in Abb. A. 1 dargestellten Daten repräsentieren die Mikrophonströme (und damit indirekt den Schalldruck) eines Musiksignals in Zeitschritten von 1/44100 Sekunden.

Abb. A. 1: Auszug aus der auf CD gespeicherten Wellenform einer auf einem Musikinstrument gespielten Note. Jede Histogrammsäule repräsentiert den Mikrophonstrom und damit den Schalldruck zu einem diskreten Zeitpunkt. Diese Zeitpunkte liegen 1/44100 Sekunde auseinander. Die Digitalisierungsfrequenz ist hoch genug, denn die Amplituden verändern sich nur allmählich, d.h. es gibt keine großen Sprünge von einem Zeitpunkt zum nächsten. [Hungarotron HCD 31185,

140

Gisela Gumz, Clavichord, 120 ms nach dem Onset der Anfangsnote von (Fuge in G-Dur von Johann Mattheson, aus „Wohlklingende Fingersprache“).]

Statt 44,1 kHz kann auch eine andere Digitalisierungsfrequenz gewählt werden. Bei den meisten Experimenten wurde eine Frequenz von 20 kHz gewählt. Dabei muß beachtet werden, daß dann nur Frequenzen bis 10 kHz repräsentiert werden können, da digitalisierte Wellenformen nur bis zu der Hälfte der Digitalisierungsfrequenz die originale Wellenform gut repräsentieren können. Das ist aber für den experimentellen Zweck völlig ausreichend.

Digitalisierung bedeutet über das Zerlegen der kontinuierlichen Welle in eine Reihe diskreter Zeitwerte hinaus auch noch Repräsentieren dieser Werte als digitale Zahl mit einer bestimmten Genauigkeit. Letztere beträgt zur Zeit bei CDs und den meisten Soundkarten 16 Bit, was eine sehr gute Genauigkeit garantiert. Auch in der vorliegenden Arbeit wurden alle Stimuli mit 16 Bit digitalisiert. Im folgenden werden statt der kontinuierlichen Signale nur noch die digitalisierten Signale besprochen, da alle verwendeten Stimuli digital erzeugt worden sind.

A.2 Digitales weißes RauschenÜber Rauschen als auditives Signal ist schon in Kapitel 3.1 gesprochen worden. Für digitalisiertes weißes Rauschen kann man beweisen, daß die Zeitwerte voneinander völlig unabhängig sind. Das unterscheidet es von anderen Signalen wie dem in Abb. A. 1 dargestellten Musiksignal, bei denen aufeinander folgende Werte einander ähnlich sind. Daher können wir weißes Rauschen erzeugen, indem wir die aufeinanderfolgenden Am-plitudenwerte zufällig würfeln. Dazu müssen wir nur festlegen, welche Amplitudenwerte überhaupt möglich sind, und ob sie gleich häufig auftreten sollen oder einer bestimmten Häufigkeitsverteilung genügen sollen.

In der Technik hat es sich eingebürgert, Gaußsches Rauschen zu verwenden. Dabei werden die Amplitudenwerte zufällig aus einer Gaußschen Verteilung gezogen (siehe Abb. A. 2a). Der Grund dafür ist, daß die Amplitudenwerte von reellem Rauschen, ob es sich um den Teekessel oder um eine Mischung aus vielen Sprachsignalen handelt, gaußförmig verteilt sind, wie man aus dem Gesetz der großen Zahl ableiten kann. Künstlich erzeugtes Gaußsches

141

Rauschen ist also natürlichem weißen Rauschen (z.B. durch Mischen vieler Sprach- oder Musiksignale erzeugt) am ähnlichsten.

Statt einer Gaußverteilung kann man die Werte auch aus einer Gleichverteilung (Abb. A. 2b) oder aus einer zweiwertigen Verteilung (Abb.A. 2c) ziehen: für das Hörsystem sind die resultierenden Rauschen nicht zu unterscheiden. Das liegt daran, daß die an ihrer Wellenform durchaus unterscheidbaren Signale nach der Aufspaltung auf die verschiedenen Frequenzkanäle des Innenohrs vergleichbare Amplitudenverteilungen ergeben, gleich welche Verteilung zuvor vorgelegen hat.

Der nächste Abschnitt behandelt die Folgen dieser Zufälligkeit der Amplitudenwerte digitalisierten weißen Rauschens: der unkomplizierte Umgang mit Teilstücken, die in beliebiger Abfolge aneinander gehängt werden können, eben auch zu periodischem Rauschen. In Abschnitt AnhangA:.A.4 wird dann der mathematischer Algorithmus für den Zufallsgenerator spezifiziert, mit dem die in dieser Arbeit verwendeten Rauschstimuli erzeugt worden sind. Dabei handelt es sich um einen Algorithmus für Gaußsches Rauschen, da dieser ein Rauschen erzeugt, das physikalisch (auf der Ebene der Schallwellen) natürlichem Rauschen am ähnlichsten ist. Statt dessen hätte aber auch ein gleichverteiltes oder binäres Rauschen verwendet werden können, da diese sich perzeptuell von Gaußschem Rauschen nicht unterscheiden. Wenn dennoch Gaußsches Rauschen genommen worden ist, dann liegt das daran, daß es genauso einfach zu erzeugen ist wie normalverteiltes Rauschen.

A.3 Iteriertes (periodisches) RauschenEine besondere Eigenschaft von digitalisiertem weißen Rauschen ist die völlige Unabhängigkeit der Amplituden von allen Voramplituden. Dies wird deutlich, wenn man sich vor Augen hält, daß es durch Würfeln dieser Amplitudenwerte erzeugt werden kann. Daher kann man digitalisiertes weißes Rauschen beliebig zerschneiden und zusammenfügen, ohne daß die Schnittstelle hörbar wird. Um sich das klar zu machen, braucht man sich nur vorzustellen, diese Operationen statt mit weißem Rauschen mit einer Zufallszahlenfolge vorzunehmen (denn im Grunde ist digitalisiertes weißes Rauschen nichts anderes als das): auch dort könnte man z.B. einer Folge das Herausnehmen der fünften bis zehnten Zahl der Folge nicht „ansehen“.

142

Wenn man die Originalfolge nicht kennt, gibt es keine Methode, zu beweisen, daß nach der vierten Zahl etwas fehlt. Genauso kann man eine neue Zufallszahlenfolge zusammenstellen, indem man aus mehreren anderen Folgen Abschnitte übernimmt und aneinanderhängt.

143

Diese Eigenschaft -10000

-5000

0

5000

10000

-10000

-5000

0

5000

10000

-10000

-5000

0

5000

10000

Abb. A. 2: a) Die ersten 100 Amplitudenwerte eines Gaußschen Rauschen. Die Amplitudenwerte dieser Demonstration wurden mit dem in Anhang A:.A.4 behandelten Algorithmus (Index 1) errechnet. Die Standardabweichung wurde auf der y-Achse auf 3000 gesetzt. Rechts ist die Häufigkeitsverteilung für diese 100 Werte dargestellt (Binweite: 1000). Sie nähert sich einer Gaußschen Verteilung. Durch die zufällige

144

a) Gaußsches Rauschen

b) gleichverteiltes Rauschen

c) binäres Rauschen

unterscheidet digitalisiertes weißes Rauschen von allen anderen digitalisierten Wellenformen: Wenn man z.B. die Wellenform von Abb. A. 1 verkürzen wollte, müßte man sich genau überlegen, wo man sie auseinanderschneidet, und wieviel man weglassen will, damit der Übergang nachher nicht zu hören ist. In der Regel ist dies gar nicht zu bewerkstelligen, da neben der Grundschwingung auch noch Oberschwingungen eine Rolle spielen und man nicht für alle beteiligten Frequenzen zugleich einen bruchlosen Übergang gewährleisten kann. Auch rosa oder braunes Rauschen (siehe Kapitel 3.1) können nicht so problemlos geschnitten werden wie weißes Rauschen. Wenn man unbedingt besondere spektrale Variante braucht, empfiehlt es sich, die Schnittoperationen (z.B. die Generierung von periodischem Rauschen) mit weißem Rauschen vorzunehmen, und dann erst durch Filtern die gewünschte spektrale Form herzustellen.

Periodisches Rauschen wird erzeugt, indem eine Folge von Zufallszahleniteriert wird. Einem derartigen Zyklus läßt sich nicht ansehen, wo er beginnt bzw. aufhört. Als Beispiel sei ein Zyklus von sechs Zufallsziffern präsentiert:

485186548518654851865485186548518654851....

Natürlich könnte man einwenden, der Anfang läge offensichtlich bei 4. Aber vielleicht war die originale Zufallszahlenfolge 5485186, und beim ersten Zyklus der Präsentation wurde die erste Ziffer weggelassen. Da die Zahlen keinen inneren Zusammenhang haben, läßt sich nicht nachweisen, wo die originale Zufallsfolge aufhört und mit der ersten Ziffer neu begonnen wird. – Zur Erzeugung von semiperiodischem Rauschen (siehe Kapitel 6.3) wird man einen kurzen Abschnitt einer Zufallsfolge immer wieder in eine andere Zufallsfolge einbauen. Hier ist natürlich ein Anfang der konstant gehaltenen Folge nachweisbar, aber nur durch den Vergleich mit den vorhergehenden Zyklen (und genau das tut das Echogedächtnis).

A.4 Zufallszahlen: AlgorithmenDas in dieser Arbeit verwendete Gaußsche Rauschen wurde mit einer Familie von Zufallszahlengeneratoren erzeugt, wobei jeder einzelne Generator durch eine einzige Zahl, den Index, gekennzeichnet ist. Verwendet man denselben Index, dieselbe Amplitude,

145

Digitalisierungsfrequenz und Periodenlänge, dann kann man dasselbe Rauschen reproduzieren. Mit einem anderen Index erhält man ein vollständig unabhängiges Rauschen.

Die meisten Zufallszahlengeneratoren erzeugen eine Gleichverteilung von Werten aus dem Intervall von Null bis Eins. Um Gaußsches Rauschen zu erzeugen, müssen diese Werte transformiert werden zu Gaußisch verteilten Werten. Dazu verwendet man im allgemeinen die sogenannte Box-Muller-Transformation. Wenn man zwei unabhängige Zufallszahlen X und Y aus dem Intervall ]0,1] hat, dann erhält man aus diesen zwei normalverteilte (Mittelwert 0, Standardabweichung 1) Zufallszahlen U und V wie folgt:

U = [2 ln(X) ]½ cos(2Y),Gl. A.1:

V = [2 ln(X) ]½ sin(2Y).

Üblicherweise wird ein linearer kongruenter Generator eingesetzt. Wenn man den Modulus M, den Multiplikator A, eine Konstante C und einen Startwert K0 gewählt hat, folgen weitere Werte für K aus

Gl. A.2: Kn+1 = (A·Kn + C) mod M.

Wenn man geeignete Konstanten gewählt hat, erhält man gleichverteilte Zufallszahlen mit 0 K M. Diese können in das Intervall [0,1[ transformiert werden, indem man sie durch M teilt. Für die Box-Muller-Transformation ist es günstiger, Kn+1 durch M+1 zu teilen, da man dadurch vermeidet, daß in den Logarithmus Null eingesetzt wird.

Die richtige Wahl des Modulus M, des Multiplikators A und der Konstante C ist alles andere als trivial. Donald E. Knuth (1981) diskutiert die Vorteile und möglichen Problemquellen von vielen denkbaren Alternativen. Die hier beschriebenen Zufallszahlengeneratoren sind eng an seinen Ratschlägen orientiert. Mit Rücksicht auf die Rechengeschwindigkeit wäre es am besten, M=2b zu wählen, wobei b die Anzahl der Bits des Wortgröße des Computers ist, da dann die Modulusoperation sehr einfach wäre. Im Hinblick auf die serielle Unabhängigkeit ist es jedoch vorzuziehen, für M eine Primzahl auszuwählen. Jeder beliebige Multiplikator ergibt dann die Maximalperiode, die ersten Dezimalbruchstellen sind genauso „zufällig“ wie die letzten, und man braucht nicht die „Potenz“ der Zufallszahlenfolge berechnen (ein Maß

146

für die Unabhängigkeit aufeinander folgender Zahlen), da sie unendlich groß ist. Alle diese Merkmale sind so nur für die Wahl einer Primzahl als Modulus gültig. Daher wurde dieser Alternative hier der Vorzug gegeben. Die Rechengeschwindigkeit spielt bei der enorm gestiegenen Leistungsfähigkeit selbst einfachster Computer heute keine Rolle mehr.

Der Multiplikator sollte größer sein als M, am besten größer als M/100, aber kleiner als M-M. Die Konstante C sollte so gewählt werden, daß C/M ungefähr gleich 1/23/6, da dann die serielle Korrelation sehr gering ist. Alle Berechnungen müssen exakt und ohne Rundungsfehler durchgeführt werden. Wenn man sich an diese Ratschläge hält, erhält man einen Generator, der sehr unabhängige Zufallszahlen erzeugt. Im folgenden wird eine Familie solcher Zufallszahlen definiert, die sich in üblichen Hochsprachen (FORTRAN, PASCAL, C) implementieren läßt.

Um vollständig unabhängige Zufallsfolgen für die Box-Muller-Transformation zu erhalten, werden zwei unabhängige Generatoren für ein Rauschen definiert:

Kn+1 = (Ak·Kn + Ck) mod Mk.Gl. A.3:

Ln+1 = (Al·Ln + Cl) mod Ml.

Nun müssen nur noch die Werte K0, Ak, Ck, und Mk sowie L0, Al, Cl, und Ml

definiert werden. Um die Unabhängigkeit zu gewährleisten, sollten die Moduli Mk und Ml verschieden sein. Sie sollte so groß wie möglich sein, um eine große Periode zu erhalten. Andererseits sollte A ·M (nach den eben vorgetragenen Vorschlägen ist das ca. M²/100) noch ohne Rundungsfehler berechnet werden können. Viele Prozessoren beherrschen 64-Bit Integer Arithmetik, aber Hochsprachen wie PASCAL stellen keinen Zugang dazu bereit. Der IEEE Standard für Fließkommazahlen doppelter Genauigkeit (z.B. DOUBLE PRECISION in FORTRAN) läßt Ganzzahlberechnungen ohne Rundungsfehler bis 253 zu. Dann kann M so groß sein wie 229, und A ca. 223 (also  M/64). Die Moduli wurden daher von den Primzahlen unter 229 nach Knuth (1981) gewählt. Um Tippfehler beim Eingeben zu vermeiden, wurden alle Parameter so gewählt, daß sie sich als simple Potenzzahlen darstellen lassen. Es ergeben sich folgende Parameter:

147

K0 = 266, Ak = 245 - i, Ck = 226, Mk = 229 - 33,Gl. A.4

L0 = K0, Al = 245 + i, Cl = Ck, Ml = 229 - 43,

wobei i der Index für dieses Mitglied der Zufallszahlengeneratorenfamilie ist. Die unterschiedlichen Multiplikatoren verschiedener Mitglieder dieser Familie sorgen dafür, daß diese Mitglieder voneinander völlig unabhängig sind. Kn und Ln werden dann transformiert zu Xn = (Kn + 1) / Mk und Yn = (Ln + 1) / Ml, und diese entsprechend Gl. A.1 zu Un und Vn. Die Rauschprobe besteht schließlich aus den Werten U1, V1, U2, V2, .... Uj, Vj, wo j die halbe Länge des samples ist. Mit denselben Werten für den Index i, die Länge der Rauschprobe (entspricht 2j), der Digitalisierungsfrequenz, und der Standardabweichung, mit der die Un und Vn noch multipliziert werden, kann man genau dieselbe Rauschprobe reproduzieren. Die folgenden Tabelle führt zu Kontrollzwecken Werte für die ersten zwei Indizes auf.

Index n Kn Ln Un Vn

1 1 280718689 407496342 .06451 -1.13695

2 130062562 515535454 1.63167 -.41610

500 351784289 413111291 .11226 -.91262

2 1 508673792 179541249 -.16618 .28335

2 527791743 452322272 .10142 -.15436

500 184200468 210021800 -1.13400 .92386

Tab. A.1: Die Werte von Zufallsfolgen nach Gl. A.1-4 für Kontrollzwecke. Präsentiert wurde U1, V1, U2, V2, ... nach Multiplikation mit der gewählten Standardabweichung. Letztere war 10% des höchsten konvertierbaren Wertes (2151), so daß Überschreitungen des konvertierbaren Bereiches extrem selten vorkommen sollten. Konvertiert wurden letztlich 211, -3725, 5346, -1363, ... für die erste Folge.

148

Literaturverzeichnis

Anderson, J.R. (1995). Cognitive Psychology and its Implications. W.H. Freeman and Company, New York. Deutsche Ausgabe: Kognitive Psychologie. Spektrum, Heidelberg (1996).

Atkinson, R.C. und Shiffrin. R.M. (1968). Human memory: a proposed sys-tem and its control processes. In K.W. Spence und J.T. Spence (Eds.), The psychology of learning and motivation: advances in research and theory (Vol. 2, 89-195). Academic Press, New York.

Baddeley, A. (1986). Working memory. Oxford: Oxford University press.

Baddeley A. und Hitch, G. (1974). Working memory. In G.H. Bower (Ed.), The psychology of learning and motivation (Vol. 8, 47-89). Academic Press, New York.

Bashford, J.A., und Warren, R.M. (1990). Pattern recognition within spec-trally isolated regions of broadband complex sound. Journal of the Acousti-cal Society of America 87, S24.

Békésy, G. von (1933). Über die Hörsamkeit der Ein- und Ausschwingvorgänge mit Berücksichtigung der Raumakustik. Annalen der Physik 16, 844-860.

Bregman, A. (1990). Auditory scene analysis. MIT Press, New York.

Broadbent, D.E., und Ladefoged, P. (1959). Auditory segregation: Stream or streams? Journal of the Acoustical Society of America 31, 1539.

Broadbent, D.E: (1958). Perception and communication. Pergamon, New York.

Brubaker, B.S., und Warren, R.M. (1987). Detection of infratonal repetition of frozen noise: Singularity recognition or pattern recognition? Journal of the Acoustical Society of America 82, S93.

Brubaker, B.S., und Warren, R.M. (1990). Auditory memory for long-period random waveforms. Journal of the Acoustical Society of America 87, S24.

Cowan, N. (1984). On short and long auditory stores. Psychological Bul-letin 96, 341-370.

149

Cowan, N. (1988). Evolving concepts of memory storage, selective atten-tion, and their mutual constraints within the human information processing system. Psychological Bulletin 104, 163-191.

Cowan, N. (1995). Attention and memory: An integrated framework. Ox-ford University Press, Oxford.

Cutler, A. (1991). Linguistic rhythm and speech segmentation. in Language, Music, Speech and Brain, edited by Carlson, Nord and Sundberg (MacMil-lan).

Cutler, A., Mehler, G., Norris, D., Segui, J. (1983). Language-specific com-prehension strategy. Nature 304, 159-160.

Darwin, C., Turvey, M., und Crowder, R. (1972). An auditory analog of the Sperling partial report procedure: Evidence for brief auditory storage. Cog-nitive Psychology 3, 255-267.

Daugman, J. G. (1980). Two-dimensional spectral analysis of cortical recep-tive field profiles. Vision Research 20, 847-856.

Daugman, J. G. (1985). Uncertainty relation for resolution in space, spatial frequency, and orientation optimized by two-dimensional visual cortical fil-ters. Journal of the Optical Society of America, 2 (7), 1160-1169.

DeSchepper, B. und Treisman, A. (1996). Visual memory for novel shapes: Implicit coding without attention. Journal of Experimental Psychology: Learning, Memory, and Cognition 22, 27- 47.

DeValois, R. L. und DeValois, K. K. (1988). Spatial Vision. Oxford Univer-sity Press.

Ebbinghaus, H. (1885). Über das Gedächtnis. Duckner und Humbold, Leipzig.

Efron, R. (1970). The minimum duration of a perception. Neuropsychologia 8, 57-63.

Eriksen, C.W. und Collins, J.F. (1967). Some temporal characteristics of visual pattern perception. Journal of Experimental Psychology 74, 476-484.

Fechner, G.T. (1860). Elemente der Psychophysik. Breitkopf & Härtel, Leipzig.

150

Forster, K.I., und Davis, C. (1984). Repetition priming and frequency atten-uation in lexical access. Journal of Experimental Psychology: Learning, Memory, and Cognition 10, 680-698.

Fowler, C.A. (1979). Perceptual centers in speech production and percep-tion. Perception & Psychophysics 25, 375-388.

Gibson, J.J. (1966). The senses considered as perceptual systems. Houghton Mifflin, Boston.

Gibson, J.J. (1979). The ecological approach to perception. Houghton Mif-flin, Boston.

Glenberg, A.M. (1997). What memory is for. Behavioral and Brain Sci-ences 20, 1-19.

Guttman, N., und Julesz, B. (1963). Lower limits of auditory periodicity analysis. Journal of the Acoustical Society of America 35, 610.

Haber, R.N. (1983). The impending demise of the icon: A critic of the con-cept of iconic storage in visual information processing. Behavioral and Brains Sciences 6, 1-11.

Hillyard, S.A., (1973). The CNV and human behavior. A review. Electroen-cephalography and Clinical Neurophysiology Suppl. 33, 161-171.

Horn, D. und Opher, I. (1996). Temporal Segmentation in a Neural Dy-namic System. Neural Computation 8, 375-391.

Kaernbach, C. (1992). On the consistency of tapping to repeated noise, Journal of the Acoustical Society of America 92, 788-793.

Kaernbach, C. (1993). Temporal and spectral basis of the features perceived in repeated noise, Journal of the Acoustical Society of America 94, 91-97.

Kaernbach, C. (1998). Lifetime and capacity of echoic memory for random wave forms, submitted to Perception & Psychophysics

Kaernbach, C., Schröger, E., Gunter, T.C. (1998). Human event-related brain potentials to auditory periodic noise stimuli, Neuroscience Letters 242, 17-20.

Kaufman, L., Curtis, S. , Wang, J.-Z., und Williamson, S.J. (1992). Changes in Cortical Activity When Subjects Scan Memory for Tones, Electroen-cephalography and clinical Neurophysiology 82, 266-284.

151

Knuth, D. E. (1981). The Art of Computer Programming, Vol. 2: Seminu-merical Algorithms, 2nd ed., Addison-Wesley, Reading, Massachusetts.

Langner, G. (1992). Periodicity coding in the auditory system, Hearing Re-search 60, 115-142.

Limbert, C. (1984). The perception of repeated noise. Doctoral dissertation, Cambridge University.

Limbert, C., und Patterson, R.D. (1982). Tapping to repeated noise. Journal of the Acoustical Society of America 71, R11.

Lu, Z.-L., Williamson, S.J. und Kaufman, L. (1992). Behavioral lifetime of human auditory sensory memory predicted by physiological measures. Sci-ence 258, 1668-1670.

MacKay, D.M. (1960). Theoretical models of space perception. In: C. A. Muses (Ed.), Aspects of the theory of artificial intelligence. New York, 1960.

MacKay, D.M. (1981). Strife over visual cortical function. Nature 289, 117-118.

Marcus, S.M. (1981). Acoustic determinants of perceptual center (P-center) location. Perception & Psychophysics 30, 247-256.

Michel, C.M. , Kaufman, L., und Williamson, S.J. (1994). Duration of EEG and MEG alpha Suppression Increases with Angle in a Mental Rotation Task, Journal of Cognitive Neuroscience 6, 139-149.

Miller G.A. (1956). The magical number seven, plus or minus two: Some limits on our capacity for processing information. Psychological Review 63, 81-97.

Moore, B.C.J. (1990). Comodulation masking release: spectro-temporal pat-tern analysis in hearing. British Journal of Audiology 24, 131-137.

Murdock, B.B. Jr. (1961). The retention of individual items. Journal of Ex-perimental Psychology 62, 618-625.

Neisser, U. (1967). Cognitive psychology. Appleton, New York.

Patterson, R.D., Milroy, R., und Lutfi, R.A. (1983). Detecting a repeated tone burst in repeated noise. Journal of the Acoustical Society of America 73, 951-954.

152

Pollack, I. (1972). Memory of auditory waveforms. Journal of the Acousti-cal Society of America 52, 1209-1215.

Pollack, I. (1975). Identification of random auditory waveforms. Journal of the Acoustical Society of America 58, 126-127.

Pollack, I. (1990). Detection and discrimination thresholds for auditory pe-riodicity. Perception & Psychophysics 47, 105-111.

Preusser, D. (1972). The effect of structure and rate on the recognition and description of auditory temporal patterns. Perception & Psychophysics 11, 233-240.

Preusser, D., Garner, W.R, und Gottwald, R.L. (1970). Perceptual organiza-tion of two-element temporal patterns as a function of their component one-element patterns. American Journal of Psychology 83, 151-170.

Raij, T., McEvoy, L., Mäkelä, J.P. and Hari, R., (1997). Human auditory cortex is activated by omissions of auditory stimuli. Brain Research 745, 134-143.

Ritter, W. und Ruchkin, D.S., (1992). Review of event-related potential components discovered in the context of studying P3. Annals of the New York Academy of Sciences 658, 1-32.

Roediger, H. L. (1990). Implicit memory: Retention without remembering. American Psychologist 45, 1043-1056.

Roth, N., und Roscher, G. (1990). A psychophysiological study of percep-tion and retrieval after repeated "subliminal" stimulation. In: Psychophysi-cal Explorations of Mental Structure, Ed. H.-G. Geißler, Hogrefe, Stuttgart.

Shepard, R.M. und Teghtsoonian, M. (1961). Retention of information un-der conditions approaching a steady state. Journal of Experimental Psychol-ogy 62, 302-309.

Schmidt, R.A. (1968). Anticipation and timing in human motor perfor-mance. Psychological Bulletin 70, 631-646.

Schröger, E. (1997). On the detection of auditory deviations: A pre-attentive activation model. Psychophysiology, 34, 245-257.

153

Schröger, E., Paavilainen, P., & Näätänen, R. (1994). Mismatch negativity to changes in a continuous tone with regularly varying frequencies. Elec-troencephalography and Clinical Neurophysiology, 92, 140-147.

Schubert, E.D., und West, R.A. (1969). Recognition of repeated patterns: A study of short-term auditory storage. Journal of the Acoustical Society of America 46, 1493-1501.

Shiffrin, R.M. und Schneider, W. (1977). Controlled and automatic human information processing: II. Perceptual learning, automatic attending, and a general theory. Psychological Review 84, 127-190.

Sperling, G.A. (1960): The information available in brief visual presenta-tions. Psychological Monographs 74, No. 498.

Treisman, A.M. (1960). Contextual cues in selective listening. Quarterly Journal of Experimental Psychology 12, 242-248.

Treisman, A.M. (1964). Selective attention in man. British Medical Bulletin 20, 12-16.

Treisman, M., und Rostron, A.B. (1972). Brief auditory storage: A modifi-cation of Sperling's paradigm. Acta Psychologica 36, 161-170.

Tulving, E. und Schacter, D. (1990). Priming and Human Memory Systems. Science 247, 301-306.

Uusitalo, M.A., Williamson, S.J., Seppä, M.T. (1996). Dynamical organiza-tion of the human visual system revealed by lifetimes of activation traces. Neuroscience Letters 213, 149-152.

Vorberg, D. (1994). Voluntarily attention switching between global and lo-cal levels. Perception Suppl. 23, 13-14.

Wang, K., und Shamma S. (1994) Wavelet representations of sound in the primary auditory cortex. Journal of Optical Engineering 33, 2143-2148.

Warren, R.M. (1982). Auditory perception, A new synthesis. Pergamon Press, Oxford.

Warren, R.M., und Ackroff, J.M. (1976). Two types of auditory sequence perception. Perception & Psychophysics 20, 387-394.

Warren, R.M., und Bashford, J.A. (1981). Perception of acoustic iterance: Pitch and infrapitch. Perception & Psychophysics 29, 395-402.

154

Warren, R.M., und Obusek, C.J. (1972). Speech perception and phonemic restoration. Perception & Psychophysics 9, 358-362.

Warren, R.M., und Wrightson, J.M. (1981). Stimuli producing conflicting temporal and spectral cues to frequency. Journal of the Acoustical Society of America 70, 1020-1024.

Warren, R.M., Wrightson, J.M., und Puretz, J. (1988). Illusory continuity of tonal and infratonal periodic sounds. Journal of the Acoustical Society of America 84, 1338-1342.

Watkins, O.C. und Watkins, M.J. (1980). The modality effect in free and se-rial recall as a function of phonological similarity. Journal of Verbal Learn-ing & Verbal Behavior 19, 430-447.

Williamson, S.J. , Kaufman, L. , Curtis, S. , Lu, Z-L. , Michel, C.M., und Wang, J-Z. (1996). Neural Substrates of Working Memories are Revealed Magnetically by the Local Suppression of Alpha Rhythm, In: Visualization of Information Processing in the Human Brain: Recent Advances in MEG and Functional MRI (EEG Suppl. 47), I. Hashimoto, Y.C. Okada, and S. Ogawa, Eds. Elsevier Science B.V., The Netherlands, pp. 163-180.

Zwislocki, J.J. (1972). A theory of central auditory masking and its partial validation. Journal of the Acoustical Society of America 52, 644-659.

155

156

Erklärung

Die Habilitationsschrift wurde von mir selbständig verfaßt. Sie benutzt keine anderen als die angegebenen Hilfsmittel und Quellen. Wörtlich oder inhaltlich übernommene Stellen sind als solche gekennzeichnet.

157

158

Lebenslauf und wissenschaftlicher Werdegang

4.10.1960 geboren in Bonn. 1978 Abitur Gymnasium Mechernich, Leistungskurse Physik und Mathematik. 1978/79 Wehrdienst. Verheiratet seit 1993.

Studiumab 9/79 Physik, Universität Bonn. 11/1985 Diplom, Thema: Innen-

ohrmodelle (Betreuer: Prof. Dr. E. de Boer, Amsterdam).ab 4/81 Medizin, Universität Bonn. 6/1988 Approbation. 9/1988

Promotion, Thema: Signalentdeckungstheorie (Prof. Dr. D. Linke).

Forschung9/88-8/91 Laboratoire d'Audiologie Expérimentale, Bordeaux (Dr. J.-M.

Aran). Arbeiten über adaptive Methoden in der Psychophysik. Studien zur Wahrnehmung periodischen Rauschens.

9/91-4/94 Institut für Neuroinformatik, Ruhr-Universität Bochum (Prof. Dr. C. von der Malsburg). Experimente und Neuromodelle zur auditiven Gestaltpsychologie und zur Tonhöhenwahrnehmung.

seit 5/94 wiss. Assistent von Prof. Dr. H.-G. Geißler, Institut für Allgemeine Psychologie, Universität Leipzig. Experimente/Modelle zu Tonhöhenwahrnehmung, sensorisches und Kurzzeitgedächtnis.

LehreUniversité Bordeaux 2, UFR des Sciences Sociales et Psychologie:

Mathématiques et Statistiques pour la 1ère année de Psychologie 90/91

Ruhr-Universität Bochum, Fakultät für Psychologie:Seminar Methoden der Psychophysik SS 93Seminar Grundlagen der Psychoakustik WS 93

Universität Leipzig, Institut für Allgemeine Psychologie:Vorlesung Skalierung WS94 WS95 WS96 WS97Vorlesung Wahrnehmungspsychologie WS94 SS95 WS95 WS96 SS98Vorlesung Kognitionspsychologie SS96 SS97

159

Mitarbeit Vorlesung Wahrnehmungstheorie und Psychophysik WS97Mitarbeit Seminar zur Vorlesung SS96 WS96 WS97Vertiefungsrichtung Kognition SS94 SS96 (WS97 Mitarbeit)Empirie-Praktikum SS94 - WS97, insgesamt 8-mal, im WS Mitarbeit

160

Veröffentlichungenin internationalen Zeitschriften mit peer-review System:

de Boer, E., Kaernbach, C., König, P., Schillen, T. (1986). Forward and re-verse waves in the one-dimensional model of the cochlea, Hearing Re-search 23, 1-7.

Kaernbach, C., König, P., Schillen, T. (1987). On Riccati equations describ-ing impedance relations for forward and backward excitation in the one-dimensional cochlea model, Journal of the Acoustical Society of America 81, 408-411.

Kaernbach, C. (1990). A single-interval adjustment-matrix (SIAM) for un-biased adaptive testing, Journal of the Acoustical Society of America 88, 2645-2655.

Kaernbach, C. (1991). Simple adaptive testing with the weighted up-down method, Perception & Psychophysics 49, 227-229.

Kaernbach, C. (1991). Poisson signal detection theory, Perception & Psy-chophysics 50, 498-506.

Kaernbach, C. (1992). On the consistency of tapping to repeated noise, Jour-nal of the Acoustical Society of America 92, 788-793.

Kaernbach, C. (1993). Temporal and spectral basis of the features perceived in repeated noise, Journal of the Acoustical Society of America 94, 91-97.

Kaernbach, C., Schröger, E., Gunter, T.C. (1998). Human event-related brain potentials to auditory periodic noise stimuli, Neuroscience Letters 242, 17-20.

Kaernbach, C. (1998). Clavichord unisons: more than just two strings, Clavi-chord International 2(1), 14-17.

Kaernbach, C., Demany, L. (1998). Psychophysical evidence against the au-tocorrelation theory of auditory temporal processing, Journal of the Acoustical Society of America (akzeptiert)

161

eingereicht, in Vorbereitung:

Kaernbach, C. (1998). Lifetime and capacity of echoic memory for random wave forms, Perception & Psychophysics (eingereicht).

Kaernbach, C. (1998). Partial report paradigm with visual cues with low and high contrast, in Vorbereitung.

Kaernbach, C., Neutzler, F. (1998). Data analysis of adaptive data, in Vorbereitung. Ergebnis einer Diplomarbeit (Betreuer: C. Kaernbach).

Kaernbach, C., Roeber, U. (1998). Search in short-term and long-term mem-ory. In Vorbereitung. Ergebnis einer Diplomarbeit (Betreuer: C. Kaernbach).

Qualifikationsarbeiten:

Kaernbach, C. (1985). Stabilität und Auswirkungen von aktiven nichtlinearen Oszillatoren in einem eindimensionalen Innenohrmodell. Diplomarbeit (Physik), Bonn.

Kaernbach, C. (1988). Entscheidungsverhalten an der Wahrnehmungsschwelle: Theoretische Überlegungen und ein Experiment zur klassischen Ja-Nein-Aufgabe. Doktorarbeit in Medizin, Bonn.

Artikel in Büchern:

de Boer, E., Kaernbach, C., König, P., Schillen, T. (1985). An isolated sound emitter in the cochlea: Notes on modelling, in Peripheral Auditory Mechanisms, Ed. J.B. Allen, J.L. Hall, A. Hubbard, S.T. Neely, A. Tubis (Springer, Berlin), 197-204.

Tagungsbeiträge in proceedings:

Kaernbach, C. (1990). SIAM: Adaptive yes-no task testing with the Single-Interval Adjustment Matrix, in Proceedings of the Sixth Annual Meet-ing of the International Society for Psychophysics, Würzburg, 1990, 88-93.

Kaernbach, C. (1991). Neue adaptive Methoden in der Psychophysik, in Fortschritte der Akustik DAGA 91 (DPG-GmbH, Bad Honnef), 465-468.

162

Kaernbach, C. (1991). Periodisches Rauschen und Periodizitätswahrnehmung, in Fortschritte der Akustik DAGA 91 (DPG-GmbH, Bad Honnef), 517-520.

Kaernbach, C. (1993). Die Rolle von Onset, Offset und Komodulation bei der auditiven Szenenanalyse, in Fortschritte der Akustik DAGA 93 (DPG-GmbH, Bad Honnef), 864-867.

Kaernbach, C. (1993). The contribution of onset, offset, and comodulation to the grouping of noise bands, Journal of the Acoustical Society of Amer-ica 93, 2347 (Abstract).

Kaernbach, C., Mohlberg, H. (1994). A neural sequence-learning model to explain auditory periodicity analysis, in Proceedings of the ICANN 1994, Sorrento, Italy. Eds M. Marinaro and P. G. Morasso (Springer, New York), vol. II, 909-912. Ergebnis einer Diplomarbeit (Betreuer: C. Kaernbach).

Kaernbach, C. (1996). Zeitkonstanten des Echogedächtnisses, in Fortschritte der Akustik DAGA 96, Hg. T. Portele, W. Hess (DEGA e.V., Oldenburg), 372-373.

163

164

Einwerbung von Drittmitteln

DFG-Forschungsstipendium Ka 824/1 „Gefrorenes Rauschen als Mittel zum Studium der Wahrnehmung von Periodizität bei akustischen Signalen“, Laboratoire d'Audiologie Expérimentale, Bordeaux, 9/89-8/91.

Mitwirkung bei der Konzeption und Projektmitarbeiter (BAT IIa 12/91-4/94) im DFG-Projekt Ma 697/4 „Psychoakustische und neuroinformatische Analyse von auditiven Mechanismen zur Zeitverarbeitung und Segmentation“ (Antragsteller: Prof. Dr. C. von der Malsburg, Ruhr-Universität Bochum), Gesamtumfang 300 TDM.

Mitantragsteller und Organisator der von der DFG (4851/173/95) unterstützten Tagung “Phenomena and Architectures of Cognitive Dy-namics” in Leipzig, 29.6.-1.7.95 (DFG: 30 TDM, insgesamt 60 TDM).

Anschaffung einer Schallkabine inkl. Ausrüstung am Institut für Allgemeine Psychologie, Universität Leipzig, aus HBFG-Mitteln mit DFG-Begutachtung (HBFG 3772-036-207) für 180 TDM.

Mitarbeit bei der Anschaffung eines 64-Kanal EEG-Gerätes für das Institut für Allgemeine Psychologie, Universität Leipzig, aus HBFG-Mitteln mit DFG-Begutachtung (Hauptantragsteller: Prof. Dr. H.-G. Geißler, HBFG 3772-036-178) für 209 TDM.

1/97-4/98 DFG-Kleinprojekt Ka 824/4 „Visuelle Wahrnehmung jenseits des Vollberichts“ mit Versuchspersonengeldern, 1 SHK etc., Gesamtum-fang 12 TDM.

5/98-4/00-... DFG-Projekt Ka 824/5 „Zeitverarbeitung bei der Tonhöhenwahrnehmung“ im Schwerpunktprogramm „Zeitverarbeitung im zentralen auditiven System“ mit ½ BAT IIa, Geräte, Reisekosten etc., Umfang 130 TDM (1. Antragszeitraum).

165

166

Register

AAckroff.........................................20; 35Altmann.............................................61Amplitudenkomodulation...........44; 123Anderson..................................108; 112ANOVA....................................101; 103Antizipation................................30f; 88Arbeitsgedächtnis.................8; 114; 120Artefakt..........................23; 27; 82; 120Atkinson......................................5f; 119Aufmerksamkeit.5; 8-10; 59; 83-85; 87;

. .89; 103; 108-110; 114-116; 119; 129Aufmerksamkeitsfokus9; 85; 108f; 114ffAutokorrelation.............................27-29Autokovarianz....................................27

BBaddeley......................................8; 108Bahnung...........................................116Bandpaß.............................................99Bandpaßrauschen...............................20baseline......................................99; 104Bashford..........................13; 19f; 41; 54Békésy...............................................12beschatten.........................................12fBetonung............................................32Bewußtsein......5; 8ff; 60; 85ff; 107-117;

129Bias....................................................38Bit.....................................63; 132; 136fBloch.................................................61Bregman............................................21Breibandrauschen...............................20Broadbent.....................................20; 83Brocca................................................61Brubaker......................................20; 35

Cchaotisch..........................................109China..........................................23; 121chunking....................................77; 129Clavichord........................................131Collins...............................................64contingent negative variation............104Cowan..........7-14; 20; 59f; 77ff; 84-87;

......................107-110; 114; 116; 119Cutler.................................................32

DDarwin.............................................115Daugman............................................48Davis........................................112; 117Demany.............................................49DeSchepper.....................................112fDeutschland................................23; 121Deviant............................................128dichotisch.............................12; 83; 119Digitalisierung................18; 44; 89; 99;

.....................................131-135; 138

EEbbinghaus........................................53EEG............81; 87-89; 92f; 96; 99; 111;

..................................115; 121; 126ffEfron..................................................12Einspeichermodell.. . . .6-9; 116; 119; 129Energie.........................16; 23; 46ff; 123EOG...................................................99Epochen.............................................99ereigniskorrelierte Potentiale.....88f; 93;

............................................99; 101ffEriksen...............................................64Erregungszustand.........................51; 86Ersparnismaß.....................................53Erwartungpotential...........................104Evolution...........................................10

167

FFarbe.............................16; 42f; 64; 113feature Detektoren............................48fFechner.......................10; 107; 110; 129Filtermodell...................................8; 83Fluktuation....29; 56; 81f; 85; 87f; 106f;

.............109; 115; 117; 123; 125; 129Forster......................................112; 117Fouriertransformation...................41; 44Fowler................................................32Frankreich...................23; 32f; 121; 122Fuge.................................................131

GGabor.................................................48Geißler...............................................61Geschlecht.........................22; 32ff; 122Gestalt...........10; 21; 32; 46; 81; 93; 117Gibson.................................................6Glenberg............................................10Grenzwertmethode.............................55Gumz...............................................131Gunter................................................92Guttman............12; 14; 18f; 46; 54; 57;

..............................59f; 65; 120; 123f

HHaber...........................................5; 119Habers..................................................5Habituation..................................83; 84Handlung...........................................10HiFi...................................................15Hillyard............................................104Hitch....................................................8Hochpaßrauschen............19; 41-45; 122holistische Verarbeitung............35f; 122Horn.................................................109

IIEEE................................................137

Ikone................................5; 11; 64; 119implizites Gedächtnis........10; 113f; 120Informationsverarbeitung......5f; 10; 12;

.. . .45; 78; 89; 106; 111; 114; 116; 119Infra-Tonhöhe.............................13; 19fInnenohr.....................................16; 133Interferenz...............10; 12f; 20; 53; 85;

......................106-110; 113; 115; 129interindividuelle Unterschiede....34; 44;

..............................................71; 128

JJulesz. . .12; 14; 18f; 46; 54; 57; 59f; 65;

....................................120; 123; 124

KKaernbach..........................................49Kapazität. . .5; 51; 59; 63ff; 68; 70f; 73f;

.....................76ff; 83; 85ff; 106-114;

..........................116f; 120; 124f; 130Kaufman...........................................111Klickfolge.............................18f; 24; 30Knuth........................................16; 136fKode.........7; 17f; 48; 63f; 78; 109; 116;

............................................119; 125Komodulation.............................46; 123Konfidenzintervall............................76fKonsonanten.......................................11Konstanzmethode...............................55konvertieren...............................23; 138Kurzzeitgedächtnis 5; 7-10; 13f; 53; 63f;

........77; 81; 85; 107f; 110f; 116; 119Kurzzeitspektrum...............................46

LLadefoged..........................................20Langner..............................................49Langzeitgedächtnis.........7f; 13; 63; 86;

.....................................110; 116; 119

168

Lautheit..............................................11Lautstärke......................................8; 81Lebensdauer. . .8; 13; 51; 53f; 63ff; 77ff;

.............85; 108; 111f; 120; 123f; 130Limbert.....................19f; 21; 27; 34; 46Listenlernen..............................12f; 119lokale Verarbeitung.........34; 36; 40; 115Lu.........................................8; 116; 119Lutfi...................................................19

MMacKay......................................48; 111Marcus...............................................32Mattheson........................................131MEG.....................................8; 116; 119Mehrspeichermodell............5f; 116; 119Merkmalsdetektoren...........51; 113; 126Michel..............................................111Miller.................................................63Milroy................................................19missing fundamental..........................18Modalität..........................................104Monotonität......................................56fMoore................................................44Murdock.............................13; 108; 116Musterverarbeitung............................35Muttersprache...............22f; 32; 34; 121

NNationalität...............................23; 121fNationalitätengruppe..........................23Neisser..............................5; 11; 64; 119

OObertöne....................................18; 135Obusek...............................................20Oktavband..............................19; 44; 46omission......................98-103; 105; 111Opher...............................................109Oszillatoren......................................109oversampling......................................47

PPASCAL..........................................137Patterson................................19; 21; 34Peking........................................23; 121perceptual learning...........................112Periodotopie.......................................49Persistenz............................11; 114; 119Pollack..............................................19fpräattentive Verarbeitung..........109; 117Preusser................................20; 35; 113priming..........81; 92; 111-114; 116f; 129Primzahl.........................................136fPrismenbrille....................................112Puretz.................................................19

RRaij..................................................111Reaktionszeit.............................88; 112fRedundanz...................................64; 78rehearsal..............................54; 107-110Repräsentation.10; 13f; 49; 66; 77; 107;

..............................109; 111; 113-116Restaktivierung. . .87; 105; 107; 110; 127Retentionsintervall.............................20Ritter................................................103Roediger............................................10Roscher............................................112Rostron.............................................115Roth.................................................112Ruchkin............................................103

SSchacter.............................................10Schmidt..............................................31Schneider..................................6-9; 119Schröger.....................................92; 115Schubert.............................................20Schwelle. . .51; 53f; 58; 85f; 99; 110; 117Selbsterregungsprozeß........................61semiperiodisches Rauschen........81; 83;

............88-95; 98; 121; 126; 128; 135Shepard............................................108

169

Shiffrin......................................5-9; 119Signaldetektionstheorie........67; 77; 98ffSignalentdeckungstheorie.................100Simulation............................69; 72; 100Singularität.......................................35fSpektrogramm.....36; 41; 45-50; 88; 123Sperling.............5; 61; 64; 109; 114; 119Spurzerfall........8; 20; 54; 78; 108; 114;

............................................119; 125Steradian............................................64Störaufgabe..................................53; 82stream................................................20Suffixeffekte...............................12; 119Sulzer.................................................61Synchronisation....................11; 30; 109Szenenanalyse....................................44

TTeilbericht......................5; 12f; 64; 114fTonhöhe......................................12; 18fTraining......13; 30; 38; 43; 54; 57; 58ff;

........70; 74; 82; 91; 93; 96; 123f; 127Treisman..................8; 12; 84; 112f; 115Tulving..............................................10

UUnterschiedsschwelle.........................20Uusitalo...............................................8

VVergessenskurve.................................53Vollbericht........................................109Vorbereitungsmodell.................87; 107fVorberg.............................................115vorbewußt...............................109f; 129vorsemantisch....................................83Vorwärtsmaskierung...........................12

WWahrnehmungserleichterung...111ff; 116Warren...............13; 19f; 35; 41; 54; 123Watkins..............................................12wavelet.............................................48fWest...................................................20Williamson.......................................111Wrightson..........................................19

ZZahlenwahrnehmung..........................17Zeitordnungsgedächtnis......................60Zufallsklickfolgen..............................20Zufallspunktemuster.....................48; 64Zufallszahlen............16; 23; 37; 54; 93;

......................121; 131; 133; 135-138Zufallsziffern....................................135Zwislocki...........................................12

170