67
Reden, um das Schlimmste zu verhindern Im Anfang war das Wort? „Ist zwar verständlich, aber …“ Verwaltungssprache: Mangelnde Verständlichkeit und Akzeptanz Warum ist UNTER schwieriger als AUF? So wird das Puzzle gelöst! Die Wirkung von Multimedia-Präsentationen auf die Informationsverarbeitung Von „Kiddies“ bis zu „Über-50-Jährigen“ Wenn Schreiber über ihren Adressaten sprechen Warum haben es „Schnellsprecher“ schwerer? Zeig mir, was du von mir willst!“ Gesten für natürliche Kommunikation zwischen Mensch und Maschine „Guck mal, wer da spricht!“ Aufmerksamkeitssteuerung für mobile Roboter Wie finden Roboter ihre Wege in einer unbekannten Welt? Sprache, Computer, Roboter Graduiertenkolleg Aufgabenorientierte Kommunikation 25/2003 an der U niversität Bielefeld F orschung Universität Bielefeld

Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

Reden, um das Schlimmste zu verhindern

Im Anfang war das Wort?

„Ist zwar verständlich, aber…“Verwaltungssprache: MangelndeVerständlichkeit und Akzeptanz

Warum ist UNTER schwieriger als AUF?

So wird das Puzzle gelöst!Die Wirkung von Multimedia-Präsentationenauf die Informationsverarbeitung

Von „Kiddies“ bis zu „Über-50-Jährigen“Wenn Schreiber über ihren Adressaten sprechen

Warum haben es „Schnellsprecher“ schwerer?

„Zeig mir, was du von mir willst!“Gesten für natürliche Kommunikationzwischen Mensch und Maschine

„Guck mal, wer da spricht!“Aufmerksamkeitssteuerung für mobile Roboter

Wie finden Roboter ihre Wege in einerunbekannten Welt?

Sprache, Computer, RoboterGraduiertenkolleg Aufgabenorientierte Kommunikation

25/2003

an der Universität Bielefeld

Forschung

Universität Bielefeld

Page 2: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

Inhalt

Forschung an der Universität Bielefeld 25/2003

Sprache, Computer, Roboter

S.2Dieter Metzing,Franz Kummert

Reden, um das Schlimmste zu verhindern: Die Struktur von Gesprächen bei Flugkatastrophen

S.4 Claudia Sassen

Im Anfang war das Wort?

S.9Eva Belke,

Mathias RehmEmpirische Studien zur Interaktion von Sprache und Wahrnehmung

Aufgabenorientierte Kommunikation in Sprachwissenschaft und Informatik

Warum ist UNTER schwieriger als AUF?

S.20 Katharina J. RohlfingEine Studie zum Verständnis von Präpositionen im Spracherwerb

So wird das Puzzle gelöst!

S.25 Ying-Hua Guan

Die Wirkung von Multimedia-Präsentationen auf die Informationsverarbeitung

„Ist zwar verständlich, aber…“

S.15Kerstin GrönertVerwaltungssprache: Mangelnde Verständlichkeit und Akzeptanz als

Barrieren in der Kommunikation zwischen Verwaltung und Bürgern

Page 3: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

1Forschung an der Universität Bielefeld 25/2003

Inhalt

AbstractsS. 61

Von „Kiddies“ bis zu „Über-50-Jährigen“Wenn Schreiber über ihren Adressaten sprechen

S. 29 Kirsten Schindler

„Zeig mir, was du von mir willst!“

S. 42 Christian LangeGesten für natürliche Kommunikation zwischen Mensch und Maschine

„Guck mal, wer da spricht!“

S. 48 Sebastian LangAufmerksamkeitssteuerung für mobile Roboter

Warum haben es „Schnellsprecher“ schwerer?

S. 35Vivian Raithel,

Britta Wrede

Untersuchungen zur automatischen Spracherkennung und zum aphasischen Sprachverständnis

Wie finden Roboter ihre Wege in einer unbekannten Welt?

S. 54 Dmitry Lebedev

Aufgabenorientierte Exploration in der Robotik mit Hilfe neuronaler Netze

Page 4: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

2 Forschung an der Universität Bielefeld 25/2003

Die Beiträge dieses Forschungsmagazins führen unterdem Titel „Sprache, Computer, Roboter – Aufgaben-orientierte Kommunikation in Sprachwissenschaftund Informatik“ exemplarisch in aktuelle Forschungs-bereiche aus Linguistik (Computerlinguistik, Experi-mentelle Phonetik, Kommunikationsanalyse, Psycho-linguistik) und Informatik (Angewandte Informatik,Neuroinformatik) ein. Jeder der zehn Beiträge ist miteinem speziellen Forschungsfeld verbunden und gibteinen Einblick in ein Promotionsprojekt, durchgeführtim interdiziplinären Graduiertenkolleg der DeutschenForschungsgemeinschaft „AufgabenorientierteKommunikation“, ein Verbund von Doktoranden, dieihre Arbeiten unter einem gemeinsamen Oberthemaund in engem Austausch untereinander und mitihren Betreuern anfertigen. Weitere Informationendazu unter: www.techfak.uni-bielefeld.de/GK256/.

Bezogen auf unterschiedliche Aufgabenszenarienund Akteure – Personen in unterschiedlichen Rollenoder Computer und Roboter – werden zentraleAspekte von Kommunikation und deren (multimo-dales/multimediales) Zusammenwirken untersucht:Sprache (Spontansprache, kontrollierte Sprache,optimierte Gebrauchstexte), Wahrnehmung (Gesten,Mimik, Körperhaltung, visuelle und taktile Perzeption)und Handlung (Aufmerksamkeitssteuerung, Hand-lungssteuerung, soziale Interaktion und Kooperation).

Die Beiträge dieses Forschungsmagazins sind einBeispiel für Forschungen unter Bedingungen einesGraduiertenkollegs an der Universität Bielefeld. Dasbedeutet:

Auswahl besonders qualifizierter Kollegiaten undgeeigneter innovativer Forschungsthemen.

Entwicklung von Einzelforschung und Eigen-initiative im Kontext von Kollegiatengruppen undForschungsteams eines aktiven lokalen Forschungs-umfelds (u.a. Leibniz-Preisträger in der Neuroinfor-matik).

Sonderforschungsbereich der Deutschen For-schungsgemeinschaft (DFG) und DFG-Forscher-gruppe (www.sfb360.uni-bielefeld.de/ undwww.coli.lili.uni-bielefeld.de/Texttechnologie/Forschergruppe/).

Interdisziplinarität zur Kombination unterschied-licher Sichten und Methoden angesichts komplexerForschungsaufgaben, damit an DisziplingrenzenNeues entstehen kann.

Partizipation an der internationalen Forschungs-entwicklung und Präsentationen von Ergebnissen der

Sprache, Computer, Roboter

Aufgabenorientierte Kommunikationin Sprachwissenschaft und Informatik

Dieter MetzingFranz Kummert

Prof. Dr. Franz Kummert, Technische Fakultät,stellvertretender Sprecher des Graduiertenkollegs„Aufgabenorientierte Kommunikation“.

Prof. Dr. Dieter Metzing, Fakultät für Linguistik und Literaturwissenschaft, Sprecher des Graduierten-kollegs „Aufgabenorientierte Kommunikation“.

Page 5: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

3Forschung an der Universität Bielefeld 25/2003

Promotionsprojekte der Stipendiaten auf Fachtagun-gen sowie in einer breiteren Öffentlichkeit. Letzteresist auch ein besonderes Anliegen der UniversitätBielefeld als Teil des immer wichtiger werdenden„Public Understanding of Science and Humanities“.

Wie aus diesem Forschungsmagazin hervorgeht,werden einige der an der Universität Bielefeld mitder Promotion abgeschlossenen Forschungen inanerkannten Forschungszentren in Deutschland,Großbritannien und den USA fortgesetzt. Die zahl-reichen Graduiertenkollegs und neuerdings mehrereInternational Graduate Schools an der UniversitätBielefeld sind ein wichtiger Schritt zu einem flächen-deckenden geordneten Promotionsstudium, wie esdie Universität als eine der ersten in Deutschlandanstrebt.

Dass die Beiträge zu den Promotionsprojekten desGraduiertenkollegs „Aufgabenorientierte Kommuni-kation“ jetzt im Forschungsmagazin erscheinen, isteiner Konstellation schwer wiederholbarer Faktorenzu verdanken: den herausragenden Leistungen undInitiativen der Stipendiaten, den produktiven undunterstützenden Forschungsaktivitäten beteiligterHochschullehrer und nicht zuletzt der Unterstützungdurch die beteiligten Fakultäten.

Mitglieder und Dozenten des Graduiertenkollegs„Aufgabenorientierte Kommunikation“.

Page 6: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

4 Forschung an der Universität Bielefeld 25/2003

Reden, um das Schlimmste zu verhindern: Die Struktur von Gesprächen bei Flugkatastrophen

Claudia Sassen

Kommunikation kann über Lebenund Tod entscheiden. Eine beson-dere Rolle kommt dabei Prozessender Verständnissicherung zu, inder Fachsprache auch uptakesecuring genannt: eigentlich eineganz einfache Form der Kommu-nikation, die sich in Verständnis-frage(n) und deren Klärunggliedert. In Krisensituationen, wiesie sich beispielsweise Sekundenvor Flugzeugabstürzen abspielen,ist eine hohe Anzahl von Ver-ständnisfragen zu beobachten.Diese enden jedoch oft im Nichts– von den anderen Gesprächs-partnern in all der Panik ignoriert.Dabei hätte manche Flugkatas-trophe durch eine funktionierendeKommunikation verhindert wer-den können.

Abbildung 1: Bislang der einzige Unfall der Lufthansa: Die „Kulmbach“ auf dem Flughafen Warszawa-Okecie,nachdem sie auf einen künstlichen Hügel geprallt war.

Abbildung 2: Vier Monate vor dem Unglück: Die „Kulmbach“ im Mai 1993.

Page 7: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

5Forschung an der Universität Bielefeld 25/2003

Zweifelhafte Flugsicherheit

Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen,einer Folge des 11. September, ist auf lange Sicht ein kontinuierlicher Anstieg an Flugaufkommen zuerwarten. Und trotz steigender Beliebtheit gibt dieNutzung von Flugzeugen Anlass zur Sorge. Ökonomieeinerseits und Flugsicherheit andererseits müssenoptimiert werden, doch scheinen sich diese Forde-rungen zu widersprechen: Eine größere Flugdichte,verkürzte Trainingsphasen für Piloten wie für Flug-lotsen, eine Halbierung des Flugabstandes mögenzwar die Kosten für die Gesellschaften senken,jedoch geht dies zu Lasten der Sicherheit. EineVerkürzung der Kommunikation beschleunigt aufden ersten Blick den Austausch zwischen Cockpitund Tower, außerdem senkt sie die Netzlast im Funk-verkehr, doch die Verständigung leidet, und das kannkatastrophale Folgen haben.

Die Autorin hat in ihrer Dissertation untersucht,wie wichtig eine präzise und reibungslose Kommuni-

kation im Flugverkehr ist, sei es in Routine- oder inNotsituationen. In diesem Rahmen sind Typen von Sprechhandlungen formal analysiert und zurErstellung einer Diskursgrammatik herangezogenworden.

Untersuchungsschwerpunkt und Daten

Das Datenmaterial für die Untersuchung liefertenTranskripte so genannter Cockpit Voice Recordings(CVRs), also von Gesprächsaufzeichnungen aus demCockpit. Diese Aufzeichnungen stammen aus Flug-datenschreibern und wurden von speziell dazuausgebildeten Transkripteuren erstellt. CVRs doku-mentieren akustische Ereignisse wie Sprache oderMaschinengeräusche, die in den Minuten vor demAbsturz im Cockpit stattfinden. Wie man den Aufzeichnungen entnehmen kann, treten Krisen-gespräche vornehmlich beim Abflug oder bei derLandung auf; denn das sind die gefährlichstenPhasen.

CAM-3 I cant see it, it s pitch dark and I

throw the little light I get ah nothing

23.41:31 CAM-4 Wheel-well lights on?

CAM-3 Pardon?

CAM-4 Wheel-well lights on?

CAM-3 Yeah wheel well lights always on if the

gear s down

CAM-1 Now try it

23.41:40 APP Eastern, ah 401 how are things

comin along out there?

23.41:44 RDO-1 Okay, we d like to turn around and

come, come back in

CAM-1 Clear on left?

CAM-2 Okay

23.41:47 APP Eastern 401 turn left heading one

eight zero

23.41:50 CAM-1 Huh?

23.41:51 RDO-1 One eighty

23.42:05 CAM-2 W e did something to the altitude

CAM-1 What?

23.42:07 CAM-2 W e re still at two thousand right?

23.42:09 CAM-1 Hey, what s happening here?

CAM [Sound of click]

23.42:10 CAM [Sound of six beeps similar to radio

altimeter increasing in rate]

23.42:12 [Sound of impact]

Ein kritischer Moment: Ausschnittaus einem Transkript so genannterCockpit Voice Recordings „CVRs“(Absturz des Eastern Air Lines-Fluges vom 29. Dezember 1972).Das Transkript dokumentiert, was in den kurzen Augenblicken, die der Crew noch vor dem Absturzblieben, auf Gesprächsebenegeschah. CAM = Cockpit Area Microphone,CAM-1 = Pilot, CAM-2 = Copilot,CAM-3 = Navigator, CAM-4 = unbenannt, APP = Tower(Approach), RDO-1 = Funkspruchaus dem Cockpit (Pilot).

Page 8: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

6 Forschung an der Universität Bielefeld 25/2003

Flugkommunikation als kontrollierte Sprache

Flugkommunikation findet in einer kontrolliertenSprache statt, insofern sie im Normalfall bestimmtenRegeln folgt. Kommt es zu unvorhersehbarenSituationen, sind Abweichungen von diesen Regelnund damit von der Grammatik der kontrolliertenSprache zu beobachten: Krisengespräche liegen vor.Für die Flugkommunikation gilt: Weicht die Crewvon bestimmten Kommunikationsregeln ab, erhöhtein solches Verhalten die Wahrscheinlichkeit einerKrise. So entsteht aus einer Krise und der ihr folgen-den Verletzung von Kommunikationsregeln einTeufelskreis.

Krisengespräche und Nicht-Krisengespräche im Vergleich

Aus den Untersuchungen leiten sich folgende Tenden-zen ab: Krisengespräche verfügen über komplexereMuster als Nicht-Krisengespräche. Die Gesamtzahlder Verständigungsprozesse steigt in Krisengesprächendeutlich an, gleichzeitig ist das Vorkommen an „nicht-terminierten“ (= abgebrochenen) Verständigungs-prozessen höher als in Nicht-Krisengesprächen. InKrisengesprächen kann man außerdem eine höhereZahl an Iterationen (=identische Wiederholungen)von Befehlen und Fragen feststellen. Nicht-Krisen-gespräche verfügen ebenfalls über Iterationen,jedoch nicht in einer vergleichbar hohen Frequenz.Schließlich lässt sich in Krisengesprächen einegrößere Anzahl an Tabuausdrücken (Kraftausdrückeu.ä.) sowie Warnungen nachweisen, wobei dasAufkommen an Höflichkeitsformeln deutlich sinkt.

Abb. 3: Unverzichtbare Helfer: In der so genannten Black Box befinden sich der Flugschreiberund der Cockpit Voice Recorder (Stimmrekorder). Durch sie bekommt man Aufschluss überbestimmte technische Daten des Flugzeugs und die Kommunikation. Vielfach lässt sich an ihrenAufzeichnungen ein Hinweis auf die Ursachen von Flugzeugabstürzen ablesen. Das Foto zeigt denStimmrekorder des Alaska Airlines-Fluges, der am 31. Januar 2000 in den Pazifik stürzte. Der Rekorder wird vom Roboterarm eines Suchgerätes gehalten.

Page 9: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

7Forschung an der Universität Bielefeld 25/2003

Korrelation von Flugsicherheit und Kommunikation

Die Einhaltung bestimmter Regeln kann Sicherheitund Umgang mit lebensbedrohlichen Situationenpositiv beeinflussen. Bestes Beispiel: das Flugunglückder Lufthansa in Warschau vom 14. September1993. Die Crew des Fluges DLH 2904 wurde vomTower vor Scherwind gewarnt, einer sehr gefähr-lichen Form von Böen, die in Bodennähe auftreten.Der Scherwind, so hieß es, werde fast frontal auf dieMaschine zukommen. Die Crew erhöhte infolgedes-sen die Anfluggeschwindigkeit. Wie sich allerdingswenige Sekunden vor der Landung zeigen sollte,wurde die Maschine vom Scherwind in Flugrichtunggetroffen. Das Flugzeug bekam auf diese Weiseeinen enormen Schub von hinten und raste mit über-höhter Geschwindigkeit auf einen Hügel am Rollbahn-ende zu. Den Piloten war es jedoch gelungen, aufdiese unvorhersehbare Situation so zu reagieren, dasseine größere Katastrophe verhindert werden konnte.Ein Aufprall ließ sich zwar nicht vermeiden, doch war

er durch die schnelle Reaktion der Crew entschei-dend abgemildert worden. Erreicht wurde dies durcheine durchweg präzise, professionelle Kommuni-kation, durch die Verständigungsprobleme gelöstwurden und die Handlungsfähigkeit optimiertwerden konnte.

Im Gegensatz dazu bietet das Transkript desAbsturzes bei Nagoya vom 26. April 1994 ein kom-munikatorisches Horrorszenario: ein auszubildenderCopilot sollte seine erste Landung fliegen. Wie sichschon recht früh in der Kommunikation zwischenPilot und Copilot abzeichnete, war der Copilot nichtimstande, den Anweisungen seines Vorgesetzten zufolgen. Wies der Pilot ihn an, das Tempo wegeneines vorauffliegenden Flugzeuges zu drosseln, soging der Copilot nicht darauf ein, sondern konzen-trierte sich auf für die Flugsicherheit völlig irrelevanteDinge, wie den Flugzeugtyp, den er vor sich hatte.Der Absturz kam letztlich dadurch zustande, dass der Copilot versehentlich den Autopiloten aktivierthatte und ihn trotz wiederholter Anweisungen nichtwieder ausschaltete.

2117:20 RDO-?: Avianca zero five two, one four zero knots.

2117:25 CAM-1: they was asking for the American.

2117:30 TWR: Avianca zero five two, can you increase

your airspeed one zero knots?

2117:40 CAM-1: One zero.

2117:41 RDO-?: Okay, one zero knots, increasing

2117:42 TWR: Increase, increase!

2117:42 CAM-1: What?

2117:44 RDO-?: Increasing

2117:45 CAM-1: What?

2117:46 TWR: Okay

2117:46 CAM-3: Ten knots more.

. . . . . .

2117:48 CAM-1: One hundred and fifty.

2117:52 CAM-1: Here we go.

2117:55 CAM-1: Tell me things louder, because I m not

hearing it.

Muster, die immer wieder auftreten: Kommt es in der Flugkommunikation zu Krisen,steigt die Zahl an Wort- und Äußerungswiederholungen deutlich an. Zudem tretenmassiert Verständnisfragen auf, die oft unbeantwortet bleiben. Das Transkript zeigteinen Ausschnitt aus dem Avianca-Flug 052 vom 25. Januar 1990 vor dem Absturz derMaschine mangels Treibstoff.CAM-1 = Pilot, CAM-3 = Navigator, RDO-? = Funkspruch aus dem Cockpit (nichtidentifizierter Sprecher), TWR = Tower.

Page 10: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

Fehlende Kooperation der Behörden

Auch in Situationen, in denen die Kommunikationfunktioniert, wird den Piloten oft die Schuld anUnfällen zugeschrieben. Für eine tiefergehendeAnalyse, die die Piloten eindeutig entlasten könnte,reichen die vorhandenen Transkripte jedoch nichtaus. Frei zugängliche Transkripte gibt es mittlerweilegenug, allerdings lässt sich nicht feststellen, wiegenau die Transkripteure es mit der Verschriftung derTonbänder genommen haben. Vermutungen zufolgewerden die Transkripte nur so weit ausgearbeitet,wie sie für einen Nachvollzug der Handlungen imCockpit erforderlich sind. Die Originalquellen, sprichdie Bänder aus der Black Box nebst Kopien, werdenvon den Behörden immer noch streng unter Ver-schluss gehalten. Für eine optimale sprachwissen-schaftliche Untersuchung der Flugsprache aufmögliche Teilursachen, die zu einem Absturz geführthaben könnten, ist der Rückgriff auf die Original-aufnahmen jedoch unerlässlich. Bleibt also zu hoffen,dass die Verantwortlichen diese Dokumente derWissenschaft bald zur Verfügung stellen werden.

Tipps zur weiteren Lektüre

Umfangreiche Sammlungen von Absturzprotokollen,Transkripten und Bildmaterial gibt es unterhttp://aviation-safety.net/index.shtml,http://www.airsafetyonline.com/ sowie unterhttp://www.airdisaster.com/

Claudia Sassen studierte von 1990 bis 1996an der Universität Bielefeld die Lehramts-fächer Biologie und Englisch. In ihrer Disser-tation befasste sie sich mit Krisengesprä-chen, speziell im Kontext vonFlugkommunikation. Von Juli 2001 bisApril 2002 war sie Mitglied imGraduiertenkolleg „AufgabenorientierteKommunikation“. Seit Herbst 2002 ist siewissenschaftliche Mitarbeiterin am Institutfür deutsche Sprache und Literatur derUniversität Dortmund. Claudia SassensForschungsschwerpunkte liegen im Bereichder Korpuslinguistik, Dialogtheorie sowieComputerlinguistik.

8 Forschung an der Universität Bielefeld 25/2003

Page 11: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

9Forschung an der Universität Bielefeld 25/2003

Fragestellung

In der ersten Hälfte des vorigen Jahrhunderts nahmman an, dass die Sprache das Denken bestimme unddass Sprecher unterschiedlicher Sprachen die Weltdaher unterschiedlich wahrnehmen. Diese These hatsich in dieser Radikalität in der wissenschaftlichenDiskussion langfristig nicht durchgesetzt. Auch diegegenteilige Position, dass sprachliche Ausdrucks-möglichkeiten allein durch das Denken festgelegtseien, ist umstritten. Wissenschaftler aus unter-schiedlichen Disziplinen wie Philosophie, Sprach-wissenschaften oder Psychologie machen sich daherzunehmend Gedanken über die Art der Interaktionsprachlichen Wissens und kognitiver Fähigkeiten, wiesie sich insbesondere in der Wahrnehmung der Weltausdrücken. Einflüsse der Sprache auf das Denkenund die Wahrnehmung zeigen sich hauptsächlich inder Rezeption von Sprache; Einflüsse des Denkensund der Wahrnehmung auf die Sprache eher in derProduktion von Sprache.

Im Anfang war das Wort?

Empirische Studien zur Interaktionvon Sprache und Wahrnehmung

Eva Belke undMathias Rehm

Seit langem beschäftigen sich Philo-sophen, Sprachwissenschaftler undPsychologen mit den Zusammenhän-gen zwischen Sprache, Wahrnehmungund Denken. Jüngere Ergebnissepsycholinguistischer Grundlagen-forschung zur Raumwahrnehmungweisen auf eine Prägung der Wahr-nehmung durch das in einer Spracheverwendete System des Bezugs aufden Raum, das räumliche Referenz-system, hin. Gleichzeitig beziehen sich viele sprachliche Äußerungen aufEreignisse in der Welt, sie sind alsodurch das Wahrnehmungserlebnisgeprägt. Beide Aspekte werden imRahmen von zwei Dissertations-projekten des Graduiertenkollegsbeleuchtet, die zwar in unterschied-lichen Forschungszusammenhängenanzusiedeln sind, aber letztlich aufdieselbe Frage abzielen: Wie hängenSprache und Wahrnehmung zu-sammen? Und: was kam zuerst?

Eine Versuchsperson am Eye-Tracker (siehe auch Abbildung 4 auf Seite 13).

Page 12: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

10 Forschung an der Universität Bielefeld 25/2003

Wie beeinflusst die Rezeption von Sprache die Wahrnehmung der Welt? Das Beispiel „Räumliche Relationen“ und der Spracherwerb

Ein Bereich, der sich besonders gut zum Nachweisvon Einflüssen der Sprache auf die Wahrnehmungder Welt eignet, sind räumliche Referenzen, dieprinzipiell in allen Sprachen vorkommen. Mit einerräumlichen Referenz wird ein Objekt in der Weltsprachlich lokalisiert, z.B. „Die Tasse steht rechts vomMonitor“. Durch die Untersuchung vieler verschiede-ner Sprachen ermittelten Forscher am Max-Planck-Institut für Psycholinguistik in Nijmegen, dass es an-scheinend mehrere grundlegend verschiedene Artengibt, eine solche Referenz zu realisieren, nämlichrelativ, absolut und intrinsisch. Besonders interessantsind in diesem Zusammenhang so genannte relativeund absolute Systeme der Raumreferenz.

In relativen räumlichen Referenzen wird ein Ob-jekt zu einem anderen in Beziehung gesetzt, indemman ein weiteres Objekt als Bezugspunkt verwendet,das allerdings nicht unbedingt explizit genannt wer-den muss. Eine Äußerung wie „Die Tasse steht rechtsvom Monitor“ meint daher immer „rechts in Bezugauf mich/dich/etc.“. Ist die Äußerung beispielsweiseauf mich bezogen, ergibt sich folgendes Phänomen:Bewege ich mich auf die andere Seite des Tisches,ändert sich damit auch meine Äußerung, zumBeispiel in „Die Tasse steht links von der Tastatur“(vgl. Abb. 1). Absolute Referenzsysteme bieten eineganz andere Lösung für diese Aufgabe räumlicherReferenz an. Hier ist der Bezugspunkt unveränder-lich (absolut) und oft in der Umwelt verankert. Ein Paradebeispiel eines absoluten Systems ist dieVerwendung von Kompassrichtungen. In diesem Fallwürde die obige Äußerung lauten „Die Tasse stehtnördlich der Tastatur“, und auch wenn ich mich umden Tisch herumbewege, ändert sich die Äußerungnicht. Im Deutschen findet sich ein solches absolutesSystem nur im Zusammenhang mit geographischenLagebeschreibungen, im Allgemeinen wird einrelatives System verwendet. Es existiert aber aucheine Reihe von Sprachen, die absolute Systeme fürÄußerungen im Nahbereich verwenden. Dabei musses sich nicht immer um Kompassrichtungen handeln.Möglich sind auch Relationen wie bergauf-bergab,Richtung Sonnenauf- oder -untergang, landeinwärts-seewärts.

In empirischen Experimenten zeigte sich, dass dieArt und Weise, wie eine Sprache räumliche Referen-zen kodiert, auch Auswirkungen darauf hat, in wel-cher Weise Sprecher dieser Sprache nicht-sprachlicheHandlungen ausführen. Damit gibt es erste empi-rische Nachweise einer Interaktion linguistischer und

Abbildung 1: Unterschiedliche Rahmen räumlicher Referenzen führen zuunterschiedlichen Beschreibungen derselben Situation.Äußerungen eines relativen Referenzrahmens sind abhän-gig vom Standpunkt und der Ausrichtung des Sprechers.Die obere Szene wird daher mit „Die Tasse steht links vonder Tastatur“, die untere mit „Die Tasse steht rechts vonder Tastatur“ beschrieben. Ein absoluter Referenzrahmenwürde hier keinen Unterschied machen, zum Beispiel „Die Tasse steht nördlich der Tastatur“.

Page 13: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

11Forschung an der Universität Bielefeld 25/2003

kognitiver Fähigkeiten. Wenn dem aber so ist, stelltsich die Frage, wie sich diese Interaktion währenddes Prozesses des Spracherwerbs und für die Wahr-nehmung (Kategorisierung) der Welt auswirkt. Umdieser Frage nachzugehen, bediente sich MatthiasRehm in seiner Dissertation des Computers. Grund-legende Idee war die folgende: Der Erwerb unter-schiedlicher Kategorien, wie sie in den verschiedenenSprachsystemen realisiert sind, sollte auf dem Rech-ner modelliert werden. Hierzu griff Rehm auf ein an der Universität Bielefeld von Jan-Torsten Mildeentwickeltes Simulationssystem zurück. In diesemSystem bewegen sich menschlich aussehendeFiguren, so genannte Agenten, durch eine komplexedreidimensionale Umwelt (vgl. Abb. 2). Sie besitzenverschiedene Sensoren, die es ihnen zum einenerlauben, die Umwelt visuell wahrzunehmen, zumanderen sprachliche Eingaben zu empfangen. Zieldieses Systems „Lokator“ ist es nun, durch dieVerwendung der dreidimensionalen visuellen und dersprachlichen Eingaben Kategorien aufzubauen, diesowohl mit den visuellen als auch mit den sprach-lichen Eingaben konsistent sind.

Mit dem System wurde eine Reihe von Simulatio-nen ausgeführt, die alle nach dem gleichen Schemaabliefen. Ein Agent bewegt sich selbstständig durchdie Umwelt, nimmt diese dabei visuell wahr underhält zusätzlich von Zeit zu Zeit eine sprachlicheEingabe. Diese wird entweder auf Deutsch (relativesSystem) oder auf Marquesan (absolutes System)gegeben. Marquesan ist eine polynesische Sprache,die von Gabriele Cablitz am Max-Planck-Institut inNijmegen im Rahmen ihrer Dissertation untersuchtwurde. Eine Beispieleingabe auf Deutsch ist: „DerBrunnen steht rechts des Zaunes.“ Auf Marquesanwürde diese Relation dagegen lauten: „Ena te punavai ma tai o te papua“ („Der Brunnen steht seewärtsdes Zaunes“).

Als grundlegendes Ergebnis der durchgeführtenSimulationsexperimente lässt sich festhalten, dass esmit dem vorgeschlagenen Modell zunächst prinzipiellmöglich ist, konsistente Kategorien aufzubauen.Während des Erwerbsprozesses interagieren dabeisprachliche und sensorische/visuelle Eingaben, sodass die gesamte zur Verfügung stehende Paletteunterschiedlicher Eingabemodalitäten verwendetwird. Die erzeugten Kategorien erlauben eine spezi-fische Wahrnehmung der Welt, die konsistent mitden in den sprachlichen Eingaben gefundenen Struk-turierungen ist. Durch den Vergleich der Konzepteverschiedener Agenten, insbesondere von Agenten,die unterschiedliche sprachliche Eingaben erhielten,ließen sich zudem die Merkmale ermitteln, die in denunterschiedlichen Strukturierungen relevant sind.

Dabei ist von entscheidender Bedeutung, dass dieeinzelnen Agenten gerade durch die Interaktion von sprachlichen und sensorischen Eingaben in dieLage versetzt wurden, selbstständig relevanteMerkmale zu kreieren. Insofern können dieseErgebnisse als Beispiel für eine starke Prägung derWahrnehmung der Welt durch die sprachlicheKodierung der Gegebenheiten in der Welt gewertetwerden. Sprache hat also einen wichtigen Einflussauf unsere Wahrnehmung.

Wie aber lassen sich diese im Zusammenhang mit Sprachproduktionsprozessen einordnen? DieBenennung eines Objekts beispielsweise setzt dieWahrnehmung des benannten Objektes voraus –bedeutet dies, dass die Wahrnehmung die Sprachedominiert?

Abbildung 2: Eine Beispielszene aus Lokator. Der Agent erforscht seine Umwelt. Im Hintergrund ist ein Berg zu sehen, der im absoluten System als Bezugspunkt für räumlicheBeschreibungen dient.

Page 14: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

12 Forschung an der Universität Bielefeld 25/2003

Wie beeinflusst die Wahrnehmung der Welt den sprachlichen Ausdruck?Das Beispiel „Überspezifikationen“

Eine der zentralen Funktionen von Sprache liegt inihrem Bezug auf Objekte in der Umwelt. Häufigerfordern Situationen, in denen über eins von meh-reren Objekten gesprochen werden soll, eine ausführ-liche Benennung dieses Objekts, die an den Kontextangepasst ist. So müsste ein Objekt aus Abbildung 3entweder durch eine räumliche Beschreibung (etwa:„das Objekt unten rechts“) oder durch die Beschrei-bung seiner Eigenschaften (etwa: „das große grüneDreieck“) benannt werden, um eindeutig daraufBezug zu nehmen und den Objektnamen für dasweitere Gespräch verfügbar zu machen.

In der experimentellen Forschung zur Sprach-produktion werden solche Situationen nachgestelltund Versuchspersonen gebeten, ein Objekt anhandseiner Eigenschaften so zu benennen, dass es einem(fiktiven) Zuhörer möglich wäre, das Zielobjekteindeutig zu identifizieren. Dabei werden bestimmteEigenschaften wie Form, Farbe, Größe oder Längeder Objekte variiert, die die Benennung des Ziel-objektes im Objektkontext determinieren. DieseEigenschaften können relativ sein, was in diesemZusammenhang bedeutet, dass sie ein Referenz-objekt benötigen, anhand dessen die jeweilige Eigen-schaft gemessen werden kann, etwa „das großeDreieck“ – im Vergleich zu einem kleineren Dreieck.Andere Eigenschaften, etwa die Farbe, sind absolut,d.h. sie können ohne Bezug auf ein Referenzobjekt

Abbildung 3: Schematische Darstellung einer Situation, die eine komplexe Objektbenennungin Relation zu den Kontextobjekten erfordert.Im experimentellen Paradigma der „referentiellen Kommunikation“ wird eine Situationnachgestellt, in der ein Sprecher ein Zielobjekt in Relation zu mehreren Kontextobjektenbenennen soll. Die Objekte werden dabei anhand verschiedener Eigenschaften, etwa Größe,Farbe oder Objektklasse, variiert. Anfangs zielte die psycholinguistische Forschung zurreferentiellen Kommunikation vor allem auf die Inhalte der Benennungen ab, die Sprecher inunterschiedlichen Situationen produzieren. Im Zusammenhang mit jüngeren prozessbezoge-nen Forschungsfragen wird dagegen verstärkt untersucht, wie die Prozesse koordiniert sind,die bei der Benennung eines Objektes ablaufen. Während die sprachlichen Codierungs-prozesse, die bei der Benennung einzelner Objekte ablaufen, heute detailliert beschriebenwerden können, gibt es noch vergleichsweise wenig Untersuchungen zur Produktion kom-plexerer Äußerungen in Situationen mit mehreren Objekten. Insbesondere der Zusammen-hang zwischen der visuellen Verarbeitung und sprachlichen Codierungsprozessen ist nochweitgehend unerforscht. Insofern stellt das Paradigma der referentiellen Kommunikation einevielversprechende Erweiterung der bisherigen prozessbezogenen Sprachproduktionsforschungdar.

Page 15: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

13Forschung an der Universität Bielefeld 25/2003

verwendet werden, wie in „das blaue Dreieck“. In der Situation aus Abbildung 3 sind einige derEigenschaften für die Benennung des Zielobjektesnotwendig, andere nicht. Häufig nennt ein Sprecherüber die minimal unterscheidenden Merkmale desZielobjektes hinaus auch Merkmale, die das Ziel-objekt nicht eindeutig vom Objektkontext unter-scheiden (referentielle Überspezifikation). Für die inAbbildung 3 dargestellte Situation würde die Benen-nung „das große grüne Dreieck“ beispielsweise eineÜberspezifikation der Farbe beinhalten – es wäre hierausreichend, nur die Größe zu benennen („das großeDreieck“), um das Zielobjekt eindeutig zu identifizie-ren. Experimentelle Studien zeigen, dass insbesonderedie Farbe in bis zu 80 Prozent aller Äußerungenüberspezifiziert wird.

Aus kommunikativer Sicht sind Überspezifikatio-nen für Hörer sehr nützlich, denn sie erlauben ihnenin der Regel, das Zielobjekt schneller zu identifizieren.Einige Forscher argumentieren daher, dass Sprecherabsichtlich Überspezifikationen produzieren, um die Identifikation des Zielobjektes für die Hörer zuerleichtern. Ob Sprecher derart komplexe Bewer-tungen der Situation überschauen, ist allerdings frag-lich. Vielmehr artikulieren Sprecher eine Objekt-benennung oft schon, bevor sie alle Kontextobjekteangeschaut und ausgewertet haben. Stellt sich imNachhinein heraus, dass die Objektbenennunggeändert werden muss, so werden die sprachlichenPlanungsprozesse entsprechend angepasst. Es ent-steht ein so genannter Nachtrag („das gelbe Hemd –das grosse“) oder eine Reparatur („das gelbe – dasgroße gelbe Hemd“). Diese Phänomene sprechen fürdie Annahme, dass Teilinformationen von der Ebeneder visuellen Verarbeitung schon an sprachliche Ver-arbeitungsstufen weitergegeben werden, obwohl dievisuelle Verarbeitung noch nicht abgeschlossen ist.

In ihrer Dissertation untersuchte Eva Belke in einerExperimentalreihe unter anderem die Entstehungreferentieller Überspezifikationen. Dabei nutzte sieReaktionszeit- und Blickbewegungsmessungen alsMethode, um Einblick zu gewinnen in die visuellenund sprachlichen Prozesse, die bei der Benennungeines Objekts im Objektkontext ablaufen (vgl. Abb.4). Zunächst untersuchte sie anhand von „gleich“-„ungleich“-Entscheidungen die Eigenschaften dervisuellen Prozesse, die bei der Beurteilung von Farb-,Größen- und/oder Objektklassenunterschiedenzwischen Objektpaaren ablaufen. Es ergab sich eindeutlicher Verarbeitungsvorteil für absolute Eigen-schaften (Farbe, Objektklasse) über relative Eigen-schaften (Größe). Dies zeigte sich in einfacherenBlickbewegungsmustern sowie kürzeren Betrach-tungs- und Reaktionszeiten für absolute Eigenschaf-

ten. Dieses Ergebnis kann darauf zurückgeführtwerden, dass absolute Eigenschaften einfach unddirekt beurteilt werden können, ohne einzelneAusprägungen der Eigenschaften im Vergleich zubeurteilen, wie dies bei Größenunterschieden der Fallist. Die Verarbeitung mehrdimensionaler Unter-schiede, etwa in Farbe und Größe, wurde jeweils vonder am leichtesten zu erkennenden Unterschieds-dimension bestimmt. Wie diese Ergebnisse und ande-re Befunde im Paradigma der „gleich“-„ungleich“-Entscheidungen nahe legen, werden Größenunter-schiede in mehrdimensionalen Unterschiedsbeurtei-lungen früh herausgefiltert, Farb- undObjektklassenunterschiede dagegen nicht. Vordiesem Hintergrund ist es möglicherweise wenigeraufwendig, die Farbe des Zielobjektes einfachmitzubenennen, egal ob sie relevant ist oder nicht.Diese Hypothese wurde in einem zweitenExperiment überprüft. Dazu wurden die gleichenStimuli wie im ersten Experiment verwendet und miteiner Benennaufgabe kombiniert. Die Ergebnissezeigen, dass die Versuchspersonen

Abbildung 4: Eine Versuchsperson am Eye-Tracker.Mit Hilfe von Blickbewegungsmessungen kann bei einemExperiment genau registriert werden, in welcher Reihen-folge, wann und wie lange eine Versuchsperson einzelneAusschnitte eines komplexen Stimulus anschaut. Es liegtnahe, dass diese Methode insbesondere zur Untersuchungder Rezeption von Sprache, etwa beim Lesen von Texten,vielfach Verwendung fand und findet. In der prozess-bezogenen Forschung zur Sprachproduktion werden Blick-bewegungsmessungen erst seit wenigen Jahren eingesetzt.Anders als die oft verwendete Methode der Messung vonReaktionszeiten bieten Blickbewegungsmessungen Einblickin die Prozesse, die vor dem Beginn der Artikulationablaufen. Im Paradigma der referentiellen Kommunikationkönnen so etwa die Prozesse, die mit der visuellen Verar-beitung des Zielobjektes verbunden sind, en detail unter-sucht werden. Insbesondere kann die zeitliche Verzahnungder visuellen Analyse und sprachlicher Codierungsprozesseuntersucht werden.

Page 16: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

14 Forschung an der Universität Bielefeld 25/2003

in bis zu 80 Prozent aller Fälle, in denen die Farbe füreine minimale Benennung nicht notwendig war, eineÜberspezifikation produzieren. Die Analyse derBlickbewegungen zeigte in der Benennaufgabe auchweitgehend die oben beschriebenen Charakteristikader visuellen Verarbeitung von Unterschieden zwi-schen Objekten.

Diese Ergebnisse sprechen dafür, dass referentielleÜberspezifikationen einen frühen visuellen, nichtaber einen späten sprachlichen Ursprung haben: Die visuelle Verarbeitung der Unterschiede zwischen Ziel- und Kontextobjekten beeinflusst unmittelbar die Auswahl und Konzeptualisierung des Zielobjektes.Dieser Befund konnte in weiteren Experimenten mit komplexeren Objektkonstellationen bestätigtwerden. Referentielle Überspezifikationen sind alsokein Ausdruck ausgesprochener Hörerfreundlichkeit,vielmehr sind sie Ausdruck der Tatsache, dass visuelleund linguistische Codierungsprozesse zwar eng ver-zahnt, letztlich aber aufeinander aufbauende Prozessesind, wobei die visuelle Verarbeitung die sprachlicheCodierung deutlich determiniert.

Ausblick

Die vorgestellten Studien beleuchten jeweils nureinen kleinen Teil der Debatte um die Interaktion vonSprache, Denken und Wahrnehmung, aber sie zeigenauf, dass sinnvolle Wege des empirischen Zugangszu diesem Thema gefunden werden können. Nichtzuletzt durch diese Erkenntnis wurde die Forschungum diese eigentlich sehr alte Frage neu beflügelt.Möglicherweise kann auf diesem Wege eine ersteAnnäherung an eine Antwort gefunden werden.

.

Dr. Eva Belke studierte Klinische Linguistik, Psychologieund Mathematik an der Universität Bielefeld. Von 1999bis 2002 war sie Stipendiatin im Graduiertenkolleg „Auf-gabenorientierte Kommunikation“. Sie promovierte imFrühjahr 2002 und war anschließend zunächst als wissen-schaftliche Mitarbeiterin im Sonderforschungsbereich„Situierte Künstliche Kommunikatoren“ an der Fakultätfür Linguistik und Literaturwissenschaft tätig. Im Herbst2002 trat sie eine Stelle als Postdoktorandin an derUniversität Birmingham an.

Dr. Mathias Rehm studierte an der UniversitätBielefeld Naturwissenschaftliche Informatik mit demSchwerpunkt Sprachverarbeitung. Zwischen 1998und 2001 promovierte er im Graduiertenkolleg„Aufgabenorientierte Kommunikation“, wo er von1999 bis 2001 auch Sprecher der Stipendiatinnenund Stipendiaten war. Nach einer kurzen Zeit als Postdoktorand des Graduiertenkollegs ist ermittlerweile als Wissenschaftlicher Assistent am Lehrstuhl für Multimedia-Konzepte und ihreAnwendungen von Prof. Elizabeth André an derUniversität Augsburg tätig.

Page 17: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

15Forschung an der Universität Bielefeld 25/2003

Die Kommunikation zwischen Bürgern und Behördenist eine der Hauptaufgaben innerhalb der Verwaltung.Es ist von großer Wichtigkeit, diese Kommunikationso zu gestalten, dass sie ihren Zweck in optimalerWeise erfüllt. Hierbei kommt der Sprache als wich-tigstem Instrument innerhalb der Kommunikationzwischen dem Bürger und der Verwaltung eine zen-trale Bedeutung zu.

Dass diese Aufgabe nicht immer zufriedenstellenderfüllt wird, zeigt der Vorwurf der schlechten Ver-ständlichkeit und die mangelnde Akzeptanz, aufwelche die Verwaltungssprache seitens der Bürgerstößt.

Im Rahmen des Dissertationsprojektes der Autorinsollen Kriterien für die Optimierung von schriftlicherVerwaltungssprache erarbeitet werden, die sowohleiner besseren Verständlichkeit, wie auch der Ak-zeptanz der Kommunikation dienen. Ziel der Unter-suchung ist die Entwicklung eines operativen Ver-fahrens zur Gestaltung schriftlicher Textvorlagen inBehörden und Verwaltungen (Beispiel: Konzepte fürMitarbeiterschulungen).

Ausgangsüberlegungen

Die durchgeführte Untersuchung basiert auf einemkommunikationsorientierten Ansatz. Hierbei wirdVerständlichkeit nicht nur auf Textmerkmale reduziert,sondern sie wird als das Ergebnis eines Kommunika-tionsprozesses gesehen, bei dem der Text nur einevon vielen verschiedenen Komponenten ist. Ver-ständlichkeit entsteht nach Gert Rickheit durch dieoptimale Interaktion des Textes mit seinen Benutzernin bestimmten situativen und aufgabenorientiertenKontexten. Eine Verbesserung der Verständlichkeitund Akzeptanz der Verwaltungssprache sollte des-

„Ist zwar verständlich, aber…“

Verwaltungssprache: Mangelnde Verständlich-keit und Akzeptanz als Barrieren in der Kom-munikation zwischen Verwaltung und Bürgern

Kerstin Grönert

Wer kennt das Problem nicht?! Ob essich um die Einschreibung an der Uni-versität handelt oder ob man plant, einHaus zu bauen, sich ummelden möchteoder BAFöG beantragt – überall ist esunumgänglich, dazu Formulare auszu-füllen. Und gerade bei diesem Ausfüllenscheitern viele solcher Vorhaben oderwerden unnötig in die Länge gezogen.Dem sollte abgeholfen werden, um so auch das Verhältnis zwischenBürger und Behörde zu verbessern.

Abbildung 1: Schreiben des BürgermeisteramtesLangenbrücken.

Page 18: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

16 Forschung an der Universität Bielefeld 25/2003

halb laut Hildegard Wagner nicht nur auf die sprach-liche Ebene reduziert werden, sondern muss sowohldie funktionalen Gegebenheiten, die Zwecke und dieLeistungsanforderungen der Verwaltung, wie auchdie Position der Bürger, als Adressaten der Schreiben,einbeziehen.

Die Ausgangsüberlegung für dieses Projekt war,dass Bürger und Verwaltungsmitarbeiter aktiv alsständige Benutzer der Sprache an dem Bewertungs-und Verbesserungsprozess der verwaltungssprach-lichen Schreiben beteiligt sind. Die Optimierung soll sich in erster Linie an ihren Bedürfnissen, Inter-essen und Wünschen orientieren, da der Erfolg derKommunikation entscheidend von ihrer gegenseitigenAkzeptanz und Verständigungsbereitschaft abhängt.

Kooperationspartner

Als Kooperationspartner für das Dissertationsprojekthaben sich die Universitätsverwaltung (Studierenden-sekretariat, BAFöG-Amt, Personaldezernat) und die

Stadt Bielefeld (Bauordnungsamt) zur Verfügunggestellt. Die verantwortlichen Verwaltungsmitarbeiterzeigten sich sehr aufgeschlossen und interessiert, unddie bisherige Zusammenarbeit gestaltete sich überauspositiv und effizient.

Untersuchungsaufbau

Die Untersuchung basiert auf einer empi-rischen Studie, die auch einen Teil zurAnalyse der sozialen Funktion der Texteumfasst. Es werden sowohl quantitativewie auch qualitative Verfahren verwen-det.

Bei den Versuchspersonen handelt essich um Mitarbeiter der einzelnen Ver-waltungen und deren Klienten. Bevor-zugt werden Versuchspersonen, die auchin der Realität mit den Bescheiden undFormularen arbeiten oder mit ihnen kon-frontiert sind, um so möglichstrealistische Untersuchungsbedingungenund Einschätzungen der sozialen Funk-tion der Texte zu erhalten (Beispiel: einMitarbeiter der Universität Bielefeld, dereine aktuelle Reise abrechnen muss, wirdzu dem dabei benutzten Reisekosten-formular befragt).

In einem ersten Schritt wurden dievon den Verwaltungen zur Verfügunggestellten Schreiben und Formularedurchgesehen und ein Textkorpus vonvier Bescheiden und Formularen zusam-mengestellt (Einschreibeformular, Formu-

lar zur Reisekostenabrechnung und Exmatrikulations-bescheid der Universität Bielefeld, Baugenehmigungder Stadt Bielefeld). Dieses Korpus dient als Grund-lage der Untersuchung. Auswahlkriterien für dieTexte waren: der Laie als Empfänger (Bürger/Student),die Häufigkeit ihrer Verwendung und das Auftretenvon negativen Rückmeldungen.

: Erste Zwischenergebnisse

Die erste Versuchsreihe mit dem Einschreibeformularder Universität Bielefeld wurde bereits durchgeführt.Hierbei wurde das Einschreibeformular Schülern des13. Jahrgangs verschiedener Bielefelder Gymnasienvorgelegt, die nach ihrem Abitur ein Studium auf-nehmen wollen. Sie sollten sich mit diesem Formularfür das von ihnen gewünschte Studium einschreiben.Weitere Informationen erhielten sie nicht. Die Ein-schreibeunterlagen setzen sich aus dem vierseitigen

Abbildung 2: Auszug aus einem Schriftstück des Standesamtes Bruchsal.

Page 19: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

17Forschung an der Universität Bielefeld 25/2003

Formular „Antrag auf Einschreibung“und dem zwölfseitigen „Antrags-Infound Schlüsselverzeichnis zum Antrag aufEinschreibung“ zusammen. Letzteresenthält die Zahlenschlüssel zum Ausfüllendes Formulars und ein Beispiel. DerBearbeitungsvorgang wurde auf Videofestgehalten, und die Schüler wurdenaufgefordert, während des Ausfüllens dieeinzelnen Arbeitsschritte laut zu kommen-tieren. Im Anschluss sollten die SchülerProbleme und Kritik auf einem Frage-bogen vermerken. Weiterhin wurden siegebeten, einen zweiten Fragebogen zuihrer persönlichen Einstellung undMeinung über Verwaltungen und derenTätigkeit auszufüllen.

In einem weiteren Untersuchungs-durchgang wurden andere Schülergebeten, das Formular in Zweiergruppenzu bearbeiten. Für diese Zweiergruppengalten dieselben Bedingungen wie für dieEinzelbearbeitung.

Das gewonnene Datenmaterial bestehtaus fünf Videoaufzeichnungen vonEinzelbearbeitungen und vier Videoauf-zeichnungen von Zweiergruppen. Die erstevorläufige Analyse ergab folgende Zwischen-ergebnisse:

Keines der Formulare wurde richtig ausgefüllt.Alle Versuchspersonen (VP) hatten Angst, als

„dumm“ dazustehen, wenn sie das Formular nichtrichtig ausfüllen würden. Niemand kam auf die Idee,dass das Formular schlecht gestaltet ist, wenn es einkorrektes Ausfüllen nicht ermöglicht.

Die Ursache für die Probleme scheint nichtmangelnde Kompetenz zu sein oder Unwissenheitüber bestehende Formular-Konventionen. Allen VPwar das Bearbeitungsschema von Formularenbekannt, und sie versuchten, es beim Ausfüllen desFormulars umzusetzen: Lesen der Aufgabe –Lösungssuche – Eintrag.

Formulare werden wie „Aufgaben“ bearbeitet,die es mit Hilfe spezifischer Ressourcen zu lösen gilt:Personen-interne Ressourcen > Biographisches Wis-sen (beispielsweise Name, Adresse etc.); Formular-interne Ressourcen > Lösungsmöglichkeiten imFormular; Formular-externe Ressourcen > Schlüssel-angaben in den Erläuterungen). In dem Formularfinden sich Hilfestellungen, die den VP signalisieren,auf welche Ressource zur Lösung der Aufgabe zuge-griffen werden muss. Die VP lassen sich hinsichtlichder Arbeitshypothesen, die sie bezüglich der zur

Verfügung stehenden Ressourcen machen, in zweiBearbeitungs-Typen aufteilen:

Typ A: Die Formular-externen Ressourcen(Erläuterungen) haben Hilfsfunktion und werdenausschließlich gebraucht, wenn Probleme auftreten.Die VP versuchen, das Formular mit Hilfe von Perso-nen-internen (beispielsweise biographisches Wissen)oder Formular-internen Ressourcen (Lösungsmöglich-keiten in dem Formular) zu lösen.

Typ B: Der Schwerpunkt der Bearbeitung liegtauf den formular-externen Ressourcen. Kein Arbeits-schritt wird ohne vorherige Absicherung unternom-men, auch wenn Formular-interne oder Personen-interne Ressourcen zur Bearbeitung ausreichenwürden.

Bei allen VP tauchten an den selben StellenProbleme auf oder wurde die gleiche Kritik genannt:

Der Zusammenhang von Formular und Erläute-rungen ist schwer herstellbar/unklar.

Abbildung 3: Auszug aus dem Bericht eines Gerichtsvollziehers.

Page 20: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

18 Forschung an der Universität Bielefeld 25/2003

Die Erläuterungen sind unübersichtlich.Die Anmerkungen in dem Formular sind unüber-

sichtlich/ungenau.Komplizierter und unverständlicher Satzbau; un-

bekannte Abkürzungen; unübersichtliche Gestaltung,überflüssige Passagen.

Bei den VP tauchen keinerlei Probleme bei derBearbeitung auf, solange sie auf Personen-interneRessourcen zurückgreifen können.

Schwierigkeiten bereitet die Verwendung der For-mular-internen und -externen Ressourcen. Obwohldie VP das Bearbeitungsschema offensichtlichkennen oder verstanden haben, fällt es ihnen sehrschwer, den Zusammenhang zwischen dem Formularund diesen Ressourcen herzustellen. Die Schwierig-keiten bereiten hier weder das Formular mit seineneinzelnen Aufgaben, noch die dazugehörendenRessourcen. Die Problematik resultiert aus einerfehlenden „Führung“ der Bearbeiter.

Die gebotenen Hilfestellungen in dem Formularreichen bei einem Teil der Aufgaben nicht aus, umeine Lösung zu finden, oder sie sind überhaupt nichtvorhanden.

Die VP erkennen die Hilfestellung nicht und sindsomit nicht in der Lage, einen Zusammenhangzwischen der Aufgabe, der Hilfestellung und denRessourcen herzustellen.

Die VP benötigen an diesen Stellen deutlich mehrArbeitsschritte/Arbeitsaufwand, als es die Logik desFormulars vorsieht, oder sind überhaupt nicht in derLage, die Aufgabe zu lösen.

Verwaltungsmitarbeiter: Erste Zwischenergebnisse

Innerhalb der Verwaltungen wurden Interviews undFragebogenerhebungen durchgeführt. Die Verwal-tungsmitarbeiter wurden gebeten, zuerst einenFragebogen zu ihrer Meinung und ihrer Einstellunggegenüber der Verwaltung und ihren Tätigkeitenauszufüllen. Dieser Fragebogen stellt das Pendant zudem Fragebogen über persönliche Meinung undEinstellung der Bürger dar. Im Anschluss daran wurdeein Interview geführt, in dessen Verlauf die Verwal-tungsmitarbeiter zu dem Schreibvorgang innerhalbder Verwaltung und ihrer persönlichen Einstellunggegenüber dem Schreiben befragt wurden. Die erstevorläufige Analyse des Datenmaterials ergab folgendeZwischenergebnisse:

Innerhalb der Verwaltungen wird nur noch inspezifischen Fällen selbst geschrieben. Für denalltäglichen Schriftverkehr werden Standardschreibenund Textbausteine verwendet, die höchstens durcheigene Passagen miteinander verbunden werden.

Die Herkunft der Standardschreiben undBausteine ist unbekannt: „Die waren schon immerda.“

Die Verwaltungsmitarbeiter nehmen eine deutlicheDifferenzierung zwischen dem eigenen Schreibenund den Textvorlagen vor, deren Stil sie überwiegendals negativ bewerten: „Ich würde nie in diesemtypischen Beamtendeutsch schreiben.“ Die Vorlagenwerden allerdings trotz dieser Kritik nicht geändert.Zum einen empfinden sich die Verwaltungsmitarbei-ter als nicht zuständig oder kompetent genug, undzum anderen spielt der Zeitfaktor eine entscheidende

Abbildung 4: Schreiben der Stadt Holmen.

Page 21: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

19Forschung an der Universität Bielefeld 25/2003

Rolle. Die vollständige Überarbeitung aller Standard-schreiben und Textbausteine würde zu viel Zeit inAnspruch nehmen. Die regelmäßige Kontrolle derSchreiben bezieht sich deshalb nur auf die Richtigkeitder rechtlichen Inhalte. Hinzu kommt, dass jeder fürsich selbst arbeitet und lediglich dort korrigiert, woihm etwas auffällt.

Die Verständlichkeit der Schreiben wird als Pro-blem erkannt, Lösungen beziehen sich aber nur aufdas eigene Schreiben. Hierbei sind die Verständlich-keit für den Laien und die Einfachheit des Textes dieHauptkriterien. Bezüglich der Textvorlagen wird einebessere Verständlichkeit gewünscht, aber Lösungenwerden nicht geboten.

Es wird in Kauf genommen, dass Formularefehlerhaft ausgefüllt werden und dann von denSachbearbeitern korrigiert werden müssen. Diemündliche Erklärung im Rahmen der Beratungs-stunden erscheint als selbstverständlich und wird vonden Angestellten als wichtigste Methode zur Lösungvon Konflikten gesehen. Teilweise ist eine solcheBeratung Grundvoraussetzung, damit das Formularvon den Klienten überhaupt bearbeitet werden kann.Nach Aussagen der Sachbearbeiter fällt es ihneninnerhalb dieser Beratungsstunden sogar wesentlichleichter, die Sachverhalte mündlich und mit eigenenWorten zu erklären. Ein wichtiger Faktor sei hierbei,dass die Mitarbeiter reden können „...wie mir derSchnabel gewachsen ist“, da keine rechtlicheVerbindlichkeit besteht.

Ausblick

Diese Zwischenergebnisse sollen im weiteren Verlaufder Studie überprüft werden, um dann möglicheOptimierungskriterien zu extrahieren.

Parallel dazu werden die Formulare gemischtenSchreibgruppen (Verwaltungsmitarbeiter und Bürger)vorgelegt, mit der Bitte, sie verständlicher zu gestal-ten. Die Arbeit in diesen Gruppen wird zur späterenAuswertung auf Video dokumentiert. Auf diesemWeg soll untersucht werden, wie „Experten“ und„Laien“ gemeinsam Lösungsstrategien entwickeln,nach welchen Kriterien sie die Texte optimieren undwie sie gegenseitige Verständigungsbereitschaft undAkzeptanz signalisieren. Im Anschluss an die Auswer-tung des Videomaterials erfolgt eine Überarbeitungder vorläufigen Optimierungskriterien, in welche dieDaten aus den Schreibgruppen einfließen. Die aufdiesem Wege gewonnenen Kriterien für die Optimie-rung der Verständlichkeit und Akzeptanz von Ver-waltungssprache, die sich sowohl an linguistischenModellen, wie auch an den Vorstellungen derBenutzer dieser Sprache orientieren, sollen in einem

„Konzept zur Gestaltung schriftlicher Textvorlagen inBehörden“ zusammengefasst und den Verwaltungenzur Verfügung gestellt werden.

Literatur

Büter D./H.-J. Schimke (1993), Anleitung zurBescheidtechnik – Wie Verwaltungsakte verständlichgeschrieben werden, Berlin, Bonn, Regensburg:Walhalla.

Gößl, A. (1981), Praktische Psychologie undSoziologie in der Verwaltung, Regensburg: Walhallaund Praetoria Verlag.

Grönert, K., Akzeptanz und Verständlichkeit derBürger-Verwaltungs-Kommunikation, in: Strohner,H./R. Brose (Hrsg.), Optimierung von Kommuni-kation: verständlicher, instruktiver, überzeugender,Tübingen: Stauffenburg Verlag 2002, S. 145–156.

Rickheit, G. (1995), „Verstehen und Verständlich-keit von Sprache“, in: Spillner, B. (Hrsg.), Sprache:Verstehen und Verständlichkeit, Frankfurt am Main:Lang. 15–30.

Wagner, H. (1970), Die deutsche Verwaltungs-sprache der Gegenwart, Düsseldorf: PädagogischerVerlag Schwann.

Kerstin Grönert hat an der Universität BielefeldGermanistik, Soziologie und Psychologie studiert undist seit März 2000 Mitglied im Graduiertenkolleg„Aufgabenorientierte Kommunikation“. Dort arbeitetsie an einer Studie zur Verständlichkeit und Akzep-tanz von verwaltungssprachlichen Bescheiden undFormularen.

Page 22: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

20 Forschung an der Universität Bielefeld 25/2003

Warum ist UNTER schwieriger als AUF?

Eine Studie zum Verständnis von Präpositionenim Spracherwerb

Katharina J. Rohlfing

Ob Englisch, Schwedisch, Dänisch,Hebräisch oder – wie KatharinaRohlfing in ihrer Dissertation fest-gestellt hat – Polnisch: Kinder im Altervon 20 bis 26 Monaten verstehen diePräposition AUF oder IN besser alsUNTER. Das zeigt sich am deutlichstenin einer experimentellen Situation:Dem Kind werden zum Beispiel einSpielzeugtisch und ein Spielzeughundpräsentiert. Nachdem sich das Kind dieObjekte angeschaut hat, äußert mandie Instruktion „Tue den Hund UNTERden Tisch“. Meistens stellen dieKinder dann den Hund AUF den Tisch.Dieses Verhalten, auf eine Instruktionmit UNTER mit einer Relation AUF zuantworten, erstreckt sich über vieleObjekte, mit denen auch eine UNTER-Relation leicht möglich ist. Würde manjedoch angesichts dieser Objekte einKind mit einer AUF-Relation beauf-tragen, könnte es ein besseres Ver-ständnis von Präpositionen zeigen. Es scheint, als wäre das Verhalten derKinder unabhängig von der sprach-lichen Instruktion – dieseInterpretation veranlasste bereits inden 70er Jahren viele Forscher zu derAnnahme, dass sich das Verstehen derKinder in diesem Alter stärker als beiErwachsenen an Informationenorientiert, die aus der Situationkommen. Es bleibt jedoch die Frage, warum die Situation eherInformationen über die Relationen INund AUF liefert. Die Antwort könntedarüber Aufschluss geben, warumKinder das Wort UNTER später als INund AUF verstehen und verwenden.

Befragung von Kindern im Labor(siehe auch Abbildung 2 auf Seite 22).

Page 23: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

21Forschung an der Universität Bielefeld 25/2003

Weil AUF häufiger ist als UNTER?

Als prominentester Faktor ist die Häufigkeit zunennen. In Lerntheorien wird davon ausgegangen,dass, je häufiger ein Wort gebraucht wird, destohäufiger Kinder die Möglichkeit haben, dieses Wortwahrzunehmen und auf diesem Wege zu lernen. ImHinblick auf die Titelfrage würde das bedeuten, dassKinder die Präpositionen IN und AUF häufiger vonihren Eltern hören als die Präposition UNTER. Deshalbkommen sie besser in Situationen zurecht, in denendiese bekannten Vokabeln benutzt werden. Allerdingszeigt sich bei unterschiedlichen Studien zur Rolle derAusdruckshäufigkeit, dass dieser Faktor zwar denErwerb entscheidend beeinflusst, ihn jedoch nichtbestimmen kann.

Weil UNTER linguistisch komplexer ist?

Ein weiterer Faktor wird als Linguistische Komplexitätbezeichnet. Damit ist gemeint, dass eine zweisilbigePräposition wie das UNTER komplexer ist als daseinsilbige AUF. Dieses Argument trifft zwar für dasDeutsche, Englische und Hebräische zu, nicht jedochfür das Polnische, wo AUF dem NA entspricht unddas UNTER dem POD. Beide Präpositionen, NA undPOD, sind im Polnischen einsilbig. Trotzdem zeigteeine Pilotstudie, dass die Reihenfolge im Verstehenauch für diese Sprache gilt. Somit liegen logischeGründe gegen das Argument der LinguistischenKomplexität vor.

Weil UNTER schwieriger zu sehen ist?

Ein Grund, weshalb das UNTER schwieriger zuerwerben sein soll, wird alternativ der Schwierigkeitim Wahrnehmen zugeschrieben. Demnach nimmtman an, dass Objekte (Trajectors – siehe Abb. 1), diesich UNTER einem anderen (Landmark) befinden,nicht leicht wahrzunehmen sind, was die Referenzauf die Trajector-Objekte erschwert. Allerdingskönnte man das gleiche Argument auf einige IN-Relationen anwenden: Trajector-Objekte, die sich INeinem anderen befinden, sind häufig auch nichtdirekt zu sehen, und man kann nicht eindeutig aufsie referieren. Die Schwierigkeit im Wahrnehmenkann sich somit nicht auf das Sehen des Trajector-Objekts beschränken. Allerdings könnte bei diesemFaktor ein weiterer Aspekt von Bedeutung sein: dieGeometrie des Landmarks, der in Studien mit Erwach-senen zur Bedeutung von Präpositionen häufig alsBedeutungskern gesehen wird. Dieser Aspekt wurdedaher im Rahmen eines Experiments untersucht (siehe unten).

Weil UNTER abstrakter ist?

Als letzter Faktor, der zum späten Verständnis von UNTER beiträgt, sei die kognitive Abstraktheitgenannt. In der Literatur wird diskutiert, ob diePräpositionen und zugleich die Relationen IN undAUF einen Basischarakter haben, so dass das sprach-erwerbende Kind zunächst die Bedeutung der Basis-relationen erlernen muss, um weitere Relationen wieUNTER zu verstehen. Die anfängliche Idee der Basis-relationen, bereits in den 80er Jahren geäußert, wirdheutzutage noch diskutiert.

Abbildung 1: In jeder Situation, in der Objekte zueinanderin eine Relation gesetzt werden, bekommen sie eine Rolle.Hier ist der Tisch in der Rolle eines Landmarks und fungiertals Hintergrund. Die Tasse wird hier in der Rolle einesTrajectors gebraucht, d.h., sie ist das aktive Objekt, dasvor dem Hintergrund des anderen Objekts agiert. Im Spielder Kinder ist es häufig zu beobachten, dass sie die Rollenflexibel halten. So ist mit den dargestellten Objekten aucheine Situation möglich, in der die Tasse die Rolle desLandmarks hat und der Tisch als Trajector gebraucht wird– dann wird das Kind versuchen, den Tisch in die Tasse zustellen, ohne die Größenverhältnisse zu berücksichtigen.

Page 24: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

22 Forschung an der Universität Bielefeld 25/2003

Experiment: Wie lernen Kinder Präpositionen?

Um zu testen, was UNTER schwieriger macht alsAUF, hat die Verfasserin im Rahmen ihrer Disser-tation eine Trainingsstudie im Polnischen durch-geführt. Genau wie das Deutsche bedient sich dasPolnische Präpositionen, um räumliche Relationenauszudrücken. Für die Studie wurden in Südpolen 24 Kinder im Alter von 20 bis 27 Monaten unter-sucht, deren Eltern mit Hilfe einer Apothekerin,zweier Kinderärztinnen und eines Dorfpfarrerserreicht wurden. An vier aufeinander folgendenTagen kamen die Kinder zu einem provisorischeingerichteten Labor im Pfarrheim (siehe Abb. 2)und lernten die Präposition POD [UNTER] zuverstehen, wobei zwei Variablen kontrolliert wurden:der linguistische Input und die Situation.

Der linguistische Input bezog sich auf die Art, wie die neue Relation gelernt wurde. Um die Art zu variieren, wurden die teilnehmenden Kinder nacheinem Vortest in vier Gruppen eingeteilt (sieheTabelle).

Abbildung 3: Die Holzkonstruktion, die für die künstlicheTransfer-Situation benutzt wurde. In dieser Situation sollendie Kinder so wenig Informationen wie möglich von denObjekten selbst über die möglichen Relationen bekommen.Die Konstruktion trägt den Namen HiK – dieser steht für„Heidelberger interessante Konstruktion“ – und soll dieTatsache ausdrücken, dass die Idee für das Design in einemHeidelberger Café entstanden ist.

Abbildung 2: Das im Pfarrheim eingerichtete Labor. Hierwird das Wissen des Kindes über die Präposition UNTERabgefragt. Bei diesem Test werden dem Kind zwei Objektepräsentiert. Wenn ein neues Objekt in die Szene einge-führt wird, hat das Kind zunächst Zeit, mit dem Objektvertraut zu werden und es auszuprobieren. Erst dannkommt die gewünschte Instruktion „Tue den Eimer UNTERdie Leiter!“. Wird ein neues Objekt eingeführt, werden die bekannten Objekte zur Seite geschoben. So ist für dasKind klar, dass sie nicht im Vordergrund stehen.

Einteilung der unterschiedlichen Lerngruppen

Gruppe Beispiel eines linguistischen Inputs

UNTER-IN Schau, der Hund ist IN der Höhle,UNTER dem Tisch

UNTER-AUF Schau, der Hund ist UNTER dem Tisch, nicht auf

UNTER Schau, der Hund ist UNTER dem Tisch

Kontrollgruppe Schau, das ist ein Hund, und das ist ein Tisch

Bei der Gruppe UNTER-IN wurde die UNTER-Relation mit der IN-Relation erklärt. Bei der UNTER-AUF-Gruppewurde die neue Relation mit AUF kontrastiert. Bei derUNTER-Gruppe wurde mit der Präposition UNTER auf dieUNTER-Relation referiert. Darüber hinaus wurde eineKontrollgruppe aus sechs Kindern eingerichtet, die zwar zu den Trainingssitzungen kamen und mit den gleichenObjekten spielten, jedoch kein Training erhielten.

Page 25: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

23Forschung an der Universität Bielefeld 25/2003

Die Situation wurde kontrolliert, indem auf Grundvon verwendeten Objekten im Laufe der Sitzungendrei Typen entstanden:

Bei der bekannten Situation haben die Kinderdieselben Objekte im Vortest, Training und Testgesehen und die UNTER-Relation mit ihnen gelernt.

Bei der Transfer-Situation handelte es sich umständig wechselnde Spielzeuge.

Bei der künstlichen Transfer-Situation wurdeeine Holzkonstruktion eingesetzt, bei der dieGeometrie des Landmarks variierte.

Die Konstruktion hatte das Ziel, das Wissen derKinder über Objekte und die Tätigkeiten mit ihnenso weit wie möglich zu neutralisieren (siehe Abb. 3). Der Tisch, zum Beispiel, ist so konstruiert, dass seineOberfläche zur Funktion des Tisches gehört. Kinderbeobachten daher, dass, wenn man die Funktion desTisches nutzen möchte, man die Objekte AUF denTisch stellt, also auf die Oberfläche. Die Oberflächeprovoziert somit bereits eine bestimmte Relation.Eine Kugel – wie sie in der Holzkonstruktion ver-wendet wird – verbinden Kinder häufig mit einemBall und werfen sie in die Luft oder rollen sie. DieseAssoziationen verleiten jedoch zu weniger bestimm-ten Relationen. Bereits im ersten Experiment (2001)hatte die Verfasserin angenommen, dass die Kinderin der „HiK-Situation“ (siehe dazu die Unterschrift zuAbb. 3) nicht von ihrem Objektwissen abgelenktwerden. Sie können daher – wenn sie die InstruktionTue den Ball auf die Kugel hören – die bestimmteRegion auf der Kugel spezifizieren. Diese Annahmekonnte jedoch nicht bestätigt werden. Vielmehr

suchten die Kinder auch in dieser Situation nachweiteren Hinweisen für eine Funktion der Objekte,die sie beim Verstehen der Instruktion nutzenkonnten. Diese Hinweise waren in einer Situation, inder Spielzeugobjekte benutzt wurden, offensichtlich.Die Daten des Experiments wurden dahingehendinterpretiert, dass das kindliche Verstehen situativund das Wissen der Kinder über Objekte beim Ver-stehensprozess entscheidend ist.

Ergebnisse

Die Ergebnisse der Trainingsstudie zeigen, dass dasVerstehen der Kinder – genau wie bei der erstenStudie – situativ ist, d.h. abhängig von einer kon-kreten Situation. Hatten die Kinder eine Situationkennen gelernt, zeigten sie ein gutes Verständnis vonUNTER. Im Gegensatz dazu gab es in der HiK-Situa-tion keine signifikanten Lerneffekte.

In Abhängigkeit vom linguistischen Input zeigtsich, dass sich die Gruppen im Verstehen von UNTERbeim Vortest nicht unterschieden. Im Test jedochzeigen die Gruppen UNTER-IN und UNTER-AUF dasbeste Verständnis von Instruktionen mit UNTER.

In der Kombination von linguistischem Input undbestimmten Typen der Situation fällt besonders dieUNTER-Gruppe auf. Ihr Lernerfolg ist in der Transfer-Situation nicht signifikant. Das heißt, dass das Zu-rückgreifen auf die Basisrelationen wie IN und AUFden Transfer erleichtert und das Postulat der Basis-relationen seine Berechtigung findet.

Abbildung 4: Eine Situation aus dem Training.Kinder lernen die Relation UNTER kennen undprobieren sie selbst aus. Bereits nach zweikurzen Trainingssitzungen haben die meistenKinder die neue Relation gelernt – der Jungeim Bild stellt einen Hund unter den Tisch. ZweiKinder in einer Trainingssitzung zu trainierenerwies sich als natürlicher, als wenn sich dieAufmerksamkeit der Experimentatorin nur aufein Kind richten würde.

Page 26: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

Warum ist AUF leichter als UNTER?

Die Ergebnisse beider Experimente bekräftigen, dassdas Wissen der Kinder über Objekte entscheidendist. Die Funktion, die die Objekte erfüllen, fungiertdabei als „konzeptueller Klebstoff“ – wie Tomasello,ein Vertreter dieses sozial-pragmatischen Ansatzeszum Spracherwerbs, es charakterisiert hat. Je mehrKinder über die Funktion einer Relation im Zusam-menhang mit bestimmten Objekten erfahren, destobesser lernen sie die neue Relation im Zusammen-hang mit den neuen Objekten. Das Verständnis einerneuen Präposition verbunden mit einer neuenRelation auf neue Objekte zu transferieren, die keinebesondere Funktion zeigen (wie in der HiK-Situation),fällt den Kindern schwer. Bei Objekten, die nicht sokünstlich erscheinen wie die Holzkonstruktion,suchen Kinder Ähnlichkeiten in der Geometrie desLandmarks, falls die Funktion des Objektes nicht klarist. Und genau in diesem Punkt scheint der Basis-charakter von IN und AUF zu liegen. Im Gegensatzzu UNTER bezieht sich die Präposition AUF meistensauf Objekte, die eine stützende Funktion erfüllen.Diese Funktion wird durch die geometrischen Merk-male des Landmarks betont (die Oberfläche). DieOberfläche zu bestimmen ist bei Objekten einfach,da sie durch die Gravitationskraft zu testen ist. DieseKette an aufeinander aufbauenden funktionalen undperzeptuellen Faktoren ist jedoch weniger eindeutigbei UNTER. Die Relation UNTER wird häufig vonKindern selbst in Verbindung mit der Funktion vonVerstecken gebracht. Allerdings kann diese Funktionnicht so deutlich wie AUF an geometrischen Merk-malen des Landmarks festgemacht werden undkonkurriert so mit Relationen wie IN und HINTER,was letztlich UNTER für Kinder schwieriger macht alsAUF.

Dr. Katharina J. Rohlfing studierte GermanistischeSprachwissenschaft, Philosophie und Medienwissen-schaft an der Universität Paderborn. In ihrer Disser-tation im Graduiertenkolleg „AufgabenorientierteKommunikation“ an der Universität Bielefeldbeschäftigte sie sich mit der Entwicklung des seman-tischen Wissens über räumliche Relationen und mitder Verbindung zwischen räumlichem Denken undSprechen über Raum. Die theoretischen Grundlagenihrer Arbeit vertiefte sie während eines Aufenthaltsan der San Diego State University, USA, wo zur Zeitauch ihr postdoktorales Projekt mit Unterstützungdes Deutschen Akademischen Austauschdienstesstattfindet.

24 Forschung an der Universität Bielefeld 25/2003

Page 27: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

25Forschung an der Universität Bielefeld 25/2003

Welche multimediale Präsentation?

Es gibt generell keine bestimmte MP, die das Lernenam besten unterstützt. Je nach dem Inhalt derLernstoffe sind unterschiedliche MPs angemessen.Manche Forscher nehmen an, dass solche Informa-tionen, die eine Folge von Handlungssequenzen,Bewegungen von Objekten, beschreiben, mitbewegten Bildern dargestellt werden sollten, weilbewegte Bilder im Vergleich zu statischen Bildernbesser geeignet sind, Zustandsänderungen darzu-stellen. Statische Bilder sind dementsprechend geeig-net für die Darstellung statischer Zustände. MancheForscher meinen auch, dass das ArbeitsgedächtnisInformationen effizienter verarbeiten kann, wenn die Informationen in verschiedenen Modalitäten (z.B. auditiv und visuell) dargeboten werden. All diese

So wird das Puzzle gelöst!

Die Wirkung von Multimedia-Präsentationenauf die Informationsverarbeitung

Ying-Hua Guan

Heutzutage werden Multimedia-Prä-sentationen, die typischerweise Texte(gedruckt oder gesprochen), Bilder(statisch oder bewegt) und auchSound-Effekte enthalten, häufig für dieKommunikation nicht nur zwischenMenschen, sondern auch zwischenMensch und Maschine verwendet. ZuLehrzwecken ist Multimedia beson-ders beliebt, weil es die Vorteile hat,Informationen in verschiedenenModalitäten gleichzeitig darzubieten,wozu die traditionellen Lehrbücher, alsgedruckte Medien, nicht in der Lagesind. Darüber hinaus ermöglicht diemultimedia-unterstützte Lern-umgebung Interaktivitäten zwischenden Lernenden und der Lernumgebung.Trotz der vermutlichen Vorteile derMultimedia-Präsentationen zeigenempirische Untersuchungen, dass sichMultimedia nicht immer vorteilhaft auf das Lernen auswirkt. In manchenFällen beeinträchtigt es sogar dasLernen.

Ying-Hua Guan stammt aus Taiwan und studierte Deutsch als Fremdsprache, Linguistik und Pädagogikan der Universität Bielefeld. In ihrer Dissertationbeschäftigt sie sich mit den Einflüssen von Multi-media-Präsentationen auf die Informationsverarbei-tung. Mithilfe der Eye-Tracking-Technik hat sie dieLernprozesse sowie die Dynamik der Aufmerksam-keitsverteilung von Versuchspersonen untersucht.Ihre Forschungsgebiete umfassen menschlichesGedächtnis, Augenbewegungsforschung im Zusam-menhang mit Text-Bild-Integration und multimedia-unterstütztes Lernen.

Page 28: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

26 Forschung an der Universität Bielefeld 25/2003

Annahmen können bislang nicht hundertprozentigempirisch bestätigt werden. Die Verfasserin hat einExperiment durchgeführt, das diese Annahmen über-prüfen soll. Dieses Experiment wird im Folgendendargestellt.

Das Würfel-Puzzle-Experiment

Das Ziel des Experiments ist zu untersuchen, 1) ob bewegte Bilder tatsächlich besser als statischeBilder sind, um eine Folge von Handlungssequenzenzu präsentieren, und 2) ob es wirklich vorteilhaft ist, wenn Texte und Bil-der in unterschiedlicher Modalität dargestellt werden.

Die Einflüsse der folgenden MPs auf die Lern-effizienz und die Lernstrategien werden systematischüberprüft: W Bedingung 1: geschriebene Texte + statische BilderW Bedingung 2: geschriebene Texte + bewegte BilderW Bedingung 3: gesprochene Texte + statische BilderW Bedingung 4: gesprochene Texte + bewegte Bilder

In dem Lernmaterial geht es um Bauanweisungenzu einem dreidimensionalen Würfel-Puzzle. DieseInstruktionen bestehen aus insgesamt zehn Web-seiten, die den Zusammenbau des Würfel-PuzzlesSchritt für Schritt erklären. Ein Beispiel aus denInstruktionen zu der jeweiligen experimentellenBedingung wird in den Abbildungen 1 bis 4 gezeigt.

Abbildung 1: Die Instruktionen werdendurch statische Bilder und geschriebeneTexte präsentiert. Rechts unten auf derWebseite gibt es zwei Buttons, womit dieVersuchpersonen (VPs) entweder die vorigeoder die nächste Webseite öffnen können.

Abbildung 2: Die Instruktionen werdendurch bewegte Bilder (Video-Clips) undgeschriebene Texte präsentiert. Unter demVideo-Fenster gibt es eine Kontrollleiste,womit die VPs das Video starten, auf derStelle anhalten oder stoppen können.

Page 29: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

27Forschung an der Universität Bielefeld 25/2003

Die Versuchspersonen (VPs) dürfen dieInstruktionen so lange lernen, wie sie wollen und bissie glauben, dass sie sich sämtliche Anweisungen gutgemerkt haben. Nach der Lernphase müssen sieversuchen, das Würfel-Puzzle so schnell wie möglich

zusammenzusetzen. Es gibt insgesamt neun Schrittefür den Zusammenbau des Würfels. Für jeden richtigdurchgeführten Schritt gibt es einen Punkt. Die Lern-effizienz berechnet sich wie folgt:

Abbildung 3: Die Instruktionen werdendurch statische Bilder und gesprocheneTexte präsentiert. Unter den statischenBildern gibt es auch eine Kontrollleiste, mitder die VPs den gesprochenen28Text starten, auf der Stelle anhalten oder

stoppen können.

Abbildung 4: Die Instruktionen werdendurch bewegte Bilder (Video-Clips) undgesprochene Texte präsentiert. Unter demVideo-Fenster gibt es ebenfalls eineKontrollleiste.

Lerneffizienz = Punkte für den Zusammenbau

(Lernzeit + Zeit für den Zusammenbau)

Page 30: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

28 Forschung an der Universität Bielefeld 25/2003

Ergebnisse

Die Resultate zeigen, dass die VPs, die mit bewegtenBildern und gesprochenen Texten gelernt haben, diehöchste Lerneffizienz erreichen. Die Lerneffizienzderjenigen VPs, die mit den anderen drei MPs gelernthaben, unterscheidet sich nicht. Die unterschied-lichen Präsentationsarten von Texten hatten einensignifikanten Effekt. Die VPs lernen effizienter, wenngesprochene Texte präsentiert werden. Allerdingsbeschränkt sich dieser positive Effekt nur auf dieBedingung der Kombination gesprochener Texte mitbewegten Bildern. Wenn statische Bilder präsentiertwerden, spielen die Präsentationsarten von Textenkeine Rolle in der Lerneffizienz. Die Präsentations-arten von Bildern (bewegt oder statisch) hattenkeinen Einfluss auf die Lerneffizienz. Der vermuteteVorteil der bewegten Bilder wird zwar nicht durch dieLerneffizienz bestätigt, aber ein Vorteil der bewegtenBilder zeigt sich darin, dass die VPs jeden Instruktions-schritt wesentlich weniger häufig wiederholen müssen,um sich die Instruktionen einzuprägen, als dies bei Instruktionen mit statischen Bildern der Fall ist.

Der Effekt der multimodalen Präsentation

In einem weiteren Experiment untersuchte die Ver-fasserin, unter welchen Bedingungen die multimodalePräsentation vorteilhaft ist und unter welchenBedingungen nicht. Das Ergebnis deutet darauf hin,dass bei der multimodalen Präsentation eine größereGefahr besteht, das Arbeitsgedächtnis zu überlasten,als bei der monomodalen (zum Beispiel nur visuellen)Präsentation. Dies spricht gegen die oben erwähntenüblichen Annahmen. Die Erklärung dafür ist, dass das Arbeitsgedächtnis zwar modalitätsspezifischeSubsysteme hat, die in gewissem Maße unabhängigvoneinander Informationen verarbeiten können –also beispielsweise verbale und visuelle gleichzeitig.Jedoch teilen sich die Subsysteme die gemeinsameAufmerksamkeitskapazität. Die multimodale Präsen-tation führt eher dazu, dass verschiedene Informatio-nen gleichzeitig verarbeitet werden müssen, wodurchleicht die Überlastung des Arbeitsgedächtnisseshervorgerufen wird. Im Gegensatz dazu werden dieInformationen bei der monomodalen Präsentationsukzessiv verarbeitet, wobei weniger Last auf dasArbeitsgedächtnis geladen wird. Die multimodalePräsentation könnte nur vorteilhaft sein, wenn die zu verarbeitenden Informationen die Kapazität desArbeitsgedächtnisses nicht erschöpfen.

Fazit

Die Annahme, dass die bewegten Bilder besser in der Lage sind, eine Folge von Handlungssequenzenoder Zustandsänderungen darzustellen, lässt sich indem Würfel-Puzzle-Experiment lediglich durch dieWiederholungsfrequenz der einzelnen Instruktions-schritte bestätigen. Die bewegten Bilder scheineneinprägsamer als die statischen Bilder zu sein. DieAnnahme, dass das Arbeitsgedächtnis Informationeneffizienter verarbeitet, wenn die Informationen inverschiedenen Modalitäten dargeboten werden, istnicht vollständig bestätigt, denn der Vorteil dermultimodalen (auditiv-visuellen) Präsentation ist nurunter bestimmten Bedingungen gültig.

Page 31: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

29Forschung an der Universität Bielefeld 25/2003

Von „Kiddies“ bis zu „Über-50-Jährigen“Wenn Schreiber über ihren Adressaten sprechen

Kirsten Schindler

Wenn wir Texte schreiben, dann tunwir das in der Regel für andere. Ob derText unseren Leser erreicht, ob er alsoversteht, was wir ihm erklären wollen,von den Argumenten überzeugt wird,die wir benutzen, oder von unserer Ge-schichte amüsiert ist, hängt davon ab,wie es uns als Schreibern gelingt, denText mit Blick auf unseren Leser zuformulieren. Aber wie machen wir dasbeim Schreiben? Denn anders als einZuhörer im Gespräch kann ein Lesernicht unmittelbar rückfragen, wenn eretwas nicht versteht, seine Aufmerk-samkeit nicht für uns deutlich auf et-was anderes richten, wenn ihn unsereGeschichte langweilt, oder beherztprotestieren, wenn ihm unsere Argu-mente nicht einleuchten. Als Schreibermüssen wir also nach anderen Zeichensuchen und spezifische Schreibstrate-gien ausbilden, um adressatengerechteTexte zu schreiben.

Vom Leser zum Adressaten

Die Orientierung am Leser ist eine zentrale Anforde-rung an Texte und an die Schreiber, die diese Texteproduzieren. Wie wichtig diese Anforderung ist, zeigt sich dann, wenn die Adressatenorientierungmissachtet wird oder misslingt. So stellen mancheBedienungsanleitungen die Leser vor geradezuunlösbare Probleme: sie sind mit Hilfe der Anleitungnicht in der Lage, das Gerät zu bedienen, und gebenfrustriert auf. Während diese Texte für die Rezipien-ten als deutlich ungeeignet beschrieben werdenkönnen, gilt auch das umgekehrte Verhältnis: nichtalle Texte haben überhaupt die Absicht, alle Leser zu erreichen, denn Texte sind unterschiedlich voraus-setzungsreich. Ein Fachtext, wie ein wissenschaft-licher Aufsatz über die Heisenbergsche Unschärfe, ist in der Regel nur für solche Personen verständlich, die bereits Kenntnisse in der Quantenmechanikhaben. Für die Leser, an die ein Text gerichtet – „adressiert“ – ist, hat sich der Begriff Adressat

etabliert. Der Adressat eines solchen Aufsatzes ist am ehesten als Gruppe von Physikern, die sich mittheoretischer Physik beschäftigt, zu beschreiben. Derkonkrete Leser muss dem nicht entsprechen. Auchein Linguist kann diesen Text selbstverständlich lesen,wird es aber vermutlich mit einem anderen Interessetun. Der Adressat ist im Gegensatz zum Leser alsoein Konstrukt, das für das Schreiben eines Texteshergestellt wird. Manchmal ist ein solches Konstruktfür den Schreiber präsent und in eine mehr oderweniger klare Beschreibung gefasst. So heißt es inden Empfehlungen dieses Forschungsmagazins, dieAutoren sollen sich „einen Akademiker in einemBeruf außerhalb der Wissenschaft oder auch eineninteressierten Oberstufenschüler, jedoch keinenFachkollegen“ vorstellen. Damit ist aber noch nichtsdarüber gesagt, was diese Beschreibung konkret fürdie Formulierungsarbeit im Text bedeutet, welcheÜberlegungen daraus abgeleitet werden, wann derAdressat für den Schreiber wichtig wird und welcheKonsequenzen daraus gezogen werden.

Page 32: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

30 Forschung an der Universität Bielefeld 25/2003

Das Schreibexperiment

In dem Dissertationsprojekt der Verfasserin geht esdarum, Schreibprozesse aus der Perspektive vonSchreibern zu rekonstruieren. Es soll beschriebenwerden, welche Rolle der Adressat beim Schreibenund für die Schreiber spielt. Wenn sich herausfindenlässt, welche Strategien Schreiber benutzen, um sich am Adressaten zu orientieren, dann lassen sich

daraus auch Überlegungen für die Vermittlung desSchreibens ableiten. Das Wissen darüber, wie versierteSchreiber den Anforderungen des Schreibens begeg-nen, ist also von unmittelbarem didaktischen Inter-esse. Schreiber, Studierende und Promovierende derUniversität Bielefeld, waren unter experimentellenBedingungen aufgefordert worden, in Gruppen zuzweit (siehe Abb. 1) gemeinsam einen Text zu pro-duzieren.

Abbildung 1: Zwei Schreiber bei der gemeinsamen Arbeit.Wenn man etwas darüber wissen will, worüberSchreiber nachdenken, während sie einen Textschreiben, dann kann man versuchen, sie zum Redenzu bringen, z.B. indem man sie gemeinsam schreibenlässt. Gemeinsames oder auch kooperatives Schreibenheißt, dass Schreiber zusammen einen Text formu-lieren. Sie haben also nicht nur die Aufgabe, einenText zu schreiben, sie sollen das darüber hinaus gemeinsam tun. Sie tauschen sich – je nach Schrei-bertyp unterschiedlich lebhaft – über verschiedeneFragen der Textproduktion aus, zum Beispiel die Zielsetzung und Struktur des Textes oder auch überFormulierungsentwürfe und Überarbeitungsschritte.Sie organisieren also gemeinsam ihre Schreibarbeitund sprechen über Entscheidungen, die sie treffen.Diese Schreibgespräche, die ebenso wie derComputerbildschirm auf Video aufgezeichnet werden,zeigen Spuren von Überlegungen, die Schreiberanstellen.

Abbildung 2: Das Computerspiel i.b.spider ist ein einfaches Denk-spiel und freeware erhältlich. Die Aufgabe bestehtdarin, die kleine Spinne durch das Labyrinth zu leitenund dabei geschickt den Wassertropfen auszuweichen.Die Rohre, in denen sich die Spinne befindet, drehensich in unregelmäßigen Abständen, so dass sich Wegeverschieben können (© Eddyware). Das Spielbesticht durch eine relativ einfache Handhabung,bedeutet aber für die Schreiber teilweise aufwendigeFormulierungsarbeit, zum Beispiel bei der Benennungder Spielobjekte.

Page 33: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

31Forschung an der Universität Bielefeld 25/2003

Schreibprozesse sollten so kontrolliert beobacht-bar werden. Die Aufgabe für die Schreiber war es, zu einem für sie unbekannten Computerspiel (sieheAbb. 2) eine Spielanleitung zu verfassen. Dazumussten sie sich das Spiel in einem ersten Schrittselbst erschließen. Damit das gelingen konnte, wurdeein einfaches Spiel ausgewählt, und die Schreibgrup-pen wurden so zusammengesetzt, dass mindestensjeweils ein Mitglied über Erfahrung mit Computer-spielen verfügt. Die Hälfte der Schreibgruppen be-kam die Aufgabe, sich bei ihren Anleitungstexten anPersonen ab 50 Jahren zu orientieren. Die anderenSchreibgruppen erhielten die gleiche Aufgabe nurmit einem anderen Adressatenzuschnitt: sie solltensich Kinder im Grundschulalter als ihre Adressatenvorstellen. Den Text konnten sie am Computerschreiben und dafür alle Text- und Bildverarbeitungs-programme benutzen; sie konnten aber ebenso aufPapier und Stift zurückgreifen. Während des gemein-samen Schreibens wurden die Schreiber von zwei

Videokameras aufgezeichnet; eine dokumentierteihre Interaktion, die zweite die allmähliche Anfer-tigung des Textes am Bildschirm. Die Gespräche, die die Schreiber während des Schreibens führten,wurden transkribiert und so der Analyse zugänglich(siehe Abb. 3). In den Gesprächen über das Schrei-ben zeigt sich, dass der Adressat in verschiedenerHinsicht thematisiert wird. Dabei lassen sich deutlichzwei Verfahren unterscheiden: Der Adressat wirdentweder als ein virtuelles Konzept verhandelt, dasüber Eigenschaften und Einschätzungen an Profilgewinnt, oder er wird als ein konkreter Leser ein-geführt, dessen Bild am Beispiel einer tatsächlichenPerson skizziert wird. Welches Verfahren benutztwird, hängt davon ab, in welchem Schreibzusammen-hang der Hinweis auf den Adressaten vorkommt,nämlich ob es sich um Formulierungsentscheidungenoder um das Nachdenken über die Zielsetzung desTextes handelt.

S: ((guckt auf den Aufgabenzettel)) aber wieso personen ab f nfzig?

M: ((gie t sich etwas zu trinken ein)) da k nnte auch stehen leute die keine ahnung

von computern haben

S: << p >h ren se mal>

M: das ist zwar jetzt ne b se unterstellung aber (8) ((trinkt, guckt zum Bildschirm, auf

die Aufgabenstellung)) jA

S: ja: ( ) ((guckt zu M)) dann schlag ich voraussetzungen vor (.)

zum beispiel so was wie (.) hm sie treffen die auch hier gestellte situation vor,

also das spiel ist schon offen, der computer ist schon an und sie wissen auch h

in welcher verbindung dieses ((nickt Richtung Maus)) komische plastikk stchen

mit dem mauszeiger steht

M: hm ( ) ja ich denke wenn wir ihnen vorher erkl ren wie sie den computer

einschalten, w rde das zu weit f hren

Abbildung 3: Dies ist ein Transkriptausschnitt aus einem Schreibgespräch, in dessen Verlauf die Schreiber gemeinsam eineAnleitung für Personen ab 50 schreiben. Transkripte versuchen, das, was akustisch und visuell beobachtbar und hörbar ist,zu verschriftlichen. Dafür haben sich verschiedene Konventionen entwickelt. Leises Sprechen wird beispielsweise sodargestellt (wobei p für piano steht): << p >hören se mal>. Trotz aller entwickelten Feinheiten stellt das Transkript eineVerkürzung dar, ist aber aus Sicht der Analyse ein wichtiger Untersuchungsschritt. So können wir am Transkript über das Gespräch hinweg bestimmte Strukturen aufzeigen, vergleichbare Aspekte in verschiedenen Gesprächen finden u.a.

Page 34: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

32 Forschung an der Universität Bielefeld 25/2003

Der virtuelle Leser: ein Adressatenprofil entwickeln

Wenn die Schreiber lokale Schreibentscheidungentreffen, also zum Beispiel über Formulierungs-vorschläge, zeigt sich, welche Einschätzungen ausder Ausgangsbeschreibung „Kinder im Grundschul-alter“ oder „Personen ab 50“ erwachsen. Wie dasaussehen kann, soll einmal an einem typischen Bei-spiel nachgezeichnet werden. Es geht um die Frage,ob computerspezifisches Vokabular wie der Begriff„Cursor“ verständlich ist. Zunächst zu Vivian undMarc, die eine Spielanleitung für Kinder im Grund-schulalter schreiben. Marc erklärt den Adressatenrelativ zu Beginn der gemeinsamen Arbeit als Ange-hörigen der „Nintendo-Generation“. Damit wird erals Vertreter einer Gruppe von Computerspielfreaksbeschrieben. Beide ziehen für ihre Formulierungs-arbeit daraus die Konsequenz, den sicheren Umgangmit dem Medium Computer ebenso wie das Verste-hen computerspezifischer Ausdrücke wie „klicken“,„Maus“ und „Cursor“ vorauszusetzen. Eine andereEinschätzung treffen Anna und Timo, die ebenfallseine Spielanleitung für Kinder schreiben. Sie glaubennicht, dass Kinder im Grundschulalter „schon mal'nen Computer gesehen haben“. Dennoch entschei-den sie sich ebenfalls dafür, den Begriff „Cursor“ (imSinne von Cursortaste) zu benutzen, da ihnen dieAlternativen „Pfeiltasten“ und „Hoch-runter-Tasten“nicht viel geeigneter erscheinen. Sie sind sich aberdarüber im Klaren, dass sie den Begriff in ihrem Texterklären müssen, so urteilt Timo: „das muss mandenen dann noch so beschreiben“. Verblüffend istder Fall Marc und Simon, die eine Spielanleitung fürPersonen ab 50 verfassen. Die Einschätzung derComputerkenntnisse von Personen ab 50 fällt radikalaus. Für Marc stellt eine synonyme Beschreibung von„Personen ab 50“ die Charakterisierung: „Leute, diekeine Ahnung von Computern haben“ dar (sieheTranskriptausschnitt, Abb. 3).

Umgesetzt findet sich diese Einschätzung in ihremText aber nicht. Denn die beiden gehen gleichwohlvon bestimmten Voraussetzungen aus, die sie fürihre Arbeit verbindlich setzen. So zieht Simon aus derEinschätzung „Leute, die keine Ahnung von Com-putern haben“ die Konsequenz: „das Spiel ist schonoffen, der Computer ist schon an, und sie wissenauch äh, in welcher Verbindung dieses komischePlastikkästchen mit dem Mauszeiger steht“. DerWiderspruch zwischen Einschätzung der Eigenschaf-ten des Adressaten und dem gewählten Vorgehenfür den Text nehmen sie bewusst in Kauf und erklä-ren ihn damit, dass es „sonst zu weit führen würde“,sie also sonst zu viel erklären und umschreiben

müssten. Schreiber treffen auf der Grundlage ihrerEinschätzungen Entscheidungen über das Profil desAdressaten. Diese Entscheidungen sind folgenreich,sie haben Konsequenzen für den Text, und sie sindhäufig Auslöser für Begründungen. Sie werden hierauf der Grundlage ganz verschiedener Überlegungengetroffen. Dennoch lässt sich in allen drei Fällen eineähnliche Methode beobachten: der Adressat wird alsDifferenz zur eigenen Person, nämlich zu eigenemWissen und Erfahrungen, konstruiert. Zwischen derPerspektive der Schreiber und des Adressatenbesteht insofern eine Divergenz.

Der konkrete Leser: ein Adressatenbild zeichnen

Immer wenn Schreiber Entscheidungen darüber tref-fen, in welchem Zusammenhang der Anleitungstextsteht, wann ein solcher Text gelesen wird, wozu erdienen soll und wie er aussehen könnte, hilft ihnender Hinweis auf abstrakte Beschreibungen und Kate-gorien nicht weiter. Sie verweisen dann auf echtePersonen in ihrem Umfeld und skizzieren auf dieserGrundlage ein Bild über den Adressaten, so wie erfür sie vorstellbar ist. Zum Adressaten kann dann einKind aus dem Bekanntenkreis oder auch die eigeneMutter werden (Abb. 4).

Die Personen werden im Hinblick darauf bewertet,ob sie als Vorstellungsobjekt für den Adressatengeeignet sind. Zwei Schreiber diskutieren beispiels-weise eine längere Zeit darüber, ob die Oma deseinen überhaupt noch zur Adressatengruppe „Per-sonen ab 50“ gerechnet werden darf, denn sie ist„über fünfzig“ und „sogar weit über fünfzig“, näm-lich „fast doppelt so alt“. Damit ist sie, nach Ansichtder Schreiber, zu alt. Das Bild des Adressaten wirdgeschärft, wenn er in konkreten Lese- und Spiel-situationen verortet wird. Eine wichtige Frage, diesich für die Schreiber stellt, ist, ob die Anleitung vor dem Spielen, parallel zum Spiel oder nur beibestimmten Fragen konsultiert wird. Diese Frage hatdirekte Auswirkungen auf die Art, wie im Text zumBeispiel auf Spielobjekte verwiesen wird. Die Formu-lierung „wie Du siehst“ ist nur dann sinnvoll, wenndie Leser den Text gleichzeitig zum Spiel geöffnethaben, solche Kommentare also eindeutig zuordnenkönnen. Diejenigen Schreiber, die selbst viel Erfahrungmit Computerspielen haben, verweisen in diesenZusammenhängen auch auf eigene Erlebnisse undmachen sich damit selbst zum Adressaten ihresTextes. Marc gesteht Simon gegenüber, dass erAnleitungstexte inzwischen auch gerne „abends imBett lesen“ würde, um sich so bereits vor Spiel-

Page 35: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

33Forschung an der Universität Bielefeld 25/2003

beginn vorzubereiten. Daraus ziehen die beiden die Konsequenz, den Text so zu formulieren, dass erauch ohne das Spiel verständlich ist.

Zusammenhang von Computerspielerfahrungund Adressatenorientierung

Die Auswahl der Teilnehmer am Schreibexperimentwar zum einen dadurch gesteuert, dass sie durch ihrfortgeschrittenes Studium bereits über eine hoheSchreibkompetenz verfügen und verschiedene Texteerfolgreich produzieren können. Gleichzeitig solltensie für die Bearbeitung der Textsorte keine Formu-lierungsroutinen besitzen, das heißt, das Schreibeneiner Spielanleitung sollte für sie ungewohnt sein.Denn dadurch, so die Vermutung, würde es in denInteraktionen zu einem erhöhten Gesprächsbedarfkommen. Die Schreiber unterschieden sich hingegen

in dem Grad ihrer Computerspielexpertise; zwarhatten alle Schreiber bereits vorher einmal einComputerspiel gespielt, aber die Zeit, die sie mitComputerspielen pro Woche zubringen, variiertedeutlich (von 0 bis zu 20 Stunden). In den Datenzeigt sich, dass sich die unterschiedliche Computer-spielexpertise auch im Hinblick auf die Orientierungam Adressaten manifestiert. Diejenigen Schreiber, die selbst viel Computerspiele spielen, können sichSpielsituationen und konkrete Adressaten besservorstellen. Sie wissen eher, welche Aspekte typischer-weise in einer Anleitung behandelt werden, und siehaben während der Arbeit mehr Zeit (und auch mehrkognitive Ressourcen zur Verfügung), um über denAdressaten nachzudenken. Die Orientierung amAdressaten, so zeigt sich, stellt eine hohe Anforderungfür Schreiber dar, die vernachlässigt wird, wenn dieSchreiber grundlegendere Probleme lösen müssen.

Abbildung 4: Kinder gehen mit Computerspielen in der Regel intuitiv um. Durch trial and error erschließen sie sich die wichtigsten Spielzusammenhänge. Die Anleitungstexte, die die Schreibgruppen für Kinder verfasst haben, nehmendiese Nutzungsgewohnheiten auf, denn sie enthalten auch solche Elemente, die zum Verständnis des Spiels nicht unbedingt notwendig sind, wohl aber den Textinteressant und spannend gestalten.

Page 36: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

34 Forschung an der Universität Bielefeld 25/2003

Überlegungen für die Schreibdidaktik

Das gemeinsame Schreiben stellt nicht nur eineMethode zur Untersuchung von Schreibprozessendar, es kann auch, wie in einigen Arbeiten bereitsgezeigt, als didaktisches Medium genutzt werden.Schreiber müssen ihre Formulierungsvorschläge ihremPartner gegenüber begründen, und sie reflektierendadurch auch ihren eigenen Schreibprozess sowieSteuerungsmechanismen, die ihm unterliegen. ImHinblick auf die Relevanz des Adressaten für Schreib-prozesse ist so eine Konstellation besonders unter-stützend, denn Rollen können hier spielerischerübernommen und kommentiert werden. Je nach zulösendem Schreibproblem variieren die Verfahren, dieSchreiber im Hinblick auf den Adressaten benutzen.Die gängige Forderung: „Denk an deinen Leser“muss insofern spezifischer formuliert werden. Einewichtige Hilfe stellt für die Schreiber das Wissen übervergleichbare Rezeptionskontexte dar, genauer: dieÜberlegung, wozu und wann der Text gelesen wirdund was der mögliche Leser damit im Sinn habenkönnte. Und zuletzt: die Orientierung am Adressatenist immer eine Entscheidung, die Schreiber mehr oderweniger bewusst treffen. Für die Güte des Produktesist es wichtig, dass diese Entscheidung im Text mög-lichst konsequent verfolgt wird.

Kirsten Schindler, M.A., studierte Geschichtswissen-schaft, Romanistik und Wirtschaftswissenschaften anden Universitäten Bielefeld, Rouen und Köln. Von1998 bis 1999 arbeitete sie in einem Forschungs-projekt zum „Domänen- und kulturspezifischenSchreiben“ an der Universität Bielefeld. Seit März2000 ist sie Stipendiatin im Graduiertenkolleg „Auf-gabenorientierte Kommunikation“ und beschäftigtsich in ihrem Dissertationsprojekt mit der „Adressa-tenorientierung beim Schreiben“.

Page 37: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

35Forschung an der Universität Bielefeld 25/2003

Warum haben es „Schnellsprecher“ schwerer?

Untersuchungen zur automatischenSpracherkennung und zum aphasischenSprachverständnis

Vivian Raithel undBritta Wrede

Stellen Sie sich vor, Sie wollen schnellnoch eine Fahrkarte am Fahrkarten-automaten kaufen, bevor Ihr Zug inwenigen Minuten abfährt. Erschrecktstellen Sie fest, dass es sich um einenneuen sprachgesteuerten Automatenhandelt. In Ihrer Eile sprechen Sieüberstürzt und zu schnell. Der Automatversteht Sie nicht und bricht den Vor-gang aufgrund eines Anwendungs-fehlers ab. Hätten Sie ohne Eile innormalem Tempo gesprochen, wäredas nicht passiert. Nun hetzen Sie zumSchalter, an dem Sie auch schnellsprechend verstanden werden und IhreKarte in letzter Sekunde bekommen.Wieso können die meisten MenschenSprache in verschiedenen Tempiverstehen und der Computer nicht? Aber auch wenn wir es nicht mitautomatischen Spracherkennern zu tunhaben, können wir in Situationengeraten, in denen Mitmenschen unsnicht auf Anhieb verstehen. So fällt esbeispielsweise Schlaganfallpatientenmit einer Sprachstörung oftmalsschwerer, schnell artikulierte Sprachezu verstehen. Die Untersuchung solcher Szenarienermöglicht es uns, Erkenntnisse überdie Sprachverarbeitung zu gewinnen,die für die aphasische Therapie (beiVerlust oder starker Einschränkung derSprachfähigkeit) oder die Entwicklungvon automatischen Spracherkennerngenutzt werden können.

Phonetische Voraussetzungen

Sprache wird als Sprachsignal vom Sprecher zumHörer durch Schwingungen der Luft, die Schallwellen,übertragen. Diese Schallwellen werden erzeugt durchSchwingungen der Stimmlippen, die die Luft inSchwingungen versetzen. Die Stimmlippen vibrierendabei mit unterschiedlicher Geschwindigkeit, wasverschiedene Frequenzen erzeugt. Diese Frequenzenwerden in Hertz (Hz) gemessen und als Tonhöhewahrgenommen. Ein Hertz entspricht einer Schwin-gung pro Sekunde. Diese Schwingungen, erzeugt an den Stimmlippen, stellen die Grundfrequenz des

Sprachsignals dar (siehe Abbildung 1 auf der nächs-ten Seite).

Das Sprachsignal ist jedoch komplexer. Es bestehtaus weiteren Frequenzanteilen, die im Spektrum alsEnergiespitzen sichtbar und „Formanten“ genanntwerden. Sie entstehen durch Vokaltraktresonanzen.Der Vokaltrakt beginnt oberhalb des Kehlkopfes undendet an den Lippen. Durch Verengungen des Vokal-traktes, zum Beispiel durch Bewegungen der Zungebeim Sprechen, werden bestimmte Frequenzen ver-stärkt und andere gedämpft.

Jeder Vokal hat charakteristische Formanten-frequenzen, die sich jedoch mit verändernder

Page 38: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

36 Forschung an der Universität Bielefeld 25/2003

Sprechgeschwindigkeit verschieben können undsomit den Vokal leicht verändert klingen lassen.Daher ist die Sprechgeschwindigkeit sowohl für dasSprachverständnis beim Menschen als auch für dieautomatische Spracherkennung von zentralerBedeutung.

Intonation

Beim Sprechen wird das Sprachsignal vom Menschenbewusst und unbewusst verändert, indem vornehm-lich die Grundfrequenz (als Tonhöhe wahrgenommen)variiert wird, um emotionale Zustände, wie zum Bei-spiel Freude, Ärger oder Enttäuschung, zu signalisierenoder um bestimmte Wörter oder Satzelemente zubetonen, also zu fokussieren. In beiden Fällen wirdder oben beschriebene Grundfrequenzverlauf mani-puliert, indem er erhöht oder herabgesenkt wird.Dies geschieht durch eine Veränderung der Spannungin den Stimmlippen. Weiterhin kann eine Fokussie-rung durch eine erhöhte Lautstärke (mehr Luftdruck)oder eine Verringerung der Sprechgeschwindigkeiterreicht werden. Solche Veränderungen des Sprach-signals können einerseits gehört werden – obwohlwir uns dessen oft nicht bewusst sind – und anderer-seits auch mittels Computertechnik gut visualisiert(siehe Abbildung 1), berechnet und manipuliertwerden.

Einfluss der Sprechgeschwindigkeit auf die akustischen Merkmale

Neben der Betrachtung der Intonationskontur-manipulation ist der Einfluss der Sprechgeschwindig-keit auf die akustischen Merkmale (zum Beispiel dieFormantenstruktur) beim Sprachverständnis und derautomatischen Spracherkennung ein sehr zentralerUntersuchungsgegenstand. Zur Erhöhung derSprechgeschwindigkeit können verschiedene Strate-gien bei der Artikulation beobachtet werden. In derRegel ist bei schneller Sprache eine Annäherung derFormanten der verschiedenen Laute zu beobachten.So liegen beispielsweise die Formantenfrequenzendes [i] in einer schnell gesprochenen Variante von‘rief’ in einem ähnlichen Bereich wie die Formantendes Vokals in einer langsam gesprochenen Versionvon ‘Riff’. Allerdings werden beide Vokale in denentsprechenden Wörtern weiterhin als unterschiedlichwahrgenommen, weil der Mensch in der Lage ist, dieSprechgeschwindigkeit automatisch beim Hören mitzu berücksichtigen.

Die Reduktion der Formantenfrequenzen kanndarauf zurückgeführt werden, dass die Artikulationder einzelnen Laute früher abgebrochen wird. Daherwird die Zielposition, die für die Artikulation einesLautes charakteristisch ist, nicht mehr erreicht. In ge-wissem Sinne wird die Artikulation also undeutlicher.

Abbildung 1: Die Äußerung „DieFrau liest eine Zeitung?“ ist in Panel a) als komplexes Sprachsignal imOszillogramm, in b) mit ihren dazugehörigen Labels(den einzelnen Wörtern) und in c) als Grundfrequenzverlauf zu sehen.

Page 39: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

37Forschung an der Universität Bielefeld 25/2003

Bemüht sich eine Sprecherin oder ein Sprecherjedoch um eine deutliche Aussprache, kann durcheine höhere Geschwindigkeit der Bewegung derArtikulatoren, also zum Beispiel der Zunge, eine sol-che Reduktion der Formantenfrequenzen selbst beierhöhter Sprechgeschwindigkeit vermieden werden.Im oben genannten Beispiel würden dann die akus-tischen Merkmale zwischen den Vokalen der Wörter‘rief’ und ‘Riff’ wieder deutlich unterschieden werdenkönnen. Betrachtet man die Formantenwerte überden Verlauf der Zeit, stellt man entsprechend fest,dass sich die Werte bei einer schnellen Artikulator-geschwindigkeit schneller verändern.

Spracherkennung

Obwohl es menschlichen Hörerinnen und Hörernnormalerweise keine Schwierigkeiten bereitet, dieakustischen Merkmale der Laute entsprechend derSprechgeschwindigkeit zu verarbeiten, stellt einehohe Sprechgeschwindigkeit für die automatischeSpracherkennung ein großes Problem dar. Je schnel-ler gesprochen wird, desto mehr Fehler werden bei der automatischen Spracherkennung gemacht(vgl. Abb. 2).

Das liegt zum einen daran, dass Spracherkennungs-systeme eine durchschnittliche Sprechgeschwindig-keit trainieren, die daher auch am besten erkanntwird. Zum anderen sind gerade bei schneller Sprachedie akustischen Merkmale unterschiedlicher Lauteschwieriger voneinander zu unterscheiden.

In den Arbeiten von Britta Wrede wurde die Ideeverfolgt, das Wissen über die systematischen Ver-änderungen der akustischen Eigenschaften für dieautomatische Spracherkennung zu nutzen.

In einer Reihe von Experimenten wurde ein auto-matisches Spracherkennungssystem, das an derTechnischen Fakultät der Universität Bielefeld ent-wickelt wurde, an verschiedene Sprechgeschwindig-keiten angepasst. Dies wurde dadurch erreicht, dassdas Trainingsmaterial in unterschiedliche Geschwin-digkeitsklassen eingeteilt wurde, mit denen ge-schwindigkeitsspezifische Modelle trainiert wurden.Es stellte sich heraus, dass es bei der Erkennung imAllgemeinen besser war, eine „datengetriebene“ (aufempirisch erhobene Daten gestützte) Auswahl derkonkurrierenden tempospezifischen Modelle durch-zuführen, als die Modelle gemäß der gemessenenSprechgeschwindigkeit anzuwenden. Bei der daten-getriebenen Auswahl wurde für jede Testäußerungpro Modell eine Hypothese erzeugt, von denen dann

Abbildung 2: Wortfehlerrate im Verhältnis zur Sprechgeschwindigkeit.

Page 40: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

38 Forschung an der Universität Bielefeld 25/2003

die bestbewertete ausgewählt wurde. Das bedeutet,dass die Modelle, die die aktuell beobachtete Sprech-geschwindigkeit am besten modellieren, automatischdetektiert werden können, ohne dass die Geschwin-digkeit vorher bekannt ist.

Weiterhin konnte gezeigt werden, dass eine Ein-teilung des Trainingsmaterials aufgrund der Sprech-geschwindigkeit, gemessen anhand der durchschnitt-lichen Dauer der Laute einer Äußerung, zu einersignifikanten Verbesserung der Erkennungsleistungenführte. Die Einteilung des Trainingsmaterials basie-rend auf der gemessenen Reduktion führte zu einervergleichbaren Verbesserung. Allerdings konnteanhand detaillierter Untersuchungen der Klassifika-tionsleistungen der verschiedenen Modelle festge-stellt werden, dass die beiden Herangehensweisenunterschiedliche Verschiebungen der akustischenParameter ergeben. Es erscheint daher sinnvoll, inweiteren Arbeiten eine geeignete Kombination dieserEffekte zu verwirklichen.

Diese Untersuchungen belegen, dass eine Ausnutzung der systematischen Effekte, die eineVeränderung der Sprechgeschwindigkeit auf dieakustischen Merkmale des Sprachsignals hat, dieLeistung von Spracherkennungssystemen erheblichverbessern kann.

Sprachverständnis bei Aphasikern

Menschen arbeiten anders als Computer oderSpracherkennungssysteme allein dadurch, dass sie,auch wenn schnell gesprochen wird, in der Lagesind, das Gesagte zu verstehen. Menschen, die aber

eine Aphasie haben, was eine Beeinträchtigung voneiner oder mehreren der „Modalitäten“ Verstehen,Sprechen, Lesen oder Schreiben bedeutet, könnennicht immer ohne Weiteres alles Gesprocheneverstehen. Die Kommunikation mit Aphasikern istdadurch erheblich erschwert. Oftmals wird jedochder Eindruck gewonnen, dass Aphasiker rechtmühelos einem Gespräch folgen können. Auch aufFragen scheinen sie ohne weitere Schwierigkeiten zureagieren und zu antworten. Reagiert der Aphasikerallerdings „falsch“, werden seine Sprachverständnis-defizite sehr deutlich. Vivian Raithel versuchte daherin zwei verschiedenen Studien herauszukristallisieren,wie schwer Broca- und Wernicke-Aphasiker1 generellbeim Erfassen von „Suprasegmentalia“ (Intonationund Prosodie) beeinträchtigt sind und zudem, wel-cher akustische Parameter – wenn manipuliert – dengrößten positiven Einfluss auf das Sprachverständnishat.

Können Aphasiker Sprachmelodien verstehen?

In der ersten Studie hat Vivian Raithel untersucht,inwieweit Aphasiker in der Lage sind, bestimmteIntonationskonturen (Fragen und Aussagen; sieheAbb. 3) zu erkennen.

Die Versuchspersonen – Aphasiker und gesundeKontrollpersonen – hörten verschiedene Fragen undAussagen2, einmal „normal“ und einmal technischmodifiziert. Die Modifizierung bewirkte, dass derInhalt nicht mehr zu verstehen, der Grundfrequenz-verlauf, also die Sprachmelodie, aber noch gut zuerkennen war (siehe Abbildungen 4 und 5).

Abbildung 3: Die Intonationskontureiner Aussage (oben) und einerFrage (unten).

Page 41: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

39Forschung an der Universität Bielefeld 25/2003

Als Ergebnis wurde festgestellt, dass die gesundenKontrollpersonen mit fast 100%iger Korrektheit dieIntonationskonturen erkannt hatten. Die Aphasikerhatten die Intonationskontur mit einer 70- bis80%igen Korrektheit erkannt. Bei beiden Gruppen

fiel auf, dass die Frageintonation „einfacher“ zuerkennen war. Insgesamt zeigen diese Ergebnisse,dass die Sprachmelodie eine wichtige Größe für dasSprachverständnis ist und durchaus unterstützend inder Therapie eingesetzt werden kann.

Abbildung 4: Die Äußerung „Der Hund frisst Hundefutter“ ist in Panel a) als komplexes Sprachsignal im Oszillogramm, in b) mit seinendazugehörigen Labels und in c) als Grundfrequenzkontur zu sehen.

Abbildung 5: In Panel a) ist das kontinuierliche Sprachsignal derÄußerung „Die Frau liest eine Zeitung?“ zu sehen. In b) ist deutlich zu erkennen, dass das Sprachsignal mit einem Tiefpassfilter gefiltertwurde; darüber ist der schematische Grundfrequenzverlauf zu erkennen.In c) ist das Signal durch Wort-Labels zu lesen.

Page 42: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

40 Forschung an der Universität Bielefeld 25/2003

siehe Abb. 6) wurde für die Parametermanipulationeingesetzt, und mittels Sprachsynthese wurdeneinzelne Inhaltswörter (Farbe, Form oder Größe) ineinem der drei Parameter verändert.

Hier zeigen die Ergebnisse, dass die Patienten einedeutlich bessere Leistung beim Token-Test zeigen,wenn die Sprechgeschwindigkeit verändert, alsoverlangsamt wurde. Tonhöhe und Lautstärke spielenbeim Verstehen für Aphasiker eine eheruntergeordnete Rolle.

Abbildung 7:Die Aufforderung „Zeigen Sie den weißen Kreis“ ist in Panel a) als komplexes Sprachsignal imOszillogramm, in b) mit ihrendazugehörigen Labels und in c) als Grundfrequenzkontur zusehen, wobei eine leichte Erhöhungder Grundfrequenz bei dem Wort„weißen“ zu erkennen ist, was die Manipulation durch die Sprach-synthese verdeutlicht.

Abbildung 6: Die aphasische Patientin zeigt auf den weißen Kreis, nachdem die Aufforderung „Zeigen Sie den weißen Kreis“ über das Tonband dargeboten wurde.

Und wie gut unterstützen Grundfrequenz, Dauer und Intensität das auditive Sprachverständnis?

In einem zweiten Test wurde untersucht, ob eineManipulation des Sprachsignals eines Wortes durcheine erhöhte Intensität, veränderte Grundfrequenzoder verlangsamte Dauer das Sprachverständnis für Aphasiker in bestimmten Kontexten erleichtert.Eine bearbeitete Version des Token-Test (Unter-suchungsinstrument aus der Aphasiediagnostik;

Page 43: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

41Forschung an der Universität Bielefeld 25/2003

1 Broca-Aphasiker haben ein generell gut erhaltenesSprachverständnis, jedoch eine erschwerte und reduzierteSprachproduktion. Wernicke-Aphasiker produzieren vielund scheinbar mühelos – wenn auch oftmals inhaltlichschwer verständlich –, sie haben große Schwierigkeitenbeim Sprachverständnis.

2 Die Aussagen wurden einerseits mit einer steigendenFrageintonation und andererseits mit einer fallendenAussageintonation gesprochen.

Die erste Untersuchung zeigt deutlich, dass es einFehlschluss ist, wenn angenommen wird, dass einAphasiker immer versteht, was er gefragt wird, auch wenn seine Reaktion dies teilweise vermittelt.Aphasiker können generell zwischen Fragen undAussagen unterscheiden, auch wenn ihnen der Inhaltoftmals verschlossen bleibt. Darüber hinaus sollte inder Kommunikation mit Aphasikern nicht lauter odermit einer erhöhten Tonlage gesprochen werden,sondern nur langsamer. Aphasiker brauchen mehrZeit, um das Gehörte zu verarbeiten.

Vivian Raithel, M.A., M.A., hat zunächst an derUniversität Hamburg Amerikanistik, Phonetik undGebärdensprache studiert. Danach studierte sie ander Universität Bielefeld Linguistik (Schwerpunkt:Klinische Linguistik), Psychologie und Anglistik. Inihrer Dissertation im Graduiertenkolleg „Aufgaben-orientierte Kommunikation“ an der UniversitätBielefeld beschäftigt sie sich mit der Perzeption vonsynthetisch veränderten akustischen Merkmalen der Prosodie bei Broca- und Wernicke-Aphasikern.

Dr. Britta Wrede studierte Linguistik, Informatik und Psychologie an der Universität Bielefeld. Ihre Forschungsschwerpunkte sind in der automatischen Spracherkennung und Sprachverarbeitungangesiedelt. In ihrer Dissertation an der Technischen Fakultätuntersuchte und modellierte sie die Auswirkungen von Varia-tionen der Sprechgeschwindigkeit auf automatische Sprach-erkennungssysteme. Sie führt ihre Arbeiten nun am InternationalComputer Science Institute in Berkeley, USA, mit einer neuenSchwerpunktsetzung auf Information Retrieval fort.

Page 44: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

42 Forschung an der Universität Bielefeld 25/2003

„Zeig mir, was du von mir willst!“

Gesten für natürliche Kommunikationzwischen Mensch und Maschine

Christian Lange

Die Benutzung von Computern undanderen technischen Geräten scheitertoftmals an ihrer viel zu kompliziertenBedienung. Der Anwender muss erstviele Seiten eines Handbuchs lesen,bevor er zum Beispiel eine Telefon-nummer in seinem Handy abspeichernkann. Wenn er dann nach ein paarWochen eine weitere Rufnummer ein-programmieren möchte, so hat er dasmeiste vergessen und greift – nacheinigen missglückten Versuchen, beidenen er vielleicht das bestehendeTelefonbuch ungewollt löscht – frus-triert erneut zum Handbuch. Obwohlder Funktionsumfang technischerGeräte in den letzten Jahren rapidezugenommen hat, bestehen dieBenutzerschnittstellen nach wie voraus einer Vielzahl kleiner Knöpfe,deren Benutzung mühsam gelerntwerden muss.

Abbildung 1: Bisher erfordern die Bedienelemente der meisten Geräte, dass der Benutzer ein Handbuch liest.

Page 45: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

43Forschung an der Universität Bielefeld 25/2003

Vereinfachung für den Benutzer

Einem anderen Menschen zu erklären: „Ich möchte,dass der Videorecorder heute Abend um 20.15 Uhrden Film im zweiten Programm aufzeichnet“, fälltuns viel leichter, als die entsprechenden Tasten amGerät zu betätigen. Angesichts der Leistungsfähigkeitheutiger Computer sollte es möglich sein, eine Be-nutzerschnittstelle zu entwickeln, die dem Menschensoweit entgegenkommt, dass er kein Handbuchmehr zu Rate ziehen muss. So ein System würdedem Anwender viel Zeit ersparen. Er braucht dieBedienung nicht zu erlernen, und das Sprechen derAnweisung geht außerdem wesentlich schneller alsdie Eingabe über Tasten. Ein weiterer Vorzug eineran den Menschen angepassten Mensch-Maschine-Schnittstelle besteht darin, dass der Benutzer sichnicht auf die Bedienung des Gerätes zu konzentrieren

braucht. Während er dem Autoradio sagt: „Sei still!“,gilt seine Aufmerksamkeit weiterhin der kompliziertenVerkehrssituation.

Ausgangspunkt: Natürliche Kommunikation

Unsere natürlichen Kommunikationskanäle sind inerster Linie Sprache und Gestik. Letztere wird dabeimeist ergänzend zur Sprache eingesetzt, etwa beiAufforderungen wie „Gehe dort entlang“ oder beiBeschreibungen wie „Der Hund ist so groß“. Hand-bewegungen werden aber auch eingesetzt, umBewegungsabläufe vorzumachen, die schwer zubeschreiben sind, wie zum Beispiel das Binden einerSchleife. Die Kommunikation mit Hilfe dieser Moda-litäten lernen wir schon im Kindesalter. Wenn wir siezur Kommunikation mit Maschinen einsetzen können,wird das Benutzen technischer Geräte „kinderleicht“.

Abbildung 2: Eine Person wähltObjekte aus, die auf einerProjektionswand angezeigtwerden. Die Kommunikationmit der Maschine soll in diesemSzenario ausschließlich durchdas Beobachten des Menschenrealisiert werden.

Page 46: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

44 Forschung an der Universität Bielefeld 25/2003

Verschiedene Arten von Gesten

Gesten, die uns aus der Kommunikation mit Men-schen geläufig sind, verwenden die meisten Men-schen intuitiv, ohne darauf zu achten. Wenn derComputer diese Gesten auswertet und damit denMenschen besser versteht, so wird die Mensch-Maschine-Kommunikation verbessert, ohne dass derMensch etwas dazulernen muss. Zu solchen Gesten,die insbesondere in Verbindung mit Sprache auf-treten, zählen die Blickrichtung (mit der wir zeigen,welche Objekte unserer Umgebung uns interessie-ren), das Zeigen auf Gegenstände oder das Nicken(mit dem wir Einverständnis signalisieren).

Gesten können auch die Bedienung sehr kom-plexer Software vereinfachen. Um beispielsweise eindreidimensionales Objekt am Bildschirm zu bearbei-

ten, sind Maus und Tastatur sehr umständlich. Hand-bewegungen im dreidimensionalen Raum sind fürdiese Aufgaben wesentlich besser geeignet und ein-facher, selbst wenn dazu Gesten festgelegt werden,an die sich der Mensch halten muss. Kommunikationüber Gesten und Sprache kann ferner dort helfen, woSchmutz oder Feuchtigkeit den Einsatz von Tastaturund Maus verhindern oder wenn der Benutzer gleich-zeitig eine Tätigkeit ausführt, bei der er beide Händebenötigt. Solche Situationen ergeben sich in Laboren,Werkstätten oder Küchen. Aufgrund dieser zahl-reichen Einsatzmöglichkeiten ist zu hoffen, dass dienatürlichen Kommunikationsfähigkeiten des Men-schen schon bald stärker in die Mensch-Maschine-Kommunikation einbezogen werden können.

Abbildung 3: Das System sucht Bereiche mitHautfarbe, da diese recht sicher zur gesuchtenPerson gehören. Darüber hinaus sind Händeund Gesicht für Gestenerkennung die wichtigs-ten Körperteile.

Page 47: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

45Forschung an der Universität Bielefeld 25/2003

Technische Umsetzung dieser Vorgaben

Welche Voraussetzungen seitens eines technischenSystems sind nun erforderlich, um eine solche Schnitt-stelle zu realisieren? Zunächst muss der Computer mitSensoren ausgestattet werden, die Sprache und Gestikwahrnehmen. Leistungsfähige Mikrofone zur Sprach-aufnahme sind schon seit einiger Zeit im Einsatz, wäh-rend an geeigneten Sensoren für die Erkennung vonGesten noch gearbeitet wird. Datenanzüge oder Daten-handschuhe, die dem Menschen angelegt werden undüber Kabel mit dem Rechner verbunden sind, liefernzwar die gewünschten Informationen, sind aber fürden Benutzer unpraktisch, unhandlich und zu zeitauf-wendig. Sie müssen schließlich immer erst angelegtwerden, bevor mit einem Gerät kommuniziert werdenkann. Wenn wir Menschen uns unterhalten, so neh-men wir die Gesten unseres Gegenübers visuell wahr.

Gestenerkennung durch Sehen

Ziel des im folgenden beschriebenen Promotionspro-jektes ViGeM (visuelle Erkennung von Körperhaltungund Gesten für multimodale Mensch-Maschine-Kommunikation) des Verfassers ist die Entwicklungeines Systems, das Gesten ausschließlich ausKamerabildern erkennt und diese für verschiedeneAnwendungen nutzbar macht. Eine vor dem Bild-schirm oder einer Projektionswand stehende Personwird von zwei Kameras aufgenommen, deren Bilderzur Verarbeitung an den Computer weitergeleitetwerden. Im ersten Schritt muss dieser erkennen,welcher Teil der Bilder zur Person gehört und welcheKörperhaltung die Person gerade einnimmt. Da ver-schiedene Personen unterschiedlich groß sind undunterschiedliche Kleidung tragen und die Gesten-erkennung auch bei unterschiedlichen Lichtverhält-

Abbildung 4: Um die Körperhaltung zuermitteln, muss das System die komplettePerson ausschneiden. Dies ist eine komplizierteAufgabe, denn für eine Maschine besteht ein Bild nur aus einer Vielzahl bunter Punkte.Sie „erkennt“ keine Objekte.

Page 48: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

nissen und weiteren Personen im Bild robust funktio-nieren soll, ist dies eine schwierige Aufgabe.

Vom Gehirn abgeschaut: Modell der Realität

Das Modell eines Menschen hilft dem System bei derLösung. Wenn der Rechner die Person erst einmalgefunden hat, speichert er ihre Position und Posturab und weiß so, wo er im nächsten Augenblick bzw.im nächsten Bild danach suchen muss. Dieses Prinzipverwenden auch wir Menschen. Wir haben ständigein Modell unserer Umgebung im Kopf, das wir mitHilfe dessen, was wir sehen, aktualisieren. Dadurchkönnen wir nach einem Gegenstand greifen, ohnehinzuschauen oder ein paar Schritte mit geschlos-senen Augen gehen, ohne irgendwo anzustoßen.

Das vom Rechner verwendete Modell der Person hatebenso viele Gelenke wie ein Mensch, und dieseGelenke besitzen die gleiche Beweglichkeit wie dieeines Menschen. Dadurch kann der Algorithmusüberprüfen, ob die geschätzte Haltung der Personüberhaupt möglich ist. Darüber hinaus hat dasSystem durch die Verwendung zweier Kamerasimmer zwei Perspektiven der Szene zur Verfügung,um beispielsweise einen Arm auch dann sehen zukönnen, wenn er aus einer Blickrichtung hinter demKörper liegt.

Zusammenspiel verschiedener Algorithmen: Ausbeiden Bildern extrahieren verschiedene AlgorithmenMerkmale zur Schätzung der Position der Körper-glieder. Die wichtigsten Merkmale sind Bildbereichemit Hautfarbe und Bildbereiche, in denen seit demletzten Bild eine Veränderung aufgetreten ist. Dieses

46 Forschung an der Universität Bielefeld 25/2003

Abbildung 5: Vom Rechnerverwendetes Modell zur Speicherung und Illustration desbeobachtetenKommunikationspartners.

Page 49: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

47Forschung an der Universität Bielefeld 25/2003

Beobachten von Bewegungen ist eine weitere Eigen-schaft, die der menschlichen Informationsverarbei-tung nachempfunden ist, denn auch unser Gehirnbraucht das Modell seiner Umgebung nur an denStellen zu aktualisieren, an denen eine Veränderungaufgetreten ist.

Die weiteren Algorithmen zur Gestenerkennungarbeiten anschließend nur auf den Daten des Modells.Sie haben die Aufgabe, in der endlosen Folge vonKörperhaltungen nach Gesten zu suchen. Hierbeimuss berücksichtigt werden, dass Gesten in unter-schiedlicher Geschwindigkeit und Größe auftreten.

Von einem gelungenen Gestenerkennungssystemist zu erwarten, dass die immer allgegenwärtigerwerdenden Computer einfacher benutzt werdenkönnen und dem Menschen weniger technischesWissen abverlangen.

Christian Lange hat im Jahr 2000 seinDiplom in „NaturwissenschaftlicherInformatik“ an der Universität Bielefeldgemacht. Danach war er als wissenschaft-licher Mitarbeiter an der TechnischenFakultät tätig. Seit April 2002 arbeitet erim Graduiertenkolleg „AufgabenorientierteKommunikation“ an seinem Dissertations-projekt „Visuelle Erkennung von Körper-haltung und Gesten für multimodaleMensch-Maschine-Kommunikation“. SeineForschungsinteressen beziehen sich aufComputersehen, intelligente Mensch-Maschine-Kommunikation und mobileRoboter.

Page 50: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

48 Forschung an der Universität Bielefeld 25/2003

„Guck mal, wer da spricht!“

Aufmerksamkeitssteuerungfür mobile Roboter

Sebastian Lang

Stellen Sie sich vor, Sie befinden sichauf einer Party. Einer der Gäste sprichtSie an. Obwohl gleichzeitig andereGäste an verschiedenen Stellen mitein-ander reden, sind Sie problemlos in derLage, diesen Gast von den anderen zuunterscheiden und ihn als Ihren neuenKommunikationspartner zu erkennen.Während Sie diese Erkennungsleistungfast ohne Anstrengung erbringen, stelltdie gleiche Aufgabe für einen Robotereine große Herausforderung dar. EinRoboter muss dazu sehen und hörenund das Wahrgenommene entsprechendinterpretieren können. Das Erkennendes Kommunikationspartners ist ins-besondere für mobile Roboter wichtig,die mit Mikrofonen alles Gesprochenein ihrer Umgebung registrieren, abernur auf das reagieren sollen, was wirk-lich an sie gerichtet ist.

Service-Roboter

Roboter zu Hause, die uns lästige Tätigkeiten imHaushalt abnehmen oder uns Unterhaltung bieten,Roboter in öffentlichen Gebäuden, die uns zu einemgewünschten Zielort führen und uns mit Informatio-nen versorgen – all dies klingt noch nach fernerZukunft und Stoff für Science-Fiction. Doch schonheute sind Unterhaltungsroboter, wie zum Beispielder Roboterhund Aibo der Firma Sony, oder Haus-haltsroboter, wie zum Beispiel der StaubsaugerroboterRoomba der Firma iRobot, im Handel erhältlich.Während diese Systeme dem Benutzer nur starkeingeschränkte Interaktionen erlauben, werden inder aktuellen Forschung Roboter mit wesentlicherweiterten Kommunikationsfähigkeiten entwickelt.In den geplanten Anwendungsszenarien, sei es, dassein Roboter den Besuchern eines Museums Führun-gen gibt oder dass Roboter alte, hilfsbedürftigeMenschen pflegen, muss berücksichtigt werden, dassdie potenziellen Anwender in der Regel keine Robo-ter-Fachleute sind und daher keine Erfahrung in derNutzung solcher Systeme besitzen. Um dennoch eine

hohe Akzeptanz bei den Anwendern zu erzielen,müssen Roboter folgende Eigenschaften aufweisen:Sie müssen intuitiv bedienbar sein, schnell undakkurat auf Anweisungen reagieren und außerdemklar verständliche Rückmeldungen an den Benutzergeben.

Ergonomische Mensch-Roboter-Schnittstelle

Ein Schwerpunkt der Roboterforschung ist dieEntwicklung ergonomischer Schnittstellen zwischenMensch und Roboter. Sie sollen es dem Anwendererlauben, in einer dem Menschen gewohnten Weisemit dem Roboter zu kommunizieren. Dabei spieltSprache eine bedeutende Rolle. Aber auch andereModalitäten der zwischenmenschlichen Kommunika-tion, wie zum Beispiel Gestik und Mimik, sollen beider Instruktion des Roboters berücksichtigt werdenkönnen. Eine natürliche Mensch-Roboter-Schnitt-stelle verbietet die Verwendung artifizieller Eingabe-geräte wie Tastatur, Touchscreen oder Datenhand-schuh. Damit der Roboter den Anwender und dieUmgebung wahrnehmen kann, muss er mit einer

Page 51: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

49Forschung an der Universität Bielefeld 25/2003

Reihe unterschiedlicher Sensoren ausgestattet sein.Häufig werden Kameras und Mikrofone sowieAbstandsmessgeräte basierend auf Ultraschall oderLaser verwendet. So liefert eine Kamera nur Bildervon Objekten, die sich in einem von der Brennweiteabhängigen Öffnungswinkel vor dem Objektiv be-finden. Um mit den Sensoren genau die relevantenBereiche zu erfassen, ist eine entsprechende Auf-merksamkeitssteuerung erforderlich, die den Roboterund die beweglichen Sensoren steuert. In seinemDissertationsprojekt beschäftigt sich der Verfasser mitder Entwicklung einer Aufmerksamkeitssteuerung für einen mobilen Roboter, um den Kommunikations-partner zu erkennen und während der Interaktion zuverfolgen.

Detektion des Kommunikationspartners

Um jederzeit Anweisungen entgegennehmen zukönnen, müssen Service-Roboter sich in einem dauer-haften Bereitschaftszustand befinden. Dennoch dür-

fen sie nicht auf jede sprechende Person reagieren.So kann die Situation auftreten, dass sich zweiMenschen in der Nähe des Roboters unterhaltenoder jemand telefoniert. Ein Roboter mit intelligenterMensch-Roboter-Schnittstelle muss folglich aus der Menge der anwesenden Personen diejenigeerkennen, die zu ihm spricht. Um diese Vorgabe zuerfüllen, benötigt der Roboter folgende Fähigkeiten:Er muss die Personen in seiner Nähe registrieren undsie im Verlauf der Zeit beobachten und verfolgenkönnen. Zudem muss er geeignete Personeneigen-schaften ermitteln können, anhand derer der Kommunikationspartner bestimmt werden kann.

Der mobile Roboter

Für diese Forschungen steht in Bielefeld ein People-Bot der Firma ActivMedia zur Verfügung. Es handeltsich dabei um einen mobilen Roboter mit einemDurchmesser von etwa 0,5 m und einer Gesamthöhevon 1,5 m. Seine Höhe macht ihn insbesondere für

Abbildung 1: Aufgrund derMobilität des Roboters kann diePosition des Benutzers variieren.In Szenen wie dieser kommt er-schwerend hinzu, dass mehrerepotenzielle Benutzer gleichzeitiganwesend sind. In diesem Fallmuss der Roboter in der Lagesein, selbstständig seinen Kom-munikationspartner zu finden.

Page 52: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

50 Forschung an der Universität Bielefeld 25/2003

die Interaktion mit stehenden Menschen geeignet.Folgende Sensoren stehen dem System zur Verfügung:In einer Höhe von 30 cm ist ein Laser-Abstands-messer eingebaut. Auf der oberen Plattform desRoboters sind eine bewegliche Kamera und zweiMikrofone angebracht. Wie der Roboter unter Ver-wendung der genannten Sensoren seinen Kommu-nikationspartner erkennen kann, wird im Folgendenbeschrieben.

Laser-Abstandsmesser, Stereo-Mikrofon und Kamera

Der verwendete Laser-Abstandsmesser arbeitet aufdem Prinzip der Time-of-Flight-Messung. Dabei wer-den kurze Laser-Impulse ausgesendet. Werden diesevon einem Hindernis zurück zum Sensor reflektiert,so kann aus der dabei verstrichenen Zeit unter Be-rücksichtigung der Lichtgeschwindigkeit der Abstandzum Hindernis berechnet werden. Der Laser-Abstands-messer erfasst alle Objekte auf einer Höhe innerhalbeines Öffnungswinkels von 180 Grad mit einer Auf-lösung von einem halben Grad. Die Messgenauigkeitliegt etwa bei einem Zentimeter. Um diese Genauig-keit zu erreichen, muss das Gerät in der Lage sein,Zeitunterschiede im Bereich von Zehntel-Nanosekun-den aufzulösen.

In der Regel werden Laser-Abstandsmesser beimobilen Robotern zur Lokalisation und zur Erken-nung von Hindernissen für die Kollisionsvermeidungeingesetzt. In Bielefeld hingegen nutzt man diesenSensor, um Beine von Menschen zu lokalisieren. Be-

Abbildung 2: Der mobile Roboter der ArbeitsgruppeAngewandte Informatik ist durch seine Gesamthöhe von1,5 m besonders für die Forschung im Bereich Mensch-Roboter-Interaktion geeignet. Er ist mit einer Reihe vonSensoren ausgestattet. Ganz oben befindet sich diebewegliche Kamera. Auf der oberen Roboterplattform sinddie Stereomikrofone angebracht. Der blaue Kasten ist derLaser-Abstandsmesser. Der Bildschirm auf der oberenRoboterplattform soll in Zukunft genutzt werden, um demBenutzer über ein animiertes Gesicht Feedback zu geben.

Page 53: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

51Forschung an der Universität Bielefeld 25/2003

dingt durch seine Einbauhöhe von 30 cm erfasst derLaser-Abstandsmesser die Beine derjenigen Men-schen, die sich in der Nähe des Roboters aufhalten.Da Beinpaare innerhalb einer Messung eincharakteristisches Muster zeigen, welches leichtautomatisch erkannt werden kann, lassen sichPersonen relativ zuverlässig lokalisieren undverfolgen. Somit liefert der Laser-Abstandsmesserden Abstand und den Winkel von Personen relativzum Roboter und stellt damit eine wichtigeGrundlage zur Erkennung von Kommunika-tionspartnern dar.

Ein Kommunikationspartner zeichnet sich ins-besondere dadurch aus, dass er zum Roboter spricht.Um zu erkennen, welche der anwesenden Personender Sprecher ist, werden Stereo-Mikrofone einge-setzt. Die Mikrofone sind an den Seiten der oberenRoboterplattform in einem festgelegten Abstandmontiert. Sobald sich der Sprecher nicht genau in derMitte vor dem Roboter befindet, ist er einem Mikro-fon näher als dem anderen. Beide Mikrofone erreichtdasselbe Sprachsignal dann, bedingt durch denunterschiedlichen Abstand zur Sprachquelle, miteinem zeitlichen Versatz. Steht der Sprecher genau inder Mitte vor dem Roboter, ist der Versatz gleichnull. Um den Sprecher zu lokalisieren, wird ein kurzerAusschnitt aus der mit dem linken Mikrofon aufge-zeichneten Sprachsequenz mit dem entsprechendenAusschnitt der mit dem rechten Mikrofon aufgezeich-neten Sprachsequenz verglichen. Die Ausschnittewerden so gegeneinander verschoben, dass siemöglichst gut übereinstimmen. Aus der zugehörigenZeitdifferenz und der Kenntnis über die Anordnungder Mikrofone lässt sich die Richtung des Sprechers

Abbildung 3: Ein Benutzer während der Interaktion mitdem Roboter. Die folgenden beiden Bilder zeigen, was derRoboter in dieser Situation mit der Kamera und demLaser-Abstandsmesser sieht.

Abbildung 4: Die Kamera erfasst den oberenKörperbereich des Benutzers. Für die Mensch-Roboter-Interaktion spielen der Kopf und dieHände eine große Rolle.

Page 54: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

52 Forschung an der Universität Bielefeld 25/2003

bestimmen.Um zu entscheiden, ob die Äußerung eines

Sprechers an den Roboter gerichtet ist, müssen nochweitere Merkmale berücksichtigt werden. Ausschlag-gebend ist dabei die Blickrichtung beziehungsweisedie Stellung des Kopfes. In der Regel ist das Gesichteines Sprechers auf seinen Adressaten gerichtet. Um zu erkennen, ob eine Person in Richtung desRoboters schaut, werden in den Bildern, die von derKamera geliefert werden, Gesichter gesucht. Diesesist eine anspruchsvolle Aufgabe, da Abbildungen vonGesichtern sehr unterschiedlich ausfallen können:Gesichter sind von Mensch zu Mensch verschieden,die Beleuchtung kann variieren und, da die Positionund der Abstand nicht bekannt sind, kann das Ge-sicht an jeder Stelle mit beliebiger Größe abgebildetsein. Um die Aufgabe effizient zu lösen, erfolgt dieSuche nach Gesichtern in zwei Schritten. Zunächstwerden Bildbereiche bestimmt, in denen gehäufthautfarbene Bildpunkte vorhanden sind. Da Ge-sichter nur in diesen Bereichen vorkommen können,wird die weitere Suche darauf beschränkt. Dazuwerden an den entsprechenden Stellen Teilbilder aus-geschnitten. Auf Basis der Helligkeitsverteilung derBildpunkte innerhalb des Teilbildes wird entschieden,ob es sich dabei um ein Gesicht handelt. War derSuchprozess erfolgreich, so wird aus der Position undder Größe der Abbildung des Gesichts im Gesamtbilddie Position der Person relativ zum Roboter bestimmt.

Kombination der Daten

Die Auswertung der drei verschiedenen Sensordatenvon der Kamera, den Mikrofonen und dem Laser-Abstandsmesser erfolgt in drei unabhängigen, parallellaufenden Prozessen. Die Prozesse sind nicht syn-chronisiert. So werden beispielsweise Messdaten des

Laser-Abstandsmessers fünf Mal pro Sekunde aus-gewertet, wohingegen die Auswertung des Kamera-bildes je nach Anzahl hautfarbener Bereiche besten-falls drei Mal pro Sekunde erfolgt. Um die verschieden-artigen Informationen zu verknüpfen, senden diedrei Prozesse ihre Auswertungsergebnisse an einModul, welches für jede erkannte Person eineinterne symbolische Repräsentation aufbaut. DieZuordnung der gesendeten Daten an die Personen-repräsentationen erfolgt anhand der ermitteltenPositionsangaben: von den Beinpaaren und denGesichtern sind jeweils der Abstand und der Winkelbekannt, von der Sprachquelle der Winkel, derAbstand lässt sich mit Stereo-Mikrofonen nichtbestimmen.

Steuerung des Roboters

Für die Detektion des Kommunikationspartners wer-den drei Personenmerkmale herangezogen. Zunächstwird aus dem zeitlichen Verlauf der Position einerPerson die Bewegung bestimmt. Nur eine stehendePerson wird als Kommunikationspartner in Betrachtgezogen. Das zweite Merkmal gibt an, ob eine Per-son spricht. Nur ein Sprecher kommt als Kommu-nikationspartner in Frage. Das dritte Merkmal ist dieKopfstellung. Nur wenn der Sprecher in Richtung desRoboters schaut, wird er als Kommunikationspartnerangesehen. Während die beiden zuerst genanntenMerkmale „stehen“ und „sprechen“ für alle Perso-nen, die sich vor dem Roboter aufhalten, jederzeitangegeben werden können, gilt das für das dritteMerkmal aufgrund des begrenzten Sichtbereichs derKamera nicht immer für alle Personen. Daher ist eineintelligente Steuerung des Roboters und der Kameranotwendig. Sobald für eine Person alle Merkmalebekannt sind und mit den Eigenschaften desKommunikationspartners übereinstimmen, richtet der

�Abbildung 5: In denentsprechenden Messdatendes Laser-Abstandsmesserserkennt man besondersgerade Linien, die ausebenen Oberflächen wieWänden und Möbelnresultieren. Auch die Beineeines Menschen ergeben eincharakteristisches Muster,hier gekennzeichnet durchden roten Pfeil.

Page 55: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

53Forschung an der Universität Bielefeld 25/2003

Sebastian Lang studierte an der UniversitätBielefeld Naturwissenschaftliche Informatikund schloss sein Studium 2000 mit demDiplom ab. Seit Februar 2001 ist er Stipen-diat im Graduiertenkolleg „Aufgabenorien-tierte Kommunikation“. Sein Dissertations-projekt erfolgt in Kooperation mit derArbeitsgruppe Angewandte Informatik derTechnischen Fakultät. Der Schwerpunktseiner Forschung liegt auf der Entwicklungeiner Aufmerksamkeitssteuerung für mobileRoboter.

Roboter seine Aufmerksamkeit auf die Person, indemer sich und die Kamera entsprechend ausrichtet.Damit wird dem Benutzer signalisiert, dass er erkanntworden ist. Die Aufmerksamkeit bleibt aufrechterhalten, auch wenn die Person nicht mehr spricht.Sobald eine andere Person spricht, wird bestimmt, obsie in Richtung des Roboters schaut. Dazu wird,wenn der Sprecher nicht im Bild ist, die Kamerakurzfristig auf den Sprecher gerichtet. Ist eine anderePerson als Kommunikationspartner erkannt worden,so richtet der Roboter sein Aufmerksamkeit neu aus.

Aufmerksamkeitssteuerung

Mit dem beschriebenen System ist der Roboter nunin der Lage, seinen Kommunikationspartner zu er-kennen und seine Aufmerksamkeit auf ihn zu richten.Diese Fähigkeit stellt wiederum die Voraussetzungfür eine weitere Interaktion dar. Mit diesem Systemist eine Aufmerksamkeitssteuerung beschrieben, diezur Ausrichtung eines mobilen Roboters auf denKommunikationspartner dient. In folgenden Arbeitensoll der Aufmerksamkeitsbegriff weiter gefasst unddie Aufmerksamkeit auf Objekte erweitert werden,auf die der Benutzer in einem Dialog mit dem Robo-ter verweisen kann. Als Anwendung ist geplant, denmobilen Roboter zu instruieren, Pflanzen in einemRaum zu gießen.

Abbildung 6: Dieses Beispiel zeigt beispielhaft das Verhalten des Roboters R bei Anwesenheit zweier Personen A und B. In (1) ist Person A bereits als Kommunikationspartner (KP) erkannt. Der Roboter hat seine Basis und seine Kamera auf Agerichtet. Obwohl Person A in (2) aufhört zu sprechen, wird sie weiterhin vom Roboter als KP betrachtet. Im folgendenBild (3) beginnt die andere Person zu sprechen. Da sie von der Kamera nicht erfasst wird, hat der Roboter keine Informationüber die Blickrichtung. Dazu richtet er die Kamera in (4) auf die Person B, für die nun alle Merkmale des KPs erfüllt sind.Um die Aufmerksamkeit vollständig auf Person B zu richten, dreht der Roboter in (5) auch seine Basis.

Page 56: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

54 Forschung an der Universität Bielefeld 25/2003

Im Folgenden betrachten wir daher Beispiele fürkontextabhängige Exploration und dynamische Weg-planung für mobile Roboter in unbekannten, ver-änderlichen Umgebungen und zur Fingerpositionierungeiner simulierten künstlichen Hand. Für Roboterarmeund -hände wird typischerweise zunächst mit Hilfevon Kameras die Aufmerksamkeit visuell auf ein fürdie Exploration „interessantes“ Objekt gelenkt. Dann

Wie finden Roboter ihre Wege in einer unbekannten Welt?

Aufgabenorientierte Explorationin der Robotik mit Hilfe neuronaler Netze

Dmitry Lebedev

Unter „Explorieren“ – das ist einklassisches Problem in der Robotik –wird häufig die Aufgabe verstanden,unbekannte Eigenschaften einer Um-gebung zu entdecken. So spielt zumBeispiel der Explorationsprozess einewichtige Rolle beim Greifen von sogenannten Roboter-Manipulatoren(beispielsweise ein Roboterarm mitdazugehöriger Hand). Weil die „Haupt-sinnesorgane“ – normalerweise ein„Sehsystem“ (Kameras) und taktile(berührungsempfindliche) Sensorik anden Fingerspitzen – eines Manipula-tors eine geräuschempfindliche Infor-mation liefern, hat der Roboter nurunpräzises Wissen von der Umgebungeines Zielobjektes und muss sie ersterkunden. Und das steht im Gegensatzzu einem erwachsenen Menschen, derdiese Tätigkeit automatisch ausführt.Da „Explorieren“ zunächst „Bewegen“bedeutet, müssen dafür auch Pfad-planungsmechanismen angewendetwerden. Dazu werden Algorithmen ausdem Bereich der neuronalen Netzeeingesetzt, die aufgrund ihrer lokalbeschränkten Berechnungen besonderseffizient sind.

werden durch vorsichtige Annäherung und lokaleExploration, häufig unter Einsatz von Taktil- undKraftsensorik, aufgabenabhängige Fingerkonfigu-rationen für ein kontrolliertes Zugreifen bestimmt. In der mobilen Robotik ist das Ziel meist, durch dieAnwendung einer Explorationsstrategie eine Karteeiner anfangs unbekannten räumlichen Umgebungzu konstruieren.

Page 57: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

55Forschung an der Universität Bielefeld 25/2003

Abbildung 1: a) Eine städtische Umgebung; b) eine Gitterrepräsentation dieser Umgebung, in der Objekte, z.B. Hindernisse, mit ihrer festen Gitterposition assoziiert werden. Die teilweise von Hindernissen besetztenGitterzellen werden typischerweise auch als Hindernisse betrachtet; c) eine Graphrepräsentation derselbenUmgebung. Der Graph spiegelt die Verbundenheit der freien Regionen des Arbeitsraums wider. Die Knoten des Graphen sind mit durchquerbaren Wegen verbunden.

a) b) c)

W Arten der Raumrepräsentation

Da die Roboter in einer physikalischen („realen“)Welt existieren, muss zunächst dieser Raum, in demein Pfad geplant werden soll, repräsentiert werden.Es gibt dafür zwei Hauptparadigmen: gitterbasierte(Abb. 1b) und graphbasierte Darstellungen (Abb.1c).

Für einen zwei- oder dreidimensionalen physikali-schen Raum bevorzugt man eine „diskrete Gitter-repräsentation“, die einfach und präzise die geo-metrischen Lagerelationen zwischen benachbartenObjekten beschreibt. Im Gegensatz dazu enthält eineGraphrepräsentation nur die Information über dieKonnektivität, also Verbundenheit, im Raum (seman-tische Information).

W Beispiel 1: Aufgabenorientierte Exploration durch einen autonomen mobilen Roboter

Situationen, in denen ein autonomer mobiler Robo-ter sich in einer unbekannten Umgebung orientierenmuss, gibt es zum Beispiel in Bahnhöfen, Flughäfen,Baustellen usw. „Unbekanntheit“ bedeutet dabei,dass es Hindernisse geben kann, deren Lage demRoboter nicht bekannt ist und die sich ändern kann.Außerdem kann die Umgebung auch von anderensich bewegenden „Agenten“ (zum Beispiel Menschenoder anderen Robotern) besiedelt sein. Bei der Model-lierung betrachten wir den Roboter der Einfachheithalber zunächst als ein punktförmiges Objekt undnehmen an, dass er eine Sensorik besitzt, mit deren

Hilfe er in der Lage ist, vor ihm liegende Objekte zu„fühlen“. Im Arbeitsraum werden auch der Ziel-punkt (ZP) und der Startpunkt (SP) für den Roboterdefiniert (siehe Abb. 2). Die Aufgabe ist nun, einensicheren kollisionsfreien Weg zum Ziel zu finden.

W Wegsuche auf einem Gitter

Die Idee zur Wegplanung bei einer Gitterrepräsen-tation des Arbeitsraums ist, jeder Position auf demGitter eine Zahl so zuzuordnen, dass der Weg vonhohen Zahlen zu kleineren hinführt. Diese Zahlen-werte – ein Potentialfeld – kann man auf verschie-dene Weise erzeugen, etwa in Anlehnung an diePhysik durch einen simulierten Diffusionsprozess, dereinen Lockstoff an der Zielposition im Raum „ver-teilt“, bis der Roboter ihn „spürt“ und in Richtungdes Ziels vorangehen kann. Jeder Schritt des Wegesführt dann von Gitterzellen mit niedrigen Potential-werten („Lockstoffkonzentrationen“) zu einemNachbarn mit höherem Wert. Mathematisch gesagtfolgt man dem Gradienten des Potentialfeldes. In unserem Fall wird eine andere (aber ähnliche)Methode – ein Mechanismus der Wellenausbrei-tung – benutzt. Und wir wollen auch dynamischeÄnderungen in der Umgebung in Betracht ziehen.Dafür wird eine Potentialfelderstellung nicht nureinmal durchgeführt, sondern in jedem Zeitschritt„reinitiiert“ (erneut durchgeführt), so dass sichimmer neue „Lockstoffwellen“ überlagern. Einesolche dynamische Umkonfiguration des Potential-feldes kann mit Hilfe eines speziellen neuronalen

Page 58: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

56 Forschung an der Universität Bielefeld 25/2003

Abbildung 2: Ein Beispiel aufgabenorientierter Exploration eines mobilen Roboters; a) Ansicht einesklassischen labyrinthischen Arbeitsraums, der aus 61x61 Zellen (künstlichen Neuronen) besteht. DiePositionen der blauen Hindernisse sind dem Roboter nicht bekannt. Die Aufgabe für ihn ist es, einenhindernisfreien Weg von der Startposition (SP) zur Zielposition (ZP) zu finden; b) in gelber Farbe ist dergefundene Weg zum Ziel gezeigt. Die vom Roboter „gefühlten“ und entdeckten Hindernisse während der Navigation sind blau; c) das dynamisch generierte Potentialfeld bei der Ankunft am Ziel spiegelt dieStruktur des Arbeitsraum mit den entdeckten Hindernissen wider. Die Informationen über neu „gefundene“Hindernisse werden sofort in die Bildung des Potentialfeldes integriert. Die Lage der Zielposition (der gelbeKreis auf dem Plot) entspricht dem globalen Minimum des Potentialfeldes. Aus Bild c) wird deutlich, dassein Weg existiert, entlang dessen der rote Ball (in der Startposition) das Ziel erreichen kann.

a) b)

c)

Page 59: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

57Forschung an der Universität Bielefeld 25/2003

Netzes schnell und effizient erreicht werden. Manstartet dazu an der Zielposition mit einem festenAktivitätswert und lässt jeweils die Nachbarn einerGitterzelle ihre Aktivitätswerte mit jedem Schritt nachgewissen Regeln dynamisch erhöhen. Diese werdenin Form einer Übergangsfunktion für künstliche„Neuronen“ formuliert, von denen jeweils eines proGitterposition angesetzt wird. Abbildung 3 illustrierteine Erstellung eines solchen Potentialfeldes.

Abbildung 3: Erstellung eines numerischen Potentialfeldes zur Wegplanung in einer dynamischen Szene. Im Arbeitsraum sind statische Hindernisse, Ziel- und Startpositionen definiert. Plötzlich auftauchendedynamische Hindernisse sind rot gezeigt. Die derzeitige Position des Roboters ist braun und der finale Weg des Roboters zum Ziel ist „sandfarben“. Die von einem neuronalen Netz erzeugten Potentialwerte sind nach dem (1), (2), ... Zeitschritt als numerischer Wert an der jeweiligen Gitterposition gezeigt.

W Beispiel 2: Aufgabenorientierte Exploration durch eine virtuelle Hand im Kontext des Greifens

Kinder können im Alter von acht bis neun Monatennach verborgenen Objekten suchen und aktiv mitSpielzeug spielen, das sie mit den Händen „ent-decken“. Mit etwa 12 Monaten können sie mitDaumen und einem weiteren Finger kleine Objekte,wie zum Beispiel Rosinen, greifen. Diese Fähigkeiten

Page 60: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

58 Forschung an der Universität Bielefeld 25/2003

a)

b)

c)

d)

erlernen sie durch explorative sensomotorische Erfah-rung. Demgegenüber ist die Koordination mehrererkünstlicher Finger für Roboter ein schwieriges undnoch nicht zufriedenstellend gelöstes Problem, daviele Aufgaben parallel gelöst werden müssen: dieBewegungsplanung, Kraftregelung, Kollisionsvermei-dung, etc. Daher hat das komplexe Greifproblemeine enorme Anziehungskraft für Wissenschaftler ausvielen Bereichen (Physik, Mathematik, Informatik,Kontrolltheorie, Kognitive Psychologie, Neurophysio-logie etc.). Eine wichtige Teilaufgabe ist es, poten-tielle Griffpunkte zu detektieren, was durch einegeschickte Organisation lokaler, explorativer Finger-bewegungen gelöst werden kann. Dazu wird jederFinger als einzelner Roboter betrachtet und eine ver-teilte Planung angestrebt. In unserem Ansatz werdendie Finger durch Setzen von Winkeln in den Finger-gelenken gesteuert, so dass der Planungsraum derWinkelraum ist, der so genannte Konfigurations-raum. In unserem virtuellen Handmodell hat die Handdrei Finger mit je drei Gelenken und ist mit einemtaktilen Sensor an der Fingerspitze ausgerüstet. Ein viertes letztes Gelenk ist passiv und nach demmenschlichen Vorbild mit dem dritten gekoppelt. Der Konfigurationsraum jedes Fingers wird hier alsGraph repräsentiert und explorative Bewegungenwerden mit Hilfe eines über dem entsprechendenGraphen generierten neuronalen Potentialfeldesgefunden (Abb. 4).

Abbildung 4: Greifversuche durch lokale explorative Fingerbewegungen; a) erfolgreiches Greifen des Würfels; b), c), d) die graphbasierten Repräsentationen der Konfigurationsräume der Finger. Jeder Punkt (ein Vektor derGelenkwinkelwerte) in dem Konfigurationsraum definiert eindeutig die Position des Fingers im physikalischenRaum. Der Weg zur Greifposition (gezeigt in grün) für jeden Finger ist mit gelben Quadraten dargestellt.

Page 61: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

59Forschung an der Universität Bielefeld 25/2003

W Wegsuche in einem Graph

Die Aufgabe ist hier, einen optimalen Weg voneinem Startknoten zum Zielknoten in einem Graphzu finden. Dabei werden den Kanten im Graphnumerische Werte zugewiesen, die zum Beispiel dieWeglängen zwischen den Knoten, Reisezeiten zwi-schen den Knoten, oder sonstige „Kosten“ bezeich-nen. Genauso wie bei der Wegsuche auf dem Gitterwird mit jedem Knoten ein Neuron assoziiert undganz analog kann ein Potentialfeld über dem Graphgeneriert werden. In diesem Fall ist der Aktivitätswerteines Neurons gleich dem niedrigsten Wert der für

jeden Nachbarn berechneten Summe dessen Aktivitäts-wertes plus die Länge der Kante zwischen ihm unddem betrachteten Neuron. Ein Unterschied zwischenunserem Algorithmus und den bekannten Algorithmenfür Wegsuche in einem Graph besteht darin, dassunser Algorithmus auch fähig ist, einen Weg in einemdynamischen Graph zu finden. In einem solchenGraph können zu beliebigen Zeiten Knoten als Hinder-nisse (verbotene Positionen) markiert und auch wiederfreigegeben werden. Falls ein Weg wegen einesHindernisses blockiert ist, wird ein neuer Weg durchdynamisches Umplanen gefunden, ohne das ganzePotentialfeld zunächst löschen zu müssen (Abb. 5).

Abbildung 5: Eine Illustration der dynamischen Natur des Wegplanungsalgorithmus in einem Graphen (Wegesind als dicke Linien markiert); a) der kürzeste Weg ohne Hindernisse; b) der Weg, der gefunden wird, wenn einHindernis in der gezeigten Position ist; c) ein Weg für die Situation, wenn in derselben Position sechs Zeittaktelang ein Hindernis ist, das dann verschwindet. In diesem Fall wurde der geplante Weg automatisch aktualisiert,ohne einen vollständig neuen Weg vom Startpunkt aus zu suchen.

Page 62: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

60 Forschung an der Universität Bielefeld 25/2003

Dmitry Lebedev studierte AngewandteMathematik und Informatik an der Staat-lichen Universität Jaroslawl, Russland, woer 1999 sein Master Diploma mit Auszeich-nung in Mathematik erhielt. Seit April2001 promoviert er bei der ArbeitsgruppeNeuroinformatik als Mitglied desGraduiertenkollegs „AufgabenorientierteKommunikation”. Seine Forschungsinter-essen sind Modelle der künstlichenNeuronen, künstliche Neuronale Netze,Entwicklung und Anwendung derNeuronale-Netze-basierten Algorithmen zurWegplanung und Exploration in derRobotik.

W Fazit

Wir haben anhand zweier Beispiele demonstriert, wieaufgabenorientierte Exploration auf Basis eines voneinem neuronalen Netz erzeugten Potentialfeldesorganisiert werden kann. Im Fall eines autonomenmobilen Roboters war die Aufgabe, ein bestimmtesZiel in einer dem Roboter unbekannten Umgebungzu erreichen. Die auf dem Weg getroffenen Hinder-nisse konnte der virtuelle Roboter mit seiner Sensorik„erfühlen“ und dynamisch in den Planungsprozessintegrieren. Daher muss der Roboter nicht auf denendgültigen umgeplanten Weg warten, sondernkann sich schon nach einigen Zeitschritten weiterbewegen.

Für die Organisation der Exploration mit einervirtuellen Hand werden die Bewegungen dreierFinger unabhängig voneinander geplant. Die Ideehier ist, einige Kontaktpunkte, das heißt potentielleGriffpositionen, zu finden. Wenn einer der Fingerdurch Taktilsensorik ein Objekt „erfühlt“, orientierensich die Bewegungen der anderen Finger in Richtungdes durch diesen Kontakt definierten Gebiets. Dagute Methoden der effizienten Erstellung der graph-basierten Umgebungsrepräsentation existieren, wur-den für diesen Fall die Neuronale-Netzwerke-basier-ten Algorithmen für die dynamische Wegplanung in den Graphen angewendet. In beiden Beispieleneigneten sich die vorgeschlagenen Algorithmen derWegplanung zusammen mit bestimmten Explorations-strategien gut zur Lösung des Explorationsproblems.

Page 63: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

61Forschung an der Universität Bielefeld 25/2003

Abstracts

Sebastian Lang

“Look who’s talking”

An important prerequisite for the natural interaction of humans

with a mobile robot is the robot’s capability to find its partner

of communication. Since more than one person may be in the

vicinity of a mobile robot, it must be able to detect when and

how long a user’s attention is directed towards the robot for

communication. The contribution describes a system which

allows a robot to perceive all persons in its vicinity, to track

them over time, and furthermore to extract features which are

then used to decide whether a person is the robot’s communi-

cation partner, or not. The system is based on the robot’s own

on-board sensors: stereo microphones, camera, and laser range

finder. Once a communication partner has been detected, the

robot’s front is turned towards this user. The entire system thus

describes an attention control system for a mobile robot.

Christian Lange

“Show me what you Want from me”

At present, human-machine-communication is too error-prone.

Humans need to learn to use the interface before working with

machines. Communication as at present wastes cognitive

resources, as people think about how to handle communicative

devices. In human-human-communication people use speech

combined with gestures, such as pointing with a finger or nod-

ding their head. Things would be much easier if machines were

able to understand these natural modalities. This is why this

contribution shows how devices are being developed to per-

ceive gestures, as well as algorithms to process intended mean-

ing. These algorithms use a model of the human body that

tracks the user’s movements. The extracted gestures will be

provided in a universal format that can be used by various

applications.

Eva Belke · Mathias Rehm

In the Beginning was the Word?

Philosophers, linguists and psychologists have long been argu-

ing on the relation between language, perception and thought.

Results from psycholinguistic experiments provide that percep-

tion of spatial relations is linguistically imprinted by the refer-

ence systems used in different languages. At the same time,

speech mostly refers to entities and events in the outside

world, and is hence massively influenced by how these events

are perceived. These two aspects were investigated in the

frame of two different PhD-projects. Although the projects are

situated in rather distinct research areas, they both point to the

same issue – how language, perception and thought interact.

On the Interaction of Language andPerception

Attention Control for a Mobile Robot

Kerstin Grönert

Officialese: Incomprehensibility andNon-acceptance as Barriers ImpedingCommunication between Civil Servantsand Citizens

Language is one most important for communication between

civil servants and citizens, and it is crucial to design this com-

munication such that it will best serve its purpose. In real life,

official language is indeed often considered incomprehensible

and hence faced with serious acceptance problems in citizens.

Officialese is felt to be obtuse and rigid, and many feel discon-

certed by it. Coping with official language has become almost

an everyday problem for the majority of the population which

overshadows and complicates their relationship with the staff

working in public administration. This study’s intention is to

formulate features for official language to facilitate compre-

hension and to improve acceptance, the goal being to develop

a functional conception for designing written texts used by the

civil service in communicating with its clients.

Gestures for Natural Human-Machine-Communication

Page 64: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

62 Forschung an der Universität Bielefeld 25/2003

Vivian Raithel · Britta Wrede

Why „Fast Talkers“ Find it so Much Harder

When speaking, we assume that other humans understand

what we are saying. Nowadays we also expect machines to

understand us. Neither expectation may be taken for granted.

The research findings presented in this contribution show that

speech rate is an important determinant of language compre-

hension and speech recognition. Aphasic individuals may have

great difficulties understanding language verbalized with a

high speech rate because the time they are allotted for pro-

cessing the input they hear is exceedingly reduced. A similar

situation can be found in talking to automatic speech recogni-

tion systems. In the case of fast speech, we find a larger over-

lap between the various vowels. This overlap can be told apart

by “normal” human listeners, but not by the machine.

Dmitry Lebedev

How Robots Plan their Paths in an Unknown Environment

Exploration is a classical problem in robotics, its focus being

on discovering unknown attributes of a given environment.

This contribution considers two simulations. The first example

demonstrates a mobile robot’s autonomous exploration activity

in task-oriented navigation. The second example illustrates

how anticipated movements of virtual fingers are organized for

grasping. As exploration of an environment first of all implies

the capability to move, the corresponding neural-network-

based techniques for path planning on regular and irregular

grids (graphs) is described as well.

Task-oriented Exploration in Robotics by Means of Neural Networks

Abstracts

There seems to be no difference in that a child between 20 to

26 months of age acquires the preposition for the spatial rela-

tion ON (as in “a cup ON a table”) between English, German,

Swedish, Hebrew - or Polish, as Katharina Rohlfing has shown

in her doctoral thesis – sooner than the preposition UNDER

(as in “a cup UNDER the table”). The question is why UNDER

is more difficult than ON. The contribution presents a training

study on how the Polish dynamic spatial preposition POD

[UNDER] is acquired. The study is based on some points aris-

ing from the larger debate on reasons why UNDER is under-

stood later. It is argued that small children learn a term for a

spatial relation in concrete situations. To abstract this relation

to a new situation seems to require cognitive abilities different

from those required for the process of understanding within

communication about cultural artifacts involved in daily life

routines.

Why is UNDER more difficult than ON?

Katharina J. Rohlfing

The contribution reports on the importance of adhering to

standards of communication in a controlled language for cop-

ing with crisis situations, or for avoiding them altogether. The

field of analysis chosen is communication in aviation. Cockpit

voice recorder transcripts relating to aviation disasters were

studied with particular regard for so-called uptake securing

processes. The study’s objective was to generate a discourse

grammar for this particular kind of communication. Results

support the informal findings that unpredictable situations con-

cur with deviations from the grammar of controlled language.

Breaking these rules of communication, in turn, increases the

probability of crisis. Hence, a crisis, together with its concurrent

deviations from rules of communication, may establish a

vicious circle with catastrophic consequences.

Claudia Sassen

How to Avoid the Worst by Correct Talk

Studies on Automatic Speech Recognition andAphasic Speech Perception

The Structure of Crisis Communication in Aviation Disaster Scenarios

Page 65: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

63Forschung an der Universität Bielefeld 25/2003

Ying-Hua Guan

This is how the Puzzle is Solved!

Multimedia is at present widely used in human-human- and

human-machine-communication. In educational practice, multi-

media is regarded as a powerful tool for presenting learning

materials, as compared to the traditional text-oriented medi-

um. The advantages of multimedia presentations are that

information can be simultaneously presented in different

codes (e.g. verbal and non-verbal) and modalities (e.g. in visu-

al and auditory formats). In view of these advantages, it seems

convincing that multimedia is superior to traditional learning

media in every respect. During the past decade, however, the

results of empirical studies about the effects of multimedia pre-

sentations on learning have been inconclusive. In some cases,

learning was even impaired by multimedia presentations. This

contribution briefly reports on two experiments in which the

effects of different multimedia presentations on learning have

been systematically examined.

Kirsten Schindler

From „Kiddies“ to Quinquagenariansand Older

The texts we write are mostly intended for others, for our

readers. Even though we can not rely on immediate responses,

as in spoken dialogue, we can nevertheless communicate suc-

cessfully with them. The contribution presents the results of a

writing experiment which focused on the role of the addressee

in the process of writing. Writers grouped in pairs were asked

to jointly write different types of texts that varied according to

their respective intended audience. The interaction within

these collaborative writing groups were videotaped, tran-

scribed and analysed. One of the results deducible from the

empirical data is that writers use different techniques to con-

struct an image of their addressee. Which method they use

depends on the writer, but also on the respective problem to

be solved by writing within which the reference to the

addressee is embedded.

How Writers Talk about their Readers The Impact of Multimedia Presentations on Information Processing

Abstracts

Page 66: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

Forschung an der Universität Bielefeld 25/2003

Das Magazin »Forschung an der Universität Bielefeld« kann für 5 Euro pro Jahr abonniert werden Die Mit-glieder der Westfälisch-Lippischen Universitätsgesellschaft erhalten das Magazin kostenlos Der ungekürzteNachdruck von Beiträgen ist unter Nennung des Autors und der Quelle frei Wir bitten um Belegexemplare.

Herausgeber: Universität Bielefeld, Informations- und Pressestelle Redaktion: Dr. Gerhard Trott (verant-wortlich), Dr. Hans-Martin Kruckis Übersetzungen: Günter Seib Satz und Gestaltung: Thomas P. Kiper,Hunteweg 28, 33689 Bielefeld Gesamtherstellung: Druck und Medienhaus Hans Gieselmann GmbH & Co. KG,Ackerstr. 54, 33649 Bielefeld, Tel. 0521/94609-0, Fax 0521/94609-99, E-Mail: [email protected], Internet: www.gieselmanndruck.de Erscheinungsweise: in der Regel einmal jährlich

Auflage: 4000 Anschrift von Redaktion und Vertrieb: Informations- und Pressestelle der UniversitätBielefeld, Postfach 10 01 31, 33501 Bielefeld, Tel. 0521/106-4146, Fax 0521/106-2964 Internet:www.uni-bielefeld.de/Presse/fomag/

Abbildungen S. 2 und 3: Norma Langohr Abbildung S. 4 links: Dan Rupp, Air Safety Online, mit freund-licher Genehmigung Abbildung S. 4 rechts: Werner Fischdick Collection mit freundlicher Genehmigung

Abbildung S. 5: Aviation Safety Net mit freundlicher Genehmigung Abbildung S. 6: U.S. Department of Defense Abbildung S. 7: Aviation Safety Net mit freundlicher Genehmigung Abbildungen S. 9 und13: Max Sichelschmidt Weitere Abbildungen wurden von den Autoren zur Verfügung gestellt Autoren-porträts (mit Ausnahme des Porträts von Claudia Sassen): Norma Langohr

Abbildungen

Impressum

ISSN 0937-2873

25/2003Universität Bielefeld

Page 67: Forschung - techfak.uni-bielefeld.declange/fomag25.pdf · Laut Statistik gilt das Flugzeug als eines der sichers-ten Fortbewegungsmittel. Trotz sinkender Buchungen, einer Folge des

Westfälisch-Lippische Universitätsgesellschaft– Verein der Freunde und Förderer e.V. –

Werden Sie Mitglied!

Eine Universität braucht Freunde. Sie brauchtKontakt zur Öffentlichkeit. Sie braucht dasEngagement aller Bürger und aller privaten oderöffentlichen Körperschaften und Firmen derRegion. Sie braucht auch die Verbundenheit ihrerStudenten über die Studienzeit hinaus. Sie brauchtdie Unterstützung aller Kreise zur Erfüllung ihrerAufgaben. Dies gilt erst recht für eine junge undexpandierende Universität.Wir laden Sie zum Beitritt ein!

Was wir tun:

Förderung von Forschung und Lehre der Universität: Unter-stützung von Fakultäten, Einrichtungen und Forschungsvorhaben.

Pflege der Beziehungen zwischen Universität und Bevölkerung:Durchführung und Unterstützung von Vorträgen, Konzerten,Kunstausstellungen, Sportveranstaltungen usw.

Hilfe bei Problemen der Studentenschaft: Förderung vonStudentenwohnheimen, Vergabe von Auslandsstipendien, praxis-orientierte Betreuung (Gesprächskreise, Firmenbesichtigungen)und andere Aktivitäten.

Förderung wissenschaftlicher Arbeiten: Jährliche Verleihung vonPreisen für hervorragende Habilitations- und Dissertationsarbeiten.Unterstützung von förderungswürdigen wissenschaftlichenArbeiten im Allgemeinen.

Vertiefung der Beziehungen zwischen Universitätsgesellschaft undLehrkörper: Veranstaltungsreihe „Fakultäten stellen sich vor“.

Wir brauchen den gut ausgebildeten Nachwuchs. Deshalb tun wiretwas dafür.

Die Westfälisch-Lippische Universitätsgesellschaft – Verein derFreunde und Förderer e.V. – wurde 1966 durch Persönlichkeitenaus Politik, Kultur, Wirtschaft und Wissenschaft gegründet. Zuihren Mitgliedern gehören heute Bürger aus allen Schichten derBevölkerung, Personen aus Handel und Industrie sowie öffentlicheKörperschaften und Firmen.

Vorsitzender des Kuratoriums: Dr. Werner Efing, Bielefeld, stell-vertretender Vorsitzender: Prof. Dr. Dieter Timmermann, Bielefeld,weitere Mitglieder: Detlef Adler, Bielefeld, Dr. Dietmar Baumeister,Bielefeld, Otto Clüsener, Bielefeld, Peter Ebertz, Bielefeld, MargritHarting-Kohlhase, Espelkamp, Dirk Ulrich Hindrichs, Bielefeld,Wolfgang Kaeller, Bielefeld, Wilhelm Krömer, Minden, HelmutKruse, Detmold, Karen Leffers, Werther-Isingdorf, FriedrichLohmann, Bielefeld, Rudolf Miele, Gütersloh, Dr. Peter von Möller,Bielefeld, Günther Remmel, Bielefeld, Dr. Christian Schäfer-barthold, Minden, Joachim Schultz-Tornau, Bielefeld, Herbert Som-mer, Bielefeld, Dr. Peter G. Ulrich, Bielefeld, Reinhold Trinius MdL,Porta Westfalica, Dr. Dr. Jürgen Weitkamp, Lübbecke, Vertreter derUniversität: Hans-Jürgen Simm, Prof. Dr. Michael Röckner, Dr.Lothar van Laak, Stefan Bienefeld

Vorsitzender des Vorstandes: Ortwin Goldbeck, Bielefeld,stellvertretender Vorsitzender: Oberbürgermeister Eberhard David,Bielefeld, Geschäftsführer und Schatzmeister: Prof. Dr. h.c. HelmutSteiner, Bielefeld, weitere Mitglieder: Bürgermeister ThomasGabriel, Herford, Dr. Siegfried Luther, Gütersloh, Wolf-Dieter MeierScheuven, Bielefeld, Walter Maaß, Bielefeld, Hans-Georg Vogt,Bielefeld, Dr. Rainer Wend, Bielefeld, Ehrenmitglieder: RudolfAugust Oetker, Ernst Graumann †, Prof. Dr. Karl Peter Grotemeyer,Dr. Kurt Schober, Gerd Seidensticker, Walter Stich.

Die Mitglieder werden durch die Herausgabe von Mitteilungen undMitgliederversammlungen auf dem Laufenden gehalten.Außerdem erhalten sie kostenlos die Bielefelder Universitäts-zeitung.

Alle Mitglieder der Universitätsgesellschaft erhalten auch dasForschungsmagazin der Universität Bielefeld kostenlos!

Die Universitätsgesellschaft ist steuerlich als gemeinnützigeInstitution anerkannt.

Mitgliedschaft

Die Überweisung erfolgt auf das Konto-Nr. 0 669 499 (BLZ 480 700 20) der Deutschen Bank AG in Bielefeld.

Bitte senden Sie die Beitrittsbestätigung an:

Name

Firma

Straße

PLZ/Ort

Datum Unterschrift

Wenn Sie Mitglied werden wollen, wenden Sie sich bitte an:Westfälisch-Lippische Universitätsgesellschaft,Prof. Dr. h.c. Helmut Steiner, Wilhelmstr. 3a, 33602 Bielefeld,Tel. (05 21) 12 43 47, Fax. (05 21) 5 21 33 33email Anschrift: [email protected]

Ich/Wir wünsche(n)

eine Firmenmitgliedschaft zu einem Jahresbeitrag von 260,– EURDie zuständige Kontaktperson in der Firma ist

eine Einzelmitgliedschaft zu einem Jahresbeitrag von 30,– EUR