36
Probleme der Übersetzung durch Mensch und Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung Mehrdeutigkeiten im Quantorenskopus

Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Embed Size (px)

Citation preview

Page 1: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Probleme der Übersetzung durch Mensch und Probleme der Übersetzung durch Mensch und Maschine: Probleme der AnalyseMaschine: Probleme der Analyse

Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung Mehrdeutigkeiten im Quantorenskopus

Page 2: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Morphologische ProblemeMorphologische Probleme

Vollformen-Wörterbuch: keine morphologische AnalyseVollformen-Wörterbuch: keine morphologische Analyse Spart AnalysezeitSpart Analysezeit Bringt Vorteile bei unregelmäßigen FormenBringt Vorteile bei unregelmäßigen Formen Nachteil: benötigt viel SpeicherplatzNachteil: benötigt viel Speicherplatz

Stammwörterbuch: morphologische AnalyseStammwörterbuch: morphologische Analyse Spart SpeicherplatzSpart Speicherplatz ermöglicht Wortartbestimmung und Erkennung grammatischer ermöglicht Wortartbestimmung und Erkennung grammatischer

Relationen (Subjekt, Objekt etc.) auch bei unbekannten WörternRelationen (Subjekt, Objekt etc.) auch bei unbekannten Wörtern im Englischen bezeichnet das Suffix im Englischen bezeichnet das Suffix ‑‑izeize gewöhnlich ein Verbgewöhnlich ein Verb

deutsche deutsche Wörter auf Wörter auf ‑‑ungung sind gewöhnlich sind gewöhnlich Nomina. Nomina. Synkretismus führt zu massiver Ambiguität, Beispiel Synkretismus führt zu massiver Ambiguität, Beispiel ‑‑enen

Page 3: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Mögliche Interpretationen von Mögliche Interpretationen von ‑en ‑en im Deutschenim Deutschen

Nomen PluralNomen Plural ((PflaumenPflaumen)) Nomen Dativ Plural (Nomen Dativ Plural (den Tagenden Tagen)) schwaches Nomen Singular nicht-Nominativ schwaches Nomen Singular nicht-Nominativ starke Deklination Maskulin Singular Akkusativstarke Deklination Maskulin Singular Akkusativ starke Deklination Dativ Plural starke Deklination Dativ Plural Adjektiv nicht‑Nominativ Maskulin Singular nach definitem Artikel Adjektiv nicht‑Nominativ Maskulin Singular nach definitem Artikel Adjektiv Dativ oder Genitiv Feminin oder Neutrum Singular nach Adjektiv Dativ oder Genitiv Feminin oder Neutrum Singular nach

bestimmtem Artikel bestimmtem Artikel Adjektiv Akkusativ oder Genitiv Maskulin Singular ohne Artikel Adjektiv Akkusativ oder Genitiv Maskulin Singular ohne Artikel Adjektiv Genitiv Neutrum Singular ohne Artikel Adjektiv Genitiv Neutrum Singular ohne Artikel Adjektiv Dativ Plural ohne ArtikelAdjektiv Dativ Plural ohne Artikel Verb Infinitiv Verb Infinitiv Verb 1. oder 3. Person Plural Verb 1. oder 3. Person Plural Verb Partizip (starkes Verb) Verb Partizip (starkes Verb) Ein Wort, das zufällig auf ‑Ein Wort, das zufällig auf ‑enen endet ( endet (RegenRegen))

Page 4: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Probleme bei zusammengesetzten WörternProbleme bei zusammengesetzten Wörtern

steam engine, steam hammer; steamshipsteam engine, steam hammer; steamship Dampfmaschine, Dampfhammer, DampfschiffDampfmaschine, Dampfhammer, Dampfschiff Silberlöffel, Suppenlöffel, SchaumlöffelSilberlöffel, Suppenlöffel, Schaumlöffel Produktivität (Produktivität (DampfschiffahrtsgesellschaftDampfschiffahrtsgesellschaft)) fehlende Kompositionalität der Bedeutungfehlende Kompositionalität der Bedeutung

Page 5: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Probleme bei zusammengesetzten WörternProbleme bei zusammengesetzten Wörtern

BeileidBeileidBei + LeidBei + Leid ‚‚condolence‘condolence‘

Beil + EidBeil + Eid ‚‚hatchet oath‘hatchet oath‘

KulturgeschichteKulturgeschichteKultur + GeschichteKultur + Geschichte ‚‚history of culture‘history of culture‘

Kult + UrgeschichteKult + Urgeschichte ‚‚pre-history of worship‘pre-history of worship‘

UranbrennerUranbrennerUran + BrennerUran + Brenner ‚‚uranium pile‘uranium pile‘

Ur + AnbrennerUr + Anbrenner ‚‚primitive kindler‘primitive kindler‘

WachtraumWachtraumWach + TraumWach + Traum ‚‚day-dream‘day-dream‘

Wacht + RaumWacht + Raum ‚‚guard-room‘guard-room‘

Page 6: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Lexikalische AmbiguitätLexikalische Ambiguität

Kategoriale AmbiguitätKategoriale Ambiguität lightlight: N, V, A; : N, V, A; controlcontrol:: N, VN, V Konversion: fast jedes Nomen kann als Verb fungierenKonversion: fast jedes Nomen kann als Verb fungieren Fast jedes Nomen kann als Adjektiv fungieren: Fast jedes Nomen kann als Adjektiv fungieren: stone wallstone wall Ein extremes aber nicht seltenes Beispiel ist Ein extremes aber nicht seltenes Beispiel ist roundround in den in den

folgenden Sätzen: Es ist Nomen (1), Verb (2), Adjektiv (3), folgenden Sätzen: Es ist Nomen (1), Verb (2), Adjektiv (3), Präposition (4), Partikel (5) und Adverb (6). Präposition (4), Partikel (5) und Adverb (6). 1.1. Liverpool were eliminated in the first Liverpool were eliminated in the first roundround. . NN2.2. The cowboy started to The cowboy started to roundround up the cattle. up the cattle. VV3.3. I want to buy a I want to buy a roundround table. table. AA4.4. We are going on a cruise We are going on a cruise roundround the world. the world. PP5.5. A bucket of cold water soon brought him A bucket of cold water soon brought him roundround. . PrtPrt6.6. The tree measured six feet The tree measured six feet roundround.. AdvAdv

Page 7: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Kategoriale AmbiguitätKategoriale Ambiguität

GasGas pumppump pricesprices roserose lastlast timetime oiloil stocksstocks fell.fell.

NN NN NN NN NN NN NN NN NN

VV VV VV VV VV VV VV VV VV

(A)(A) AA

AdvAdv

Zapfsäulenpreise stiegen letztes Mal an, Ölvorräte fielenZapfsäulenpreise stiegen letztes Mal an, Ölvorräte fielen

Page 8: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Kategoriale AmbiguitätKategoriale Ambiguität

(1)(1) Foot heads arms body.Foot heads arms body.

(2)(2) British left waffles on FalklandsBritish left waffles on Falklands

Page 9: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Homographie und HomophonieHomographie und Homophonie

HomographeHomographe sind zwei (oder mehrere) sind zwei (oder mehrere) ‘Wörter' mit deutlich ‘Wörter' mit deutlich verschiedener Bedeutung, die die gleiche Schreibung aufweisen. verschiedener Bedeutung, die die gleiche Schreibung aufweisen. Beispiele: Beispiele:

clubclub (Waffe, Institution), (Waffe, Institution), bank bank (Ufer, Institution), dt. (Ufer, Institution), dt. BankBank (Sitzgelegenheit, Institution) (Sitzgelegenheit, Institution) light light (Antonym (Antonym darkdark oder oder heavyheavy)) Schloß Schloß (Gebäude, Schließvorrichtung)(Gebäude, Schließvorrichtung)

HomophoneHomophone sind Wörter, die gleich ausgesprochen aber sind Wörter, die gleich ausgesprochen aber verschieden geschrieben werden (z.B. verschieden geschrieben werden (z.B. hairhair und und harehare). ). Aber da MÜ Aber da MÜ hauptsächlich geschriebene Texte betrifft, spielen sie hier kaum hauptsächlich geschriebene Texte betrifft, spielen sie hier kaum eine Rolle.eine Rolle.

Page 10: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Polysemie (Mehrdeutigkeit)Polysemie (Mehrdeutigkeit)

PolysemePolyseme sind Wörter, die ein breites aber zusammenhängendes sind Wörter, die ein breites aber zusammenhängendes Bedeutungsspektrum aufweisen, z.B. durch mBedeutungsspektrum aufweisen, z.B. durch metaphorische etaphorische Erweiterungen und Übertragungen:Erweiterungen und Übertragungen:

mouth mouth of a river, of a river, branch branch of a bank, of a bank, flow flow of ideas, of ideas, channel channel of communication, of communication, tidetide of opinion, etc.. of opinion, etc..

Wenn sich die Erweiterung zu sehr vom Ursprung entfernt, werden Wenn sich die Erweiterung zu sehr vom Ursprung entfernt, werden Polyseme zu Homographen. Das Wort Polyseme zu Homographen. Das Wort cranecrane im Sinne von ‘Kran’ im Sinne von ‘Kran’ mag aus einer metaphorischen Übertragung der Bedeutung mag aus einer metaphorischen Übertragung der Bedeutung ‘Kranich’ entstanden sein, aber die Wörter ‘Kranich’ entstanden sein, aber die Wörter cranecrane ‘Kran’ und ‘Kran’ und cranecrane ‘Kranich’ werden nicht mehr als Polyseme verstanden, sondern als ‘Kranich’ werden nicht mehr als Polyseme verstanden, sondern als Homographe.Homographe.

Page 11: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Strukturelle AmbiguitätStrukturelle Ambiguität

Während lexikalische Mehrdeutigkeiten zu Problemen bei der Analyse Während lexikalische Mehrdeutigkeiten zu Problemen bei der Analyse einzelner Wörter und beim Transfer ihrer Bedeutungen führen, involviert einzelner Wörter und beim Transfer ihrer Bedeutungen führen, involviert eine eine strukturelle Ambiguitätstrukturelle Ambiguität Probleme mit der syntaktischen Strukturen von Probleme mit der syntaktischen Strukturen von Sätzen und deren Repräsentation. Sätzen und deren Repräsentation.

Eine strukturelle Ambiguität liegt vor, wenn es mehr als eine Möglichkeit Eine strukturelle Ambiguität liegt vor, wenn es mehr als eine Möglichkeit gibt, die zugrunde liegende Struktur eines Satzes auf der Grundlage der gibt, die zugrunde liegende Struktur eines Satzes auf der Grundlage der vom System verwendeten Grammatik zu analysieren.vom System verwendeten Grammatik zu analysieren.

Die beiden Einschränkungen "eines Satzes" und “auf der Grundlage der Die beiden Einschränkungen "eines Satzes" und “auf der Grundlage der vom System verwendeten Grammatik" sind wichtig. vom System verwendeten Grammatik" sind wichtig.

Die meisten MÜ Systeme beschränken sich auf die sequentielle Analyse Die meisten MÜ Systeme beschränken sich auf die sequentielle Analyse einzelner Sätze; sie behandeln im Allgemeinen keine größeren einzelner Sätze; sie behandeln im Allgemeinen keine größeren Übersetzungseinheiten wie z.B Absätze. Es werden zwar einzelne Übersetzungseinheiten wie z.B Absätze. Es werden zwar einzelne Versuche unternommen, sprachliche Elemente, durch die Sätze zu Texten Versuche unternommen, sprachliche Elemente, durch die Sätze zu Texten verknüpft werden zu berücksichten (z.B. Pronomina, Thema-Rheme verknüpft werden zu berücksichten (z.B. Pronomina, Thema-Rheme Struktur), sind die meisten dieser Systeme über ein Experimentierstadium Struktur), sind die meisten dieser Systeme über ein Experimentierstadium nicht hinausgekommen. nicht hinausgekommen.

Die zweite Einschränkung ist eine Hinweis, dass kein Parser über die Die zweite Einschränkung ist eine Hinweis, dass kein Parser über die Grenzen der implementierten Grammatik hinausgehen kann. Grenzen der implementierten Grammatik hinausgehen kann.

Page 12: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Strukturelle AmbiguitätStrukturelle Ambiguität

Wenn die Grammatik Unterscheidungen, die ein menschlicher Wenn die Grammatik Unterscheidungen, die ein menschlicher Leser machen würde, nicht macht, dann wird auch der Parser Leser machen würde, nicht macht, dann wird auch der Parser nicht in der Lage sein, zwischen alternativen Analysen zu nicht in der Lage sein, zwischen alternativen Analysen zu entscheiden. Mit anderen Worten: es ist die Grammatik, die entscheiden. Mit anderen Worten: es ist die Grammatik, die bestimmt, ob eine bestimmte Struktur mehr als eine zulässige bestimmt, ob eine bestimmte Struktur mehr als eine zulässige Interpretation hat und daher mehrdeutig ist. Es ist folglich Interpretation hat und daher mehrdeutig ist. Es ist folglich gerechtfertigt, zu unterscheiden zwischengerechtfertigt, zu unterscheiden zwischen

‘‘echten' Mehrdeutigkeiten, für die auch ein Mensch mehrere echten' Mehrdeutigkeiten, für die auch ein Mensch mehrere Interpretationen finden könnte, Interpretationen finden könnte,

'System‘-Mehrdeutigkeiten, die der menschliche Leser nicht 'System‘-Mehrdeutigkeiten, die der menschliche Leser nicht unbedingt erkennen würde.unbedingt erkennen würde.

Page 13: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Echte Strukturelle AmbiguitätEchte Strukturelle Ambiguität

Linguisten verwenden gerne echte strukturelle Ambiguitäten, Linguisten verwenden gerne echte strukturelle Ambiguitäten, um alternative syntaktische Interpretationen zu demonstrieren, um alternative syntaktische Interpretationen zu demonstrieren, die von der formalen Analyse nahegelegt werden. Typische die von der formalen Analyse nahegelegt werden. Typische Beispiele dafür sind die folgenden:Beispiele dafür sind die folgenden:

(1)(1) Flying planes can be dangerous.Flying planes can be dangerous.

(2)(2) Time flies like an arrow. Time flies like an arrow.

(3)(3) The man saw the girl with the telescope.The man saw the girl with the telescope.

Page 14: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Echte Strukturelle AmbiguitätEchte Strukturelle Ambiguität

(1)(1) Flying planes can be dangerous.Flying planes can be dangerous.a.a. It can be dangerous to fly planes.It can be dangerous to fly planes.

b.b. Planes which are flying can be dangerous.Planes which are flying can be dangerous.

(2)(2) Time flies like an arrow.Time flies like an arrow.a.a. The passage of time is as quick as an arrow.The passage of time is as quick as an arrow.

b.b. A species of flies called 'time flies' enjoy an arrow. A species of flies called 'time flies' enjoy an arrow.

(3)(3) The man saw the girl with the telescope.The man saw the girl with the telescope.a.a. The man saw the girl who possessed the telescope.The man saw the girl who possessed the telescope.

b.b. The man saw the girl with the aid of the telescope.The man saw the girl with the aid of the telescope.

Page 15: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Strukturelle AmbiguitätStrukturelle Ambiguität

Menschen fällt es oft schwer, strukturelle Mehrdeutigkeiten in solchen Sätzen zu erkennen und im Kontext - in einer besonderen Situation oder in einem bestimmten Text - kann es sein, dass die Sätze ziemlich eindeutig erscheinen.

Wenn (3) zum Beispiel im Kontext einer Geschichte vorkommt, ist vermutlich aus dem Verlauf der Geschichte klar, wer denn im Besitz des Teleskops ist, der Mann oder das Mädchen. Da jedoch MÜ-Systeme diese kontextuellen Anhaltspunkte im Allgemeinen nicht oder nur in sehr begrenztem Maße benutzen können, sind die Sätze effektiv mehrdeutig. In diesen Fällen fallen die 'System‘-Mehrdeutigkeiten mit ‚echten' Mehrdeutigkeiten zusammen.

Page 16: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

„„Zufällige“ strukturelle AmbiguitätZufällige“ strukturelle Ambiguität

Nicht-systematische strukturelle Mehrdeutigkeiten können entstehen durch eine zufällige Kombination von Wörtern, die kategorial Mehrdeutig sind (Nomen, Verb, Adjektiv), aufgrund alternativer grammatischer Funktionen von syntaktischen Konstituenten oder aufgrund verschiedener Kombinations-möglichkeiten von syntaktischen Konstituenten.

Die Arten von strukturellen Mehrdeutigkeiten, die auftreten können, unterscheiden sich von Sprache zu Sprache und insbesondere von Grammatik zu Grammatik. Sie sollen hier anhand englischer Beispiele exemplifiziert werden.

Page 17: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

„„Zufällige“ strukturelle AmbiguitätZufällige“ strukturelle Ambiguität

Viele Mehrdeutigkeiten ergeben sich aus der Tatsache, dass ein einzelnes Wort in verschiedenen Funktionen innerhalb desselben syntaktischen Kontexts dienen kann. Dies ist eine mögliche Folge der kategorialen Ambiguität.

Diese Mehrdeutigkeiten korrelieren mit verschiedenen strukturellen Interpretationen desselben Satzes. Im Sinne der generativen Grammatik von Chomsky handelt es sich um tiefenstrukturelle Mehrdeutigkeiten. Es gibt verschiedene 'Tiefenstrukturen' für dieselben 'Oberflächenstrukturen'.(1) He noticed her shaking hands

(2)(2) I like I like swimmingswimming

(3)(3) They complained to the guide They complained to the guide thatthat they could not hear. they could not hear.

Page 18: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Strukturelle AmbiguitätStrukturelle Ambiguität

Das Präsentspartizip shaking in (1) kann als Adjektiv fungieren wie Das Präsentspartizip shaking in (1) kann als Adjektiv fungieren wie tiny in a., oder als Gerundivum wie watching in tiny in a., oder als Gerundivum wie watching in

a.a. He noticed her tiny feet.He noticed her tiny feet.

b.b. He noticed her watching television.He noticed her watching television.

Das Präsenspartizip (2) kann auch mit einer Mehrdeutigkeit Das Präsenspartizip (2) kann auch mit einer Mehrdeutigkeit zwischen seiner Verwendung als ein (verbales) Nomen (vgl. a) und zwischen seiner Verwendung als ein (verbales) Nomen (vgl. a) und als ein Gerundivum (b) verbunden sein: als ein Gerundivum (b) verbunden sein:

a.a. I like tennis.I like tennis.

b.b. I like getting up late.I like getting up late.

Das Wort that in (3) kann eines sein ein Relativpronomen (wie Das Wort that in (3) kann eines sein ein Relativpronomen (wie whom in a.) oder eine Konjunktion wie in b.whom in a.) oder eine Konjunktion wie in b.

a.a. They complained to the guide whom they could not hear.They complained to the guide whom they could not hear.

b.b. They complained to the guide that they could not hear him.They complained to the guide that they could not hear him.

Page 19: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Strukturelle AmbiguitätStrukturelle Ambiguität

Ein letztes Beispiel für eine tiefenstrukturelle Mehrdeutigkeit finden Ein letztes Beispiel für eine tiefenstrukturelle Mehrdeutigkeit finden wir bei der Interpretation einer Folge von Nomina entweder als eine wir bei der Interpretation einer Folge von Nomina entweder als eine einzelne Konstituente, d.h. als ein zusammengesetztes Nomen, einzelne Konstituente, d.h. als ein zusammengesetztes Nomen, oder mit einer Konstituentengrenze dazwischen. Dies ist besonder oder mit einer Konstituentengrenze dazwischen. Dies ist besonder problematisch im Englischen, weil dort in restriktiven Relativsätzen problematisch im Englischen, weil dort in restriktiven Relativsätzen das Relativpronomen weggelassen werden kann:das Relativpronomen weggelassen werden kann:

(1)(1) The mathematics students sat their examinations.The mathematics students sat their examinations.(2)(2) The mathematics students study today is very complex.The mathematics students study today is very complex.

Da im Englischen solche Nominalkomposita sehr häufig sind Da im Englischen solche Nominalkomposita sehr häufig sind verbunden mit der Häufigkeit von kategorialen Ambiguitäten ist in verbunden mit der Häufigkeit von kategorialen Ambiguitäten ist in dieser Sprache diese Art struktureller Mehrdeutigkeit sehr dieser Sprache diese Art struktureller Mehrdeutigkeit sehr verbreitet. verbreitet.

Page 20: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Strukturelle Ambiguität: weitere BeispieleStrukturelle Ambiguität: weitere Beispiele

(1)(1) Have you seen the story about the air crash in the paper? Have you seen the story about the air crash in the paper?

(2)(2) Have you seen the story about the air crash in the jungle? Have you seen the story about the air crash in the jungle?

(3)(3) John mentioned the book I sent to Susan. John mentioned the book I sent to Susan.

(4)(4) John mentioned the book I sent him to Susan. John mentioned the book I sent him to Susan.

(5)(5) John mentioned the book I sent to Susan to his brother. John mentioned the book I sent to Susan to his brother.

(6)(6) I told everyone concerned about the strike. I told everyone concerned about the strike.

(7)(7) I told everyone concerned about the strike not to worry. I told everyone concerned about the strike not to worry.

(8)(8) I told everyone about the strike.I told everyone about the strike.

Page 21: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Auflösung struktureller AmbiguitätAuflösung struktureller Ambiguität

Wenn die syntaktische Analyse mehr als eine mögliche Interpretation für Wenn die syntaktische Analyse mehr als eine mögliche Interpretation für einen Satz produziert, muss ein Weg gefunden werden, die richtige zu einen Satz produziert, muss ein Weg gefunden werden, die richtige zu wählen. Das ist notwendig, weil zwar nicht immer, aber doch sehr wählen. Das ist notwendig, weil zwar nicht immer, aber doch sehr häufig, die Übersetzung in die Zielsprache je nach der gewählten häufig, die Übersetzung in die Zielsprache je nach der gewählten Interpretation anders ausfallen wird.Interpretation anders ausfallen wird.

Bei der Übersetzung von Bei der Übersetzung von The man saw the girl with the telescopeThe man saw the girl with the telescope ins ins Japanische zum Beispiel muss die Mehrdeutigkeit aufgelöst werden:Japanische zum Beispiel muss die Mehrdeutigkeit aufgelöst werden:

Otoko wa Otoko wa BOENKYO WO BOENKYO WO MOITE IRUMOITE IRU onnanoko wo onnanoko wo mitamita..MAN subj MAN subj TELESCOPE obj TELESCOPE obj HOLDING HOLDING GIRL obj GIRL obj SAW SAW 'The man saw the girl who was holding the telescope'. 'The man saw the girl who was holding the telescope'.

Otoko wa Otoko wa BOENKYO DEBOENKYO DE onnanoko wo onnanoko wo mita.mita.MAN subj MAN subj TELESCOPE inst TELESCOPE inst GIRL obj GIRL obj SAW SAW 'The man, using the telescope, saw the girl.' 'The man, using the telescope, saw the girl.'

Page 22: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Auflösung struktureller AmbiguitätAuflösung struktureller Ambiguität

Die Mehrdeutigkeit von Die Mehrdeutigkeit von thatthat in in They complained to the guide They complained to the guide thatthat they could not hear they could not hear muss bei der Übersetzung ins Deutsche muss bei der Übersetzung ins Deutsche ebenfalls aufgelöst werden.ebenfalls aufgelöst werden.

Sie beklagten sich bei dem Reiseführer, DEN sie nicht Sie beklagten sich bei dem Reiseführer, DEN sie nicht hören konnten. hören konnten.

Sie beklagten sich bei dem Reiseführer, DASS sie nicht hören Sie beklagten sich bei dem Reiseführer, DASS sie nicht hören konnten.konnten.

Page 23: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Auflösung struktureller AmbiguitätAuflösung struktureller Ambiguität

Es gibt eine Anzahl von Optionen, die für Auflösung von Es gibt eine Anzahl von Optionen, die für Auflösung von Mehrdeutigkeit verfügbar sind: Mehrdeutigkeit verfügbar sind: die Verwendung semantischer oder anderer linguistischer die Verwendung semantischer oder anderer linguistischer

Information, Information, des Verwendung kontextueller Anhaltspunkte, des Verwendung kontextueller Anhaltspunkte, dem Verwendung von außerlinguistischem 'Weltwissen‚dem Verwendung von außerlinguistischem 'Weltwissen‚ Interaktive Befragung Interaktive Befragung

Eine weitere Möglichkeit besteht darin, die Mehrdeutigkeit Eine weitere Möglichkeit besteht darin, die Mehrdeutigkeit einfach zu ignorieren und darauf zu bauen, dass in der einfach zu ignorieren und darauf zu bauen, dass in der Zielsprache die gleiche Ambiguität vorliegt. Zielsprache die gleiche Ambiguität vorliegt.

Page 24: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Linguistisches WissenLinguistisches Wissen

Oft können potentiell mehrdeutige Sätze unter Bezug auf Oft können potentiell mehrdeutige Sätze unter Bezug auf linguistisches Wissenlinguistisches Wissen disambiguiert werden. Mann kann disambiguiert werden. Mann kann verschiedene Arten von sprachlichem Wissen unterscheiden. Sie verschiedene Arten von sprachlichem Wissen unterscheiden. Sie alle haben gemeinsam, dass sie Informationen über Wörter und die alle haben gemeinsam, dass sie Informationen über Wörter und die Art sie zu kombinieren benutzen und nicht über die über die Art sie zu kombinieren benutzen und nicht über die über die Ereignisse im wirklichen Leben, welche die Sätze beschreiben. Ereignisse im wirklichen Leben, welche die Sätze beschreiben.

Ein Verfahren besteht darin, Parsern (Analsyseprogrammen) Ein Verfahren besteht darin, Parsern (Analsyseprogrammen) Informationen über Vorkommensbeschränkungen zur Verfügung zu Informationen über Vorkommensbeschränkungen zur Verfügung zu stellen, d.h. Hinweise darauf, wie das Vorhandensein bestimmter stellen, d.h. Hinweise darauf, wie das Vorhandensein bestimmter Elemente in einer Struktur die Vorkommensmöglichkeiten anderer Elemente in einer Struktur die Vorkommensmöglichkeiten anderer Elemente beeinflusst. Elemente beeinflusst.

Page 25: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Linguistisches WissenLinguistisches Wissen

Ein typisches Beispiel dafür ist die Verwendung von Subkategori-Ein typisches Beispiel dafür ist die Verwendung von Subkategori-sierungsrahmen für Verben. Diese zeigen an, welche Arten von sierungsrahmen für Verben. Diese zeigen an, welche Arten von Ergänzungen von einem bestimmten Verb 'erwartet' werden. Ergänzungen von einem bestimmten Verb 'erwartet' werden. Ein Verb wie Ein Verb wie givegive zum Beispiel, erwartet als Subjekt ein Nomen, das zum Beispiel, erwartet als Subjekt ein Nomen, das

sich auf einen 'Geber' bezieht, als direktes Objekt ein Nomen, das sich sich auf einen 'Geber' bezieht, als direktes Objekt ein Nomen, das sich auf das 'gegebene' Ding bezieht, und als indirektes Objekt ein Nomen, auf das 'gegebene' Ding bezieht, und als indirektes Objekt ein Nomen, das auf einen 'Empfänger' referiert. das auf einen 'Empfänger' referiert.

Weiterhin können wir in einem gewissen Rahmen bestimmen, mit Weiterhin können wir in einem gewissen Rahmen bestimmen, mit welchen Arten von Nomina diese syntaktischen Rollen gefüllt werden welchen Arten von Nomina diese syntaktischen Rollen gefüllt werden können, z.B. durch die Verwendung von semantischen Merkmalen: der können, z.B. durch die Verwendung von semantischen Merkmalen: der 'Geber' sollte belebt usw. sein. 'Geber' sollte belebt usw. sein.

Page 26: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Linguistisches WissenLinguistisches Wissen

Auf diese Weise kann der Parser für ein potentiell mehrdeutiges Auf diese Weise kann der Parser für ein potentiell mehrdeutiges Satzpaar wie unten die richtigen Interpretationen produzieren, wenn Satzpaar wie unten die richtigen Interpretationen produzieren, wenn er die Information hat, dass er die Information hat, dass readread von einer Präpositionalphrase mit von einer Präpositionalphrase mit inin modifiziert werden kann, wenn das betroffene Nomen zu einer modifiziert werden kann, wenn das betroffene Nomen zu einer Klasse von Nomina gehört, die als 'lesbar' gekennzeichnet sind Klasse von Nomina gehört, die als 'lesbar' gekennzeichnet sind (z.B. (z.B. book, magazine, newspaperbook, magazine, newspaper, usw.) , usw.) (1)(1) I read about the air crash I read about the air crash in Francein France..

(2)(2) I read about the air crash I read about the air crash in the paperin the paper..

Page 27: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Linguistisches WissenLinguistisches Wissen

Diese Art von Information kann auch auf einer allgemeineren Diese Art von Information kann auch auf einer allgemeineren Ebene durch Konzepte wie Ebene durch Konzepte wie ValenzValenz und und Kasus Kasus im Sinne der im Sinne der Kasusgrammatik behandelt werden. Kasusgrammatik behandelt werden.

Durch die Durch die ValenzValenz werden Verben nach der Anzahl und Art der werden Verben nach der Anzahl und Art der Ergänzungen charakterisiert, die mit ihnen entweder assoziiert sein Ergänzungen charakterisiert, die mit ihnen entweder assoziiert sein müssen oder dürfen. müssen oder dürfen.

In der In der KasusgrammatikKasusgrammatik werden die werden die RollenRollen von abhängigen von abhängigen Ergänzungen z.B. als Ergänzungen z.B. als AgentAgent, , PatientPatient (oder (oder ObjectObject) ) InstrumentInstrument, , MannerManner, , AccompanierAccompanier, , LocationLocation, usw. identifiziert. , usw. identifiziert.

Eine typische Verallgemeinerung ist, dass die Subjekte von Eine typische Verallgemeinerung ist, dass die Subjekte von transitiven Verben Agenten sind, die normalerweise 'belebt', transitiven Verben Agenten sind, die normalerweise 'belebt', ‚potent', usw. sind. Für ‚potent', usw. sind. Für givegive wären die erwarteten Kasusrollen wären die erwarteten Kasusrollen AgentAgent, , RecipientRecipient und und PatientPatient. .

Page 28: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Linguistisches WissenLinguistisches Wissen

Die folgenden Beispielsätze werden richtig analysiert, wenn der Die folgenden Beispielsätze werden richtig analysiert, wenn der Parser über die Information verfügt, dass Parser über die Information verfügt, dass writewrite eine instrumentale eine instrumentale withwith-Phrase zu sich nimmt und dass das Instrument ein -Phrase zu sich nimmt und dass das Instrument ein physisches Objekt sein sollte. physisches Objekt sein sollte. (1)(1) He wrote the letter with a fountain‑pen. He wrote the letter with a fountain‑pen.

cf. He wrote the letter with the parcel.cf. He wrote the letter with the parcel. Der Accompanier von Der Accompanier von visitvisit und ähnliche Verben sollte belebt sein; und ähnliche Verben sollte belebt sein;

und und telltell nimmt eine nimmt eine withwith-Phrase der Art und Weise zu sich, mit -Phrase der Art und Weise zu sich, mit einem beschränkten Bereich von möglichen Füllseln (einem beschränkten Bereich von möglichen Füllseln (stutterstutter, , accentaccent, usw.). , usw.). (2)(2) He visited the museum with his brother. He visited the museum with his brother.

cf. He visited the museum with the Elgin marbles.cf. He visited the museum with the Elgin marbles.(3)(3) He told the story He told the story with a funny accentwith a funny accent. .

cf. He told the story cf. He told the story with a funny endingwith a funny ending

Page 29: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

KontextwissenKontextwissen

In der Praxis sind sehr wenige Sätze wirklich mehrdeutig: in In der Praxis sind sehr wenige Sätze wirklich mehrdeutig: in Abwesenheit anderer Disambiguierungskriterien wird Abwesenheit anderer Disambiguierungskriterien wird normalerweise der Kontext, in dem der Satz auftritt, entscheiden normalerweise der Kontext, in dem der Satz auftritt, entscheiden welche von mehreren Lesarten zu bevorzugen ist.welche von mehreren Lesarten zu bevorzugen ist.

Allerdings sind nur sehr wenige MÜ-Systeme in der Lage, Allerdings sind nur sehr wenige MÜ-Systeme in der Lage, solches kontextuelles Wissen zu benutzen. Der Grund dafür ist, solches kontextuelles Wissen zu benutzen. Der Grund dafür ist, dass es sehr schwer ist Regeln zu dafü formulieren, wo man dass es sehr schwer ist Regeln zu dafü formulieren, wo man das 'Wissen' finden kann, das in einem konkreten Fall zur das 'Wissen' finden kann, das in einem konkreten Fall zur Disambiguierung dienen könnte. Zudem müsste die Information, Disambiguierung dienen könnte. Zudem müsste die Information, die während des Übersetzungsprozesses anfällt, gespeichert die während des Übersetzungsprozesses anfällt, gespeichert werden.werden.

Page 30: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Weltwissen Weltwissen

Der dritte Ansatz zur Auflösung von Mehrdeutigkeiten, wenn die Der dritte Ansatz zur Auflösung von Mehrdeutigkeiten, wenn die syntaktische Analyse dafür nicht ausreicht, besteht darin, syntaktische Analyse dafür nicht ausreicht, besteht darin, allgemeines Weltwissen einzubeziehn.allgemeines Weltwissen einzubeziehn.

Ein Beispiel für eine strukturelle Mehrdeutigkeit, die durch Ein Beispiel für eine strukturelle Mehrdeutigkeit, die durch Verwendung von Weltwissen aufgelöst wird, liefert der folgende Verwendung von Weltwissen aufgelöst wird, liefert der folgende Satz : Satz :

(1)(1) The man saw the horse with the telescope.The man saw the horse with the telescope. Die Grenze zwischen Weltwissen und sprachlichem Wissen ist Die Grenze zwischen Weltwissen und sprachlichem Wissen ist

keineswegs klar gezogen.keineswegs klar gezogen.(2)(2) We will meet the man you told us about yesterday.We will meet the man you told us about yesterday.

(3)(3) We will meet the man you told us about tomorrow.We will meet the man you told us about tomorrow.

Page 31: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Anaphorische ReferenzAnaphorische Referenz

Neben der Auflösung von Mehrdeutigkeiten, die oft als das Neben der Auflösung von Mehrdeutigkeiten, die oft als das wichtigste linguistische Problem für die MÜ betrachtet wird, ist wichtigste linguistische Problem für die MÜ betrachtet wird, ist eine andere Hauptschwierigkeit die Auflösung von eine andere Hauptschwierigkeit die Auflösung von pronominalen Verweisen (anaphora resolution). pronominalen Verweisen (anaphora resolution).

'Anapher' ist der linguistische Fachausdruck für einen indirekte 'Anapher' ist der linguistische Fachausdruck für einen indirekte Bezug auf eine Entität, die an einer anderen Textstelle explizit Bezug auf eine Entität, die an einer anderen Textstelle explizit erwähnt wird. Das häufigste linguistische Mittel dafür ist die erwähnt wird. Das häufigste linguistische Mittel dafür ist die Verwendung von Personalpronomina wie Verwendung von Personalpronomina wie es, er, siees, er, sie, usw., , usw., Demonstratpronomina wie Demonstratpronomina wie dies, dieser, diesedies, dieser, diese etc. oder Phrasen etc. oder Phrasen wie wie der (die, das) Letztereder (die, das) Letztere. .

Die Identifizierung von Pronomina schließt deshalb die Die Identifizierung von Pronomina schließt deshalb die Identifizierung einer vorangegangen Nominalphrase ein, auf die Identifizierung einer vorangegangen Nominalphrase ein, auf die sie sich beziehen. Dieses Bezugselement wird sie sich beziehen. Dieses Bezugselement wird AntezedensAntezedens genannt. genannt.

Page 32: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Anaphorische ReferenzAnaphorische Referenz

Die Ermittlung des Antezedens von Anaphern ist sehr oft von Die Ermittlung des Antezedens von Anaphern ist sehr oft von entscheidender Wichtigkeit für die richtige Übersetzung. Wenn in entscheidender Wichtigkeit für die richtige Übersetzung. Wenn in Sprachen übersetzt wird, in denen die Pronomina genusmarkiert sind, Sprachen übersetzt wird, in denen die Pronomina genusmarkiert sind, ist es unerläßlich, die anaphorischen Beziehungen aufzulösen. ist es unerläßlich, die anaphorischen Beziehungen aufzulösen.

(1)(1) The monkey ate the banana because it was hungry.The monkey ate the banana because it was hungry.

(2)(2) The monkey ate the banana because it was ripe.The monkey ate the banana because it was ripe.

(3)(3) The monkey ate the banana because it was tea‑time.The monkey ate the banana because it was tea‑time.

Page 33: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Anaphorische ReferenzAnaphorische Referenz

In jedem dieser Beispiele bezieht sich das Pronomen In jedem dieser Beispiele bezieht sich das Pronomen itit jeweils auf jeweils auf etwas Anderes: in (1) auf etwas Anderes: in (1) auf monkeymonkey, in (2) auf , in (2) auf bananabanana, und in (3) auf die , und in (3) auf die Ereigniszeit. Ereigniszeit.

Für die Übersetzung ins Deutsche, wo die Pronomina im Genus mit Für die Übersetzung ins Deutsche, wo die Pronomina im Genus mit dem Antezedens kongruieren, müssen die entsprechenden Bezüge dem Antezedens kongruieren, müssen die entsprechenden Bezüge explizit gemacht werden. Da explizit gemacht werden. Da AffeAffe maskulin ist, ist das entsprechende maskulin ist, ist das entsprechende Pronomen Pronomen erer; ; BananeBanane ist feminin und das entsprechende Pronomen ist feminin und das entsprechende Pronomen muß muß siesie sein; und das entsprechende Pronomen für (3) ist sein; und das entsprechende Pronomen für (3) ist eses. .

(1)(1) Der Affe hat die Banane gefressen, weil er Hunger hatte.Der Affe hat die Banane gefressen, weil er Hunger hatte.

(2)(2) Der Affe hat die Banane gefressen, weil sie reif war.Der Affe hat die Banane gefressen, weil sie reif war.

(3)(3) Der Affe hat die Banane gefressen, weil es die Teestunde war.Der Affe hat die Banane gefressen, weil es die Teestunde war.

Page 34: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

Anaphorische ReferenzAnaphorische Referenz

Die korrekte Auflösung von anaphorischen Bezügen involviert Die korrekte Auflösung von anaphorischen Bezügen involviert dieselben Wissensarten wie bei der Auflösung von Mehrdeutigkeiten. dieselben Wissensarten wie bei der Auflösung von Mehrdeutigkeiten. In der Tat können Anaphern als eine Art von Mehrdeutigkeit betrachtet In der Tat können Anaphern als eine Art von Mehrdeutigkeit betrachtet werden. werden.

Wie bei der Auflösung von Mehrdeutigkeiten reicht das linguistische Wie bei der Auflösung von Mehrdeutigkeiten reicht das linguistische Wissen manchmal für die richtige Analyse nicht aus. Wenn man die Wissen manchmal für die richtige Analyse nicht aus. Wenn man die folgenden Sätze ins Französische übersetzen will, muß man wissen, folgenden Sätze ins Französische übersetzen will, muß man wissen, ob ob some of themsome of them sich auf sich auf soldierssoldiers (maskulin) oder auf (maskulin) oder auf womenwomen (feminin) bezieht:(feminin) bezieht:

(1)(1) The soldiers shot at the women and The soldiers shot at the women and some of themsome of them fell. fell.

(2)(2) The soldiers shot at the women and The soldiers shot at the women and some of themsome of them missed. missed.

(3)(3) Les soldats ont tiré sur les femmes et Les soldats ont tiré sur les femmes et quelques‑unesquelques‑unes sont tombées. sont tombées.

(4)(4) Les soldats ont tire sur les femmes et Les soldats ont tire sur les femmes et quelques‑unsquelques‑uns ont raté. ont raté.

Page 35: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

QuantorenskopusQuantorenskopus

Als letztes Problem soll die Mehrdeutigkeit im Geltungsbereich Als letztes Problem soll die Mehrdeutigkeit im Geltungsbereich (Skopus) von Quantoren erörtert. (Skopus) von Quantoren erörtert.

Dieses Problem ist im Kontext von natürlichsprachlichen Dieses Problem ist im Kontext von natürlichsprachlichen Dialogsystemen intensiv untersucht worden, wo es Dialogsystemen intensiv untersucht worden, wo es wahrscheinlich entscheidender ist als in der MÜ. Diese Art der wahrscheinlich entscheidender ist als in der MÜ. Diese Art der Mehrdeutigkeit tritt auf, wenn der Geltungsbereich oder Skopus Mehrdeutigkeit tritt auf, wenn der Geltungsbereich oder Skopus eines Quantors wie eines Quantors wie some, all, nonesome, all, none unklar ist. Im Englischen unklar ist. Im Englischen insbesondere gibt es ein syntaktischen Phänomen namens insbesondere gibt es ein syntaktischen Phänomen namens 'Quantorenanhebung‚ (quantifier raising), das die Position des 'Quantorenanhebung‚ (quantifier raising), das die Position des Quantors im Satz verschiebt. Quantors im Satz verschiebt.

Page 36: Probleme der Übersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguität Strukturelle Ambiguität Anaphernauflösung

QuantorenskopusQuantorenskopus

(1)(1) I don't think he'll come. I don't think he'll come. (2)(2) I think he won't come.I think he won't come.(3)(3) All women don't like fur coats.All women don't like fur coats.(4)(4) Not all women like fur coats, only some do. Not all women like fur coats, only some do. (5)(5) There are no women who like fur coats.There are no women who like fur coats.(6)(6) All wires are attached to a pin.All wires are attached to a pin.(7)(7) There is one (large) pin to which all wires are attached. There is one (large) pin to which all wires are attached. (8)(8) Each wire is attached to its own pin.Each wire is attached to its own pin.(9)(9) No smoking seats are available on domestic flights.No smoking seats are available on domestic flights.(10)(10) There are no seats where you may smoke on domestic There are no seats where you may smoke on domestic

flights. flights. (11)(11) There are "no smoking" sections on domestic flights.There are "no smoking" sections on domestic flights.