25
Die verschiedenen Arten Die verschiedenen Arten von Dependenzen zwischen von Dependenzen zwischen Wordformen Wordformen Ludwig-Maximilians-Universität München Ludwig-Maximilians-Universität München Hauptseminar: Hauptseminar: Syntaxanalyse des Russischen im maschinellen Syntaxanalyse des Russischen im maschinellen Übersetzungssystem ETAP-3 Übersetzungssystem ETAP-3 SoSe 2008 SoSe 2008 29.05.2008 29.05.2008 Dozenten: R.Zangenfeind, Dr. Franz Guenthner Dozenten: R.Zangenfeind, Dr. Franz Guenthner Referentin: Natalia Filatova Referentin: Natalia Filatova

Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

Embed Size (px)

Citation preview

Page 1: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

Die verschiedenen Arten von Die verschiedenen Arten von Dependenzen zwischen Dependenzen zwischen

WordformenWordformen

Ludwig-Maximilians-Universität MünchenLudwig-Maximilians-Universität MünchenHauptseminar:Hauptseminar:

Syntaxanalyse des Russischen im maschinellen Syntaxanalyse des Russischen im maschinellen Übersetzungssystem ETAP-3Übersetzungssystem ETAP-3

SoSe 2008SoSe 200829.05.200829.05.2008

Dozenten: R.Zangenfeind, Dr. Franz GuenthnerDozenten: R.Zangenfeind, Dr. Franz GuenthnerReferentin: Natalia FilatovaReferentin: Natalia Filatova

Page 2: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

Die möglichen Arten von Die möglichen Arten von syntagmatischen Dependenzen syntagmatischen Dependenzen zwischen Wortformen in einem zwischen Wortformen in einem

Satz (Teil 1)Satz (Teil 1)

I.A. Mel‘cukI.A. Mel‘cukDependency Syntax: Theory and Practice.1988 (Kapitel 3)Dependency Syntax: Theory and Practice.1988 (Kapitel 3)

Page 3: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

Die elementare Einheiten der Sätze sind die Die elementare Einheiten der Sätze sind die Wortformen oder ‚the deep - morphological Wortformen oder ‚the deep - morphological representations of wordforms‘(DMorphR).representations of wordforms‘(DMorphR). Mel‘cuk unterscheidet drei Hauptarten von Mel‘cuk unterscheidet drei Hauptarten von syntagmatischen Dependenzen, die die syntagmatischen Dependenzen, die die Wortformen in einem Satz in alle Sprachen Wortformen in einem Satz in alle Sprachen verbinden können:verbinden können:

Morphologische oder streng formale Dependenz

Syntaktische oder halb formale halb abstrakte Dependenz

Semantische oder streng abstrakte Dependenz

Page 4: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

Es gibt mehrere Typen, zum Es gibt mehrere Typen, zum Beispiel:Beispiel:

• Anaphorische Verbindung.Wenn zwei Wordformen (w1 und w2) in einem

Ausdruck oder Satz bedeuten das gleiche Objekt:

z.B. He never expressed a disire to remain in the country longer or to return to it.

• Kommunikative Verbindung.Solche Verbindung gilt für zwei Wortformen, die

gleichzeitig zum Thema und Rhema des Satzes gehören.

z.B. What I promised to do,| I will do.

Page 5: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

1. Morphologische Dependenz Die Wortform w1 hängt direkt von der Wortform w2 ab,

wenn und nur wenn der Wert mindestens von einer morphologische Variable w1 wird von w2 bestimmen.

Beispiel: I na grudi ee bulyznoj Blestit rosa serebrjanym soskom. (V.Xlebnikov) (And on her stony breast,/[A] dew [drop] glistens like a silver teat.)

Page 6: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

Die Übereinstimmung von Adjektiven Bulyznoj mit grudi; und

serebrjanim mit soscom nach Genus, Numerus und Kasus;

Nomen grudi ist morphologisch abhängig von Präposition na.

(Vgl: s grud‘ju = Andere Präpositionen brauchen anderen Kasus.)

Verb blestit hängt vom grammatischen Subjekt- Nomen rosa

gemäß Numerus und Person ab.

(Vgl: Blestit rosa und Blestjat rosy oder Ty blestis‘.)

Der grammatische Subjekt rosa ist auch morphologisch

abhängig von dem Verb blestit gemäß Kasus.

In Russisch gibt es ein Paar Verben, die Genitiv vom Subjekt

brauchen,

z. B. Rosy xvataet ‚There is enough dew‘ .

Page 7: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

Morphologische Dependenzen haben drei wichtigen Eigenschaften:

1. Universalität.

Sind solche Dependenzen für jede Sprache, in jedem Satz und für jede Wortform geeignet?

- Wörter, die morphologisch unveränderlich sind z.B. In Englisch: Adverbien, Präpositionen,

Konjunktionen, Partikeln, und Interjektionen. die morphologischen Dependenzen sind nicht

immer obligatorisch, um eine Verbundene Struktur (‚connected structure‘) zu konstruieren.

Page 8: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

2. Bilateral (oder zweiseitig):

w1 kann morphologisch abhängig von w2 gemäß seine Variable Xi(w1) sein, während w2 hängt von w1 gemäß andere Variable Xj(w2); i ist nicht gleich j.

z.B.dve volni (fem) Cf. Dv+a vola (mask).

Gleichzeitig Voln+y (sg Gen form) ist von dve in Numerus und Kasus abhängig.

Cf. Pjat‘voln(wo voln in pl Gen Form); Dvadcat‘ odna voln+a(wo volna ist in Nom sg Form).

Dve --morph-- volny

Page 9: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

3. Von w1w2 folgt nicht unbedingt w3w2, wenn w3 ist nicht gleich w1.

Da ein Wort mehrere morphologische Variablen haben kann, kann es morphologisch von mehreren Wortformen gleichzeitig abhängig sein.

z.B. Ona kazetsja sovsem bol´n+oj. FEM.SG.INSTR.On kazetsja sovsem bol´n+ym.

MASK.SG.INSTR.

Cf.Mit dem anderen Verb:

Ona lezit sovsem bol´n+aja. FEM.SG.NOM.On lezit sovsem bol´n+oj. MASK.SG.NOM.

Page 10: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

2. Semantische Dependenz

In einem Satz hängt Wortform w1 von Wordform w2 ,

wenn und nur wenn die Bedeutung des Lexems

L(w2) von Prädikat ’L(w2)n(....)’ in Wörterbuch

beschrieben ist; und in einem Frage- Satz die

Bedeutung ’L(w1)’ ein Argument von diesem

Prädikate ist: ‚L(w2)n(…,L(w1),….)’.

Page 11: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

Semantische Dependenzen haben die folgenden wichtigen Eigenschaften:

1. Universal wie syntaktische Dependenz.

Semantische Dependenzen kommen in allen Sprachen

vor und beziehen sich auf alle Wörter (außer

semantisch leere Wörter in bestimmten Kontexte)

jeder Sprache. In jedem Satz bilden die semantische

Dependenzen ‚die Verbundenen Konstruktionen‘.

Page 12: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

2. Einseitig (wie syntaktische Dependenzen)

Im Rahmen eines Satzes funktionieren nur einseitige semantische Dependenzen:

Also, es gilt nicht:

w1 sem w2

Page 13: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

3. Semantische Dependenzen voraussetzen keine Einzigartigkeit von sem Herr (auf englisch:

‚governor‘)

Im Gegenteil zu syntaktischen Dependenzen, aber ähnlich wie

bei morphologischen Dependenzen: es ist logisch möglich in

einem Satz für das gleiche Argument mehr als ein Prädikat zu

behaupten. So, in (10) fille ist gleichzeitig abhängig von une, danser

und se mettre;

place von la, sur und chauffee;

dancer von se mettre und von sur, etc.

Page 14: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

Das System von semantischen Dependenzen im Satz:‚On the sun-warmed square, a girl began to dance.‘

Page 15: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

Im Satz sind die folgende interessante semantische Dependenzen zu beobachten:

Place chauffee soleilChauffee ist 2-stell. Prädikat: chauffee (X,Y) = ’X is warmed

by Y’ „chauffee“(place, soleil)

  Präposition ‘sur’ ist ein 2-stell. Prädikat und ordnet

semantisch ‘place und ‘danser’: placesurdanser

Der Artikel (le, la, les, un, une) - 1-stell. Prädikat:laplace, lesoleil, unefille,

Nomen hängt semantisch vom Artikel ab. Artikel hat den entscheidende Funktion.

Page 16: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

3. Syntaktische Dependenzen

Eine syntaktische Einheit von Sprache ist das Vorkommen

von Lexem, Phrase, Satzglied oder Satz.

Die Liste von sprachlichen Konstruktionen (exakt: ‚the list of

the surface-syntactic roles‘), wo eine syntaktische

Einheit vorkommen kann entweder wie

‚dependent(modifying) component‘ oder wie ‚absolute

head‘ wird ‚the passive surface-syntactic

valency‘[passive SS-valency] genannt.

Page 17: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

´The passive SS-valency` ist eine Liste von syntaktischen Rollen. Zum Beispiel, Nomen in Englisch hat die folgende syntaktischen Rollen:

1. Grammatikalischer Subjekt2. Objekt von dem Verb3. kopulativer Verb Komplement4. Präposition Komplement5. Modifizierte Komponente von Nominal Phrase

(paper bag, opposition movement)6. Apposition7. Adverbiale Komplemente von Dauer (He spend one week

there)8. Kopf von absolute Konstruktionen

(The war finished, my parents came to Paris)9. Kopf von Titeln, Etiketten, Schilden, etc

(‚A language with a double causative construction‘; What a beautiful day!)

Page 18: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

Wichtige Annahmen für syntaktische Dependenzen:

(1) SS-valency von einer syntaktische Einheit spielt eine Rolle

nur in SURFACE-SYNTACTIK STRUCTURES, nicht in

einem aktuellen Satz. (Surface-syntactic Representation

vom Satz hat den Form von syntaktischen Baum, wo

Hauptteil als SURFACE-SYNTACTIK STRUCTURE

(SSyntS) dargestellt ist. )

Page 19: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

(11) SS-valency ist SS-Potenzial von Wortform und ist bestimmt

nur von seine ‚INHERENT, LEXIKAL PROPERTIES‘.

• Zum Beispiel, Kasus in Russisch ändert seine passive SS-

valency, die nur für sein Stamm charakteristisch ist, nicht.

Das Kasus zeigt in der morphologischen Struktur vom Satz,

welche entsprechende Nomen die bestimmten SS-Rollen

ausfüllen. Daraus folgt die Definition von SURFACE-

SYNTACTIK DEPENDENZ. Es ist als ein komplexeres

Kriterium – System definiert.

• Wordform w1 hängt syntaktisch von w2 ab, in dem Fall, wenn

passive SS-Valenz von Phrase (w1+w2) von passive SS-

Valenz von Wordform w2 festgelegt ist.

Page 20: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

Das System von syntaktischen Dependenzen im Satz:‚On the sun-warmed square, a girl began to dance.‘:

Page 21: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

Die syntaktischen Dependenzen zwischen verschiedenen Wortformen im Satz:

‚On the sun-warmed square, a girl began to dance.‘:

Artikel/Nomen:

La place ; Lesoleil; Unefille

Nomen/Präposition:

Placesur ; soleila

Nomen/Verbform:

Filleest

Page 22: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

Die Eigenschaften von Syntaktische

Dependenzen: 1.Universal.

Es gibt keine Sprache ohne die Syn Dep.

Sie verbinden die Wortformen in jede Sprache, also sie bilden

immer eine verbundene Struktur (‚Connected Structure’). Ein

Satz kann nicht aus verschiedenen Wordformen bestehen, die

mit den anderen Wordformen in diesem Satz nicht verbunden

sind.

Page 23: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

2. Syntaktische Dependenzen können nicht zweiseitig sein:

*w1-----syn-----w2

In einem Satz ist Wordform w1 syntaktisch abhängig von w2, und wird in diesem Satz nie umgekehrt sein:

`GOVERNOR + DEPENDENT´

3.In einem Satz kann eine Wordform nur von einem anderen Wordform abhängig sein.

Also nicht: *w2---w1---w3

Page 24: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen

Die Eigenschaften von Die Eigenschaften von DependenzenDependenzen

Im allgemeinen, morphologische Dependenzen sind Im allgemeinen, morphologische Dependenzen sind

nützlich, um syntaktische Dependenzen anzudeuten nützlich, um syntaktische Dependenzen anzudeuten

und umgekehrt. Aber es ist nicht immer so, dass und umgekehrt. Aber es ist nicht immer so, dass

w1—morphw1—morph w2 andeuten w1—syn w2 andeuten w1—synw2 und w2 und

w1– semw1– sem w2 andeuten w1—syn w2 andeuten w1—syn w2.w2.

  Morphologische Dependenzen zwischen zwei Morphologische Dependenzen zwischen zwei

bestimmten Wortformen erhalten nicht unbedingt bestimmten Wortformen erhalten nicht unbedingt

direkte syntaktische Dependenzen zwischen denen. direkte syntaktische Dependenzen zwischen denen.

Das gleiche passiert zwischen syntaktischen und Das gleiche passiert zwischen syntaktischen und

semantischen Dependenzen.semantischen Dependenzen.

Page 25: Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen