Upload
siegbert-ambs
View
108
Download
0
Embed Size (px)
Citation preview
1
Transduktoren fuumlr die Sprachverarbeitung
Karin Haenelt
1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
2
Akzeptoren - Transduktoren
copy Karin Haenelt Transduktoren 1652010
3
Akzeptor Transduktor
0 1S
qt
2 3a
5
dt4
tt tt0 1
[ʃ]S
q[t]t
2 3[a]a dt
4[t]
Grundkonzept
regulaumlre Mengen Akzeptor
Erkenner
GrundkonzeptRelationen zwischenregulaumlren Mengen
Transduktor Erkenner Generator Uumlbersetzer
Transduktor Betrachtungsweisen
Erkenner Betrachtung beide Baumlnder werden gelesen berechnete Information Entscheidung ob die Paare von
Zeichenketten akzeptiert werden oder nicht Generator
Betrachtung beide Baumlnder werden geschrieben berechnete Information Aufzaumlhlung der akzeptierten Paare von
Zeichenketten Uumlbersetzer
Betrachtung ein Band wird gelesen ein Band wird geschrieben berechnete Information Aufzaumlhlung aller moumlglichen Zeichenketten
welche zusammen mit den gelesenen Zeichenketten akzeptiert werden
4copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
5
Akzeptoren ndash Transduktoren Aumlquivalenzen
copy Karin Haenelt Transduktoren 1652010
6
EndlicheTransduktoren
regulaumlre Relationen
-Regulaumlre
Sprachpaare
Regulaumlre Ausdruumlckeuumlber Symbolpaare
spezifizieren
akzeptieren
sindaumlquivalent
EndlicheAkzeptoren
regulaumlre Mengen
-RegulaumlreSprachen
Regulaumlre Ausdruumlckeuumlber Symbole
spezifizieren
akzeptieren
sindaumlquivalent
Transduktor Aumlquivalenzen
Endliche Transduktoren sind aumlquivalent zu regulaumlren Relationen Zu jedem endlichen Transduktor laumlsst sich eine aumlquivalente
regulaumlre Relation konstruieren und umgekehrt
Ein Transduktor ist ein endlicher Automat der zwei regulaumlre Sprachen in Relation zueinander setzt und eine regulaumlre Relation repraumlsentiert
7copy Karin Haenelt Transduktoren 1652010
Regulaumlre Relationen
Formulierung 1 Das Cartesische Produkt zweier regulaumlrer Mengen L1 und L2 heiszligt
regulaumlre Relation
Formulierung 2 Seien 1 2 Alphabete formaler Sprachen Dann ist die Menge der
regulaumlren Relationen folgendermaszligen bestimmt Die leere Menge ist eine regulaumlre Relation (xy) fuumlr alle xy 12 ist eine regulaumlre Relation Wenn R R1 und R2 regulaumlre Relationen sind dann sind
R1 R2 = (x1x2y1y2) | (x1y1) R1 (x2y2) R2 R1 R2 = (xy) | (xy) R1 (xy) R2 R = i=0 Ri
regulaumlre Relationen Nichts sonst ist eine regulaumlre Relation
copy Karin Haenelt Transduktoren 1652010
8
Regulaumlre RelationenBeispiele
gemaumlszlig Formulierung 1 Cartesisches Produkt zweierregulaumlrer Mengen
(gabmiddotst) (gebmiddoten)
gemaumlszlig Formulierung 2 regulaumlre Relation
(gabgeb) middot (sten)
copy Karin Haenelt Transduktoren 1652010
9
stgab
engeb
st
en
gab
geb
Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
copy Karin Haenelt Transduktoren 1652010
10
gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S
- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S
- Huumllle R
bb
aa
b
a
b
a
by
ax
y
x
b
a
sang
sing
saumlng
singsingsing
sangsaumlng
y
x
b
axa
yb
gibst
geben
st
en
gib
geb
haha
hihi
ha
hi
ha
hi
Regulaumlre Ausdruumlcke uumlber Symbolpaare
Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)
Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)
11
gabst
geben
gab
gebenen
st
en
gab
geb
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
12
Notation
copy Karin Haenelt Transduktoren 252009
13
Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)
T = ( Q Σ Δ q0 F δ σ wλ ρ)
allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand
F Q Menge der Endzustaumlnde
RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion
σ Q (Σ ε) Q rarrΔ Ausgabefunktion
w Q (Σ ε) Q rarr R+
oder Q (Σ ε) Q Δ rarr R+
Gewichtungsfunktion
Transduktor Definition
14copy Karin Haenelt Transduktoren 1652010
Transduktor Darstellung
die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)
p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand
graphische Darstellung
15
qwoi
p q
i
wo
p
oder
obere Sprache
untere Sprache
copy Karin Haenelt Transduktoren 1652010
Transduktor zu Grunde liegender Automat
Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor
dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)
X ist die Vereinigung aller solcher Paare (xy) in T
16
0 1 2 3 4s a n gs i n g
0 1 2 3 4(ss) (ai) (nn) (gg)
bull (q1 (ai) q2) δA und
bull q2 δ(q1a) und
bull i = σ(q1 a q2)
Zu Grunde liegender Automat ATransduktor T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Identitaumltstransduktor
Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten
A = ( QΣ q0 F δ) ist wie folgt definiert
T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)
17
m a c h m a c h
m a c h
A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Projektionen
Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)
18
w i e gw o g ε
w o g ε
w i e g
π1(T) A = ( Q Σ q0 F δ)
π2(T) A = ( Q Δ q0 F δA)
T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Durch Transduktoren berechenbare Relationen
R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T
Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen
Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion
19copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
2
Akzeptoren - Transduktoren
copy Karin Haenelt Transduktoren 1652010
3
Akzeptor Transduktor
0 1S
qt
2 3a
5
dt4
tt tt0 1
[ʃ]S
q[t]t
2 3[a]a dt
4[t]
Grundkonzept
regulaumlre Mengen Akzeptor
Erkenner
GrundkonzeptRelationen zwischenregulaumlren Mengen
Transduktor Erkenner Generator Uumlbersetzer
Transduktor Betrachtungsweisen
Erkenner Betrachtung beide Baumlnder werden gelesen berechnete Information Entscheidung ob die Paare von
Zeichenketten akzeptiert werden oder nicht Generator
Betrachtung beide Baumlnder werden geschrieben berechnete Information Aufzaumlhlung der akzeptierten Paare von
Zeichenketten Uumlbersetzer
Betrachtung ein Band wird gelesen ein Band wird geschrieben berechnete Information Aufzaumlhlung aller moumlglichen Zeichenketten
welche zusammen mit den gelesenen Zeichenketten akzeptiert werden
4copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
5
Akzeptoren ndash Transduktoren Aumlquivalenzen
copy Karin Haenelt Transduktoren 1652010
6
EndlicheTransduktoren
regulaumlre Relationen
-Regulaumlre
Sprachpaare
Regulaumlre Ausdruumlckeuumlber Symbolpaare
spezifizieren
akzeptieren
sindaumlquivalent
EndlicheAkzeptoren
regulaumlre Mengen
-RegulaumlreSprachen
Regulaumlre Ausdruumlckeuumlber Symbole
spezifizieren
akzeptieren
sindaumlquivalent
Transduktor Aumlquivalenzen
Endliche Transduktoren sind aumlquivalent zu regulaumlren Relationen Zu jedem endlichen Transduktor laumlsst sich eine aumlquivalente
regulaumlre Relation konstruieren und umgekehrt
Ein Transduktor ist ein endlicher Automat der zwei regulaumlre Sprachen in Relation zueinander setzt und eine regulaumlre Relation repraumlsentiert
7copy Karin Haenelt Transduktoren 1652010
Regulaumlre Relationen
Formulierung 1 Das Cartesische Produkt zweier regulaumlrer Mengen L1 und L2 heiszligt
regulaumlre Relation
Formulierung 2 Seien 1 2 Alphabete formaler Sprachen Dann ist die Menge der
regulaumlren Relationen folgendermaszligen bestimmt Die leere Menge ist eine regulaumlre Relation (xy) fuumlr alle xy 12 ist eine regulaumlre Relation Wenn R R1 und R2 regulaumlre Relationen sind dann sind
R1 R2 = (x1x2y1y2) | (x1y1) R1 (x2y2) R2 R1 R2 = (xy) | (xy) R1 (xy) R2 R = i=0 Ri
regulaumlre Relationen Nichts sonst ist eine regulaumlre Relation
copy Karin Haenelt Transduktoren 1652010
8
Regulaumlre RelationenBeispiele
gemaumlszlig Formulierung 1 Cartesisches Produkt zweierregulaumlrer Mengen
(gabmiddotst) (gebmiddoten)
gemaumlszlig Formulierung 2 regulaumlre Relation
(gabgeb) middot (sten)
copy Karin Haenelt Transduktoren 1652010
9
stgab
engeb
st
en
gab
geb
Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
copy Karin Haenelt Transduktoren 1652010
10
gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S
- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S
- Huumllle R
bb
aa
b
a
b
a
by
ax
y
x
b
a
sang
sing
saumlng
singsingsing
sangsaumlng
y
x
b
axa
yb
gibst
geben
st
en
gib
geb
haha
hihi
ha
hi
ha
hi
Regulaumlre Ausdruumlcke uumlber Symbolpaare
Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)
Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)
11
gabst
geben
gab
gebenen
st
en
gab
geb
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
12
Notation
copy Karin Haenelt Transduktoren 252009
13
Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)
T = ( Q Σ Δ q0 F δ σ wλ ρ)
allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand
F Q Menge der Endzustaumlnde
RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion
σ Q (Σ ε) Q rarrΔ Ausgabefunktion
w Q (Σ ε) Q rarr R+
oder Q (Σ ε) Q Δ rarr R+
Gewichtungsfunktion
Transduktor Definition
14copy Karin Haenelt Transduktoren 1652010
Transduktor Darstellung
die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)
p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand
graphische Darstellung
15
qwoi
p q
i
wo
p
oder
obere Sprache
untere Sprache
copy Karin Haenelt Transduktoren 1652010
Transduktor zu Grunde liegender Automat
Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor
dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)
X ist die Vereinigung aller solcher Paare (xy) in T
16
0 1 2 3 4s a n gs i n g
0 1 2 3 4(ss) (ai) (nn) (gg)
bull (q1 (ai) q2) δA und
bull q2 δ(q1a) und
bull i = σ(q1 a q2)
Zu Grunde liegender Automat ATransduktor T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Identitaumltstransduktor
Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten
A = ( QΣ q0 F δ) ist wie folgt definiert
T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)
17
m a c h m a c h
m a c h
A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Projektionen
Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)
18
w i e gw o g ε
w o g ε
w i e g
π1(T) A = ( Q Σ q0 F δ)
π2(T) A = ( Q Δ q0 F δA)
T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Durch Transduktoren berechenbare Relationen
R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T
Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen
Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion
19copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Akzeptoren - Transduktoren
copy Karin Haenelt Transduktoren 1652010
3
Akzeptor Transduktor
0 1S
qt
2 3a
5
dt4
tt tt0 1
[ʃ]S
q[t]t
2 3[a]a dt
4[t]
Grundkonzept
regulaumlre Mengen Akzeptor
Erkenner
GrundkonzeptRelationen zwischenregulaumlren Mengen
Transduktor Erkenner Generator Uumlbersetzer
Transduktor Betrachtungsweisen
Erkenner Betrachtung beide Baumlnder werden gelesen berechnete Information Entscheidung ob die Paare von
Zeichenketten akzeptiert werden oder nicht Generator
Betrachtung beide Baumlnder werden geschrieben berechnete Information Aufzaumlhlung der akzeptierten Paare von
Zeichenketten Uumlbersetzer
Betrachtung ein Band wird gelesen ein Band wird geschrieben berechnete Information Aufzaumlhlung aller moumlglichen Zeichenketten
welche zusammen mit den gelesenen Zeichenketten akzeptiert werden
4copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
5
Akzeptoren ndash Transduktoren Aumlquivalenzen
copy Karin Haenelt Transduktoren 1652010
6
EndlicheTransduktoren
regulaumlre Relationen
-Regulaumlre
Sprachpaare
Regulaumlre Ausdruumlckeuumlber Symbolpaare
spezifizieren
akzeptieren
sindaumlquivalent
EndlicheAkzeptoren
regulaumlre Mengen
-RegulaumlreSprachen
Regulaumlre Ausdruumlckeuumlber Symbole
spezifizieren
akzeptieren
sindaumlquivalent
Transduktor Aumlquivalenzen
Endliche Transduktoren sind aumlquivalent zu regulaumlren Relationen Zu jedem endlichen Transduktor laumlsst sich eine aumlquivalente
regulaumlre Relation konstruieren und umgekehrt
Ein Transduktor ist ein endlicher Automat der zwei regulaumlre Sprachen in Relation zueinander setzt und eine regulaumlre Relation repraumlsentiert
7copy Karin Haenelt Transduktoren 1652010
Regulaumlre Relationen
Formulierung 1 Das Cartesische Produkt zweier regulaumlrer Mengen L1 und L2 heiszligt
regulaumlre Relation
Formulierung 2 Seien 1 2 Alphabete formaler Sprachen Dann ist die Menge der
regulaumlren Relationen folgendermaszligen bestimmt Die leere Menge ist eine regulaumlre Relation (xy) fuumlr alle xy 12 ist eine regulaumlre Relation Wenn R R1 und R2 regulaumlre Relationen sind dann sind
R1 R2 = (x1x2y1y2) | (x1y1) R1 (x2y2) R2 R1 R2 = (xy) | (xy) R1 (xy) R2 R = i=0 Ri
regulaumlre Relationen Nichts sonst ist eine regulaumlre Relation
copy Karin Haenelt Transduktoren 1652010
8
Regulaumlre RelationenBeispiele
gemaumlszlig Formulierung 1 Cartesisches Produkt zweierregulaumlrer Mengen
(gabmiddotst) (gebmiddoten)
gemaumlszlig Formulierung 2 regulaumlre Relation
(gabgeb) middot (sten)
copy Karin Haenelt Transduktoren 1652010
9
stgab
engeb
st
en
gab
geb
Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
copy Karin Haenelt Transduktoren 1652010
10
gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S
- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S
- Huumllle R
bb
aa
b
a
b
a
by
ax
y
x
b
a
sang
sing
saumlng
singsingsing
sangsaumlng
y
x
b
axa
yb
gibst
geben
st
en
gib
geb
haha
hihi
ha
hi
ha
hi
Regulaumlre Ausdruumlcke uumlber Symbolpaare
Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)
Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)
11
gabst
geben
gab
gebenen
st
en
gab
geb
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
12
Notation
copy Karin Haenelt Transduktoren 252009
13
Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)
T = ( Q Σ Δ q0 F δ σ wλ ρ)
allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand
F Q Menge der Endzustaumlnde
RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion
σ Q (Σ ε) Q rarrΔ Ausgabefunktion
w Q (Σ ε) Q rarr R+
oder Q (Σ ε) Q Δ rarr R+
Gewichtungsfunktion
Transduktor Definition
14copy Karin Haenelt Transduktoren 1652010
Transduktor Darstellung
die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)
p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand
graphische Darstellung
15
qwoi
p q
i
wo
p
oder
obere Sprache
untere Sprache
copy Karin Haenelt Transduktoren 1652010
Transduktor zu Grunde liegender Automat
Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor
dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)
X ist die Vereinigung aller solcher Paare (xy) in T
16
0 1 2 3 4s a n gs i n g
0 1 2 3 4(ss) (ai) (nn) (gg)
bull (q1 (ai) q2) δA und
bull q2 δ(q1a) und
bull i = σ(q1 a q2)
Zu Grunde liegender Automat ATransduktor T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Identitaumltstransduktor
Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten
A = ( QΣ q0 F δ) ist wie folgt definiert
T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)
17
m a c h m a c h
m a c h
A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Projektionen
Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)
18
w i e gw o g ε
w o g ε
w i e g
π1(T) A = ( Q Σ q0 F δ)
π2(T) A = ( Q Δ q0 F δA)
T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Durch Transduktoren berechenbare Relationen
R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T
Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen
Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion
19copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Transduktor Betrachtungsweisen
Erkenner Betrachtung beide Baumlnder werden gelesen berechnete Information Entscheidung ob die Paare von
Zeichenketten akzeptiert werden oder nicht Generator
Betrachtung beide Baumlnder werden geschrieben berechnete Information Aufzaumlhlung der akzeptierten Paare von
Zeichenketten Uumlbersetzer
Betrachtung ein Band wird gelesen ein Band wird geschrieben berechnete Information Aufzaumlhlung aller moumlglichen Zeichenketten
welche zusammen mit den gelesenen Zeichenketten akzeptiert werden
4copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
5
Akzeptoren ndash Transduktoren Aumlquivalenzen
copy Karin Haenelt Transduktoren 1652010
6
EndlicheTransduktoren
regulaumlre Relationen
-Regulaumlre
Sprachpaare
Regulaumlre Ausdruumlckeuumlber Symbolpaare
spezifizieren
akzeptieren
sindaumlquivalent
EndlicheAkzeptoren
regulaumlre Mengen
-RegulaumlreSprachen
Regulaumlre Ausdruumlckeuumlber Symbole
spezifizieren
akzeptieren
sindaumlquivalent
Transduktor Aumlquivalenzen
Endliche Transduktoren sind aumlquivalent zu regulaumlren Relationen Zu jedem endlichen Transduktor laumlsst sich eine aumlquivalente
regulaumlre Relation konstruieren und umgekehrt
Ein Transduktor ist ein endlicher Automat der zwei regulaumlre Sprachen in Relation zueinander setzt und eine regulaumlre Relation repraumlsentiert
7copy Karin Haenelt Transduktoren 1652010
Regulaumlre Relationen
Formulierung 1 Das Cartesische Produkt zweier regulaumlrer Mengen L1 und L2 heiszligt
regulaumlre Relation
Formulierung 2 Seien 1 2 Alphabete formaler Sprachen Dann ist die Menge der
regulaumlren Relationen folgendermaszligen bestimmt Die leere Menge ist eine regulaumlre Relation (xy) fuumlr alle xy 12 ist eine regulaumlre Relation Wenn R R1 und R2 regulaumlre Relationen sind dann sind
R1 R2 = (x1x2y1y2) | (x1y1) R1 (x2y2) R2 R1 R2 = (xy) | (xy) R1 (xy) R2 R = i=0 Ri
regulaumlre Relationen Nichts sonst ist eine regulaumlre Relation
copy Karin Haenelt Transduktoren 1652010
8
Regulaumlre RelationenBeispiele
gemaumlszlig Formulierung 1 Cartesisches Produkt zweierregulaumlrer Mengen
(gabmiddotst) (gebmiddoten)
gemaumlszlig Formulierung 2 regulaumlre Relation
(gabgeb) middot (sten)
copy Karin Haenelt Transduktoren 1652010
9
stgab
engeb
st
en
gab
geb
Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
copy Karin Haenelt Transduktoren 1652010
10
gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S
- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S
- Huumllle R
bb
aa
b
a
b
a
by
ax
y
x
b
a
sang
sing
saumlng
singsingsing
sangsaumlng
y
x
b
axa
yb
gibst
geben
st
en
gib
geb
haha
hihi
ha
hi
ha
hi
Regulaumlre Ausdruumlcke uumlber Symbolpaare
Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)
Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)
11
gabst
geben
gab
gebenen
st
en
gab
geb
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
12
Notation
copy Karin Haenelt Transduktoren 252009
13
Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)
T = ( Q Σ Δ q0 F δ σ wλ ρ)
allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand
F Q Menge der Endzustaumlnde
RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion
σ Q (Σ ε) Q rarrΔ Ausgabefunktion
w Q (Σ ε) Q rarr R+
oder Q (Σ ε) Q Δ rarr R+
Gewichtungsfunktion
Transduktor Definition
14copy Karin Haenelt Transduktoren 1652010
Transduktor Darstellung
die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)
p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand
graphische Darstellung
15
qwoi
p q
i
wo
p
oder
obere Sprache
untere Sprache
copy Karin Haenelt Transduktoren 1652010
Transduktor zu Grunde liegender Automat
Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor
dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)
X ist die Vereinigung aller solcher Paare (xy) in T
16
0 1 2 3 4s a n gs i n g
0 1 2 3 4(ss) (ai) (nn) (gg)
bull (q1 (ai) q2) δA und
bull q2 δ(q1a) und
bull i = σ(q1 a q2)
Zu Grunde liegender Automat ATransduktor T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Identitaumltstransduktor
Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten
A = ( QΣ q0 F δ) ist wie folgt definiert
T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)
17
m a c h m a c h
m a c h
A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Projektionen
Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)
18
w i e gw o g ε
w o g ε
w i e g
π1(T) A = ( Q Σ q0 F δ)
π2(T) A = ( Q Δ q0 F δA)
T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Durch Transduktoren berechenbare Relationen
R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T
Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen
Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion
19copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
5
Akzeptoren ndash Transduktoren Aumlquivalenzen
copy Karin Haenelt Transduktoren 1652010
6
EndlicheTransduktoren
regulaumlre Relationen
-Regulaumlre
Sprachpaare
Regulaumlre Ausdruumlckeuumlber Symbolpaare
spezifizieren
akzeptieren
sindaumlquivalent
EndlicheAkzeptoren
regulaumlre Mengen
-RegulaumlreSprachen
Regulaumlre Ausdruumlckeuumlber Symbole
spezifizieren
akzeptieren
sindaumlquivalent
Transduktor Aumlquivalenzen
Endliche Transduktoren sind aumlquivalent zu regulaumlren Relationen Zu jedem endlichen Transduktor laumlsst sich eine aumlquivalente
regulaumlre Relation konstruieren und umgekehrt
Ein Transduktor ist ein endlicher Automat der zwei regulaumlre Sprachen in Relation zueinander setzt und eine regulaumlre Relation repraumlsentiert
7copy Karin Haenelt Transduktoren 1652010
Regulaumlre Relationen
Formulierung 1 Das Cartesische Produkt zweier regulaumlrer Mengen L1 und L2 heiszligt
regulaumlre Relation
Formulierung 2 Seien 1 2 Alphabete formaler Sprachen Dann ist die Menge der
regulaumlren Relationen folgendermaszligen bestimmt Die leere Menge ist eine regulaumlre Relation (xy) fuumlr alle xy 12 ist eine regulaumlre Relation Wenn R R1 und R2 regulaumlre Relationen sind dann sind
R1 R2 = (x1x2y1y2) | (x1y1) R1 (x2y2) R2 R1 R2 = (xy) | (xy) R1 (xy) R2 R = i=0 Ri
regulaumlre Relationen Nichts sonst ist eine regulaumlre Relation
copy Karin Haenelt Transduktoren 1652010
8
Regulaumlre RelationenBeispiele
gemaumlszlig Formulierung 1 Cartesisches Produkt zweierregulaumlrer Mengen
(gabmiddotst) (gebmiddoten)
gemaumlszlig Formulierung 2 regulaumlre Relation
(gabgeb) middot (sten)
copy Karin Haenelt Transduktoren 1652010
9
stgab
engeb
st
en
gab
geb
Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
copy Karin Haenelt Transduktoren 1652010
10
gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S
- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S
- Huumllle R
bb
aa
b
a
b
a
by
ax
y
x
b
a
sang
sing
saumlng
singsingsing
sangsaumlng
y
x
b
axa
yb
gibst
geben
st
en
gib
geb
haha
hihi
ha
hi
ha
hi
Regulaumlre Ausdruumlcke uumlber Symbolpaare
Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)
Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)
11
gabst
geben
gab
gebenen
st
en
gab
geb
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
12
Notation
copy Karin Haenelt Transduktoren 252009
13
Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)
T = ( Q Σ Δ q0 F δ σ wλ ρ)
allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand
F Q Menge der Endzustaumlnde
RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion
σ Q (Σ ε) Q rarrΔ Ausgabefunktion
w Q (Σ ε) Q rarr R+
oder Q (Σ ε) Q Δ rarr R+
Gewichtungsfunktion
Transduktor Definition
14copy Karin Haenelt Transduktoren 1652010
Transduktor Darstellung
die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)
p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand
graphische Darstellung
15
qwoi
p q
i
wo
p
oder
obere Sprache
untere Sprache
copy Karin Haenelt Transduktoren 1652010
Transduktor zu Grunde liegender Automat
Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor
dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)
X ist die Vereinigung aller solcher Paare (xy) in T
16
0 1 2 3 4s a n gs i n g
0 1 2 3 4(ss) (ai) (nn) (gg)
bull (q1 (ai) q2) δA und
bull q2 δ(q1a) und
bull i = σ(q1 a q2)
Zu Grunde liegender Automat ATransduktor T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Identitaumltstransduktor
Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten
A = ( QΣ q0 F δ) ist wie folgt definiert
T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)
17
m a c h m a c h
m a c h
A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Projektionen
Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)
18
w i e gw o g ε
w o g ε
w i e g
π1(T) A = ( Q Σ q0 F δ)
π2(T) A = ( Q Δ q0 F δA)
T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Durch Transduktoren berechenbare Relationen
R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T
Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen
Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion
19copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Akzeptoren ndash Transduktoren Aumlquivalenzen
copy Karin Haenelt Transduktoren 1652010
6
EndlicheTransduktoren
regulaumlre Relationen
-Regulaumlre
Sprachpaare
Regulaumlre Ausdruumlckeuumlber Symbolpaare
spezifizieren
akzeptieren
sindaumlquivalent
EndlicheAkzeptoren
regulaumlre Mengen
-RegulaumlreSprachen
Regulaumlre Ausdruumlckeuumlber Symbole
spezifizieren
akzeptieren
sindaumlquivalent
Transduktor Aumlquivalenzen
Endliche Transduktoren sind aumlquivalent zu regulaumlren Relationen Zu jedem endlichen Transduktor laumlsst sich eine aumlquivalente
regulaumlre Relation konstruieren und umgekehrt
Ein Transduktor ist ein endlicher Automat der zwei regulaumlre Sprachen in Relation zueinander setzt und eine regulaumlre Relation repraumlsentiert
7copy Karin Haenelt Transduktoren 1652010
Regulaumlre Relationen
Formulierung 1 Das Cartesische Produkt zweier regulaumlrer Mengen L1 und L2 heiszligt
regulaumlre Relation
Formulierung 2 Seien 1 2 Alphabete formaler Sprachen Dann ist die Menge der
regulaumlren Relationen folgendermaszligen bestimmt Die leere Menge ist eine regulaumlre Relation (xy) fuumlr alle xy 12 ist eine regulaumlre Relation Wenn R R1 und R2 regulaumlre Relationen sind dann sind
R1 R2 = (x1x2y1y2) | (x1y1) R1 (x2y2) R2 R1 R2 = (xy) | (xy) R1 (xy) R2 R = i=0 Ri
regulaumlre Relationen Nichts sonst ist eine regulaumlre Relation
copy Karin Haenelt Transduktoren 1652010
8
Regulaumlre RelationenBeispiele
gemaumlszlig Formulierung 1 Cartesisches Produkt zweierregulaumlrer Mengen
(gabmiddotst) (gebmiddoten)
gemaumlszlig Formulierung 2 regulaumlre Relation
(gabgeb) middot (sten)
copy Karin Haenelt Transduktoren 1652010
9
stgab
engeb
st
en
gab
geb
Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
copy Karin Haenelt Transduktoren 1652010
10
gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S
- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S
- Huumllle R
bb
aa
b
a
b
a
by
ax
y
x
b
a
sang
sing
saumlng
singsingsing
sangsaumlng
y
x
b
axa
yb
gibst
geben
st
en
gib
geb
haha
hihi
ha
hi
ha
hi
Regulaumlre Ausdruumlcke uumlber Symbolpaare
Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)
Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)
11
gabst
geben
gab
gebenen
st
en
gab
geb
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
12
Notation
copy Karin Haenelt Transduktoren 252009
13
Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)
T = ( Q Σ Δ q0 F δ σ wλ ρ)
allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand
F Q Menge der Endzustaumlnde
RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion
σ Q (Σ ε) Q rarrΔ Ausgabefunktion
w Q (Σ ε) Q rarr R+
oder Q (Σ ε) Q Δ rarr R+
Gewichtungsfunktion
Transduktor Definition
14copy Karin Haenelt Transduktoren 1652010
Transduktor Darstellung
die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)
p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand
graphische Darstellung
15
qwoi
p q
i
wo
p
oder
obere Sprache
untere Sprache
copy Karin Haenelt Transduktoren 1652010
Transduktor zu Grunde liegender Automat
Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor
dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)
X ist die Vereinigung aller solcher Paare (xy) in T
16
0 1 2 3 4s a n gs i n g
0 1 2 3 4(ss) (ai) (nn) (gg)
bull (q1 (ai) q2) δA und
bull q2 δ(q1a) und
bull i = σ(q1 a q2)
Zu Grunde liegender Automat ATransduktor T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Identitaumltstransduktor
Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten
A = ( QΣ q0 F δ) ist wie folgt definiert
T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)
17
m a c h m a c h
m a c h
A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Projektionen
Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)
18
w i e gw o g ε
w o g ε
w i e g
π1(T) A = ( Q Σ q0 F δ)
π2(T) A = ( Q Δ q0 F δA)
T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Durch Transduktoren berechenbare Relationen
R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T
Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen
Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion
19copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Transduktor Aumlquivalenzen
Endliche Transduktoren sind aumlquivalent zu regulaumlren Relationen Zu jedem endlichen Transduktor laumlsst sich eine aumlquivalente
regulaumlre Relation konstruieren und umgekehrt
Ein Transduktor ist ein endlicher Automat der zwei regulaumlre Sprachen in Relation zueinander setzt und eine regulaumlre Relation repraumlsentiert
7copy Karin Haenelt Transduktoren 1652010
Regulaumlre Relationen
Formulierung 1 Das Cartesische Produkt zweier regulaumlrer Mengen L1 und L2 heiszligt
regulaumlre Relation
Formulierung 2 Seien 1 2 Alphabete formaler Sprachen Dann ist die Menge der
regulaumlren Relationen folgendermaszligen bestimmt Die leere Menge ist eine regulaumlre Relation (xy) fuumlr alle xy 12 ist eine regulaumlre Relation Wenn R R1 und R2 regulaumlre Relationen sind dann sind
R1 R2 = (x1x2y1y2) | (x1y1) R1 (x2y2) R2 R1 R2 = (xy) | (xy) R1 (xy) R2 R = i=0 Ri
regulaumlre Relationen Nichts sonst ist eine regulaumlre Relation
copy Karin Haenelt Transduktoren 1652010
8
Regulaumlre RelationenBeispiele
gemaumlszlig Formulierung 1 Cartesisches Produkt zweierregulaumlrer Mengen
(gabmiddotst) (gebmiddoten)
gemaumlszlig Formulierung 2 regulaumlre Relation
(gabgeb) middot (sten)
copy Karin Haenelt Transduktoren 1652010
9
stgab
engeb
st
en
gab
geb
Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
copy Karin Haenelt Transduktoren 1652010
10
gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S
- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S
- Huumllle R
bb
aa
b
a
b
a
by
ax
y
x
b
a
sang
sing
saumlng
singsingsing
sangsaumlng
y
x
b
axa
yb
gibst
geben
st
en
gib
geb
haha
hihi
ha
hi
ha
hi
Regulaumlre Ausdruumlcke uumlber Symbolpaare
Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)
Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)
11
gabst
geben
gab
gebenen
st
en
gab
geb
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
12
Notation
copy Karin Haenelt Transduktoren 252009
13
Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)
T = ( Q Σ Δ q0 F δ σ wλ ρ)
allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand
F Q Menge der Endzustaumlnde
RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion
σ Q (Σ ε) Q rarrΔ Ausgabefunktion
w Q (Σ ε) Q rarr R+
oder Q (Σ ε) Q Δ rarr R+
Gewichtungsfunktion
Transduktor Definition
14copy Karin Haenelt Transduktoren 1652010
Transduktor Darstellung
die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)
p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand
graphische Darstellung
15
qwoi
p q
i
wo
p
oder
obere Sprache
untere Sprache
copy Karin Haenelt Transduktoren 1652010
Transduktor zu Grunde liegender Automat
Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor
dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)
X ist die Vereinigung aller solcher Paare (xy) in T
16
0 1 2 3 4s a n gs i n g
0 1 2 3 4(ss) (ai) (nn) (gg)
bull (q1 (ai) q2) δA und
bull q2 δ(q1a) und
bull i = σ(q1 a q2)
Zu Grunde liegender Automat ATransduktor T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Identitaumltstransduktor
Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten
A = ( QΣ q0 F δ) ist wie folgt definiert
T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)
17
m a c h m a c h
m a c h
A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Projektionen
Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)
18
w i e gw o g ε
w o g ε
w i e g
π1(T) A = ( Q Σ q0 F δ)
π2(T) A = ( Q Δ q0 F δA)
T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Durch Transduktoren berechenbare Relationen
R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T
Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen
Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion
19copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Regulaumlre Relationen
Formulierung 1 Das Cartesische Produkt zweier regulaumlrer Mengen L1 und L2 heiszligt
regulaumlre Relation
Formulierung 2 Seien 1 2 Alphabete formaler Sprachen Dann ist die Menge der
regulaumlren Relationen folgendermaszligen bestimmt Die leere Menge ist eine regulaumlre Relation (xy) fuumlr alle xy 12 ist eine regulaumlre Relation Wenn R R1 und R2 regulaumlre Relationen sind dann sind
R1 R2 = (x1x2y1y2) | (x1y1) R1 (x2y2) R2 R1 R2 = (xy) | (xy) R1 (xy) R2 R = i=0 Ri
regulaumlre Relationen Nichts sonst ist eine regulaumlre Relation
copy Karin Haenelt Transduktoren 1652010
8
Regulaumlre RelationenBeispiele
gemaumlszlig Formulierung 1 Cartesisches Produkt zweierregulaumlrer Mengen
(gabmiddotst) (gebmiddoten)
gemaumlszlig Formulierung 2 regulaumlre Relation
(gabgeb) middot (sten)
copy Karin Haenelt Transduktoren 1652010
9
stgab
engeb
st
en
gab
geb
Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
copy Karin Haenelt Transduktoren 1652010
10
gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S
- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S
- Huumllle R
bb
aa
b
a
b
a
by
ax
y
x
b
a
sang
sing
saumlng
singsingsing
sangsaumlng
y
x
b
axa
yb
gibst
geben
st
en
gib
geb
haha
hihi
ha
hi
ha
hi
Regulaumlre Ausdruumlcke uumlber Symbolpaare
Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)
Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)
11
gabst
geben
gab
gebenen
st
en
gab
geb
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
12
Notation
copy Karin Haenelt Transduktoren 252009
13
Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)
T = ( Q Σ Δ q0 F δ σ wλ ρ)
allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand
F Q Menge der Endzustaumlnde
RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion
σ Q (Σ ε) Q rarrΔ Ausgabefunktion
w Q (Σ ε) Q rarr R+
oder Q (Σ ε) Q Δ rarr R+
Gewichtungsfunktion
Transduktor Definition
14copy Karin Haenelt Transduktoren 1652010
Transduktor Darstellung
die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)
p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand
graphische Darstellung
15
qwoi
p q
i
wo
p
oder
obere Sprache
untere Sprache
copy Karin Haenelt Transduktoren 1652010
Transduktor zu Grunde liegender Automat
Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor
dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)
X ist die Vereinigung aller solcher Paare (xy) in T
16
0 1 2 3 4s a n gs i n g
0 1 2 3 4(ss) (ai) (nn) (gg)
bull (q1 (ai) q2) δA und
bull q2 δ(q1a) und
bull i = σ(q1 a q2)
Zu Grunde liegender Automat ATransduktor T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Identitaumltstransduktor
Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten
A = ( QΣ q0 F δ) ist wie folgt definiert
T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)
17
m a c h m a c h
m a c h
A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Projektionen
Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)
18
w i e gw o g ε
w o g ε
w i e g
π1(T) A = ( Q Σ q0 F δ)
π2(T) A = ( Q Δ q0 F δA)
T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Durch Transduktoren berechenbare Relationen
R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T
Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen
Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion
19copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Regulaumlre RelationenBeispiele
gemaumlszlig Formulierung 1 Cartesisches Produkt zweierregulaumlrer Mengen
(gabmiddotst) (gebmiddoten)
gemaumlszlig Formulierung 2 regulaumlre Relation
(gabgeb) middot (sten)
copy Karin Haenelt Transduktoren 1652010
9
stgab
engeb
st
en
gab
geb
Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
copy Karin Haenelt Transduktoren 1652010
10
gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S
- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S
- Huumllle R
bb
aa
b
a
b
a
by
ax
y
x
b
a
sang
sing
saumlng
singsingsing
sangsaumlng
y
x
b
axa
yb
gibst
geben
st
en
gib
geb
haha
hihi
ha
hi
ha
hi
Regulaumlre Ausdruumlcke uumlber Symbolpaare
Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)
Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)
11
gabst
geben
gab
gebenen
st
en
gab
geb
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
12
Notation
copy Karin Haenelt Transduktoren 252009
13
Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)
T = ( Q Σ Δ q0 F δ σ wλ ρ)
allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand
F Q Menge der Endzustaumlnde
RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion
σ Q (Σ ε) Q rarrΔ Ausgabefunktion
w Q (Σ ε) Q rarr R+
oder Q (Σ ε) Q Δ rarr R+
Gewichtungsfunktion
Transduktor Definition
14copy Karin Haenelt Transduktoren 1652010
Transduktor Darstellung
die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)
p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand
graphische Darstellung
15
qwoi
p q
i
wo
p
oder
obere Sprache
untere Sprache
copy Karin Haenelt Transduktoren 1652010
Transduktor zu Grunde liegender Automat
Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor
dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)
X ist die Vereinigung aller solcher Paare (xy) in T
16
0 1 2 3 4s a n gs i n g
0 1 2 3 4(ss) (ai) (nn) (gg)
bull (q1 (ai) q2) δA und
bull q2 δ(q1a) und
bull i = σ(q1 a q2)
Zu Grunde liegender Automat ATransduktor T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Identitaumltstransduktor
Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten
A = ( QΣ q0 F δ) ist wie folgt definiert
T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)
17
m a c h m a c h
m a c h
A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Projektionen
Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)
18
w i e gw o g ε
w o g ε
w i e g
π1(T) A = ( Q Σ q0 F δ)
π2(T) A = ( Q Δ q0 F δA)
T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Durch Transduktoren berechenbare Relationen
R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T
Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen
Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion
19copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
copy Karin Haenelt Transduktoren 1652010
10
gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S
- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S
- Huumllle R
bb
aa
b
a
b
a
by
ax
y
x
b
a
sang
sing
saumlng
singsingsing
sangsaumlng
y
x
b
axa
yb
gibst
geben
st
en
gib
geb
haha
hihi
ha
hi
ha
hi
Regulaumlre Ausdruumlcke uumlber Symbolpaare
Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)
Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)
11
gabst
geben
gab
gebenen
st
en
gab
geb
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
12
Notation
copy Karin Haenelt Transduktoren 252009
13
Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)
T = ( Q Σ Δ q0 F δ σ wλ ρ)
allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand
F Q Menge der Endzustaumlnde
RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion
σ Q (Σ ε) Q rarrΔ Ausgabefunktion
w Q (Σ ε) Q rarr R+
oder Q (Σ ε) Q Δ rarr R+
Gewichtungsfunktion
Transduktor Definition
14copy Karin Haenelt Transduktoren 1652010
Transduktor Darstellung
die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)
p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand
graphische Darstellung
15
qwoi
p q
i
wo
p
oder
obere Sprache
untere Sprache
copy Karin Haenelt Transduktoren 1652010
Transduktor zu Grunde liegender Automat
Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor
dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)
X ist die Vereinigung aller solcher Paare (xy) in T
16
0 1 2 3 4s a n gs i n g
0 1 2 3 4(ss) (ai) (nn) (gg)
bull (q1 (ai) q2) δA und
bull q2 δ(q1a) und
bull i = σ(q1 a q2)
Zu Grunde liegender Automat ATransduktor T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Identitaumltstransduktor
Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten
A = ( QΣ q0 F δ) ist wie folgt definiert
T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)
17
m a c h m a c h
m a c h
A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Projektionen
Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)
18
w i e gw o g ε
w o g ε
w i e g
π1(T) A = ( Q Σ q0 F δ)
π2(T) A = ( Q Δ q0 F δA)
T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Durch Transduktoren berechenbare Relationen
R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T
Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen
Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion
19copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Regulaumlre Ausdruumlcke uumlber Symbolpaare
Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)
Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)
11
gabst
geben
gab
gebenen
st
en
gab
geb
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
12
Notation
copy Karin Haenelt Transduktoren 252009
13
Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)
T = ( Q Σ Δ q0 F δ σ wλ ρ)
allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand
F Q Menge der Endzustaumlnde
RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion
σ Q (Σ ε) Q rarrΔ Ausgabefunktion
w Q (Σ ε) Q rarr R+
oder Q (Σ ε) Q Δ rarr R+
Gewichtungsfunktion
Transduktor Definition
14copy Karin Haenelt Transduktoren 1652010
Transduktor Darstellung
die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)
p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand
graphische Darstellung
15
qwoi
p q
i
wo
p
oder
obere Sprache
untere Sprache
copy Karin Haenelt Transduktoren 1652010
Transduktor zu Grunde liegender Automat
Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor
dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)
X ist die Vereinigung aller solcher Paare (xy) in T
16
0 1 2 3 4s a n gs i n g
0 1 2 3 4(ss) (ai) (nn) (gg)
bull (q1 (ai) q2) δA und
bull q2 δ(q1a) und
bull i = σ(q1 a q2)
Zu Grunde liegender Automat ATransduktor T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Identitaumltstransduktor
Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten
A = ( QΣ q0 F δ) ist wie folgt definiert
T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)
17
m a c h m a c h
m a c h
A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Projektionen
Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)
18
w i e gw o g ε
w o g ε
w i e g
π1(T) A = ( Q Σ q0 F δ)
π2(T) A = ( Q Δ q0 F δA)
T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Durch Transduktoren berechenbare Relationen
R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T
Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen
Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion
19copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
12
Notation
copy Karin Haenelt Transduktoren 252009
13
Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)
T = ( Q Σ Δ q0 F δ σ wλ ρ)
allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand
F Q Menge der Endzustaumlnde
RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion
σ Q (Σ ε) Q rarrΔ Ausgabefunktion
w Q (Σ ε) Q rarr R+
oder Q (Σ ε) Q Δ rarr R+
Gewichtungsfunktion
Transduktor Definition
14copy Karin Haenelt Transduktoren 1652010
Transduktor Darstellung
die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)
p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand
graphische Darstellung
15
qwoi
p q
i
wo
p
oder
obere Sprache
untere Sprache
copy Karin Haenelt Transduktoren 1652010
Transduktor zu Grunde liegender Automat
Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor
dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)
X ist die Vereinigung aller solcher Paare (xy) in T
16
0 1 2 3 4s a n gs i n g
0 1 2 3 4(ss) (ai) (nn) (gg)
bull (q1 (ai) q2) δA und
bull q2 δ(q1a) und
bull i = σ(q1 a q2)
Zu Grunde liegender Automat ATransduktor T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Identitaumltstransduktor
Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten
A = ( QΣ q0 F δ) ist wie folgt definiert
T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)
17
m a c h m a c h
m a c h
A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Projektionen
Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)
18
w i e gw o g ε
w o g ε
w i e g
π1(T) A = ( Q Σ q0 F δ)
π2(T) A = ( Q Δ q0 F δA)
T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Durch Transduktoren berechenbare Relationen
R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T
Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen
Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion
19copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Notation
copy Karin Haenelt Transduktoren 252009
13
Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)
T = ( Q Σ Δ q0 F δ σ wλ ρ)
allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand
F Q Menge der Endzustaumlnde
RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion
σ Q (Σ ε) Q rarrΔ Ausgabefunktion
w Q (Σ ε) Q rarr R+
oder Q (Σ ε) Q Δ rarr R+
Gewichtungsfunktion
Transduktor Definition
14copy Karin Haenelt Transduktoren 1652010
Transduktor Darstellung
die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)
p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand
graphische Darstellung
15
qwoi
p q
i
wo
p
oder
obere Sprache
untere Sprache
copy Karin Haenelt Transduktoren 1652010
Transduktor zu Grunde liegender Automat
Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor
dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)
X ist die Vereinigung aller solcher Paare (xy) in T
16
0 1 2 3 4s a n gs i n g
0 1 2 3 4(ss) (ai) (nn) (gg)
bull (q1 (ai) q2) δA und
bull q2 δ(q1a) und
bull i = σ(q1 a q2)
Zu Grunde liegender Automat ATransduktor T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Identitaumltstransduktor
Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten
A = ( QΣ q0 F δ) ist wie folgt definiert
T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)
17
m a c h m a c h
m a c h
A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Projektionen
Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)
18
w i e gw o g ε
w o g ε
w i e g
π1(T) A = ( Q Σ q0 F δ)
π2(T) A = ( Q Δ q0 F δA)
T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Durch Transduktoren berechenbare Relationen
R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T
Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen
Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion
19copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand
F Q Menge der Endzustaumlnde
RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion
σ Q (Σ ε) Q rarrΔ Ausgabefunktion
w Q (Σ ε) Q rarr R+
oder Q (Σ ε) Q Δ rarr R+
Gewichtungsfunktion
Transduktor Definition
14copy Karin Haenelt Transduktoren 1652010
Transduktor Darstellung
die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)
p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand
graphische Darstellung
15
qwoi
p q
i
wo
p
oder
obere Sprache
untere Sprache
copy Karin Haenelt Transduktoren 1652010
Transduktor zu Grunde liegender Automat
Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor
dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)
X ist die Vereinigung aller solcher Paare (xy) in T
16
0 1 2 3 4s a n gs i n g
0 1 2 3 4(ss) (ai) (nn) (gg)
bull (q1 (ai) q2) δA und
bull q2 δ(q1a) und
bull i = σ(q1 a q2)
Zu Grunde liegender Automat ATransduktor T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Identitaumltstransduktor
Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten
A = ( QΣ q0 F δ) ist wie folgt definiert
T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)
17
m a c h m a c h
m a c h
A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Projektionen
Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)
18
w i e gw o g ε
w o g ε
w i e g
π1(T) A = ( Q Σ q0 F δ)
π2(T) A = ( Q Δ q0 F δA)
T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Durch Transduktoren berechenbare Relationen
R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T
Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen
Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion
19copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Transduktor Darstellung
die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)
p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand
graphische Darstellung
15
qwoi
p q
i
wo
p
oder
obere Sprache
untere Sprache
copy Karin Haenelt Transduktoren 1652010
Transduktor zu Grunde liegender Automat
Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor
dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)
X ist die Vereinigung aller solcher Paare (xy) in T
16
0 1 2 3 4s a n gs i n g
0 1 2 3 4(ss) (ai) (nn) (gg)
bull (q1 (ai) q2) δA und
bull q2 δ(q1a) und
bull i = σ(q1 a q2)
Zu Grunde liegender Automat ATransduktor T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Identitaumltstransduktor
Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten
A = ( QΣ q0 F δ) ist wie folgt definiert
T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)
17
m a c h m a c h
m a c h
A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Projektionen
Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)
18
w i e gw o g ε
w o g ε
w i e g
π1(T) A = ( Q Σ q0 F δ)
π2(T) A = ( Q Δ q0 F δA)
T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Durch Transduktoren berechenbare Relationen
R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T
Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen
Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion
19copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Transduktor zu Grunde liegender Automat
Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor
dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)
X ist die Vereinigung aller solcher Paare (xy) in T
16
0 1 2 3 4s a n gs i n g
0 1 2 3 4(ss) (ai) (nn) (gg)
bull (q1 (ai) q2) δA und
bull q2 δ(q1a) und
bull i = σ(q1 a q2)
Zu Grunde liegender Automat ATransduktor T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Identitaumltstransduktor
Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten
A = ( QΣ q0 F δ) ist wie folgt definiert
T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)
17
m a c h m a c h
m a c h
A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Projektionen
Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)
18
w i e gw o g ε
w o g ε
w i e g
π1(T) A = ( Q Σ q0 F δ)
π2(T) A = ( Q Δ q0 F δA)
T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Durch Transduktoren berechenbare Relationen
R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T
Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen
Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion
19copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Transduktor Identitaumltstransduktor
Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten
A = ( QΣ q0 F δ) ist wie folgt definiert
T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)
17
m a c h m a c h
m a c h
A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Transduktor Projektionen
Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)
18
w i e gw o g ε
w o g ε
w i e g
π1(T) A = ( Q Σ q0 F δ)
π2(T) A = ( Q Δ q0 F δA)
T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Durch Transduktoren berechenbare Relationen
R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T
Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen
Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion
19copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Transduktor Projektionen
Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)
18
w i e gw o g ε
w o g ε
w i e g
π1(T) A = ( Q Σ q0 F δ)
π2(T) A = ( Q Δ q0 F δA)
T
(Def vgl Hanneforth (2002 3)
copy Karin Haenelt Transduktoren 1652010
Durch Transduktoren berechenbare Relationen
R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T
Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen
Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion
19copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Durch Transduktoren berechenbare Relationen
R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T
Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen
Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion
19copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v
δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ
σ ist die entsprechend erweiterte Ausgabefunktion
20
vgl (Hanneforth 2002 4)
copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Transduktionsabbildung
Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert
T (u) = v Δ | (uv) L(T)
21
w i e g
w o g ε
o go g
T (wog) = wieg wog
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktionen δ und σ
Grundfunktionen fuumlr Zeichen
erweiterte Funktionen fuumlr Zeichenreihen
22
paq )(baq )(
baQqp
awQq qq )(
))(()( awqwaq )( q
))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)
copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Erweiterte Funktion σ Beispiel
erweiterte Funktionen σ fuumlr Zeichenreihen
23
σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s
0 1 2 3e i na u s
))(()()( awqwqwaq
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
24
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat
Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)
Zeichen ε Zeichen oder ε literal oder normalisiert
Endausgabe ohne Endausgabe mit Endausgabe
Typ der Relation Relation ambig relational
Funktion funktional Verhaumlltnis der EinAusgabekanten
(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron
Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell
Transduktoren mit bestimmten Eigenschaften
25copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Transduktoren Ausgabestelle
Zwei klassische Modelle Moore-Maschine (1956)
Ausgabe am Zustand Mealy-Maschine (1955)
Ausgabe bei Transition
26copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Moore-Maschine
27
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
q Ausgabefunktion Q
)( 0qQA
q0 q1 q2
0 1 2
HopcroftUllmann 198843
Q 0 1
q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2
1
11
0
00
copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Mealy-Maschine
28
Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i
iq Ausgabefunktion Q
)( 0qQA
Q 0 1
q0 p0n p1n p0 p0y p1y p1 p0n p1y
HopcroftUllmann 198843
q0
p1
p0
1n 0n
0y
1y
0n
1n
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe
Aumlquivalente Maschinen konstruierbar
29copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Transduktoren mit literalen Kantenetiketten
literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn
giltσ Q x (Σ ε) rarr Δ ε
Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden
30
0 1[ʃ]S
q[t]t
2 3[a]a
5
[t]dt
4
[t]tt
nicht normalisiert
0 1[ʃ]S
q[t]t
2 3[a]a
6
[t]d
4
t 7
5t
t
[t]
normalisiert
copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Transduktoren als Funktion bzw Relation funktionaler Transduktor
Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann
Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x
T heiszligt in diesem Fall auch rationale Funktion
ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt
| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation
31copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Transduktoren als Relation
einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt
T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n
unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht
einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c
uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es
eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x
Beispiel ein Transduktor mit a rarr (b | c)
32
vgl (Hanneforth 2002 5)
copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|
33
w i e g
w o g εw o gw o g
synchroner Transduktor asynchroner Transduktor
| T (x) | = | x |
| T (wog) | = | wog |
| wog | = | wog | 3 = 3
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
34
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1
Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand
35copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
36
xa
yb
0
2
1 xa
xb
0
2
1xa
ya
0
2
1 xa
y
0
2
1
bidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
unidirektionalsequentiell
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren
37
p qi
ow
p qio1w
rio2w
p qi
aw o1w
o2w
p qi
ow x
sequentiell d QQ Q | + | +
d wie sequentiell wie sequentiell F
d wie sequentiell wie sequentiell F ()p p
nicht sequentiell Q(ε)2Q
subsequentielleine Endausgabe
endlich-subsequentiellendlich vieleEndausgaben
Q(ε) Q 2 | 2+ | 2+
copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle
Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-
ambigen Automaten
38copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Beispiel
39
0 1b
b2 3 4 5
e hr c
a hr c
6 7 8 9i gr n
a hr c
nicht-sequentiellerTransduktor
aumlltere Bezeichnung p-subsequentieller Transduktor
0 1b
b2 3 4 5
r
a hr c
ech
ing
endlich-subsequentieller Transduktor
copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Sequentielle Transduktoren Zeit-Komplexitaumlt
Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors
Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert
ist erzeugt die korrespondierende Ausgabe
40copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung
Operationen fuumlr Transduktoren Projektion Komposition hellip
Optimierung Determinisierung (hier Sequentialisierung) hellip
42copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)
Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr
1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs
44copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Entscheidbarkeit
es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann
Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12
(12)R endlich ist R erkennbar ist
45
(Berstel 197990)
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
46
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt
Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen
in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht
in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText
47copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Beispiel
Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen
48
httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus
0 1 2
3 4 5
7 8 96
l ea v e +VBZs
vf eεaε
+VBε
+VBDt
Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum
copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Bidirektionalitaumlt Linguistische Adaumlquatheit
Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht
es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt
Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo
Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo
49copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
50
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar
51
istPaar geordneteskein falls
falls)(1 Xtundefinier
(ab) XbaX Def
ist Paar geordneteskein falls
falls)(2 Xtundefinier
(ab) XabX Def
copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes
Produkt Kreuzprodukt) von A1 An ist die Menge
A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw
A1 x x An = (a1an) | a1 A1 und an An
Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener
Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den
Unterschied und spricht nur von Relationen
52copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Relation Grundbegriffe
53
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
m a c hm a c h
s a n gs i n g
s i n gs i n g
w i e gw o g ε
w o gw o g
geordnetes Paar (saumlngsing)
Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)
Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)
machsaumlngsangsing
sungwog
mach
sing
wiegwog
A B
copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Themen
Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren
Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren
sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten
copy Karin Haenelt Transduktoren 1652010
54
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz vonMealy-Maschine und Moore-Maschine
55
MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843
Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
56
1n 0n
0y
1y
0n
1n
q0
p1
p0
y
q0n
p0y
p0n
q0y p1y
p1nn n n
y y
0
0
1
1
00
0
0
1
11
1
nichterreichbardh tilgbar
HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Aumlquivalenz von Mealy- und Moore-Maschine
57
Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq
Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y
Q Moore
0 1
[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]
Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y
copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Vielen Dank
fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich
Simone Eberhard Katja Niemann Christian Roth Ineta Sejane
58copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Literatur
Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)
(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)
Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf
Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56
Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf
Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf
Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf
59copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Literatur
Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml
Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)
Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press
Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml
Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20
Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps
Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin
XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml
60copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Versionen
40 1652010 34 252009 33 15072008 32 18052008 31
17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005
25052005 12 24052004 17052004 28042004
1802200415022004 11 30052003 10 15012003
61copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010
Copyright
copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below
Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)
Deletion or omission of the footer (with name data and copyright sign) is not permitted
Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf
For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author
Court of Jurisdiction is Darmstadt Germany
62copy Karin Haenelt Transduktoren 1652010