36
Übersetzung »Übersetzen ist ein schwieriges Problem. Computer besitzen nun mal keinerlei Intelligenz. Ein Mensch kann eine Sprache schon mit tausend Wörtern sprechen. Wir haben Computermodelle mit über einer Million Wörtern - und trotzdem können sie nicht mit einem Menschen mithalten.« (Systran-Chef Dimitris Sabatakakis ) Alexander Brunsbach Anwendung Rechnernetze

Übersetzung - iks.hs-merseburg.deuheuert/pdf/Anwendung Rechnernetze/Vortraege... · Programm fordert Benutzer zur Teilübersetzung auf Die meisten Systeme in der Praxis sind eine

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Übersetzung

»Übersetzen ist ein schwieriges Problem. Computer besitzen nun mal keinerlei Intelligenz. Ein Mensch kann eine Sprache schon mit tausend Wörtern sprechen. Wir haben Computermodelle mit über einer Million Wörtern - und trotzdem können sie nicht mit einem Menschen mithalten.«

(Systran-Chef Dimitris Sabatakakis )

Alexander Brunsbach Anwendung Rechnernetze

0. Inhalt

1. Wozu maschinelle Übersetzung?

2. Idee

3. Geschichte

4. Übersetzungsmethoden4. Übersetzungsmethoden

5. Übersetzungsprogramme

1. Verbmobil

6. Statistics-Based Machine Translation

7. Fazit

06.12.2007 Alexander Brunsbach 2

1. Wozu maschinelle Übersetzung?

� viele Texte sind digital verfügbar � einfache Übersetzung möglich

� Globalisierung

� Wirtschaftlich wichtige, schwer erlernbare Sprachen� Wirtschaftlich wichtige, schwer erlernbare Sprachen� chinesisch, japanisch, koreanisch, usw.

� Militärisch wichtige, schwer erlernbare Sprachen� arabisch, paschtu, usw.

06.12.2007 Alexander Brunsbach 3

Inhalt

1. Wozu maschinelle Übersetzung?

2. Idee

3. Geschichte

4. Übersetzungsmethoden4. Übersetzungsmethoden

5. Übersetzungsprogramme

1. Verbmobil

6. Statistics-Based Machine Translation

7. Fazit

06.12.2007 Alexander Brunsbach 4

2. Idee

� Verstehen einer Sprache, ohne sie selbst zu beherrschen

� Erfordert� Künstliche Intelligenz� Künstliche Intelligenz

� Computerlinguistik

� Mathematik

� Informatik

06.12.2007 Alexander Brunsbach 5

Inhalt

1. Wozu maschinelle Übersetzung?

2. Idee

3. Geschichte

4. Übersetzungsmethoden4. Übersetzungsmethoden

5. Übersetzungsprogramme

1. Verbmobil

6. Statistics-Based Machine Translation

7. Fazit

06.12.2007 Alexander Brunsbach 6

3. Geschichte

� Erstes große Projekt vom US-Militär� Russisch-Englisch-Übersetzungsprogramm

� 1966: Pentagon bescheinigt grundsätzliche Unrealisierbarkeit der maschinellen ÜbersetzungUnrealisierbarkeit der maschinellen Übersetzung

� 1980: Siemens AG greift MÜ – Forschung wieder auf

� 1980er: Japan entwickelt erstes kommerzielle MÜ –Programm (in Prolog)

06.12.2007 Alexander Brunsbach 7

3. Geschichte

� 1990er: „Verbmobil“ wird von deutscher Industrie und Akademik entwickelt (Spracherkennung, Direktübersetzung, Satzgenerierung)

� 2000/01: „Dotcom-Crash“ viele kleine MÜ-Firmen � 2000/01: „Dotcom-Crash“ viele kleine MÜ-Firmen melden Konkurs an

� 2007: nur 1% des Gesamtumsatzes auf dem Übersetzungsmarkt durch MÜ

„Die maschinelle Übersetzung befindet sich in Kinderschuhen“

(google)

06.12.2007 Alexander Brunsbach 8

Inhalt

1. Wozu maschinelle Übersetzung?

2. Idee

3. Geschichte

4. Übersetzungsmethoden4. Übersetzungsmethoden

5. Übersetzungsprogramme

1. Verbmobil

6. Statistics-Based Machine Translation

7. Fazit

06.12.2007 Alexander Brunsbach 9

4. Übersetzungsmethoden

� Datei / Datenbank mit „Vokabel-“ Einträgen

� Direkte MÜ� Wort-für-Wort-Übersetzung

� Anschließende Satzgenierung� Anschließende Satzgenierung

� Robust und schnell

06.12.2007 Alexander Brunsbach 10

Quelltext Morphologische Analyse

Wortstellungs-korrektur

ZieltextBilinguales Wörterbuch

4. Übersetzungsmethoden

� Transfer� Satzanalyse (Baumstruktur)

� Transfer (Übersetzung)

� Generierung (Satzbildung nach grammatikalischen � Generierung (Satzbildung nach grammatikalischen Regeln der Zielsprache)

06.12.2007 Alexander Brunsbach 11

Quelltext Analyse Transfer Generierung Zieltext

4. Übersetzungsmethoden

� Interlingua� Grammatische Information der Quellsprache, wird in

neutraler Zwischensprache ausgedrückt

� Erzeugung grammatischer Information der � Erzeugung grammatischer Information der Zielsprache

� „einfache“ Übersetzung komplexer Ausdrücke

06.12.2007 Alexander Brunsbach 12

Quelltext Analyse Generierung Zieltext

4. Übersetzungsmethoden

� Example-Based Machine Translation (EBMT)� Speicherung von häufig vorkommenden Sätzen

� Ableitung ähnlicher Sätze

� Statistics-Based Machine Translation (SBMT)� Statistics-Based Machine Translation (SBMT)� Einlesen von zweisprachigem Textfundus

� Vergleich mit Quelltext

06.12.2007 Alexander Brunsbach 13

4. Übersetzungsmethoden

� Human-Aided Machine Translation (HAMT) � Programm fordert Benutzer zur Teilübersetzung auf

Die meisten Systeme in der Praxis sind eine Mischung aus

mehreren Methoden (oft Dominanz des Transfersystems mit

Interlingua und EBMT-Elementen)

06.12.2007 Alexander Brunsbach 14

4. Übersetzungsmethoden

06.12.2007 Alexander Brunsbach 15

Inhalt

1. Wozu maschinelle Übersetzung?

2. Idee

3. Geschichte

4. Übersetzungsmethoden4. Übersetzungsmethoden

5. Übersetzungsprogramme

1. Verbmobil

6. Statistics-Based Machine Translation

7. Fazit

06.12.2007 Alexander Brunsbach 16

5. Übersetzungsprogramme

� Systran übersetzt täglich 30 Millionen Web-Seiten

06.12.2007 Alexander Brunsbach 17

5. Übersetzungsprogramme

Test diverser, freier Übersetzungstools, anhand des Beispielsatzes:anhand des Beispielsatzes:

„John lässt sich einen Bart wachsen“

Deutsch → Englisch → Deutsch

06.12.2007 Alexander Brunsbach 18

5. Übersetzungsprogramme

06.12.2007 Alexander Brunsbach 19

5. Übersetzungsprogramme

06.12.2007 Alexander Brunsbach 20

5. Übersetzungsprogramme

06.12.2007 Alexander Brunsbach 21

5. Übersetzungsprogramme

06.12.2007 Alexander Brunsbach 22

5. Übersetzungsprogramme

� Google überzeugt beim Wettbewerb automatischer Dolmetscher� Google verzichtet auf linguistische Regeln und setzt

auf Statistikauf Statistik

� 1000 Rechner mit einem Sprachschatz von 200 Milliarden Wörtern

� »das größte Sprachmodell in der Geschichte der Menschheit« (Franz Och)

06.12.2007 Alexander Brunsbach 23

5. Übersetzungsprogramme

� Beispielübersetzung einer arabischen Zeitungsschlagzeile� Google: »ElBaradei: Inspektoren brauchen ›einige

Monate‹, um ihre Aufgabe zu erfüllen«,Monate‹, um ihre Aufgabe zu erfüllen«,

� Systran: »Der Bradi: Die Inspektoren brauchen zu ›einige Monate‹ für Ende wichtige ihr.«

»Die Infrastruktur ist fantastisch. Hier werden acht

Milliarden Web-Seiten erfasst und ständig

aktualisiert. Die liegen einfach da, und mit denen

kann man dann rechnen.« Franz Och (google)

06.12.2007 Alexander Brunsbach 24

5.1 Verbmobil

� Sprachübersetzung für deutsch, englisch und japanisch

� Sprecherunabhängig

� „Echtzeit“ – Berechnung� „Echtzeit“ – Berechnung

� Beschränkung auf� Terminabsprache

� Reiseplanung

� Hotelreservierung

� Forschungsgelder von 170 000 000 DM

06.12.2007 Alexander Brunsbach 25

5.1 Verbmobil

06.12.2007 Alexander Brunsbach 26

5.1 Verbmobil

� Gleichzeitige Anwendung von fünf Übersetzungsverfahren

� Über stochastisches Verfahren, wird die wahrscheinlichste Übersetzung gewähltwahrscheinlichste Übersetzung gewählt

� Wortschatz von 10 000 Wörtern

� Umgang mit „Spontansprache“� „Ja, ich weil also würde mal sagen äh vorschlagen,

wir könnten uns am äh 7. treffen so im Mai“

� „How about the seventh of May?“

06.12.2007 Alexander Brunsbach 27

5.1 Verbmobil

06.12.2007 Alexander Brunsbach 28

Inhalt

1. Wozu maschinelle Übersetzung?

2. Idee

3. Geschichte

4. Übersetzungsmethoden4. Übersetzungsmethoden

5. Übersetzungsprogramme

1. Verbmobil

6. Statistics-Based Machine Translation

7. Fazit

06.12.2007 Alexander Brunsbach 29

6. Statistics-Based Machine Translation

� Statistischer Ansatz� Maschinelle Sprachverarbeitung = statistische

Entscheidungstheorie + linguistische Modellierung

� 1989-1994: IBM forscht an statistischen � 1989-1994: IBM forscht an statistischen Übersetzungsmethoden, als Textfundus dienten die kanadischen Parlamentsaufzeichnungen

(bilingual: englisch – französisch)

06.12.2007 Alexander Brunsbach 30

6. Statistics-Based Machine Translation

� Language Modell: syntaktische / semantische Struktur der möglichen Sätze der Zielsprache

� Übersetzungsmodell: Zusammenhang zwischen Quell –und Zielsatz

06.12.2007 Alexander Brunsbach 31

Inhalt

1. Wozu maschinelle Übersetzung?

2. Idee

3. Geschichte

4. Übersetzungsmethoden4. Übersetzungsmethoden

5. Übersetzungsprogramme

1. Verbmobil

6. Statistics-Based Machine Translation

7. Fazit

06.12.2007 Alexander Brunsbach 32

7. Fazit

06.12.2007 Alexander Brunsbach 33

7. Fazit

� Heutige maschinelle Übersetzungssysteme sind sehr unvollkommen

� Abstraktionsfähigkeit ist beschränkt

� „Gesprochene und geschriebene Sprache hat es � „Gesprochene und geschriebene Sprache hat es schon gegeben, lange bevor es Grammatiker, Linguisten und Informatiker gab.“

06.12.2007 Alexander Brunsbach 34

Quellen

� Grundlagen der Computerlinguistik (Roland Hausser)

� Computerlinguistik und Sprachtechnologie (K.-U. Carstensen)

� http://zeus.zeit.de/text/zeit-wissen/2006/03/Maschinelle_Uebersetzung.xml

� http://www.ifi.unizh.ch/groups/ailab/teaching/semi2000/sprachverarbeitung.pdf

� Informatik – Spektrum (Mai 2003)Informatik – Spektrum (Mai 2003)

� http://server02.is.uni-sb.de/courses/wiki/index.php/Maschinelle_%C3%9Cbersetzung

� http://de.wikipedia.org/wiki/Maschinelle_%C3%9Cbersetzung

� http://server02.is.uni-sb.de/courses/wiki/index.php/Verbmobil

06.12.2007 Alexander Brunsbach 35

Fragen

Haben Sie noch Fragen?

06.12.2007 Alexander Brunsbach 36