15
2. Bereiche der maschinellen 2. Bereiche der maschinellen Bearbeitung von natürlichen Bearbeitung von natürlichen Sprachen Sprachen 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf an 200 Wissen-schaftler. Im Aufruf schildert er die Idee der Übersetzung aus einer Sprache in eine andere mit der Anwendung des Computers.

2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf

Embed Size (px)

Citation preview

Page 1: 2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf

2. Bereiche der maschinellen Bearbeitung 2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachenvon natürlichen Sprachen

1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf an 200 Wissen-schaftler. Im Aufruf schildert er die Idee der Übersetzung aus einer Sprache in eine andere mit der Anwendung des Computers.

Page 2: 2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf

Bereiche der maschinellen Bearbeitung von natürlichen SprachenBereiche der maschinellen Bearbeitung von natürlichen Sprachen

Es begann eine intensive Er-forschung der Möglichkeit einer maschinellen Überset-zung. Nach der ersten Eupho-rie kam eine längere Periode der pessimistischen Resigna-tion im Bereich der automati-schen Übersetzung. In letzter Zeit erlebt jedoch auch dieser Teil der Computerlinguistik eine Renaissance.

Page 3: 2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf

Bereiche der maschinellen Bearbeitung von natürlichen SprachenBereiche der maschinellen Bearbeitung von natürlichen Sprachen

Welches sind die anderen Bereiche der rech-nerischen Verarbeitung von natürlichsprach-lichen Daten? Es sind vor allem vielleicht die speziellen Datenbanken, die man in ihrer her-kömmlichen Form gemeinhin Wörterbücher nennt.

Page 4: 2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf

Bereiche der maschinellen Bearbeitung von natürlichen SprachenBereiche der maschinellen Bearbeitung von natürlichen Sprachen

Auch die Zusammenstellung von gedruckten Wörterbüchern – wie überhaupt die Erstellung von Drucksachen – ist heute ohne Computer kaum vorstell-bar. Man kann die in beliebiger Reihenfolge eingegebenen Wör-ter jederzeit alphabetisch ord-nen oder sogar die Umkehrung des Wörterbuchs ausführen, d.h. z.B. aus einem deutsch-un-garischen Wörterbuch ein un-garisch-deutsches machen.

Page 5: 2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf

Bereiche der maschinellen Bearbeitung von natürlichen SprachenBereiche der maschinellen Bearbeitung von natürlichen Sprachen

Die Lexikographie wurde so-gar – eigentlich dank dem Computer – mit einem neuen Typ der Wörterbücher berei-chert: Mit dem rückläufigen Wörterbuch.

Page 6: 2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf

Bereiche der maschinellen Bearbeitung von natürlichen SprachenBereiche der maschinellen Bearbeitung von natürlichen Sprachen

Wozu dienen aber diese Wör-terbücher? Das kommt auch darauf an, was noch mit den Wörtern zusammen eingege-ben wird. Das rückläufige Wörterbuch der ungarischen Sprache enthält z. B. prak-tisch alle morphologischen Informationen über die ein-zelnen Wörter.

Page 7: 2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf

Bereiche der maschinellen Bearbeitung von natürlichen SprachenBereiche der maschinellen Bearbeitung von natürlichen Sprachen

Lexikographen bedienten sich auch früher u.a. der Methode, dass sie große Mengen von Texten untersuchten, um Wörter – ein sog. Korpus – für ihre Wörterbücher zusammen-zubringen. Dies war ziemlich zeitaufwendig, bis man den Computer auch dabei zu Hilfe rief.

Page 8: 2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf

Bereiche der maschinellen Bearbeitung von natürlichen SprachenBereiche der maschinellen Bearbeitung von natürlichen Sprachen

Man kann sich dabei auch das Ziel setzen, mit Hilfe der Ma-schine zusammenzuzählen, wie oft die einzelnen Wörter im Korpus auftauchen. Das Resultat ist eine Häufigkeits-liste, oder – bei ausreichender Quantität – ein Häufigkeits-wörterbuch.

Page 9: 2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf

Bereiche der maschinellen Bearbeitung von natürlichen SprachenBereiche der maschinellen Bearbeitung von natürlichen Sprachen

Ein Computer, der die Wör-ter eines Textes auflisten kann, vermag natürlich die jeweilige Umgebung dieser Wörter auch zu fixieren. Das Ergebnis nennt man Konkor-danzliste oder Konkordanz-wörterbuch.

Page 10: 2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf

Bereiche der maschinellen Bearbeitung von natürlichen SprachenBereiche der maschinellen Bearbeitung von natürlichen Sprachen

Es gibt schon funktionierende natürlich-sprachliche Schnitt-stellen (natural language in-terfaces), d. h. Programme, mit deren Hilfe die Computer in einer natürlichen Sprache kommandiert werden können. Solche Schnittstellen werden meistens an Datenbasisver-waltungsprogramme ange-schlossen.

Page 11: 2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf

Bereiche der maschinellen Bearbeitung von natürlichen SprachenBereiche der maschinellen Bearbeitung von natürlichen Sprachen

Die Synthese einer verständlichen (aber nicht unbedingt naturgetreuen) Rede ist wesentlich leichter zu schaffen als das Hörverstehen seitens des Rechners. Schon ein einige hundert Kilobyte großes Pro-gramm kann mit Hilfe des zur Grund-ausstattung gehörenden Tongenerators (also ohne zusätzliche Hardware) eine größtenteils verständliche Rede produ-zieren.

Page 12: 2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf

Bereiche der maschinellen Bearbeitung von natürlichen SprachenBereiche der maschinellen Bearbeitung von natürlichen Sprachen

Linguistik wird sogar in die Textverarbeitung einbezogen: Die Überprüfung der Recht-schreibung, bzw. die automa-tische Silbentrennung sind bei Sprachen mit reicher Mor-phologie (z. B. Ungarisch) ohne morphologische Analyse unvorstellbar.

Page 13: 2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf

Bereiche der maschinellen Bearbeitung von natürlichen SprachenBereiche der maschinellen Bearbeitung von natürlichen Sprachen

Textgenerierungsprogramme: TEXT KAFKA XCALIBUR ANA TELLTALE

Page 14: 2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf

Bereiche der maschinellen Bearbeitung von natürlichen SprachenBereiche der maschinellen Bearbeitung von natürlichen Sprachen

Linguisten arbeiten auch mit Programmen, die Phonemstatistiken, Phonemhäufigkeit, Phonemkonkordanz liefern.

Mit Hilfe des Computers kann man sämtliche Pho-nemkombinationen auflisten, die in den verschiedenen Po-sitionstypen vorkommen (An-laut, Inlaut, Auslaut, Silben-grenze usw.).

Page 15: 2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf

Bereiche der maschinellen Bearbeitung von natürlichen SprachenBereiche der maschinellen Bearbeitung von natürlichen Sprachen

Mit Hilfe des Computers kann man auch nach Regeln suchen. Oft ließe sich z. B. die linguis-tische Beschreibung vereinfachen, wenn man die Möglichkeit gewisser syntagmatischer Ver-bindungen von formalen und/oder semanti-schen Merkmalen der beteiligten Elemente herleiten könnte .