10
, Tite/thema .---- Becherhalterung 50// . \ter ZIns herh a ße c Basiszins Soll Translation-Memory-Systeme und die Möglichkeiten, die sie zur Produktivitätssteigerung bieten, sind aus dem Übersetzeralltag nicht mehr wegzudenken. Auf der Suche nach weiterem Optimierungspotenzial im Übersetzungsprozess ist nun der Quelltext in den Blickpunkt der Hersteller gerückt. 10 MDU 4 12009

Neue Werkzeuge Zur Autorenunterstuetzung

  • Upload
    leon

  • View
    313

  • Download
    1

Embed Size (px)

DESCRIPTION

Neue-Werkzeuge-zur-Autorenunterstuetzung

Citation preview

Page 1: Neue Werkzeuge Zur Autorenunterstuetzung

,Tite/thema.----

Becherhalterung

50// .\ter ZIns

herh aße

c Basiszins Soll

Translation-Memory-Systeme und die Möglichkeiten, die sie zur Produktivitätssteigerung

bieten, sind aus dem Übersetzeralltag nicht mehr wegzudenken. Auf der Suche nach weiterem

Optimierungspotenzial im Übersetzungsprozess ist nun der Quelltext in den Blickpunkt der

Hersteller gerückt.

10 MDU 4 12009

Page 2: Neue Werkzeuge Zur Autorenunterstuetzung

Tite/thema "-

.:l

Abb.1: Dialog in acro­check, dem (Iient vonacrolinx . Der Prüferkann für eine Quell­sprache (hier: Deutsch)entsprechende Prüfop­tionen (Terminologie,Grammatik, Stil, Recht­schreibung) und einbestimmtes Regelsetauswählenr

I!!'.:lMo!<PlM.._l.......~.. iI'I_I\,d>'__-............__

textes einen Zugriff auf ein bereits vorhandenes Translati­on Memory (Abb. 2). Die Tatsache allein, dass ein Satz be­reits in einem anderen Text verwendet wurde, sagt jedochnoch nichts über dessen Qualität aus (s. Lehmann et al.2009). Folglich steht und fällt der sinnvolle Einsatz einesAuthoring Memory mit der Qualität des Translation Me­mory, damit sich sprachliche Fehler nicht ungehindert inneuen Texten fortpflanzen.

Paradoxerweise kann beim Einsatz eines CLC gerade dieOptimierung eines Quelltextes zu zusätzlichen Überset­zungskosten führen. Ein Beispiel: Angenommen, ein be­reits vorhandener Text, für den auch schon Übersetzungenvorliegen, wird geprüft und sprachlich verbessert. Falls dieKorrekturen nicht gleichzeitig in das TM eingepflegt wer­den, ist der Ausgangtext zwar von sprachlich höherer Qua­lität, die Matchrate im TM kann jedoch drastisch sinken.Das heißt, wenn Texte nicht komplett neu erstellt (undsomit auch komplett neu übersetzt) werden, ist die Syn­chronisation zwischen CLC und TM-System von großerBedeutung. Grundsätzlich besteht der große Vorteil einesAuthoring Memory darin, dass es keine sprachspezifischenRegeln erfordert und somit für alle Sprachen verwendet

Abb. 2: Echtzeitprüfung in crossAuthor, dem Authoring Memory vonAcross. Bereits bei der Eingabe eines deutschen Quellsatzes im Editorprüft crossAuthor, ob identische oder ähnliche quellsprachliche Sätzeim TM abgespeichert wurden. Hier wurde ein 55-%- Match gefunden.Die britische Flagge zeigt, dass für diesen deutschen Satz bereits eineÜbersetzung in crossTank, dem TM von Across, vorhanden ist

Effektives Übersetzen fängt bereits beim Quelltext an:Je verständlicher und konsistenter ein Text verfasstist, desto einfacher und günstiger ist die anschlie-

ßende Übersetzung. Übersetzungsgerechtes Schreiben be­deutet vor allem, auf Konsistenz bei Wort-, Satz- und Text­ebene zu achten (vgl. Drewer 2009). Vor allem in größerenRedaktionsteams, die möglicherweise an verschiedenenStandorten arbeiten, ist das nicht immer einfach. Auf Tex­tebene lässt sich diese Konsistenz durch den Einsatz vonContent-Management-Systemen und die Definition ent­sprechender Textmodule erreichen. Zur Standardisierungauf Wort- und Satzebene dienen dagegen Werkzeuge wieControlled Language Checker (CLC) oder Authoring Me­mory. Durch den Einsatz dieser Tools lässt sich das Po­tenzial von Translation-Memory-Systemen (TMS) besserausschöpfen, da sich die Trefferquote im Translation Me­mory durch eine konsistente Terminologie und eine Stan­dardisierung auf Satzebene erheblich steigern lässt. Inso­fern ist es nur konsequent, dass die Hersteller der "großen"TM-Systeme (SDL Trados, Across, STAR) den Funktions­umfang ihrer Systeme in Richtung Quelltexterstellung er­weitert haben und mittlerweile auch Anwendungen zurAutorenunterstützung anbieten, mit denen sich die Trans­lation Memories auch als Authoring Memories nutzenlassen.

Im Bereich der Technischen Redaktion haben in denletzten Jahren sogenannte Controlled Language Checkers(CLe) an Bedeutung gewonnen. Zu den bekannten CLCsauf dem deutschen Markt gehören acrolinx IQ von acro­linx und CLAT (Controlled Language Authoring Techno­logy) vom lAI (Institut der Gesellschaft zur Förderung derAngewandten Informationsforschung e.v.).

CLCs führen eine umfassende linguistische Qualitäts­prüfung des Quelltextes durch, welche Terminologie, Stil,Grammatik und Rechtschreibung umfasst. Mit Hilfe vonCLCs lassen sich neben der Terminologie auch die Anfor­derungen an Stil und Grammatik, die in einer bestimmtenkontrollierten Sprache (z. B. Simplified English) oder fir­menspezifischen Stilrichtlinien aufgestellt wurden, über­prüfen. Ein Controlled Language Checker muss für jedeSprache gesondert entwickelt werden, was - aufgrund derTiefe der linguistischen Analyse - entsprechend aufwän­dig ist. Folglich stehen derartige Systeme bislang auch nurfür wenige Quellsprachen zur Verfügung.

Während CLCs die Qualität des Quelltextes steigern sol­len, um anschließend die (maschinelle) Übersetzung desTextes zu erleichtern, zielen Authoring Memories vorallem darauf, durch die Wiederverwendung bereits über­setzter Segmente die Quelltexte zu standardisieren und da­durch die Übersetzungskosten zu senken. Ein AuthoringMemory ermöglicht dem Autor beim Erstellen des Quell-

MOÜ 4 I 2009 11

Page 3: Neue Werkzeuge Zur Autorenunterstuetzung

" Titelthema

mit denen sich firmenspezifische Stilrichtlinien abbildenlassen. Seit 2008 umfasst acrolinx IQ außerdem eine web­basierte begriffsorientierte Terminologieverwaltung, densogenannten Termmanager, der auch zur Termextrakti­on herangezogen werden kann. Der Termmanager ver­wendet aUF als natives Format zur Terminologieverwal­tung; über verschiedene Filter ist jedoch auch der Importund Export von Terminologieeinträgen in andere Formate

werden kann, für die bereits quellsprachliche Segmente imTM abgespeichert wurden. Allerdings stehen dem Redak­teur in einem typischen Authoring-Memory-System neuequellsprachliche Sätze erst nach der Übersetzung zur Ver­fügung, was unter Umständen Wochen oder Monate dau­ern kann. An diesem Punkt setzt die Autorenunterstüt­zung [iJ-match von der Firma itl AG an, die den Zugriffauf Satzbanken auch ohne Anbindung an ein TM-Systemermöglicht.

Wie funktioniert ein Controlled language Checker?

Für den Einsatz eines CLC müssen linguistische Ressour­cen in der Quellsprache zur Verfügung stehen, die entwe­der direkt vom Hersteller geliefert oder vom linguistischenAdministrator des Systems konfiguriert werden. Stil- undGrammatikregeln werden prinzipiell vom Hersteller ent­wickelt, da die Entwicklung dieser Regelsets fundiertescomputerlinguistisches Wissen erfordert. Terminologie­ressourcen können dagegen vom Anwender selbst ge­pflegt werden. Die Textprüfung findet grundsätzlich nachder TextersteIlung statt. Dazu wählt der Autor die entspre­chenden Prüfoptionen aus (Abb. 1) und erhält ein Prüfer­gebnis, in dem gefundene Fehler farbig markiert und mitErläuterungen versehen werden (Abb. 3). Controlled Lan­guage Checking wird bislang vorrangig in der TechnischenRedaktion eingesetzt. Prinzipiell könnten aber auch Über­setzer und Lektoren diese Werkzeuge zur Textprüfungnutzen. Schließlich sollten für alle Texte die gleichen Qua­litätsanforderungen gelten, unabhängig davon, ob es sichum Ausgangstexte oder Übersetzungen handelt.

Nun stellen wir einige Werkzeuge zur Autorenunter­stützung vor. Die wichtigsten Kennzeichen der hier unter­suchten Systeme finden Sie in Tabelle 1.

acrolinx 10

Das Programm acrolinx IQ von acrolinx basiert auf ei­ner Client-Server-Architektur und ist modular aufgebaut.Zentrale Komponenten des Systems sind das sogenannteDashboard, die Clients zur Textprüfung, der Terminolo­giemanager zur webbasierten Terminologieverwaltung so­wie die intelligente Wiederverwendung zur Erstellung vonSatzbanken. Das browserbasierte Dashboard fungiert alsSteuerzentrale zur Systemkonfiguration. Hier kann derlinguistische Administrator die linguistischen Ressourcen(Terminologie, Satzbanken, Regelsets) pflegen und Be­nutzer mit verschiedenen Rechten und Rollen verwalten.Für die Grammatik- und Stilprüfung bietet acrolinx gän­gige kontrollierte Sprachen wie ASD Simplified Englishan, entwickelt jedoch auch kundenspezifische Regelwerke,

12

IPrüffunktionen

Sprachen

Textprüfung

Integration in TM-Systeme

Verfügbarkeit von Sätzenfür die Wiederverwendung

Unterstützte Edi­toren und Formate

Anbieter

Terminologie, Stil, Gram­matik, Rechtschreibung,intelligente Wiederverwer­tung von Standardsätzen

Deutsch (TÜV DocCertRegelset, acrolinx TechnischesDeutsch), Englisch (Simpli­fied English, Global English),Französisch, Japanisch

Nachträgliche Prüfung(d. h. Textprüfung erfolgtnach der Texterstellung)

Import von TMX-Dateien, Im­port und Export von Termino­logieeinträgen (OUF, andereXML-basierte Formate, CSV)

Neue Sätze stehen zurVerfügung, sobald derRedakteur einen Satz in derSatzbank abspeichert hat

MS Word, Excel, PowerPoint,Adobe FrameMaker und In­Design, PTC Arbortext, Just­Systems XmetaL, AuthorIT;Batch Checker für TMX,HTML, XML, GML, PDF

http://www.acrolinx.de/

MOÜ 4 I 2009

I

Page 4: Neue Werkzeuge Zur Autorenunterstuetzung

Titelthema "-(z. B. TBX oder MultiTerm XML) möglich. Texte können

nach der Textprüfung in Satzbanken abgespeichert wer­

den, damit sie für die Wiederverwendung zur Verfügung

stehen.

Hier bietet acrolinx mit der sogenannten intelligenten

Wiederverwertung eine neue Funktion, die in dieser Form

in anderen Systemen noch nicht vorhanden ist. Die Ent­

wickler von acrolinx übertragen damit einen Ansatz, wie

er vielen Anwendern bereits aus der praktischen Ter­

minologiearbeit vertraut ist, von der Wortebene auf die

Satzebene. Beim Aufbau einer Unternehmensterminolo­

gie führt ein Terminologe in der Regel zunächst eine Ter­

minologiebereinigung durch, d. h., er identifiziert Syno­

nyme, legt Vorzugsbenennungen fest und dokumentiert

verbotene Benennungen, also Benennungen, die in den

Texten des Unternehmens nicht verwendet werden dür-

Terminologie, Stil,Grammatik, Recht­schreibung, Aut­horing Memory

fE!I3Terminologie, Autho­ring Memory, einfacheGrammatik- und erwei­terbare Stilprüfungen

Terminologie, Aut­horing Memory

II~

Terminologie,Satzbanken

....oUII

L..", .!'i!!Il1I: -

o •1."'" 'olfrlllO

Terminologie, Stil,Grammatik, Recht­schreibung

l

Deutsch, EnglischIn Vorbereitung: Fran­zösisch und Spanisch

Linguistische Prü­fung: siehe CLATAuthoring Memory:Beliebige Quellspra­chen, die im TMvorhanden sind

Linguistische Prüfung:Englisch; stilistischePrüfung: Englisch,Deutsch, FranzösischAuthoring Memory:Beliebige Quellspra­chen, die im TMvorhanden sind (mitEinschränkungen fürbidirektionale undostasiatische Sprachen)

Authoring-Memory undTerminologie: beliebigeQuellsprachen, die imTM bzw. im Wörter­buch vorhanden sind.

Authoring Memory,aber mit linguistischerPrüfung: Quellspra­chen mit Code 1252(alle westeuropäischenSprachen), die in derSatz- oder Termbankvorhanden sind

Nachträgliche Prüfung Echtzeitprüfung odernachträgliche Prüfung

Nachträgliche Prüfung Echtzeitprüfung Echtzeitprüfung odernachträgliche Prüfung

Integration in Acrossüber crossAuthorLinguistic

Direkte Integration inAcross Language Server

Integration in SDLTrados 2007; Integrationin SDL Trados Studio2009 in Vorbereitung

Integration in STARTransit und Term-Star; Transit-Projektekönnen im MindReaderempfangen werden

Import und Export vonSätzen in TMX undCSV; Import und Exportvon Terminologie inMARTIF und CSV

http://www.i­match.itl.info/

MS Word, Ado­be FrameMaker

Neue Sätze stehen zurVerfügung, sobaldder Redakteur einenSatz in der Satzbankabgespeichert hat

Authoring Memory:Neue quellsprach­liche Sätze stehen zurVerfügung, sobald sieals Referenzmaterialeingelesen wurden.

MS Word, AdobeFrameMaker, Ar­bortext EditorRedaktionssystemStar GRIPS

http://www.sdLcom

Authoring Memory:neue quellsprachlicheSätze stehen erst nachder Übersetzung zurVerfügung, wenn siein einem Translati­on Memory abge­speichert wurden

MS Word, AdobeFrameMaker, Ar­bortext Editor, Just­Systems XMetaL

http://www.across.net

Authoring Memory:Neue quellsprachlicheSätze stehen erst nachder Übersetzung zurVerfügung, wenn siein einem Translati-on Memory abge­speichert wurden

MS Word, PowerPoint,Adobe InDesign, Ad­obe FrameMaker, PTCArbortext, JustSystemsXmetaL, MadCap Flare

CLAT-ins für MS Word2003, PTC ArbortextEditor, Adobe Frame­Maker; CLAT-in für MSWord 2007 in Vorbe­reitung; Batch Checkerfür SGML, HTML,XML, Interleaf; JAVA­API zur Anbindung anRedaktionssysteme

http://www.iai-sb.de/iai!

Kein Aufbau vonSatzbanken möglich

http://www.star­group.net

Tabelle 1: Übersicht über die in diesem Artikel untersuchten Systeme zur Autorenunterstützung

MDÜ 4 I 2009 13

Page 5: Neue Werkzeuge Zur Autorenunterstuetzung

" Titelthema

fen. Genau dasselbe macht acrolinx IQnun auf Satzebene: BedeutungsgleicheSätze werden automatisch in sogenann­ten Clustern zusammengefasst und vomlinguistischen Administrator validiert,der einen "Vorzugssatz" als Repräsen­tant auswählt (Abb. 4). Dieser Satz stehtden Autoren in Zukunft als Standardfor­mulierung zur Verfügung. Kommt imText ein synonymer Satz vor, der nichtdem Standard entspricht, wird dem Au­tor bei der Textprüfung stattdessen der"Vorzugssatz" vorgeschlagen. Auf dieseWeise soll sich die Entstehung typischerInkonsistenzen auf Satzebene innerhalbeines Translation Memory vermeidenlassen (Tabelle 2).

Dieses Konzept einer intelligentenWiederverwendung setzt zweifellos eineanspruchsvolle linguistische Analyse aufsyntaktischer und semantischer Ebene

voraus. Insofern ist es nicht überraschend, dass acrolinxim Systemtest irrtümlicherweise auch nicht bedeutungs­gleiche Sätze in einem Cluster gruppierte.

Nach Angaben des Herstellers wird jedoch die Cluste­ring-Funktion der intelligenten Wiederverwendung fürdie nächste Version grundlegend überarbeitet und ihrePräzision somit noch gesteigert. In der nächsten Versionsoll es dann auch möglich sein, Sätze in den Satzbankenzu editieren.

Größe

Niemals

Niemals

Niemals

Niem.,ls

Now switch on the machine.

Switch the macnine on.JJJJJJ

.... S~"ltch on the machine. 0

ReRrasentant

Abb.3: Textprüfung mit acrocheck. Im Kontextmenü werden für den aktuellen Fehler (gelbunterlegt) Erläuterungen angeboten. Bei einigen Fehlertypen werden konkrete Korrektur­vorschläge unterbreitet, die per Mausklick übernommen werden können

Abb.4: Bedeutungsgleiche Sätze werden in acrolinx zu einem Clusterzusammengefasst. Der unterste Satz wurde als Repräsentant, d. h. alsStandard, ausgewählt

ClAT

•Nach Abschluss der Installationstarten Sie den Server neu.

Nach Abschluss derSystemeinrichtung startenSie den Server neu.-------------- Please restart serverNach Abschluß der after the installation.Installation müssen Sieden Server neu starten.

Starten Sie den Zentral­rechner neu nach Abschlussder Installation.

Tabelle 2: Inkonsistenzen in einem Translation Memory:Im deutschen Text wurden vier Varianten gefunden.Beispiele aus lehmann et al. (2009)

14

Auch CLAT basiert auf einer Client-Server-Architekturund bietet ebenfalls eine Textprüfung im Bereich Recht­schreibung, Terminologie, Stil und Grammatik sowie eineTermextraktion an. Für die Konfiguration der linguis­tischen Ressourcen (Terminologie, Regelwerke, Benutzer­wörterbücher, Synonyme) steht mit dem UMMT (Utilityfor Mandate Management Tasks) ein eigenes Werkzeugzur Verfügung, dessen Funktionen mit denen des Dash­boards von acrolinx vergleichbar sind.

Anders als in acrolinx arbeitet der linguistische Admi­nistrator im UMMT nicht nur mit kompletten Regelsets,sondern kann einzelne Regeln für projektspezifische An­wendungen ein- und ausschalten (Abb. 5). In die Ent­wicklung der Stil- und Grammatikregeln sind die Erfah­rungen aus zahlreichen Technischen Redaktionen undRedaktionsleitfäden eingeflossen; im Unterschied zuacrolinx wird jedoch keine spezifische kontrollierte Spra­che modelliert.

MDÜ 4 I 2009

Page 6: Neue Werkzeuge Zur Autorenunterstuetzung

rite/thema "-

1'00" Durch die Integration von CLA'T: wird crossAuthor dankcrossAlJ!lor UnO\) stIc um eine ~1st1sche InteUIg<!nz erweitert -VI!~ ~

+ •

- c y ~ l"'!I

~ ;;:ehwQ'-V IJ..::JClAT 0-v1!Jcrctu~Q""1l

Iigenz

.7.

Ch..II.lR.t1521d.aus t_NIlII1(R.~ I~

""..·IIAI Sl2~._ 11.... R SIOde'8Iß 17

""

·7··30--.!.. 11

Pt.S1t:lofl WordJ:)l' (itnn.n[Gt",,'~ ~

~.,t.OWl:.,

, VT.1fI'IItlOlo9le._....-­......-...­T_T__

'9­-­...-,,""-­,-......-.-----"'­-'9-,-­DTD

Rnl~r.m

~--­......­""-

Diese erweiterten l-unKtlonen von crossAuthor L1ngulstlc sind nahtlos in •..' ",,,mit ",in " . (' ,~

L~~. Horne ~~Itrt Pa~t';'~ut Iltftr,ncu Io4IUongs RNitw V1tw Otwtoptr Adc'-inl

~ J, Mal -11.0 - ==-1="·,-:- ~~ ~ &. ~

~ :IB r 11 ..... ",-""",1_ .. '"' •. 1E:1 1 AaB 1.1 Aa 1.1.1 J • 'RPlI~tt '::/ ~. A. Al ,., ~ • ~~~:~ fd~nSl

(llpbOolul r;Jl fo T__:TobIl('l2)~Itd(l2)WJtlo:rit::d:(12) .~

"; =:':...-",,""" ~. ijI1iiiiiiiii...........-;<:l-1

1.1 Acre ~ !~=i:: Ij ~Durch die Int T""".'......."""""",••__"""'.,, ssAuthor Ling

IWormllllonen;nl',.a,bdmlden"nor1'rlfllefl«OU~-"~en.netYMnSiebl:le ~

Intelligenz er __.......20. ~ eibung, Grarr

und Abkürzu ~~-i.-.io,p~~~~~~~~~~1 [prÜfUngen -maschinellellliltiMB# 4!&iM 5 1::1 lieren, DarübELinguisticdie iJ s bestehendeund die entsl und dort als

~~

Abb.5: 5tilregeln im Konfigurationswerkzeug UMMT. Rot markierte Regeln sind Kernre­geln, die standardmäßig in CLAT enthalten sind und quasi einen Best-Practice-Regelsatzdarstellen. Grün markierte Regeln ergänzen diesen Bestand. Alle Regeln sind ein- und aus­schaltbar. Für einige Regeln kann der linguistische Administrator einen 5chwellenwert set­zen, z. B. kann er eine Obergrenze für im Satz erlaubte Präpositionalphrasen festlegen

Sowohl das lAI als auch acrolinx ar­beiten im tekom-Arbeitskreis "Tech­nisches Deutsch" mit und planen, dieRegeln des "Technischen Deutsch nachtekom", das sich zurzeit noch in derEntwicklung befindet, in Zukunft auchin den Regelsets des jeweiligen CLCabzudecken.

Genau wie bei acrolinx gilt aber auchfür CLAT: Eine linguistische Regel kannvom Anwender nicht geändert wer­den, da in einem komplexen Systemwie der Linguistic Engine eines Con­trolled Language Checker schon klei­ne Änderungen ungeahnte Folgen nachsich ziehen können. Mit CLAT kön­nen allerdings keine Satzbanken aufge­baut werden. Außerdem verfügt CLATüber keine Terminologieverwaltung mitfrei definierbarer Eintragsstruktur. Inden Projektressourcen des UMMT kön­nen in den Terminologielisten lediglichvorgegebene Felder wie Genus, Wortartund Numerus ausgefüllt werden. Wei­tere Felder sind nicht vorgesehen.

Interessant ist jedoch, wie die imUMMT gespeicherten Synonymlistenzur Terminologie- und Konsistenzprü­fung verwendet werden können. EinBeispiel: Angenommen, im UMMT sindBautyp und Baureihe als Synonyme hin­terlegt. Falls in der Terminologieliste Ty­

penreihe als Vorzugsbenennung enthal­ten ist, erkennt die Terminologieprüfungim Text Artenreihe als Variante von Ty­

penreihe. Die Konsistenzkontrolle würdeim Text Fahrzeugtyp und Fahrzeugart alsmögliche Inkonsistenz anzeigen.

Abb.6: Termextraktion in crossAuthor linguistic. Treffer im Authoring Memory undderTerminologieverwaltung crossTerm werden dem Autor in separaten Fenstern ange­zeigt. Die ausgewählten Termkandidaten können zusammen mit dem Kontextsatz aus derAutorenumgebung in crossTerm eingepflegt werden

crossAuthor linguistic

Die neue Version 5.0 des Across Langua­ge Server, die Across im August 2009 aufden Markt gebracht hat, beinhaltet einedeutliche Erweiterung der bisherigenAutorenunterstützung crossAuthor.

Neben dieser Autorenunterstützung, die auch weiterhinangeboten wird, präsentiert Across mit der neuen Anwen­dung crossAuthor Linguistic eine Integration von CLAT incrossAuthor, die die Stärken von beiden Ansätzen zur Au­torenunterstützung, CLC und Authoring Memory, vereint.

CrossAuthor Linguistic bietet die gleichen Möglichkeitenzur Stil-, Grammatik- und Terminologieprüfung wie CLAT;gleichzeitig kann der Autor jedoch über das Authoring Me­mory von crossAuthor auf bereits im Translation Memorygespeicherte Sätze und ihre Übersetzung zugreifen (Abb. 2).

MOÜ 4 I 2009 15

Page 7: Neue Werkzeuge Zur Autorenunterstuetzung

" Tite/thema

SOL AuthorAssistant

oo

Abb.7: Terminologieprüfung im SOL AuthorAssistant. Das System er­kennt zu vermeidende Termini im Ausgangstext, die in MultiTerm hin­terlegt wurden, und schlägt die jeweilige Vorzugsbenennung vor

Abb.8: Beispiel für einen einfachen Terminologieeintrag in Multi­Term. Über das Feld Status lassen sich Vorzugsbennungen von verbo­tenen Benennungen unterscheiden

Außerdem steht dem Anwender mit crossTerm eine be­griffsorientierte Terminologiedatenbank zur Verfügung.Ein weiteres Plus ist die Termextraktion: Mit dem ToolcrossAuthor Linguistic lassen sich Termkandidaten ausdem Quelltext extrahieren und zusammen mit Kontext­sätzen direkt in crossTerm einpflegen (Abb. 6).

Bislang konnte in Across eine Termextraktion ledig­lich im Rahmen des Workflows "Terminologiearbeit und-übersetzung" durchgeführt werden, wobei weder Ter­minologielisten exportiert noch Kontextsätze generiertwerden konnten. Dank der linguistischen Intelligenz vonCLAT erzeugt die neue Funktion zur Termextraktion incrossAuthor Linguistic auch qualitativ deutlich bessereTerminologielisten als die bisherige Funktion.

Die Terminologieverwaltung erfolgt hier grundsätzlichin crossTerm; die notwendige Synchronisation zwischenden Terminologieressourcen im UMMT und den Termi­nologieeinträgen in crossTerm lässt sich nach Angaben desHerstellers über die ebenfalls ab Version 5.0 erstmals ange­botene Anwendung crossAutomate auch automatisieren.

16

Der SDL AuthorAssistant Client ist als zentrale Komponen­te des SDL-Global-Authoring-Management-Systems direktin die Autorenumgebung integriert. Der Author-Assistantumfasst eine Terminologieprüfung, ein Authoring Memo­ry, das Translation Memories aus SDLX und SDL Tradosverwenden kann, sowie verschiedene Prüfungen für unter­nehmensspezifische Stilvorgaben, die allerdings im Funk­tionsumfang nicht mit denen eines Controlled LanguageChecker vergleichbar sind. Systeme wie CLAT oder acro­linx enthalten jeweils weit über 100 verschiedene Gramma­tik- und Stilregeln, beim AuthorAssistant sind es ungefahrein Dutzend. Eine linguistische Prüfung wird derzeit nur fürEnglisch als Quellsprache angeboten, stilistische Prüfungengibt es außer für Englisch auch für Deutsch und Franzö­sisch. Für die linguistische Prüfung sollten die Entwicklerjedoch die linguistischen Regeln noch etwas verfeinern. ImSystemtest löste der AuthorAssistant mehrmals falschenAlarm aus. Auch die Option "Passiv" ist in der derzeitigenVersion noch etwas zu undifferenziert: Nachdem diese Prü­foption gewählt wurde, wurde jeder englische Satz, der eineVerbform im Passiv enthielt, als potenzieller Fehler gemel­det, was aus Autorensicht doch etwas zu restriktiv ist. Fürdie Terminologieprüfung kann auf lokale und serversei­tige MultiTerm-Datenbanken zugegriffen werden (Abb. 7).Außerdem lassen sich mit dem AuthorAssistant umfang­reiche Berichte erstellen, darunter auch ROI-Analysen, diedas Einsparpotenzial übersetzungsgerecht verfasster Textedeutlich machen.

STAR MindReader

Auch der MindReader von STAR ermöglicht den Echt­zeitzugriff auf bereits vorhandene quellsprachliche Sätzeund eine Terminologieprüfung. Genau wie beim TM-Sys­tem Transit verfolgt STAR auch beim MindReader einendateiorientierten Ansatz. Das Referenzmaterial für denMindReader besteht aus kompletten Dateien und nichtaus einer Datenbank mit Satzpaaren, wie es bei den meis­ten TM-Systemen bzw. Authoring Memories der Fall ist(Abb. 10). Dieses Referenzmaterial kann entweder direktim MindReader erstellt oder aus Transit-Projektdateienempfangen werden, welche über das Netzwerk, per E-Mailoder FTP zur Verfügung gestellt werden. Dieser datei­orientierte Ansatz hat den Vorteil, dass der Autor bei derTextersteIlung nicht nur satzweise Vorschläge aus demAuthoring Memory bekommt, sondern auch Informati­onen über deren Kontext und Herkunft erhält und ggf. so­gar komplette Absätze übernehmen kann. Wörterbücherfür die Terminologieprüfung können entweder in Mind-

MDÜ 412009

Page 8: Neue Werkzeuge Zur Autorenunterstuetzung

Tite/thema "-Reader erstellt werden oder aus TermStar - dem Termi­nologieverwaltungssystem von STAR - oder anderen For­maten wie MARTIF/TBX importiert werden.

[i]-match

Modul zur Termextraktion und eine Erweiterung der Be­nutzerverwaltung vorgesehen.

Standardisierung auf Wortebene:die Terminologieprüfung

Anzeige

39,90 €1)

ab 97,20 €1)

ab 48,60 € 1)2)

ASSEKURANZVersicherungsmakler für den BOÜ

BOSS ·

35 Jahre

41,18 €49,74 €

25 Jahre

32 ,08 €36,38 €

In den letzten Jahren ist das Bewusstsein für die Notwen­digkeit von Terminologiearbeit gewachsen. Laut der SDL­Terminologie-Umfrage 2009 sind 95 % der Befragten der

Eintrittsalter

Deckungssumme 200.000 €

Männer

Frauen

Jahresbeitrag in Abhängigkeit von Jahresnettoumsatzund Laufzeit

Jahresbeitrag für Existenzgründer

1) zzgl. 19% Versicherungssteuer2) Der Beitrag gilt für ein Jahr und bis zu einem Jahresnettoumsatz von 19.000 €

Berufshaftpflichtversicherung bei der Generali

VersicherungsrahmenverträgePreiswert - Leistungsstark

Vermögensschadenhaftpflichtversicherung bei der R+V

Private Krankenversicherung• Vermittlung von privaten Vollkrankenversicherungen, Zusatzversicherungen für Mitglieder

gesetzlicher Krankenversicherungen und Auslandsreisekrankenversicherungen• Beitrags- und Leistungsvergleiche aller privaten Krankenversicherer unter Einbe­

ziehung der bestehenden Gruppenverträge für BDÜ-Mitglieder mit der Gothaerund der DKV.

Altersvorsorge• Vermittlung von Rürup-, Riester- und privaten Rentenversicherungen• Kostenloser Service für BDÜ-Mitglieder: produktunabhängige Altersvorsorgeplanung

Abschluss und Umstellung bestehender Verträge nur über die Boss-Assekuranz

Boss-Assekuranz • Versicherungsmakter für den BOO • Tauentzienstraße 1

10789 Berlln • Telefon: 030-885 68 50 • Telefax: 030-88 56 85 88E-Mail: info@boss·assekuranz.de • Beratungszeiten: Montag bis Freitag von10.00 bis 18.00 Uhr

Alle Informationen und Dokumente zum Download unter

www.boss-assekuranz.com

Service für BDÜ-Mitglieder

Die Authoring Memories, die in Werkzeugen wie cross­Author Linguistic, SDL AuthorAssistant oder MindRea­der enthalten sind, basieren auf der TM-Technologie derjeweiligen Hersteller. Das heißt, dassder sinnvolle Einsatz dieser Systemegleichzeitig die Verwendung des je-weiligen TM-Systems voraussetzt.Doch nicht jedes Unternehmen hatoder möchte jedoch ein TM-System.Hier setzt die Autorenunterstützung[i]-match von der Firma itl AG an, dieseit 2008 angeboten wird.

Das Produkt [i]-match basiert aufeiner Client-Server-Architektur undumfasst folgende zentrale Kompo­nenten: Clients für Word und Fra­meMaker, ein Webportal, eine Such­maschine sowie Datenbanken zurVerwaltung von Terminologie undSätzen. Die Grundidee besteht darin,dass Autoren Terminologie und Sät­ze für die Wiederverwendung abspei­chern können, ohne ein TMS verwen­den zu müssen.

Im Unterschied zu TM-basiertenAuthoring-Memory-Systemen stehendem Redakteur die neuen quell­sprachlichen Sätze schon zur Wieder­verwendung zur Verfügung, sobald ersie in der Satzbank abgespeichert hatund nicht erst nach der Übersetzung.Außerdem setzt [i]-match Suchalgo­rithmen ein, die auch in Suchmaschi­nen wie Yahoo! verwendet werden.Diese Algorithmen verbessern lautAngaben der Hersteller die unscharfeSuche in den Datenbanken, was sichu. a. auch auf die Terminologieprü­fung positiv auswirkt (Abb. 9). Quell­sprachliche Sätze und Termini lassensich in [i] -match bei der Texterstel­lung direkt aus dem jeweiligen Editorin die Datenbank einpflegen.

Für die Version 2.0, die im Herbst2009 eingeführt werden soll, ist ein

MOÜ 4 I 2009 17

Page 9: Neue Werkzeuge Zur Autorenunterstuetzung

" Tite/thema

. .... ...

Drei-Liter-Auto Dreiliterauto, 3-Liter-Auto Bindestrichvariante, evtl. noch mit Ziffern

BecherhalterRückfuhrventil

BecherhalterungRückführungsventil

Morphologische Variante (zusätzlichesSuffix)

Einkommenssteuer

Basiszins Soll

Terminologiemanagement

Einkommensteuer

Sollzins

Terminologieverwaltung

Unterschiedliche Fugenelemente

Mehrwort- versus Einwortbenennung

Synonyme

Serverkonfiguration Konfiguration des Servers Nominalphrase statt Kompositum

Öltransportsystem Öltrasportsytem Rechtschreibfehler

Tabelle 3: Varianten bei der Benennungsbildung. Die erste Spalte enthält die gewünschten Vorzugsbenennungen, die jeweils in die Terminolo­

giedatenbank aufgenommen wurden. Getestet wurde, ob die in der zweiten Spalte aufgelisteten Varianten bei der Terminologieprüfung auto­

matisch als Terminologiefehler erkannt wurden

_...-

Systeme eine Terminologieprüfung an. Im Mittelpunkt desTests stand, wie die einzelnen Systeme mit sogenannten"Unwörtern" oder "Negativtermen" umgehen. Die Fragewar: Reicht es für die Terminologieprüfung aus, die Vor­zugsbenennungen in die Terminologiedatenbank aufzu-

nehmen, oder müssen Schreibvariantenund verbotene synonyme Benennungenexplizit eingepflegt und mit einem ent­sprechenden Feld zum Verwendungs­status als verboten gekennzeichnet wer-den (Abb. 8), wie es beispielsweise incrossAuthor der Fall ist?

In allen getesteten Systemen gibt es einderartiges Feld, und als verboten mar­kierte Benennungen werden zuverlässigals Terminologiefehler erkannt. Jedochgerade bei längeren Komposita, de­ren Bestandteile auch Ziffern und Ein­heiten umfassen, lassen sich im Deut-schen häufig mehr als fünf verschiedeneVarianten finden (man denke nur an diemöglichen Schreibweisen von Drei-Li­

ter-Auto). Hier ist es aus Sicht des Ter­minologen wünschenswert, den Arbeits­aufwand bei der Terminologieerfassungzu reduzieren. Eine weitere Frage ist, obdie jeweilige Terminologieprüfung auch

..Je'

Die Einkommensteuer ist eine Steuer, die auf das Einkommen von

Personen erhoben wird.

e-(I'..tU'I'~ • 11 • A" "," ~ r-' 1=' .~. ijr: ~ tt .. ' ..1bCc.0Il11 ..1ba:0d1 AaBbC.. ~ ~=.~J FIIl· ...... l('Ju·~·A· •••• ':I- "_' IliIt.__ lltlI'll"_Ulltn<lu'_.~" i: ............

M _ ,

I"'""'-..--........-----

Abb.9: Echtzeitprüfung in [i]-match. Das untere Fenster enthält Treffer in der Satzbank [i]­

write. Im Unterschied zu anderen Authoring Memories rechnet [i]-match nicht mit 100-%­Matches, sondern nimmt eine feinere Abstufung vor. Im rechten Fenster werden die Trefferaus der Terminologiedatenbank [i]-term angezeigt. Das Wort Einkommensteuerfindet [i]­

match trotz anderer Schreibweise und kennzeichnet dies mit einer Warnung

Auffassung, dass "terminologische Inkonsistenzen Aus­wirkungen auf die übersetzungsqualität haben" (Wet­zel 2009). Zum Abschluss wird deswegen die Termino­logieprüfung in den einzelnen Werkzeugen nochmalsnäher beleuchtet. Grundsätzlich bieten alle untersuchten

18 MDÜ 4 I 2009

Page 10: Neue Werkzeuge Zur Autorenunterstuetzung

Titelthema "---~

al°ri.loplUd-

Stefanie Geldbach

Als Linguistin mit mehrjähriger Erfahrung in der Entwicklungvon MÜ-Systemen verfolgt Dr. Stefanie Geldbach neue Ent­wicklungen im Bereich Übersetzungstechnologie mit großemInteresse. Seit 2006 bietet sie als freiberufliche Beraterin Ter­minologie- und Sprachdienstleistungen im Bereich TechnischeDokumentation und Übersetzung an. Im Wintersemester200912010 ist sie außerdem als wissenschaftliche Mitarbeiterinin dem Projekt "Redaktionsschnittstellen in TM-Umgebungen"an der Hochschule Anhalt tä[email protected]

LiteraturDrewer, Petra: "Übersetzungsgerecht schreiben", in: tech­nische kommunikation 312009, S. 28-33Lehmann, Sabine I Siegel, Melanie I Collmann, Oliver: "In­telligente Wiederverwertung statt blinden Kopierens", acro­linx White Paper Juni 2009, www.acrolinx.de/uploads/documents/whitepapers/Whitepaper_IntelligenCReuse­2009-06-[de].pdfWetze!, Michael: "SDL-Terminologie-Umfrage 2009", in:eDITion 112009, S. 18-20, www.iim.fh-koeln.de/dtt/Doku­menteledition_2009_liedition-2009-1-wetzel-web.pdf

.. _... .. = .._.

Betonmischanlag8">Transportbetonwert<wrerdenfOr ~~ I~ldieverschiedooonBetonblKtan<iellerezeptlKgenau,~~ -:::==;---'=====?"""'",.. .' "r""I~

100% C:\ProarammelMindReadeOprojects\Betonmischer (

I~ ,

100% C\Pro rammelMindReade ro'ects\8etonmischerMischen von Kleinmengen [<"Betonmischert.action~

Bearbeiten

100% C.\Pro ramme\MindReade ro"ecls\Betonmischer

• ,.N

100% C\Pro ramme\MindReader\or6ects\Setonmlscher (+l

Weblinks <"Betonmischer&action=edit&secbon=10" "Abschnitt bearbeiten: Weblinks">Bearbeilen100% C:\Pronramme\MindReader\nro"ects\Betonmischer +

TrockendosIerung und Fahrmischer-Mischung [<"Betonmischer&acbon=edit&section=4". "Abschnitt bearbeiten:Trockendosierunn und Fahrmischer-Mischuno":>Bearbeilen

Abb.10: Im MindReader können ganze Ordner oder Dateien als Referenzmaterial für dieredaktionelle Arbeit ausgewählt werden. Bei der Textsuche werden die Sätze, in denen dergesuchte String (hier: Betonmischer) vorkommt, in ihrem Kontext angezeigt

Fazit

mit Rechtschreib- oder Tippfehlern um­gehen kann. Tabelle 3 führt die Varian­ten an, die für die Terminologieprüfungvon Bedeutung sind.

Grundsätzlich lassen sich bei der Ter­minologieprüfung zwei Ansätze unter­scheiden: Eine Möglichkeit besteht da­rin, linguistisches Wissen einzusetzenund mögliche Terminologievariantenüber entsprechende linguistische Re­geln zu erfassen. Diesen Ansatz verfol­gen die Controlled Language Checkers,die zumindest mit einigen der beschrie­benen Varianten gut zurechtkamen. So­wohl die acrolinx-Suite als auch CLATund crossAuthor Linguistic konnten Va­rianten der Vorzugsbenennung Drei-Li­ter-Auto wie 3-Liter-Auto oder Dreili­terauto problemlos identifizieren. DieErkennung der Variante Konfigurati-

on des Servers versus Serverkonfiguration funktioniert inCLAT bzw. crossAuthor Linguistic über die sogenanntenHinterlegungsoptionen im UMMT. Hier kann der linguis­tische Administrator bestimmte Hinterlegungsmuster wieAB -7 BxA auswählen, welche die Nominalphrase Konfigu­

ration des Servers in Form einer Phrasenstrukturregel vondem Kompositum Serverkonfiguration ableiten. Auch ei­nige der morphologischen Varianten wie Dichtheit versusDichtigkeit oder Heizelement versus Heizungselement kön­nen CLCs im Prinzip erkennen.

Eine anderer Ansatz für die Terminologieprüfung istdie unscharfe Suche (Fuzzy-Suche) in der Terminologie­datenbank, bei der Abweichungen in der gesuchten Zei­chenkette (Permutationen, ausgelassene Zeichen etc.) be­rücksichtigt werden. Eine derartige Fuzzy-Suche wirdbeispielsweise von [i]-match verwendet, so dass im Testalle Varianten außer Terminologiemanagement versus Ter­

minologieverwaltung erkannt werden konnten. Somit kön­nen auch Rechtschreib- oder Tippfehler bei der Termino­logieprüfung erfasst werden. Der Nachteil gegenüber demlinguistischen Ansatz liegt in einer geringeren Präzision,da das System - je nach Unschärfegrad - auch unsinnigeVorschläge liefert.

Im Bereich Autorenunterstützung hat sich auf Seiten derHersteller in den letzten Jahren einiges getan. Aufgrundder steigenden Anforderung an die Standardisierung vonTexten ist auch zu erwarten, dass diese Werkzeuge an Ver­breitung gewinnen werden. •

MDÜ 4 I 200919