34
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 1 Auf dem Weg zu wissensbasierten Terminologien tekom Herbst-Tagung 11.-13. November 2014 in Stuttgart D.O.G. Dokumentation ohne Grenzen GmbH Dr. François Massion, Geschäftsführer [email protected]

Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 2: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 2

Historische Entwicklung

Karteikarten: ein- und mehrsprachig alphabetisch oder nach Begriffssystem(en)

Word- / Excel-Listen: alphabetisch oder begriffsorientiert evtl. mit Zusatzinformationen

Aus: Eugen Wüster. Technische Sprachnormung – Aufgaben und Stand. Sprachforum 1 (1955), Nr. 1, p. 51-61 in: Heribert Picht, Klaus-Dirk Schmitz. Terminologie und Wissensordnung. Ausgewählte Schriften aus dem Gesamtwerk von Eugen Wüster. Termnet. Wien 2001. Hier: normierter Eintrag aus einer Terminologiekarte für seinWerkzeugmaschinenwörterbuch.

Page 3: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 3

Stand der Technik

Begriffsorientierte Terminologieverwaltungssysteme (TVS) Begriff fasst Benennungen mehrsprachig zusammen Mit weiteren Informationen

(Status, Verwendung, Definitionen usw.)

Selbständig oder in Anwendungen integriert: Translation Memory Systeme (TMS) Content Management Systeme (CMS) Qualitätssicherungssoftware Produktinformationsmanagement (PIM) usw.

Page 4: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 4

Schwächen von TVS

Reine Sammlung einzelner Begriffe Beziehung zwischen Begriffen nicht vorhanden oder nur

hierarchisch (Oberbegriff, Unterbegriff) Keine oder lückenhafte Entscheidungshilfe bei:

Fehlende Definitionen und Erläuterungen Benennungs- bzw. Begriffsalternativen

("Exit" = Ausgang oder Ausfahrt?) Fehlendem Kontext Fehlendem Wissen des Anwenders

(implizites Wissen vorausgesetzt)

Page 5: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 5

Warum bereiten Begriffe Kopfzerbrechen?

Am Anfang kommt die Realität Daraus entsteht ein Begriff:

Denkeinheit Gemeinsame relevante Merkmale Berücksichtigte Merkmale sind arbiträr

Definierter Begriff und Anwendungsfall stimmen nicht ganz überein: Andere Einsatzbedingungen Weitere technologische Entwicklungen Hybridverfahren / Hybridsituationen Beispiel MÜ-Systeme: Statistisch, regelbasiert, hybrid. Wo liegen die

Grenzen?

BCD

Begriffsdefinitionmit gemeinsamenMerkmalen BCD

RealitätABD

ABC

BCD ABCD

Terminologe

Nutzer

Auswahl von Objekten {

Page 6: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 6

Beispiel: Welche Übersetzung für "Behälter"?

Vessel?

(Drei Textauszüge aus Dokumenten eines Anlagebauers)

Page 7: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 7

Informationen im TVS hilfreich?

Im DIN-Terminologieportal: 45 Normen definieren “Behälter”

Page 8: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 8

Einsatzbereiche (Beispiele): Produktionssteuerung (z. B. Internet der Dinge) Vertriebsunterstützung Technischer Support

Benutzen Ontologien: In der IT: Formale computerlesbare Darstellung eines Wissensbereichs

auf der Basis von Begriffen und Relationen. Meta-Ontologien = Ontologie von Ontologien

Beispiel: das Unified Medical Language System (UMLS): Mit Begriffen aus etwa 150 Ontologien und medizinischen Nomenklaturen in 15

Sprachen. Enthält 2,1 Mio. Begriffe und 9, 8 Mio. einmalige Begriffsbezeichnungen

Wissenssysteme

Page 9: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 9

Klassen [=Begriffe] und Relationen zwischen ihnen. Ontologien können Instanzen von Klassen enthalten

(z. B. "Einstein" Instanz von Klasse "Physiker"). Angelehnt an objektorientierter Programmierung

(Klassen, Objekte, Eigenschaften). Logik-Regeln und Abfragesprachen wie SPARQL.

Wissensmaterial

Page 10: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 10

Schwächen von Wissenssystemen

Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse "Hotel" ) Probleme bei Begriffssuche oder Verknüpfung von Ontologien

Problemfall Synonyme oder Fremdsprachen Nur manche Ontologien ordnen mehrere Benennungen Klassen

(Begriffen) zu. Mit Relationen wie "SameAs" oder "EquivalentTo".

Aufbau von Ontologien ist komplex Spezialwissen ist erforderlich. Einige wenige Fachleute bauen das Wissen mit auf.

Page 11: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 11

TVS und Wissenssysteme

Unterschiedliche Ziele: TVS: Sprachsteuerung (+ Wissen) Wissenssysteme: Einem Wissensziel untergeordnet

(z. B. Vertriebsunterstützung)

Synergien nutzen: TVS können das Sprachwissen und die Begriffsmodelle

beisteuern Über TVS werden mehr Teilnehmer am Wissensaufbau

beteiligt. Wissenssysteme können Methoden und Instrumente zur

Wissensstrukturierung und -abfrage beisteuern

Page 12: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 12

Synergien

B1

B4

B3

B2

B5

Bn

Begriffe (=B)Sprache A- Benennung A- Benennung BSprache B- Benennung A

Wissenssystem

Page 13: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 13

Unsere Zielsetzung

Vorhandene begriffsorientierte Terminologiebestände nehmen

Diese mit Wissen anreichern Arbeit standardisieren und z. T. automatisieren

Page 14: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 14

Wissen ist vorhanden

In TVS: Definitionen und Beispiele Verweise

In Dokumentationen: Anleitungen, Web-Sites usw. Zeichnungen, Schemata

Wissen vorhanden aber nicht strukturiert Reine Texte und kein computerlesbares Wissen

Page 15: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 15

Wie entsteht Wissen?

Basismaterial = Begriffe Wissen muss "konstruiert" werden Wissen = Begriffe + Relationen Wissen austauschbar und maschinenlesbar

machen

Page 16: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 16

Tripel aufbauen: Subjekt – Prädikat – Objekt

Subjekt = Begriff, von dem die Beziehung ausgeht. Prädikat = Beziehung Objekt = Begriff, der Ziel dieser Beziehung ist.

Beziehungsbeispiele:

Relationsmuster

Subjekt Prädikat Objekt

Kohlebürste ist Teil von Lichtmaschine

Kohlebürste bewirkt elektrischen Kontakt

Stan Zurek . Wikimedia. 2006. Kohlebürste eines Motors

Page 17: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 17

Relationstypen

Äquivalenzrelationen (in TVS) Hierarchierelationen ( in TVS) Assoziationsrelationen ( in TVS):

Ursache-Wirkung, Position … Abhängig vom Wissensgebiet und von den Wissenszielen

Attribute und Bedingungen: Gilt nur, wenn Objektattribut ist: 'Material = Kunststoff'

Relationseigenschaften: Unidirektional / Bidirektional Transitiv 1:1; 1:n; n:1

Page 18: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 18

Relationen modellieren

Beziehungstyp BeispieleKAUSALITÄT • Bewirkt, Beeinflusst

• Verwendet, Benutzt• Verändert• Beendet, Startet

GANZ - TEIL • Ist Teil von• Beinhaltet, Umfasst

FUNKTION • Dient zu

ZEIT - ZEITFOLGE • Startet nach, vor

EIGENSCHAFT • Hat Zustand• Hat Eigenschaft• Besteht aus Material

POSITION - ORT • Befindet sich• Steht neben

Allgemeine Beziehungen • Hat zu tun mit• Ist ähnlich zu

Page 19: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 19

Umsetzungsstrategie

Beschränkte Anzahl an Relationen definieren und dokumentieren

Teil der Arbeit automatisieren Manuelle Arbeit in virtuellen Teams verteilen

(Autoren, Entwickler, Übersetzer…)

Page 20: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 20

Hierarchische Relationen festlegen

Manuell oder halbautomatisch: Gemeinsames Grundwort suchen (z.B. "Ventil") Zeichnungen, Stücklisten (Teil - Ganzes - Relation) Oberflächenbeschreibungen, Maskennummer

Quelle: Kuntoff. Wikimedia. 09.09.2005

Page 21: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 21

Assoziative Relationen festlegen

Manuell oder halbautomatisch: Z. B. Begriffe aus Normen, aus Gefahrenhinweisen

extrahieren Stichwörter (Marker) für best. Relationstypen in Listen

pflegen: "Befindet sich" Positionsrelation "Verwenden", "dienen zu" Funktionsrelation "Enthalten", "besteht aus" Teil – Ganzes - Relation "Bewirkt", "verursacht", "löst aus" Ursache – Wirkungsrelation usw..

Page 22: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 22

Umsetzungsbeispiel

Wie lässt sich unser Übersetzungsbeispiel modellieren? Verschiedene Anreicherungsschritte Schritt 1: Wort- und Begriffsliste sammeln

Deutsch

Behälter

Druckbehälter

Paketbehälter

Tank

Englisch

bin

tank

vessel

container

Page 23: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 23

Schritt 2: Taxonomie

Begriffshierarchie ("Taxonomie") Aufbau klassischer TVS

Behälter

DE: BehälterDE: DruckbehälterEN: Vessel

DE: BehälterDE: AuffangbehälterEN: Container

DE: BehälterDE: TankEN: Tank

DE: BehälterDE: PaketbehälterEN: Bin

Page 24: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 24

Schritt 3: Anreicherung

Definitionen Bilder, Kommentare usw.

Behälter

DE: Behälter (verboten)DE: Druckbehälter (erlaubt)EN: Vessel

DE: Behälter (verboten)DE: Auffangbehälter (erlaubt)EN: Container

DE: Behälter (verboten)DE: Tank (erlaubt)EN: Tank

DE: Behälter (verboten)DE: Paketbehälter (erlaubt)EN: Bin

Def.: etwas, was zum Aufbewahren und Transportieren beliebiger Gegenstände oder Flüssigkeiten (auch Gase) dient

Def.: Transport, stapelbar, z.B. fürBriefe, Pakete

Def.: Druck, Vakuum, z.B. fürGas

Def.: offen odergeschlossen, rel. groß, z.B. fürWasser

Def.: für die Entsorgung von Stoffen, Flüssigkeiten, Chemikalien

Page 25: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 25

Schritt 4: Relationen

Behälter

Vessel = Druckbehälter

Container = AuffangbehälterTankBin =

Paketbehälter

EntsorgungTransport FlüssigkeitPaket Druck

Enth

ält

VersorgungGas

Hierarchisch Assoziativ

Page 26: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 26

Von der Terminologie zur Wissenslösung

Quellen

• Dokumente• Web• Datenbanken

Extraktion

• Einsprachig• Mehrsprachig• Erkennung von

Synonymen und Homonymen

• Erfassung

Anreicherung

• Definitionen• Semantische

Informationen• Attribute• Bild, Zeichnung

Organisation

• Relationen• Evtl.

Bedingungen

Page 27: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 27

Einige XML-basierte Datenformate (1/2)

TBX (TermBase Exchange) Austausch begriffsorientierter Terminologien

RDF (Resource Description Framework) und RDFS (RDF Schema) Repräsentation von Wissen im Internet Aussagen über Ressourcen (Individuen) Einfache Relationen Benutzt Tripel Beispiele von RDF-Vokabulare:

FOAF – Friend of a Friend (speziell für soziale Netzwerke)

SKOS – Simple Knowledge Organisation SystemBeschreibt Taxononomien, Klassifikationen, Thesauri

Quelle: https://github.com/seebi/planet-fsw.lod2.eu/blob/master/test/desirejeanette.rdf Zugriff: 16.10.2014)

Page 28: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 28

Einige XML-basierte Datenformate (2/2)

OWL (Web Ontology Language). Varianten: OWL Lite, OWL DL, OWL Full Baut auf RDF Komplexere Relationen Klassen, Objekte, Eigenschaften, Logik

Page 29: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 29

Wissensabfrage

Durch Relationen kann man Zusammenhänge abfragen. Beispiele:

Welche Begriffe stehen mit dem BegriffKohlebürste in Zusammenhang?

Was sind es für Relationen?oder Welche Gefahren gehen vom Spritzgerät aus?

Abfrage unabhängig von: Sprache ("Drehknopf", "Poti" oder "potentiomètre"). Verwendungsstatus: "erlaubt" oder "verboten"

Page 30: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 30

Nutzungsszenarios

Entlang des Produktlebenszyklus viele potenzielle Nutzer: Konstruktion Vertrieb Technischer Support Redaktion und Übersetzungen usw.

Beispiele: Redakteur nutzt Firmenwissen zur Optimierung der Warnhinweise

oder der Normenkonformität der Dokumentation. Übersetzer prüft Übersetzungskontext ("Behälter"). Technischer Support sucht Ursache-Wirkung-Relationen zur

schnelleren Lösung von Problemen.

Page 31: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 31

Anwendungsbeispiel Warnhinweise

Dokumentieren von Gefahren mit Unterstützung von Beziehungen

Auszug aus der BA “Mischpumpe G 4 X Standard” der Fa. Knauf PFT GmbH & Co.KG. Heruntergeladen von www.pft.eu am 17.10.2014

Page 32: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 32

Anwendungsbeispiel Warnhinweise

Dokumentieren von Gefahren mit Unterstützung von Beziehungen

Auszug aus der BA “Mischpumpe G 4 X Standard” der Fa. Knauf PFT GmbH & Co.KG. Heruntergeladen von www.pft.eu am 17.10.2014

Page 33: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 33

Die Vision

Aufwertung der Terminologiearbeit. Anerkennung von Terminologie als Instrument zur

Wissenserstellung. Schnellere und genauere Umsetzung neuer Wissensprojekte . Grenzen zwischen TVS und Wissenssystemen verschwinden

allmählich. Öffnet Wissensthemen, Wissensmodellierung einer größeren

Anzahl von Teilnehmern. Dadurch schneller zu inhaltsreicheren Wissenssystemen Kooperative Wissenserstellung.

Page 34: Auf dem Weg zu wissensbasierten Terminologien · 2017. 2. 3. · Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse

tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 34

Vielen Dank für Ihre Aufmerksamkeit!

Dr. F. MassionD.O.G. Dokumentation ohne Grenzen GmbHNeue Ramtelstr. 1271229 Leonberg, [email protected]