Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 1
Auf dem Weg zu wissensbasierten Terminologien
tekom Herbst-Tagung11.-13. November 2014 in Stuttgart
D.O.G. Dokumentation ohne Grenzen GmbH
Dr. François Massion, Geschäftsfü[email protected]
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 2
Historische Entwicklung
Karteikarten: ein- und mehrsprachig alphabetisch oder nach Begriffssystem(en)
Word- / Excel-Listen: alphabetisch oder begriffsorientiert evtl. mit Zusatzinformationen
Aus: Eugen Wüster. Technische Sprachnormung – Aufgaben und Stand. Sprachforum 1 (1955), Nr. 1, p. 51-61 in: Heribert Picht, Klaus-Dirk Schmitz. Terminologie und Wissensordnung. Ausgewählte Schriften aus dem Gesamtwerk von Eugen Wüster. Termnet. Wien 2001. Hier: normierter Eintrag aus einer Terminologiekarte für seinWerkzeugmaschinenwörterbuch.
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 3
Stand der Technik
Begriffsorientierte Terminologieverwaltungssysteme (TVS) Begriff fasst Benennungen mehrsprachig zusammen Mit weiteren Informationen
(Status, Verwendung, Definitionen usw.)
Selbständig oder in Anwendungen integriert: Translation Memory Systeme (TMS) Content Management Systeme (CMS) Qualitätssicherungssoftware Produktinformationsmanagement (PIM) usw.
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 4
Schwächen von TVS
Reine Sammlung einzelner Begriffe Beziehung zwischen Begriffen nicht vorhanden oder nur
hierarchisch (Oberbegriff, Unterbegriff) Keine oder lückenhafte Entscheidungshilfe bei:
Fehlende Definitionen und Erläuterungen Benennungs- bzw. Begriffsalternativen
("Exit" = Ausgang oder Ausfahrt?) Fehlendem Kontext Fehlendem Wissen des Anwenders
(implizites Wissen vorausgesetzt)
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 5
Warum bereiten Begriffe Kopfzerbrechen?
Am Anfang kommt die Realität Daraus entsteht ein Begriff:
Denkeinheit Gemeinsame relevante Merkmale Berücksichtigte Merkmale sind arbiträr
Definierter Begriff und Anwendungsfall stimmen nicht ganz überein: Andere Einsatzbedingungen Weitere technologische Entwicklungen Hybridverfahren / Hybridsituationen Beispiel MÜ-Systeme: Statistisch, regelbasiert, hybrid. Wo liegen die
Grenzen?
BCD
Begriffsdefinitionmit gemeinsamenMerkmalen BCD
RealitätABD
ABC
BCD ABCD
Terminologe
Nutzer
Auswahl von Objekten {
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 6
Beispiel: Welche Übersetzung für "Behälter"?
Vessel?
(Drei Textauszüge aus Dokumenten eines Anlagebauers)
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 7
Informationen im TVS hilfreich?
Im DIN-Terminologieportal: 45 Normen definieren “Behälter”
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 8
Einsatzbereiche (Beispiele): Produktionssteuerung (z. B. Internet der Dinge) Vertriebsunterstützung Technischer Support
Benutzen Ontologien: In der IT: Formale computerlesbare Darstellung eines Wissensbereichs
auf der Basis von Begriffen und Relationen. Meta-Ontologien = Ontologie von Ontologien
Beispiel: das Unified Medical Language System (UMLS): Mit Begriffen aus etwa 150 Ontologien und medizinischen Nomenklaturen in 15
Sprachen. Enthält 2,1 Mio. Begriffe und 9, 8 Mio. einmalige Begriffsbezeichnungen
Wissenssysteme
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 9
Klassen [=Begriffe] und Relationen zwischen ihnen. Ontologien können Instanzen von Klassen enthalten
(z. B. "Einstein" Instanz von Klasse "Physiker"). Angelehnt an objektorientierter Programmierung
(Klassen, Objekte, Eigenschaften). Logik-Regeln und Abfragesprachen wie SPARQL.
Wissensmaterial
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 10
Schwächen von Wissenssystemen
Terminologisch mangelhaft aufbereitet Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse "Hotel" ) Probleme bei Begriffssuche oder Verknüpfung von Ontologien
Problemfall Synonyme oder Fremdsprachen Nur manche Ontologien ordnen mehrere Benennungen Klassen
(Begriffen) zu. Mit Relationen wie "SameAs" oder "EquivalentTo".
Aufbau von Ontologien ist komplex Spezialwissen ist erforderlich. Einige wenige Fachleute bauen das Wissen mit auf.
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 11
TVS und Wissenssysteme
Unterschiedliche Ziele: TVS: Sprachsteuerung (+ Wissen) Wissenssysteme: Einem Wissensziel untergeordnet
(z. B. Vertriebsunterstützung)
Synergien nutzen: TVS können das Sprachwissen und die Begriffsmodelle
beisteuern Über TVS werden mehr Teilnehmer am Wissensaufbau
beteiligt. Wissenssysteme können Methoden und Instrumente zur
Wissensstrukturierung und -abfrage beisteuern
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 12
Synergien
B1
B4
B3
B2
B5
Bn
Begriffe (=B)Sprache A- Benennung A- Benennung BSprache B- Benennung A
Wissenssystem
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 13
Unsere Zielsetzung
Vorhandene begriffsorientierte Terminologiebestände nehmen
Diese mit Wissen anreichern Arbeit standardisieren und z. T. automatisieren
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 14
Wissen ist vorhanden
In TVS: Definitionen und Beispiele Verweise
In Dokumentationen: Anleitungen, Web-Sites usw. Zeichnungen, Schemata
Wissen vorhanden aber nicht strukturiert Reine Texte und kein computerlesbares Wissen
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 15
Wie entsteht Wissen?
Basismaterial = Begriffe Wissen muss "konstruiert" werden Wissen = Begriffe + Relationen Wissen austauschbar und maschinenlesbar
machen
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 16
Tripel aufbauen: Subjekt – Prädikat – Objekt
Subjekt = Begriff, von dem die Beziehung ausgeht. Prädikat = Beziehung Objekt = Begriff, der Ziel dieser Beziehung ist.
Beziehungsbeispiele:
Relationsmuster
Subjekt Prädikat Objekt
Kohlebürste ist Teil von Lichtmaschine
Kohlebürste bewirkt elektrischen Kontakt
Stan Zurek . Wikimedia. 2006. Kohlebürste eines Motors
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 17
Relationstypen
Äquivalenzrelationen (in TVS) Hierarchierelationen ( in TVS) Assoziationsrelationen ( in TVS):
Ursache-Wirkung, Position … Abhängig vom Wissensgebiet und von den Wissenszielen
Attribute und Bedingungen: Gilt nur, wenn Objektattribut ist: 'Material = Kunststoff'
Relationseigenschaften: Unidirektional / Bidirektional Transitiv 1:1; 1:n; n:1
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 18
Relationen modellieren
Beziehungstyp BeispieleKAUSALITÄT • Bewirkt, Beeinflusst
• Verwendet, Benutzt• Verändert• Beendet, Startet
GANZ - TEIL • Ist Teil von• Beinhaltet, Umfasst
FUNKTION • Dient zu
ZEIT - ZEITFOLGE • Startet nach, vor
EIGENSCHAFT • Hat Zustand• Hat Eigenschaft• Besteht aus Material
POSITION - ORT • Befindet sich• Steht neben
Allgemeine Beziehungen • Hat zu tun mit• Ist ähnlich zu
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 19
Umsetzungsstrategie
Beschränkte Anzahl an Relationen definieren und dokumentieren
Teil der Arbeit automatisieren Manuelle Arbeit in virtuellen Teams verteilen
(Autoren, Entwickler, Übersetzer…)
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 20
Hierarchische Relationen festlegen
Manuell oder halbautomatisch: Gemeinsames Grundwort suchen (z.B. "Ventil") Zeichnungen, Stücklisten (Teil - Ganzes - Relation) Oberflächenbeschreibungen, Maskennummer
Quelle: Kuntoff. Wikimedia. 09.09.2005
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 21
Assoziative Relationen festlegen
Manuell oder halbautomatisch: Z. B. Begriffe aus Normen, aus Gefahrenhinweisen
extrahieren Stichwörter (Marker) für best. Relationstypen in Listen
pflegen: "Befindet sich" Positionsrelation "Verwenden", "dienen zu" Funktionsrelation "Enthalten", "besteht aus" Teil – Ganzes - Relation "Bewirkt", "verursacht", "löst aus" Ursache – Wirkungsrelation usw..
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 22
Umsetzungsbeispiel
Wie lässt sich unser Übersetzungsbeispiel modellieren? Verschiedene Anreicherungsschritte Schritt 1: Wort- und Begriffsliste sammeln
Deutsch
Behälter
Druckbehälter
Paketbehälter
Tank
Englisch
bin
tank
vessel
container
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 23
Schritt 2: Taxonomie
Begriffshierarchie ("Taxonomie") Aufbau klassischer TVS
Behälter
DE: BehälterDE: DruckbehälterEN: Vessel
DE: BehälterDE: AuffangbehälterEN: Container
DE: BehälterDE: TankEN: Tank
DE: BehälterDE: PaketbehälterEN: Bin
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 24
Schritt 3: Anreicherung
Definitionen Bilder, Kommentare usw.
Behälter
DE: Behälter (verboten)DE: Druckbehälter (erlaubt)EN: Vessel
DE: Behälter (verboten)DE: Auffangbehälter (erlaubt)EN: Container
DE: Behälter (verboten)DE: Tank (erlaubt)EN: Tank
DE: Behälter (verboten)DE: Paketbehälter (erlaubt)EN: Bin
Def.: etwas, was zum Aufbewahren und Transportieren beliebiger Gegenstände oder Flüssigkeiten (auch Gase) dient
Def.: Transport, stapelbar, z.B. fürBriefe, Pakete
Def.: Druck, Vakuum, z.B. fürGas
Def.: offen odergeschlossen, rel. groß, z.B. fürWasser
Def.: für die Entsorgung von Stoffen, Flüssigkeiten, Chemikalien
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 25
Schritt 4: Relationen
Behälter
Vessel = Druckbehälter
Container = AuffangbehälterTankBin =
Paketbehälter
EntsorgungTransport FlüssigkeitPaket Druck
Enth
ält
VersorgungGas
Hierarchisch Assoziativ
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 26
Von der Terminologie zur Wissenslösung
Quellen
• Dokumente• Web• Datenbanken
Extraktion
• Einsprachig• Mehrsprachig• Erkennung von
Synonymen und Homonymen
• Erfassung
Anreicherung
• Definitionen• Semantische
Informationen• Attribute• Bild, Zeichnung
Organisation
• Relationen• Evtl.
Bedingungen
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 27
Einige XML-basierte Datenformate (1/2)
TBX (TermBase Exchange) Austausch begriffsorientierter Terminologien
RDF (Resource Description Framework) und RDFS (RDF Schema) Repräsentation von Wissen im Internet Aussagen über Ressourcen (Individuen) Einfache Relationen Benutzt Tripel Beispiele von RDF-Vokabulare:
FOAF – Friend of a Friend (speziell für soziale Netzwerke)
SKOS – Simple Knowledge Organisation SystemBeschreibt Taxononomien, Klassifikationen, Thesauri
Quelle: https://github.com/seebi/planet-fsw.lod2.eu/blob/master/test/desirejeanette.rdf Zugriff: 16.10.2014)
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 28
Einige XML-basierte Datenformate (2/2)
OWL (Web Ontology Language). Varianten: OWL Lite, OWL DL, OWL Full Baut auf RDF Komplexere Relationen Klassen, Objekte, Eigenschaften, Logik
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 29
Wissensabfrage
Durch Relationen kann man Zusammenhänge abfragen. Beispiele:
Welche Begriffe stehen mit dem BegriffKohlebürste in Zusammenhang?
Was sind es für Relationen?oder Welche Gefahren gehen vom Spritzgerät aus?
Abfrage unabhängig von: Sprache ("Drehknopf", "Poti" oder "potentiomètre"). Verwendungsstatus: "erlaubt" oder "verboten"
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 30
Nutzungsszenarios
Entlang des Produktlebenszyklus viele potenzielle Nutzer: Konstruktion Vertrieb Technischer Support Redaktion und Übersetzungen usw.
Beispiele: Redakteur nutzt Firmenwissen zur Optimierung der Warnhinweise
oder der Normenkonformität der Dokumentation. Übersetzer prüft Übersetzungskontext ("Behälter"). Technischer Support sucht Ursache-Wirkung-Relationen zur
schnelleren Lösung von Problemen.
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 31
Anwendungsbeispiel Warnhinweise
Dokumentieren von Gefahren mit Unterstützung von Beziehungen
Auszug aus der BA “Mischpumpe G 4 X Standard” der Fa. Knauf PFT GmbH & Co.KG. Heruntergeladen von www.pft.eu am 17.10.2014
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 32
Anwendungsbeispiel Warnhinweise
Dokumentieren von Gefahren mit Unterstützung von Beziehungen
Auszug aus der BA “Mischpumpe G 4 X Standard” der Fa. Knauf PFT GmbH & Co.KG. Heruntergeladen von www.pft.eu am 17.10.2014
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 33
Die Vision
Aufwertung der Terminologiearbeit. Anerkennung von Terminologie als Instrument zur
Wissenserstellung. Schnellere und genauere Umsetzung neuer Wissensprojekte . Grenzen zwischen TVS und Wissenssystemen verschwinden
allmählich. Öffnet Wissensthemen, Wissensmodellierung einer größeren
Anzahl von Teilnehmern. Dadurch schneller zu inhaltsreicheren Wissenssystemen Kooperative Wissenserstellung.
tekom-Tagung 11.-13. November 2014 © D.O.G. GmbH 34
Vielen Dank für Ihre Aufmerksamkeit!
Dr. F. MassionD.O.G. Dokumentation ohne Grenzen GmbHNeue Ramtelstr. 1271229 Leonberg, [email protected]