Upload
apsel-boche
View
111
Download
1
Embed Size (px)
Citation preview
1
OWL-Ontologieabgleich
Can Kayalı
Hybride, partielle
für Dienstselektierungim semantischen Web
2
Inhalt
• Einführung – OWL und OWL-S– Semantischer Dienstabgleich
• OWLS-MX
• Ontologieabgleich
• OWLS-MX 2.0
• Zusammenfassung
3
OWL und OWL-S
http://www.daml.org/services/owl-s/1.1/
DatumTicketkaufTicketkauf
Geld Flugticket
Ort
Ort
Fahrzeug
Auto Fahrrad
Thing
Geldkostet
meinBMX
http://www.w3.org/TR/owl-features
4
Semantischer Dienstabgleich
MatchmakerMatchmakerAnfrageAnfrage
Geld Fahrzeug Inserate(advertisements)
Inserate(advertisements)Inserate(advertisements)
Inserate(advertisements)InserateInserate
TrefferTreffer
Geld Auto
TrefferTreffer
Geld Fahrzeug
Fahrzeug
Auto Fahrrad
Thing
Geldkostet
Quittung
5
Inhalt
• Einführung – OWL und OWL-S– Semantischer Dienstabgleich
• OWLS-MX
• Ontologieabgleich
• OWLS-MX 2.0
• Zusammenfassung
6
OWLS-MX Ansatz• Abgleichfilter
– exact– plug-in– subsumes– subsumed_by– nearest_neighbour
• Erst logischer Abgleich; danach Fehlerkorrektur mittels syntaktischer Analyse
• Automated Semantic Web Service Discovery with OWLS-MX, Klusch et. al
Syntaktische Filter werden ebenfalls verwendet
AnfrageAnfrage DienstDienstsubsumed_by
0,85
7
OWLS-MX Ansatz
8
OWLS-MX Nachteile
Gründe für “false positives”
• Granularität
• Kein 1-1-Abgleich von Konzepten
• Nichtabgeglichene Konzepte werden nicht analysiert
• Nur Signaturabgleich
Gründe für “false negatives”
• Granularität
• Ausschließlich Subsumptionsbeziehung
Thing
Lebewesen SatellitenschüsselreinigerElefant
AfrikanischerElefant
Rüsseltier
AsiatischerElefant
Wald-elefant
Deutsche
Saarländer Pfälzer
Menschen
Japaner
AdditionAdditionZahl
Zahl
Zahl
SubtraktionSubtraktionZahl
Zahl
Zahl
NegationNegation
AdditionAdditionZahl
Zahl
Zahl
Zahl Zahl
AutovermietenAutovermieten
AutoverkaufAutoverkaufAuto Geld
Auto Geld
Datum
9
Inhalt
• Einführung – OWL und OWL-S– Semantischer Dienstabgleich
• OWLS-MX
• Ontologieabgleich
• OWLS-MX 2.0
• Zusammenfassung
10
Ontologieabgleich
neu
• Heterogenität von Ontologien– Verschiedene Sprachen, Terminologien,
Modellierungen– “Ontology matching, alignment,
mapping, merging”– An analysis of Ontology Mismatches;
Heterogenity versus Interoperability, Visser et. al
• Systeme– COMA++, Anchor-Prompt,
OLA, ...
• Surveys, Bücher– Ontology Matching
• Contests (OAEI)• ISWC, ESWC• www.ontologymatching.org
neu
11
Ähnlichkeit• Elementebene
– Stringbasiert: Edit distance, N-grams, prefix, suffix z.B. yznisch - zynisch
– Sprachbasiert: Stemmer, Wortart z.B. go - going– Bedingungsbasiert: Datentypvergleich z.B. 9/11 –
11. September– Bedeutungsbasiert: WordNet-Hierarchiedistanz z.B. Auto - Fahrzeug – Spezifische Thesauri: Abkürzungen,
Domänenspezifisches Wissen z.B. ROI• Features of Similarity, Tversky• Simpack: A Generic Java Library for Similiarity
Measures in Ontologies, Bernstein et al.
12
Ähnlichkeit von Konzepten
Fahrzeug
Auto Fahrrad
Thing
Geld
Cabrio Steilheck
Ontology-Based Similarity Between Text Documents on Manifold, Shadbolt et al.
13
Inhalt
• Einführung – OWL und OWL-S– Semantischer Dienstabgleich
• OWLS-MX
• Ontologieabgleich
• OWLS-MX 2.0
• Zusammenfassung
14
Ähnlichkeit von Diensten
• Ähnlichkeitsmetriken für Diensten• Personalisiert, syntaktisch (Cosinus, LOI,
Jensen-Shannon) • Ähnlichkeiten von Konzepten kombinieren
– Bipartite Graphen, “maximum matching“ [Karp 74]– Eingabeabgleich, Ausgabeabgleich, Aggregation
messFiebermessFieberFieberFieberPerson
Krankenhaus
Arzt
HerzFq
Fieber Patient
Krankenhaus
Chirurg
Pyrexia
15
Bipartiter Abgleich sim(R,S)• Ähnlichkeiten größer als einem
Schwellenwert werden berechnet• Maximaler Abgleich wird berechnet• Abgleichwert wird berechnet als
Abgleichergebnis / Anzahl abgeglichener Kanten (2,6 / 3 = 0,87)
Person
Patient
Krankenhaus
Krankenhaus
Arzt Chirurg
1,0
0,9
0,7Person
Patient
Krankenhaus
Krankenhaus
Arzt Chirurg
1,0
0,9
0,7
0,8
0,6
• Ausgabekonzepten werden auch dementsprechend abgeglichen
• Beide Ergebnisse sind aggregiert: result = ¢ inputresult + ¢
outputresult + = 1 (z.B. 0,5 ¢ 0,87 + 0,5 ¢
0.9 = 0,8895)HerzFq
Pyrexia0.9
0,6
Fieber
HerzFq
Pyrexia0,9
Fieber
16
Bipartiter Abgleich degree(R,S)• Die terminologischen Beziehungen
zwischen den Eingabekonzepten werden berechnet
• Maximaler Abgleich wird berechnet (equal > LSC > subsumes)
• Abgleichwert ist die minimale Kantenwert wenn alle grüne Kanten abgeglichen sind. (Ausnahme bei partiellem Abgleich)
Person
Patient
Hospital
Hospital
Doctor Surgeon
equal
LSC
LSCPerson
Patient
Hospital
Hospital
Doctor Surgeon
equal
LSC
LSC
LSC
• Ausgabekonzepten werden dementsprechend abgeglichen
• Beide Ergebnisse sind aggregiert:result = min(resin, resout) (z.B. min(LSC, equal) = LSC)
HeartFq
Pyrexiaequal
Fever
HeartFq
Pyrexiaequal
Fever
17
Partieller Abgleich
• Wähle 2 [0,1]• Matchmaker toleriert einen Nichtabgleich von
maximal der Konzepte • Die Gruppenähnlichkeit von den nicht
abgeglichenen Konzepten zu den abgeglichenen Konzepten ist das Abgleichergebnis
• Wenn = 1, dann purer logischer Abgleich für die logischen Filter
• Wenn = 0, dann kein logischer Abgleich, nur hybride Ähnlichkeiten werden verwendet
18
Hybrider Abgleich
• Ähnlichkeitsmetriken sind:– Syntaktische Ähnlichkeit– Eigenschaftsbasierte Ähnlichkeit– Ontologie-Distanz– WordNet-Ähnlichkeit– …
19
OWLS-MX 2.0 Screenshot
20
OWLS-MX 2.0
Gegeben: Ontology O, Anfrage R, Menge von Diensten D, , , Matchermenge M
Gesucht: relevante Dienste 2 D
• 8 S 2 D berechne relaxierte degree(r,s)
• Für hybride Filter berechne sim(r,s)
• Ordne die Ergebnisse nach Grad und Wert
21
Inhalt
• Einführung – OWL und OWL-S– Semantischer Dienstabgleich
• OWLS-MX
• Ontologieabgleich
• OWLS-MX 2.0
• Zusammenfassung
22
Relevante Arbeiten• Dienstselektierung:
– OWL-S/UDDI Matchmaker (CMU)– OWLSM (TU Berlin)– Automatic Composition and Selection of Semantic Web Services,
Springer LNCS
• Ontologieabgleich:– COMA++ (U Leipzig)– Anchor/PROMPT (Stanford)– OLA (INRIA Rhône-Alpes/Université de Montreal)– Ontology Matching, Euzenat, Shvaiko– A Survey of Schema-based Matching Approaches, Euzenat, Shvaiko– Semantic Integration: A Survey of Ontology-based Approaches,
Noy– Ontology Mapping: The State of the Art, Kalfoglou, Schorlemmer
23
Zusammenfassung
• Partielle Abgleiche werden erlaubt um die Ausbeute zu erhöhen
• Hybride Filter tendieren dazu, die Genauigkeit zu erhöhen
Bessere Genauigkeit und Ausbeute Gute Basis für Personalisierung nach
Präferenzen, vergangenen Aktionen
Kompliziert Semantische Kombination von Ähnlichkeitsmetriken
241
FIN