Upload
kai-eckert
View
522
Download
0
Embed Size (px)
DESCRIPTION
PETRUS-Workshop Deutsche Nationalbibliothek 21. März 2011 Frankfurt
Citation preview
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
PETRUS-WorkshopDeutsche Nationalbibliothek
21. März 2011Frankfurt
Thesaurusvisualisierung mit ICE-Map und SEMTINEL
Kai Eckert
UniversitätsbibliothekUniversität Mannheim
2/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
Forschungsschwerpunkte
● Effizienzsteigerung bei der Thesauruspflege in Bibliotheken.
● Entwicklung von Werkzeugen und Prozessen, um alternative Methoden der Verschlagwortung nutzbar zu machen, ohne die Qualität zu gefährden.
● Durch bestmögliche Automatisierung den Menschen beim Aufbau, der Pflege und der Nutzung eines Thesaurus zu unterstützen.
● Dadurch den Einsatz thesaurusbasierter Suchanwendungen auch in Bereichen ermöglichen, in denen das bislang zu aufwändig ist.
3/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
Visual Datamining
Cholera-Ausbruch 1854.
John Snow entdeckt die Ursache durch Daten-visualisierung.
Motivation für uns: „Ich will das sehen!“
4/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
ICE-Map Visualisierung
● Motivation: „Ich will das sehen!“
● Wie sieht denn der Thesaurus eigentlich aus?
● Welche Begriffe wurden denn zugewiesen?
● Gibt es Bereiche, die hauptsächlich verwendet wurden?
● Wie unterscheiden sich die Zuweisungen, wenn verschiedene Verfahren zum Einsatz kommen (Intellektuell, Automatisch, Tagging, ...)?
5/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
Wo setzen wir an?
6/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
Wie visualisiere ich einen Thesaurus?
7/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
Slice and Dice Algorithmus
8/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
Squarified Layout
9/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
Intuitive Identifikation von problematischen Konzepten
● Sehr hohe Anzahl Zuordnungen:
– Zu allgemein – sollte aufgeteilt werden
– Nicht signifikant
– Fehlerhafte Zuweisungen
● Sehr geringe Anzahl Zuordnungen:
– Zu spezialisiert – sollte mit anderen Begriffen zusammengeführt werden
– Fehlende Synonyme
– Nicht signifikant
– Fehlende Zuweisungen
10/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
Berücksichtigung der Thesaurus-Hierarchie
● Hohe Anzahl Höher in der Hierarchie
– Allgemeinere Begriffe
● Niedrige Anzahl Niedriger in der Hierarchie
– Speziellere Konzepte
11/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
IC Differenz Analyse
D IC c= IC c− IIC c
IC c=−log P c IIC c=−log hypoc1max
Informationsgehalt:● Vorgestellt von Resnik● Basiert auf der Auftrittswahrscheinlichkeit
in der Dokumentenbasis
Intrinsischer Informationsgehalt:● Vorgestellt von Seco, Veale und Hayes● Basiert auf der Anzahl der Unterbegriffe
Alternativ: Referenzset IC● z.B. Manuell vergebene Schlagwörter
Intuitiv: Ein Wert zwischen -1 und 1, der angibt, ob ein Begriff eine auffällige Häufigkeit hat bezüglich seinerPosition im Thesaurus oder im Vergleich zur Referenz.
12/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
ICE-Map Visualisierung
13/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
ICE-Map Visualisierung
14/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
Anwendungen der ICE-Map Analyse
15/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
Begrifflichkeiten
● IC Differenz Analyse: Das statistische Framework zur Berechnung der IC Differenz eines Konzepts.
● ICE-Map Visualisierung: Die Visualierung der IC Differenz Analyse mittels einer Treemap, plus Navigationsunterstützung (Treeview, Rootline)
● SEMTINEL: Die Plattform zur Entwicklung und Nutzung von Analysen und Visualisierungen, also der ganze Rest.
“Sorry für die Verwirrung ;-)”
16/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
SEMTINEL ist...– Eine Plattform zur Entwicklung eigener Anwendungen
● Integration in thesaurusbasierte Suchanwendungen
– Eine erweiterbare Anwendung, für die man eigene Module entwickeln kann
● Analysen, Visualisierungen, Import-/Exportfilter, Editoren, …
– Eine Anwendung zur Entwicklung von Analysen ● Entwicklung zur Laufzeit, noch nicht realisiert.
– Eine Anwendung zum Experimentieren● Kombination von vorhandenen Analysen und
Visualisierungen
– Ein Werkzeug für Thesaurus-Ersteller und -Nutzer● Einsatz der Werkzeuge, die von anderen entwickelt
wurden
17/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
Netbeans Platform
18/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
SEMTINEL Architektur
19/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
SEMTINEL Datenmodell
20/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
Configuration
OutputVisualizations/
AnalysesDatasets
Experiment API
21/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
Konfiguration eines Experiments
Drag and Drop Support.
Erweiterbares Datenmodell.
Mehrfachauswahl möglich.
Register und Register Set.
22/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
Hierarchische Analysen
23/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
Explanation API
● Jede Analyse liefert Informationen:
– Was wird in der Analyse gemacht?
– Auf welchen Analysen baut sie auf?
– Was sind die Eingabewerte?
– Welche Zwischenergebnisse wurden berechnet?
– Welches Ergebnis wird zurückgegeben?
25/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
Group Management
Gruppierung von Experimenten
26/27Kai Eckert
Thesauruspflege mit ICE-Map und Semtinel
ZBW Workshop, Hamburg, 10. März 2011
Vielen Dank.
http://www.semtinel.org
Fragen und Anregungen: