Upload
sikke-gaubatz
View
107
Download
1
Embed Size (px)
Citation preview
1
Semiautomatische Medienresonanz- und Diffusions-Analyse
Waltraud Wiedermann, GF APA-DeFacto und APA-MediaWatch
Michael Granitzer, Know-Center
2
3
4
Kurzzeit-Diffusionsanalyse:
„APA-Meldung: wer schreibt wann ab?“
Such-Fokus: typische Duplikatssuche
Die APA-Exklusivmeldung um 16.43 Uhr wurde vom Kurier um 19.12 Uhr in der Onlineausgabe zu
94% übernommen.
5
Langzeit-Diffusionsanalyse:
„APA-Meldung: wer übernimmt wie stark welche Inhalte?“
Such-Fokus: typische Zitatssuche
Die APA-Meldung vom 17.09. wurde in der OÖ Rundschau am 18.09. in
drei Absätzen zu 97% übernommen.
6
Themen-Drift:
„APA-Meldung: wie entwickeln sich die Inhalte der Meldung?“
7
Wien, Freitag, 2. Juni, 9
.00
Uhr
8
Wien, Freitag, 2. Juni, 9
.00
Uhr
9
Wien, Freitag, 2. Juni, 10.45 Uhr
10
Wien, Freitag, 2. Juni, 10.54 Uhr
11
Berlin, Samstag, 3. Juni, 10.54 Uhr
Blog: „Life on the road“, Donnerstag, 8.Juni
Sys-Con, Spanien,
12
Yonhap News, 5. Juni, 10.28 Uhr
13
ThaiPR, 5. Juni, 9.33 Uhr
14
??? www.ixbt.com ??
15
Projekt N-Trace
Nachrichten-Diffusionsanalyse
Identifikation von Plagiaten
Identifikation von exakt gleichen Textteilen
300.000 Artikel in 30 Tagen (ohne externe Quellen)
30 Millionen Gesamt
Ansatz
Einschränken der Artikelmenge durch zeitlichen Ausschluss (z.B. 30 Tage)
Berechnen von Hash-Werten für Artikel (Shingling lt. Broder et. al.)
300.000 Artikel in Memory
Vergleichen der Hash-Werte: Übereinstimmung möglicherweise ähnliche Inhalte
Detailanalyse der verbleibenden Kandidaten
Reihenfolgeabhängige Satz-Levenstheinmetrik
Reihenfolgeunabhängiges Chunking
16
N-TraceÄhnlichkeitskandidaten über Hashing
17
MediaMatrix
Zusammenfassung der Ergebnisse
Direkte Integration in Office
Online Verfügbarkeit über APA Plattform
18
Projekt N-Trace
19
Projekt X-TrendZielsetzung & Ablauf
Semiautomatische Unterstützung der Medienresonanzanalyse
Prototypische Anwendung von Techniken der Wissenserschließung
Als Unterstützung der APA Mitarbeiter, nicht als Ersatz
Wahrung der hohen Qualitätsstandards durch menschliche Kontrolle
Vermeidung von Medienbrüchen
Ablauf im Projekt:
Ablaufanalyse
Erarbeitung von Ansatzpunkten zur Integration von
Wissenserschließungstechniken
Prototypische Umsetzung und Test
20
Projekt X-TrendAblauf einer Medienresonanzanalyse
1. Definition von Nennungs- und Wertungsbegriffen
2. Suche nach Nennungen über die APA PowerSearch
3. Import der gefundenen Artikel
4. Identifikation der Sätze mit entsprechenden Wertungsbegriffen
5. Manuelle Satzbewertung
6. Auswertung und manuelle Berichterstellung
Prototypische Umsetzung einer Service-orientierten Architektur
Entwicklung eines dementsprechenden Client
21
Projekt X-TrendService-orientierte Architektur
Erweiterung der Thesaurusverwaltung
Verwaltung von Suchen und Projekten
Analyse der APA PowerSearch Suchergebnisse
Extraktion von Personen-, Orts und Zeitbezügen
Extraktion von Schlüsselwörtern
Filtern auf Basis der bereitgestellten/extrahierten Metadaten
Artikel Warenkorb und Vergleich von Suchen
Fuzzy Analyse von Nennungen
Automatisches Vorschlagen von Wertungsbegriffen
Automatisches Vorschlagen von weiterführenden Suchbegriffen für Nennungen
22
Projekt X-Trend / X-Trend Client
23
Projekt X-Trend / X-Trend Client
24
Vielen Dank für Ihre AufmerksamkeitWaltraud Wiedermann ([email protected])
Michael Granitzer ([email protected])