1 Semiautomatische Medienresonanz- und Diffusions-Analyse Waltraud Wiedermann, GF APA-DeFacto und...

Preview:

Citation preview

1

Semiautomatische Medienresonanz- und Diffusions-Analyse

Waltraud Wiedermann, GF APA-DeFacto und APA-MediaWatch

Michael Granitzer, Know-Center

2

3

4

Kurzzeit-Diffusionsanalyse:

„APA-Meldung: wer schreibt wann ab?“

Such-Fokus: typische Duplikatssuche

Die APA-Exklusivmeldung um 16.43 Uhr wurde vom Kurier um 19.12 Uhr in der Onlineausgabe zu

94% übernommen.

5

Langzeit-Diffusionsanalyse:

„APA-Meldung: wer übernimmt wie stark welche Inhalte?“

Such-Fokus: typische Zitatssuche

Die APA-Meldung vom 17.09. wurde in der OÖ Rundschau am 18.09. in

drei Absätzen zu 97% übernommen.

6

Themen-Drift:

„APA-Meldung: wie entwickeln sich die Inhalte der Meldung?“

7

Wien, Freitag, 2. Juni, 9

.00

Uhr

8

Wien, Freitag, 2. Juni, 9

.00

Uhr

9

Wien, Freitag, 2. Juni, 10.45 Uhr

10

Wien, Freitag, 2. Juni, 10.54 Uhr

11

Berlin, Samstag, 3. Juni, 10.54 Uhr

Blog: „Life on the road“, Donnerstag, 8.Juni

Sys-Con, Spanien,

12

Yonhap News, 5. Juni, 10.28 Uhr

13

ThaiPR, 5. Juni, 9.33 Uhr

14

??? www.ixbt.com ??

15

Projekt N-Trace

Nachrichten-Diffusionsanalyse

Identifikation von Plagiaten

Identifikation von exakt gleichen Textteilen

300.000 Artikel in 30 Tagen (ohne externe Quellen)

30 Millionen Gesamt

Ansatz

Einschränken der Artikelmenge durch zeitlichen Ausschluss (z.B. 30 Tage)

Berechnen von Hash-Werten für Artikel (Shingling lt. Broder et. al.)

300.000 Artikel in Memory

Vergleichen der Hash-Werte: Übereinstimmung möglicherweise ähnliche Inhalte

Detailanalyse der verbleibenden Kandidaten

Reihenfolgeabhängige Satz-Levenstheinmetrik

Reihenfolgeunabhängiges Chunking

16

N-TraceÄhnlichkeitskandidaten über Hashing

17

MediaMatrix

Zusammenfassung der Ergebnisse

Direkte Integration in Office

Online Verfügbarkeit über APA Plattform

18

Projekt N-Trace

19

Projekt X-TrendZielsetzung & Ablauf

Semiautomatische Unterstützung der Medienresonanzanalyse

Prototypische Anwendung von Techniken der Wissenserschließung

Als Unterstützung der APA Mitarbeiter, nicht als Ersatz

Wahrung der hohen Qualitätsstandards durch menschliche Kontrolle

Vermeidung von Medienbrüchen

Ablauf im Projekt:

Ablaufanalyse

Erarbeitung von Ansatzpunkten zur Integration von

Wissenserschließungstechniken

Prototypische Umsetzung und Test

20

Projekt X-TrendAblauf einer Medienresonanzanalyse

1. Definition von Nennungs- und Wertungsbegriffen

2. Suche nach Nennungen über die APA PowerSearch

3. Import der gefundenen Artikel

4. Identifikation der Sätze mit entsprechenden Wertungsbegriffen

5. Manuelle Satzbewertung

6. Auswertung und manuelle Berichterstellung

Prototypische Umsetzung einer Service-orientierten Architektur

Entwicklung eines dementsprechenden Client

21

Projekt X-TrendService-orientierte Architektur

Erweiterung der Thesaurusverwaltung

Verwaltung von Suchen und Projekten

Analyse der APA PowerSearch Suchergebnisse

Extraktion von Personen-, Orts und Zeitbezügen

Extraktion von Schlüsselwörtern

Filtern auf Basis der bereitgestellten/extrahierten Metadaten

Artikel Warenkorb und Vergleich von Suchen

Fuzzy Analyse von Nennungen

Automatisches Vorschlagen von Wertungsbegriffen

Automatisches Vorschlagen von weiterführenden Suchbegriffen für Nennungen

22

Projekt X-Trend / X-Trend Client

23

Projekt X-Trend / X-Trend Client

24

Vielen Dank für Ihre AufmerksamkeitWaltraud Wiedermann (waltraud.wiedermann@apa.at)

Michael Granitzer (mgrani@know-center.at)

Recommended