30
APA – Online Manager IT-Subsidiary of a News Agency as a Profit Center Manfred Mitterholzer Rudolf Horvath

APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

Embed Size (px)

Citation preview

Page 1: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

APA – Online Manager

IT-Subsidiary of a News Agency as a Profit Center

Manfred Mitterholzer Rudolf Horvath

Page 2: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

Das Unternehmen

APA – Gruppe240 Mitarbeiter34,6 Mio Umsatz

APA - IT100 % Tochter der Austria Presse Agentur seit 1.1.200255 MitarbeiterUmsatz EUR 9,5 Mio

Page 3: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

GF III - Informationstechnologie

Page 4: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

Dienstleistungen für externe Kunden

Applikationsentwicklung und Portallösungen (CMS)

Outsourcing Produkte

Redaktion-Systeme RadioTV-Stationen

Datenbank-Hosting

AOM – APA OnlineManager

Page 5: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

Applikationsentwicklung, Portallösungen (CMS)

•Trennung von Content und Darstellung•Workflow und Berechtigungssystem•Plattformunabhängigkeit •Beliebige Skalierbarkeit

Redaktions-Clientfür Erstellung von Inhalten

Publikations-Enginepubliziert freigegebene Inhalte

Presentation-Enginestellt die Inhalte mittels Templates dar

Page 6: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

Outsourcing ProdukteAll inklusiv Betreuung Server, Desktop7 x 24h APA-IT Techniker vor OrtSpezialist für große DatenmengenBewältigung rasch auftretender Spitzen (Wahlen, 9/11, EM/WM)Breitbandiges Internet 2 x 1 Gbit

USV, Dieselaggregat, Klima redundant

50% aller ÖWA-Visits bei APA-IT

Zufriedenen Kunden aus Medien, Politik und Wirtschaft

Spiegelung in Ausfall-RZ seit 3/2005

Page 7: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

Sendungs-Planung, Abwicklung•Alle ZiBs, TV-Magazine, Landesstudios•Alle Hörfunk-Nachrichten, Journale•2.500 Anwender in ORF-Redaktionen•83.000 Sendungen pro Jahr

APA-IT Video Server•Aufnahme,Speicherung eines TV-Signals•Videoschnitt am Redakteursarbeitsplatz•Parallele Aufnahmen und Videoschnitt

Page 8: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

Der APA DatenbankhostGrößter Datenbank-Host in Österreich8.000 registrierte Benutzer1.600 zur Spitzenzeit online50 Millionen Dokumente

Täglich 60.000 neue Dokumente in Real Time20 Mio. Suchen pro Jahr40 Mio. Dokumentenabrufe

Page 9: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

Der APA Datenbankhost250+ multimediale Quellen:

Text, Bilder, Business Grafiken, Audios, VideosZeitungen, Agenturen, Business Info, TermineAlle österr. Tageszeitungen seit 1990Alle wichtigen österr. Wochen-, MonatszeitungenDie großen deutschen Tages- u. WochenzeitungenHistorisches Archiv (Scan,OCR) APA-Basisienstseit 1955

Page 10: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

Der APA-OnlineManager (AOM)Zugriff auf APA-Datenbankhost und Onlinedienstleistungen der APA

Windows-ClientWebbasierte HTML-ApplikationPDA-VersionSMS-Versand der Titel

Kombinierte Volltextrecherche in Archiv und hochaktuellen Real Time-Nachrichten

Page 11: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

APA-OnlineManager internationalAOM eine rein österreichische Entwicklung erweckt internationales InteresseSeit Dezember 2004 Im ASP Betrieb auf Servern in Wien für dpa – Deutsche Presse Agentur14 Mio Dokumente, alle dpa Meldungen seit 1982700 dpa-user in allen deutschen Großstädten und Korrespondenten in der ganzen Welt haben ZugriffGespräche über ähnliche Lösungen mit skandinavischen Zeitungsverlagen und Nachrichtenagenturen

Page 12: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

AOM – InnovationsprojektDie Ausgangssituation

Steigende Anzahl von Dokumenten und Quellen am APA-DatenbankhostZunehmende Schwierigkeiten für die Benutzer relevante Dokumente zu findenLange Antwortenzeiten bei umfangreichen RecherchenSuchmaschinen im Internet geben Standards hinsichtlich der Response Time vorNeuere Methoden aus dem Bereich Wissensmanagement praktikabel umsetzbar

Page 13: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

AOM – InnovationsprojektDie Umsetzung

Phase 1: APA-IT PowerSearchBeschleunigtes RetrievalLeistungsfähiger Unterbau für Phase 2

Phase 2: Angewandtes Knowledge ManagementZiel ist effektive Unterstützung der User um zu relevanteren Suchergebnissen zu gelangenTopic ClusteringSimilarity SearchVisualisierung von SuchergebnissenAkzeptable Antwortzeiten erforderlich

Page 14: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

APA-IT PowerSearch - MotivationSchnelles Fulltext-Retrieval erforderlich für:

Umfangreiche RecherchenGeplante neue AOM-Funktionen

„Altes“ Volltextsystem zu langsam für AnforderungenIm Test keine klaren Vorteile der Mitbewerbsprodukte unter APA-Rahmenbedingungen

52 Mio. Quellen, 250+ Quellen, 1500 gleichzeitige UserEigenentwicklung einer Volltext-Engine durch APA-IT in 2003APA-IT PowerSearch integriert in AOM-Version 5.0

In Produktion seit September 2004

Page 15: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

PowerSearch – Key FeaturesSchnellere, verbesserte Recherche

Typische Suche in 52 Mio. Dok. dauert nur wenige Sek.Schneller Dokumentenabruf und schnelle SortierungKnowledge Management-Funktionen direkt im KernelUnveränderte Suchoptionen für die Benutzer

Boolesche VerknüpfungenWildcardsSucheinschränkung auf Dokumentenfelder

Unscharfe Suche (Gaddafi, Gadaffi, Gadhaffi, …)Alternative Suchsyntax, zusätzliche RetrievaloperatorenHochgradig skalierbar und fehlertolerant, …

Page 16: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

Topic ClusteringIst – Situation für den Benutzer:

Flache Ergebnislisten sind unübersichtlichLangwieriges Blättern liefert nur groben Überblick

Topic ClusteringTeilt ein Suchergebnis in Gruppen von thematisch verwandten DokumentenVergibt aussagekräftige Beschreibungen an Gruppen

Page 17: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

Themen ClusteringVorteile

Im Suchergebnis verborgenes Wissen wird unmittelbar sichtbarRelevante Themengruppen direkt navigierbar

Cluster werden „On The Fly“ aus den VolltextenerrechnetKein zugrunde liegendes KategorienschemaGroße Cluster in sich wiederum gruppierbarEigenentwicklung der APA-ITDurchsatz ca. 1.000 Dokumente pro Sekunde

Page 18: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

Clustering - BeispielSuche nach „WWF“ in APA-Meldungen seit 1986 bringt 2986 Treffer

Page 19: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

Clustering - ListeIdentifizierte Themen:

Page 20: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

Clustering: APA+OTS 4.4. – 7.4.

Page 21: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

Similarity SearchFindet Dokumente, die zum aktuellen Dokument

thematisch ähnlich sindweiterführende Informationen enthalten

Keine Formulierung von Suchbegriffen nötig

Die Suche ist das aktuelle Dokument selbst

Trefferliste nach Relevanz sortiert

Relevante Wörter des Basisdokuments in den Treffern hervorgehoben

Optimiertes TF / IDF – Verfahren als technische Grundlage, direkt in APA-IT PowerSearch integriert

Page 22: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder
Page 23: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder
Page 24: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

Suchergebnis Visualisierung„Ein Bild sagt mehr als 1000 Worte“

Zusätzliche Navigation in Suchergebnissen

Mögliche Freiheitsgrade der Darstellung sind:Ähnlichkeit von DokumentenÄhnlichkeit von Themen ClusternZeitachseWorthäufigkeitenQuellen

Page 25: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

ZeitreihenSuche nach „Internet“ im APA-Basisdienst seit 1986

Page 26: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

Visualisierung Hügel

Page 27: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

Visualisierung Spinne

Page 28: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

Visualisierung 3D-Hügel

Page 29: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

QuellenchartsSuchbegriff „Harmonisierung“ Suchbegriff „Forschung“

Page 30: APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte Suchoptionen für die Benutzer Boolesche Verknüpfungen Wildcards Sucheinschränkung auf Dokumentenfelder

APA-OnlineManager - ZeitplanAOM 5.0

Schnelle Recherche über großen DatenbestandIn Produktion seit September 2004

AOM 6.0Themen Clustering, Ähnlichkeitssuche, Visualisierung, neues GUIUmsetzung der KM-Funktionen technisch fertigAOM-Windows-Client in FertigstellungFreigabe erfolgt Mai 2005