APA – Online Manager · Knowledge Management-Funktionen direkt im Kernel Unveränderte...

Preview:

Citation preview

APA – Online Manager

IT-Subsidiary of a News Agency as a Profit Center

Manfred Mitterholzer Rudolf Horvath

Das Unternehmen

APA – Gruppe240 Mitarbeiter34,6 Mio Umsatz

APA - IT100 % Tochter der Austria Presse Agentur seit 1.1.200255 MitarbeiterUmsatz EUR 9,5 Mio

GF III - Informationstechnologie

Dienstleistungen für externe Kunden

Applikationsentwicklung und Portallösungen (CMS)

Outsourcing Produkte

Redaktion-Systeme RadioTV-Stationen

Datenbank-Hosting

AOM – APA OnlineManager

Applikationsentwicklung, Portallösungen (CMS)

•Trennung von Content und Darstellung•Workflow und Berechtigungssystem•Plattformunabhängigkeit •Beliebige Skalierbarkeit

Redaktions-Clientfür Erstellung von Inhalten

Publikations-Enginepubliziert freigegebene Inhalte

Presentation-Enginestellt die Inhalte mittels Templates dar

Outsourcing ProdukteAll inklusiv Betreuung Server, Desktop7 x 24h APA-IT Techniker vor OrtSpezialist für große DatenmengenBewältigung rasch auftretender Spitzen (Wahlen, 9/11, EM/WM)Breitbandiges Internet 2 x 1 Gbit

USV, Dieselaggregat, Klima redundant

50% aller ÖWA-Visits bei APA-IT

Zufriedenen Kunden aus Medien, Politik und Wirtschaft

Spiegelung in Ausfall-RZ seit 3/2005

Sendungs-Planung, Abwicklung•Alle ZiBs, TV-Magazine, Landesstudios•Alle Hörfunk-Nachrichten, Journale•2.500 Anwender in ORF-Redaktionen•83.000 Sendungen pro Jahr

APA-IT Video Server•Aufnahme,Speicherung eines TV-Signals•Videoschnitt am Redakteursarbeitsplatz•Parallele Aufnahmen und Videoschnitt

Der APA DatenbankhostGrößter Datenbank-Host in Österreich8.000 registrierte Benutzer1.600 zur Spitzenzeit online50 Millionen Dokumente

Täglich 60.000 neue Dokumente in Real Time20 Mio. Suchen pro Jahr40 Mio. Dokumentenabrufe

Der APA Datenbankhost250+ multimediale Quellen:

Text, Bilder, Business Grafiken, Audios, VideosZeitungen, Agenturen, Business Info, TermineAlle österr. Tageszeitungen seit 1990Alle wichtigen österr. Wochen-, MonatszeitungenDie großen deutschen Tages- u. WochenzeitungenHistorisches Archiv (Scan,OCR) APA-Basisienstseit 1955

Der APA-OnlineManager (AOM)Zugriff auf APA-Datenbankhost und Onlinedienstleistungen der APA

Windows-ClientWebbasierte HTML-ApplikationPDA-VersionSMS-Versand der Titel

Kombinierte Volltextrecherche in Archiv und hochaktuellen Real Time-Nachrichten

APA-OnlineManager internationalAOM eine rein österreichische Entwicklung erweckt internationales InteresseSeit Dezember 2004 Im ASP Betrieb auf Servern in Wien für dpa – Deutsche Presse Agentur14 Mio Dokumente, alle dpa Meldungen seit 1982700 dpa-user in allen deutschen Großstädten und Korrespondenten in der ganzen Welt haben ZugriffGespräche über ähnliche Lösungen mit skandinavischen Zeitungsverlagen und Nachrichtenagenturen

AOM – InnovationsprojektDie Ausgangssituation

Steigende Anzahl von Dokumenten und Quellen am APA-DatenbankhostZunehmende Schwierigkeiten für die Benutzer relevante Dokumente zu findenLange Antwortenzeiten bei umfangreichen RecherchenSuchmaschinen im Internet geben Standards hinsichtlich der Response Time vorNeuere Methoden aus dem Bereich Wissensmanagement praktikabel umsetzbar

AOM – InnovationsprojektDie Umsetzung

Phase 1: APA-IT PowerSearchBeschleunigtes RetrievalLeistungsfähiger Unterbau für Phase 2

Phase 2: Angewandtes Knowledge ManagementZiel ist effektive Unterstützung der User um zu relevanteren Suchergebnissen zu gelangenTopic ClusteringSimilarity SearchVisualisierung von SuchergebnissenAkzeptable Antwortzeiten erforderlich

APA-IT PowerSearch - MotivationSchnelles Fulltext-Retrieval erforderlich für:

Umfangreiche RecherchenGeplante neue AOM-Funktionen

„Altes“ Volltextsystem zu langsam für AnforderungenIm Test keine klaren Vorteile der Mitbewerbsprodukte unter APA-Rahmenbedingungen

52 Mio. Quellen, 250+ Quellen, 1500 gleichzeitige UserEigenentwicklung einer Volltext-Engine durch APA-IT in 2003APA-IT PowerSearch integriert in AOM-Version 5.0

In Produktion seit September 2004

PowerSearch – Key FeaturesSchnellere, verbesserte Recherche

Typische Suche in 52 Mio. Dok. dauert nur wenige Sek.Schneller Dokumentenabruf und schnelle SortierungKnowledge Management-Funktionen direkt im KernelUnveränderte Suchoptionen für die Benutzer

Boolesche VerknüpfungenWildcardsSucheinschränkung auf Dokumentenfelder

Unscharfe Suche (Gaddafi, Gadaffi, Gadhaffi, …)Alternative Suchsyntax, zusätzliche RetrievaloperatorenHochgradig skalierbar und fehlertolerant, …

Topic ClusteringIst – Situation für den Benutzer:

Flache Ergebnislisten sind unübersichtlichLangwieriges Blättern liefert nur groben Überblick

Topic ClusteringTeilt ein Suchergebnis in Gruppen von thematisch verwandten DokumentenVergibt aussagekräftige Beschreibungen an Gruppen

Themen ClusteringVorteile

Im Suchergebnis verborgenes Wissen wird unmittelbar sichtbarRelevante Themengruppen direkt navigierbar

Cluster werden „On The Fly“ aus den VolltextenerrechnetKein zugrunde liegendes KategorienschemaGroße Cluster in sich wiederum gruppierbarEigenentwicklung der APA-ITDurchsatz ca. 1.000 Dokumente pro Sekunde

Clustering - BeispielSuche nach „WWF“ in APA-Meldungen seit 1986 bringt 2986 Treffer

Clustering - ListeIdentifizierte Themen:

Clustering: APA+OTS 4.4. – 7.4.

Similarity SearchFindet Dokumente, die zum aktuellen Dokument

thematisch ähnlich sindweiterführende Informationen enthalten

Keine Formulierung von Suchbegriffen nötig

Die Suche ist das aktuelle Dokument selbst

Trefferliste nach Relevanz sortiert

Relevante Wörter des Basisdokuments in den Treffern hervorgehoben

Optimiertes TF / IDF – Verfahren als technische Grundlage, direkt in APA-IT PowerSearch integriert

Suchergebnis Visualisierung„Ein Bild sagt mehr als 1000 Worte“

Zusätzliche Navigation in Suchergebnissen

Mögliche Freiheitsgrade der Darstellung sind:Ähnlichkeit von DokumentenÄhnlichkeit von Themen ClusternZeitachseWorthäufigkeitenQuellen

ZeitreihenSuche nach „Internet“ im APA-Basisdienst seit 1986

Visualisierung Hügel

Visualisierung Spinne

Visualisierung 3D-Hügel

QuellenchartsSuchbegriff „Harmonisierung“ Suchbegriff „Forschung“

APA-OnlineManager - ZeitplanAOM 5.0

Schnelle Recherche über großen DatenbestandIn Produktion seit September 2004

AOM 6.0Themen Clustering, Ähnlichkeitssuche, Visualisierung, neues GUIUmsetzung der KM-Funktionen technisch fertigAOM-Windows-Client in FertigstellungFreigabe erfolgt Mai 2005

Recommended