15
DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie iCMC, BLAST & BLAZE: Entwicklungsprojekte der neofonie im Rahmen von <xmlcity:berlin> 23.04.2003@Statusmeeting im Rahmen der Initiative <xmlcity:berlin> präsentiert von Helmut Oertel [email protected]

DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie iCMC, BLAST & BLAZE: Entwicklungsprojekte der neofonie im Rahmen von 23.04.2003@Statusmeeting

Embed Size (px)

Citation preview

Page 1: DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie iCMC, BLAST & BLAZE: Entwicklungsprojekte der neofonie im Rahmen von 23.04.2003@Statusmeeting

DER SPEZIALIST FÜR IHREINFORMATIONSARCHITEKTUR

neofonie

iCMC, BLAST & BLAZE: Entwicklungsprojekte

der neofonie im Rahmen von <xmlcity:berlin>

23.04.2003@Statusmeeting

im Rahmen der Initiative <xmlcity:berlin>präsentiert von Helmut Oertel

[email protected]

Page 2: DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie iCMC, BLAST & BLAZE: Entwicklungsprojekte der neofonie im Rahmen von 23.04.2003@Statusmeeting

2neofonie Technologieentwicklung und Informationsmanagement GmbH

neofonie - Leistungsspektrum

Java C++ HTML XML UN*X

Informations-ArchitektWeb Wap VPN EAI Data Distribution

&

Information Gathering/RetrievalPeer-to-PeerC++-ServletsXML

ForschungPortaleOnline-DiensteKnowledge Management

Entwicklung

Software

Information Gathering/Retrieval(Content Management)Standard-Komponenten

Dienstleistung Produkteherstellerunabhängigbedarfsgerechtkompetent

BeratungEntwurf & DesignMaßgeschneiderte EntwicklungIntegrationWartung, Pflege & Betrieb

Page 3: DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie iCMC, BLAST & BLAZE: Entwicklungsprojekte der neofonie im Rahmen von 23.04.2003@Statusmeeting

3neofonie Technologieentwicklung und Informationsmanagement GmbH

neofonie – Forschung & Entwicklung

neofonie kombiniert… Kompetenz- und Entwicklungsvorsprung durch Forschung, finanziert aus dem operativen

Geschäft sowie durch regionale und europäische Förderprogramme Know-How und Erfahrung aus der Durchführung kommerzieller Großprojekte Full Service für den Kunden: Beratung, Entwurf, Entwicklung, Installation, Wartung und

Weiterentwicklung Forschung

neofonie 1998 aus Technischer Universität Berlin ausgegründet Untersuchung neuester Technologien und Softwarearchitekturen. Use Cases und

Praxistauglichkeit. Mehrere erfolgreich durchgeführte Forschungsprojekte. Themen: spezialisierte Internet-

Suchmaschinen, Personalisierung, Cross-Seller-Shopping. <xmlcity:berlin> (BMBF): XML Technologie, Content Management, Information

Retrieval Science 2 Science: Peer 2 Peer, Wissensmanagement Fokus 2003/2004: Information Retrieval, EAI und P2P basiertes, Workflow-unterstütztes

Knowledge Management Beratung und Entwicklung

Basierend auf Forschungsergebnissen und professionellem Know-How Systemintegration basierend auf eigenen Software-Komponenten und Best-Of-Breed

Produkten Dritter Von kleinen Lösungen bis hin zu Portalen

sowie Produkte Lösungsfamilien neofonie search und neofonie content Basierend auf Grundlagenentwicklung im Rahmen von Forschungsprojekten

Page 4: DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie iCMC, BLAST & BLAZE: Entwicklungsprojekte der neofonie im Rahmen von 23.04.2003@Statusmeeting

4neofonie Technologieentwicklung und Informationsmanagement GmbH

<xmlcity:berlin> - Entwicklungsziele

XML XML überall: Konfiguration, Dokument-Repräsentation, Schnittstellen XML Sprachen und Protokolle: XML Schema, XSLT, XPath, XLinking, SOAP XML auch für große Installationen: Verteilte Datenhaltung

<xmlcity:berlin/iCMC> Prototypische Komponentenentwicklung für Lösungsfamilie neofonie content Handhabbarkeit: Strikte Trennug Design und Content kontrolliertes WYSIWIG Betrieb: lokale Installation ASP Service Funktionalität: Integration von Recherchewerkzeugen

<xmlcity:berlin/BLAST&BLAZE> Prototypische Komponentenentwicklung für Lösungsfamilie neofonie search Integrierbarkeit: Unterstützung von SOAP, Nutzer- und Rechtemanagement etc. Funktion: Volltextsuche XML Repository Datenbank-Eigenschaften Skalierbarkeit: kleine Installation: Lokaler Index große Installation: verteilter

Index Ergebnis

Im Bereich Suche und Content Management skalierbare, modulare, flexible, XML-basierte Softwaresysteme mit offenen Schnittstellen schaffen.

Verbreiterung der Menge unterstützter Anwendungsszenarien Leichte Integrierbarkeit zum Nutzen der Kunden

Page 5: DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie iCMC, BLAST & BLAZE: Entwicklungsprojekte der neofonie im Rahmen von 23.04.2003@Statusmeeting

5neofonie Technologieentwicklung und Informationsmanagement GmbH

neofonie content

Lösungsfamilie neofonie content: Content-Integration (:delivery), Redaktionssystem (:editor), Content-Extraktion (:extractor) und weitere

Content-Integration Integration (ggf. on-the-fly), Transformation und Präsentation von

Inhalten über elegante XML-Schnittstellen. Abstrahiert vom Zugriff auf Datenquellen, dabei verwendeten

Transport-protokollen (z.B. File, HTTP, JDBC, SOAP, CORBA etc.) und den Quellformaten der Inhalte.

Implementiert mehrstufige Caching-Verfahren auf Datenströmen, geladenen Inhalten, generierten Seitensegmenten und kompletten Webseiten und stellt damit maximale Performanz sicher.

Redaktionssystem Strikte Trennung von Inhalt (XML) und Design (insb. HTML). Mehrdimensionale Kategorisierung von Inhalten inkl. Multibranding. Generierung von Web-basierten Content Entry Formularen aus

XML Schemata Multibranding, Rollenbasiertes Zugriffsmanagement, Preview-

Funktionalität u.v.m.

Page 6: DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie iCMC, BLAST & BLAZE: Entwicklungsprojekte der neofonie im Rahmen von 23.04.2003@Statusmeeting

6neofonie Technologieentwicklung und Informationsmanagement GmbH

<xmlcity:berlin/iCMC> - Entwicklungsziele

Das System ist bisher nur für große Redaktionen und Installationen geeignet, der Einführungs- und Betriebsaufwand ist zu hoch.

Prototypische Komponentenentwicklung zur … Realisierung eines Redaktionsinterfaces für kontrolliertes

Wysiwig, dadurch einsetzbar auch für einfache Unternehmens-Sites bei geringem Lernaufwand

Erlaubte Formatierungs-Aktionen einstellbar pro Inhaltstyp Kontrollierbare Formatierungen (Styles) pro Inhaltstyp

Datenhaltung je nach Einsatzszenario Persistenzschicht erlaubt wahlweise Einsatz eines RDBMS, XML-

Repositories oder Dateisystem Bei Einsatz von BLAZE Volltext-Recherche (auch in archivierten

Inhalten) möglich Unterstützung eines konfigurierbaren Workflows bei der

Bearbeitung von Inhalten Bereitstellung als ASP Lösung, dadurch ohne eigenen

Betriebsaufwand einsetzbar, insb. für Verbände, Unternehmens-Gruppen.

Page 7: DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie iCMC, BLAST & BLAZE: Entwicklungsprojekte der neofonie im Rahmen von 23.04.2003@Statusmeeting

7neofonie Technologieentwicklung und Informationsmanagement GmbH

JSP

Meta-daten

XML

Schema

:editor

RedakteurAdministrator

staging

XML

Endnutzer

JSP

Extern

View

BLAST

View

FILE

View

SQL

View

SOAP

atps.getContentObject("xyz://") XML

HTTP/XML I/O

JDBC

Producer

Extern

HTTP/HTML

View

HTTP:extractor

XML

html

Application Server

Redaktion

:delivery

Adminis-tration Content Templating

staging

Redaktions-interface

Management-funktionen

Kernel

html

Inspector

Administrator

Content Integration und Auslieferung

RDB(Sybase)

ASP - Instanz je Mandant

neofonie content + iCMC

BLAZE

RDB(Sybase)

skalierbares Staging (IP Multicast)

kontr.Wysiwig

konf.Workflow

neofonie

ASP

BLAZE

Page 8: DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie iCMC, BLAST & BLAZE: Entwicklungsprojekte der neofonie im Rahmen von 23.04.2003@Statusmeeting

8neofonie Technologieentwicklung und Informationsmanagement GmbH

<xmlcity:berlin/iCMC> - Use Case »www.dfn.de«

Web Content Management auch für relativ kleine Sites und Redaktionen handhabbar machen

Inhalt und Design müssen nicht strikt getrennt werden: durch bereits gelernte Benutzerführung lassen sich auch komplexe Seiten einfach bearbeiten

Durch Angebot als ASP Lösung kein Betriebs-Know-How nötig

Page 9: DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie iCMC, BLAST & BLAZE: Entwicklungsprojekte der neofonie im Rahmen von 23.04.2003@Statusmeeting

9neofonie Technologieentwicklung und Informationsmanagement GmbH

neofonie search:engine (1)

Lösungsfamilie neofonie search: Information Retrieval Engine (:engine), Robotersystem (:robot), ASP Suchmaschine (:suchexpress), Dienstleistung (:integrate), weitere

:engine (Codename BLAST) mit nativer XML-Unterstützung und zum Patent angemeldeten Such- und Sortierverfahren: Relevanzbewertung berücksichtigt je Dokument textuellen Inhalt, Struktur, Verlinkung sowie optional Qualitätsmaße (z.B. berechnet durch Auswertung des Nutzer-Verhaltens). Gewichtung der Kriterien einstellbar.

Basis ist ein hocheffizient organisierter Volltextindex:hierarchische Felder, parametrische Suche, Kombination von Boolescher und +/- Suche, Mehrfachsortierung, Feld-basierte Gruppierung.

Gute Integrierbarkeit dank Java API, C++ API inkl. Plugin-Mechanismus sowie HTTP/XML basierter Schnittstelle des engine Servers.

Die Präsentationsschicht erlaubt maximale Freiheiten/Individualisierung bei der Vorverarbeitung von Suchanfragen sowie Nachbearbeitung und Darstellung von Suchergebnissen inkl. Highlighting und Generierung von Zusammenfassungen.

Page 10: DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie iCMC, BLAST & BLAZE: Entwicklungsprojekte der neofonie im Rahmen von 23.04.2003@Statusmeeting

10neofonie Technologieentwicklung und Informationsmanagement GmbH

neofonie search:engine (2)

Page 11: DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie iCMC, BLAST & BLAZE: Entwicklungsprojekte der neofonie im Rahmen von 23.04.2003@Statusmeeting

11neofonie Technologieentwicklung und Informationsmanagement GmbH

<xmlcity:berlin/BLAST&BLAZE> - Entwicklungsziele (1)

Dem System fehlen bisher Datenbank-typische Eigenschaften um nicht nur als Grundlage für reine (Volltext-)Suchmaschinen sondern auch als XML Repository in komplexere Anwendungsszenarien eingesetzt werden zu können. Ferner ist Skalierbarkeit bei sehr großen Anfrage- und/oder Datenvolumina nicht gegeben.

Prototypische Komponentenentwicklung zur Verbesserung von…

Integrierbarkeit Unterstützung des XML-Protokolls SOAP zwecks Einbettung in Web-

Service orientierte Softwarearchitekturen Unterstützung von XLinking zur Nutzung der Link-basierten

Relevanzbewertung auch bei XML-Dokumenten Verwaltung von Benutzern und Rechten beim Zugriff auf Indexe

(TBD) Interaktiver Console-Client (TBD)

Skalierbarkeit Nutzbarkeit auch für sehr große Daten- und Anfragevolumina:

IP-Multicast basierte Replikation von Indexen und Änderungen (Delta-Indexe) zum Betrieb auf einem Rechner-Cluster. Lineare Skalierbarkeit bei Replikation und Anfragebearbeitung.

Page 12: DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie iCMC, BLAST & BLAZE: Entwicklungsprojekte der neofonie im Rahmen von 23.04.2003@Statusmeeting

12neofonie Technologieentwicklung und Informationsmanagement GmbH

<xmlcity:berlin/BLAST&BLAZE> - Entwicklungsziele (2) Funktionalität

Unterstützung von XPath zur nachträglichen Selektion innerhalb von Suchergebnissen

Unterstützung von XSLT bei Präsentation von Suchergebnissen Unterstützung von XML Schema zur Validierung von Dokumenten

und Konfiguration des Index Vergleichsoperatoren auf numerischen Feldern Änderbarkeit von numerischen Werten in Dokumenten ohne

Neuindexierung. Einzeln aktivier/deaktivier- und suchbare Subindexe als Grundlage

für Transaktionen Kombination von parametrischer Volltext- und XPath-basierter

Suche Unterstützung der XML-Datenbank-API XUpdate inkl.

Transaktionen (TBD)

Page 13: DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie iCMC, BLAST & BLAZE: Entwicklungsprojekte der neofonie im Rahmen von 23.04.2003@Statusmeeting

13neofonie Technologieentwicklung und Informationsmanagement GmbH

<xmlcity:berlin/BLAST&BLAZE> - Use Case »AOL Kleinanzeigen«

Web-basiertes Kleinanzeigensystem: www.kleinanzeigen.aol.de

Repräsentation von redaktionellen Inhalten als XML-Dokumente. Verwaltung mit neofonie CMS.

Dynamische Generierung der Rubriken-Navigation aus XML-basierter Konfiguration.

Repräsentation von Kleinanzeigen und Nutzerprofilen als XML-Dokumente. Erweiterbares XML-Format, insg. mehr als 50 Rubriken mit spezifischen Teilbäumen.

Vorgänger-System nutzte zur Speicherung von Kleinanzeigen Volltextindex plus relationale Datenbank plus Dateisystem. Jetzt Speicherung ausschließlich im neofonie search:engine basierten XML-Repository.

Betrieb auf einem Cluster von Sun/Solaris Servern. Automatische Replikation der Änderungen ohne Beeinträchtigung der Suche. Möglicher Durchsatz: ~2 Mio. PIs pro Tag bei >50.000 Kleinanzeigen und Profilen

Page 14: DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie iCMC, BLAST & BLAZE: Entwicklungsprojekte der neofonie im Rahmen von 23.04.2003@Statusmeeting

14neofonie Technologieentwicklung und Informationsmanagement GmbH

<xmlcity:berlin/BLAST&BLAZE> - Use Case »Science 2 Science«

Peer 2 Peer basiertes Netzwerk erlaubt Volltextsuche und Austausch wissenschaftlicher Dokumente: http://www/profil/forschung_und_entwicklung/s2s.csp.

XML als universelles Repräsentationsformat für wissenschaftliche Dokumente: Automatische Konvertierung der Ausangsformate (HTML, LaTeX, Word, Postscript, PDF) nach XML.

Einbettung von neofonie search:engine (und :robot) in einen Provider-Peer zur Indexierung und Suche lokaler Dokumente.

Advertisements, Anfragen, Dokumente XML auf API-Level, binär auf Wire-Level.

Interne Nutzung von XSLT in Hubs zur Generierung Query-Node Predicates aus Registrierungen, dann Indexierung mit :engine.

Vortrag zu S2S im Rahmen des <xmlcity:berlin> Kolloqiums am 12.5.2003.

Page 15: DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie iCMC, BLAST & BLAZE: Entwicklungsprojekte der neofonie im Rahmen von 23.04.2003@Statusmeeting

15neofonie Technologieentwicklung und Informationsmanagement GmbH

Fazit

Förderung ermöglicht innovative Forschung im Mittelstand Regionales Expertenwissen Experimenteller Einsatz neuester Konzepte

Durchgängige Verwendung von XML bewährt sich Modulare Komponenten Flexible Einsetzbarkeit Gute Performanz bei geschicktem Einsatz

XML-basierte Produkte schaffen Vorteile im Projektgeschäft Niedrige Integrationskosten Hohe Interoperabilität Beste Skalierbarkeit

neofonie realisiert zukunftsfähige XML basierte Lösungen für Kunden