5
BI Fachzeitschrift für Business Intelligence und Data Warehousing Eine Publikation des TDWI Germany e.V. Spektrum Ausgabe 4 u 6. Jahrgang 2011 u D e18,00 A e21,50 SFR 33,25 ISSN 1862-5789 Schwerpunkt Gleicht die ROI-Berechnung der Quadratur des Kreises? Open-Source-BI-Suiten im Vergleich: Pentaho versus JasperSoft Buchbesprechung Prozessintegration mit SAP NetWeaver® PI 7.1 Fachartikel Social Media Analytics: Vielstimmiger Buzz – doch wo ist der Nutzen? Basel II: Best Practice für standardisiertes Reporting So lassen sich aggregierte Abfragen um ein Vielfaches beschleunigen SCHWERPUNKT WIRTSCHAFTLICHKEIT VON BI-LöSUNGEN SONDERDRUCK FüR Open-Source-BI-Suiten im Vergleich: Pentaho versus JasperSoft

Ausgabe 4 D BI Spektrum - Softwarelösungen - IT-Projekte im... · Pentaho und JasperSoft Open-Source-BI- Suiten im Vergleich Open-Source-Produkte sind auf dem Vormarsch – auch

Embed Size (px)

Citation preview

BI Fachzeitschrift für Business Intelligenceund Data WarehousingEine Publikation des TDWI Germany e.V.

Spektrum

Ausgabe 4 u 6. Jahrgang 2011 u D e18,00 A e21,50 SFR 33,25IS

SN 1

862-

5789

SchwerpunktGleicht die ROI-Berechnung der Quadratur des Kreises?

Open-Source-BI-Suiten im Vergleich: Pentaho versus JasperSoft

BuchbesprechungProzessintegration mit SAP NetWeaver® PI 7.1

Fachartikel

Social Media Analytics: Vielstimmiger Buzz – doch wo ist der Nutzen?

Basel II: Best Practice für standardisiertes Reporting

So lassen sich aggregierte Abfragen um ein Vielfaches beschleunigen

Schwerpunkt wirtSchaftlichkeit

von Bi-löSungen

Sonderdruck für

Open-Source-BI-Suiten im Vergleich:

Pentaho versus JasperSoft

Pentaho und JasperSoft

Open-Source-BI- Suiten im Vergleich Open-Source-Produkte sind auf dem Vormarsch – auch in Business Intelligence. Anwender haben heute bereits die Auswahl zwischen mehreren integrierten Suiten, die im Funktionsumfang klassischen Herstellerprodukten kaum nachstehen. Interessenten, die auf den Zug aufspringen wollen, stehen angesichts der erheblichen Dynamik im Markt jedoch vor der Frage: Welches Pferd ist das richti-ge, das heißt, welches Produkt schützt meine Investition am besten? Ist die Lösung wirtschaftlich? Der Artikel vergleicht die beiden ausgereiftesten Suiten von Jasper-Soft und Pentaho im Hinblick auf ihre Zukunftssicherheit nach den Kriterien Produkteigenschaften, Produktstrate-gie und Marktakzeptanz.

Mangelnde Interoperabilität und unklare Lizenzbedin-gungen, verbunden mit hohen Kosten, sind oftmals Hin-dernisse auf dem Weg zur erfolgreichen Bereitstellung einer neuen BI-Lösung. Eine mögliche Antwort darauf stellt Open-Source-BI (OSBI) dar. Hier haben sich in den letzten Jahren einige interessante Produkte herausge-schält, die ihren kommerziellen Konkurrenten in Funk-tionsumfang und Performance kaum nachstehen. So schafften es beispielsweise JasperSoft und Actuate dieses Jahr in den Magic Quadrant der Marktforscher von Gart-ner [Gar11].Der Markt ist heiß umkämpft und entsprechend dyna-misch: Viele Player, häufige Releases, unterschiedliche Geschäftsmodelle und Zukunftsaussichten machen die Auswahl des richtigen Werkzeugs schwierig. Der Open-Source-Interessent steht also vor der Frage: „Auf welches Pferd soll ich setzen?“Unter den Open-Source-Lösungen bieten Pentaho und JasperSoft die breiteste Palette an Funktionen. Beide tre-ten mit ganzen Suiten an, die ähnlich zu denen großer Hersteller wie IBM/Cognos oder SAP/Business Objects vom ETL bis zur Benutzeroberfläche alles abdecken wol-

len. Im Folgenden betrachten wir den kürzlich erschiene-nen Releasekandidat 1 der Version 4 von Pentaho sowie JasperSoft in Version 4.0.1.Die Suite von Pentaho gruppiert sich um den BI-Platt-form-Server, der die Infrastruktur für alle BI-Prozesse darstellt. Data Integration steht als ETL-Komponente zur Verfügung. Außerdem integriert Pentaho die Open-Source-Projekte JFreeReport (Report Designer), Mond-rian (ROLAP) und Weka (Data Mining) und entwickelt diese weiter. Die JasperSoft BI Suite umfasst den Reporting Server, eine Benutzeroberfläche zur grafischen Erstellung von Berichten (iReport), OLAP sowie ein Java-API. Bei JasperETL handelt es sich um eine Anpassung des be-währten Open-Source-ETL-Werkzeugs von Talend. Jas-perSoft kann ebenso wie Pentaho sowohl freistehend eingesetzt als auch in eigene Lösungen integriert werden. Beide Plattformen stehen auch in einer freien Commu-nity Edition zur Verfügung, die mindestens eine zeitlich unbegrenzte, kostenlose Evaluierung ermöglicht, etwa im Rahmen einer Prototyp-Phase. Um die Frage nach der Zukunftssicherheit beider Suiten zu beantworten, haben wir drei übergreifende Aspekte untersucht. Zunächst ist die Produktstrategie beziehungsweise das Geschäftsmodell des Herstellers von Interesse. Wie sieht zum Beispiel das Lizenzmodell aus und mit welchen Einschränkungen müssen Nutzer der Community Edi-tion leben? Schafft es der Hersteller, etwa über eine ent-sprechende Community, Kunden und Interessenten lang-fristig zu binden und damit wirtschaftlich erfolgreich zu sein?Ebenfalls wichtig sind natürlich die Produkteigenschaf-ten. Welche sprechen für einen Einsatz im eigenen Un-ternehmen? Hierunter fallen Fragen nach Features, aber auch nach der Dokumentation. Bei Evaluierungen in einem bestimmten Projektkontext stehen die Produktei-genschaften in der Regel im Vordergrund. Sie sind für eine Bewertung der Zukunftssicherheit aber nicht hinrei-chend.Zusätzlich muss deshalb die Marktakzeptanz betrachtet werden. Wie groß ist die Verbreitung? (Daraus lässt sich mit einiger Berechtigung auf die Nachhaltigkeit schlie-ßen.) Zusätzlich weist die Behandlung in der Fachpresse darauf hin, wie viel Durchschlagskraft dem Produkt zu-zutrauen ist. Im Folgenden werden JasperSoft und Pentaho unter die-sen Kriterien genau beleuchtet.

Produktstrategie

Lizenzen und Versionen Pentaho wird in einer Community Edition (CE) und drei kommerziellen Versionen angeboten: Basic, Professional und Enterprise. Die CE steht unter GNU Public Li cense (GPL) v2, zum Teil auch unter der Lesser GPL v2, der Common Public License und Mozilla Public License

Johannes Dieterich verantwortet bei der iteratec GmbH den Bereich Business Intelli-gence mit Schwerpunkten Open-Source-BI, Kennzahlensysteme und Usability. E-Mail: [email protected]üseyin Kagba ist Software-Berater bei der iteratec GmbH. Als JEE-Experte interessiert er sich besonders für die Einsatzmöglichkeiten von OSBI als Systemkomponenten.E-Mail: [email protected]

02

BI-SPEKTRUM 04-2011

Sch

wer

punk

t

zur Verfügung. All diese Lizenzen verhindern nicht den kommerziellen Einsatz der Software in Kundenprojekten, schränken allerdings die Entwicklung darauf basierender Produkte ein, die ihrerseits wieder unter der entsprechen-den Lizenz erscheinen müssen [Liz]. Pentaho entwickelt die fortschrittlichsten Features seiner Suite als Closed Source weiter und bietet diese entspre-chend nur in Kaufversionen an. Dazu gehört zum Bei-spiel die 2009 von LucidEra akquirierte Analysefunk-tionalität. Laut CTO James Dixon strebt Pentaho einen Open-Closed-Source-Mix von 50:50 an [Alv09].JasperSofts Community Edition ist unter LGPL verfüg-bar. Außerdem gibt es ebenfalls drei kommerzielle Pa-ckages. Basic heißt hier Express und verzichtet zunächst auf die ETL-Komponente, die aber optional hinzugefügt werden kann. Überhaupt ist das Editionenmodell von JasperSoft durch optionale Bestandteile flexibler, jedoch auch komplexer. Bei den übrigen beiden Editionen han-

delt es sich ebenso wie bei Pentaho um Professional- und Enterprise-Editionen. Erst die Enterprise-Version bringt fortgeschrit-tene Analyse-Funktionen mit.Wie bei Open-Source-Projekten üblich, stellen beide Hersteller unterschiedliche

Versionen jeder Edition zur Verfügung: als Source Code, Continuous Integration Builds (aktuellster Stand) und Released Builds (qualitätsgesichert und stabil).

Aktive CommunityIn der Strategie beider Hersteller spielt die jeweilige Community eine wichtige Rolle. Kunden, Interessenten und Fans liefern Bug Reports, Features, gegenseitigen Support und wichtige Hinweise für die Weiterentwick-lung.Pentaho betreibt eine eigene Community-Website, in der alle Ressourcen der CE zu finden sind, wie API, Wiki, Downloads, Foren etc. Das dort gehostete Forum hat rund 33.500 (August 2011) Mitglieder, davon zirka 1.000 aktive. Die Anzahl zahlender Kunden und Produktimple-mentierungen konnte für Pentaho nicht ermittelt werden. Die Community von JasperSoft verfügte im August 2011 nach eigenen Angaben über mehr als 230.000 Mitglieder

Anzahl Community-Commits - Januar 2010 bis April 2011

SVN-Commits

0

500

1000

1500

2000

2500

3000

3500

4000

4500

Pentaho

JasperSoft

Anzahl aktiver Community-User in 2010

User

0

10

20

30

40

50

60

70

80

90

100

Pentaho

JasperSoft

OSBI-Suite Pentaho JasperSoftEdition Community Basic Professional Enterprise Community Express Professional EnterpriseETL

Grafischer Designer X X X X X optional X XDatenqualität X X X X X optional X XKonnektoren X X X X X optional X XJob Scheduler X X X X optional X XParallele Ausführung X X X XDatenbrowser X X optional optional X

Reporting & DashboardsGrundlegendes Reporting X X X X X X X XGrafischer Report-Designer X X X X X X X XInteraktive Reports X X X X X X XReiche Visualisierungen X X X X XMobile-Unterstützung X X * * * *Reporting-API X X X X X X X XDashboard-Designer X X X X X X X

AnalyseAd-hoc-Analyse X X X optional XOLAP X X X optional XData-Mining X XIn-Memory-Analyse optional X

EnterpriseSecurity-Integration X X X X X X XZentrale Administration X X X X X X XMandantenfähigkeit optional X

*) Mobile-Unterstützung angekündigt. Derzeit noch unklar in welcher Version und Edition

Abb. 1: Vergleich

Anzahl der Com-

munity-Commits

von Januar 2010

bis April 2011

Abb. 2: Vergleich

der Anzahl aktiver

Community-User

Tab. 1: OSBI-Features

03

BI-SPEKTRUM 04-2011

Sch

wer

punk

t

herum. Eine entsprechende Komponente fehlt bei JasperSoft gänzlich. Beide Hersteller bemü-hen sich um Mobile-Funktionalität. Hier scheint Pentaho zurzeit leicht die Nase vorn zu haben.Für Sandboxes und Teststellungen in der IT soll-ten die CE-Versionen ausreichen, für größere Vorhaben mangelt es an Komfort, insbesondere wenn User Self Services (wie Design von Be-richten und Analysen durch IT-fremde Anwen-der) eine Rolle spielen. Hier bleibt dann nur der Griff zu den umfangreicheren Editionen, die dann auch den entsprechenden Support bieten.

DokumentationWas die Dokumentation betrifft, ist die erste Anlaufstelle auf beiden Seiten die Community-

Website. Beide Hersteller stellen dort umfangreiche Do-kumentation, Tutorials, Foren und Wikis bereit. Öffentli-che Bugtracker runden die Sache ab.JasperSoft versorgt die Community dabei mit besonders vielen und zugänglichen Informationen über die BI-Suite [vgl. zum Beispiel Jas]. Detaillierte Handbücher sind ge-gen Gebühr zusätzlich erhältlich und nicht mit dem Er-werb kommerzieller Versionen verknüpft.Jenseits davon bieten vor allem Bücher über die Open-Source-BI-Produkte einen Mehrwert. Eine Recherche über Google Books lieferte für JasperSoft 16 Titel, für Pentaho 11 (August 2011), vergleichende Literatur eingeschlossen. Trotz leichtem Vorsprung für JasperSoft ist die unabhängi-ge Wissensbasis bei beiden also relativ dünn. Erschwerend kommt hinzu, dass sich die verfügbaren Bücher durch die Bank auf deutlich ältere Versionen beziehen. Man ist also weitestgehend auf die Community angewiesen, wie es bei jungen Open-Source-Projekten häufig der Fall ist.

Marktakzeptanz

Unabhängige Statistiken zur Verbreitung von OSBI-Lö-sungen existieren leider nicht. Stattdessen beurteilen wir die Marktakzeptanz anhand der Download-Zahlen und des Medienechos.

DownloadsDie Download-Zahlen repräsentieren die Verbreitung der Produkte und wurden für den Zeitraum von August 2010 bis Juli 2011 ermittelt (12 Monate). Abbildung 3 zeigt die kumulierte Anzahl der Downloads der einzel-nen Komponenten. Die bei den Features ausgemachten Schwerpunkte von Pentaho im ETL und JasperReports im Reporting schlagen sich deutlich nieder. Beim Thema ETL liegt Pentaho deutlich vorne. Interessiert man sich für die Marktdurchdringung von JasperSoft, lohnt sich allerdings zusätzlich der Blick auf die Download-Zahlen von Talend, das ja die ETL-Komponente von JasperSoft darstellt. Beim Reporting liegt JasperSoft dagegen weit in Führung.

und 13.500 zahlende Kunden. Im Februar 2011 zählte die Community rund 160.000 Produktimplementierungen. Für die Community stellt JasperSoft wie Pentaho eine eigene Projektseite, JasperForge, zur Verfügung. Jede Komponente (Server, Reporting, ETL) wird dort als ei-genständiges Projekt verwaltet. Auf der Projektseite be-finden sich Links auf die SVN-Repositories, zum Bug-tracking, zu Dokumentationen, zum Wiki etc. Um den Grad der Aktivität in der Community einzu-schätzen, haben wir uns die Anzahl der Commits der zu-gehörigen Projekte angesehen (Abbildung 1).Hier stellt sich die Pentaho-Community deutlich aktiver dar. Den zirka 3.800 Commits stehen etwas mehr als 700 der JasperSoft-Community gegenüber. Betrachtet man die Anzahl aktiver User, bestätigt sich das Bild: Hier konnten für Pentaho im Jahr 2010 rund 100 beitragende User gezählt werden, verglichen mit etwa 35 bei Jasper-Soft, also einer relativ kleinen Zahl (Abbildung 2). Beide Zahlen erlauben lediglich eine Aussage über die Aktivi-tät der Community, da ein großer Teil der Weiterentwick-lung beider Hersteller intern und teils als Closed Source ausgeführt wird.

Produkteigenschaften

FeaturesTabelle 1 zeigt die Features beider Suiten in der Über-sicht. Die CE von JasperSofts BI Suite enthält nahezu alle Komponenten, die auch in der Professional und Enterprise Edition (EE) enthalten sind. Lediglich der Ex-cel Connector fehlt in der CE, der optional für die Profes-sional Edition erhältlich und fester Bestandteil der EE ist. Während Pentaho eine besonders ausgereifte ETL-Funk-tionalität inklusive Multi-Threading anbietet, liegen Jas-perSofts Stärken trotz der Partnerschaft mit den ETL-Ex-perten von Talend mehr im Frontend. JasperSoft ist auch freigiebiger in Bezug auf die Enterprise-Funktionen wie Directory-Anbindung, die dort schon in der Community Edition zum Umfang gehört. Wer integrierte Data-Mining-Funktionalität benötigt, kommt dafür um Pentaho nicht

Anzahl Downloads - August 2010 bis Juli 2011

0

100000

200000

300000

400000

500000

600000

700000

BI Server ETL Reporting Analyse

Pentaho

JasperSoft

Talend

Abb. 3: Vergleich Anzahl der Downloads

04

BI-SPEKTRUM 04-2011

Sch

wer

punk

t

sich vor allem Pentahos ETL-Komponente gegen Jasper-Soft, aber auch gegen kommerzielle Produkte behaupten. Ein Alleinstellungsmerkmal ist die Data-Mining-Kom-ponente. JasperSofts Stärken liegen dagegen im grafi-schen Reporting. Die Projektanforderungen sollten hier den Ausschlag geben. Auch eine Kombination im Sinne eines Best-of-Breed-Ansatzes kann sinnvoll sein. Das Kopf-an-Kopf-Rennen wird nach derzeitigem Stand der Dinge noch eine Weile so weitergehen. Ganz falsch liegt man also mit keinem der beiden Produkte. Jasper-Softs Vorsprung im Reporting dürfte Pentaho nur schwer knacken können. Die Zusammenarbeit von JasperSoft mit Talend im ETL-Bereich ist deshalb besonders interessant. Hierin und wohl auch im Mobile-Anwendungsbereich stecken Chance und Risiken im Wettrennen mit Pentaho.

Referenzen

[Alv09] http://pedroalves-bi.blogspot.com/2009/10/pentaho- lucidera-excuse-for-big.html[Liz] www.netzrebellen.de/artikel/open-source-%E2% 80%93-eine-alternative/[HPo] www.heise.de/open/artikel/Datenqualitaet- messen-mit-Pentaho-763951.html[HJa] www.heise.de/firma/Jaspersoft[Gar11] www.microstrategy.com/Company/Gartner Quadrant.asp[jmp] www.jaspersoft.com/press/dcm-backed-jasper soft-paycycle-and-pgp-named-jmp%E2%80%99s-% E2%80%9Chot-100%E2%80%9D-report[Jas] www.jaspersoft.com/resources

MedienechoSowohl JasperSoft als auch Pentaho erhielten in der Vergangenheit viel positive Presse und auch einige Aus-zeichnungen. Außer unzähligen Erwähnungen in Online-Artikeln und Blogs verdienen folgende Punkte besondere Aufmerksamkeit:◆◆ Pentaho wurde von heise.de in einer Untersuchung

zur Datenqualität von ETL-Werkzeugen mit zwei kommerziellen Produkten verglichen [HPo]. Bei der Analyse kam es auf konsistente und homogene In-formationen in verschiedenen Systemen an. Pentaho hatte insgesamt die Nase vorn. Auch JasperSoft findet Beachtung durch heise.de in Form einer Themenseite rund um Entwicklungen und Neuigkeiten von Jasper-Soft [HJa].

◆◆ Im BI Survey 9 von BARC erzielte Pentaho im Ran-king unter 18 Kandidaten den neunten Platz. Einbe-zogen waren bei der BARC-Studie insbesondere die Business-Intelligence-Suiten der großen kommerzi-ellen Player wie Microsoft, SAP und Oracle. Bewer-tungskriterien waren hier unter anderem Bereitstel-lung, Kosten und Anwendung, Probleme, Vertrieb, Fähigkeit zum Umgang mit großen Datenvolumen und Performanz. Pentaho stach dabei besonders durch Performanz hervor.

◆◆ Wie erwähnt platzierte sich JasperSoft in Gartner’s Ma-gic Quadrant, was von diversen Medien aufgegriffen und thematisiert wurde. Außerdem erschien JasperSoft in der Liste der „100 besten Softwarefirmen in Privatbe-sitz“ der Investment-Bank JMP Securities. In der Unter-suchung wurden die führenden Softwareunternehmen aus den Bereichen Anwendungs-, Infrastruktur-, Analy-se- und Datenintegrationssoftware bewertet [jmp].

Fazit

Unterm Strich machen beide Suiten einen ausgereiften Eindruck und haben eine hohe, nachhaltige Verbreitung. Die Pentaho-Community ist etwas aktiver, dafür infor-miert JasperSoft seine Community besonders vorbildlich. Richtet sich der Blick auf die Produkteigenschaften, kann

Produktstrategie Produkteigenschaften MarktakzeptanzLizenzen Community Features Dokumentation Downloads Medienecho

Pentaho Community Edition unter verschiedenen

Open-Source-Lizenzen Basic Edition

Professional EditionEnterprise Edition

Pentaho-Communityca. 32.000 Mitglieder

Mehr Community-Beiträge zum

Quellcode

ETLReporting

DashboardingOLAP

Data-MiningMobile BI

SDK

Tuturial, FAQ, Api-Docs, Wiki, Forum

gratisWenige Bücher

ETL: ca. 215.000Reporting: ca. 41.000

Viel, Gewinner POC

Datenqualität von heise.de

Gute Bewertung im BARC BI Survey 9

JasperSoft Community Edition unter LGPL

Express EditionProfessional EditionEnterprise EditionOptionale Module

JasperForgeCa. 230.000 Mitglieder

Ca. 13.500 zahlende Kunden

Ca. 160.000 Implementierungen

ETLReporting

DashboardingOLAPSDK

Tuturial, FAQ, Api-Docs, Wiki, Forum

gratisWeitere

Dokumentation gegen Gebühr

Wenige Bücher

ETL: ca. 26.000Reporting: ca. 607.000

Viel,Aufnahme in Gartner

Magic Quadrant 2011,Auszeichnung von

JMP Securities

Tab. 2: Übersicht über die gewonnenen Erkenntnisse

BI-SPEKTRUM ist eine Fachpublikation des Verlags:SIGS DATACOM GmbH | Lindlaustraße 2c | 53842 TroisdorfTel.: +49 (0) 22 41.2341-100 | Fax: +49 (0) 22 41.2341-199

E-mail: [email protected] | www.objektspektrum.de

www.bi-spektrum.de

05

BI-SPEKTRUM 04-2011

Sch

wer

punk

t