open source business intelligence - · pdf fileit -novum white paper november 2009...

50
it-novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source BI-Lösungen JasperSoft, Palo und Pentaho

Upload: truonghanh

Post on 06-Mar-2018

220 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper November 2009

©it-novum GmbH 2009 Version 1.0

Open Source

Business

Intelligence

Ein Vergleich der Open Source BI-Lösungen

JasperSoft, Palo und Pentaho

Page 2: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 2 Version 1.0

Es gibt verschiedene Open SourceEs gibt verschiedene Open SourceEs gibt verschiedene Open SourceEs gibt verschiedene Open Source----Lösungen für Business Intelligence auf Lösungen für Business Intelligence auf Lösungen für Business Intelligence auf Lösungen für Business Intelligence auf

dem Markt. dem Markt. dem Markt. dem Markt. DiesesDiesesDiesesDieses DoDoDoDokumentkumentkumentkument stellt drei stellt drei stellt drei stellt drei besonders ausgereifte Vebesonders ausgereifte Vebesonders ausgereifte Vebesonders ausgereifte Vertreter rtreter rtreter rtreter

vor: vor: vor: vor: Pentaho, JasperSoft und Palo. Pentaho, JasperSoft und Palo. Pentaho, JasperSoft und Palo. Pentaho, JasperSoft und Palo. Verglichen werden die Funktionen Verglichen werden die Funktionen Verglichen werden die Funktionen Verglichen werden die Funktionen

sowohl der Community Version als auch der jeweiligen kostenpflichtigen sowohl der Community Version als auch der jeweiligen kostenpflichtigen sowohl der Community Version als auch der jeweiligen kostenpflichtigen sowohl der Community Version als auch der jeweiligen kostenpflichtigen

Version. Version. Version. Version. Ziel Ziel Ziel Ziel des des des des ProduktvergleichsProduktvergleichsProduktvergleichsProduktvergleichs ist es, dem Anwender die Auswahl der ist es, dem Anwender die Auswahl der ist es, dem Anwender die Auswahl der ist es, dem Anwender die Auswahl der

richtigen Burichtigen Burichtigen Burichtigen Business Intelligencesiness Intelligencesiness Intelligencesiness Intelligence----Software zSoftware zSoftware zSoftware zu erleichternu erleichternu erleichternu erleichtern....

Sie haben Fragen zum vorliegenden Sie haben Fragen zum vorliegenden Sie haben Fragen zum vorliegenden Sie haben Fragen zum vorliegenden DokumentDokumentDokumentDokument, Anmerkungen, Anmerkungen, Anmerkungen, Anmerkungen,,,, Kritik? Dann Kritik? Dann Kritik? Dann Kritik? Dann

schreiben Sie uns an schreiben Sie uns an schreiben Sie uns an schreiben Sie uns an businessbusinessbusinessbusiness----intelligence@itintelligence@itintelligence@[email protected]. . . .

Wir bieten regelmäßig Webinare zu Jaspersoft, PWir bieten regelmäßig Webinare zu Jaspersoft, PWir bieten regelmäßig Webinare zu Jaspersoft, PWir bieten regelmäßig Webinare zu Jaspersoft, Palo und Pentaho an. alo und Pentaho an. alo und Pentaho an. alo und Pentaho an. Bei Bei Bei Bei

Interesse schreiben Sie anInteresse schreiben Sie anInteresse schreiben Sie anInteresse schreiben Sie an businessbusinessbusinessbusiness----intelligence@itintelligence@itintelligence@[email protected]....

Kurzfassung

Fragen, Anmerkungen, Kritik

Webinar

Page 3: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 3 Version 1.0

Einleitung: Open Source Software im Bereich BusEinleitung: Open Source Software im Bereich BusEinleitung: Open Source Software im Bereich BusEinleitung: Open Source Software im Bereich Business Intelligenceiness Intelligenceiness Intelligenceiness Intelligence 5

1. Business Intelligence1. Business Intelligence1. Business Intelligence1. Business Intelligence ................................................................... 9

1.1.1.1.1.1.1.1. ETL ETL ETL ETL ---- Extraktion, Transformation, LadenExtraktion, Transformation, LadenExtraktion, Transformation, LadenExtraktion, Transformation, Laden .......................... 10

1.2.1.2.1.2.1.2. Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)................................... 13

1.3.1.3.1.3.1.3. Data MiningData MiningData MiningData Mining ............................................................................ 16

1.4.1.4.1.4.1.4. ReportingReportingReportingReporting .................................................................................. 17

1.5.1.5.1.5.1.5. DashboardsDashboardsDashboardsDashboards .............................................................................. 18

1.6.1.6.1.6.1.6. PortalePortalePortalePortale ...................................................................................... 18

2. An2. An2. An2. Anbieter von Open Source Businesbieter von Open Source Businesbieter von Open Source Businesbieter von Open Source Busines IntelliIntelliIntelliIntelligencegencegencegence ................ 20

2.1.2.1.2.1.2.1. Pentaho: Pentaho BIPentaho: Pentaho BIPentaho: Pentaho BIPentaho: Pentaho BI----SuiteSuiteSuiteSuite ................................................... 20

2.1.1.2.1.1.2.1.1.2.1.1. ETL: Pentaho Data Integration (Kettle)ETL: Pentaho Data Integration (Kettle)ETL: Pentaho Data Integration (Kettle)ETL: Pentaho Data Integration (Kettle) ......................... 21

2.1.2.2.1.2.2.1.2.2.1.2. Pentaho Analysis Services (Mondrian)Pentaho Analysis Services (Mondrian)Pentaho Analysis Services (Mondrian)Pentaho Analysis Services (Mondrian) ........................ 23

2.1.2.1.2.1.2.1.2.1.2.1.2.1.2.1. Mondrian SchemaMondrian SchemaMondrian SchemaMondrian Schema----WorkbenchWorkbenchWorkbenchWorkbench ................................... 24

2.1.2.2.2.1.2.2.2.1.2.2.2.1.2.2. MondriMondriMondriMondrianananan----WebanwendungWebanwendungWebanwendungWebanwendung ........................................ 24

2.1.2.3.2.1.2.3.2.1.2.3.2.1.2.3. Aggregation DesignerAggregation DesignerAggregation DesignerAggregation Designer .................................................. 26

2.1.3.2.1.3.2.1.3.2.1.3. Pentaho WEKAPentaho WEKAPentaho WEKAPentaho WEKA ................................................................... 27

2.1.4.2.1.4.2.1.4.2.1.4. Pentaho Report DesignerPentaho Report DesignerPentaho Report DesignerPentaho Report Designer ................................................ 27

2.1.5.2.1.5.2.1.5.2.1.5. Pentaho DashboardPentaho DashboardPentaho DashboardPentaho Dashboard----BuildingBuildingBuildingBuilding ........................................ 28

2.1.6.2.1.6.2.1.6.2.1.6. Pentaho Enterprise EditionPentaho Enterprise EditionPentaho Enterprise EditionPentaho Enterprise Edition ............................................ 29

2.1.7.2.1.7.2.1.7.2.1.7. Fazit: PentahoFazit: PentahoFazit: PentahoFazit: Pentaho ..................................................................... 31

2.2.2.2.2.2.2.2. JasperSoft BIJasperSoft BIJasperSoft BIJasperSoft BI----SuiteSuiteSuiteSuite ................................................................. 32

2.2.1.2.2.1.2.2.1.2.2.1. JasperSoft BIJasperSoft BIJasperSoft BIJasperSoft BI----PlattformPlattformPlattformPlattform ................................................... 33

Inhalt

Page 4: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 4 Version 1.0

2.2.2.2.2.2.2.2.2.2.2.2. JasperETL (Talend Open Studio)JasperETL (Talend Open Studio)JasperETL (Talend Open Studio)JasperETL (Talend Open Studio) ................................... 33

2.2.3.2.2.3.2.2.3.2.2.3. JasperAnalysis (Mondrian)JasperAnalysis (Mondrian)JasperAnalysis (Mondrian)JasperAnalysis (Mondrian) ............................................ 34

2.2.4.2.2.4.2.2.4.2.2.4. JasperReportsJasperReportsJasperReportsJasperReports ................................................................... 35

2.2.4.1.2.2.4.1.2.2.4.1.2.2.4.1. iReportiReportiReportiReport ............................................................................. 35

2.2.5.2.2.5.2.2.5.2.2.5. JasperSoft BI Suite Professional EditionJasperSoft BI Suite Professional EditionJasperSoft BI Suite Professional EditionJasperSoft BI Suite Professional Edition ..................... 36

2.2.6.2.2.6.2.2.6.2.2.6. Fazit: JasperSoftFazit: JasperSoftFazit: JasperSoftFazit: JasperSoft ............................................................... 37

2.3.2.3.2.3.2.3. Palo BI SuitePalo BI SuitePalo BI SuitePalo BI Suite ............................................................................ 39

2.3.1.2.3.1.2.3.1.2.3.1. Palo OLAP SerPalo OLAP SerPalo OLAP SerPalo OLAP Serverververver .............................................................. 40

2.3.2.2.3.2.2.3.2.2.3.2. Palo ETL ServerPalo ETL ServerPalo ETL ServerPalo ETL Server ................................................................. 40

2.3.3.2.3.3.2.3.3.2.3.3. Palo WorksheetPalo WorksheetPalo WorksheetPalo Worksheet----ServerServerServerServer .................................................... 41

2.3.4.2.3.4.2.3.4.2.3.4. Palo Excel AddPalo Excel AddPalo Excel AddPalo Excel Add----inininin .............................................................. 44

2.3.5.2.3.5.2.3.5.2.3.5. Palo Supervision ServerPalo Supervision ServerPalo Supervision ServerPalo Supervision Server .................................................. 45

2.3.6.2.3.6.2.3.6.2.3.6. Fazit: PaloFazit: PaloFazit: PaloFazit: Palo .......................................................................... 45

3. Gesamtbetrachtung3. Gesamtbetrachtung3. Gesamtbetrachtung3. Gesamtbetrachtung .................................................................. 47

Weiterführende Informationen /Links........................................ 49

Kontaktadressen.............................................................................. 50

Page 5: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 5 Version 1.0

EEEEinleitunginleitunginleitunginleitung: : : : Open Source Software im Bereich Open Source Software im Bereich Open Source Software im Bereich Open Source Software im Bereich Business IntelligenceBusiness IntelligenceBusiness IntelligenceBusiness Intelligence

Kennen Sie die Situation, dass für die Bereitstellung von Berichten immer die IT-

Abteilung herangezogen wird oder die Auswertung von Geschäftskennzahlen

sehr zeitaufwändig und kostenintensiv ist? Bei Besprechungen werden Reports

mit unterschiedlichen Datenbeständen herangezogen; zudem sind viele

Datenbestände über mehrere Datenquellen und Systeme verteilt. Solche

Situationen erschweren es, aussagekräftige Berichte zu erstellen und die

dazugehörigen Daten zu analysieren. Doch gerade Geschäftsdaten sind meistens

die Grundlage für unternehmerische Entscheidungen von großer Tragweite.

Früher waren Begrifflichkeiten wie „IT-basierte Managementunterstützung“,

„Management Support Systeme“ oder „Management-Informationssysteme“ weit

verbreitet und wurden eingesetzt, um Führungskräfte in ihrer Tätigkeit zu

unterstützen. Heute hat sich der Begriff „Business Intelligence“ (BI) durchgesetzt.

Business IntelligenceBusiness IntelligenceBusiness IntelligenceBusiness Intelligence

Business Intelligence ist heute ein wichtiges Anwendungsfeld im Umfeld

betriebswirtschaftlicher Applikationen. BI umfasst die Methoden, mit denen die

Daten eines Unternehmens aufbereitet und strukturiert ausgewertet werden

können. Die eigentlichen Anwendungen sind vielfältig: Kennzahlensysteme und

Balanced Scorecards, Konsolidierung, Reporting, Management-Dashboards,

Ursachenanalyse, Datenkorrelation etc.

BI hat in den letzten Jahren nicht ohne Grund so ein großes Marktinteresse

erfahren. Auslöser waren z.B. ungeeignete Reporting- und Analyse-

Funktionalitäten von anderen (insbesondere ERP-) Systemen, die diese

Anforderungen nur mit viel Mühe und Aufwand umsetzen konnten, die

Notwendigkeit, Daten aus mehreren (oft unterschiedlichen) Vorsystemen zu

konsolidieren, um einen umfassenden Überblick zu gewinnen (z.B.

Konzernreporting), oder schlicht die wirtschaftliche Situation als äußerer Druck

zur Verbesserung der eigenen Organisation und Prozesse mit Hilfe besseren

Zahlenmaterials. Ein wesentlicher Grund ist auch der Wunsch nach einem

einfachen Zugriff auf Geschäftsdaten und Analysen über vertraute, nicht-

technische Frontends wie Excel oder Portale, die auch Fachanwendern und nicht

nur der IT das Arbeiten mit diesen Daten ermöglichen. Aufgeführt wurde oft auch

die Entlastung der operativen Transaktionssysteme. Dieser Performancegrund ist

aber durch die stetig günstigere und leistungsfähigere Hardware kaum noch

relevant.

Page 6: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 6 Version 1.0

Die Auswertung von unternehmerischem Zahlenmaterial geschieht durch

analytische Informationssysteme, die auf einen konsolidierten Datenbestand

(oftmals in Form sogenannter „Cubes“) zugreifen. .Je größer das Unternehmen

ist, desto mehr Daten entstehen. Dazu kommt, dass auf Grund von heterogenen

IT-Landschaften Daten aus verschiedenen Vorsystemen integriert werden

müssen. Das stellt nicht nur hohe technische Anforderungen, sondern auch

semantische, z.B. die Normierung von Daten (Euro und Dollar in einem globalen

Umsatzreport). Natürlich sind diese Daten ohne eine entsprechende

Aufbereitung nicht wirklich nützlich für die Unternehmensführung. Werden sie

aber unter Verwendung von BI-Systemen bearbeitet und verändert, bekommen

sie einen Bezug zueinander und sind in Entscheidungsprozessen einsetzbar.

BI-Systeme sind also mit wenigen Ausnahmen ein „Muss“ für alle

Managementebenen. Entscheider erhalten dadurch einen einfachen Zugang zu

Kennzahlen, Berichten und Scorecards und können selber Analysen mit zeitlicher

Betrachtung (wie z.B. Drill-Down-Analysen) durchführen. Führungskräfte haben

spezielle Anforderungen, die BI-Systeme gut erfüllen können: Schnelligkeit,

Einfachheit der Nutzung, Gebrauchstauglichkeit für IT-fremde Personen,

Datenqualität, stetige Aktualität, Verlässlichkeit, Integrität und Konsistenz.

SoftwareSoftwareSoftwareSoftware----Lösungen für Lösungen für Lösungen für Lösungen für BIBIBIBI

Kommerzielle Anbieter im Bereich Business Intelligence bieten vielfältige und

integrierte Gesamtpakete. Sie unterscheiden sich im Leistungsumfang, der

Benutzerfreundlichkeit und dem Preis. Ein eigenes Produktsegment stellt Open

Source BI-Software dar. Sie basiert oft auf einem modularen Aufbau: Während

die Gesamtlösung Plattformcharakter hat, können ihre Bestandteile auch separat

eingesetzt werden. Daneben gibt es eine Reihe von Open Source-Lösungen für

einzelne Bereiche der Business Intelligence.

Open Source hat sich seit einiger Zeit auf dem Markt für Business Intelligence

etabliert und stellt auf einigen Anwendungsgebieten eine absolut

ernstzunehmende Konkurrenz zu den kommerziellen Lösungen dar. Es handelt

sich dabei um Softwarepakete, die im Internet zum Download stehen. Sowohl das

Programm an sich als auch der Quellcode können heruntergeladen werden.

Neben den kostenlosen „Community“-Versionen gibt es inzwischen auch

kostenpflichtige „Enterprise Editionen“, die professionelle Dienstleistungen

(Support etc.) und mehr Funktionen bieten.

Vorteile von Open SourceVorteile von Open SourceVorteile von Open SourceVorteile von Open Source

Für eine Open Source BI-Lösung spricht nicht nur der Kostenaspekt. Klare Vorteile

bringen auch die Unabhängigkeit von einem bestimmten Hersteller und eine

Page 7: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 7 Version 1.0

größere Flexibilität und Integrationsfähigkeit in heterogene IT-Landschaften

dank der verwendeten offenen Technologien und Schnittstellen.

Der Der Der Der Open SourceOpen SourceOpen SourceOpen Source----DiamantDiamantDiamantDiamant

Die marktführenden Anbieter im Open Source-Bereich, von denen einige im

Rahmen des vorliegenden Dokuments betrachtet werden, zeichnen sich durch

bestimmte Eigenschaften aus. Für eine bildliche Darstellung dieser Eigenschaften

und einen vereinfachten Vergleich mit den Charakteristika proprietärer Software

haben wir das Modell eines Diamanten entwickelt. Es setzt die Aspekte

Abhängigkeit, Funktionalität/Innovation, Flexibilität, Sicherheit und Kosten

zueinander in Beziehung und hilft, Klarheit über die Vor- und Nachteile einer IT-

Lösung zu gewinnen (siehe Abbildung 1).

Der bekannteste Vorteil quelloffener Software ist der frei zugängliche Quellcode.

Damit hat der Anwender grundsätzlich die Möglichkeit, selbst Erweiterungen am

Code durchzuführen (ob das der Endanwender macht oder einen darauf

spezialisierten Dienstleister beauftragt, ist in diesem Fall nicht ausschlaggebend)

und diese anderen zur Verfügung zu stellen. Ein weiterer Vorteil der strukturellen

Transparenz von Open Source-Software ist ein umfassenderer und gründlicherer

Innovationszyklus, weil die Anwender entscheidenden Einfluss auf die

Weiterentwicklung haben. Proprietäre Software ist dagegen von einem Hersteller

Abbildung Abbildung Abbildung Abbildung 1111: Der Open Source: Der Open Source: Der Open Source: Der Open Source----DiamantDiamantDiamantDiamant

Page 8: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 8 Version 1.0

abhängig und kann vom Anwender weder editiert noch ergänzt oder verbessert

werden. Das beschränkt ihr Innovationspotenzial auf die

Weiterentwicklungsressourcen und -bereitschaft des Produzenten.

Die weiteren im Open Source-Diamanten beschriebenen Eigenschaften werden

auf unserer Website www.itwww.itwww.itwww.it----novum.com/opensource_diamant_4629.htmlnovum.com/opensource_diamant_4629.htmlnovum.com/opensource_diamant_4629.htmlnovum.com/opensource_diamant_4629.html

näher erläutert.

Page 9: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 9 Version 1.0

1.1.1.1. Business IntelligenceBusiness IntelligenceBusiness IntelligenceBusiness Intelligence

Der Begriff „Business Intelligence“ wurde Mitte der neunziger Jahre zum ersten

Mal vom Analystenhaus Gartner verwendet. Er umschreibt die Bereitstellung und

Analyse von Daten mit dem Ziel, Führungskräfte in ihrer Tätigkeit zu

unterstützen. Business Intelligence hilft beim Umgang mit Problemstellungen

wie dem richtigen Aufeinanderbeziehen von Daten aus unstrukturiert

abgelegten Datenquellen, um sie danach zur Beschreibung und Analyse

unternehmerischer Zustände heranzuziehen.

Business Intelligence stellt verschiedene Methoden und spezialisierte

Applikationen zur Verfügung, um interne und externe Daten zu sammeln,

zusammenzuführen und auszuwerten. Den Rahmen dafür bilden im

Wesentlichen drei Prozessstufen:

1) Datenbeschaffung

Die benötigten Daten können aus einer oder mehreren Ursprungsquellen

herangezogen werden. Das kann ein ERP-System, eine Datenbank, eine Datei

(z.B. eine Excel-Datei) u.a. sein. Die zur Datenbeschaffung eingesetzte BI-

Funktionalität ist der ETL-Prozess (Extraction, Transformation, Loading).

2) Analytische Auswertung

Die gewonnenen Daten werden mittels analytischer Verfahren verarbeitet.

Hierbei handelt es sich entweder um eine einfache Ansammlung der Daten -

mit Hilfe der Analysetechnik OLAP (Online Analytical Processing) - oder um

komplexe statistische Untersuchungen über die Data Mining-Methode

erarbeitet.

3) Präsentationsfunktion

Dem Analyseschritt folgt die Aufbereitung der Daten zu

Präsentationszwecken in Form von Berichten (Reports). Sie werden entweder

als pdf-Dokumente oder in Form von Dashboards auf dem Frontend von

Portalen veröffentlicht.

Nach Abschluss der drei Verarbeitungsphasen bieten die dargestellten Daten eine

Hilfestellung bei der Entscheidungsfindung für Unternehmen, das sich so besser

auf Chancen und Risiken einstellen und dementsprechend agieren kann.

Page 10: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 10 Version 1.0

1.1.1.1.1.1.1.1. ETLETLETLETL ---- Extraktion, Transformation, LaExtraktion, Transformation, LaExtraktion, Transformation, LaExtraktion, Transformation, Ladendendenden

Die Beschaffung der Daten setzt sich aus folgenden Schritten zusammen:

• ExtraktionExtraktionExtraktionExtraktion der Daten aus dem ERP-System, einer Datenbank, einer

Datei oder aus anderen bestehenden Ursprungsquellen

• TransformationTransformationTransformationTransformation der Daten, um sie im nächsten Schritt

weiterverarbeiten zu können

• LLLLadenadenadenaden der erzielten Daten in eine zentrale Datensammelstelle (Data

Warehouse), um sie später für die verschiedenen Geschäftseinheiten zu

trennen.

Der ETL-Prozess wandelt operative Daten in subjekt- bzw. themenorientierte

Daten um. Dadurch können sie für die Entscheidungsfindung des Managements

eingesetzt werden. Dieser Vorgang setzt sich aus mehreren Teilprozessen

zusammen: Filterung, Harmonisierung, Aggregation und Anreicherung.

Abbildung Abbildung Abbildung Abbildung 2222: : : : Die Die Die Die BusinBusinBusinBusiness Intelligenceess Intelligenceess Intelligenceess Intelligence----Plattform (Schema)Plattform (Schema)Plattform (Schema)Plattform (Schema)

Page 11: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 11 Version 1.0

FilterungFilterungFilterungFilterung

Die Filterungsschicht umfasst die Extraktions- und die Bereinigungsphase (data

cleansing). Aus internen und externen Quellsystemen werden die benötigten

Daten ausgewählt und zwischengespeichert. Bevor die Daten in das Data

Warehouse geladen werden, werden sie vorerst in einer sogenannten „Staging

Area“ gelagert (Extraktion). Anschließend erfolgt die Bereinigung der

zwischengelagerten Daten von formellen und von inhaltlichen Mängeln.

HarmonisierungHarmonisierungHarmonisierungHarmonisierung

Nach erfolgreicher Filterung der Daten folgt die Harmonisierungsschicht. Sie

dient der Verknüpfung der gefilterten Daten. Dabei sind zwei Aspekte zu

untersuchen, die syntaktische Harmonisierung und die betriebswirtschaftliche

Harmonisierung.

• Syntaktische SynchronisierungSyntaktische SynchronisierungSyntaktische SynchronisierungSyntaktische Synchronisierung

Operative und externe Daten haben eine uneinheitliche Struktur und

müssen syntaktisch harmonisiert werden. Das geschieht durch

verschiedene Vorgänge:

a) Abstimmung von Kodierungen: Daten können unterschiedlich

kodiert sein, deshalb muss mit Hilfe von Zuordnungstabellen

eine Wahl getroffen werden.

b) Lösung des Synonym-Problems: Es existieren unterschiedlich

benannte, aber den gleichen Inhalt enthaltende Spalten. Dieses

Problem lässt sich durch die Einigung auf einen Spaltennamen

beheben.

c) Lösung des Homonym-Problems: Hier sind die Spaltennamen

identisch, aber der Inhalt unterscheidet sich. Die Lösung ist die

Vergabe von neuen Spaltennamen.

d) Bereinigung von Schlüsseldisharmonien: Wenn die extrahierten

und bereinigten Daten andere Primärschlüssel aufweisen als in

der operativen Datenhaltung, werden künstliche Primärschlüssel

erzeugt und die vorherigen Primärschlüssel als Fremdschlüssel

mitgeführt.

• Betriebswirtschaftliche HarmonisierungBetriebswirtschaftliche HarmonisierungBetriebswirtschaftliche HarmonisierungBetriebswirtschaftliche Harmonisierung

Für eine optimale Überführung der operativen Daten in

entscheidungsunterstützende Datenbestände muss die

Page 12: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 12 Version 1.0

betriebswirtschaftliche Harmonisierung durchgeführt werden. Sie

gleicht die betriebswirtschaftlichen Kennziffern ab und legt die

gewünschte Granularität (Detaillierungsgrad) der Daten fest:

a) Abgleichung der betriebswirtschaftlichen Kennziffern: Die Daten

werden betriebswirtschaftlich vereinheitlicht. Daten wie

Währung müssen nach gebiets- und ressortspezifischen Kriterien

in homogene Werte transformiert werden.

b) Festlegung der gewünschten Granularität der dispositiven Daten:

Je niedriger die Datengranularität, desto detaillierter sind die

Daten. Im Management werden niedrige Granularitäten

bevorzugt, weil die Analysen dementsprechend detaillierter

betrachtet werden können. Zur Festlegung des gewünschten

Detaillierungsgrades sind weitere Transformationsregeln nötig.

AggregationAggregationAggregationAggregation

Die gefilterten und harmonisierten Daten werden der nächsten

Transformationsschicht übergeben. Diese Schicht befasst sich mit der

Aggregation (Verdichtung, Ansammlung) der Daten. Es werden bestimmte

Aggregationsalgorithmen angewendet, da ein bestimmter Granularitätsgrad

nicht nötig ist. So werden in diesem Schritt Vorsummierungen getroffen, weil

gewisse betriebswirtschaftliche Kennzahlen nur mit diesen berechnet werden

können. Im Rahmen der Aggregation werden Dimensionshierarchietabellen

entworfen. Dabei entstehen Elemente wie „Gesamt“ oder „Alle“, die die

Summation der Einzeldaten enthalten.

AnreicherungAnreicherungAnreicherungAnreicherung

Hier werden die betriebswirtschaftlichen Kennzahlen berechnet und integriert.

Dieser Prozess ist wichtig für Informationen, die von mehreren Endanwendern

benutzt werden. Dabei werden verschiedene Kennzahlen für verschiedene

Anwender errechnet. Beispielsweise ist für einen Produktmanager der

wöchentliche Deckungsbeitrag auf Produktebene wichtig, ein Filialleiter hat

dagegen mehr Interesse an den jährlichen Deckungsbeiträgen auf Filialebene.

Nach den Transformationsprozessen sind die Daten so aufbereitet, dass sie in das

Data Warehouse aufgenommen werden können. Dieser Prozess nennt sich Laden

(Loading). Die Daten werden von der Staging Area in das Data Warehouse

verschoben und stehen jetzt für analytische Zwecke zur Verfügung.

Page 13: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 13 Version 1.0

1.2.1.2.1.2.1.2. Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)

Die Technologien des „Online Analytical Processing“ (OLAP) bilden die Grundlage

des Berichtswesens (Reporting). Dazu werden die im Data Warehouse

eingelagerten Daten in einem sogenannten OLAP-Cube (Würfel) aufbereitet und

zur Verfügung gestellt, sodass sich die Anwender die benötigten Daten

herausziehen und anzeigen lassen können.

Beim OLAP werden relationale Datenmodelle mit Hilfe von zweidimensionalen

Tabellen abgebildet. Die eindeutige Identifikation der einzelnen Zeilen erfolgt

über Primärschlüssel. Um eine engere Analyserichtung gewährleisten zu können,

bedarf es multidimensionaler Datenräume. Diese werden mit Hilfe von

Datenwürfeln (Cubes) verwirklicht. Die Struktur eines Cubes erlaubt die

Abbildung mehrerer Dimensionen. Im Gegensatz dazu lässt sich ein normaler

Würfel nur auf drei Dimensionen abbilden. Um Analysen im Sinne der Business

Abbildung Abbildung Abbildung Abbildung 3333: Normierung der Daten für die spätere betriebswirtsch: Normierung der Daten für die spätere betriebswirtsch: Normierung der Daten für die spätere betriebswirtsch: Normierung der Daten für die spätere betriebswirtschaftlich einheitliche Darstellungaftlich einheitliche Darstellungaftlich einheitliche Darstellungaftlich einheitliche Darstellung

Page 14: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 14 Version 1.0

Intelligence durchführen zu können, bedarf es mehrerer Ebenen bzw.

Dimensionen.

Zwei Gesichtspunkte kennzeichnen einen Cube:

• Fakten:Fakten:Fakten:Fakten: Stehen im Mittelpunkt des Cubes und werden durch

betriebswirtschaftliche Kennzahlen gebildet.

• Dimensionen:Dimensionen:Dimensionen:Dimensionen: Stellen die Ebenen dar, die bei der Analyse zum Einsatz

kommen. Sie sind gleichzeitig die Achsen des Cubes.

Die Erstellung eines Cubes ist verbunden mit einer gut durchdachten

Aufbereitung der Daten. Die Daten müssen normiert vorliegen, um einen Cube

erstellen zu können und durchlaufen zunächst Prozesse wie den ETL-Prozess, um

in nächster Ebene als Tabelle in ein Data Warehouse integriert zu werden.

Dimensionsebenen werden herausgegriffen und anhand dieser wird eine

Faktentabelle erstellt, die die notwendigen Primärschlüssel der einzelnen

Dimensionstabellen enthält. Dabei kann ein Cube mehr als nur drei Dimensionen

AbAbAbAbbildung bildung bildung bildung 4444: Beispiel für einen Cube: Ein sogenannter Vertriebswürfel: Beispiel für einen Cube: Ein sogenannter Vertriebswürfel: Beispiel für einen Cube: Ein sogenannter Vertriebswürfel: Beispiel für einen Cube: Ein sogenannter Vertriebswürfel

Page 15: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 15 Version 1.0

enthalten. Die Faktentabelle umfasst zusätzlich zu den Primärschlüsseln der

Dimensionstabellen auch Kennzahlen wie beispielsweise „Umsatz“ oder

„Gewinn“. Diese Kennzahlen werden innerhalb der Faktentabelle über die

Dimensionen hinweg berechnet und im Cube gespeichert.

Cubes werden hauptsächlich im Controlling eingesetzt. So werden beispielsweise

einzelne Cubes für das Vertriebscontrolling erstellt, die einzelne Kennzahlen wie

„Umsatz pro Jahr“ oder „Anzahl der Aufträge pro Kunde“ beinhalten. Diese

Kennzahlen dienen gleichzeitig der strategischen Planung und Kontrolle des

Unternehmens.

Mit Hilfe von Internet und Intranet hat der Anwender die Möglichkeit, sich die

Tabellen bzw. Cubes über den Web-Browser anzeigen zu lassen, um daraus die

Analysen zu konstruieren. Die Daten können daneben auch als Excel-Datei

ausgegeben werden.

In OLAP-Systemen sollen die Informationen aus verschiedenen Perspektiven und

in verschiedenen Detaillierungsstufen veranschaulicht werden. Dazu dienen

Funktionen wie Drill-Down, Drill-Up, Drill-Across, Dicing und Slicing (Abbildung

5).

• DrillDrillDrillDrill----Down:Down:Down:Down: Erlaubt eine detailliertere Betrachtung der Daten in

vertikaler Richtung.

• DrillDrillDrillDrill----Up bzw.Up bzw.Up bzw.Up bzw. RollRollRollRoll----Up: Up: Up: Up: Entspricht der nächsthöheren Verdichtungs-

ebene und ist das Gegenteil des Drill-Down.

• DrillDrillDrillDrill----Across:Across:Across:Across: Erlaubt das Vertauschen der Dimensionen untereinander.

• Dicing: Dicing: Dicing: Dicing: Filtert bestimmte Attribute zur Betrachtung. Dadurch, dass alle

anderen Attribute ausgeblendet werden, entsteht ein kleinerer Cube.

• Slicing: Slicing: Slicing: Slicing: Es wird nur eine Scheibe des Cubes berücksichtigt.

Page 16: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 16 Version 1.0

Es gibt verschiedene OLAP-Umsetzungskonzepte wie das R-OLAP (Relationales

OLAP) und das M-OLAP (Multidimensionales OLAP). R-OLAP basiert auf Daten, die

in einer relationalen Datenbank gespeichert sind. Dieses Konzept findet bei

hohen Datenvolumen und großen Benutzerkreisen Anwendung. M-OLAP

(Multidimensionales OLAP) arbeitet mit multidimensionalen Datenbanken. Dabei

sind die abgespeicherten Daten transformiert und bilden von vornherein einen

Würfel). Der Vorteil ist die schnellere Antwortzeit bei Datenabfragen. Abfragen

auf multidimensionalen Datenstrukturen werden mit MDX-Anweisungen

(Multidimensional Expressions) durchgeführt.

1.3.1.3.1.3.1.3. Data MiningData MiningData MiningData Mining

Beim Data Mining handelt es sich um ein weiteres Analyseverfahren. Die

existierende Datensammlung wird nach Zusammenhängen untersucht und die

neu entdeckten Hypothesen festgehalten. Eingesetzt werden verschiedene

Methoden der Statistik, der Mathematik und der Künstlichen Intelligenz:

• Entscheidungsbäume

• Künstliche Neuronale Netze (KNN)

• Clusterverfahren

• Assoziationsanalyse

Abbildung Abbildung Abbildung Abbildung 5555: Die Selektion von unterschiedlichen Datenschichten: Die Selektion von unterschiedlichen Datenschichten: Die Selektion von unterschiedlichen Datenschichten: Die Selektion von unterschiedlichen Datenschichten

Page 17: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 17 Version 1.0

1.4.1.4.1.4.1.4. ReportingReportingReportingReporting

Das Reporting (deutsch: Berichtswesen) ist die Gesamtheit aller Methoden und

Techniken für die betriebliche Berichterstattung. Dabei wird gerne in „Standard-

Reporting” und „Ad-hoc-Reporting” unterschieden. Reports oder Berichte

erleichtern Mitarbeitern die Erledigung ihrer Aufgaben und dienen dem

Management als Informationsquelle. Um einen Bericht zu erstellen, müssen die

folgenden Punkte festgelegt werden: der Berichtszweck, der Berichtsinhalt,

Sender und Empfänger und sowie der Zeitpunkt der Berichterstattung.

Aktive Berichtssysteme arbeiten selbstständig. Nachdem Form und Inhalt des

Berichts einmal festgelegt sind, generieren sie automatisch die Reports und

stellen sie dem Empfänger zu. Passive Berichtssysteme erzeugen Berichte nur auf

Anfrage eines Benutzers. Ad-hoc-Berichtssysteme sind ein Teil der passiven

Berichtssysteme.

Im Bereich des Ad-hoc-Reportings ist der Endbenutzer jedoch nicht nur an der

Berichtserzeugung, sondern auch an dessen Gestaltung beteiligt. Bereits der

Name „ad hoc“ drückt aus, dass ein Bericht „aus dem Stegreif“ erstellt wird. Das

bedeutet, dass der Anwender während der Berichtserzeugung selbstständig das

Layout des gewünschten Reports festlegt. Eine solche interaktive

Zusammenstellung der Daten bevorzugt besonders der Anwenderkreis der

Analytiker, wie beispielsweise die Controller. Ihnen reichen häufig die

Informationen aus den Standardreports nicht aus. Sie benötigen die Möglichkeit,

Daten auf Produktsegmente oder Einzelkunden herunterzubrechen. Hier helfen

die Ad-hoc-Analysen weiter. Ad-hoc-Berichte basieren ausschließlich auf

multidimensionalen Daten, weil sich ihre Struktur optimal für derartige

Auswertungen eignet. Ad-hoc-Analysen werden häufig in

Tabellenkalkulationsprogrammen wie beispielsweise Microsoft Excel

durchgeführt. Je nach zugrunde liegender Datenbank werden verschiedene

Plugins für die Erstellung von Ad-hoc-Berichten angeboten. Häufig können die

auszuwählenden Dimensionen einfach mit Drag-and-Drop selektiert werden. Ad-

hoc-Berichte können ebenso wie Standardberichte in Form von Tabellen oder

Diagrammen umgesetzt werden. Sie zeichnen sich durch eine sehr große

Benutzerfreundlichkeit aus, weil schnelle Sichtänderungen auch vom

unerfahrenen Anwender durchgeführt werden können.

Page 18: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 18 Version 1.0

1.5.1.5.1.5.1.5. DashDashDashDashboardboardboardboardssss

Die wichtigsten Kennzahlen eines Unternehmens werden gerne im sogenannten

Dashboard auf einer einzigen Bildschirmseite präsentiert. Ein Dashboard ist eine

Ansammlung von einzelnen Berichten, die wiederum aus Kennzahlen,

Messpunkten oder Key Performance Indicators (KPIs) bestehen, wobei die Berichte

aufeinander aufbauen. Es ähnelt dem Cockpit eines Piloten, weil die Daten durch

Tachometer, Liniendiagramme, Ampeln, Landkarten und andere Darstellungen

visualisiert werden. Das soll Entscheidungsträgern einen schnellen Blick auf die

wichtigsten Unternehmensdaten ermöglichen.

Dashboards zeichnen sich durch folgende Merkmale aus:

• Komprimierte Darstellung:Komprimierte Darstellung:Komprimierte Darstellung:Komprimierte Darstellung: Die benötigten Informationen werden in

verdichteter Form, meist auf einer einzigen Bildschirmseite, dargestellt,

um den Übersichtscharakter zu betonen. Dazu werden geeignete

Visualisierungstechniken verwendet.

• Konzentration auf wesentliche Informationen:Konzentration auf wesentliche Informationen:Konzentration auf wesentliche Informationen:Konzentration auf wesentliche Informationen: Auf eine Überhäufung

an Detailinformationen wird verzichtet. Auffällige

Visualisierungsmerkmale wie z.B. Ampeln werden eingesetzt, damit der

Betrachter die Informationen schnell erfassen kann.

• Spezifische Lösung:Spezifische Lösung:Spezifische Lösung:Spezifische Lösung: Dashboards werden den Bedürfnissen des

Endanwenders angepasst.

Key Performance Indicators (KPIs) sind Kennzahlen von besonders großer

Bedeutung für unternehmerische Entscheidungen. Mit ihrer Hilfe wird gerne die

Wirtschaftlichkeit eines Unternehmens durch einen Soll-Ist-Vergleich ermittelt.

Sie sind deshalb ein wichtiges Hilfsmittel für Führungspersonen. Weil solche

Kennzahlen für sich allein genommen keine Aussagekraft haben, werden sie dem

Benutzer in Verbindung mit anderen Kennzahlen präsentiert. Zur visuellen

Darstellung der KPIs dienen die Dashboards, die die Werte mit Hilfe der bereits

erwähnten Ampeln, Tachometern oder Thermometern verdeutlichen.

1.6.1.6.1.6.1.6. PortalePortalePortalePortale

Portale bieten eine individuell angepasste Zugriffsmöglichkeit auf Inhalte und

Applikationen. Durch ein Portal erhält der Anwender einen zentralen Zugang zu

ausgewählten Themenbereichen sowie den zugehörigen Informationen und

Diensten.

Page 19: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 19 Version 1.0

Portale basieren auf Web-Technologien. Ihre Inhalte werden in Web-Browsern

dargestellt. Das erfordert einen Web-Server, der die Nutzeranfragen (Requests)

beantwortet, damit die benötigten Informationen in Form von Portlets

dargestellt werden können. Portlets sind kleine Fenster auf der Web-Seite eines

Portals, die mit beliebigen Inhalten befüllt und innerhalb des Portalfensters

verschoben werden können. Der Vorteil eines Portals ist, dass sich der Benutzer

nur einmal am Portal anmelden muss, nach der Authentifizierung aber auf alle

im Portal enthaltenen Anwendungen und Dienste Zugriff hat.

In der Business Intelligence dienen Portale zur Darstellung von webbasierten

Berichten und Dashboards. Das Portal fungiert innerhalb eines Unternehmens als

zentraler „Point of Access“ auf unternehmerische Kennzahlen und deren

Darstellung in Reports oder Dashboards. Der Benutzer meldet sich einmal am

Portal an und kann dann auf die BI-Funktionalitäten im Portal zugreifen.

Page 20: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 20 Version 1.0

2222.... Anbieter von Open Source Anbieter von Open Source Anbieter von Open Source Anbieter von Open Source Business Business Business Business IntelligenceIntelligenceIntelligenceIntelligence

Pentaho, JasperSoft und Jedox sind drei marktführende Anbieter von

kommerzieller Open Source-Software für Business Intelligence. Ihre Produkte sind

mittlerweile auf dem Markt gut etabliert, weshalb sie im Fokus des vorliegenden

Dokuments stehen. Alle drei Anbieter unterscheiden in ihrer Produktpalette

zwischen kostenpflichtigen Enterprise Edition-Versionen und einer Community-

Version, die kostenlos zum Download zur Verfügung steht. Die Enterprise Edition-

Versionen bieten meist mehr Funktionen als die Community-Versionen und eine

Reihe von Dienstleistungen, die Support, Schulungen oder gar Consulting

umfassen können.

2.1.2.1.2.1.2.1. PentahoPentahoPentahoPentaho: Pentaho: Pentaho: Pentaho: Pentaho BIBIBIBI----SuiteSuiteSuiteSuite

Pentaho ist neben JasperSoft der bekannteste Anbieter kommerzieller Open

Source-Software. Pentaho entwickelt und vertreibt eine Business Intelligence-

Plattform, die Pentaho BI-Suite. Daneben bietet das Unternehmen

kostenpflichtige Dienstleistungen wie professionellen Support an. Die Pentaho

BI-Suite entstand 2002, als verschiedene Open Source-Projekte im Business

Intelligence-Bereich wie JFreeReport, Kettle, Mondrian und Weka zu einer BI-

Plattform zusammengefasst wurden.

Die Pentaho BI-Suite hat einen modularen Aufbau. Die einzelnen Module

entsprechen den BI-Funktionsbereichen ETL-Prozesse, OLAP-Analysen, Data

Mining, Reporting und Dashboards. Sie können im Rahmen der Suite verwendet

werden, es ist aber auch möglich, einzelne Komponenten alleine einzusetzen

(Abbildung 6).

Page 21: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 21 Version 1.0

Zur Umsetzung der BI-Funktionalitäten setzt Pentaho den Java-

Applikationsserver Tomcat ein. Die Benutzeroberfläche (user console) und die

administrative Sicht (administration console) sind Java-Webanwendungen. Die

user console umfasst Beispielordner, kann aber um weitere Ordner ergänzt

werden. Neue Berichte oder OLAP-Analysen können hier angelegt werden, für

einen besseren Überblick lassen sich verschiedene Ordner mit Unterordnern

erstellen und verwalten. Die administration console dient zur

Benutzerverwaltung, der Vergabe von Berechtigungen und der Konfiguration von

Datenbanken.

2.1.1.2.1.1.2.1.1.2.1.1. EEEETL: TL: TL: TL: Pentaho Data Integration (Kettle)Pentaho Data Integration (Kettle)Pentaho Data Integration (Kettle)Pentaho Data Integration (Kettle)

Das ETL-Tool von Pentaho heißt Pentaho Data Integration. Es ist aus dem sehr

beliebten Open Source-Projekt Kettle hervorgegangen und wird auch als

integrierter Bestandteil der Suite noch gerne Kettle genannt. Pentaho Data

Integration unterliegt der LGPL-Lizenz. Der Einsatz ist sowohl mit Pentaho als

auch als Standalone-Tool möglich.

Abbildung 6: Der modulare Aufbau der PentahoAbbildung 6: Der modulare Aufbau der PentahoAbbildung 6: Der modulare Aufbau der PentahoAbbildung 6: Der modulare Aufbau der Pentaho----BIBIBIBI----SuiteSuiteSuiteSuite

Page 22: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 22 Version 1.0

AufbauAufbauAufbauAufbau

Pentaho Data Integration besteht aus vier Einzelapplikationen:

• SpoonSpoonSpoonSpoon ist verantwortlich für die grafische Benutzerschnittstelle.

• PanPanPanPan ist zuständig für die Stapelverarbeitung von Transformationen.

• KitchenKitchenKitchenKitchen erledigt die Stapelverarbeitung von Job-Ketten.

• CarteCarteCarteCarte hat die Aufgabe, einen "Remote-Server" zu aktivieren, mit dem

Spoon-Transformationen remote ausgelöst werden können.

Kettle basiert auf der Entwicklungsumgebung Eclipse und ist deshalb ähnlich

strukturiert und mit Hilfe von Plugins erweiterbar. Neben freien existieren auch

kostenpflichtige Plugins, wie z.B. ein SAP-Plugin mit dem Namen „ProERPconn",

das den Datenaustausch mit SAP-Systemen ermöglicht.

Mit Kettle können entweder Transformationen oder Jobs angelegt werden.

Transformationen umfassen den Import und Export der Daten. Jobs

konzentrieren sich auf die Umsetzung von mehreren Transformationen und

anderen Prozessen.

NutzungNutzungNutzungNutzung

Die Entwicklungsumgebung von Kettle ist übersichtlich aufgebaut und

unkompliziert zu bedienen. Per Mausklick können die „Steps" (einzelne

Bestandteile) des Jobs bzw. der Transformation erzeugt werden. Die "Hops" sind

die Verbindungspfeile zwischen den Steps (Abbildung 7). Der Datentransfer von

bzw. in eine Datenbank erfordert eine Datenbankanbindung. Diese Anbindung

wird einmalig im View-Fenster erstellt und kann mehrmals verwendet werden.

Wenn Kettle im Zusammenhang mit Pentaho verwendet wird, bietet Pentaho die

Option, generierte Jobs in einer speziellen „administration console“ zu verwalten.

Page 23: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 23 Version 1.0

Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen

Vom Aufbau ausgehend ist Pentaho Data Integration sehr gut strukturiert,

übersichtlich und unkompliziert in der Bedienung. Für die Gliederung der ETL-

Elemente nach Anwendungsbereichen gibt es eine einheitliche Struktur. Kettle

eignet sich daher gut für ETL-Einsteiger. Ebenfalls positiv ins Auge fallen die

großen Erweiterungsmöglichkeiten durch die vielen Plugins.

Für SAP-Anwender gibt es ein eigenes Plugin für Kettle, den „ProERPconn“ des

Pentaho-Partners proratio. Er ist ohne weiteres in die Umgebung

implementierbar, allerdings kostenpflichtig.

2.1.2.2.1.2.2.1.2.2.1.2. Pentaho Analysis Services (Mondrian)Pentaho Analysis Services (Mondrian)Pentaho Analysis Services (Mondrian)Pentaho Analysis Services (Mondrian)

Die Pentaho Analysis Services bestehen im Wesentlichen aus dem Open Source-

Projekt Mondrian. Sie setzen sich zusammen aus der Schema-Workbench, der

Mondrian-Webanwendung und dem Aggregation Designer.

Abbildung 7: ETLAbbildung 7: ETLAbbildung 7: ETLAbbildung 7: ETL----Prozesse mit KettleProzesse mit KettleProzesse mit KettleProzesse mit Kettle

Page 24: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 24 Version 1.0

2.1.2.1.2.1.2.1.2.1.2.1.2.1.2.1. Mondrian SchemaMondrian SchemaMondrian SchemaMondrian Schema----WorkbenchWorkbenchWorkbenchWorkbench

Die Mondrian Schema-Workbench wird sowohl von Pentaho als auch von

Mitbewerber JasperSoft genutzt und ist für die Erstellung von Mondrian-

Schemata basierend auf R-OLAP-Systemen geeignet. Ein Schema wird per Drag-

and-Drop-Technik angefertigt und als XML-Datei abgespeichert. Wichtig ist dabei

die Betrachtung von R-OLAP-Systemen, weil sich die Schema-Workbench auf die

strukturierten Tabellen eines Relationalen Datenbankmanagement Systems

bezieht. Zur Erstellung eines Schemas wird ein Cube definiert, der aus einer

Faktentabelle und mehreren Dimensionstabellen besteht.

AufbauAufbauAufbauAufbau

Die Schema-Workbench umfasst Komponenten wie Cubes, die zugehörigen

Dimensionen, Hierarchien, Levels oder Kennzahlen. Das Schema wird in einer

Baumstruktur angezeigt. MDX-Abfragen können in einem Editor durchgeführt

werden.

NutzungNutzungNutzungNutzung

Über die Oberfläche kann der Anwender ein neues Schema bzw. eine neue MDX-

Anweisung erstellen oder ein Vorhandenes öffnen. Sobald ein neues Schema

erzeugt wird, muss eine Datenbankverbindung angegeben werden. Per

Mausklick wird ein Cube generiert und die zugehörige Faktentabelle mit ihren

Dimensionstabellen hinzugefügt. Es entsteht eine Baumstruktur, mit der weitere

Elemente wie Kennzahlen oder Hierarchien einfach angelegt werden können. Die

Schema-Workbench speichert das Schema im XML-Format und es besteht die

Möglichkeit, das Schema in der jeweiligen BI-Plattform zu publizieren.

2.1.2.2.2.1.2.2.2.1.2.2.2.1.2.2. MondrianMondrianMondrianMondrian----WebanwendungWebanwendungWebanwendungWebanwendung

Für das Webfrontend für Mondrian gibt es momentan drei Anwendungen: Das

von Pentaho erst kürzlich erworbene Produkt ClearView des Drittanbieters

LucidEra, JPivot und die Pentaho Analysis Tools (PAT). Klassisches Webfrontend

war bis vor kurzem das Open Source-Projekt JPivot. JPivot besitzt alle Funktionen

zur Durchführung von OLAP-Analysen, wurde jedoch von Anwendern als

umständlich und visuell wenig ansprechend wahrgenommen. Seit kurzem setzt

Pentaho daher ClearView ein, allerdings nur in der Enterprise Edition. Die

Community Version enthält weiterhin JPivot, es ist aber geplant, JPivot durch das

Open Source-Projekt Pentaho Analysis Tools (PAT) zu ersetzen. PAT gilt als

anwenderfreundlicher und zeitgemäßer als JPivot, eine erste stabile Version soll

Weihnachten 2009 veröffentlicht werden. Da PAT im Gegensatz zu JPivot noch

Page 25: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 25 Version 1.0

nicht in die Pentaho BI-Plattform integriert ist, die meisten User aber bis zur

Einbindung von PAT mit JPivot arbeiten dürften, wird im Folgenden die

Arbeitsweise von JPivot beschrieben.

Der Datenzugriff wird bei JPivot über MDX-Abfragen durchgeführt. Mit Hilfe des

Mondrian-Schemas werden die Abfragen in eine SQL-Syntax übersetzt und auf

der Datenbank ausgeführt. JPivot ermöglicht die grafische Darstellung der

Ergebnisse in Form von Tabellen oder Diagrammen. Die Mondrian Cubes können

in Excel mit Hilfe von Pivot-Tabellen ausgewertet werden. Zu diesem Zweck

enthält die Pentaho-Plattform mittlerweile nicht mehr das Excel-Add-In Pentaho

Spreadsheet Services, es gibt aber einen Drittanbieter namens Simba. Mit dem

kostenpflichtigen SimbaO2X-Plugin kann Excel als Frontend zur Darstellung von

Mondrian Cubes verwendet werden, was für Anwender aus technikfernen

Fachabteilungen sicher eine attraktive Alternative zum eher umständlich zu

bedienenden JPivot ist.

Das Webfrontend von Mondrian besteht aus JPivot-Tabellen. Diese umfassen in

einer tabellarischen Sicht die Datenwürfel, die in der Schema-Workbench erstellt

wurden, und eine Leiste zur Durchführung von OLAP-Analysen. Darunter befindet

sich ein OLAP-Navigator, mit dem sich die Dimensionen eines Cubes frei

kombinieren und die anzuzeigenden Daten auswählen lassen.

Abbildung 8: Der Zugriff auf Excel PivotAbbildung 8: Der Zugriff auf Excel PivotAbbildung 8: Der Zugriff auf Excel PivotAbbildung 8: Der Zugriff auf Excel Pivot----Tabellen mit SimbaTabellen mit SimbaTabellen mit SimbaTabellen mit Simba

Page 26: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 26 Version 1.0

NutzungNutzungNutzungNutzung

Mit jPivot werden OLAP-Analysen durchgeführt, MDX-Anweisungen erzeugt und

Daten in Excel oder als gedrucktes Dokument ausgegeben.

2.1.2.3.2.1.2.3.2.1.2.3.2.1.2.3. Aggregation DesignerAggregation DesignerAggregation DesignerAggregation Designer

Um die Leistung von OLAP-Analysen zu steigern, wurde von Pentaho der

Aggregation Designer entwickelt. Der Designer erstellt Tabellen, die der

Datenbank den Aggregationsprozess ersparen.

AufbauAufbauAufbauAufbau

Der Aggregation Designer ist ein separates Werkzeug mit einer einfachen

Struktur. Drei Fenster bilden die Oberfläche. Die linke Sicht enthält die

Dimensionen des ausgewählten Cubes mit den entsprechenden Levels. Ein

Grafikfenster demonstriert die Performance des Ergebnisses.

NutzungNutzungNutzungNutzung

Der Aggregation Designer lässt sich sehr leicht bedienen. Durch vorgefertigte

Wizards werden Datenbankverbindungen und das bereits existierende Schema

angelegt. Die zugehörigen Dimensionen werden angezeigt und die

entsprechenden Levels können ausgewählt werden. Nach dem Speichern kann

das aggregierte Schema im BI-Server veröffentlicht werden.

Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen

Die Mondrian-Plattform setzt sich aus mehreren Einzeltools zusammen und

erscheint daher auf den ersten Blick unübersichtlich und unstrukturiert.

Eine große Erleichterung für Endanwender-Szenarios stellt das Simba-Plugin dar.

Mit dem Plugin können Auswertungen aus Mondrian direkt in Excel-Pivot-

Tabellen importiert werden, sodass der Endanwender innerhalb seiner

gewohnten Excel-Umgebung arbeiten und gleichzeitig schnelle Analysen

durchführen kann.

Im SAP-Bereich eignet sich Mondrian beispielsweise für die Generierung von

Cubes, die SAP-Daten beinhalten. Dafür werden zunächst die Daten aus dem SAP-

Page 27: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 27 Version 1.0

System exportiert, um daraus Cubes zu bilden, auf denen dann die OLAP-Analyse

ausgeführt wird – wird Simba verwendet, auch in Excel.

2.1.3.2.1.3.2.1.3.2.1.3. Pentaho WEKAPentaho WEKAPentaho WEKAPentaho WEKA

Pentaho kooperiert im Bereich Data Mining seit 2006 mit dem WEKA-Projekt. Das

Projekt wurde 1993 an der Universität von Waikato (Neuseeland) gestartet. WEKA

steht unter der GPL und kann auch unabhängig vom Pentaho BI-Server eingesetzt

werden. Das Tool umfasst drei Oberflächen: Explorer, Experimenter und

Knowledge Flow.

• Explorer:Explorer:Explorer:Explorer: Mit Hilfe des Explorers gibt der Anwender die Datenquelle

an, aus der die benötigten Daten importiert werden. Gleichzeitig

werden darüber Daten geändert und gefiltert, um anschließend die

Algorithmen ausführen zu können.

• Experimenter: Experimenter: Experimenter: Experimenter: Der Experimenter besitzt eine Oberfläche für das

Anlegen und Testen von Lernansätzen in Form von Experimenten.

Der Anwender legt eine Datei an, in der die Ergebnisse geschrieben

werden, wählt die Algorithmen aus, die ausgeführt werden sollen,

und gibt die Datenquelle an. Das Experiment wird durchgeführt, das

Ergebnis in einem eigenen Fenster dargestellt.

• Knowledge Flow:Knowledge Flow:Knowledge Flow:Knowledge Flow: Als eine weitere Option des Explorers ermöglicht

Knowledge Flow, Data-Mining Analysen als Datenflussdiagramme

zu visualisieren.

2.1.4.2.1.4.2.1.4.2.1.4. Pentaho Report DesignerPentaho Report DesignerPentaho Report DesignerPentaho Report Designer

Pentaho Reporting ist eine Weiterführung des Projekts JFreeReport, das unter

dem Namen Classic Reporting Engine herausgegeben wird. JFreeReport ist eine

freie Bibliothek von Java-Klassen zum Generieren von Berichten, lizensiert unter

der LGPL. Das Projekt wurde im Jahre 2002 erstmals zum Download angeboten

und 2006 in Pentaho integriert. Anhand von JFreeReport lassen sich XML-basierte

Berichte erstellen und in verschiedene Formate wie csv, html oder pdf

exportieren. Für die Erstellung von Berichten steht dem Anwender eine eigene

Oberfläche angeboten: Der Pentaho Report Designer. Alternativ kann auch der

mit etwas weniger Funktionen ausgestattete Report Design Wizard gewählt

werden.

Page 28: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 28 Version 1.0

Pentaho erlaubt das Generieren von Berichten in verschiedenen Varianten: Zum

einen mit Hilfe des Pentaho Report Designer als separatem

Berichtsentwicklungstools, zum anderen innerhalb der BI-Plattform durch fertige

Vorlagen (Templates). Der Pentaho Report Designer ermöglicht es, die generierten

Berichte auf der BI-Plattform zu publizieren.

AufbauAufbauAufbauAufbau

Eine Palette listet alle vorhandenen Berichtselemente des Report Designers auf.

Die Komponenten der Palette können per Drag-and-Drop-Technik auf die

Oberfläche platziert und bearbeitet werden. Die komplette Struktur des Berichtes

wird in einer hierarchischen Gliederung wiedergegeben.

NutzungNutzungNutzungNutzung

Der Anwender kann zwischen einer manuellen Berichterstellung und dem Report

Design Wizard (siehe Abbildung 4.21.) entscheiden. Mit dem Report Design

Wizard wird auf einfache Weise ein Standardbericht erzeugt. Für mehr

Flexibilität bei der Erstellung und Gestaltung des Berichts sollte man die Berichte

jedoch manuell erstellen. Wie bei anderen Reporting-Tools auch, wird ein Bericht

in einzelne Bereiche wie ”Page Header”, ”Report Header”, ”Item Band”, ”Report

Footer” und ”Page Footer“ gegliedert”. Sobald Layout und Design des Berichts

feststehen, hat der Anwender die Option, den Bericht zu speichern oder auf der

BI-Plattform zu veröffentlichen.

Erfahrungen und Erfahrungen und Erfahrungen und Erfahrungen und BewertungBewertungBewertungBewertung

Der Report Designer von Pentaho hat eine einfache Struktur, lässt sich sehr leicht

bedienen und benötigt nur wenig Einarbeitungszeit. Er umfasst eine große

Auswahl an qualitativ hochwertigen Diagrammen, sodass ansprechende Berichte

erstellt werden können. Als Datenquellen lassen sich auch SAP-Systeme und

Excel-Dateien anbinden. Das Publizieren des generierten Berichts ist direkt auf

der Report Designer-Oberfläche und Pentaho-BI-Plattform möglich.

2.1.5.2.1.5.2.1.5.2.1.5. Pentaho DashboardPentaho DashboardPentaho DashboardPentaho Dashboard----BuildingBuildingBuildingBuilding

Eine Oberfläche für die grafische Erstellung von Dashboards steht bei Pentaho

nur in der kostenpflichtigen Enterprise Edition zur Verfügung. Die Community

Version enthält aber Bibliotheken des Projekts Community Dashboard

Framework, mit denen manuell Dashboards generiert werden können (Abbildung

9).

Page 29: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 29 Version 1.0

Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen

Durch die manuelle Dashboard-Erstellung ist es für einen technisch weniger

versierten Anwender schwierig, schnell und einfach Visualisierungen zu

erzeugen. Notwendig ist Entwicklerwissen z.B. über die Funktionsweise von XML-

Dateien und html- und Java Script-Kenntnisse. Auch das Community Dashboards

Framework und seine Bibliotheken ändern wenig daran, weil die damit

entwickelten Dashboards nicht ohne Programmierkenntnisse verändert werden

können.

2.1.6.2.1.6.2.1.6.2.1.6. Pentaho Enterprise EditionPentaho Enterprise EditionPentaho Enterprise EditionPentaho Enterprise Edition

Die Pentaho Enterprise Edition ist das kostenpflichtige Komplettpaket der

Pentaho BI-Suite. Sie enthält alle Designer-Tools wie z.B. Aggregation Designer,

Data Integration (Kettle), Report Designer und Schema-Workbench. Die

Community Version liefert diese Tools nicht innerhalb eines Gesamtpakets,

sondern bietet sie einzeln zum Download an. Vergleicht man die einzelnen

Komponenten der beiden Versionen, sind kaum Unterschiede zwischen den

Community Design-Tools und den Enterprise Edition Design-Tools festzustellen

mit Ausnahme des Dashboard Designers (Abbildung 10).

Abbildung Abbildung Abbildung Abbildung 6666: Die Erstellung von Dashboards in der Community Version: Die Erstellung von Dashboards in der Community Version: Die Erstellung von Dashboards in der Community Version: Die Erstellung von Dashboards in der Community Version

Page 30: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 30 Version 1.0

Mit dem Designer kann der Anwender anhand vorher gespeicherter Berichte

Dashboards erstellen. Dafür können Filter gesetzt werden, um Abhängigkeiten zu

erzeugen. Grafisch gesehen ist der Dashboard-Designer sehr übersichtlich

strukturiert und enthält die wichtigsten Funktionen zur Dashboard-Generierung.

Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen

Die Pentaho Enterprise Edition hat aus Anwendersicht den Vorteil, dass sowohl

die Design-Tools als auch die BI-Plattform auf einem Blick zur Verfügung stehen,

weil sie nach der Installation über das Start-Menü aufgerufen werden können.

Aus Entwicklersicht ist das separate Herunterladen der Open Source-Design-Tools

und der BI-Plattform innerhalb der Community Version aber kein Nachteil

gegenüber der Enterprise Edition.

Die von der Community Version bereitgestellten Module weisen die gleichen

Funktionalitäten wie die der Enterprise Version auf. Die wesentlichen

Unterschiede sind der fehlenden Dashboard-Designer in der Community-Version

und die Dienstleistungen der Enterprise Edition. Für Entwickler spielen diese

Unterschiede sicher keine Rolle. Endanwender ohne Programmierkenntnisse aus

der Managementebene bevorzugen aber eine leicht zu bedienende Oberfläche

Abbildung Abbildung Abbildung Abbildung 7777: Der Dashboard Designer der Pentaho Enterprise Edition: Der Dashboard Designer der Pentaho Enterprise Edition: Der Dashboard Designer der Pentaho Enterprise Edition: Der Dashboard Designer der Pentaho Enterprise Edition

Page 31: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 31 Version 1.0

für die Darstellung ihrer Kennzahlen. Bei größeren BI-Projekten dürften

außerdem die Support- und Service-Leistungen der Enterprise Edition eine

sinnvolle Investition darstellen.

2.1.7.2.1.7.2.1.7.2.1.7. Fazit: PentahoFazit: PentahoFazit: PentahoFazit: Pentaho

Die Pentaho Community Version bietet eine große Palette an Anwendungen für

die verschiedenen Fragestellungen der Business Intelligence. Besonders positiv

fallen Pentaho Data Integration (Kettle) und Pentaho Report Designer ins Auge.

Kettle ist mit Hilfe von Plugins erweiterbar und damit sehr flexibel im Hinblick

auf neue oder sich ändernde BI-Anforderungen. Der Report Designer überzeugt

durch das Zusammenspiel mit der BI-Plattform: Berichte werden im Report

Designer generiert und können anschließend auf der BI-Plattform veröffentlicht

werden.

OLAP-Funktionalität stellt Mondrian auf der Grundlage der R-OLAP-Technologie

bereit. Durch den Einsatz der Drittanbieter-Lösung Simba kann Mondrian in Excel

importiert werden. Mit Blick auf den Anwenderkreis aus technikfernen Bereichen

wie Controlling, Finanzen oder Marketing stellt das Excel-Frontend einen klaren

Vorteil dar, weil diese Anwender OLAP-Analysen in ihrer gewohnten

Arbeitsumgebung durchführen können.

Page 32: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 32 Version 1.0

2.2.2.2.2.2.2.2. JasperSoftJasperSoftJasperSoftJasperSoft BIBIBIBI----SuiteSuiteSuiteSuite

JasperSoft wurde 2001 unter dem Namen Panscopic gegründet und spezialisierte

sich zunächst auf den Bereich Reporting. Gleichzeitig entwickelte ein

Programmierer namens Teodor Danciu die Open Source Software JasperReports.

Er wurde daraufhin von Panscopic übernommen und der Firmenname in

JasperSoft geändert. JasperSoft ist seither nicht nur im Reporting-Bereich tätig,

sondern entwickelt auch Lösungen für andere Bereiche der Business Intelligence.

Seit 2005 vertreibt JasperSoft auch kommerzielle Produkte.

JasperSoft hat wie Pentaho eine Business Intelligence-Plattform im Angebot. Die

Suite ist wie Pentaho modular aufgebaut: Für die verschiedenen BI-Bereiche gibt

es einzelne Werkzeuge:

• JasperETL ist verantwortlich für den ETL-Prozess und enthält Talend

Open Studio, eine auch eigenständig erhältliche Anwendung.

• JasperAnalysis ist zuständig für OLAP-Analysen. Es ist identisch mit

dem Pentaho-Modul Pentaho Analysis Services, weil es aus den

gleichen Komponenten besteht: der Mondrian Schema-Workbench,

der Mondrian Webanwendung und dem Aggregation Designer.

• JasperReports umfasst die Entwicklungsumgebung iReport, die der

Erstellung von Berichten dient.

Abbildung Abbildung Abbildung Abbildung 8888: : : : Der mDer mDer mDer modulare Aufbau der JasperSoft BIodulare Aufbau der JasperSoft BIodulare Aufbau der JasperSoft BIodulare Aufbau der JasperSoft BI----SuiteSuiteSuiteSuite

Page 33: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 33 Version 1.0

2.2.1.2.2.1.2.2.1.2.2.1. JasperSoft JasperSoft JasperSoft JasperSoft BIBIBIBI----PlattformPlattformPlattformPlattform

Die JasperSoft BI-Plattform basiert wie Pentaho auf einem Server. Wie bei

Pentaho handelt es sich um den Tomcat Server. Die grafische Oberfläche hat eine

Baumstruktur und ist gegliedert nach Themengebieten wie OLAP-Analysen oder

Reporting. Anders als bei Pentaho gibt es zwei verschiedene

Anmeldemöglichkeiten: als User (mit Leserechten) oder als Administrator

(Schreib- und Leserechte). Dafür existiert keine zusätzliche administration

console wie bei Pentaho.

2.2.2.2.2.2.2.2.2.2.2.2. JasperETL (TalenJasperETL (TalenJasperETL (TalenJasperETL (Talend Open Studio)d Open Studio)d Open Studio)d Open Studio)

JasperSoft setzt im ETL-Bereich das Talend Open Studio (TOS) ein. Dafür

kooperiert JasperSoft mit dem französischen Anbieter Talend, der sich auf

Datenintegration spezialisiert hat. Talend Open Studio wurde unter der GPL-

Lizenz veröffentlicht.

AufbauAufbauAufbauAufbau

Wie bei Pentaho Kettle können in JasperETL ETL-Prozesse per Drag-and-Drop auf

einer grafischen Oberfläche erstellt werden. Der Unterschied zu Kettle ist, dass

ein Codegenerator die grafisch erstellten Prozesse automatisch in Code (Java oder

Perl) umwandelt. Auch Talend hat seinen Ursprung in der Eclipse-Umgebung.

Hier können neue Jobs und die zugehörigen Komponenten angelegt und

verwaltet werden. Der Paletten-View enthält eine große Anzahl an Konnektoren,

die Verbindungen zu Datenbanken, ERP-Systemen oder zu einfachen Dateien (wie

XML- oder Excel-Dateien) aufbauen können.

NutzungNutzungNutzungNutzung

Abweichend zu Kettle umfasst der Ausdruck „Job" bei JasperETL beide Vorgänge

„Transformation“ und „Job". Bei Kettle setzt sich ein Job aus mehreren

Transformationen zusammen. Talend verbindet dagegen mehrere Jobs

miteinander und unterscheidet nicht zwischen Job und Transformation.

Der große Funktionsumfang von JasperETL erleichtert den Prozessablauf beim

ETL. Durch die vielen Konnektoren kann JasperETL mit allen wichtigen

Datenbanken eingesetzt werden. Zu SAP gibt es eine eigene Schnittstelle, den

Java-Connector SAP JCo. Bei der Ausgabe von SAP-Daten in JasperETL werden

diese allerdings durch Trennzeichen getrennt im Zielordner gespeichert. Das

muss manuell wieder rückgängig gemacht werden.

Page 34: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 34 Version 1.0

Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen

Die Talend Open Studio-Entwicklungsumgebung ist auf den ersten Blick sehr

unübersichtlich. Angesichts der vielen Elemente fühlt man sich schnell

überfordert. Die Komponenten des Paletten-Views sind im Unterschied zu Kettle

nicht nach Anwendungsbereichen, sondern funktional kategorisiert. Hier

entscheidet allein der Anwender, was ihm lieber ist. Talend Open Studio verfügt

über eine deutlich größere Anzahl an Konnektoren als Kettle. Durch den JCo-

Connector ist die Anbindung an SAP möglich, der Datenzugriff erfolgt dabei

durch BAPI-Aufrufe. Interessant für Perl-Anwender und ein

Unterscheidungsmerkmal zu Pentaho und Palo: Im Open Studio können

Codeanpassungen nicht nur in Java, sondern auch in Perl vorgenommen werden.

2.2.3.2.2.3.2.2.3.2.2.3. JasperAnalysis (Mondrian)JasperAnalysis (Mondrian)JasperAnalysis (Mondrian)JasperAnalysis (Mondrian)

JasperSoft benutzt im Bereich der OLAP-Analysen die gleichen Open Source

Software-Tools, die auch Pentaho einsetzt. Es wird die Mondrian Schema-

Workbench angeboten und weitere Produkte wie der Aggregation Designer. Da

die Funktionsweise gleich ist, wird für eine detaillierte Darstellung auf den

entsprechenden Abschnitt bei Pentaho verwiesen.

Abbildung Abbildung Abbildung Abbildung 9999: JasperETL : JasperETL : JasperETL : JasperETL ---- das Open Studio von Talenddas Open Studio von Talenddas Open Studio von Talenddas Open Studio von Talend

Page 35: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 35 Version 1.0

2.2.4.2.2.4.2.2.4.2.2.4. JasperReportsJasperReportsJasperReportsJasperReports

JasperReports ist wie JFreeReport eine Open Source Reporting-Bibliothek, die auf

Java basiert und unter der GNU GPL lizenziert ist. Die Anwendung entstand 2001

entworfen und wird seitdem weiterentwickelt. Berichte werden in JasperReports

mit dem speziellen Werkzeugs iReport erstellt.

2.2.4.1.2.2.4.1.2.2.4.1.2.2.4.1. iReportiReportiReportiReport

Das grafische Entwicklungstool iReport erzeugt die XML-Dateien für die Berichte.

Erstmals 2002 herausgebracht, ist iReport unter der GPL veröffentlicht.

AufbauAufbauAufbauAufbau

iReport ist in Java geschrieben und hat eine ähnliche Oberfläche wie der Pentaho

Report Designer und der kommerzielle Berichts-Designer von Microsoft. Ein

„Report Inspector” listet die einzelnen Elemente des zu erstellenden Berichts auf,

z.B. die Datenbankverbindung oder die im Bericht verwendeten Tabellen oder

Charts. Die Berichte sind wie bei Pentaho in Bereiche unterteilt: „Page Header”,

„Column Header”, „Detail”, „Column Footer” und „Page Footer”.

NutzungNutzungNutzungNutzung

Berichte werden in iReport auf der „Design”-Oberfläche erstellt. Gleichzeitig

generiert das Backend automatisch einen XML-Code. Ein Bericht wird mit Hilfe

mehrerer Prozesse kreiert: Zunächst wird eine ”.jrxml”-Datei erzeugt, der nächste

Schritt erzeugt daraus eine ”.jasper”-Datei, woraufhin eine ”.jrprint”-Datei

entsteht. Jetzt kann der Bericht z.B. als „.html”- oder ”.pdf”-Datei geöffnet

werden.

Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen

Das Reporting Tool iReport bietet mehr Funktionen als der Pentaho Report

Designer. Beispielsweise beinhaltet iReport einen Expression Editor, der

Variablen, Parameter, Felder und andere Elemente umfasst. Diese Elemente

ermöglichen eine flexible Gestaltung des Berichts. Außerdem hat iReport mehr

Diagramme im Angebot als der Pentaho Report Designer.

Page 36: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 36 Version 1.0

Der Nachteil von iReport ist, dass das Publizieren eines Berichts nicht über die

iReport-Umgebung erfolgt, sondern von der BI-Plattform von JasperSoft

hochgeladen werden muss.

2.2.5.2.2.5.2.2.5.2.2.5. JasperSoft JasperSoft JasperSoft JasperSoft BIBIBIBI Suite Professional EditionSuite Professional EditionSuite Professional EditionSuite Professional Edition

Die kostenpflichtige Version der JasperSoft BI Suite nennt sich Professional

Edition und bietet neben den Modulen der Community Version zusätzlich einen

Dashboard-Designer an. Der Designer ist eine Webanwendung und zugänglich

über den JasperServer.

Der Dashboard-Designer bietet eine Reihe von Optionen zur flexiblen Gestaltung

von Dashboards an. Beispielsweise lassen sich die einzelnen Dashboard-Fenster

sowie auch die jeweiligen Filter beliebig platzieren. Daneben ist es möglich, die

Größe der Berichte zu verändern und sie von einer Baumstruktur ausgehend per

Drag-and-Drop zu positionieren.

Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen

Die Professional Edition von JasperSoft wird nicht wie ihr Pentaho-Gegenstück als

Gesamtpaket angeboten. Die einzelnen Design-Tools wie der Aggregation

Abbildung Abbildung Abbildung Abbildung 10101010: Das Berichtsdesign: Das Berichtsdesign: Das Berichtsdesign: Das Berichtsdesign----Tool iReportTool iReportTool iReportTool iReport

Page 37: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 37 Version 1.0

Designer, das ETL-Tool oder die Schema Workbench sind nicht Bestandteil der

Plattform, sondern werden separat vermarktet. Lediglich der Report Designer

iReport und der Webserver sind von vornherein Teil des Pakets.

Die Design-Tools können entweder als Open Source-Variante oder als

kostenpflichte Professional Edition eingesetzt werden. Vorteil der Professional-

Version ist wie bei Pentaho der Dashboard-Designer, der in der freien Variante

von JasperSoft fehlt.

2.2.6.2.2.6.2.2.6.2.2.6. Fazit: JasperSoftFazit: JasperSoftFazit: JasperSoftFazit: JasperSoft

Im Gegensatz zu Pentaho ist die JasperSoft-BI-Suite nicht als Gesamtpaket

konzipiert. Trotz der vorhandenen Plattform ist deutlich, dass die einzelnen

Anwendungen für einen separaten Einsatz entwickelt wurden. Da die Tools

funktional teils sehr stark sind, empfiehlt es sich, für bestimmte BI-

Anforderungen die entsprechende JasperSoft-Anwendung und nicht die gesamte

Plattform einzusetzen.

Abbildung Abbildung Abbildung Abbildung 11111111: Der Dashboard Designer in der JasperSoft Professional Edition: Der Dashboard Designer in der JasperSoft Professional Edition: Der Dashboard Designer in der JasperSoft Professional Edition: Der Dashboard Designer in der JasperSoft Professional Edition

Page 38: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 38 Version 1.0

Positiv ins Auge fallen die vielen Plugins und Konnektoren für die ETL-Lösung

JasperETL/Talend. Besonders der von einem Drittanbieter vertriebene SAP-

Konnektor ist für Anwender aus dem SAP-Bereich sehr interessant. Der Konnektor

kann von Entwicklern ohne ein zusätzliches Plugin eingesetzt werden. Für nicht-

technische Anwender ist die Nutzung allerdings nicht so einfach, weil es

spezieller Modifikationen bedarf, um aus dem SAP-System Daten auslesen zu

können.

iReport und der Aggregation Designer sind vollfunktionale BI-Anwendungen.

Allerdings können die erstellten Berichte bzw. Aggregationstabellen nicht direkt

von der jeweiligen Anwendung auf der JasperSoft BI-Plattform publiziert werden.

Dazu ist ein manueller Publiziervorgang erforderlich.

Im OLAP-Bereich gibt es keinen großen Unterschied zu Pentaho, da JasperSoft

ebenfalls Mondrian einsetzt. Mit Hilfe des Drittanbieters Simba kann dabei Excel

als OLAP-Front-End verwendet werden, was dem nicht-technischen

Anwenderkreis entgegenkommt.

Page 39: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 39 Version 1.0

2.3.2.3.2.3.2.3. PaloPaloPaloPalo BI SuiteBI SuiteBI SuiteBI Suite

Palo ist ein Produkt der Jedox AG und wird für Einzelbereiche der Business

Intelligence wie Planung, Analyse und Berichterstellung eingesetzt. Palo arbeitet

auf Basis von M-OLAP (multidimensionales OLAP; greift auf eine

multidimensionale Datenbank zu) und hat daher den Vorteil, dass es sehr schnell

arbeitet.

Wie Pentaho und JasperSoft kann Palo als Open Source Software, die Community

Version, oder als kostenpflichtigen Enterprise Edition eingesetzt werden.

Die Palo BI Suite Community Version besteht aus den Komponenten

• Palo ETL Server

• Palo OLAP Server

• Palo Worksheet Server und

• Palo Excel Add-In

Die Enterprise Edition enthält die Community-Elementen auf und bietet

zusätzlich den Palo Supervisor Server an.

Abbildung Abbildung Abbildung Abbildung 12121212: Die Palo BI Suite: Die Palo BI Suite: Die Palo BI Suite: Die Palo BI Suite

Page 40: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 40 Version 1.0

BI-Prozesse werden in Palo folgendermaßen durchgeführt: Der Palo ETL Server

bereitet die Daten auf und importiert sie in Palo-Cubes. Alternativ können dafür

auch Kettle oder Talend eingesetzt werden. Nach dem erfolgreichen Import der

Daten können die Palo-Cubes analysiert werden: Entweder über ein Excel-Front-

End oder im Palo Worksheet Server.

2.3.1.2.3.1.2.3.1.2.3.1. Palo OLAP ServerPalo OLAP ServerPalo OLAP ServerPalo OLAP Server

Der Palo OLAP Server ist die Grundlage der Palo BI Suite. Auf ihn greifen die

einzelnen Anwendungen zu. Sein Aufbau basiert auf der M-OLAP-Architektur; in

der Enterprise Edition werden auch Multi-Prozessor-Architekturen unterstützt.

Die Daten werden in Form von Cubes, Dimensionen und Hierarchien gespeichert,

ihre Analyse erfolgt in Echtzeit.

2.3.2.2.3.2.2.3.2.2.3.2. Palo ETL ServerPalo ETL ServerPalo ETL ServerPalo ETL Server

Palo bietet einen speziellen ETL Server für den Datenaustauch zwischen Quell-

und Zielsystemen an. Damit ist nicht nur der Datenimport in Palo Cubes möglich,

sondern auch in die gängigsten Zielsysteme aus verschiedenen Quellsystemen.

Bei der Enterprise Edition können auch Daten aus SAP-Systemen geladen werden.

AufbauAufbauAufbauAufbau

Der Palo ETL Server ist eine Java-Anwendung und wird als Webdienst zur

Verfügung gestellt. Wie bei Kettle gibt es die Unterscheidung zwischen Jobs und

Transformationen. Diese können unter einer Baumstruktur angelegt und

definiert werden. Auch Verbindungen werden in der Baumstruktur festgelegt.

NutzungNutzungNutzungNutzung

Anders als bei den ETL-Tools Kettle und Talend stellt der Palo ETL Server keine

eigenen Konnektoren zu Fremdsystemen bereit. Eine Anbindung an andere

Datenbanken oder Dateiformate ist jedoch möglich, in der Enterprise Edition

kann zusätzlich SAP angebunden werden. Je nach Art des Quellsystems legt man

eine Extraktion fest. Beispielsweise wird die Extraktion bei relationalen

Datenbanken anhand von SQL-Statements durchgeführt. Nach dem

Extraktionsprozess wird mit Hilfe des Loading-Vorgangs die Zielquelle

angegeben. Nach Abschluss der Phasen legt man innerhalb von „Jobs“ fest, wann

das angelegte Projekt gestartet werden soll.

Page 41: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 41 Version 1.0

Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen

Der Palo ETL Server unterstützt zwar auch eine Reihe von Drittsystemen, wenn

man aber erst einmal mit ihm arbeitet, wird klar, dass er den Datenaustausch mit

Palosystemen bevorzugt. Für den Endanwender ist die Anwendung nicht ganz

einfach zu bedienen, es braucht dazu einer gewissen Einarbeitungszeit.

Palo-Cubes können nicht nur in Palo selbst, sondern auch in Talend und Kettle

erstellt werden. Dazu gibt es Konnektoren (Talend) bzw. ein eigenes Palo-Plugin

(Kettle).

2.3.3.2.3.3.2.3.3.2.3.3. Palo WorksheetPalo WorksheetPalo WorksheetPalo Worksheet----ServerServerServerServer

Der Palo Worksheet Server (Abbildung 17) basiert auf einer Webanwendung und

dient zur Generierung und Visualisierung von Berichten oder Analysen und zur

Bereitstellung von Formularen für Benutzereingaben. Daneben werden über ihn

die Benutzerrechte gesteuert.

Abbildung Abbildung Abbildung Abbildung 13131313: Der Palo ETL Server: Der Palo ETL Server: Der Palo ETL Server: Der Palo ETL Server

Page 42: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 42 Version 1.0

AufbauAufbauAufbauAufbau

Der Palo Worksheet-Server besitzt eine Baumstruktur, so dass die einzelnen

Module wie beispielsweise „Ressourcen“ oder „Berichtspeicher“ hierarchisch

strukturiert sind.

Zur Berichtsgenerierung stellt das Tool eine Art Excel-Umgebung über den

Browser bereit. Die Berichte werden als Ressourcen angelegt und können zur

weiteren Bearbeitung im Berichtsspeicher abgelegt werden.

NutzungNutzungNutzungNutzung

Der Palo Worksheet-Server vereinfacht die Erstellung von Reports enorm. Durch

das Anlegen von neuen Arbeitsmappen können die Daten über den Webbrowser

aufgerufen werden, um daraus Berichte zu erstellen. Positiv dabei ist, dass

Sondergrafiken, die es in Excel nicht gibt (Dashboard-Vorlagen wie Tachometer

etc.), eingebunden werden können. Der Worksheet-Server erlaubt außerdem,

Benutzerrechte für Würfel, Berichte und einzelne Zellen innerhalb von Berichten

einzurichten. So können einzelne Zellen für Eingaben freigegeben bzw. gesperrt

werden.

Abbildung Abbildung Abbildung Abbildung 14141414: Der Palo Worksheet Server: Der Palo Worksheet Server: Der Palo Worksheet Server: Der Palo Worksheet Server

Page 43: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 43 Version 1.0

Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen

Der Worksheet-Server von Palo weist zwei entscheidende Vorteile im Bereich der

Berichtgenerierung auf: Der Endanwender auf der Geschäftsseite kann mit der

gewohnten Excel-Umgebung arbeiten, die über den Webbrowser bereitgestellt

wird. Selbst, wenn er Excel nicht installiert hat, kann er die Berichte von

verschiedenen Standorten aus abrufen.

Der zweite Vorteil ist die zentrale Benutzerverwaltung. Sie macht den Worksheet-

Server für Einsatzszenarien in der Planungsebene sehr interessant. Indem

einzelne Zellen freigegeben bzw. gesperrt werden können, wird die Gefahr

falscher Einträge verhindert. So kann der Benutzer gezielt zur Bearbeitung

bestimmter Zellen aufgefordert werden, besitzt aber nicht die Möglichkeit, für

ihn gesperrte Zellen zu editieren.

Page 44: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 44 Version 1.0

2.3.4.2.3.4.2.3.4.2.3.4. Palo Excel AddPalo Excel AddPalo Excel AddPalo Excel Add----inininin

Das Excel Add-in von Palo (Abbildung 18) bringt im Sinne der OLAP-

Funktionalitäten und der Planung einen großen Mehrwert. Der Anwender muss

sich nicht an eine neue Anwendungsumgebung gewöhnen, sondern kann OLAP-

Analysen in Excel selbst durchführen. Das umso mehr, als dass über das Add-in

auch die grafische Berichterstellung erfolgt.

AufbauAufbauAufbauAufbau

Das Add-in gleicht vom Aussehen her exakt Excel, besitzt aber einen zusätzlichen

Menüpunkt mit dem Titel „Palo“, über den sich die Palo-Funktionalitäten

aufrufen lassen. Darüber wird auf vorher angelegte Palo-Würfel zugegriffen. Ad-

hoc-Berichte können per Drag-and-Drop erstellt werden.

NutzungNutzungNutzungNutzung

Über die Excel-Oberfläche fügt man Ansichten ein. Dadurch können Palo-Würfel

selektiert und die entsprechenden Dimensionen mit den Werten angezeigt

werden. Der Zugriff auf die Würfeldaten erfolgt über spezielle Funktionen, die

Excel mit der Datenbank verknüpfen.

Das Entwerfen von neuen Würfeln ist mit dem Add-in auf einfache Weise

möglich. Dimensionen können angelegt werden, um daraus verschiedene Würfel

zu konstruieren.

Abbildung Abbildung Abbildung Abbildung 15151515: Das Palo Excel Add: Das Palo Excel Add: Das Palo Excel Add: Das Palo Excel Add----in mit der Funktion PALO.DATAC()in mit der Funktion PALO.DATAC()in mit der Funktion PALO.DATAC()in mit der Funktion PALO.DATAC()

Page 45: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 45 Version 1.0

Daneben lassen sich Daten nicht nur analysieren, sondern gegebenenfalls auch

zurückschreiben. Palo eignet sich dadurch auch gut als Planungswerkzeug.

Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen

Anwendung findet das Palo Excel Add-in im Controlling und

Finanzplanungsbereich. Die Cube-Daten können je nach Wunsch detailliert im

Excel-Front-End angezeigt oder mit den jeweiligen OLAP-Funktionen analysiert

bzw. verändert werden. Die meisten Anwender favorisieren Excel als Front-End,

weil sich dadurch unübersichtliche Datenmengen bequem anzeigen lassen.

Großer Vorteil des Add-ins ist es, dass der Endanwender Modifikationen selbst

durchführen kann und nicht die IT-Abteilung dazu heranziehen muss.

2.3.5.2.3.5.2.3.5.2.3.5. Palo Supervision ServerPalo Supervision ServerPalo Supervision ServerPalo Supervision Server

Der Palo Supervision Server ist nur in der Palo Enterprise BI Suite enthalten und

dient als Kontrollinstanz für die einzelnen Abläufe bezüglich der Palo Datenbank.

Das betrifft beispielsweise den Prozess „Login eines Benutzers“, d.h. wann ist der

Benutzer eingeloggt, welche Änderungen hat er vorgenommen, wann hat er sich

abgemeldet. Das Tool arbeitet mit PHP Codes, die als Warnsysteme fungieren,

wenn definierte Grenzwerte über- bzw. unterschritten werden. Der Benutzer

kann in solchen Fällen per SMS oder E-Mail kontaktiert werden. Die

Anwendungsgebiete für den Einsatz des Palo Supervision Server sind Bereiche, in

denen Transparenz eine wichtige Rolle spielt, z.B. im Controlling bei der Analyse

bestimmter Kennzahlen wie Gewinn, Umsatz oder Liquidität.

2.3.6.2.3.6.2.3.6.2.3.6. Fazit: PaloFazit: PaloFazit: PaloFazit: Palo

Palo ist ein Softwarepaket zur Analyse und Planung. Die Community Version

umfasst mehrere Einzelanwendungen, die sowohl alleine als auch als

Gesamtpaket eingesetzt werden können. Verglichen mit anderen Open Source BI-

Tools besticht Palo durch die Möglichkeit, einzelne Zellen anpassen zu können.

Palo eignet sich deshalb besonders für die Festlegung von Planzahlen. Ein

weiterer Pluspunkt dabei ist, dass die Änderung von Datenwürfeln ohne die IT-

Abteilung vorgenommen werden kann.

Weitere Pluspunkte sind das Excel Add-in und der ETL-Server. Die

Datenintegration kann bei Palo über beide Tools erfolgen. Im Vergleich zu den

ETL-Werkzeugen der beiden anderen Suiten überzeugt der ETL-Server von Palo

durch die Art der Datenflussmodellierung: Der Design-Prozess läuft bei Palo über

eine selbst entwickelte Webanwendung. Allerdings wird die eigentlich schön

Page 46: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 46 Version 1.0

strukturiert aufgebaute Anwendung bei großen Transformationen leider ein

wenig unübersichtlich.

Der ETL-Server besticht im Vergleich zu Kettle oder Talend mit einer guten

Performance und bietet in der Enterprise Version einen Konnektor zur Integration

von SAP-Daten an.

Beide Anwendungen sind als sehr anwenderfreundlich einzustufen: Dank der

Excel-Anbindung muss der Benutzer seine vertraute Anwendungsumgebung

nicht verlassen, sondern greift einfach über Excel auf die Daten zu. Das erweitert

den Anwenderkreis von Palo, weil damit auch die Fachabteilungen ohne viel

Aufwand Analysen vornehmen können.

Ein weiterer Vorteil ist, dass Palo dem Anwender einige Berechnungen während

des Planungsprozesses erspart. Der Anwender gibt die Vorgehensweise zur

Planzahlenberechnung an, etwa die prozentuale Aufteilung der Zahlen vom

Vorjahr bezüglich der Monate. Palo listet nach derselben Anordnung die

Planzahlen auf.

In Bezug auf diese Punkte kommt also Palo dem nicht-technischen

Anwenderkreis mehr entgegen als Pentaho oder JasperSoft.

Die Enterprise Edition von Palo stellt einen Supervision Server bereit, der als

Kontrollinstanz fungiert und Aktionen wie An- und Abmelden eines Benutzers,

Verändern einer Zelle, Speichern der Datenbank oder die Gruppenzugehörigkeit

des Benutzers protokolliert. Darüber hinaus können Regeln wie das Unter- bzw.

Überschreiten von Grenzwerten definiert werden, sodass der Supervision Server

Warnungen in Form von SMS- oder E-Mail-Benachrichtigungen auslöst.

Page 47: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 47 Version 1.0

3.3.3.3. GesamtbetrachtungGesamtbetrachtungGesamtbetrachtungGesamtbetrachtung

Ziel des vorliegenden White Papers ist es, einen Überblick von drei Lösungen im

Open Source Business Intelligence-Bereich zu geben. In diesem Kapitel werden

die Erkenntnisse noch einmal zusammengefasst.

Alle drei der vorgestellten Open Source Produkte sind modular aufgebaut und

plattformunabhängig. Angeboten werden sie sowohl als Gesamtpakete als auch

als Einzellösungen, die allein betrieben werden können. Die kostenpflichtigen

Versionen von Pentaho, JasperSoft und Palo decken die einzelnen BI-Bereiche wie

ETL-Prozesse, OLAP-Analysen, Berichterstellung und die Zusammenfassung von

Kennzahlen in Dashboards ab. Bis auf die Dashboard-Funktionen trifft das auch

auf die Community-Alternativen zu.

Es ist möglich, die einzelnen Anwendungen untereinander zu kombinieren. Das

gibt dem Anwender größtmögliche Flexibilität bei der Lösung seines jeweiligen

BI-Problems. Hier zeigen sich klar die Vorteile der Herstellerunabhängigkeit und

offenen Standards von Open Source-Software. Beispiel: Zum Laden eines Palo-

Würfels kann entweder der Palo ETL-Server oder aber Talend bzw. Kettle

eingesetzt werden. Der frei zugängliche Quellcode der drei Lösungen kann zudem

geändert oder erweitert werden, wenn für unternehmens- oder

problemspezifische Anforderungen die vorhandenen Funktionen nicht

ausreichen. Das trifft auch auf Integrationsszenarien zu: Muss die Software an

andere Anwendungen angebunden werden, können dank des offen liegenden

Codes und der schon existierenden Konnektoren Schnittstellen erstellt werden.

Da es sich zudem um Java-basierte Lösungen handelt, lassen sich die

vorgestellten Werkzeuge um Plugins erweitern. Beispielsweise können zum

Importieren von Daten aus ERP-Systemen Programmcodes entwickelt und

implementiert werden.

Vor der Durchführung eines BI-Projektes mit Open Source sind wie bei einer

proprietären Software genaue Überlegungen nötig. Hilfreich kann dabei das Vier-

Phasen-Modell sein. Das Vier-Phasen-Modell setzt sich aus den Stufen

Konzeption, Datenarchitektur, technische Architektur und Implementierung

(jeweils mit dem Fokus auf Backend- und Frontend-Aspekte) zusammen und

bildet eine gute gedankliche Grundlage für die Umsetzung von Projekten.

Ob sich die Investition in eine BI-Suite lohnt, lässt sich anhand der Frage nach

dem Integrationsbedarf und der Unternehmensgröße beantworten. So kann es

für ein kleines Unternehmen ausreichend sein, im Bereich der BI die einzelnen

Community-Tools einzusetzen. Interessant wird der Einsatz von BI-Plattformen in

mittelständigen bis großen Firmen, weil diese Firmen aus mehreren Abteilungen

Page 48: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 48 Version 1.0

und hunderten von Mitarbeitern bestehen. Hier entsteht beim Einsatz einer Open

Source-Lösung, selbst in der kostenpflichtigen Enterprise Version, immer noch ein

deutlicher Kostenvorteil, der zur Anpassung und Konfiguration der Lösung

verwendet werden kann. Trotzdem sollte Open Source-Software nicht allein aus

Kostengründen eingesetzt werden. Die ausgewählte Lösung sollte zu den

jeweiligen Anforderungen passen und sie zufriedenstellend erfüllen.

Die untersuchten Open Source-Produkte sind in der Lage, die Anforderungen

typischer Anwendungsszenarien der Business Intelligence zu erfüllen. Sie stellen

bezüglich Leistungsumfang und Anwenderfreundlichkeit vollwertige BI-Produkte

dar und entscheiden sich in den wichtigsten Anwendungsbereichen nur marginal

voneinander. Die größten Unterschiede liegen im Bedienungskomfort der

einzelnen Lösungen. So ist Pentaho sicherlich das überzeugendste BI-

Komplettpaket. Sollen nur Einzelanwendungen für bestimmte BI-Bereiche

eingesetzt werden, stehen JasperSoft und Palo dem bekannteren Konkurrenten

aber in nichts nach.

Wenn bei der Einführung einer quelloffenen Business Intelligence-Lösung nicht

der Fehler gemacht wird, auf angemessene Projektunterstützung und -planung

zu verzichten, nur weil es sich um Open Source handelt, sondern die gleichen

Prioritäten, Ressourcen und die entsprechende „Management-Attention“ wie bei

einem Einsatz kommerzieller Lösungen eingesetzt werden, kann Open Source den

gleichen Gewinn bringen wie proprietäre Software.

Page 49: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 49 Version 1.0

Weiterführende Informationen /Links

Weiterführende White-Papers zu OpenSource allgemein oder themen- bzw.

produktspezifischen Analysen sind bei it-novum als Download oder auf Anfrage

erhältlich:

Allgemein zum Thema Open Source:

Einführung von Open Source aus der Sicht eines Anwenders: Die Top-10

Mythen und Fallstricke

Der Open Source-Diamond: Beurteilung von Open Source Lösungen

nach fünf praxis-relevanten Kriterien

Die Open Source Strategie eines Unternehmens als Teil einer

umfassenden IT-Strategie

100% Open Source – ist das möglich?

Themenspezifisch:

Modernes Open Source Dokumentenmanagement mit Alfresco:

Wegweiser vom einfachen Enterprise Content Management bis hin zu

komplexen Workflows mit jBPM und SAP-Integration

Open Source System- und Servicemanagement einfach gemacht:

Integriertes Systemmanagement und -monitoring – Geschäftsprozesse

im Fokus mit Nagios und ITCOCKIT.

Open Source BI: Vergleich der Open Source BI-Lösungen Pentaho,

Jaspersoft und Palo

Open Source CRM mit sugarCRM als nachhaltiger Beitrag zum

Vertriebserfolg: Lassen sich moderne Anforderungen wie bspw.

Abbildung von Vertriebsprozesse, Closed-Loop Marketing und

analytisches CRM einfach mit Open Source umsetzen?

SAP und Open Source – ein Widerspruch? Flexible Integration zum

Aufbau individueller und effizienter Lösungen

Aus unseren Projekten heraus ergeben sich immer neue themen-

/produktspezifische WhitePapers. Sehen Sie regelmäßig auf unserer Homepage

vorbei oder fragen Sie gezielt nach Themen, die sie interessieren unter den oben

genannten Kontaktdaten.

Page 50: Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009 ©it-novum GmbH 2009 Version 1.0 Open Source Business Intelligence Ein Vergleich der Open Source

it-novum White Paper Open Source Business Intelligence November 2009

© it-novum GmbH 2009 50 Version 1.0

Kontaktadressen

Bei Fragen zu Business Intelligence können Sie sich gerne an business-

[email protected] wenden.

Bei Fragen zu unseren anderen Geschäftsbereichen und Dienstleistungen stehen

wir Ihnen unter folgender Adresse zur Verfügung:

it-novum GmbH

Deutschland:

Edelzeller Straße 44 • 36043 Fulda • Tel: +49 (661) 103-333

Österreich:

Mooslackengasse 17 • 1190 Wien • Tel: +43 (1) 230 60-41 50

[email protected]

www.it-novum.com