Sie sind hier:
Startseite
Business Intelligence (BI)

Neben der langjährig
verfügbaren Data-Warehouse-Applikation SAP BW mehren sich mit HANA, BO und Sybase die Alternativen für Data Warehousing mit Werkzeugen aus dem SAP Produktportfolio. Seit 2008 kann mit Datenintegrationswerkzeugen und einer semantischen Schicht von Business Objects eine andere Data-Warehouse-Philosophie als SAP BW umgesetzt werden. 2010 wurden durch den Kauf von Sybase und der Ankündigung der High-Performance Analytical Appliance (HANA) auch Datenbanken für den Einsatz als Data Warehouse oder Data Mart mit in das Portfolio genommen.
Durch diese Entwicklung erhalten SAP-Kunden mehr Möglichkeiten, es ist aber auch wichtig, die Unterschiede der Technologie und Einsatzszenarien zu kennen. Nur so können informierte Entscheidungen für Neuinvestitionen und eine Weiterentwicklung der Roadmap bestehender Lösungen in Unternehmen getroffen werden.
SAP Business Warehouse (SAP BW)
SAP BW ist eine Data-Warehouse-Management-Anwendung. In der Anwendung werden alle Aufgaben wie Datenmodellierung, Anlage von Datenintegrationsprozessen etc. vorgenommen und der zugehörige Server übernimmt als Zwischenschicht auch die Ausführung der Abfragen von BI-Frontends auf einer zugrunde liegenenden relationalen Datenbank. Wegen architekturbedingter Performance-Probleme bietet SAP mit dem BW Accelerator zusätzlich eine Replikation von Daten in eine ergänzende Hauptspeicherdatenbank an.
SAP BW ist für Kunden mit Auswertungsanforderungen überwiegend für SAP-Daten und einer SAP-Strategie die präferierte Option. Hauptvorteile beim Einsatz sind gute Datenextraktionsmöglichkeiten aus SAP ERP-Systemen, vordefinierte Modelle und Berichte (Business Content) sowie mit der Lösung verfügbare Funktionen wie Währungsumrechnung, Historisierung, Transportwesen etc. mit einer Anlehnung an für SAP-Kunden bekannte Administrationsfunktionen.
Komplexität der Lösung, Betriebskosten, eingeschränkte Offenheit und schlechte Abfrageperformance sind die am häufigsten geäußerten Kritikpunkte am System. Die Roadmap sieht vor, die als Datenspeicherkomponente genutzte relationale Datenbank durch die neue SAP In-Memory-Datenbank in HANA zu ersetzen. Man kann langfristig daher davon ausgehen, dass die DW-Management-Applikation BW und die neue Datenbankplattform HANA verschmelzen werden.
Traditionelles Data Warehousing mit relationalen Datenbanken und BusinessObjects-Datenmanagement-Tools
Die traditionelle Alternative zum Einsatz eines SAP BWs ist der Aufbau eines Data Warehouse in einer standardrelationalen Datenbank wie Oracle 11g, IBM DB2 oder Microsoft SQL Server. Für die Integration von Daten aus unterschiedlichsten Quellen in die Data-Warehouse-Datenbank bietet SAP mit BusinessObjects Data Services hierfür eine leistungsfähige Lösung an. Große Offenheit und Flexibilität, gute Integrationsmöglichkeiten gerade in heterogenere IT-Landschaften sowie die Nutzung von Standards in allen Bereichen sind die Hauptvorteile dieses Ansatzes.
Andererseits müssen Systemarchitektur, Betriebsprozesse sowie logische Konstrukte und Funktionen selbst aufgebaut werden. Dieser Weg ist für nicht-SAP-Kunden seit Anfang der 1990er Jahre Standard; SAP-Kunden, die sich aktuell vom SAP BW lösen, müssen hierfür häufig erst Know-how aufbauen, was allerdings im Markt ausreichend vorhanden ist. In der Datenbankschicht können auch spaltenbasierte relationale Datenbanken wie Sybase IQ oder SAP HANA zum Einsatz kommen, so dass die BusinessObjects Datenmanagement-Werkzeuge die Datenbankentwicklung beziehungsweise den Zukauf der SAP ergänzen.
Logisches Data Warehousing mit BusinessObjects Universen
BusinessObjects bietet mit den „Universen“ eine semantische Schicht an. In der semantischen Schicht werden Auswertungsobjekte modelliert, die Anwendern etwa im Rahmen eines Ad-hoc-Reporting für die eigene Zusammenstellung von Berichten zur Verfügung stehen. In der semantischen Schicht wird eine Verknüpfung der Objekte mit Datenquellen hinterlegt, so dass zum Abfragezeitpunkt eines Berichtes die Daten aus den Datenquellen (relationale Datenbanken) abgefragt und an das Abfragewerkzeug weitergeleitet werden. Ein Data-Warehouse-Modell kann so angelegt werden, es erfolgt aber keine Speicherung von Daten. Daher wird bei diesem Konzept auch von virtuellem oder logischem Data Warehousing gesprochen. Mit BO Release 4 wird eine neue semantische Schicht angeboten, die sowohl relationale als auch multidimensionale Datenbanken abfragen kann. Somit soll insbesondere auch die Unterstützung von SAP BW als Datenquelle verbessert werden.
Sybase IQ
SAP Kunden steht mit Sybase IQ eine etablierte Data-Warehouse-Plattform zur Verfügung. Sybase IQ ist eine spaltenorientierte relationale Datenbank für analytische Datenhaltung, die seit mehr als zehn Jahren angeboten und von >1000 Anwendern weltweit eingesetzt wird. Während sich die Datenbank nach außen durch SQL-Schnittstellen, ODBC-Zugriff etc. wie eine klassische zeilenorientierte relationale Datenbanken darstellt, wird intern spaltenorientiert indiziert und abgefragt. Dies bringt für viele Anwendungsfälle im Data Warehousing Vorteile hinsichtlich Abfragezeiten, Datenvolumen (Kompression) und Hardwarebedarf. Die Technologie ist ähnlich zur HANA-Datenbank, allerdings speichert Sybase IQ auf Festplatte während HANA komplett im Hauptspeicher liegt.
Die Übernahme von Sybase wird von der SAP sehr stark mit dem Zukauf von Plattformtechnologien für Anwendungen auf mobilen Geräten begründet. Inwiefern SAP das Produkt Sybase IQ also tatsächlich auch verstärkt innerhalb der bestehenden SAP-Kundenbasis anbietet, muss sich zeigen. Die fokussierte Zukunftstechnologie im Datenbankbereich scheint insgesamt hier eher HANA zu sein.
HANA
2010 stellte SAP die „SAP In-Memory Computing Engine“ als neue Datenbankentwicklung vor. Die Datenbankengine ist Kern der High-Performance Analytical Appliance (HANA). Es handelt sich um eine spaltenorientierte In-Memory-Datenbank – die Datenbank hält also nicht nur Caches, sondern den kompletten Datenbestand im Hauptspeicher und organisiert die Daten wie Sybase IQ spaltenorientiert. In HANA ist zusätzlich die Eclipse-basierte Modellierungsumgebung SAP In-Memory Computing Studio enthalten. Die Datenintegration in die Datenbank wird über BusinessObjects Data Services oder Sybase Replikationsdienste vollzogen. Als Abfragesprachen werden sowohl SQL als auch MDX unterstützt. Insgesamt verfolgt HANA damit eher einen offenen Data-Warehouse-Ansatz, in dem Kunden selbst modellieren und administrieren.
Kernidee von HANA ist, langfristig eine Datenbank zu entwickeln, die sowohl transaktionale als auch analytische Datenverarbeitung in einem System ermöglicht. SAP ERP-Daten können damit direkt im ERP-System leistungsfähig analysiert werden, was ein ergänzendes Data Warehouse allerdings nicht unbedingt überflüssig macht. HANA wird zunächst als Datenbank für SAP BW und als ergänzenden analytisches Data Mart für Teildaten aus dem ERP-System positioniert.
Auch wenn noch viele Fragen zu genauen Eigenschaften und Entwicklungsstand dieser Datenbank offen bleiben, kann die Annahme getroffen werden, dass damit insbesondere operative Business-Intelligence-Anforderungen umgesetzt werden. HANA ist ein wesentlicher strategischer Fokus der SAP und hat als technologische Neuentwicklung das Potential, die leistungsfähigste Option für die analytische Datenhaltung im SAP-Portfolio zu werden.
Insgesamt haben sich die Optionen für Data Warehousing im SAP Portfolio in den letzten Jahren deutlich erweitert. Einige Optionen können dabei ergänzend eingesetzt werden, andere stehen im Wettbewerb zueinander (siehe Abbildung). Klar ist aber, dass der lange Jahre exklusiv propagierte Ansatz des SAP BW nicht mehr alleine steht und zahlreiche andere Lösungen verfügbar sind, die auch die Umsetzung anderer Architekturen und Philosophien des Data Warehousing unterstützen.
Der Autor: Dr. Carsten Bange, geschäftsführender Gesellschafter des Business Application Research Center (BARC)