
Sie sind hier:
Startseite
Business Intelligence (BI)

Mit Hilfe
von High-End-Grafikkarten steigert der Business-Intelligence-Anbieter Jedox die Performance beim Palo OLAP Accelerator. Die Ergebnisse sind beeindruckend: „Der Video-Hauptspeicher hat etwa die achtfache Lesegeschwindigkeit des klassischen Intel-RAMs“, erklärt Jedox-CEO Kristian Raue. „Aufgrund der massiv parallelen Befehlsverarbeitung von Grafikkarten erzielen wir Performance-Steigerungen, die durchschnittlich um den Faktor 50, in Einzelfällen sogar um den Faktor 400 höher liegen als bei einer CPU-basierten In-Memory-Datenverarbeitung.“ Dem Anwender verspricht Jedox einen ähnlichen Nutzen wie SAP mit der High Performance Analytic Application SAP HANA: Unternehmen mit sehr großen Datenmengen bekommen in der Betriebs- und Risikosteuerung einen schnelleren Überblick. Außerdem könnten Simulationen und Planungen schneller, häufiger und detaillierter durchgeführt werden.
Das Tempo steigt deshalb so stark, weil der Palo OLAP Accelerator zusätzlich zur Rechenleistung des OLAP-Servers die Rechenleistung von Grafikkarten nutzt. „In Grafikkarten der Oberliga arbeiten bis zu 250 Rechenkerne parallel, die als Floating-Point-Prozessoren einfache Rechenaufgaben wie Addition und Multiplikation rasant ausführen“, erklärt Raue. „Genau diese Rechenschritte kommen in Business-Intelligence-Anwendungen bevorzugt vor.“ Video-RAM, also der Hauptspeicher der Grafikkarten, läuft besonders schnell und ist zudem sehr eng mit den dazugehörigen Rechenkernen verknüpft.
Die Hürde dabei: Die numerischen GPU-Bausteine (Graphic Processing Unit) in Grafikkarten unterstützen im Gegensatz zu klassischen Prozessoren von Intel oder AMD keine komplexen Instruktionen. „Komplexe Befehle sind sinnvoll, wenn die Prozessoren beispielsweise ein Betriebssystem wie Windows oder Linux steuern“, erläutert Raue. „Für das Number Crunching in einem BI-System sind sie nicht nötig, hier bringt es mehr Performance, wenn sehr viele Prozessoren parallel arbeiten.“
Software für klassische Server kann hunderte oder tausende parallel arbeitende Prozessoren nicht ausnutzen, weil sie die Instruktionen sequentiell abarbeitet. Sie muss daher so umgebaut werden, dass sie mehrere Threads parallel verarbeiten kann. Genau das hat Jedox in Kooperation mit der Universität Freiburg und der University of Western Australia in Perth getan. In zweijähriger gemeinsamer Forschung wurde für die GPU-Version von Palo der größte Teil des Intel-Codes gegen ganz einfache Algorithmen ausgetauscht, die parallel arbeiten. „Bezogen auf den einzelnen Rechenkern sind die Verarbeitungsschritte relativ ineffizient“, erklärt Raue. „Die Performance steigt dennoch rasant, weil 200, 500 oder sogar 1000
Threads gleichzeitig laufen.“ Als Vergleich zitiert der Jedox-CEO das Beispiel eines Ameisenhaufens: Die einzelne Ameise führe nur einfachste Arbeitsschritte aus, der gesamte Organismus hingegen sei sehr effizient organisiert.
Auch die In-Memory-Technologie auf Basis von Intel-Servern, wie sie beispielsweise SAP HANA verwendet, erhöht die Performance eines Business-Intelligence-Systems. Im Leistungsvergleich haben laut Jedox die Grafikkarten die Nase vorn: Bei Disk-basierten Systemen liege das Bottleneck in der Datenübertragung zwischen Festplatte und Hauptspeicher, die mit 800 Megabyte pro Sekunde läuft. Bei In-Memory-Systemen zähle die Geschwindigkeit des Datenaustausches zwischen Hauptspeicher und Prozessor – bis zu 26 Gigabyte pro Sekunde. Bei der GPU-Technologie komme es auf den Datenaustausch zwischen den Rechenkernen und dem Videospeicher an. Mit 200 Gigabyte pro Sekunde sei dieser fast achtmal so schnell wie ein Intel-basiertes In-Memory-System (siehe Grafik Seite 26). „GPU-Prozessoren setzen das volle Tempopotenzial der In-Memory-Technologie frei“, erläutert Raue.
Mit einem Volumen zwischen vier und sechs Gigabyte ist der Videospeicher einer Grafikkarte ähnlich groß wie der Hauptspeicher manch eines Intel-Servers. Das Zusammenschalten mehrerer Grafikkarten lässt den verfügbaren Videospeicher weiter ansteigen. Das ermöglicht es, die Daten des Palo OLAP Server komplett im Video-RAM abzulegen. Dabei kann die Performance stärker zulegen als das blanke Tempo des Datenaustausches.
Mit einem klassischen Server lässt sich die GPU-Technologie nicht nutzen, denn dort sind typischerweise lediglich einfachste Grafikchips verbaut. Der Palo OLAP Accelerator benötigt Nvidia-Grafikkarten, welche die Compute Unified Device Architecture (CUDA) unterstützen. CUDA ermöglicht es, dass der Grafikprozessor Applikationsbefehle verarbeitet. Grafikkarten der Tesla Baureihe gibt es laut Raue in einer Gaming-Variante zum Stückpreis zwischen 200 und 500 Euro sowie in einer Premium-Variante zum Stückpreis von circa 2000 Euro. Die Premium-Variante enthält einen Error Correction Code und erkennt damit sogenannte Bitdreher.
Für den Einstieg in die GPU-Technologie rüsten Anwender entweder einen vorhandenen Server mit einer oder mehreren Nvidia-Grafikkarten auf oder sie kaufen sich beispielsweise von Dell eine Appliance, in der bereits solche Karten enthalten sind. Die dritte Möglichkeit: sie mieten sich einen GPU-bestückten Server in der Amazon-Cloud. „In Deutschland ist bislang die Akzeptanz für Business-Intelligence-Applikationen aus der Cloud sehr gering“, schränkt Raue ein. „Wir haben einige Kunden, welche die GPU-Technologie in der Amazon-Cloud testen, aber niemanden, der den operativen Betrieb dorthin auslagert.“
Da der Hauptspeicher im Gegensatz zu einer Festplatte oder einer Flash-Disk flüchtig ist, gingen bei einem Stromausfall oder einem Absturz des Servers sämtliche Daten aus dem RAM verloren. Die Software nutzt deshalb einen Mechanismus, um diese möglichst schnell wiederherzustellen. Dafür läuft in den GPU-Systemen ein Logfile, das alle Datenveränderungen mitschreibt. Gespeichert wird dieses entweder auf einer klassischen Festplatte oder auf einem Solid State Drive (SSD), wobei letzteres deutlich schneller läuft und daher die Daten auch rascher wiederherstellt.
Jedox bietet seine Business-Intelligence-Applikationen in einer kostenlosen Open-Source- und einer lizenzpflichtigen Premium-Version an. High-End-Funktionen wie etwa das Graphic Processor Computing oder auch die Multiprozessorfähigkeit der Intel-Variante des Palo OLAP Server sind ausschließlich in der Premium-Variante verfügbar. Gleiches gilt für den vordefinierten Konnektor von Palo ETL für SAP-Systeme. Die Open-Source-Variante und die lizenzpflichtige Version liegen stets etwa 12 bis 15 Monate auseinander: Die Premium-Version ist in Sachen Optimierung stets auf dem neuesten Stand, die Open-Source-Variante folgt später. Für die Lizenzversion habe Jedox in den ersten sechs Monaten dieses Jahres 79 Kunden gewonnen. Derzeit nutzten rund zehn Prozent der installierten Basis die lizenzkos-tenpflichtige Version von Jedox.
Häufig beobachten lässt sich bei Open-Source-Anwendern, dass Unternehmen eine Software in der kostenlosen Variante testen und für die produktive Installation dann auf die Lizenzversion wechseln. Beim Palo OLAP Accelerator ist das so nicht möglich, da die GPU-Funktionalität der Bezahlvariante vorbehalten ist. Allerdings gebe es laut Raue auch eine kostenlose 4-Wochen-Testversion.
Als schärfste Konkurrenten betrachtet Raue wegen der technischen Nähe IBM Cognos TM1 und Infor PM 10. Hinzu kämen die Applikationen von SAP BusinessObjects. Angesichts der hohen Verbreitung von SAP-Lösungen würden einige Anwender möglichst viel aus einer Hand beziehen wollen. Raue sieht seine Angebote nicht als Konkurrenz zu SAP-Anwendungen, sondern als Ergänzung: „Wir haben viele SAP-Kunden, welche mit Palo ihre Planung mit der In-Memory-Technologie durchführen. Dabei bildet typischerweise SAP BW die Datenbereitstellungsebene ab.“
Im Release 3.2 der Palo Community Edition hat Jedox laut eigener Aussage insbesondere Stabilität und Performance verbessert. Gleichzeitig wurde für die Premium-Version der Palo OLAP Accelerator nach einer einjährigen Testphase in einer Windows- und einer Linux-Version für den Markt freigegeben. Eine Funktion zum Rückschreiben von Daten auf OLAP-Würfel soll die Performance bei Planungen und Simulationen erheblich steigern. „Mit der GPU-Technologie beschäftigen sich derzeit drei Unternehmen in Testprojekten“, berichtet Raue. Ein Referenzkunde ist die Elektrogroßhandelsgruppe DEHA, die Palo für die Ad-hoc-Analyse, das Standardreporting im Lager und für das Vertriebscontrolling nutzt. Im Einsatz sind dort die Reporting-Werkzeuge Palo Excel und Palo Web sowie die ETL-Lösung (Extraktion, Transformation, Laden) Palo ETL. Die Datenhaltung findet in Palo OLAP sowie Palo OLAP Accelerator statt. jf