SAP verbindet Hadoop und SAP HANA auf Prozessebene

Bei SAP HANA Vora bindet SAP einen Hadoop-Cluster so an SAP HANA an, dass Anwender die Daten gemeinsam analysieren können. Als Konkurrenzvorteil betrachten die Walldorfer die enge Einbindung in Geschäftsprozesse.

SAP HANA Vora stellt eine neue Query-Engine auf Basis von SAPs In-Memory-Technologie dar, die das Datenverarbeitungs-Framework Apache Spark nutzt. Ein Hadoop-Cluster wird dabei so an SAP HANA angebunden, dass Anwender in Echtzeit beide Datenbestände gemeinsam analysieren können. Der Name Vora verweist auf den englischen Begriff voracious, zu Deutsch: gefräßig.

Rolf_Schumann

„SAP HANA arbeitet als einziges Produkt ohne Aggregate und vollkommen ohne Datenkopien“, hebt Rolf Schumann, SAPs Chief Technology Officer und Head of Innovation, das Angebot der Walldorfer gegenüber Mitbewerbern hervor. „Im Rahmen der Transaktionsdaten von S/4 HANA sind die Informationen unserer Systeme direkt in laufende Prozesse eingebunden und analysieren nicht die Extrakte von Prozessen, die beispielsweise in einem Data Warehouse liegen.“ (Fotoquelle: SAP)

Mit SAP HANA Vora lasse sich die In-Memory-Technologie für verteilte Daten nutzen. Die Lösung ermögliche OLAP-ähnliche Analysen (Online- Analytical Processing), bei denen auch die Geschäftssemantik von Daten aus dem Hadoop-Umfeld berücksichtigt wird. „Unternehmen bekommen mit SAP HANA Vora einen umfassenden Einblick in den Kontext ihrer geschäftlichen Aktivitäten und können ihre Entscheidungsprozesse optimieren“, berichtet Rolf Schumann, Chief Technology Officer und Head of Innovation bei SAP. „Sowohl Analysespezialisten als auch Entwickler erhalten Zugriff auf die Daten. Unternehmensinformationen lassen sich leichter mit Hadoop-Daten verknüpfen, und dies eröffnet Unternehmen neue Erkenntnisse.“

Risikominimierung, Betrugsprävention und Predictive Maintenance

Unternehmen aus Branchen wie dem Finanzdienstleistungssektor, der Telekommunikation, dem Gesundheitswesen und der Fertigungsindustrie sind laut SAP auf die interaktive Analyse großer Datenmengen im Kontext der jeweiligen Geschäftsprozesse angewiesen. Ihnen soll SAP HANA Vora beispielsweise bei der Risikominimierung und Betrugsprävention helfen durch das Aufdecken bislang unerkannter Unregelmäßigkeiten in Finanztransaktionen und historischen Kundendaten. Telekommunikationsunternehmen sollen durch die Analyse von Datenverkehrsmustern die Bandbreite in ihren Netzen optimieren und Engpässe vermeiden können. Eine weitere Anwendung sei die vorbeugende Instandhaltung und Verbesserung der Prozesse für den Produktrückruf durch gemeinsame Analyse von Sensordaten, Stücklisten und Service-Daten.

„Im Rahmen unserer Big-Data-Initiative haben wir Hadoop und SAP HANA implementiert, um große Mengen unstrukturierter Daten verarbeiten zu können“, berichtet Aziz Safa, Vice President und General Manager der Intel IT Enterprise Applications and Application Strategy. „Zu unseren wesentlichen Anforderungen gehört eine bessere Analyse. Doch diese Daten in Hadoop nach Kontextinformationen zu durchsuchen, ist eine ziemliche Herausforderung. Mit SAP HANA Vora können wir die OLAP-Verarbeitung der Hadoop-Daten direkt im Arbeitsspeicher durchführen, die Kontextinformationen auslesen und den Anwendern bereitstellen.“

Die Speicherhierarchie umfasst inzwischen drei Schichten

SAP HANA VORA stellt zumindest teilweise eine Abkehr von Hasso Plattners 2008 formulierten Postulat dar, nach dem künftig sämtliche Daten im Hauptspeicher lagern sollten. Die Speicherarchitektur umfasst inzwischen drei Schichten: den Hauptspeicher von SAP HANA, angeschlossenen Nearline Storage beispielsweise von Sybase IQ und Hadoop Data Lakes. „Wir kennen die Daten samt Semantik im Business Kontext und können deshalb einer Information den für sie am besten passenden Speicher zuweisen“, erklärt Schuhmann. „Im Hauptspeicher von SAP HANA werden nicht nur Transaktionsdaten abgelegt sondern auch geschäftskritische Informationen, etwa die gesetzlich vorgeschriebenen Inhaltsprüfungen der Zutaten von Medikamenten oder sicherheitsrelevante Daten von Automobilen. In Hadoop-Clustern lagern hingegen lagern unstrukturierte oder semistrukturierte Massendaten beispielsweise von Maschinensensoren.“ Hauptspeicher sei der bei weitem schnellste, aber eben auch der teuerste Speicher und eigne sich am besten für geschäftskritische Daten. Hadoop als kostengünstiger Speicher sei hingegen ideal für Nicht-geschäftskritische Daten, bei denen es weniger auf die Lesegeschwindigkeit ankomme.

Mit SAP HANA Vora folgt SAP dem Beispiel des Data-Warehouse-Spezialisten Teradata. Dieser hatte im April dieses Jahres unter dem Namen Query Grid eine Möglichkeit vorgestellt, unstrukturierte Daten aus einem Hadoop Data Lake gemeinsam mit Informationen aus einem klassischen Data Warehouse zu analysieren. Query Grid ist eine Erweiterung von Teradatas Konzept des Multitemperature Data Warehouse. Dieses teilt Daten nach der Häufigkeit der Zugriffe in Temperaturstufen ein und verschiebt sie anhand dieser Kategorisierung in den schnellsten oder den billigsten Speicher.

Ohne Aggregate und ohne Datenkopien im Prozesskontext

SAP-Manager Schumann sieht SAP HANA Vora gegenüber den Angeboten von Wettbewerbern im Vorteil: „SAP HANA arbeitet als einziges Produkt ohne Aggregate und vollkommen ohne Datenkopien. Im Rahmen der Transaktionsdaten von S/4 HANA sind die Informationen unserer Systeme direkt in laufende Prozesse eingebunden und analysieren nicht die Extrakte von Prozessen, die beispielsweise in einem Data Warehouse liegen.“

SAP HANA Vora soll Ende September für die Kunden verfügbar sein. Eine Cloud-basierte Version für Entwickler ist ebenfalls für Ende des Monats geplant. Das Lizenzmodell umfasst vier Stufen: die Developer Edition in der Public Cloud ist kostenlos. Die anderen Varianten sind Mietmodelle, deren Kosten sich nach der Zahl der Hadoop-Knoten richten. Details zum Pricing werden nach Angaben von SAP gerade erarbeitet. jf

Anzeige

SAP Lösungs-Guide 

sap_kleiner-211x300

Über Beteiligungsmöglichkeiten informiert Sie gerne Stefan Raupach unter: 089/ 90 48 62 30 oder per E-Mail: sRaupach@isreport.de

Bestellen können Sie diese Standardreferenz telefonisch unter 089/90 48 62-0 und per E-Mail unter info@isreport.de

Als E-Paper lesen Sie den Guide unter diesem Link.

 

Kommentare sind deaktiviert