Marktübersicht Hadoop Distributionen

Das Business Application Research Center (BARC) hat Hadoop-Distributionen miteinander verglichen. IT-Entscheider erhalten so einen Überblick über die diversen auf Apache Hadoop basierenden, aber funktional oft unterschiedlichen Angebote für die Verwaltung von Big-Data-Daten.

Der Wunsch nach einer geschäftlichen Nutzung von Big Data hat in den vergangenen Monaten auch die Nachfrage nach neuen Techniken verstärkt, mit denen sich solche großen, polystrukturierten Datenbestände verwalten sowie schnell und fortschrittlich auswerten lassen. Einer der größten Hoffnungsträger ist hierbei „Hadoop“, eine Sammlung von Komponenten für unterschiedliche Aufgabenstellungen für die Verwaltung und den Zugriff auf strukturierte und unstrukturierte Daten.

Hadoop ist ein seit 2008 bei der Apache Software Foundation angesiedeltes Top-Level-Projekt, das sich aufgrund des großen Interesses von Anwenderunternehmen rasant weiterentwickelt. Arbeitsschwerpunkte sind aktuell die Performance, die Stabilität, Sicherheitsmechanismen sowie die Analysefähigkeit, Nutzbarkeit, Wartbarkeit und die Administrierbarkeit des komplexen Frameworks. Das Versprechen kommerzieller Softwareanbieter ist es somit, die Community-getriebene Open Source Apache Hadoop Distribution „unternehmensfähig“ auch für die Ansprüche von Großunternehmen nutzbar zu machen. Begleitend ist hierfür ein verlässlicher Support anzubieten und Fragen der Haftung zu klären.

Aufbauen auf dem Apache-Projekt versuchen diverse Anbieter mit ihren eigenständigen Hadoop-Distributionen die genannten Schwächen zu beseitigen, Lücken zu füllen und durch einen „Added Value“ im Markt zu punkten. So konkurrieren aktuell reine Hadoop-Distributionen (Cloudera, Hortonworks, MapR), Software-Stack-Anbieter (IBM), Speicherlösungs-Anbieter mit Hadoop-Angebot (NetApp, Pivotal) und Cloud-Service-Anbieter (Amazon, Microsoft, Rackspace) um die Gunst der Kunden.

Hadoop-BARC

Übersicht und Einordnung der Hadoop-Partnerschaften. Quelle: BARC

Vielfalt der Hadoop-Distributionen

Entsprechend unübersichtlich ist mittlerweile das Hadoop-Angebot für Unternehmen geworden. Eine Orientierung bietet die neue Marktübersicht  „Hadoop-Distributionen im Vergleich“ des BARC. Nach einer kurzen Einführung zu Hadoop und seinen Komponenten stellt die Untersuchung die fünf eigenständigen kommerziellen Hadoop-Distributionen Cloudera, Hortonworks, IBM, MapR und Pivotal gegenüber und gibt dem Leser dabei Auswahlkriterien für deren Bewertung an die Hand.

Allen Distributionen gemein ist laut BARC-Studie, dass ihre Entwickler angesichts der hohen Anzahl von Komponenten und Werkzeuge, die in Hadoop-Umgebungen für die Integration, Speicherung, Zugriff, Analyse und das Reporting zum Einsatz kommen, das Datenmanagement durch eine einheitliche Administrationskomponente vereinfachen wollen. Dabei zeigen sich in der Praxis vor allem in den Bereichen Datenmanagement, Security, Analytics und Benutzerfreundlichkeit einige Unterschiede zwischen den Angeboten.

„In dem Maße wie in den kommenden Monaten solche Datenmanagementfunktionen in Open-Source-Distributionen wie „Hortonworks“ verfügbar werden, wird sich der bislang noch teuer bezahlte „Added Value“ anderer Distributionen nicht mehr rechtfertigen lassen“,  kommentiert Timm Grosser, Co-Autor und Senior Analyst beim BARC, die weitere Entwicklung.  „Unternehmen sollten aufgrund seiner großen Dynamik den Hadoop-Markt die eingesetzten Distributionen kontinuierlich evaluieren.“

Die BARC-Studie „Hadoop-Distributionen im Vergleich“ kostet 490 Euro. Kaufen lässt sie sich unter diesem Link.

Sascha Alexander/hei

Anzeige

Titel_BI_Guide_2013_2014.inddis report Business Intelligence Guide 2013

Bestellen können Sie diese Standardreferenz für den BI-Markt telefonisch unter 089/90 48 62 10 und per E-Mail unter eantritter@isreport.de

Über Beteiligungsmöglichkeiten informiert Sie Herr Raupach unter 089/90 48 62 30 oder sRaupach@isreport.de

Hier finden Sie den Guide kostenlos als E-Paper.

 

Kommentare sind deaktiviert