Leitfaden Hadoop-Distribution

Hadoop-Distribution: Leitfaden hilft bei der Auswahl

Wachsende Datenmengen bringen relationale Datenbanksysteme an ihre Grenzen. Die Hadoop-Technologie bietet hiereinen Ausweg. BARC-Analyst Lars Iffert gibt Tipps zur Wahl der richtigen Hadoop-Distribution.

Die Hadoop-Technologie sorgt dafür, dass sich strukturierte (tabellarische) sowie unstrukturierte Daten (beispielsweise Text, Bild, Audio, Video) kostengünstig und skalierbar ablegen, verwalten und auswerten lassen. Wesentlich ist die Frage, inwiefern sich diese Technologie durch ihren generischen Ansatz in die bestehende Infrastruktur und die etablierten Prozesse sowie beteiligten Rollen integrieren lässt. Ein Erfolgskriterium liegt in der SQL-Schnittstelle – welche die Anbieter unterschiedlich gut unterstützen.

Softwareanbieter positionieren ihre Hadoop-Distributionen mit unterschiedlichen Strategien in ihrem Software- und Dienstleistungs-Portfolio. Bei der Auswahl der Distribution sollte ein Abgleich mit der IT-Strategie des Unternehmens erfolgen. Eigenständige Hadoop-Distributionen entwickeln und vertreiben folgende Anbietergruppen:

  1. Hadoop-Distributoren wie Cloudera und Hadoop selbst fokussieren auf ihre Software und bieten darüber hinaus Service an. Für darüber hinaus gehende Anforderungen wie die weitergehende Datenanalyse oder ein umfangreiches Datenmanagement verweisen sie an Partner.
  2. Software-Stack-Anbieter mit einer eigenen Hadoop-Distribution wie IBM haben die Hadoop-Technologie mit in ihr Portfolio integriert und unterbreiten dem Kunden ein umfangreiches, zuweilen auch recht unübersichtliches Angebot.
  3. Spezialisten für Speicherlösungen wie Pivotal bieten Hadoop-Distributionen an, die um eigene Optimierungen für ihre Speichersysteme erweitert sind. Sofern bereits entsprechende Hardware im Unternehmen vorhanden ist und keine weitergehenden Anforderungen an die Hadoop-Distribution gestellt werden, sollten diese Anbieter geprüft werden.

Einige Anbieter unterhalten Partnerschaften mit den Herstellern eigenständiger Hadoop-Distributionen. Hierbei geschieht die wesentliche Weiterentwicklung der Hadoop-Distribution durch den Partner, der Anbieter versucht die Partner-Distribution durch Erweiterungen oder Unterstützung des Partners besonders gut in seine Softwarelandschaft zu integrieren. Bei speziellen Fragen des Endanwenders zur Hadoop-Distribution verweisen die Anbieter zuweilen an ihre Distributionspartner.

  • Software-Stack-Anbieter wie Microsoft, Oracle und Teradata setzen auf Partnerschaften mit kommerziellen Hadoop-Distributionsanbietern um ihr Portfolio zu erweitern.
  • Spezialisten für Speicherlösungen wie NetApp nutzen Hadoop-Distributionen um weitere Einsatzgebiete für ihre Speichersysteme zu erschließen.
  • Cloud-Service-Anbieter wie Amazon oder Rackspace stellen eine Hadoop-Plattform zur Verfügung, die für Plattform- oder Software as a Service Szenarien interessant sind und setzen auch hier auf die Weiterentwicklung der Hadoop-Distribution durch einen Partner.

In einer Marktübersicht hat BARC Hadoop-Distributionen miteinander verglichen. IT-Entscheider erhalten so einen Überblick über die diversen auf Apache Hadoop basierenden, aber funktional oft unterschiedlichen Angebote für die Verwaltung von Big Data. Anhand eines praxiserprobten Kriterienkatalogs erfolgt eine Gegenüberstellung und Bewertung der Hadoop-Angebote von Cloudera, Hortonworks, IBM, MapR und Pivotal. Weitere Informationen unter http://barc.de/hadoop.

Der Autor
Lars IffertLars Iffert ist Analyst und Berater am Business Application Research Center (BARC). Seine Spezialgebiete sind Data Warehousing, Datenintegration, Datenqualität, Stammdatenmanagement, Big Data und Hadoop sowie Predictive Analytics. Er ist Autor verschiedener BARC Produkt- und Marktstudien im Datenmanagement-Bereich.

 

 

 

Anzeige

Titel_BI_Guide_2014_2015.inddis report Business Intelligence Guide 2014

Die Printversion dieser Standardreferenz für den BI-Markt können Sie hier oder per E-Mail unter eantritter@isreport.de bestellen.

Über Beteiligungsmöglichkeiten informiert Sie Herr Raupach unter 089/90 48 62 30 oder sRaupach@isreport.de

Kommentare sind deaktiviert