
Sie sind hier:
Startseite
Business Intelligence (BI)

DIE MEISTEN bisherigen Analysewerkzeuge sind für das Auswerten riesiger Datenmengen nur wenig oder gar nicht gerüstet. Diese Tools sind entstanden in der Welt strukturierter Daten und Geschäftsprozesse, in der Felder und deren Ausprägungen vorgedacht waren und auf deren Vorgaben man sich zumindest über weite Strecken verlassen konnte. Sie bieten nicht die technischen Zugriffsmöglichkeiten auf unstrukturierte Daten aus Web-2.0-Anwendungen, vor allem aber auch nicht den analytischen Zugang beispielsweise zu den semantischen Finessen, die in Blog- und Foreneinträgen mitschwingen und sogar die eigentliche Aussage darstellen können. Synonyme, Wortspiele, Wortkreationen, Humor – all dies sind Aspekte menschlicher Sprache, mit denen Analysewerkzeuge künftig lernen müssen umzugehen, um brauchbare Informationen aus den Textdaten zu ziehen. Technische Verfahren aus Text Mining und Suchmaschinentechnologie haben daher Einzug in Business-Intelligence-Lösungen gehalten und ermöglichen damit erst die Beantwortung der oben genannten Fragestellungen. Es steht zu erwarten, dass in den nächsten Jahren auch Bildverarbeitung sowie Stimm- und Spracherkennung Eingang in die Analyse-Infrastrukturen finden.
Viele Technologien für die Analyse von Big Data beruhen auf parallel und verteilt verarbeitende Algorithmen und Architekturen wie beispielsweise Hadoop und erfordern spezielle Hardware. Optimierte Appliances – zumeist parallelprozessierende Hardware mit viel Arbeitsspeicher und darauf abgestimmter Analysesoftware – nehmen eine wichtige Stellung im Markt für Big Data Analytics ein. Sie verdrängen aufgrund ihrer Verarbeitungsgeschwindigkeit zunehmend die herkömmlichen relationalen Datenbanken als zentrale Datenablagen.
Neben kleineren, aber sehr erfolgreichen Spezialisten wie Exasol und Netezza (Ende 2010 von IBM übernommen) hat als einer der ers-ten großen BI-Anbieter SAP diesen Trend erkannt und mit SAP HANA ein Produkt im Markt etabliert, das nun als Basis für die Kundensegmentierungs- und die Predictive-Analytics-Lösung der SAP verfügbar ist. Darüber hinaus wollen die Walldorfer diese Plattform auch in den operativen Systemen als Datenbank nutzen. Das positive Kundenfeedback der bisherigen Nutzer sowie die Marktstellung und die Marketingpower von SAP haben andere Hersteller auf den Plan gerufen und den Markt in Bewegung gebracht.
Ein großes Anwendungsfeld für Big-Data-Analysen ist das Marketing, das sich in den vergangenen Jahren deutlich gewandelt hat. War es früher geprägt vom Einsatz von Massenmedien und Massenmailings, steht heute zunehmend der einzelne Kunde im Fokus. Sein Verhalten und seine Bedürfnisse entscheiden, welches Produkt er über welchen Kanal zu welchen Konditionen angeboten bekommt. Je präziser die Segmentierung von Kunden und die Prognose ihres Verhaltens, desto höher fallen Kontakt- und Antwortraten sowie Abschlussquoten aus. Aufgrund der besseren Kundenansprache steigen Zufriedenheit und Loyalität. Durch den fokussierten Einsatz von Budgets wird das Marketing zum Treiber für steigende Profitabilität.
Was sich einfach liest, stellt hohe Ansprüche an die Leistungsfähigkeit von IT-Systemen und die Qualität von Datenanalysen. Das Internet und mobile Endgeräte wälzen den Konsumentenmarkt und die Prozesse der Unternehmen massiv um. Soziale Medien stärken die Macht der Konsumenten. Kunden stellen neue Anforderungen an Produkte und Dienstleistungen und erwarten intelligente und zeitnahe Kommunikation. Die Beschleunigung von Prozessen und Märkten nimmt zu, ebenso die Menge und Vielfalt von Daten. Big Data Analyse erfordert für viele Unternehmen einen Paradigmenwechsel, erst recht, wenn die Analyse in Echtzeit erfolgen soll.
Aber Big Data birgt auch Chancen. Vorhersagen werden präziser, und Unternehmen können viel feinere und signifikante Zusammenhänge identifizieren und nutzen, Kundensegmente gezielter und schneller ansprechen. Produkte und Services lassen sich passgenau dem Bedarf anpassen (Design to Value). Das kann die Kundenzufriedenheit deutlich steigern.
Menge, Vielfalt und Komplexität der verfügbaren Daten machen es menschlichen Analysten unmöglich, darin enthaltene Zusammenhänge zu identifizieren. Das gilt selbst dann, wenn die Muster vergleichsweise einfach sind. Bestenfalls lassen sich Annahmen gezielt überprüfen. Schon hypothesengetriebene Analysen erfordern Werkzeuge, welche die über Millionen Datensätze verteilten Information sinnvoll aggregieren (Mittelwerte, Summen) und visualisieren. Viele Werkzeuge für deskriptive Statistik und OLAP (Online Analytical Processing) sind mit dem Datenwachstum überfordert. Dies gilt zunehmend auch für relationale Datenbankenmanagement-Systeme, die über die Jahrzehnte zum IT-Rückgrat größerer Unternehmen geworden sind. Im Kampagnenmanagement scheinen die Grenzen dieser Systeme erreicht.
Wenn in den Datenbergen bisher unbekannte Muster gesucht werden sollen (explorative Analysen), sind die Business-Analysten ohne technische Hilfsmittel verloren. Selbst relativ einfache Zusammenhänge lassen sich durch Datenbrowsen nur zufällig finden. Werden die Muster komplexer, sind sie selbst für intelligenteste menschliche Analytiker und bei bester Software-Unterstützung zur Aggregation und Visualisierung der Daten praktisch unsichtbar.
Spätestens hier kommt Data Mining ins Spiel. Hinter dieser Gruppe von Analyseverfahren verbergen sich eine Vielzahl von Algorithmen und Methoden, die weitgehend autonom und automatisiert signifikante Zusammenhänge in großen Datenmengen aufspüren, aus denen sich wiederum Prognosen für zukünftige Ereignisse ableiten lassen. Predictive Analytics erkennen auch Effekte, die sich aus dem Zusammenspiel von Dutzenden von Einflussfaktoren zusammensetzen. Sie finden diese Muster in Grundgesamtheiten mit Zehntausenden von Variablen zu Millionen und Abermillionen von Datensätzen. Die im Database Marketing üblichen Modelle prognostizieren das Verhalten von Kunden oder Märkten oder den Erfolg von Produkt- oder Dienstleistungsangeboten mit hoher Wahrscheinlichkeit.
Was in früheren Jahrzehnten als große Herausforderung galt, nämlich Daten zu Millionen Kunden und Zigmillionen Transaktionen zu analyiseren, ist heute durch etablierte Verarbeitungsprozesse selbst für manchen Mittelständler zur Normalität geworden. Allerdings nur, solange man nicht den Anspruch erhebt, die Daten in Echtzeit zu analysieren, und solange man sich auf die Betrachtung von aggregierten Informationen anstelle von Einzelvorgängen beschränkt und auf viele weitere Datenquellen und Auswertungen verzichtet. Bis an die Grenzen ihrer Leistungsfähigkeit getunte Datenbanksysteme und elaborierte, aber zeitaufwändige Prozesse der Datenverarbeitung und -aufbereitung machen es möglich.
Die kontinuierlich steigenden Anforderungen und die ständig zunehmende Datenmenge und -vielfalt erzwingen einen technologischen Paradigmenwechsel. Big Data meint die Daten von Zigmillionen Kunden und Milliarden Transaktionen. Vor allem aber Typen von Daten, die es in dieser Form und Vielfalt früher nicht gab oder die kaum zu analysieren waren. Allen voran sind dies Freitexte, beispielsweise auf Webseiten, aber auch Bilder, Videos, Audiodaten und zunehmend auch Informationen über den Aufenthaltsort von Personen und Objekten. Hinzu kommen Daten, die durch die in Produkten enthaltenen Sensoren an die Hersteller zurückgemeldet werden und so die Nutzung, den aktuellen Zustand von Produkten wie Maschinen, Fahrzeugen oder Software-Installationen sowie aktuelle Fehler melden.
Hersteller von Business-Intelligence-Software und Hardware-Appliances nutzen den Begriff Big Data, um den Verkauf ihrer Produkte anzukurbeln. Tatsächlich ist die steigende Anzahl an Datensätzen aber nur eine der Eigenschaften, die heutige Geschäftsdaten von denen früherer Jahrzehnte unterscheiden. Wer nur diesen Aspekt betrachtet, der trifft unter Umständen falsche Investitionsentscheidungen und versucht, das Datenwachstum beispielsweise mit noch größerer Hardware oder weiterem Tuning zu kompensieren, wo eigentlich qualitativ andere Ansätze erforderlich wären.
In der Praxis sind bei Big Data Analytics mindestens folgende Aspekte zu betrachten:
Während das klassische Database Marketing im Wesentlichen mit strukturierten Daten in relationalen Datenbanken arbeitet, brachten vor etwa zehn Jahren zunächst Kundenmanagement-Systeme (CRM) neue Datenquellen mit sich: weitgehend technische Protokolle aus dem Call Center oder dem Webshop, die aus Volumen- und Performance-Gründen nicht in transaktionale Datenbanken aufgenommen werden. Für das Marketing und die Analyse von Kundendaten sind diese Informationen höchst interessant, da sie in Verbindung mit den Stamm- und Transaktionsdaten das Verständnis von Kundenverhalten erheblich verbessern und eine Erfolgskontrolle von Marketingaktionen ermöglichen. Seit dem Aufkommen von Web 2.0 fallen neben diesen zumeist semistrukturierten Textdateien auch vollständig freie Textinformationen aus Blogs, Foren und Sozialen Netzwerken an. Diese Daten werden nicht mehr notwendigerweise von unternehmenseigenen Systemen erfasst, sondern liegen im Internet. Dort sind sie weitgehend uneingeschränkt für Analysen verfügbar.
Neben Texten beinhaltet das Internet auch Audio-, Bild- und Videodaten. Deren Auswertung erfordert völlig andere Algorithmen als sie bisher im Data Mining üblich sind. Aktuell konzentrieren sich viele Big-Data-Analysen auf relationale Daten und Textdaten. Doch die akademische und industrielle Forschung bringen in rasanter Folge Analyseverfahren für nicht-textuelle Inhalte hervor. Derartige Auswertungen werden an Bedeutung gewinnen, sobald eine kritische Masse an pfiffigen Ideen und lukrativen Geschäftsmodellen dafür existiert.
Vorher dürften vor allem Standortinformationen praktischen Nutzen bringen. Location-Based Services, also Kunden die für ihren Aufenthaltsort passenden Dienste und Informationen zukommen zu lassen, sind längst nicht mehr ungewöhnlich. Das Potential dieser Dienstleistungen ist aber noch nicht ausgeschöpft. Die Standortinformationen lassen sich zu Bewegungsprofilen im Supermarkt oder innerhalb von bestimmten Geografien verdichten.
Großes Potential birgt auch die Analyse von Produktnutzungsdaten, die Software, Maschinen und Fahrzeuge an den Hersteller übermitteln. Neben der Analyse von Produktdefekten lassen sich aus diesen Daten Nutzungsprofile erstellen. Die Amerikaner denken darüber nach, Daten über die Fahrzeugnutzung den Versicherern zur Verfügung zu stellen, damit diese daraus die Risiken bewerten. Aus dem Blickwinkel des Datenschutzes sind personalisierte Datensammlungen und Auswertungen allerdings sehr kritisch zu betrachten.
Im klassischen Database Marketing – der Basis für jegliche Kampagnen mit dem Ziel von Cross- oder Up-Selling, Kündigerprävention, Neukundengewinnung oder Kundenrückgewinnung – sind die Modelle im Wesentlichen aus Kundenverhaltensdaten und Kundenattributen aufgebaut. Bei Kundenattributen handelt es sich um soziodemografische Daten wie Adresse, Alter, Status, ergänzt um Segmentzuordnungen oder andere klassifizierende Eigenschaften, die aus früheren Analysen gewonnen wurden.
Beim Kundenverhalten standen lange Zeit die Umsatzdaten im Vordergrund, meist gruppiert nach Produktgruppen und analysiert für verschiedene Zeitintervalle. Retouren, Rabatte und andere auftragsbezogene Informationen ergänzten das Profil. Mit der Einführung von CRM-Systemen und dem Einzug der Online-Welt boten sich Daten zur Vorgeschichte von Aufträgen zur Analyse an. Art und Verlauf von Kundenkontakten in Call Centern und Webshops wurden interessant. Informationen hierüber sind wohl die ersten betriebswirtschaftlich relevanten Big Data. Nur wenige Unternehmen nutzten die sogenannten Call Detail Records und Click-Stream-Daten von Anfang an wirklich systematisch. Teils waren an anderen Stellen noch grundlegendere Hausaufgaben zu erledigen, teils fehlten die Werkzeuge dafür. Für viele Fragestellungen müssen diese Daten außerdem mit Transaktions- und Stammdaten integriert werden. Dafür sind individuelle Lösungen notwendig.
Das letzte Jahrzehnt brachte zwei neue Trends, aus denen neue Chancen und damit auch Anforderungen an Analysen entstanden: Einerseits nahm mit dem Aufkommen von Web 2.0 mit Sozialen Netzwerken, Foren und Blogs der Umfang und die Bedeutung von Freitextinformationen massiv zu. Vertrieb und Marketing vieler Unternehmen haben schnell erkannt, dass diese neuen Kommunikationskanäle den Markt nachhaltig verändern und für junge Kundengruppen der primäre Weg des Austausches untereinander sind. Weite Teile dieser Kundengruppen lassen sich praktisch nur über diesen Kanal erfolgreich ansprechen, da sie nicht mehr fernsehen und kaum E-Mails lesen.
Facebook, Twitter und Co. sind aus dem Konsumentenmarketing nicht mehr wegzudenken. Selbst im B2B-Geschäft sind Foren und Netzwerke wesentlicher Bestandteil von PR und Leadgenerierung sowie Support- und Serviceangeboten. Die verschiedenen Spielarten von Web 2.0 bieten zudem neue Möglichkeiten der Gewinnung von Wissen über Kunden, die diese Informationen oft bereitwillig im Austausch für relevante Services preisgeben. Bei allen kritischen Datenschutzaspekten liegt hier eine Unmenge an Chancen.
Häufig genanntes Beispiel ist die Sentimentanalyse, die Stimmungen und Einstellungen zu bestimmten Themen, Produkten, Firmen automatisch erkennt. Im Internet kursierende Gerüchte und Kritik können für ein Unternehmen durch Selbstverstärkungseffekte sehr leicht einen dauerhaften Imageschaden erzeugen. Erkennt man solche Risiken schnell, lässt sich durch eine gezielte Informationspolitik der Schaden begrenzen. Das Sentiment im Web 2.0 gegenüber den eigenen und Konkurrenzprodukten ist aber auch ein Frühwarnsystem, das mögliche Umsatzrückgänge und das Abwandern größerer Kundengruppen ankündigen kann. Insbesondere Unternehmen mit Konsumentengeschäft können auf relativ einfache Weise Hinweise sammeln, in welche Richtung zukünftige Marketingaktionen zielen sollten und welche Produkteigenschaften künftig besonders nachgefragt werden.
Der Autor:
Dr. Marcus Dill, Geschäftsführer vom Analysten- und Beraterhaus mayato, ist Experte für Business Intelligence und Customer Relationship Management.