Predictive Analytics sagt künftige Entwicklungen voraus

Ausgabe 06/2011

Predictive Analytics sagt künftige Entwicklungen voraus

Mathematische Algorithmen erweitern die vergangenheitsbezogene Analyse in Richtung Zukunft. Die dazugehörigen Werkzeuge sind häufig komplex. Projekte sollten laut Analystenrat stets bei den fachlichen Prozessen starten.

Der Markt

für Predictive Analytics wächst: „Themen wie Data Mining, Datenmustererkennung und statistische Vorhersagen erfreuen sich wachsender Aufmerksamkeit“, berichtet Carsten Bange, geschäftsführender Gesellschafter des Würzburger Business Application Research Center (BARC). „Wir schätzen, dass in Deutschland etwa acht bis zehn Prozent des Gesamtmarktes für Business Intelligence auf derartige Werkzeuge und Anwendungen entfällt. Das entspricht einem Volumen von 70 bis 80 Millionen Euro.“ Noch im Vorjahr habe der geschätzte Marktanteil rund sieben Prozent betragen.

Online-Händler analysieren die Kaufwahrscheinlichkeit

Während bei der vergangenheitsorientierten Betrachtung die Analysewerkzeuge Transaktionsdaten auswerten, generiert Predictive Analytics Vorhersagen auf Basis mathematischer Algorithmen. Anwender sind in vorderster Linie Banken und Versicherungen, die damit die Ausfallwahrscheinlichkeit von Krediten berechnen und Betrugsversuche aufdecken. Weit verbreitet ist die Technologie auch bei Händlern, die damit ihre Warenkorb-Analysen steuern, die Platzierung ihrer Artikel im Regal optimieren und die Daten der weit verbreiteten Kundenkarten zu Profilen verdichten. Webshops präsentieren den Besuchern das Produkt mit der höchsten Kaufwahrscheinlichkeit und kalkulieren in den USA kundenindividuelle Preise anhand des durch die Navigation im Angebot ermittelten Interessentenprofils.

Komplexe Werkzeuge fordern Anwender heraus

Bei den Werkzeugen für Predic­tive Analytics unterscheidet Bange zwei Klassen: Zum einen einfache s­tatistische Verfahren wie etwa Regressionsanalysen, die Vorhersagen im Rahmen von Zeitreihenanalysen generieren. Diese Technologie findet sich heute bereits in Planungstools und klassischen Analysewerkzeugen. Der zweite Bereich sind Data-Mining-Werkzeuge und diese wiederum verwenden mehrere Ansätze: „Bei der fortgeschrittenen Statistik kommen vor allem multivariate Verfahren zum Einsatz. Hinzu kommen das maschinelle Lernen über Entscheidungsbaumverfahren sowie neuronale Netze“, erläutert der BARC-Geschäftsführer.
Die Anwender haben bei Predic­tive Analytics einen hohen Freiheitsgrad für vielfältige Auswertungen. Im Umkehrschluss bedeutet das allerdings, dass die Bedienung der Tools überaus komplex ausfällt. „Die meisten Applikationen werden als Werkzeugkästen angeboten, die verschiedene Analysemethoden enthalten“, erläutert Bange. „Die Anwender müssen sich in statistischen Verfahren sehr gut auskennen, um die für ihre Fragestellung am besten passende Methode auszuwählen. Jede Methode wiederum erfordert ein individuelles Vorgehen, um valide Aussagen zu erreichen sowie anschließend das Testen der Ergebnisse.“ Einen Teil dieser Vor- und Nacharbeit versuchen die Software-Anbieter den Anwendern abzunehmen, indem sie mehr Intelligenz in ihre Anwendungen packen. „Einige Tools schlagen dem Anwender vor, welche Methode er für welches Problem anwenden sollte, sie weisen darauf hin, dass ein Verfahren einen Testdatensatz von einer bestimmten Qualität erfordert, oder sie führen eine Selbstvalidierung durch“, sagt Bange.

Vordefinierte Applikationen kapseln Analysemethoden

Die stärkste methodische Unterstützung für den Anwender bieten Werkzeuge, bei denen die Funktionen zu vordefinierten analytischen Applikationen verdichtet werden. Ein Beispiel hierfür sind automatisierte Vorschläge für Cross-Selling-Angebote in Call Centern. „Diese Tools konzentrieren sich auf eng umrissene Anwendungsfälle, und die dazugehörigen Methoden sind fest verbaut“, erläutert Bange. „Der Anwender muss sich nicht mehr um die Auswahl der Methode, die Verarbeitung der Daten oder das Testen der Ergebnisse kümmern. Der komplette Prozess ist bereits in der Anwendung definiert und gekapselt.“
Klarer Marktführer bei den Herstellern ist laut Bange SAS Insti­tute mit einem breiten Portfolio von Werkzeugen und Anwendungen für fortgeschrittene Analyse. Auf Platz zwei liege IBM, das sich 2009 mit dem Zukauf von SPSS verstärkt hat. Darüber hinaus gebe es noch einige Hersteller wie Microstrategy oder Bissantz, die entsprechende Verfahren mit in ihren Lösungen anbieten sowie eine Vielzahl an kleinen Spezialisten wie Angoss, InforSense, KXEN, prudsys oder Viscovery. Wachsendes Interesse verzeichneten Open-Source-Lösungen wie Rapidminer von Rapid-I, KNIME oder Weka Mining. Die Open-Source-Bibliothek R würde von Anbietern wie Information Builders als Baustein in Analyselösungen verbaut. Schließlich integrierten noch Datenbankanbieter wie Oracle und Microsoft Data-Mining-Funktionen in ihre Produkte.

Der fachliche Prozess steht am Anfang eines jeden Projekts

Unternehmen, die in das Thema Predictive Analytics einsteigen wollen, empfiehlt Bange zunächst den Blick auf den Nutzen für ihre Fachabteilungen: „Es geht zuallererst um den fachlichen Prozess. Unternehmen sollten sich überlegen, wo sie mit fortgeschrittener Analyse Mehrwert generieren können.“ Fachbereiche müssen also darüber nachdenken, welche Einflussfaktoren es in ihrer Branche auf den Geschäftserfolg gibt und anhand welcher Daten sie diese abfragen und zu passenden Maßzahlen verdichten können.
Der zweite Blick sollte den Daten gelten. Multivariate Analyse erfordert eine Mindestmenge an Rohdaten, bevor sie zu sinnvollen Ergebnissen kommen kann, und auch Zeitreihenanalysen funktionieren erst ab einer gewissen Länge. „Wenn ein Unternehmen nur wenige Kunden hat oder nur eine geringe Anzahl von Transaktionen pro Kunde, dann lohnt es sich nicht, über Predictive Analytics nachzudenken, weil dann die damit zusammenhängenden Methoden nicht funktionieren können“, schränkt Bange ein. Ebenfalls wichtig ist das Thema Datenqualität. Ohne ein Data Warehouse mit gut gesicherten Informationen laufen schließlich auch die besten Algorithmen ins Leere.

Automatisierung steigert den Integrationsbedarf

Erst als dritten Schritt empfiehlt Bange den Blick auf die IT-Systeme. Ein Data Warehouse bezieht seine Informationen aus der unternehmensweiten Standardsoftware (ERP) und bereitet zudem externe Daten für die Analyse auf. Nicht immer müssen die Data-Mining-Werkzeuge eng mit den Transaktionssystemen integriert sein. „Viele Unternehmen ziehen die Daten aus dem ERP-System über Adapter in ihr Data Warehouse und analysieren sie dort“, berichtet der BARC-Chef. Sollen allerdings die Analyse-Ergebnisse automatisiert zur Entscheidungsfindung oder Preisgestaltung genutzt werden, müssen die dazugehörigen Tools oder die mit ihnen generierten Modelle nahtlos mit den Transaktionssystemen verknüpft werden.
Einen weiteren Trend sieht Bange darin, dass Unternehmen Predictive Analytics nicht mehr als Insellösung betrachten, sondern überlegen, wie sie die dazugehörigen Anwendungen in ihr Business-Intelligence-Portfolio integrieren. „Fortgeschrittene Analyse stellt einen Teilbereich von Business Intelligence dar und sollte idealerweise mit anderen Disziplinen wie Reporting und Planung verknüpft werden“, erläutert Bange. „Aus diesem Ziel ergibt sich ein höherer Bedarf an Verschränkung mit den anderen beteiligten Anwendungen. Das kann die Werkzeugauswahl durchaus beeinflussen.“ Standardisierte Pakete, die Komplettlösungen aus einer Hand bieten, existieren allerdings bislang kaum.  jf