CRM und Datenanalyse: Data-Mining-Tools auf dem Prüfstand Detail - Computerwelt

Computerwelt: Aktuelle IT-News Österreich


22.09.2011 Peter Neckel*

CRM und Datenanalyse: Data-Mining-Tools auf dem Prüfstand

CRM und Datenanalyse: Data-Mining-Tools auf dem Prüfstand

Kundensegmentierungen bilden im CRM-nahen Bereich der sogenannten Customer Relationship Analytics (CRA) eine der zentralen analytischen Aufgaben, die sowohl eine hohe praktische als auch strategische Bedeutung haben. Seine Kundenbasis zu sortieren stellt sich als analytische Querschnittsaufgabe im Rahmen der Kundenbeziehungspflege dar - sie steht typischerweise in einer Reihe mit der Kundenwertanalyse und der Markt- und Kundenbearbeitung, zum Beispiel im Rahmen des Kampagnen-Managements. Gleichzeitig sind Segmentierungen eine der Paradedisziplinen des Data Mining, da hier häufig große Datenmengen stark explorativ analysiert werden müssen, um zu validen Ergebnissen zu kommen.

Die Toolauswahl für diese Aufgabe ist jedoch keineswegs trivial: Im Angebots-Dickicht der Hersteller versammeln sich mittlerweile geschätzte 150 Data-Mining-Werkzeuge, die um die Gunst der Käufer konkurrieren. Die Informationen und Produktblätter der Hersteller erleichtern die Entscheidungsfindung in vielen Fällen nur begrenzt: Zum einen stellen sie verständlicherweise vorwiegend die Stärken des jeweils eigenen Tools heraus, zum anderen ähneln sich viele Angaben von Hersteller zu Hersteller. Im Ergebnis bleiben die Hauptunterschiede auch für den erfahrenen Nutzer meist wenig transparent. Zudem zeigen sich die wirklich entscheidenden, praxisrelevanten Stärken und Schwächen der Tools erst im praktischen Einsatz bei einer konkreten Fragestellung.

DER STUDIENAUFBAU Daher wurde in der vorliegenden Studie für den Vergleichstest ein komplexes, praxisnahes Testszenario erarbeitet, das von der Datenvorverarbeitung über die eigentliche Erstellung der Kundensegmentierung und Interpretation der Ergebnisse bis hin zur praktischen Anwendung der Segmentierung zur Neukundenklassifikation alle Aspekte des Analyseprozesses abdeckt.

Um direkte Vergleichbarkeit sicherzustellen, wurde jedes Werkzeug in einer vorab definierten Testumgebung installiert und ausführlich getestet. Während dieses Praxistests fanden standardisierte Messungen statt zum Beispiel zur Ausführungsgeschwindigkeit mit zahlreichen unterschiedlichen Parametereinstellungen. Weiterhin ist für jedes der Werkzeuge eine detaillierte Funktionsübersicht zur Clusteranalyse aufgeführt. Die Bewertungskriterien umfassen unter anderem die Bedienung der Tools, den Funktionsumfang, das Systemverhalten bei großen Datenmengen und die Stabilität.

Im Endergebnis zeigen sich deutliche Unterschiede vor allem im Bedienkomfort, bei der Ausführungsgeschwindigkeit sowie bei den Möglichkeiten der grafischen Ergebnisauswertung.

DAS TESTFELD Da Data-Mining-Funktionen in stark unterschiedlichen Tool- und Preiskategorien angeboten werden, fiel das Testfeld entsprechend breit aus: Die klassische, funktionsmächtige Data-Mining-Suite (SAS, StatSoft) findet sich ebenso darunter wie das Business-Intelligence-Werkzeug, das Data-Mining-Verfahren eher als Zusatz zu mächtigen Datenverwaltungsfunktionen offeriert (SAP). Um die Frage zu klären, ob sich die Analyseaufgabe auch mit einer kostenlosen Data-Mining-Suite zufriedenstellend lösen lässt, wurde zusätzlich eine Open-Source-Variante in den Test aufgenommen (WEKA).

Die diesjährige mayato-Studie legt den Schwerpunkt auf die Kundensegmentierung im Rahmen des Customer Relationship Analytics. Dazu traten anhand eines umfangreichen Testdatensatzes eines Finanzdienstleisters folgende vier Data-Mining-Tools und -Suiten gegeneinander an:

• SAS Enterprise Miner 6.2 • STATISTICA Data Miner 10 von StatSoft • WEKA 3.6.3 (Open-Source-Werkzeug) • SAP BW 7 (Data Mining Workbench)

DIE DATA-MINING-TOOLKATEGORIEN Bei näherer Betrachtung des Data-Mining-Softwaremarktes lassen sich typische Kategorien von Tools erkennen, deren Vertreter sich jeweils für unterschiedliche Anwendergruppen und Nutzungsszenarien eignen:

Zunächst sind hier die klassischen Data-Mining-Suiten (zum Beispiel von SAS, SPSS oder StatSoft) mit ihrem umfassenden Angebot an Funktionen für die Datenvorverarbeitung und Data-Mining-Verfahren zu nennen. Mit durchaus vergleichbarem Funktionsumfang werden sie inzwischen auch Open Source angeboten.

Demgegenüber stehen die schlankeren Data-Mining-Werkzeuge mit reduzierter Funktionalität: Sie sind in der Regel auf bestimmte Anwendungsgebiete (zum Beispiel Controlling) oder Analysefälle (zum Beispiel Prognose- und Klassifizierungsaufgaben) spezialisiert. Eine Sonderstellung in dieser Kategorie nimmt die softwaretechnische Umsetzung des Self-Acting Data Mining ein. Dieser hochautomatisierte Ansatz kommt weitgehend ohne manuelle Datenvorverarbeitung und Parametrisierung aus und eignet sich daher besonders gut für schnelle, erste Analyseprojekte.

Weiterhin haben zahlreiche Datenbank- und BI-Anbieter wie SAP, Oracle oder Microsoft in manchen Fällen recht umfangreiche Data-Mining-Funktionen in ihren Suiten integriert.

DIE PREISMODELLE Der Anschaffungspreis für komplette Data-Mining-Suiten liegt weiterhin - abhängig von der Nutzeranzahl und der gewünschten Funktionalität - meist im sechsstelligen Euro-Bereich. Hier geht der Trend jedoch zu günstigeren Konditionen, da immer mehr Hersteller einzelne Funktionen in Pakete zusammenfassen und separat anbieten. Meist sind solche Pakete an typischen Nutzungsszenarien ausgerichtet, so dass man mit einem konkreten Analyseprojekt im Hinterkopf die jeweils passende Funktionalität erhält. Damit können Anwender beispielsweise ein individuelles Startpaket erwerben, das zudem bei Bedarf einfach zum Differenzpreis erweiterbar ist.

Aber auch komplette Suiten kosten nicht mehr zwangsläufig sechsstellige Summen: So ist die Einzelplatzlizenz des Statistica Data Miners bei vollem Funktionsumfang beispielsweise bereits ab 20.000 Euro erhältlich. Für Open-Source-Lösungen entfällt der Anschaffungspreis; bei professioneller Nutzung kommen jedoch jährliche Supportgebühren im vierstelligen Eurobereich hinzu.

DER PRAXISTEST Im Praxistest zeigten sich schnell die Stärken und Schwächen der jeweiligen Tools: Den höchsten Reifegrad erreichen der "SAS Enterprise Miner" und der "Statistica Data Miner". Sie sind flüssig zu bedienen und leisten sich im gesamten Test keine echte Schwäche. Ihre Stärken zeigen beide besonders bei hohen Ausführungsgeschwindigkeiten und dem sicheren Umgang mit großen Datenmengen.

SAS bettet den Enterprise Miner in eine leistungsfähige BI-Gesamtarchitektur ein, die dem erfahrenen Anwender eine breite Palette an Möglichkeiten bietet. StatSoft punktet mit der im Umfeld der Clusteranalyse größeren Funktionsvielfalt, mit den bequemer und feiner zu parametrisierenden Verfahren und der ausführlicheren Dokumentation. Statistica bietet weiterhin im Vergleich zu SAS das bessere Preis-Leistungs-Verhältnis.

Diesen Artikel

Bewertung:

Übermittlung Ihrer Stimme...
Noch nicht bewertet. Seien Sie der Erste, der diesen Artikel bewertet!
Klicken Sie auf den Bewertungsbalken, um diesen Artikel zu bewerten.
  Sponsored Links:

IT-News täglich per Newsletter

E-Mail:
Weitere CW-Newsletter

CW Premium Zugang

Whitepaper und Printausgabe lesen.  

kostenlos registrieren

Aktuelle Praxisreports

(c) FotoliaHunderte Berichte über IKT Projekte aus Österreich. Suchen Sie nach Unternehmen oder Lösungen.

Zum Thema


Hosted by:    Security Monitoring by: