Lade Inhalt...

Einsatzmöglichkeiten von Data Mining im Marketing: Status Quo und Entwicklungspotenzial

Diplomarbeit 2005 77 Seiten

BWL - Marketing, Unternehmenskommunikation, CRM, Marktforschung, Social Media

Leseprobe

Inhaltsverzeichnis

Abbildungsverzeichnis

Abkürzungsverzeichnis

1 Einleitung

2 Rahmen und Umfeld des Data Minings im Marketing
2.1 Die Datenbasis
2.1.1 Daten - Information - Wissen
2.1.2 Mögliche Datenquellen
2.1.3 Data Warehouse und Data Mart
2.2 Die Analyse
2.2.1 Online Analytical Processing (OLAP)
2.2.2 Data Mining
2.2.3 Der Data Mining Prozess oder Knowledge Discovery in Databases (KDD)

3 Data Mining im Marketing entlang des Kundenlebenszyklus
3.1 Mit Data Mining verbundene Marketingkonzepte
3.2 Systematik der Einsatzmöglichkeiten
3.3 Kundenakquisition
3.3.1 Segmentierung potenzieller Kunden
3.3.2 Bearbeitung der ausgewählten Segmente
3.4 Kundenaktivierung
3.4.1 Datensammlung zur Optimierung vorheriger und künftiger Analysen
3.4.2 Risikoerkennung und -beurteilung
3.5 Kundenbeziehungsmanagement
3.5.1 Selektion profitabler Beziehungen - Kundenbewertung
3.5.2 Entwicklung der Beziehungen - Steigerung des Kundenwerts
3.5.3 Pflege der Beziehungen - Kundenbindung und Abwanderungsverhinderung.
3.6 Bewertung der Einsatzmöglichkeiten

4 Neuere Entwicklungen und Potenziale für Data Mining im Marketing
4.1 Externe Einflussfaktoren
4.1.1 Technologie
4.1.2 Gesellschaft und Recht
4.2 Anwendungsgebiete
4.2.1 Web Mining im Marketing
4.2.2 Text Mining im Marketing
4.3 Perspektiven im Data Mining Prozess
4.3.1 Datenerhebung und -speicherung
4.3.2 Datenverarbeitung und -analyse
4.3.3 Informationsdarstellung, -interpretation und -nutzung

5 Fazit

Literaturverzeichnis

Anhang

Abbildungsverzeichnis

Abb. 1 - Begriffshierarchie Zeichen/Daten/Information/Wissen

Abb. 2 - Architektur eines Data Warehouses

Abb. 3 - Dreidimensionaler OLAP-Würfel

Abb. 4 - Überblick über den Prozess der Knowledge Discovery in Databases (KDD)

Abb. 5 - Komponenten einer CRM-Lösung

Abb. 6 - Der Kundenlebenszyklus

Abb. 7a - Beispielhafte Netzwerkarchitektur eines KNN

Abb. 7b - Modell eines Neurons

Abb. 8 - Beispielhafter Entscheidungsbaum

Abb. 9 - Visualisierung von Assoziationsregeln

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

1 Einleitung

Generell kann beobachtet werden, dass die Menge verfügbarer Informationen in den letzten Jahren stark zugenommen hat und diese Entwicklung sich auch in baldiger Zukunft nicht abschwächen wird. Eine Studie der University of Berkeley kommt zu dem Ergebnis, dass im Jahr 2002 fünf Exabyte1 neuer Informationen produziert und gespeichert wurden. Das entspricht bei Zugrundelegung der Weltbevölkerung fast 800 Megabyte pro Person.2 Im Jahr 1999 waren es nur 250 Megabyte pro Erdbewohner, was einem Wachstum von über 300% in drei Jahren entspricht.3 Das anhaltende exponentielle Wachstum des welt-umspannenden unternehmensexternen Wissensspeichers Internet unterstreicht diese Er-gebnisse.4

Auch im Marketingbereich werden Unternehmen mit diesem Phänomen der „Datenflut“ konfrontiert. Dabei können zwei Einflussbereiche identifiziert werden. Einerseits ermög-licht der technische Fortschritt die Generierung und Speicherung von Daten in noch nie dagewesenem Umfang durch billigere Speichermedien, bessere Speichertechnologien und leistungsfähigere Datenbankverwaltungssysteme.5 Andererseits führen organisationale Ursachen zu immer größeren Datenbeständen. Hier zeigen sich die Auswirkungen einer zunehmenden Automatisierung. So speichern Anwendungssysteme zur Unterstützung und Steuerung operativer Prozesse wachsende Mengen an Daten aufgrund einer Asymmetrie zwischen Datengewinnung und Datenvernichtung (vertikales Wachstum). Außerdem wird aufgrund zunehmender Umweltkomplexität die Erfassung einer größeren Anzahl von Fakten erforderlich (horizontales Wachstum).6

Die bereitstehende Masse von Daten führt jedoch nicht unbedingt zu einer besseren Infor-mationsversorgung im Marketing. Es kann im Gegenteil sogar festgestellt werden, dass das Auffinden der gewünschten Information, die sinnvolle Verdichtung von Daten und gene-rell eine Verwendung zu Zwecken der Entscheidungsunterstützung zu einem immer größeren Problem wird.

Andererseits kann aber auch die wachsende Datenmenge als Chance begriffen werden, wenn es gelingt, das in den Daten liegende Wissen aufzuspüren und nutzbar zu machen. Traditionelle Methoden der Datenanalyse wie Berichte oder ad-hoc Abfragen können die wachsenden Datenbestände jedoch kaum noch bewältigen. Einfache statistische Auswer-tungen bringen geringen Mehrwert. Deshalb wurde die Notwendigkeit erkannt, neue Methoden und Techniken zu entwickeln und einzusetzen, um dieses Problem zu lösen.

Gerade im Marketing wird das Problem durch eine steigende Angewiesenheit auf ent-scheidungsunterstützende Informationen verschlimmert. Grund dafür ist vor allem der Wechsel vom transaktionsbezogenen Massenmarketing hin zu einem individuellen Bezie-hungsmarketing aufgrund einer sich verschärfenden Wettbewerbssituation. Durch eine zunehmende Angleichung konkurrierender Unternehmen wird eine Differenzierung über Qualität, Preis oder Zeit schwieriger. Deshalb wird versucht, sich mit Hilfe individualisier-ter Kundenbeziehungen und Produkte einem individualisierten Marketing zu nähern. Konkret kann dies beispielsweise mit persönlichen Anschreiben oder kundenspezifischen Cross-Selling Angeboten realisiert werden. Um jedoch die Individualisierung adäquat durchführen zu können, ist das Marketing auf relevantes Wissen über den Kunden ange-wiesen. Der Ressource Information kommt somit entscheidende Bedeutung zu.7

Spezielle Data Mining8 Methoden können nun aus bereitstehenden Daten derartig relevan-te Informationen generieren. Mit Hilfe von Data Mining ist es möglich, automatisch oder semiautomatisch Muster in großen Datenmengen zu erkennen und damit Hypothesen zu generieren.9 Besonders im Marketing lassen sich diese Methoden auf vielfältige Art nutzbringend einsetzen. So können beispielsweise im Handel die Warenkörbe der Kunden analysiert werden. Aus den Ergebnissen sind konkrete Maßnahmen ableitbar, die helfen können, Kundenzufriedenheit und Umsatz zu steigern. Auch Prognosen können durch den Einsatz von Data Mining erstellt werden. Dadurch können zum Beispiel abwanderungsge-fährdete Kunden identifiziert und mit entsprechenden Maßnahmen weiterhin an das Unter-nehmen gebunden werden. Diese beispielhaft herausgegriffenen Einsatzmöglichkeiten sollen nur die große Anwendungsvielfalt von Data Mining illustrieren.

Ziel dieser Arbeit ist es nun, mögliche Anwendungsbereiche des Data Minings im Marketing systematisch aufzuzeigen und darauf aufbauend Entwicklungspotenziale darzustellen. Dazu wird zunächst in Kapitel 2 dieser Arbeit der Rahmen des Data Mining im Marketing abgesteckt. Neben der Klärung wichtiger Begrifflichkeiten und einer Darstellung der Grundlagen der Bereitstellung von Daten wird dabei auch auf den allgemeinen Analyseprozess von Marketingdaten mit Hilfe von Data Mining eingegangen.

In Kapitel 3 werden dann konkrete Einsatzmöglichkeiten von Data Mining im Marketing erläutert. Das Vorgehen lehnt sich in diesem Teil der Arbeit an die verschiedenen Phasen des Kundenlebenszyklus an. Ausgehend von Nichtkunden wird aufgezeigt, welche Rolle Data Mining bei der Gewinnung von Interessenten, deren Überführung zu Neukunden und deren Weiterentwicklung zu Bestandskunden spielen kann. So wird es möglich, Aspekte des Data Minings und des Marketings integriert zu betrachten. Dabei wird knapp die Funktionsweise der wichtigsten Data Mining Methoden erklärt und deren typische Anwen-dungen veranschaulicht. Ziel ist nicht eine detaillierte statistisch-mathematische Beschrei-bung der Methoden. Vielmehr soll ein grundlegender Überblick gegeben werden, der es ermöglicht, den Einsatz im Marketing nachzuvollziehen. Ebenso können auch aufgegriffe-ne Marketingaspekte nicht in ihrer vollen Breite dargestellt werden. Anschließend findet eine Bewertung der Einsatzmöglichkeiten statt.

Darauf aufbauend wird in Kapitel 4 der Fokus auf Entwicklungsmöglichkeiten von Data Mining im Marketing gelegt. Zunächst werden technologische, gesellschaftliche und rechtliche Faktoren identifiziert, die extern auf das Data Mining im Marketing einwirken. Im Anschluss werden die Folgen insbesondere technologischer Entwicklungen für das Data Mining aufgezeigt. Dabei steht im Rahmen des Marketings die Ausweitung von Data Mining auf das Internet (Web Mining) und auf unstrukturierte Daten, insbesondere Texte (Text Mining) im Vordergrund. Zum Abschluss des Kapitels rückt dann ein auf die drei Phasen Datenerhebung, Datenanalyse und Informationsnutzung vereinfachter Data Mining Prozess in den Mittelpunkt. Entlang dieses Prozesses erfolgt dabei die Darstellung weiterer Potenziale, wobei die Möglichkeiten neuer Technologien und Anwendungsgebiete einflie-ßen.

Abschließend wird in Kapitel 5 ein Fazit gezogen, in das die gewonnenen Erkenntnisse eingearbeitet werden. Neben einer wertenden Betrachtung stehen hier auch weitere Herausforderungen an das Data Mining im Marketing im Vordergrund.

2 Rahmen und Umfeld des Data Minings im Marketing

2.1 Die Datenbasis

2.1.1 Daten - Information - Wissen

„We live in an expanding universe of datain which there is too much data and too little information.”10 Dieses Zitat fasst die anfangs beschriebene Problematik zusammen und macht deutlich, dass ein Unterschied zwischen Daten und Informationen besteht.

In der Literatur finden sich viele Definitionen und Abgrenzungen der Begriffe „Daten“ und „Information“. Heinrich beschränkt Informationen eng auf den Zweck der Entscheidungs-vorbereitung.11 Hierbei kann die Subjektivität bei der Beurteilung, was einen Zweck hat und was nicht, kritisiert werden. Ferstl und Sinz dagegen definieren Information sehr weit als den „Sinngehalt“ von Daten.12 Diese Abgrenzung lässt einen großen Interpretationsfrei-raum.

Deshalb wird in dieser Arbeit eine klar abgegrenzte, hierarchisch aufge-baute Definition auf Grundlage der Semiotik verwendet (vgl. Abb. 1).Zeichensind demnach die Grundele-mente zur Darstellung von Daten und Informationen. Sie stammen aus einem Zeichenvorrat, der Alphabet genannt wird, wenn er linear geordnet ist. Werden Zeichen mit einer Syntax

Abbildung in dieser Leseprobe nicht enthalten

Abb. 1 - Begriffshierarchie Zeichen/Daten/Informa-tion/Wissen (Quelle: Eigene Darstellung, Erweiterung von Krcmar (2000), S. 11)

man vonDaten. Daten in einem Sinn gebenden Kontext, der Semantik, sindInformatio-nen.13 Wissenentsteht durch die Vernetzung von verschiedenen Informationen. Je weiter oben man sich auf der dargestellten Pyramide befindet (vgl. Abb. 1), desto mehr nimmt die

Qualität und damit der Wert der jeweiligen Ressource zu. Wissen stellt dann die Grundlage für Entscheidungen dar.

2.1.2 Mögliche Datenquellen

Für die Daten, die die Grundlage für erfolgreiches Data Mining im Marketing darstellen, sind die verschiedensten Quellen denkbar. Dabei handelt es sich in der Regel um Kunden-daten. Diese lassen sich in Grund-, Potenzial-, Aktions- und Reaktionsdaten einteilen.14 Grunddatensind längerfristig gleich bleibende und produktunabhängige Daten wie bei-spielsweise Name und Adresse.Potenzialdatenliefern produktgruppen- und zeitpunktbe-zogene Hinweise auf das kundenindividuelle Nachfragevolumen (zum Beispiel Leasing-laufzeiten oder anstehende Wartungstermine).Aktionsdatenbeziehen sich auf kundenbe-zogene Maßnahmen wie Werbebriefe oder Kundenbesuche.Reaktionsdatenspiegeln die Verhaltensweisen der Kunden wieder (zum Beispiel Anfragen, Bestellungen, Reklamatio-nen).15

Diese Daten fallen im unternehmensinternen Bereich im Umfeld von Marketing und Vertrieb an, aber auch in anderen Bereichen wie dem Rechnungswesen werden für das Data Mining im Marketing relevante Daten gesammelt. So bergen beispielsweise die von Telekommunikationsanbietern zu Abrechnungszwecken erhobenen Gesprächsdaten ein erhebliches Wissenspotenzial, das mit Hilfe von Data Mining erschlossen werden kann. Auch im Bereich der Logistik erhobene Daten, zum Beispiel über das Retourenverhalten von Kunden, können hilfreich sein.16

Daneben stehen aber auch unternehmensexterne Daten zur Verfügung. Diese Daten kön-nen von darauf spezialisierten Dienstleistungsunternehmen, kooperierenden Unternehmen, die Kundendaten austauschen, oder auch dem Staat, zum Beispiel in Form von Daten des Kraftfahrtbundesamtes oder des Statistischen Bundesamtes stammen. Generell kann bei externen Daten zwischen Individual- und Aggregatdaten unterschieden werden.Individu-aldatenkönnen über Name und Adresse eindeutig einem intern vorhandenen Kundenda-tensatz zugeordnet werden.Aggregatdatendagegen beziehen sich auf Kundenaggregate wie beispielsweise Marktsegmente, Kundengruppen oder Regionen und können nur mittel- bar den vorhandenen Kundendaten zugeordnet werden. Auf Datensammlung und -aufbereitung spezialisierte Unternehmen bieten beispielsweise Individualdaten in Form von elektronischen Telefon- und Adressenverzeichnissen, Firmendatenbanken im Bereich des B2B-Marketing, Lifestyledaten (detaillierte Konsumprofile und -interessen) oder Wohngebäudedatenbanken (individuelle Wohnverhältnisse) an. Im Bereich der Aggregat-daten offerieren sie mikrogeografische Segmentierungen (Wohngebietstypologien) oder Marktforschungsdaten.17

Für erfolgreiches Data Mining ist am besten eine umfassende, integrierte und bereinigte Datenbasis geeignet, die Daten verschiedener individueller Datenbanken integriert und auch historische Daten vorhält, um Trends und Entwicklungen erkennen und berücksichti-gen zu können.18 Allerdings sammeln Unternehmen anfallende Daten häufig nur aus operativen Gründen wie beispielsweise zur Lagerbestandskontrolle oder zu Abrechnungs-zwecken. Haben die Daten ihren originären Zweck erfüllt, werden sie gelöscht oder liegen ungenutzt brach, da sich die Unternehmen des in ihnen liegenden Potenzials für das Mar-keting nicht bewusst sind. Teilweise finden sich jedoch auch historisch gewachsene be-reichsspezifische Insellösungen, die eine eingeschränkte Analyse und Wissensgewinnung ermöglichen, dennoch aber nur einen beschränkten Einblick in das Kundenverhalten geben können. Verstärkt wird dieses Problem durch eine fehlende Standardisierung bei der Datenspeicherung. So werden etwa Datenfelder gleichen Inhalts in verschiedenen Unter-nehmensbereichen anders benannt oder Daten redundant, d.h. mehrfach gespeichert. Zur Lösung dieses Problems der verteilten Speicherung und inkonsistenten Organisation der Daten wurde das Konzept des Data Warehouses entwickelt.19

2.1.3 Data Warehouse und Data Mart

Das Konzept des Data Warehouses (DWH) wurde von Inmon (1992) eingeführt. Er definierte es wie folgt:„A data warehouse is a subject oriented, integrated, non-volatile, and time variant collection of data in support of management’s decisions.“20

Ein Data Warehouse kann analog zu einem zentralen Warenlager als ein zentraler Speiche-rort für Daten betrachtet werden. Einen Überblick über die typische Architektur eines Data Warehouse gibt Abbildung 2. Die Informationseinheiten im Data Warehouse sind auf die inhaltlichen Kernbereiche einer Organisation („subject oriented“) fokussiert. Die Daten in einem Data Warehouse werden zu einem einheitlichen und konsistenten („integrated“) Datenbestand zusammengefasst. Der Import aktueller Daten wird durch ETL-Komponenten gewährleistet, wobei ETL für Extraktion, Transformation und Laden steht. Monitoring-Komponenten überwachen zu berücksichtigende externe und interne Daten-quellen auf Änderungen. Aktualisierte oder neue Daten werden dann extrahiert und trans-formiert. Bei der Transformation wird unter Berücksichtigung von Metadaten, die die Beziehungen, Strukturen und Zusammenhänge der zu transformierenden Daten beschrei-ben, eine Bereinigung und Integration der Daten vorgenommen. Danach werden sie in das Data Warehouse geladen. Nach einer fehlerfreien Übernahme werden die Daten nicht mehr verändert, sie sind dann dauerhaft („nonvolatile“) im Data Warehouse vorhanden. Die Speicherung der Daten erfolgt in den operativen Systemen zeitpunktbezogen, im Data Warehouse dagegen zeitraumbezogen („time variant“). Die auf diese Weise über einen längeren Zeitraum gesammelten Daten („collection of data“) können dann zur Entschei-dungsunterstützung herangezogen werden („support of management’s decisions“) und bilden die Grundlage für weitere Analysen mit Hilfe von aufgesetzten Werkzeugen, insbe-sondere auch mit Hilfe von Data Mining Tools.21

Festzuhalten ist jedoch, dass für die Anwendung von Data Mining Methoden ein Data Warehouse nicht zwingend erforderlich ist, es jedoch den Data DWH Mining Prozess wesentlich effizienter gestalten Laden kann.22 Das Data Warehouse liefert eine für die Datenanalyse im Marketing geeignete Aufbereitung der relevanten Daten.

Abb. 2 - Architektur eines Data Warehouses

(Quelle: in Anlehnung an Muksch und Behme (2000), S. 14 und Schinzer, Bange und Mertens (1999), S. 30.)

Eine Variante innerhalb des Data Warehouse Konzepts stellen Data Marts dar, die als eine kleine-re Version eines Warehouses gelten. Data Marts stellen lediglich eine inhaltlich beschränkte Sicht auf das Data Warehouse bereit, häufig nur einen abteilungsspezifisch zugeschnittenen Teilausschnitt.23

2.2 Die Analyse

2.2.1 Online Analytical Processing (OLAP)

Online Analytical Processing (OLAP) bezeichnet einen Ansatz zur multidimensionalen Analyse von Daten in einem Data Warehouse. Dieses Konzept wurde von E.F. Codd anhand von 12 Regeln eingeführt.24 OLAP zielt darauf ab, die in Interaktion mit einem Nutzer durchgeführte Datenanalyse zu vereinfachen und die Datenbestände auf vielfältige Art und Weise und aus verschiedenen Blickwinkeln zu betrachten. Ein wesentlicher Vorteil von OLAP ist, dass aufgrund der intuitiven Benutzeroberfläche für die Nutzung von OLAP keine Spezialisten erforderlich sind, so dass auch ein Fachbereichsmitarbeiter ohne tief greifende Statistikkenntnisse erfolgreiche Analysen durchführen kann. Die übersichtliche Visualisierung der Ergebnisse in Form von Graphiken und Tabellen ermög-licht einen schnellen Überblick über die Resultate und erleichtert den Umgang mit den umfangreichen Datenbeständen.25

Zur Veranschaulichung der mehrdimensionalen Datenbasis wird aus Darstellungsgründen häufig eine dreidimensionale Darstellung gewählt (vgl. auch Abb. 3). OLAP ist jedoch nicht auf drei Dimensionen beschränkt.26

Abbildung in dieser Leseprobe nicht enthalten

Abb. 3 - Dreidimensionaler OLAP-Würfel

(Quelle: Eigene Darstellung)

Auf dem Datenwürfel können verschiedene Operationen durchgeführt werden.„Roll up“ führt eine Aggregation durch, zum Beispiel von der regionalen Betrachtung hin zur Betrachtung auf Länderebene. Die Dimensionen bleiben dabei erhalten.„Drill down“verhält sich komplementär zu „Roll up“, dabei wird von verdichteten zu detaillierten Daten navigiert, beispielsweise von Quartalsebene zu Monatsebene. Beim„Drill across“wird die angezeigte Kennzahl gewechselt, zum Beispiel verkaufte Stückzahl statt Umsatz. „Slice“ und „Dice“ unterstützen den Nutzer bei der Beantwortung typischer Geschäftsfragen. Beim„Slicing“wird ein bestimmter Bereich aus dem Würfel herausgeschnitten, während beim„Dicing“der Würfel gedreht oder gekippt wird. So lässt sich beispielsweise die Frage „Wie hat sich der Umsatz von Produkt A in der Region III in den letzten 2 Jahren entwickelt?“ beantworten.27

Während OLAP für einfachere Analysen gut geeignet ist, stößt es bei komplexen oder mit Prognosen behafteten Fragestellungen auch aufgrund eines beschränkten Methodenarse-nals und der rein deskriptiven Darstellung der Daten schnell an seine Grenzen.28 An dieser Stelle setzt Data Mining an. Deshalb sind OLAP und Data Mining auch keine konkurrie-renden Ansätze, sondern sie ergänzen sich. So können die Ergebnisse einer OLAP-Analyse Fragestellungen aufwerfen, die durch eine Data Mining Analyse beantwortet werden können. Andererseits können mit Hilfe von Data Mining entdeckte Muster die Basis für OLAP bilden.29 Dennoch werden mit OLAP überwiegend hypothesengetriebene Untersu-chungen durchgeführt.

2.2.2 Data Mining

Data Mining kann als die Anwendung spezifischer Algorithmen verstanden werden, die eingesetzt werden, um Muster aus Daten zu extrahieren.30 Dabei handelt es sich um die nicht-triviale Entdeckung gültiger, neuer, potenziell nützlicher und verständlicher Mus-ter.31

Teilweise wird Data Mining auch auf die automatische Analyse begrenzt.32 Dies stellt jedoch eine zu starke Einschränkung dar, da einige Methoden semiautomatisch, d.h. beispielsweise im Dialog mit dem Nutzer eine Analyse durchführen. Berry und Linoff sehen den Anwendungsbereich von Data Mining nur in Bezug auf große Datenmengen.33 Dies mag in der Praxis häufig der Fall sein, dennoch können entsprechende Methoden auch auf kleinere Datenmengen angewendet werden und darin enthaltene interessante Muster aufdecken.34

Es muss auch festgehalten werden, dass das Ziel von Data Mining in der Regel die Generierung neuer Hypothesen aus einem Datenbestand ist, eine so genannte hypothesenfreie Bottom-Up Vorgehensweise. Im Rahmen einer derartigen datengetriebenen Analyse im Marketing kann zum Beispiel der Frage: „Welche Artikel werden häufig gemeinsam gekauft?“ nachgegangen werden.35 Anhand des genannten Beispiels wird deutlich, dass eine völlig hypothesenfreie Vorgehensweise kaum möglich ist, da immer gewisse Vermutungen eine Rolle spielen und eine Suche nach irgendwelchen Auffälligkeiten in den seltensten Fällen brauchbare Ergebnisse liefern wird.36 Generell kann Data Mining einen hohen Erfolgsbeitrag leisten, da die Aufdeckung völlig unbekannter und nicht vermuteter Muster und Zusammenhänge große Potenziale birgt.

Data Mining kann weiter in Verfahren desüberwachten Lernens(Lernen aus vorgegebenen Beispielen) und Verfahren desunüberwachten Lernens(Lernen aus Beobachtungen) unterteilt werden.37 Daneben kann anhand verwendeter Methoden auch Data Mining zudeskriptivenbzw.prädiktivenZwecken unterschieden werden.38

Data Mining hat sich als eigenständige Forschungsrichtung durch eine Synthese bestehen-der Wissenschaftsdisziplinen entwickelt. Einen Einfluss hatten dabei insbesondere die Statistik, die Datenbankforschung, die grafische Datenverarbeitung und die Künstliche Intelligenz.39 Deshalb finden sich auch viele weitere Begriffe, die den Prozess der Erken-nung von Mustern in Daten beschreiben. Hier sind beispielsweise „knowledge extraction“, „information discovery“, „information harvesting“, „data archaeology“ oder „data pattern processing“ zu nennen.40

Aufgrund der generellen Nützlichkeit des Data Mining wird es nicht nur im Marketing, sondern im betriebswirtschaftlichen Bereich beispielsweise auch im Controlling oder in der Produktion eingesetzt. Auch in anderen Gebieten, wie beispielsweise der Astronomie41, der Biologie42 oder der Chemie43 finden die Methoden des Data Mining Anwendung.

2.2.3 Der Data Mining Prozess oder Knowledge Discovery in Databases (KDD)

Data Mining wird häufig in den Prozess der Knowledge Discovery in Databases (KDD) eingeordnet. Nach der ursprünglichen Definition von Fayyad et al.44 stellt Data Mining ein Schritt innerhalb dieses Prozesses dar. In diesem Fall wird Data Mining auf die konkrete Durchführung von Analysen mit Hilfe von Data Mining Algorithmen begrenzt.45 Diese Betrachtungsweise kann auch als Data Mining im engeren Sinne verstanden werden.

Teilweise werden die Begriffe Data Mining und KDD jedoch auch synonym verwendet.46 Dann kann aber in der Regel auch davon ausgegangen, dass dem Prozess des Data Mining neben der eigentlichen Analyse auch vor- und nachbereitende Schritte zugeschrieben werden47, so dass hier von Data Mining im weiten Sinne gesprochen werden kann. Data Mining im weiten Sinne entspricht dann dem KDD-Prozess und wird auch als Data Mining Prozess bezeichnet.

Da auch für Data Mining im engeren Sinne vorbereitende Maßnahmen erforderlich sind, wird nun kurz der KDD-Prozess bzw. Data Mining im weiten Sinne dargestellt (vgl. Abb. 4).

Der Prozessablauf ist iterativ und interaktiv48, d.h. der Anwender bestimmt auf der Grund-lage des Ergebnisses einzelner Phasen oder des gesamten Prozesses den weiteren Prozess-ablauf. Dabei können einzelne Phasen oder der gesamte Prozess erneut durchlaufen wer-den.

Abbildung in dieser Leseprobe nicht enthalten

Abb. 4 - Überblick über den Prozess der Knowledge Discovery in Databases (KDD)

(Quelle: Fayyad, Piatetsky-Shapiro, Smyth (1996b), S. 41)

Zu Beginn wird die Aufgabenstellung und Zielsetzung festgelegt. Danach werden die für die Aufgabenstellung relevanter Daten ausgewählt („Selection“). Dabei ist zu beachten, dass technische, organisatorische oder rechtliche Gründe Schranken setzen können.49 Die selektierten Daten („Target Data“) müssen nun aufbereitet werden. Hier steht die Bereini-gung der Daten im Vordergrund („Preprocessing“). Bei fehlenden Daten kann der ent-sprechende Datensatz gelöscht werden oder die fehlenden Werte müssen ersetzt werden. Fehlerhafte Merkmalsausprägungen müssen korrigiert werden.50 Dies können inkonsisten-te Ausprägungen oder Ausreißerwerte sein. Es sollte in dieser Phase jedoch mit äußerster Vorsicht vorgegangen werden, um keine bedeutsamen Beziehungsmuster zu zerstören.51 Daran schließt sich dieTransformationder Daten an. Das Ziel der Verringerung der Komplexität der Ermittlung und Abbildung von Beziehungsmustern in den Daten wird in dieser Phase durch eine Reduktion der Merkmale bzw. Dimensionen angestrebt.52 Dabei werden die Daten auch in ein für das Data Mining Verfahren geeignetes Format überführt. Bevor nun die eigentliche Phase des Data Minings (im engeren Sinne) beginnt, findet noch eine an der zu Beginn festgelegten Zielsetzung ausgerichtete Auswahl der Analysemethode statt. Außerdem wird bestimmt, ob die Analyse auf der Grundlage einer Stichprobe oder der Grundgesamtheit durchgeführt wird.53 Jetzt folgt die Datenanalyse („Data Mining“), bei der mit mathematischen und statistischen Verfahren Muster in den Daten aufgedeckt werden sollen. Die erkannten Muster („Patterns“) werden anschließend interpretiert und bewertet („Interpretation“). Das Ziel des Prozesses ist der Gewinn von Wissen („Knowledge“) und dessen nutzbringender Einsatz.54 So kann beispielsweise herausgefunden werden, welche Merkmale bei der Attraktivitätseinstufung eines Kunden eingesetzt werden oder welche Kunden für eine Werbeaktion geeignet sind.

Die vorbereitenden Schritte sind entscheidend für den Erfolg eines Data Mining Projektes.55 Deshalb ist es auch nicht verwunderlich, dass sie einen erheblichen Anteil der insgesamt benötigten Ressourcen beanspruchen. Expertenschätzungen gehen dabei von circa 60% des Gesamtaufwands eines Data Mining Projektes aus. Die eigentliche Data Mining Analyse benötigt nur etwa 10% des Zeitaufwandes.56

Durch den Einsatz eines Data Warehouses kann der Aufwand in den vorbereitenden Phasen reduziert werden, da bereits beim Laden der Daten in das Data Warehouse eine Bereinigung der Daten durchgeführt wurde.57 Außerdem werden die operativen Datenbanken bei der Analyse der Daten im Data Warehouse nicht belastet.58 Ein weiterer Vorteil liegt in der Weiterverwendung des durch das Data Mining gewonnenen Wissens, welches wiederum im Data Warehouse gespeichert werden kann.59

3 Data Mining im Marketing entlang des Kundenlebenszyklus

3.1 Mit Data Mining verbundene Marketingkonzepte

In der Marketingliteratur existieren einige Konzepte, die eng mit Data Mining zusammenhängen bzw. auf Data Mining aufbauen und nur durch den Einsatz von Data Mining Methoden realisiert werden können.

Database Marketing hängt unmittelbar mit Data Mining im Marketing zusammen. Teilwei-se werden die Begriffe auch synonym verwendet. Als sich Database Marketing in den 1980er Jahren entwickelte, wurden Analysen, die weiterentwickelt heute unter OLAP und Data Mining fallen, dem Database Marketing zugeschrieben. Gegenwärtig wird Database Marketing jedoch als Marketinginstrument betrachtet, das sich auf die Anwendung und Umsetzung der mit Hilfe von Data Mining gewonnenen Erkenntnisse bezieht.60 Database Marketing wird dabei als die kunden- bzw. interessentenindividuelle Planung, Ausgestaltung, Koordination und Kontrolle aller Marketingkonzepte und -aktivitäten auf Grundlage eines EDV-gestützten Informationssystems mit dem Ziel verbesserter Kundenbindung und effizienterer Neukundengewinnung gesehen.61

Computer Aided Selling (CAS) ist ein System zur Unterstützung der Aufgaben im Außen-dienst. Durch den Einsatz mobiler Computer soll dessen Wirtschaftlichkeit und der Ver-kaufserfolg gesteigert werden.62 Im US-amerikanischen Gebiet wird dieses Konzept auch Sales Force Automation (SFA) genannt. Seit der Einführung dieses Konzepts in den 1980er Jahren wandelte es sich jedoch hin zu einem Einsatz von Software im Verkaufsau-ßendienst, die den Verkäufer mit umfassenden Informationen und Funktionen beim Kun-den vor Ort und seinen Vorgesetzten bei der Führung und Kontrolle seiner Mitarbeiter unterstützt.63 Die dadurch gewährleistete detaillierte Dokumentation der Verkaufsaktivitä-ten und die dabei anfallenden Daten bieten eine gute Grundlage für Data Mining Analysen. Dabei gewonnene Erkenntnisse können dann wiederum mit Hilfe der CAS-Software dem Außendienstmitarbeiter, auch direkt vor Ort beim Kunden, zur Verfügung gestellt werden und den Verkaufserfolg steigern.

Aus technischer Sicht entstanden aus der Weiterentwicklung der CAS-Systeme Customer Relationship Management (CRM)-Systeme. Diese dienen im Gegensatz zu den CAS-Systemen jedoch nicht nur zur Unterstützung des Verkaufsprozesses sondern auch zur Verbesserung der Marketing- und Serviceprozesse. Aus betriebswirtschaftlicher Sicht führte jedoch auch der Trend weg vom Produkt- und Transaktionsmarketing und hin zum Kunden- und Beziehungsmarketing zur Verbreitung von CRM-Systemen. CRM kann dabei als kundenorientierte Unternehmensstrategie verstanden werden, die mit Hilfe moderner Informationstechnologie versucht, auf lange Sicht profitable Kundenbeziehungen durch ganzheitliche und individuelle Marketing- Vertriebs- und Servicekonzepte aufzubauen und zu festigen.64

Abbildung 5 gibt einen Überblick über die Komponenten des CRM. Es wird deutlich, dass das Data Warehouse als zentraler Datenspeicher im Mittelpunkt steht und als Datenspeicher und Datenquelle für Anwendungen aus dem Back-Office-Bereich dient. Die im Data Warehouse bereitgestellten Daten werden im Rahmen des analytischen CRM mit Hilfe von Data Mining und OLAP analysiert.

Die gewonnenen Erkennt- nisse werden dann im Rahmen des operativen und kommunikativen CRM in konkrete Maßnahmen im Marketing-, Vertriebs- oder Servicebereich umgesetzt, Architecture wobei eine Vielzahl von Kommunikations- und Interaktionsmöglichkeiten offen stehen. Wird dabei das Medium Internet eingesetzt, handelt es sich um electronic CRM (eCRM). Wichtig hierbei ist die als lernendes System ausgerichtete Closed Loop Architecture, d.h. die Kundenreaktionen auf durchgeführte Maßnahmen 65 werden dokumentiert und gespeichert und im nächsten Durchlauf berücksichtigt.65

Abbildung in dieser Leseprobe nicht enthalten

Abb. 5 - Komponenten einer CRM-Lösung

(Quelle: Hippner, Martin und Wilde (2001), S. 419)

3.2 Systematik der Einsatzmöglichkeiten

Zur Systematisierung der Anwendungsmöglichkeiten von Data Mining im Marketing sind mehrere Möglichkeiten denkbar. Teilweise wird in der Literatur das Vorgehen anhand des oben dargestellten Data Mining Prozesses geordnet.66 Es besteht dann jedoch die Gefahr, den Fokus auf die konkreten Einsatzmöglichkeiten aus den Augen zu verlieren.

Eine häufige Vorgehensweise ist die Gliederung nach Data Mining Methoden. Dabei werden zuerst in einem mathematisch-statistischem Teil die Data Mining vorgestellt und erläutert. Anschließend findet eine beispielhafte Aufzählung konkreter Einsatzmöglichkei-

[...]


1 Das sind über fünf Millionen Terabyte bzw. über fünf Milliarden Gigabyte oder ungefähr die Menge an Speicherplatz, die 9,5 Billiarden digitalisierte Bücher belegen würden.

2 Vgl. Lyman und Varian (2003).

3 Vgl. Lyman und Varian (2000).

4 Vgl. Anlage 1.

5 Vgl. Fayyad, Piatetsky-Shapiro und Smyth (1996a), S. 1f.

6 Vgl. Fayyad, Piatetsky-Shapiro und Smyth (1996b), S. 38.

7 Vgl. Hippner und Wilde (2001a), S. 973ff.

8 Vgl. Abschnitt 2.2.2 dieser Arbeit für eine Definition.

9 Ebenda.

10 Adriaans und Zantinge (1996), S. 2.

11 Vgl. Heinrich (1993), S. 104.

12 Vgl. Ferstl und Sinz (1998), S. 126.

13 Vgl. Krcmar (2000), S. 11.

14 Für andere Kategorien vgl. zum Beispiel Kotler und Bliemel (1999), S. 436f.

15 Vgl. Link und Hildebrand (1994), S. 5ff.

16 Vgl. dazu auch Abschnitt 3.5.2 dieser Arbeit.

17 Vgl. Hippner und Wilde (2001b), S. 30ff.

18 Vgl. dazu auch Abschnitt 2.2.3 dieser Arbeit.

19 Vgl. Lusti (2002), S. 130ff.

20 Vgl. Inmon (1992), S. 25.

21 Vgl. Schinzer, Bange und Mertens (1999), S. 14ff.

22 Vgl. Berry und Linoff (2004), S. 508ff. Extraktion Monitoring Datenquellen (intern und extern)

23 Vgl. Samli, Pohlen und Bozovic (2002), S. 217f.

24 Vgl. Codd, Codd und Salley (1993), S. 12ff.

25 Vgl. Schinzer, Bange und Mertens (1999), S. 39.

26 Ebenda, S. 40f. Produkt A 12 7 1 Produkt B 9 16 4 3. Quartal Produkt C 23 34 30 2. Quartal 1. Quartal Umsatz

27 Vgl. Chamoni (2001), S. 553f.

28 Vgl. Wilde (2001), S. 12f.

29 Vgl. Zipser (2000), S. 193ff.

30 Vgl. Fayyad, Piatetsky-Shapiro und Smyth (1996b), S. 39.

31 Vgl. Fayyad, Piatetsky-Shapiro und Smyth (1996a), S. 6ff.

32 Vgl. Samli, Pohlen und Bozovic (2002), S. 219.

33 Vgl. Berry und Linoff (2004), S. 7.

34 Vgl. Bensberg (2001), S. 63f.

35 Vgl. Knobloch und Weidner (2000), S. 351ff.

36 Vgl. Küppers (1999), S. 82.

37 Vgl. Knobloch und Weidner (2000), S. 352.

38 Vgl. Fayyad, Piatetsky-Shapiro und Smyth (1996b), S. 44.

39 Vgl. Hagedorn, Bissantz und Mertens (1997), S. 601.

40 Vgl. Fayyad, Piatetsky-Shapiro und Smyth (1996b), S. 39.

41 Vgl. Fayyad, Djorgovski und Weir (1996), S. 471ff.

42 Vgl. Fayyad, Haussler, und Stolorz (1996), S. 53f.

43 Vgl. Hemmer und Gasteiger (2000), S. 1ff.

44 Vgl. Fayyad, Piatetsky-Shapiro und Smyth (1996b), S. 41.

45 Ebenda, S. 42.

46 Vgl. Adriaans und Zantinge (1996), S. 5.

47 Vgl. zum Beispiel den Cross Industry Standard Process for Data Mining (CRISP-DM) bei Chapman et al. (2000), S. 13ff. oder den SEMMA Prozess (Sample, Explore, Modify, Model, Assess) des SAS Institute (http://www.sas.com/technologies/analytics/datamining/miner/semma.html, zugegriffen am 06.02.2005).

48 Vgl. Wrobel (1998), S. 5.

49 Siehe auch Abschnitt 4.1 dieser Arbeit.

50 Vgl. Berry und Linoff (2004), S. 73f.

51 Vgl. Brachman und Anand (1996), S. 50.

52 Vgl. Weiss und Indurkhya (1998), S. 84.

53 Ebenda, S. 107.

54 Vgl. Fayyad, Piatetsky-Shapiro und Smyth (1996b), S. 42.

55 Vgl. Adriaans und Zantinge (1996), S. 9.

56 Vgl. Cabena et al. (1998), S. 43.

57 Vgl. Adriaans und Zantinge (1996), S. 84.

58 Vgl. Krahl, Windheuser und Zick (1998), S. 51ff.

59 Vgl. Cabena et al. (1998), S. 21.

60 Vgl. Ahlemeyer-Stubbe (2000), S. 22.

61 Vgl. Ceyp (2002), S. 869.

62 Vgl. Hermanns (1989), S. 21.

63 Vgl. Kieliszek (1994), S. 8.

64 Vgl. Hippner, Martin und Wilde (2001), S. 417.

65 Ebenda, S. 418ff.

66 Siehe zum Beispiel Rud (2001).

Details

Seiten
77
Jahr
2005
ISBN (eBook)
9783638392037
Dateigröße
757 KB
Sprache
Deutsch
Katalognummer
v40766
Institution / Hochschule
Universität Hohenheim – Institut für Betriebswirtschaftslehre
Note
2,0
Schlagworte
Einsatzmöglichkeiten Data Mining Marketing Status Entwicklungspotenzial

Autor

Teilen

Zurück

Titel: Einsatzmöglichkeiten von Data Mining im Marketing: Status Quo und Entwicklungspotenzial