State-of-the-Art der Nutzung von Data-Mining-Methoden im Performance Management

Name: State-of-the-Art der Nutzung von Data-Mining-Methoden im Performance Management
Price: 42.95 EUR
Availability: InStock
Author: Marc Kremer
ISBN: 978-3-640-77602-3

Bachelorarbeit, 2010

74 Seiten, Note: 1,3

Marc Kremer (Autor:in)

Leseprobe

Inhaltsverzeichnis

Abkürzungsverzeichnis

Abbildungsverzeichnis

1 Data Mining als Instrument der Entscheidungsunterstützung im Kontext wachsender Datenmengen

2 Theoretische Grundlagen des Data Mining
2.1 Begriffe und Entwicklung des Data Mining
2.2 Der KDD-Prozess in Abgrenzung zum Data Mining
2.3 Einordnung des Data Mining in die analytischen Informationssysteme
2.4 Aktivitäten und Problemstellungen des Data Mining

3 Systematischer Überblick und Beurteilung der verschiedenen Data-Mining-Methoden
3.1 Fallbasiertes Schließen
3.2 Neuronale Netze
3.3 Entscheidungsbäume
3.4 Genetische Algorithmen
3.5 Visualisierung

4 Bisheriger Einsatz von Data-Mining-Methoden im Performance Management verschiedener Branchen
4.1 Banken
4.1.1 Betrugserkennung
4.1.2 Financial Management
4.2 Handel
4.2.1 Warenkorbanalyse und Cross Selling
4.2.2 Direct- und Database-Marketing
4.3 Industrie
4.3.1 Ursachenanalyse von Fehlern in Produktionsprozessen
4.3.2 Vorhersage von Komponentenausfällen in der Flugzeugwartung
4.4 Branchenübergreifender Einsatz von Data-Mining-Methoden
4.4.1 Kundenwert-Controlling
4.4.2 Customer Relationship Management

5 Identifikation von Anwendungsmöglichkeiten des Data Mining
5.1 Text-, Opinion- und Web-Mining
5.2 Churn Management
5.3 Neuere Ansätze zur Betrugserkennung

6 Konzeption eines Fragebogens zur Verbreitung, Zielsetzung, Entschei- dungsunterstützungspotenzialen und Nutzungs-/Anwendungsgebieten des Data Mining

7 Diskussion von Potenzialen und Herausforderungen des Data Mining im Performance Management
7.1 aCRM: Trends und Probleme
7.2 Nichtnumerische, nichtstationäre und multidimensionale Daten
7.3 Datenschutzrechtliche Aspekte des Data Mining

Anhang

Literaturverzeichnis

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

Abbildungsverzeichnis

Abbildung 1: Evolutionsstufen des Data Mining

Abbildung 2: DMKD-Publikationen seit 1994

Abbildung 3: Der KDD-Prozess

Abbildung 4: Zusammenhänge der analytischen Informationssysteme

Abbildung 5: Abfrage im OLAP-Datenwürfel

Abbildung 6: Datenanalysezyklus nach Knobloch

Abbildung 7: Die Problemtypen des Data Mining

Abbildung 8: Modelltypen zur Lösung unternehmerischer Probleme

Abbildung 9: Der CBR-Zyklus

Abbildung 10: Neuron eines Neuronalen Netzes

Abbildung 11: Entscheidungsbaum

Abbildung 12: Algorithmen von Entscheidungsbäumen

Abbildung 13: Optimierung mit Genetischen Algorithmen

Abbildung 14: 3D-Stadtmodell der LandXplorer-Software

Abbildung 15: Auswahl von Anwendungsgebieten des Data Mining

Abbildung 16: Mögliche Ertragsfaktoren beim Einsatz von Data-Mining-Systemen

Abbildung 17: Ordnungsrahmen des Text Mining

Abbildung 18: Potenzial verschiedener Verfahren zur Betrugserkennung

1 Data Mining als Instrument der Entscheidungsunterstützung im Kontext wachsender Datenmengen

„I never waste memory or time for things that can be stored or retrieved from elsewhere.”

ALBERT EINSTEIN, 1879-1955

In einer Welt, die immer mehr von Unsicherheit geprägt ist, sind insbesondere jene Unternehmen erfolgreich, die konstant neues Wissen produzieren und dieses in kon- tinuierliche Innovation umsetzen.¹ Häufig ist dieses Wissen im „Rohzustand“ bereits in Form von „Geschäftserfahrungen“ im Unternehmen vorhanden.² Zudem sind diese

Erfahrungen durch die Entwicklungen in der Informationstechnologie meist als elekt- ronisch gespeicherte Daten verfügbar. Durch fortschrittlichere Speichermethoden und die zunehmende elektronische Dokumentation von Geschäftsvorfällen steigt al- lerdings auch das damit verbundene Datenvolumen. So verzeichnete die US- Suchmaschine Yahoo! 2007 im Monat durchschnittlich 425 Millionen Besucher, wel- che pro Tag 10 Terabyte Daten produzierten.³ Auch der US-Einzelhandelskonzern Wal-Mart sieht sich seit Einführung der elektronischen Scannerkassen mit umfang- reichen Datenmengen konfrontiert, welche potenzielles Wissen über das Kaufverhal- ten der Kunden enthalten.⁴ FAYYAD ET AL. stellen fest, dass sich Datenbanken sowohl durch die wachsende Anzahl an Objekten als auch durch die Zunahme der zugehöri- gen Objektattribute stark vergrößern.⁵

Es stellt sich nun die Frage, wie dieses verborgene Wissen freigelegt und zur Unter- stützung von Managemententscheidungen genutzt werden kann. Eine manuelle Ex- traktion durch den Menschen scheint schwierig bis unmöglich, da die Komplexität massiver Datenbestände die menschliche Fähigkeit zur Analyse übersteigt.⁶ Eine Unterstützung durch computergestützte Methoden ist daher notwendig, wodurch die Motivation zur Entwicklung und Anwendung von Data-Mining-Methoden begründet ist. Auch EINSTEIN hat im oben genannten Zitat erkannt, dass Wissensspeicherung und -extraktion Hand in Hand gehen müssen.

Da es sich bei Data Mining um ein relativ junges Forschungsgebiet handelt, fehlt es an einheitlichen Beschreibungen und konkreten Definitionen. Zu diesem Schluss kommen auch PENG ET AL., weshalb sie durch Anwendung von Grounded Theory und Dokumenten-Clustering einen beschreibenden Ordnungsrahmen des aktuellen Stan- des von Data Mining und Wissensentdeckung (DMKD) veröffentlicht haben.⁷ Da es sich hierbei um die Querschnittsbetrachtung eines relativ breiten Feldes handelt, soll diese Arbeit den Fokus auf einen speziellen Aspekt der Studie legen: die aktuelle und potenzielle Anwendung von Data Mining in der Praxis. Konkret möchte ich des- sen Nutzung als Instrument des Performance Managements zur Entscheidungsun- terstützung untersuchen, da hier von vielen Unternehmen ein großes Nutzenpotenzi- al gesehen wird.⁸ ⁹

Im Mittelpunkt des zweiten Kapitels steht die Suche nach einem Theoriegerüst für das Data Mining. Gegenstand von Kapitel 3 ist ein Überblick und die kritische Würdi- gung einer Auswahl populärer Data-Mining-Methoden. Im vierten Kapitel soll anhand diverser Branchenbeispiele der bisherige Einsatz von Data Mining im Performance Management betrachtet werden, während Kapitel 5 weitere Anwendungsmöglichkei- ten aufzeigen soll. Um eine empirische Auswertung der in Kapitel 4 und 5 gefunde- nen Ergebnisse in der Unternehmenspraxis zu ermöglichen, behandelt Kapitel 6 die Entwicklung eines Fragebogens für eine kommende Unternehmensbefragung. Den Abschluss bildet eine Diskussion über Potenziale und Herausforderungen des Data Mining.

2 Theoretische Grundlagen des Data Mining

2.1 Begriffe und Entwicklung des Data Mining

Der Begriff Data Mining ist eine Anlehnung an den Bergbau, im Speziellen die Gold- oder Kohleförderung. Die Aufgabe ist das automatische Auffinden und Extrahieren des „Rohstoffs“ Wissen aus den „Datenbergen“ eines Unternehmens, in denen es möglicherweise „vergraben“ liegt.¹⁰

Aufgrund der noch jungen Geschichte des Data Mining existieren viele Definitionen, deren Inhalt sich mitunter stark voneinander unterscheidet.

LACKES definiert Data Mining im Gabler Wirtschaftslexikon wie folgt:

„ Unter Data Mining versteht man die Anwendung von Methoden und Algo- rithmen zur möglichst automatischen Extraktion empirischer Zusammen- hänge zwischen Planungsobjekten, deren Daten in einer hierfür aufgebau- ten Datenbasis bereitgestellt werden.“¹¹

LACKES sieht Data Mining als singuläre Aufgabe, die allerdings eine vorbereitete Da- tengrundlage voraussetzt. Zusätzlich wird der automatisierte Ablauf des Data Mining hervorgehoben. Die genannten empirischen Zusammenhänge können gespeicherte Geschäftsprozesse in Unternehmen darstellen, beispielsweise Kundenhistorien über vergangene Einkäufe. Diese historischen Daten sollen für Planungsaufgaben genutzt werden, indem darin enthaltene Muster erkannt werden.

YOON betrachtet Data Mining folgendermaßen:

„Data Mining kombiniert Techniken des maschinellen Lernens, der Mus- tererkennung, der Statistik [sowie] aus Datenbanken und Visualisierung, um Konzepte, Konzeptbeziehungen und interessante Muster automatisch aus großen Unternehmensdatenbanken zu extrahieren.“¹²

Durch diese Definition wird deutlich, dass es sich bei Data Mining um ein fächerüber- greifendes Gebiet handelt, dessen Entwicklung durch viele Disziplinen geprägt wur- de.¹³ Diese sind u.a. Statistik, Mathematik, Informatik, Künstliche Intelligenz, Maschi- nelles Lernen, Ingenieurwissenschaften und auch Naturwissenschaften wie Biologie, Medizin sowie Psychologie.¹⁴

Bisher wurde Data Mining als einzelne Aufgabe gesehen. Es ist allerdings auch eine Betrachtung des gesamten Prozesses „Wissensentdeckung“ möglich. In diesem Fall ist vom „KDD-Prozess“ die Rede. KDD steht für „Knowledge Discovery in Databases“ und wurde von FAYYAD ET AL. folgendermaßen definiert:

„[KDD ist] Der nichttriviale Prozess zur Identifizierung gültiger, neuartiger, potenziell nützlicher, und letztendlich verständlicher Muster in Daten.“¹⁵

Den Autoren nach bedeutet „nichttrivial“, dass Wissensentdeckung über die klassi- schen Berechnungsaufgaben von Computern hinausgeht, da nun die Suche nach Mustern und Strukturen im Vordergrund steht. Die gefundenen Muster sollten gültig hinsichtlich deren Anwendung auf neue Daten sein und nicht bereits bekannte Er- kenntnisse liefern. Zudem wäre es wünschenswert, wenn sie einen Nutzenbeitrag für den KDD-Prozess aufweisen würden und der Nutzer die gefundenen Muster verste- hen könnte.

Der Konsens der meisten Definitionen des Data Mining liegt gemäß WIEDMANN im Auftreten des Phänomens „Lernen“, mit dem Unterschied, dass zunächst der Com- puter aus den Daten lernen muss und erst im Anschluss das Gelernte an den Nutzer weitergegeben wird. Weiterhin grenzt er die Anwendung von Data Mining in anderen Disziplinen aus und beschränkt dessen Nutzung auf den betriebswirtschaftlichen Kontext. Als weiterer wichtiger Aspekt wird die Hypothesenbildung angesprochen, welche im Data Mining automatisch geschieht. In der manuellen Datenanalyse muss der Mensch die Hypothesen selbst erzeugen, d.h. er muss wissen, wonach er sucht. Wiedmann definiert Data Mining daher wie folgt:

„Data Mining ist das computergestützte Lernen aus Daten bei einer be- triebswirtschaftlichen Fragestellung. Lernen ist das Aneignen von Hypo- thesen über Gesetzmäßigkeiten der Welt anhand von Erfahrungen.“¹⁶

Das Data Mining ist eine noch vergleichsweise junge Forschungsrichtung. Ende der 1980er Jahre zeichneten sich erste Ansätze einer möglichen Entwicklung ab, die im Laufe des kommenden Jahrzehnts immer konkreter wurden. Der erste Workshop zum Thema „Knowledge Discovery in Databases“ (KDD) fand im Jahre 1989 statt, woraus 1995 eine internationale Konferenz entstand.¹⁷ Eine zeitliche Entwicklung des Data Mining lässt sich bei RYGIELSKI ET AL. finden:

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Evolutionsstufen des Data Mining ¹⁸

Es lässt sich erkennen, dass der Fokus der ersten drei Evolutionsstufen auf retro- spektiver Datenlieferung liegt, während Data Mining sich auf die vorausschauende Informationsgewinnung aus Daten konzentriert. Auffallend ist auch der proaktive Charakter des Data Mining, sodass eine automatische Auswertung und Aufbereitung der in den Daten enthaltenen Informationen erfolgt. Die Autoren kennzeichnen die einzelnen Stufen folgendermaßen: Speicherten in den 1960ern häufig nur einzelne Stellen im Unternehmen Daten für eigene Zwecke, so wurden in den 80ern unter- nehmensweite, einheitliche Datenbanken etabliert, die Abfragen einzelner Ge- schäftseinheiten ermöglichten. Eine tiefergehende manuelle Analyse erlaubten dann Entwicklungen wie On-line analytic processing (OLAP) in den 90er Jahren. So konn- ten nun auch mehrere Dimensionen in Echtzeit abgefragt werden.

Die Gemeinsamkeit aller bisherigen Perioden ist, dass die Gewinnung von Informati- onen immer einen manuellen Prozess darstellte, der mit wachsendem Datenvolumen stets schwieriger wurde. Daher war die Unterstützung durch die automatisierten Me- thoden des Data Mining notwendig. Als „anwendungsgetriebenes Feld“ zeichnet es sich zudem dadurch aus, dass eine rege Nachfrage seitens der Unternehmen zur Erschließung neuer Anwendungsgebiete führte.¹⁹ Diese Aussage spiegelt sich auch in der wachsenden Anzahl an Publikationen seit Mitte der 1990er Jahre wider. PENG ET AL. haben dazu den Zeitraum ab 1994 untersucht:

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2: DMKD-Publikation seit 1994 ²⁰

Es ist ein starker Aufwärtstrend seit 1994 zu erkennen, der bis 2001 andauert. Ab diesem Zeitpunkt stagniert die Anzahl der Publikationen. Da die Untersuchung im Juli 2005 endete, sind zu diesem Zeitpunkt nur 69 Veröffentlichungen erfasst worden.

2.2 Der KDD-Prozess in Abgrenzung zum Data Mining

In der angloamerikanischen Literatur findet häufig eine starke Differenzierung der Begriffe Data Mining und KDD statt, während im deutschsprachigen Raum eine sy- nonyme Verwendung gebräuchlich ist. MULTHAUPT beispielsweise sieht in beiden Be- griffen eine inhaltliche Kongruenz.²¹ FAYYAD ET AL. hingegen betrachten Data Mining nur als einen Teilprozessschritt des „KDD-Prozesses“. ²² Dieser wird in folgender Grafik veranschaulicht:

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3: Der KDD-Prozess ²³

Die Autoren beschreiben den Prozess wie folgt: Zunächst müssen das Anwendungs- gebiet und das Ziel des KDD-Prozesses bestimmt, vorhandenes Wissen in die Pro- zessentwicklung mit einbezogen und geeignete Daten für die Analyse ausgewählt werden. Letztere werden zu Zieldaten und sollten im nächsten Schritt gereinigt und vorverarbeitet werden. Die Reinigung verringert das Rauschen in den Daten, gibt Strategien für die Behandlung fehlender Datenfelder und für das Auftreten von Aus- reißern vor und berücksichtigt bekannte zeitliche Veränderungen im Datenset. Die- ses muss nun so transformiert werden, dass es weiter reduziert wird, um die Anzahl der Variablen zu verringern. Ziel dabei ist, dass möglichst wenige Attribute die Daten hinreichend genau beschreiben. Die bisherigen Schritte fallen unter den Teilprozess des „Preprocessing“. Dieser hat die Aufgabe, die Effektivität der Mustererkennung zu erhöhen, da die Qualität der vorliegenden Daten verbessert wird.²⁴. Im darauffolgen- den Schritt kommt das Data Mining zum Einsatz. Dabei ist es wichtig, dass die aus- gewählte spezifische Data-Mining-Methode zum Erreichen des Prozessziels beiträgt. So kann ein Nutzer beispielsweise ein verständliches Modell gegenüber einem Mo- dell mit hoher Prognosefähigkeit präferieren. Erst im Anschluss wird Data Mining i.e.S. angewendet, d.h. die Suche nach Mustern in den vorher angepassten Daten. Der letzte Prozessschritt im KDD behandelt die Interpretation der gefundenen Muster und die Nutzung des gefundenen Wissens.

Es muss darauf hingewiesen werden, dass der KDD-Prozess interaktiv und iterativ ist.²⁵ Dies bedeutet, dass der Anwender jederzeit den Prozess steuern muss und eventuell in einem späteren Prozessschritt gewonnene Erkenntnisse eine Anpassung früherer Schritte notwendig machen. Dieser Umstand wird in der Grafik durch Feed- backschleifen verdeutlicht. Ein anschauliches Beispiel dafür ist, dass im KDD- Prozess gefundenes Wissen Ausgangsbasis für einen weiteren Prozessdurchlauf sein kann, wie es im ersten Schritt bereits empfohlen wurde. Damit soll sichergestellt werden, dass der gewonnene Wissensstand durch wiederholte Überprüfung weiter- hin seine Gültigkeit behält.

Die Antwort auf die Frage, ob es nun sinnvoll ist, die Begriffe Data Mining und KDD synonym zu gebrauchen, muss ich verneinen. Die vorbereitenden Schritte vor der eigentlichen Durchführung des Data Mining sind essentiell für dessen Erfolg und er- höhen die Wahrscheinlichkeit, brauchbare Erkenntnisse aus den Daten zu generie- ren. Zu diesem Schluss kommen auch diverse Autoren: MARTIN beschreibt die Not- wendigkeit einer soliden Datengrundlage treffend mit dem Prinzip „garbage in – garbage out.“²⁶ CABENA ET AL. stellen fest, dass nur ca. 10% des Zeitaufwandes des KDD-Prozesses auf die Selektion und Anwendung des Data Mining entfallen. Dem gegenüber stehen allerdings ca. 60% für Datenauswahl und -aufbereitung.²⁷

Eine Synthese von KDD-Prozess und Data Mining wird in der Literatur oft dadurch erreicht, dass alternativ vom „Data-Mining-Prozess“ die Rede ist. Vorangetrieben wird dieser Trend auch durch die Entwicklung des „Cross-Industry Standard Process for Data-Mining“ (CRISP-DM), welches aus einer Initiative diverser Unternehmen entstand. ²⁸ Damit sollen die bis dato oft existierenden Insellösungen des Data Mi- ning eine stärkere Integration erfahren, um eine unternehmensübergreifende Nut- zung zu ermöglichen.

2.3 Einordnung des Data Mining in die analytischen Informationssysteme

Analytische Informationssysteme werden häufig auch als „Business Intelligence“ Systeme (BI) bezeichnet und dienen der „Informationsversorgung und funktionale[n] Unterstützung betrieblicher Fach- und Führungskräfte zu Analysezwecken.“²⁹

Folgende drei Elemente der BI werden nun genauer betrachtet, da sie häufig zu- sammen in der Literatur genannt werden³⁰ ³¹: Data Warehouse, On-line analytic pro- cessing und Data Mining.

Die Aufgabe eines Data Warehouse (DW) ist, „inhaltsorientiert, integriert und dauer- haft Informationen zur Unterstützung von Entscheidern zu sammeln, zu transformie- ren und zu verteilen.“³² Damit fungiert es als zentrale, unternehmensweite Datenba- sis zur Informationsspeicherung und -recherche. Zusätzlich können auch externe Information, wie beispielsweise volkswirtschaftliche Kennzahlen, mit integriert wer- den. Ein DW unterstützt das Data Mining durch die Bereitstellung und Aufbereitung eben dieser Datenbasis, die die Grundlage für die effektive Durchführung des Data- Mining-Prozesses ist. INMON spricht gar von einer „symbiotischen Beziehung.“ Die integralen Bestandteile eines DW sieht er wie folgt: ³³

- Integrierte Daten
- Detaillierte und summierte Daten
- Historische Daten
- Metadaten

Integrierte Daten beschleunigen den Data-Mining-Prozess, da die Preprocessing- Phase verkürzt werden kann. Detaillierte Daten sind hilfreich, falls eine sehr tiefge- hende Analyse gewünscht ist, summierte Daten hingegen machen eine Aggregation durch den Miner (= das Data-Mining-Programm) überflüssig und stellen somit einen Aufsatzpunkt für die Analyse dar. Durch das Vorliegen von historischen Daten kann das Data-Mining zeitliche Muster, wie Trends entdecken, sodass auch längerfristige Analysen möglich sind. Die letzte genannte Datenart sind die Metadaten. Diese ent- halten kontextbezogene Informationen über die vorliegenden Daten, sodass der Mi- ner diese als „Straßenkarte“ nutzen kann, um sich selbst innerhalb der Daten zu ori- entieren.

Wie dargestellt wurde, stellt das DW einen kritischen Erfolgsfaktor für die Implemen- tierung eines Data-Mining-Systems im Unternehmen dar. Grundsätzlich ist Data Mi- ning zwar ohne ein DW möglich, allerdings kann die Konsequenz eine mindere Qua- lität der gewonnenen Ergebnisse sein.³⁴

Der Ursprung des On-line analytic processing (OLAP) geht auf CODD zurück, der 1993 dessen zwölf grundlegende Prinzipien definiert hat.³⁵ Gegenüber einer „klassi- schen“ Datenbankabfrage, beispielsweise per SQL, bietet OLAP den Vorteil, mehr- dimensionale Auswertungen der Daten durchführen zu können, ohne schwierige Ab- fragesprachen beherrschen zu müssen. Diese Möglichkeit „schneller, konsistenter und interaktiver Zugriffe“ hat sich in der Praxis etabliert, da Führungskräfte nun we- sentliche Informationen relativ einfach erhalten können.³⁶ OLAP-Systeme greifen für ihre Abfragen auf sog. „Data Marts“ zu. Diese sind oft Untereinheiten eines DW und unterscheiden sich von diesem folgendermaßen:³⁷

Das DW enthält unternehmensweite Daten, während sich Data Marts auf einzelne Bereiche, wie beispielsweise den Vertrieb oder das Rechnungswesen, beschränken. Sie stellen ihre Informationen damit nur ausgewählten Benutzergruppen zur Verfü- gung. Als weiteres differenzierendes Merkmal kann festgehalten werden, dass beim OLAP die Datenanalyse häufig auf dem hohen Aggregationslevel von Data Marts stattfindet, während das Data Mining für gewöhnlich in den sehr detailreichen Daten des DW nach Mustern sucht. In dieser Grafik sind überblicksartig die Zusammen- hänge der analytischen Informationssysteme dargestellt:

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 4: Zusammenhänge der analytischen Informationssysteme ³⁸

Die operativen Vorsysteme erfassen informationstechnisch alle Vorgänge in einem Unternehmen. Da diese Daten meist aus mehreren Quellen stammen und unstruktu- riert sind, werden sie im DW gesammelt, aufbereitet und stehen für die Analyse durch OLAP und Data Mining sowie zur Generierung von Berichten zur Verfügung. Gleichzeitig hat das DW eine externe Schnittstelle, um auch Informationen des Un- ternehmensumfelds mit in spätere Auswertungen einbeziehen zu können. Wie man sieht, ist der Data Mart eine Unterart des DW, sodass dort selektive Informationen vorgehalten werden. Diese werden bei einer Abfrage häufig in Form eines sog.

„OLAP-Würfels“ dargestellt.³⁹ An folgendem Beispiel sollen das Merkmal der Mehr- dimensionalität und die Funktionen dieses OLAP-Würfels erläutert werden: Nehmen wir an, die gesamten jährlichen Absatzzahlen eines Unternehmens hängen von drei Dimensionen ab: der Produktart, dem Monat und dem Gebiet. Daher kann es für eine Führungskraft interessant sein, eine detailliertere Analyse durchzuführen und zu erkunden, welches Produkt in welchem Zeitraum in welcher Region abgesetzt wurde:

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 5: Abfrage im OLAP-Datenwürfel ⁴⁰

Die Navigation im OLAP-Würfel erfolgt auf zwei Arten:⁴¹

- Roll-up: Falls die Daten hierarchisch vorliegen, kann innerhalb dieser Hierar- chie auf den verschiedenen Abstraktionsgraden navigiert werden. So könnte die Dimension „Gebiet“ beispielsweise in Länder, Regionen und Städte unter- teilt werden. Die Verdichtung der Absatzzahlen erfolgt mittels Summation. Roll-up bezeichnet nun die Aufwärtsbewegung innerhalb der Hierarchie, so- dass beispielsweise die Städte New York City, Boston und Washington D.C. zur Region „US-Ostküste“ zusammengefasst würden.
- Drill-down: Diese Funktion stellt genau die entgegensetzte Bewegung des Roll-Up dar, sodass die Informationen auf einem höheren Detailgrad darge- stellt werden, beispielsweise von Regional- auf Städtebene.

Die folgenden drei Operationen dienen der Analyse der Daten:

- Slice: Bei dieser Funktion wird eine „Scheibe“ aus dem Datenwürfel geschnit- ten und näher untersucht. Informationstechnisch wird dabei der Wertebereich einer Dimension eingeschränkt, beispielsweise auf einen Monat.

[...]

¹ Vgl. Nonaka (1991), S. 96

² Berry, Linoff (1997), S. 2ff.

³ Vgl. Wolfgang Martin Team (2010), S. 51

⁴ Vgl. Berry et al. (1994), URL: siehe Literaturverzeichnis

⁵ Vgl. Fayyad, Piatetsky-Shapiro, Smyth (1996c), S. 28

⁶ Vgl. Fayyad, Piatetsky-Shapiro, Smyth (1996c), S. 29

⁷ Peng et al. (2008), S. 640

⁸ Vgl. Bange, Marr, Bange (2009), S. 19

⁹ Vgl. Frisch (2009), S. 21

¹⁰ Vgl. Rygielski, Wang, Yen (2002), S. 485

¹¹ Lackes, (2010), URL siehe Literaturverzeichnis

¹² Yoon (1999), URL: siehe Literaturverzeichnis: „DM combines techniques from machine learning, pattern recognition, statistics, databases, and visualization to extract concepts, concept interrelations, and interesting patterns automatically form large corporate databases.”

¹³ Vgl. Multhaupt (1999), S.8

¹⁴ Wiedmann (2001), S. 21

¹⁵ Fayyad, Piatetsky-Shapiro, Smyth (1996c), S. 30: “The nontrivial process of identifying valid, novel, potentially useful, and ultimately understandable patterns in data.”

¹⁶ Wiedmann (2001), S. 21

¹⁷ Vgl. Fayyad, Uthurusamy (1996), S. 26

¹⁸ Eigene Darstellung in Anlehnung an Rygielski, Wang, Yen (2002), S. 486

¹⁹ Peng et al. (2008), S. 658

²⁰ Peng et al. (2008), S. 656

²¹ Vgl. Multhaupt (1999), S. 8

²² Vgl. Fayyad, Piatetsky-Shapiro, Smyth (1996b), S.41f.

²³ Eigene Darstellung in Anlehnung an Fayyad, Piatetsky-Shapiro, Smyth (1996b), S. 41

²⁴ Vgl. Yoon, (1999), URL: siehe Literaturverzeichnis

²⁵ Vgl. Wilde (2000), S. 13f.

²⁶ Wolfgang Martin Team (2010), S. 71

²⁷ Vgl. Cabena et al. (1998), S. 43

²⁸ Vgl. Chapman et al. (1999), S. 9ff.

²⁹ Chamoni, Gluchowski (2006), S.11

³⁰ Vgl. Mertens et al. (2005), S. 71ff

³¹ Vgl. Wilde (2000), S. 6ff.

³² Gluchowski, Gabriel, Chamoni (1997), S. 267

³³ Inmon (1996), S. 49f.

³⁴ Vgl. Berson, Smith, Thearling (1999), S. 92

³⁵ Vgl. Codd, Codd, Sally (1993), S. 12

³⁶ Gluchowski, Gabriel, Chamoni (1997), S. 282

³⁷ Vgl. Inmon (1996), S. 50

³⁸ Eigene Darstellung in Anlehnung an Gluchowski, Gabriel, Chamoni (1997), S. 275

³⁹ Mertens et al. (2005), S. 73

⁴⁰ Eigene Darstellung in Anlehnung an Wilde (2000), S. 11

⁴¹ Purgold-Software (2003), URL siehe Literaturverzeichnis

Ende der Leseprobe aus 74 Seiten

Details

Titel: State-of-the-Art der Nutzung von Data-Mining-Methoden im Performance Management
Hochschule: Georg-August-Universität Göttingen (Professur für Unternehmensrechnung und Controlling)
Note: 1,3
Autor: Marc Kremer (Autor:in)
Jahr: 2010
Seiten: 74
Katalognummer: V162691
ISBN (eBook): 9783640775897
ISBN (Buch): 9783640776023
Dateigröße: 1998 KB
Sprache: Deutsch
Schlagworte: State-of-the-Art, Data-Mining-Methoden, Management, Data Mining, Data Warehouse, OLAP, KDD, Knowledge Discovery, Controlling, Business Intelligence, Wissensmanagement, Performance Management, Customer Relationship Management, Risikomanagement

Arbeit zitieren: Marc Kremer (Autor:in), 2010, State-of-the-Art der Nutzung von Data-Mining-Methoden im Performance Management, München, GRIN Verlag, https://www.grin.com/document/162691

Kommentare