Lade Inhalt...

Aufbau und Inhalt eines Datawarehouse

Hausarbeit (Hauptseminar) 2010 17 Seiten

Ingenieurwissenschaften - Wirtschaftsingenieurwesen

Leseprobe

Inhaltsverzeichnis

Darstellungsverzeichnis

Abbildungsverzeichnis

1. Einleitung
1.1. Aufgabenstellung
1.2. Ziele dieser Arbeit
1.3. Zielgruppe
1.4. Nutzen für die Zielgruppe
1.5. Aufbau der Arbeit

2. DATA Warehouse (DW)

3. Business Intelligence (BI)

4. Corporate Performance Management (CPM)

5. Architektur eines DATA Warehouses (DW)
5.1. Metadaten
5.2. Datenquellen (Quellsysteme)
5.2.1. Qualität der Daten aus Quellsystemen
5.2.2. Einteilung der Quelldaten in Klassen
5.3. Integration layer
5.3.1. Staging Area
5.3.2. ETL Prozess
5.4. Data Storage Layer
5.4.1. Core Data Warehouse
5.4.2. Operational Data Store (ODS)
5.5. Output Layer (Datenbereitstellung )
5.5.1. Auswertungsdatenbank
5.5.2. Bereichsdaten (Data Marts)
5.5.3. Planung Hochrechnung
5.5.4. Aggregationen (Materialized View)
5.5.5. OLAP Würfel
5.6. Frontend Layer (Reporting)

6. Schlussbetrachtung

7. Literaturnachweis

Darstellungsverzeichnis

Abbildung 1: Referenzarchitektur eines Data Warehouse

Abbildung 2: Dimensionswürfel (Data Cube)

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

1. Einleitung

1.1. Aufgabenstellung

Für den Leistungsnachweis in der Lehrveranstaltung „IT Infrastruktur 2“ wurde eine Seminararbeit zu einem entsprechenden Fachthema gefordert. Dieses Thema sollte einen Bezug zum Arbeitsumfeld des Autors haben.

1.2. Ziele dieser Arbeit

Den Studierenden soll mit dieser Aufgabenstellung das Aufarbeiten komplexer Sachverhalte unter Berücksichtigung der Aspekte des wissenschaftlichen Arbeitens näher gebracht werden. Ziel dieser Arbeit ist die Erläuterung der Architektur eines Datawarehouses und die Möglichkeiten die daraus für den Anwender resultieren.

1.3. Zielgruppe

Unter die Zielgruppe fallen Personen mit Interesse an der Informationsgewinnung und Informationsaufbereitung im Unternehmen.

1.4. Nutzen für die Zielgruppe

Der Zielgruppe soll ein kurzer Überblick über die Architektur eines Datawarehouse

vermittel werden. Des Weiteren wird darauf eingegangen wie DATEN gesammelt, aufbereitet und ausgewertet werden könnten.

1.5. Aufbau der Arbeit

Die Arbeit richtet sich nach bekannten Modellen aus einschlägiger Fachliteratur sowie

praktischen Erfahrungen aus dem betrieblichen Umfeld des Autors. Durch Interviews mit

Fachspezialisten aus den verschiedenen Fachbereichen der IT wurde versucht, praktische

Erfahrung in diese Arbeit mit einfließen zu lassen.

2. DATA Warehouse (DW)

Konventionell werden drei Produktionsfaktoren Boden, Arbeit und Kapital genannt, diese werden immer häufiger um die vierte Sichtweise, die der Information, erweitert. Information basiert auf Daten, diese fallen entweder im eigenen Unternehmen an oder werden zugekauft. Das Sammeln dieser Daten geschieht mittels einer Vielzahl von unterschiedlichen Informationssystemen, welche die gewonnen Informationen meist autonom verarbeiten und verwalten.

Die Aufgabe eines DATA Warehouse besteht in der Integration dieser Daten in einen gemeinsamen Datenpool. Im Vordergrund eines Data Warehouse sollte aber nicht nur der integrative Aspekt (das Sammeln und Zusammenführen), sondern auch der analytische Aspekt (die Auswertung) stehen. Somit ist nicht nur auf eine möglichst effiziente Art der Integration der gewonnen Daten Wert zu legen, sondern bereits bei der Integration auf analytische Aspekte zu achten. Aus unterschiedlichen Quellsystemen werden Daten extrahiert, durch Transformation bereinigt und vereinheitlicht, um danach in das Data Warehouse geladen zu werden. (Bauer 2009, S5-17)

“A data warehouse is a subject oriented, integrated, non-volatile, and time variant collection of data in support of management’s decisions.” (Inmon 1993, S33)

Somit hat ein Datawarehouse laut der Definition von Inmon vier Eigenschaften. Die erste Eigenschaften, jene der Fachorientierung (subject orientation) liegt auf der Modellierung spezifischer Anwendungsziele. Eine weitere Eigenschaft, die Integrierte Datenbasis (integration), setzt ihren Schwerpunkt in der Datenverarbeitung, also in der Integration mehrerer Datenbanken. Auch die nicht flüchtige Datenbasis (non-volatile) wird von Inmon als Charakteristika eines Data Warehouses beschrieben. Einmal geladen, werden Daten weder entfernt, noch geändert. Lediglich das Ergänzen des DW um zusätzliche Datensätze, welche die vorherigen auflösen, ist erlaubt. Das vierte und somit letzte beschriebene Attribut ist das der Historie von Daten (time variant). Darunter ist das Halten von Daten über längere Zeiträume zu verstehen, damit Vergleiche angestellt werden können. (Baur 2009, S5-25)

Darauf aufbauend beschreibt Baur ein Data Warehouse wie folgt:

„Ein Data Warehouse ist eine physische Datenbank, die eine integrierte Sicht auf beliebige Daten zu Analysezwecken ermöglicht“ (Baur 2009, S7)

Eine weitere, sehr aktuelle Beschreibung, deren Fokus nicht allein auf der technischen Seite liegt, liefert Gansor:

„Ein Data Warehouse ist ein unternehmensweites System zur Integration entscheidungsrelevanter Daten für die Steuerung des Unternehmens und dient als „einzige Quelle der Wahrheit“ (Single Point of Truth).“ (Gansor 2010, S28)

3. Business Intelligence (BI)

Durch die ständig wachsende IT-Durchdringung der Unternehmen und der damit verbunden Flut an Daten, wird es immer wichtiger den anfallenden Datenstrom in verwertbare Information und entscheidungsrelevantes Wissen zu transformieren. Business Intelligence (BI) ist keine Software die selbständig Probleme löst. IT-Systeme sind uns Menschen maximal in der Berechnung und Speicherung von Information überlegen, jedoch sicherlich nicht in der inhaltlichen Bewertung der gewonnen Information. Vielmehr sind IT-Systeme Handwerkszeuge, die Menschen bei ihrer Arbeit unterstützen.

Der Begriff Business Intelligence beschreibt daher ein Verfahren bzw. einen Prozess, der Menschen beim Sammeln, Aufbereiten und Interpretieren von elektronischen Daten unterstützt. Die gewonnenen Erkenntnisse fließen in die operative und strategische Entscheidungsfindung im Unternehmen ein. BI ist keine reine Erfindung der IT, da deren rein technische Sichtweise zwar systemseitig optimale Prozesse hervor bringt, aber ohne die korrekte Eingabe der Daten in das System keinerlei relevanten Informationen liefert. (Garbage in – Garbage out).

Aus diesem Grund betrachten wir beim Thema Business Intelligence, Menschen in Prozessen, die bei ihrer Entscheidungenfindung durch optimierte IT-Systeme unterstützt werden.

[...]

Details

Seiten
17
Jahr
2010
ISBN (eBook)
9783640740819
ISBN (Buch)
9783640740864
Dateigröße
445 KB
Sprache
Deutsch
Katalognummer
v160922
Institution / Hochschule
Fachhochschule Vorarlberg GmbH
Note
2
Schlagworte
Aufbau Inhalt Datawarehouse

Autor

Teilen

Zurück

Titel: Aufbau und Inhalt eines Datawarehouse