Lade Inhalt...

Evaluierung der SAP HANA Technologie

ERP und Business Intelligence

Fachbuch 2014 27 Seiten

Informatik - Internet, neue Technologien

Leseprobe

Inhaltsverzeichnis

1. Einleitung

2. Was ist SAP HANA?
2.1 SAP HANA Architektur
2.1.1 Hardware
2.1.2 Software
2.2 In-Memory-Technologie

3. SAP HANA Studio
3.1 Voraussetzungen
3.2 Installation
3.3 Eclipse-Konfiguration
3.4 Amazon Cloud Konfiguration
3.5 Arbeiten mit SAP HANA Studio

4. Entwicklung einer ersten Applikation
4.1 Verbinden mit SAP HANA
4.2 Tabellen und Testdaten
4.3 Package
4.4 Attribute View
4.5 Auswertungen – Data Preview

5. Zusammenfassung

Literaturverzeichnis

Glossar

A Anhang
a. SQL Scripts

I. Abbildungsverzeichnis

Abbildung 1: SAP HANA Architektur [SAP13]

Abbildung 2: Zeilenorientierte Speicherung (row-based)

Abbildung 3: Spaltenorientierte Speicherung (column-based)

Abbildung 4: Komprimierung von Daten

Abbildung 5: SAP HANA Datenbank, Client und Studio

Abbildung 6: Download von SAP HANA Client und Studio

Abbildung 7: Installation des SAP HANA Clients

Abbildung 8: Installation SAP HANA Cloud Tools

Abbildung 9: Konfiguration des SAP HANA Cloud Trial Accounts

Abbildung 10: Informationen zur SAP HANA Instanz in der Amazon Cloud

Abbildung 11: Konfigurieren der SAP HANA Instanz im HANA Studio

Abbildung 12: Schema "shop" erstellen

Abbildung 13: Startseite der Modeler Perspektive

Abbildung 14: Neues Package erstellen

Abbildung 15: Erstellen eines Attribute Views

Abbildung 16: Verknüpfung von "users"- und "invoices"-Tabelle

Abbildung 17: Attribute View AV01

Abbildung 18: Auswertung der Umsätze, gruppiert nach Kunde

Abbildung 19: Umsatzentwicklung über alle Rechnungen

II. Tabellenverzeichnis

Tabelle 1: Vergleich SAP ERP und SAP BW

Tabelle 2: Amazon Cloud-System m2.xlarge [AMA13]

Tabelle 3: Erstellen der "users"- und „invoices“-Tabellen

Tabelle 4: Einfügen von Testdaten

Tabelle 5: SQL-Script zum Anlegen und Befüllen der Tabellen

1 Einleitung

In der heutigen Zeit ist das größte und wichtigste Kapital eines Unternehmens sein Wissen, auf dessen Grundlage oft wichtige Entscheidungen der Unternehmensspitze getroffen werden. Dieses Wissen ist in Form von Daten in meist unzähligen Datenbanken abgelegt. Gerade bei großen Konzernen häuft sich über die Jahre eine sehr große Datenmenge an, wodurch es immer schwieriger und kostenintensiver wird, auf diese Daten gezielt zuzugreifen. Bei noch mehr Daten, die für die nahe Zukunft erwartet werden, wird dieses Problem noch gravierender und somit eine immer größere Herausforderung für die Unternehmen.

Die bisherigen Verfahren um diese Datenmengen sinnvoll und zielgerichtet aufzuarbeiten, basieren meist auf unterschiedlichen Systemen. So werden operative und analytische Daten in unterschiedlichen Datenbanken gespeichert. Sollen diese Daten nun ausgewertet werden, um z.B. zukünftige Unternehmensstrategien festzulegen, werden die Daten in einem aufwendigen Verfahren in ein Data-Warehouse (DWH) importiert. Dieser Prozess kann je nach Datenmenge mehrere Tage in Anspruch nehmen, wodurch die Daten schon wieder „veraltet“ sein könnten und somit für den Entscheidungsträger nur noch bedingt von Nutzen sind.

Dieses Problem wurde von IT-Unternehmen erkannt und so wurden verschiedene Systeme entwickelt, um derartige Analysen sehr viel schneller bzw. im Idealfall in sogar Echtzeit durchzuführen. Eines dieser Systeme ist das von der SAP AG[1] entwickelte HANA[2] System, welches auf einer In-Memory-Technologie basiert, um komplexe Analysen von großen Datenmengen zu beschleunigen.

In dieser Arbeit soll die HANA Technologie evaluiert werden. Dabei werden die Konzepte, die zur Beschleunigung von daten- und rechenintensiven Analysen notwendig sind beschrieben und mögliche Einsatzgebiete erörtert. Des Weiteren soll eine Applikation mit der HANA Technologie in der Amazon Cloud entwickelt werden, um somit die Einsatzmöglichkeiten besser definieren zu können.

2 Was ist SAP HANA?

Die Hauptprodukte der SAP AG ist SAP ERP (Enterprise Resource Planning) und SAP BW (Business Warehouse). Beide sind sehr stark miteinander verbunden, nutzen jedoch im Backend nicht die gleichen Datenbanken. Das ERP System wird benutzt, um Kundendaten zu speichern, Bestellungen zu verwalten, Lieferungen zu verfolgen und Rechnungen zu überprüfen. Es werden damit also „Live-Daten“ verwaltet.

Ganz anders beim BW System. Dieses System wird für Reports und Analysen benutzt. Hierzu werden Daten aus dem ERP System geladen und aufwendig aufbereitet, um sie dann auswerten zu können. Diese Trennung der Daten wird deshalb vorgenommen, um das Live-System nicht mit aufwendigen Auswertungen zu belasten, was jedoch zu langsamen oder verspäteten Reports führen kann. Diese Probleme sollen mit SAP HANA beseitigt werden.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 1 : Vergleich SAP ERP und SAP BW

SAP HANA wird als Appliance vermarktet, d.h. das Produkt wird als kombiniertes System aus Soft- und Hardware geliefert. Dadurch soll sichergestellt werden, dass nur von der SAP AG geprüfte Systemteile benutzt werden und somit das bestmögliche Ergebnis erzielt werden kann.

HANA arbeitet mit einer speziellen In-Memory-Technologie, wodurch die gesamte Datenbank im Arbeitsspeicher gehalten wird. Dies ist gegenüber normalen Festplatten deutlich schneller.

2.1  SAP HANA Architektur

Wie bereits erwähnt, wird SAP HANA als Appliance vermarktet. Die Hauptbestandteile des HANA Server-System besteht also zum einen Teil aus der Hardware und zum anderen aus der Software, welche im Folgenden näher beschrieben werden.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1 : SAP HANA Architektur [SAP13]

Eine komplette Übersicht über die die HANA Architektur und die zur Verfügung gestellten Schnittstellen ist in Abbildung 1 zu sehen.

2.1.1  Hardware

Da HANA sehr auf parallele Verarbeitung setzt, gibt SAP vor, dass Server eingesetzt werden, die möglichst viele CPU´s haben, die jeweils mehrere Kerne besitzen.

Die meisten Datenbanken (wie z.B. Oracle Database) legen möglichst viele Daten im Hauptspeicher ab, um schnell darauf zugreifen zu können. Dies sind vor allem Tabellen, auf die häufig zugegriffen wird. SAP HANA geht hier einen Schritt weiter und legt die komplette Datenbank in den Hauptspeicher. Aus diesem Grund muss der Hauptspeicher möglichst groß dimensioniert sein. So hat z.B. IBM – einer der Partner im SAP HANA Bereich – 2012 einen Server entwickelt, der insgesamt 100TB Hauptspeicher zur Verfügung hat. Diese Kapazitäten würden ausreichen, um die Daten der weltweit acht größten SAP Kunden zu verarbeiten [IBM12].

2.1.2  Software

Die SAP HANA Datenbank Software, die auf einem Server installiert wird, vereint mehrere Technologien, die SAP bereits seit längerem im Einsatz hat und die sich im Einsatz bewährt haben:

- MaxDB

MaxDB ist ein Relationales Datenbankmanagementsystem (RDBMS), welche bis 2004 unter der Bezeichnung SAP DB bekannt war. MaxDB ist im Vergleich zu anderen großen RDBMS, wie z.B. von Oracle, relativ simpel aufgebaut und hat geringe Systemvoraussetzungen. Die Das Datenbanksystem kann zum Betrieb für SAP ERP, aber auch SAP BW eingesetzt werden. Es hat eine „hohe Zuverlässigkeit und Verfügbarkeit sowie Skalierbarkeit und ein sehr umfangreiches Set von Features“ [MA09, 29].

- TREX

TREX ist eine von SAP entwickelte Search-Engine, die seit 2000 eine Komponente der NetWeaver Plattform ist. TREX arbeitet bereits mit der In-Memory-Technologie und benutzt optimierte Datenstrukturen, wie die spaltenorientierte Speicherung von Datenbankinformationen, wodurch auch der Speicherplatz reduziert werden kann.

- P*Time

P*Time ist eine Technologie der Firma Transact in Memory und wurde im Jahr 2005 von SAP akquiriert. P*Time ist ein leichtgewichtiges Relationales Datenbankmanagementsystem, welches als OLTP System eingesetzt werden kann. Das System arbeitet dabei mit einer In-Memory-Technologie mit einer zeilenorientierten Speicherung von Datenbankinformationen.

Diese drei Technologien sind die Hauptbestandteile von SAP HANA und bilden das Rückgrat der In-Memory-Technologie, die von SAP NewDB genannt wird.

Ein weiterer wichtiger Bestandteil von SAP HANA ist die spaltenorientierte Speicherung der Daten (column-based). Üblicherweise speichert ein RDBMS die Daten zeilenweise (row-based) in einer Tabelle ab, ähnlich wie in einem Microsoft Excel-Sheet, was jedoch gerade bei großen Datenbanken ein Nachteil der der Geschwindigkeit sein kann. Um dies zu verdeutlichen, wird im folgendem der Aufbau einer zeilenorientierten und einer spaltenorientierten Speicherung verglichen.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2 : Zeilenorientierte Speicherung (row-based)

Im Gegensatz zur zeilenorientierten Speicherung, speichert eine spaltenorientierte Datenbank die Daten genau umgekehrt, wie in Abbildung 3 zu sehen ist.

[...]


[1] http://www.sap.com

[2] http://www.saphana.com

Details

Seiten
27
Jahr
2014
ISBN (eBook)
9783656630265
ISBN (Buch)
9783656630258
Dateigröße
995 KB
Sprache
Deutsch
Katalognummer
v270979
Institution / Hochschule
Ludwig-Maximilians-Universität München
Note
1.0
Schlagworte
evaluierung hana technologie business intelligence

Autor

Teilen

Zurück

Titel: Evaluierung der SAP HANA Technologie