Lade Inhalt...

EMC Isilon als Grundlage für einen Scale-out-Data-Lake mit sofortiger Snapshot-Wiederherstellungen nach Bedarf

Projektarbeit 2018 18 Seiten

Informatik - Angewandte Informatik

Leseprobe

Inhaltsverzeichnis

1. Projektdefinition
1.1 Projektumfeld
1.2 Ist-Analyse
1.3 Soll-Konzept
1.4 Projektphasen

2. Planung
2.1 Replikation über SyncIQ
2.2 SnapshotIQ
2.3 SnapshotIQ Zeitintervall-Konzept

3. Durchführung
3.1 Konfiguration des SyncIQ
3.2 Konfiguration des SnapshotIQ
3.5 Test

4. Projektergebnis und Fazit

5. Anhang
5.1 Glossar
5.2 Quellen
5.3 Abbildungsverzeichnis

1. Projektdefinition

1.1 Projektumfeld

Der „xxx“ ist der IT-Dienstleister des Universitätsklinikums xxx.

Sie betreiben eine leistungsfähige, redundante und hochverfügbare Infrastruktur auf dem aktuellen Stand der Technik. Diese Infrastruktur ist die Grundlage für zentrale Systeme, wie zum Beispiel das Krankenhausinformationssystem, das Bildverarbeitungs- und Kommunikationssystem (PACS) oder dem zentralen Verzeichnisdienst inkl. des elektronischen Postverkehrs (eMail).

Die Netzwerktechnik sorgt dabei für eine reibungslose Verbindung aller Systeme untereinander. Die Spannweite der Geräte, die mit dem Netz des xxx verbunden sind, reicht dabei vom typischen Büroarbeitsplatz bis hin zum speziellen Bett-PC.

1.2 Ist-Analyse

Im Universitätsklinikum xxx steigen die Datenspeicheranforderungen sehr schnell. Die neuen Daten sind dateibasiert und unstrukturiert. Dieses rasante Datenwachstum belastet die begrenzten IT-Ressourcen und steigert die Managementkomplexität. Des Weiteren muss abgewogen werden, wie sich die Kosten für die Speicherung von Archivdaten mit einem schnellen Zugriff in Einklang bringen lassen. Um sich diesen Herausforderungen zu stellen, setzt das Universitätsklinikum zukünftig auf eine Scale-out-Data-Lake1 Lösung von Dell, die EMC Isilon.

Die EMC Isilon ist eine einfach zu bedienende, hochgradig skalierbare und effiziente Data-Lake-Platform. Darüber hinaus bildet sie eine ideale Hardware-Grundlage für die Multiprotokollaufnahme von Daten. Das ist eine wichtige Funktion in Big Data-Umgebungen, in denen Daten schnell und zuverlässig über verschiedene Protokolle aufgenommen werden müssen, die dem Workload, der die Daten erzeugt, am nächsten kommen.

1.3 Soll-Konzept

Im Rahmen des Projektes soll ich ein Konzept für die Snapshots erarbeiten, dabei kommt es darauf an, dass die Daten redundant und an verschiedenen Standorten gespeichert werden. Das Anlegen, Speichern und Löschen von Snapshots sollen dabei Inhalte des Konzeptes sein. Die Prüfung des Konzepts wird dabei vom IT-Leiter übernommen. Am Ende werden die Server-Administratoren, mit den nötigen Rechten ausgestattet, die Installation vornehmen. Nach Abschluss des Projektes soll es möglich sein, sekundenschnell zu einem früheren Datenstand (Snapshot) zu gelangen. Aktuell ist dies nur mit einem hohen Zeitaufwand möglich.

Im Universitätsklinikum sollen zwei Isilon Gen6 mit vier Node A200 Cluster in Betrieb genommen werden. Jeder Node hat dabei eine Bruttokapazität von 60 TB und wird mit jeweils 2x10 Gigabit Ethernet Ports verbunden. Insgesamt steht eine Bruttokapazität von 240 TB pro Isilon zur Verfügung. Diese Speicherkapazität ist durch Hinzufügen weiterer Nodes zu jeder Zeit erweiterbar.

Es können zwei Nodes pro Isilon ausfallen, ohne dass ein Totalausfall auftritt. Die beiden Isilons stehen in verschiedenen Brandschutzbereichen, dadurch ist eine hohe Ausfallsicherheit gewährleistet.

Auf den beiden Isilons ist das OneFS-Betriebssystem installiert. OneFS führt die drei Schichten herkömmlicher Speicherarchitekturen - Dateisystem, Volume Manager und Datensicherheit - In einer einzigen Softwareschicht zusammen, und schafft so ein einziges, intelligentes Dateisystem, das alle Nodes In einem Cluster umspannt. Für das Projekt sind die Feature SnapshotIQ und SyncIQ essentiell. Die Lizenzen dafür wurden bei der Bestellung mit erworben.

1.4 Projektphasen

Ist-Analyse 2,0 Stunden

Soll-Konzept 2,0 Stunden

Planung 15,0 Stunden

Durchführung 5,0 Stunden

Test 2,0 Stunden

Übergabe 1,0 Stunde

Dokumentation 8,0 Stunden

Gesamt: 35,0 Stunden

2. Planung

2.1 Replikation über SyncIQ

Um die Daten an verschiedenen Standorten zu speichern, wurden für das Universitätsklinikum zwei baugleiche Isilons angeschafft, welche in verschiedenen Brandabschnitten stehen. Die Kommunikation zwischen ihnen wird über das LAN des Klinikums bewerkstelligt. Mit dem Datensicherheitsfeature SyncIQ von EMC Isilon ist eine asynchrone Replikation von Daten möglich. Dabei werden Daten auf der ersten Isilon geschrieben und erst, wenn der Schreibvorgang abgeschlossen ist, auf die zweite EMC übertragen. SyncIQ bietet eine einzigartige Replikationsleistung. Jeder Knoten in einem Isilon-Cluster kann Daten senden und empfangen.

Durch dieses Feature ist es möglich, den laufenden Betrieb aufrechtzuerhalten, auch wenn eine der beiden Isilon-Cluster einen Totalausfall erleidet.

2.2 SnapshotIQ

Was ist ein Snapshot und warum braucht man ihn?

Ein Snapshot ist ein Point-In-Time-Picture2 eines Verzeichnisses. Snapshots sorgen für eine deutliche Verbesserung der Häufigkeit und Zuverlässigkeit von Backups, weil sie einen minimalen Performance Overhead verursachen und sicher auf einem Produktionscluster erstellt werden können.

Warum braucht man einen Snapshot?

Ein Snapshot ermöglicht die schnelle Wiederherstellung einer verlorengegangen oder beschädigten Datei.

Was ist SnapshotIQ?

Das Feature SnapshotIQ ist eine einfache, skalierbare und flexible Option, mit der man eine Snapshot-Datensicherung der Enterprise-Klasse aktivieren kann. Mit SnapshotIQ kann man mit geringen Auswirkungen häufige Backups von Dateien durchführen.

Wie funktioniert Snapshot IQ?

SnapshotIQ überwindet die Einschränkungen herkömmlicher Ansätze durch eine zuverlässige Verteilung einer hoch skalierbaren Anzahl von Snapshots über mehrere, hochverfügbare Isilon-Scale-Out-Store-Nodes3. Das Ergebnis ist eine bemerkenswert einfache, hoch skalierbare und effiziente Daten-Backup- und -Recovery-Funktion, die es ermöglicht, die anspruchsvollen Anforderungen an die Datenverfügbarkeit zu erfüllen.

Sobald ein Basis-Snapshot eingerichtet ist, werden nur Änderungen an Blöcken einer Datei in Updates der aktuellen Snapshot-Version wiedergegeben. Damit ist eine höchst effiziente Snapshot-Speicherauslastung möglich. Da Snapshots ein wesentlicher Bestandteil des OneFS-Dateisystems sind, ist darüber hinaus keine Vorabzuweisung von dediziertem, für Snapshots reserviertem Speicherplatz, erforderlich.

2.3 SnapshotIQ Zeitintervall-Konzept

Abbildung in dieser Leseprobe nicht enthalten

Ich habe zwei Zeitintervall-Konzepte in die engere Auswahl einbezogen. Bei meinem ersten Vorschlag bin ich von einem stündlichen Snapshot ausgegangen, welcher alle 24 Stunden gelöscht wird. Dadurch werden 24 Snapshots aufbewahrt. Täglich bin ich von einem pro Tag ausgegangen, dieser hat eine Speicher Zeit von 7 Tagen. Wöchentlich wird ein Snapshot erstellt mit einer vier-wöchigen Speicherzeit. Somit ergeben sich maximal 35 Snapshots.

Beim zweiten Vorschlag habe ich sechs Snapshots in der Stunde erstellt. Diese werden ebenfalls alle 24 Stunden gelöscht. Dadurch werden 144 aufbewahrt. Täglich werden zwei erstellt und eine Aufbewahrungsfrist von sieben Tagen wird realisiert. Wöchentlich wird ein Snapshot erstellt, welcher alle vier Wochen gelöscht wird. Monatlich wird einer erstellt und hat eine Aufbewahrungsfrist von 12 Monaten. So ergeben sich 174 Snapshots, die maximal gespeichert werden.

Der IT-Leiter hat meine Vorschläge geprüft und wir sind beide zum Entschluss gekommen, dass der erste Vorschlag der Bessere ist.

Begründung: Wenn zu wenige Datenkopien angelegt werden, kann dies dazu führen, dass sich nicht das gewünschte Recovery Point Objective erreichen lässt. Das bedeutet, dass die Datenkopien vom Erstellungszeitpunkt zu weit zurückliegen, um schnellst möglich wieder den normalen Produktionsablauf aufzunehmen. Dies kann in einem Krankenhaus zu erheblichen Störungen führen. Mit SnapshotIQ können Daten automatisch und so häufig wie nötig gesichert werden, um Recovery Point Objectives4 einzuhalten. Die Auswirkung auf die Performance ist dabei kaum oder gar nicht bemerkbar (Herstellerangabe), und das unabhängig von der Größe des Dateisystems oder Verzeichnisses, für welches ein Snapshot erstellt wird, und vom Umfang der Produktionsaktivität auf dem Cluster. In einem Isilon-Speichercluster können bis zu 1024 Snapshots pro Verzeichnis erstellt werden, somit ist der von mir erbrachte zweite Vorschlag hinsichtlich Skalierung und Performance unproblematisch.

3. Durchführung

3.1 Konfiguration des SyncIQ

Die Erläuterung der Einzelschritte bei der Konfiguration der SyncIQ entnehmen Sie bitte den Abbildungen 3 bis 7 der Anlage. Die gewählte Schrittfolge beginnt mit der Auswahl des Isilon-Clusters im Backend-Management-Network und endet mit der Auswahl der SyncIQ-Policy.

Im Rahmen des Projektes wurde die Replikation in folgenden Schritten eingerichtet (siehe Abbildung 6 und 7). In der folgenden Aufzählung werden auswählbare Eigenschaften näher erläutert:

1. Policy Name: Replikation_Isilon1_zu_Isilon2

Der gewählte Namen der Richtlinie muss einen Wiedererkennungswert haben, ansonsten ist beim Hinzufügen neuer Richtlinien eine Unterscheidung nur schlecht möglich und die Übersichtlichkeit geht verloren.

2. Description

Beschreibt die Richtlinie. Zum Beispiel kann die Beschreibung den Zweck oder die Funktion der Richtlinie erklären.

3. Haken setzten bei Enable this Policy

Bestimmt, ob die Richtlinie aktiviert ist.

4. Action: Synchronize

Bestimmt, wie die Richtlinie Daten repliziert. Alle Richtlinien kopieren Daten aus dem Quellverzeichnis in das Zielverzeichnis und aktualisieren Dateien im Zielverzeichnis. Die Aktion bestimmt, wie gelöscht wird. Dabei wirkt sich eine Datei aus dem Quellverzeichnis auf das Ziel aus. Zur Auswahl stehen die Eigenschaftswerte „Synchronize“ und „Copy“. „Synchronize“ konfiguriert die Richtlinie so, dass beim Löschen einer Datei im Quellverzeichnis die Richtlinie diese Datei beim Ausführen der Richtlinie aus dem Zielverzeichnis löscht. Dies stellt sicher, dass eine exakte Kopie des Quellclusters beibehalten wird.

„Copy“ konfiguriert die Richtlinie so, dass beim Löschen einer Datei im Quellverzeichnis die Richtlinie diese Datei beim Ausführen der Richtlinie nicht aus dem Zielverzeichnis löscht. Im Rahmen des Projektes sollte eine exakte Kopie des Quellclusters entstehen, somit fiel die Wahl auf „Synchronize“.

[...]

Details

Seiten
18
Jahr
2018
ISBN (eBook)
9783346104052
Sprache
Deutsch
Katalognummer
v510926
Note
2
Schlagworte
Projektarbeit Informatik IT DV Isilon Dell Telekommunikation Abschlussarbeit Fachinformatik Systemintegration Scale Data-Lake Snapshot Wiederherstellung IHK
Zurück

Titel: EMC Isilon als Grundlage für einen Scale-out-Data-Lake mit sofortiger Snapshot-Wiederherstellungen nach Bedarf