Lade Inhalt...

Medien zur Langzeitspeicherung elektronischer Daten (Bitstream Preservation)

Seminararbeit 2014 14 Seiten

Informatik - Allgemeines

Leseprobe

Zusammenfassung: Dieser Artikel beschäftigt sich mit der physikalischen Erhaltung von elektronischen Daten (

”BitstreamPreservation”).EinBitstrom(engl.bitstream)isteine

Sequenz von Bits in unterschiedlicher Länge. Zu betrachten sind Speichermedien, die als physische Trägersubstanz dieses Bitstromes dienen. Im Vordergrund steht die Diskussion hinsichtlich der Eignung für die Langzeitspeicherung. Trotz Konkurrenz durch neuere Medien kann sich das Magnetband nach wie vor durch seine niedrigen Kosten und die hohe Haltbarkeit der Daten einer großen Beliebtheit erfreuen. Allerdings werden in letzter Zeit verstärkt optische Speichermedien (CD-ROM, DVD, Blu-ray Disc) und Festplatten bzw. Festplattensubsysteme als Ergänzung oder Alternative herangezogen. Disketten konnten sich aufgrund ihrer niedrigen Speicherkapazität und geringen Haltbarkeit nicht als primäres Medium zur Langzeitspeicherung durchsetzen. Die praktische Anwendung eines Speichermediums in einem bestimmten Kontext erfordert strategische Überlegungen. Dazu zählen das Anfertigen mehrerer Kopien, die Sicherung der Daten durch kryptografische Prüfsummen sowie eine regelmäßige Medienmigration. Als Beispiel für eine Umsetzung strategischer Überlegungen wird die Langzeitspeicherung im Bundesarchiv sowie die Verwendung von Metadaten im Archiv-System DIMAG vorgestellt.

1 Einleitung

Zweifelsohne ist es in den letzten Jahrzehnten durch den vermehrten Einsatz von EDV-Technologien zu einer rapiden Zunahme elektronisch gespeicherter Daten gekommen. Dies betrifft sowohl private als auch viele öffentliche Lebensbereiche. Die IDC-Studie ”TheDigitalUniverse“ausdem Jahre 2012 prognostiziert ein Anwachsen des Informationsberges bis 2020 auf 40 ZB ( 40.000.000.000 TB). Das sind 57 -mal mehr elektronische Bytes, als es Sandkörner auf der Erde gibt. Jeder Mensch wird 2020 pro Jahr acht GB an Daten erzeugen.1 Diese rasante Entwicklung schafft neue Schwierigkeiten und erfordert neue Strategien im Umgang mit gespeicherten Daten. Der universitäre Forschungs- zweig der ”DigitalenLangzeitarchivierung”versuchtinVerbindungmitÜberlegungenzumForschu- ngsdatenmanagement dieses Thema auf allen Ebenen zu betrachten. Der Aspekt ”BitstreamPreser- vation” ist hierbei eines der grundlegenden Themengebiete, da der einwandfreie physikalische Erhalt einer Datenmenge auf einem bestimmten Trägermedium sicherstellt, dass weitergehende Maßnahmen, wie z.B. die Errichtung eines Hardware-Museums oder die Emulation einer alten Software, überhaupt erst möglich werden.

Folgendes Negativbeispiel soll die Problematik verdeutlichen. Als 1979 die Pioneer-Sonde am Mars vorbei flog, wurden die laufend übertragenen Daten zunächst auf Magnetbändern gespeichert. Zur Sicherheit verwendete die NASA insgesamt vier Formate: 9 -Spur-Magnetband, 7 -SpurMagnetband, Lochstreifen und Lochkarten. Nach 15 Jahren waren die Medien allesamt gut erhalten, es gab jedoch keine geeigneten Lesegeräte mehr, da diese auf dem Markt nicht mehr erhältlich waren.2 Man hat hier mehrere Kopien mit verschiedenen Speichertechniken erstellt und auch auf sachgerechte Lagerung geachtet, aber die Marktentwicklung ignoriert. Eine rechtzeitige Migration auf neuere Magnetbandformate hätte die Lösung gebracht. Bis Mitte der 90er Jahren sind insgesamt 1,2 Millionen Magnetbänder, die Daten aus 30 Jahren Raumfahrt speicherten, unbrauchbar geworden. Dies lag u.a. auch daran, dass die Daten den entsprechenden Weltraumfahrten nicht mehr zugeordnet werden konnten. Hier ist eindeutig die Erstellung von Metadaten beim Ingest vernachlässigt worden.3 Datenverluste sind also nicht nur technisch bedingt sind, sondern auch Folge mangelnder Organisation.

Dieser Fall zeigt, dass neben der Frage der physikalischen Haltbarkeit eines bestimmten Trägermediums gleichermaßen strategische Überlegungen von entscheidender Bedeutung sind. Sowohl die Forschung als auch Unternehmen, Archive, Museen und Bibliotheken beschäftigen sich seit Jahren mit der Entwicklung effektiver Strategien und Techniken zur Bewahrung digitaler Objekte. Für die Entwicklung solcher Strategien können Aspekte wie Anzahl der Sicherheitskopien, Einsatz unterschiedlicher Speichertechniken, Bewahrung internationaler Standards, kryptografische Sicherheitsverfahren und regelmäßige Datenmigrationen eine Rolle spielen.

Nicht nur die Bewahrung aktueller Datenmengen ist von Interesse. Gerade Museen und Archive können altes Datenmaterial erhalten, welches nicht nur gelesen werden muss, sondern auch für die

Zukunft bewahrt werden soll. Man kann in diesem Zusammenhang von einer ”DigitalenArchäologie” sprechen.4 Zusätzlich muss berücksichtigt werden, dass die zu archivierenden Objekte sehr unterschiedlich sein können. Dazu zählen Aspekte wie Häufigkeit des Zugriffs (häufige, seltene, keine Nachfragen), zeitliche Vorgaben zur Speicherung (etwa gesetzliche Mindestaufbewahrungsfristen in unterschiedlicher Länge oder auch potenziell ewig) und Wichtigkeit (Forschungsdaten, Kunstwerke, behördliche Dokumente).5 Für ein konkretes Anwendungsbedürfnis sollte daher eine sinnvolle Strategie erarbeitet werden, die zu einer Wahl geeigneter Speichermedien führen. Bei der folgenden Betrachtung einzelner Speichermedien werden diese auch hinsichtlich der Eignung für bestimmte Anwendungsbedürnisse untersucht.

2 Betrachtung einzelner Speichermedien

Ein bestimmtes Speichermedium stellt die unterste Ebene der Datenspeicherung dar, da es die konkrete physische Trägersubstanz eines Bitstroms ist. Ein Bitstrom (engl. bitstream) ist eine Sequenz von Bits in unterschiedlicher Länge.6 Die blanke Abfolge von Bits ist für einen Computer erst dann brauchbar, wenn über entsprechende Laufwerke und Controller der Bitstrom eingelesen wird. Doch auch dies genügt nicht. Erst die Interpretation der Bits durch eine Software ergibt dann für den Menschen verstehbare Informationen. Hier soll es jedoch thematisch nur um die Erhaltung des blanken Bitstroms gehen.

Im Bereich der Langzeitarchivierung spielen derzeit Magnetbänder, Magnetbandkassetten, Digital Audio Tapes (DAT), CD-ROMs, DVDs, Blu-ray Discs und insbesondere Festplatten eine bedeutsame Rolle.7

Es sei noch angemerkt, dass die hier gemachten Angaben zur Haltbarkeit eines Mediums mit Vorsicht zu betrachten sind.8 In der Literatur finden sich im Allgemeinen zu einem Medium durchaus sehr unterschiedliche Angaben. Es gibt eine Reihe von Faktoren, die die Haltbarkeit eines bestimmten Mediums beeinflussen. Dazu gehören Art der Lagerung (Temperatur, Verschmutzungen, Luftfeuchtigkeit, Sonneneinstrahlung), Einfluss von Magnetfeldern, Anzahl der Lese-/ Schreibvorgänge, Stöße und Beschädigungen des Mediums bzw. der Laufwerke. Je nach Anwendungsfall und Art der Lagerung kann die reale Lebensdauer eines Mediums kürzer bzw. länger ausfallen. Es gehört daher auch zu dem Bereich der strategischen Überlegungen, wie die Haltbarkeit eines Mediums optimiert werden kann.

2.1 Magnetband, Magnetbandkassette und Digital Audio Tape (DAT)

Ein Magnetband besteht aus einer langen, schmalen Folie aus Kunststoff, die mit einem magnetisierbaren Material beschichtet ist. Ein solches Kunststoffband kann auf Wickelkernen oder Spulen aufgewickelt oder in Kassetten eingebaut sein. Ist Letzteres der Fall, spricht man von einer Magnetbandkassette.9 Das DAT (Digital Audio Tape) kann als eine Weiterentwicklung der Magnetbandkassette betrachtet werden.

Dieser Datenträger bietet eine Reihe von Vorteilen, sodass Magnetbänder lange Zeit das Standardmedium zur Datenspeicherung in der EDV waren und auch heute noch beliebt sind. Ein wesentlicher Vorteil ist die Haltbarkeit, die auf bis zu 30-50 Jahre geschätzt wird.10 In der realen Anwendung kann die Lebenszeit jedoch deutlich geringer ausfallen. Eine ungünstige Lagerung, häufige Lesezugriffe und fehlerhafte Laufwerke können als mögliche Ursachen infrage kommen. Eine hohe Haltbarkeit kann dann erreicht werden, wenn das Band sachgerecht gelagert (kühl, trocken, staubfrei und außerhalb der Reichweite von Magnetfeldern), wenig bis keine Lesezugriffe erfährt und passende Laufwerke vorhanden sind und diese einwandfrei funktionieren. Ein fehlerhaftes Laufwerk kann ein Band massiv beschädigen oder ganz zerstören, was zu empfindlichen Datenverlusten führen kann. Zudem sind sie in der Anschaffung und im Unterhalt günstiger als im Vergleich zu Festplatten, da sie z.B. nur Strom verbrauchen, wenn sie beschrieben oder gelesen werden. Dies zahlt sich dann aus, wenn Magnetbänder für Daten verwendet werden, die kaum oder gar nicht gelesen werden.

Früher galten Magnetbänder als langsame, sequenzielle Medien d.h. im Vergleich zu anderen Medien war der Lesezugriff langsamer. Ein Magnetband muss nicht nur sequenziell durchgegangen, sondern auch aus dem Lager geholt und in das Laufwerk gelegt werden. Daher war auch der Umkopierprozess mühsamer als z.B. bei einer Festplatte. Dies wird heute dadurch ausgeglichen, dass zum Lesen, Schreiben oder Umkopieren nicht mehr manuell mit Einzellaufwerken gearbeitet wird, sondern ganze Bandroboter-Systeme (Bandbibliotheken) mit automatischen Bandwechslern zum Einsatz kommen. Solche Systeme können Kapazitäten im Petabyte-Bereich verarbeiten.11 Bedingt durch die Konkurrenz neuer, schneller Medien, sind in den letzten Jahren neue Bandtechnologien auf den Markt gekommen, die gegenüber älteren Technologien schneller arbeiten und z.T. erheblich mehr Kapazitäten verfügen. Ein DAT (4-mm-Band) verarbeitet 72 GB. Die S-DLTTechnologie erreicht 160 GB (mit Kompression 320 GB) und mit LTO-Ultrium vom Typ LTO-6 kommt man sogar mit Kompression auf 6,25 TB.12 Moderne Magnetbandtypen besitzen eine Da- tentransferrate, die vergleich mit anderen Medien ist (HDD 50-100 MBit/s, DVD 80 (8x) MBit/s, LTO-Magnetbänder 60-120 MBit/s).13

Zusammengefasst sind Magnetbänder für Datenobjekte geeignet, die für einen langen Zeitraum (bis zu ewig) und unverändert gespeichert und die kaum bis gar nicht gelesen werden müssen. Die hohe Haltbarkeit macht sie auch für wichtige Daten attraktiv. Zudem können als Träger von Sicherheitskopien dienen, wenn beispielsweise mit den Daten auf einer Festplatte viel gearbeitet wird. Die Entwicklung neuer Markttechnologien, die auch international verbreitet sind, zeigt, dass dieses altgediente Medium nach wie vor aktuell ist. Daher werden in vielen Institutionen weiterhin Magnetbänder als Speichermedium verwendet.14

2.2 Disketten

Disketten zählen ebenso zu den magnetischen Datenträgern. Das eigentliche Speichermaterial ist eine dünne Schicht aus Eisenoxid, die auf eine Kunststoffscheibe aufgetragen wird. Diese Scheibe wird von einer quadratischen oder rechteckigen Kunststoff- oder Papphülle umschlossen.15 Disketten sind für den Einsatz als Langzeitspeichermedium wegen ihrer geringen Haltbarkeit und mangelnden Speicherkapazität nur in bestimmten Anwendungsfällen zu gebrauchen.16 Klassische 3,5-Zoll-Disketten enthalten gerade mal 1,44 MB Speicher. Es gab jedoch Bemühungen, die Kapazität der Disketten deutlich zu erhöhen. Bekannte Technologien sind hierbei die LS120/LS240 (120/240 MB Speicher) und die sog. ZIP-Disketten (je nach Typ 100-750 MB).17 Heutige Datenmengen übersteigen jedoch auch die Fähigkeiten dieser Datenträger. Disketten halten durchschnittlich fünf Jahre. Bei entsprechender Lagerung (Schutz vor Wärme, Sonne und Magnetismus) und geringen Lesezugriffen können auch 10-30 Jahre möglich sein.18

Berücksichtigt man die riesigen Datenmengen, die heute bewältigt werden müssen, so scheint der Einsatz von Disketten als unpraktisch. Speichert man größere Datenobjekte ab oder kopiert diese um, so müsste man ständig neue Disketten in die Laufwerke einfügen. Heutzutage würde kaum jemand Disketten als Primärspeicher für Daten mit hoher Relevanz benutzen. Ein möglicher Einsatz ist jedoch die Erstaufnahme kleinerer Datenmengen. Interessanterweise hat das Bundesarchiv zwischen 1990-2001 z.T. Daten auf klassischen Diskettenformaten und später auch auf ZIP-Disketten gespeichert.19 Durch das Aufkommen von CD-ROM und DVD wurde der Einsatz nach 2001 jedoch eingestellt.

Im privaten Sektor haben Disketten jedoch eine weite Verbreitung gefunden, da sie kostengünstig sind und der Privatanwender nicht immer riesige Datenmengen zu bewältigen hat (z.B. OfficeDokumente, PDFs, einzelne Bilddateien). Durch die Konkurrenz durch CD-ROM, DVD und FlashSpeicher (z.B. USB-Sticks) steht die Diskette jedoch vor dem Aus. Einige Hersteller haben sogar schon die Herstellung einzelner Formate eingestellt.20 Vermutlich wird es in Zukunft schwierig sein, passende Laufwerke für solche Medien zu bekommen.21

[...]


1 Gantz, John/Reinsel, David (2012): The Digital universe in 2020. Big Data, Bigger Digital shadows, and Biggest Growth in the far East. IDC Digital universe study. URL: www.emc.com/collateral/analyst- reports/idc-the-digital-universe-in-2020.pdf (Letzter Aufruf: 08.02.2014)

2 Stoll, Clifford (1996): Die Wüste Internet. Geisterfahrten auf der Datenautobahn. Frankfurt am Main, S.263

3 vergl. Rathje, Ulf (2002): a.a.O., S. 117

4 Im Jahre 2012 entdeckte der Entwickler des Computerspiels Prince of Persia den verloren geglaubten Original-Quellcode des Spiels. Die Daten waren auf alten Disketten abgespeichert und zufällig gefunden worden. Mithilfe von Experten gelang es, die Daten vollständig zu retten, wobei der Rekonstruktionsprozess mühsam war. Vergleiche hierzu folgenden Online-Artikel: http://www.zeit.de/digital/games/2012-04/prince-of-persia-quellcode (Letzter Aufruf: 31.01.2014)

5 Das Bundesfinanzministerium hat z.B. Grundsätze zum Datenzugriff und zur Prüfbarkeit digitaler Unterlagen (GDPdU) erstellt. Dieses Dokument enthält Regeln zur Aufbewahrung digitaler Unterlagen. URL: http://www.bundesfinanzministerium.de/Content/DE/Downloads/BMF Schreiben/Weitere Steuerthe men/Abgabenordnung/Datenzugriff GDPdU/002 GDPdU a.pdf? blob=publicationFilev=4 (Letzter Aufruf: 07.02.2014) Rechtsfragen verschiedener Art im Zusammenhang mit Langzeitarchivierung werden hier diskutiert: Steinhauer, Eric: Wissen ohne Zukunft? Der Rechtsrahmen der digitalen Langzeitarchivierung von Netzpublikationen. In: Hrsg. Klimpel, Paul, Keiper, Jürgen (2013): Was bleibt? Nachhaltigkeit der Kultur in der digitalen Welt. Internet Gesellschaft Collaboratory e. V. S. 61-82

6 Für eine ausführliche Erläuterung vergl. Rothenberg, Jeff (1999): Ensuring the Longevity of Digital Information. S.5

7 vergl. Rathje, Ulf (2002): Technisches Konzept für die Datenarchivierung im Bundesarchiv. In: Der Archivar, H. 2, Jahrgang 55, S.117-120. S. 119

8 Eine Übersicht über die Haltbarkeit verschiedener Speichermedien findet sich in Däßler, Ralf: Datenträger und Speicherverfahren für die digitale Langzeitarchivierung. In: Hrsg. v. H. Neuroth, u.a. (2010): Nestor-Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung. Online-Version 2.3, Göttingen: Nestor c/o Niedersächs. Staats- und Univ.-Bibliothek, S.275

9 http://www.itwissen.info/definition/lexikon/Magnetband-MT-magnetic-tape.html (Letzter Aufruf: 08.02.2014)

10 Arbeitsgemeinschaft für wirtschaftliche Verwaltung e.V. (AWV) (2003): Speichern, Sichern und Archivieren auf Bandtechnologien. Eine aktuelle Übersicht zu Sicherheit, Haltbarkeit und Beschaffenheit. Eschborn: AWV-Eigenverlag. S.85

11 vergl. Ullrich, Dagmar: Magnetbänder. In: Hrsg. v. H. Neuroth, u.a. (2010): Nestor-Handbuch: a.a.O., S.282

12 vergl. Hrsg. Schneider, Uwe; Werner, Dieter (2007): Taschenbuch der Informatik. Carl Hanser Verlag München. S. 141. Eine aktuelle Übersicht über die verschieden Kapazitäten der LTO-Ultrium Typen findet sich auf http://lto.org/technology/roadmap.html (Letzter Aufruf: 08.02.2014)

13 Däßler, Ralf: Datenträger und Speicherverfahren für die digitale Langzeitarchivierung. In: Hrsg. v. H. Neuroth, u.a. (2010): Nestor-Handbuch: a.a.O., S.273

14 Giebel, Ralph: Speichertechnologie und Nachhaltigkeit. In: Hrsg. Klimpel, Paul, Keiper, Jürgen (2013): Was bleibt? a.a.O. S. 104f

15 http://www.itwissen.info/definition/lexikon/Diskette-FD-floppy-disk.html am 07.02.2014

16 vergl. Rathje, Ulf (2002): a.a.O., S. 120

17 Mueller, Scott (2005): Scott Mueller’s Upgrading and Repairing Laptops. Que Corporation. S. 494f.

18 Michael W. Gilbert (o.J.): Digital Media Life Expectancy and Care. URL: http://web.archive.org/web/20031222194846/http://www.oit.umass.edu/publications/at oit/Archive/f all98/media.html Letzter Aufruf: 08.02.2014)

19 vergl. hierzu die Auflistung der im Bundesarchiv verwendeten Speichermedien in: Rathje, Ulf (2002): a.a.O., S. 118

20 http://www.t-online.de/computer/hardware/id 41443768/sony-stellt-produktion-der-3-5-zoll-diskette ein.html am 08.01.2014

21 Stührenberg, Maik: Digitale Langzeitarchivierung aus Sicht der IT. In: Hrsg. Klimpel, Paul, Keiper, Jürgen (2013): a.a.O. S. 86

Details

Seiten
14
Jahr
2014
ISBN (eBook)
9783656778349
ISBN (Buch)
9783656774754
Dateigröße
563 KB
Sprache
Deutsch
Katalognummer
v281771
Institution / Hochschule
Albert-Ludwigs-Universität Freiburg – Lehrstuhl für Kommunikationssysteme
Note
1,3
Schlagworte
medien langzeitspeicherung daten bitstream preservation

Autor

Teilen

Zurück

Titel: Medien zur Langzeitspeicherung elektronischer Daten (Bitstream Preservation)