Wie sicher sind digitale Daten?

Von Dietmar Wüller

 

Quelle: FREELENS-Magazin #21 - 2. Quartal 2005

 

Wie sicher sind digitale Daten?

Wenn wir heute unsere Dias aus den 60er Jahren aus der Kiste holen, sind die Farben vielleicht nicht mehr ganz frisch, aber das Motiv lässt sich noch gut erkennen. aben wir aber 1980 unsere Daten auf eine 10-Zoll-Diskette gesichert, so finden sich heute fast keine Computerlaufwerke mehr, um diese auszulesen.

VON DIETMAR WÜLLER

HALTBARKEIT VON DATENTRÄGERN

Diese Aussagen sind zwar richtig, aber inzwischen hat sich einiges geändert. Meine CDs, die ich Mitte der 80er gekauft habe, sind heute noch auf jedem CD-Spieler abspielbar, sofern sie nicht mecha­nisch beschädigt wurden. Auch meine selbst gebrannten Scheiben von 1995 lassen sich zumeist noch problemlos lesen, es sei denn, die Erstellung erfolgte auf Rohlingen von niederer Qualität.

Wie dem auch sei – der Tag naht, wo CDs mit neueren Technologien nicht mehr kompatibel sind und auf andere Datenträger umkopiert werden müssen. Fachleute gehen von einem Zeitrahmen von 15 bis 20 Jahren aus, dann müssen die Daten auf Datenträgern gleich welcher Art auf neuere Medien gebrachtt werden, um die Lesbarkeit für die Zukunft sicherzustellen. Dieser Vorgang des Umkopierens – in der Regel auf Datenträger mit größerer Speicherkapazität – wird im Fach­jargon als Migration bezeichnet. Es ist also müßig zu diskutieren, ob eine CD 50, 70 oder 100 Jahre hält, weil sie dann sowieso keiner mehr lesen kann. Sie sollte aber die 15 bis 20 Jahre Migra­tionszeit über­stehen, wovon heute bei Marken-CDs und -DVDs unter guten Lagerungsbedingungen ausgegangen wer­den kann.

Was mit Papas digitaler Bildersammlung passiert, wenn sie 50 Jahre auf dem Speicher steht und nicht gepflegt wird, ist leicht auszumalen. Andererseits kann ein gepflegtes digitales Archiv theoretisch un­endlich lange auf­be­wahrt werden, weil das Umkopieren der Daten verlustfrei vonstatten geht. Ein digitales Bild wird – im Gegensatz zum Dia – über die Zeit und auch beim Kopieren nicht schlechter. Es gibt hier nur zwei Zustände: Entweder die Bilddatei ist in Ordnung, oder sie ist defekt. Wobei sich defekte Dateien in vielen Fällen reparieren lassen.

WIE ENTSTEHEN DEFEKTE?

Durch mechanische Beschädigung der Da­ten­träger, durch einen Produktionsfehler auf diesen oder durch Fehler in der Datenübertragung während des Kopiervorgangs können Defekte hervorgerufen werden. Auch Materialfehler auf dem Datenträger, die eine vorzeitige Alterung bedingen, oder eine Veränderung durch Um­welteinflüsse wie z.B. falsche Temperatur oder Lagerungsbedingungen lassen Defekte entstehen.

Die mechanische Beschädigung und die Umwelteinflüsse lassen sich durch optimierte Lagerungsbedingungen minimie­ren. Die Produktions- und Übertragungsfehler werden durch eine Kontrolle des Datenträgers nach dem Brennen, die in allen gängigen Brennprogrammen aktiviert werden kann, erkannt und können durch erneutes Speichern der Daten auf einem anderen Datenträger behoben werden.

Was bleibt ist die Unsicherheit durch Materialfehler. Sie kann durch die Wahl von Markenprodukten und ggf. solche mit ausgewiesen langer Haltbarkeit reduziert werden. Zusätzlich sollten digitale Daten zwei-, besser dreifach gesichert werden, um bei eventueller Beschädigung des Trägers einen Ersatz zur Verfügung zu haben.

WELCHES DATEIFORMAT EIGNET SICH?

Das verwendete Dateiformat sollte ein Standardformat sein, das von vielen Programmen auch zukünftig noch lesbar ist. Zudem sollte sich die Datei im Falle eines auftretenden Fehlers mit einfachen Mitteln reparieren lassen. Natürlich spielen auch der Erhalt der Bildqualität und die Dateigröße eine Rollee, also der notwendige Speicherplatz. Jedoch sind dies ge­nerelle Anforderungen, die an das Bild gestellt werden und nicht für die Langzeitarchivierung spezifisch.

In der digitalen Fotografie kommen nur zwei bzw. drei Dateiformate für die Langzeitarchivierung in Frage. Das eine ist das TIFF-Format. Es besteht als Standard schon seit Mitte der 80er Jahre und wird sicherlich auch zukünftig von den gängigen Programmen unterstützt. TIFF-Dateien für die Archivierung sollten ohne Ebenen und Kompression gespeichert werden. Sie lassen sich bei einem Fehler mit einfachen Werkzeugen reparieren, benötigen aber viel Speicherplatz.

Deutlich weniger Platz benötigen die JPEG-Dateien. Sie lassen sich im Falle eines Schreibfehlers jedoch nicht so leicht, in vielen Fällen gar nicht reparieren. JPEG-Dateien können aber mit jedem Bildbearbeitungsprogramm gelesen werden. Das dritte Dateiformat ist bisher nicht sehr weit verbreitet, vereint aber die positiven Eigenschaften von JPEG und TIFF: JPEG 2000. Es ist in der ISO-Norm 15444 standardisiert, benötigt je nach Einstellung bei der Speicherung wenig Speicherplatz und ist so designt, dass es sich bei einem Fehler leicht reparieren lässt. Außerdem ermöglicht es eine verlustfreie Kompression der Bilddaten. JPEG 2000 ist auch in Photoshop CS integriert, wird aber derzeit standardmäßig nicht mit installiert. Das entsprechende Plugin befindet sich auf der CD unter Goodies/Photoshop only/File Format/.

DIE RICHTIGE WAHL DES DATENTRÄGERS

Verschiedenen Faktoren bedingen die Datenträgerwahl, die je nach Anwendung unterschiedliche Priorität erhalten. Die drei wichtigsten sind Speicherkapazität, Zugriffszeit und Haltbarkeit.
Für die Speicherung kommen derzeit vier verschiedene Datenträger in Frage: CD, DVD, Festplatte und Bandlaufwerke (Streamer).

Der sicherste der genannten Datenträger ist zweifellos die CD. Sie bietet mit 700 MB jedoch das geringste Speichervolumen. Bei hohem Datenauf­kommen kommt es daher zu einer entsprechenden Men­ge an Datenträgern, die verwaltet und gelagert werden will.

Etwas mehr Speicherplatz bietet die DVD mit 4,7 GB. Sie kommt aufgrund der Zusammensetzung in puncto Haltbarkeit der CD sehr nahe. Aber auch sie steht im Schrank und will für jedes gesicherte Bild in den Rechner eingelegt werden.

Den langsamsten Zugriff, eine mitt­lere Kapazität und die schlechteste Haltbarkeit bieten Bandlaufwerke. Die Bänder können aber mehrfach überschrieben werden und eignen sich deshalb für die kurzzeitige Sicherung.

Institutionen wie Bild­agenturen oder größere Redaktionen, die ihre Bilder häufig verwenden, setzen deshalb nur Festplatten oder komplette so genannte „Storage Solutions“ ein, die aus einem Festplatten-Array und Bandsicherungslaufwerken bestehen. Bei letzteren wird zur Beschleunigung der Zugriffszeiten regis­triert, welche Datei wie oft verwendet wird, und dementsprechend werden die oft benutzten Dateien auf den Festplatten gelagert und die selten benutzten auf den Bandlaufwerken. Da eine Festplatte nur ein paar Jahre hält, weil sie sich mit hoher Geschwindigkeit dreht und häufig benutzt wird, werden alle Daten mehrfach auf verschiedenen Datenträgern verteilt. Geht eine Festplatte kaputt, kann sie im laufenden Betrieb aus dem Rechner herausgezogen und eine neue eingesteckt werden, ohne dass Daten verloren gehen. Für die Verwaltung der mehrfachen Verteilung sorgt ein so genannter „Raid Controller“ (Redundant Array of Independent Disks) [1] [2] [3].

URSACHEN FÜR DATENVERLUSTE

Um für die Datensicherung die richtige Strategie aus Speicherkapazität, Zugriffsgeschwindigkeit und Haltbarkeit auf Basis der genannten Datenträger zu entwickeln, hilft ein kurzer Blick auf mög­liche Ursachen eines Datenverlustes oder einer Beschädigung:

1) Festplatte, DVD oder CD geht kaputt
2) Festplatte enthält fehlerhafte Sektoren
3) Brand oder Diebstahl zerstört den kompletten Rechner
4) eine Datei, ein Verzeichnis oder die Festplatte wird versehentlich gelöscht
5) ein Virus befällt den Computer
6) eine Software enthält einen Bug, der Daten unbeabsichtigt löscht

Für unsere Strategie gehen wir von mehreren Sicherungen aus, die in jedem Fall benötigt werden. Aufgrund der Viren- und Software-Problematik benötigen wir eine zeitliche Entkopplung der Sicherungen, und aufgrund der Brand- und Diebstahlgefahr benötigen wir eine örtliche Entkopplung.

INKREMENTELLE BACK-UPS

Bei dieser Art der Sicherung werden in regelmäßigen Abständen neu hinzugekommene bzw. gegenüber dem letzten Stand veränderte Daten auf eine externe Festplatte kopiert. Es gibt zwei Arten: ein wirk­liches Back-up, das bei veränderten Daten die alte Version erhält und die neue zusätzlich abspeichert, und ein reines Kopieren der veränderten Daten, also ein Überschreiben der alten Version.

Ersteres setzt ein Back-up-Programm wie z.B. Retrospect voraus und führt dazu, dass man auf die Daten nicht direkt z.B. über einen Explorer o.ä. Zugreifen kann. Das einfache Synchronisieren führt zu einem Überschreiben der alten Ver­sion. Hierfür gibt es viele kleine Helfer wie FileSync oder Mr Mirror auf Win­dows oder You Synchronize für den Mac. Das einfache Synchronisieren ermöglicht einen direkten Zugriff auf die Daten über Finder oder Explorer.

DIE OPTIMALE SPEICHERSTRATEGIE

Zum schnellen Zugriff liegen alle Daten auf der Festplatte. Um deren Ausfall abzusichern, enthält der Computer eine zweite, gleichgroße Festplatte, die mit der ersten gespiegelt wird (RAID 1, bei Windows und auch Linux schon betriebsystemseitig). Alle Daten sind also nahezu zeitgleich zweimal vorhanden und so gegen Festplattendefekte geschützt. Zur räumlichen Entkopplung werden die Daten täglich inkrementell auf eine externe Festplatte (USB 2.0 oder FireWire) kopiert und diese dann vom Computer getrennt gelagert. Daten, die langzeitarchiviert werden, werden in zweifacher Ausfertigung auf DVD gebrannt und an unterschiedlichen Orten gelagert, wobei auf die Verwendung von Markenprodukten und möglichst ideale Lagerbedingungen (kühl und nicht zu feucht, nicht zu trocken) zu achten ist. Um die Daten­menge über­schau­bar zu halten, werden regelmäßig alle nicht mehr gebrauchten Bilder gelöscht.

Inwieweit Zeit und Budget diese Ideal­bedingungen erlauben, ist jedem Anwender überlassen. Aber Datensicherung ist wichtig ­– keine zu haben, kann die Existenz des Fotografen gefährden.