Archivierung großer Datenmengen mit LTFS–Bändern

Der Begriff „BigData“ fällt häufig seit einiger Zeit. Verkürzt handelt es sich um alle Daten, die tagtäglich produziert werden. Zeitweise werden sie tatsächlich benötigt; danach liegen sie auf schnellen hochverfügbaren Speichersystemen, ohne das noch jemand darauf zugreift. Damit beginnt die Herausforderung für die IT-Verantwortlichen. Diese Daten müssen so sicher und kosteneffizient wie möglich archiviert werden.

Egal in welcher Branche – in fast allen Unternehmen nimmt der Datenbestand permanent zu. Die Dateien werden nicht nur mehr, sie werden in aller Regel auch größer. Ein gutes Beispiel sind HD-Medien: Im Entertainment-Umfeld geht man  davon aus, dass eine Verdoppelung der Bildauflösung von 4k auf 8k eine Vervierfachung des Datenvolumens mit sich bringt.

Auf der anderen Seite existiert ein permanenter Kostendruck auf die IT Verantwortlichen. Dass die Archivierung wachsender Datenmengen logischerweise mit Kostensteigerungen einhergeht, ist noch nicht in alle Controlling-Abteilungen durchgedrungen. Ein Lösungsansatz im Umgang mit BigData liegt darin, die Daten auf vermeintlich langsamere Langzeitspeicher zu übertragen. Aktuelle Technik sorgt dafür, dass dies die Performance weit weniger einschränkt, als viele erwarten.

Nur 20 % werden tatsächlich genutzt

Statistisch liegt der Anteil der nicht genutzten Dateien bei bis zu 80 % des vorhandenen Datenbestands – je nach Branche. In den Augen der IT-Verantwortlichen sind Anwender „Jäger und Sammler“, die meinen, alle Dateien zu brauchen. Die IT muss dann Möglichkeiten finden, um diesen Datenbestand lange Zeit nachhaltig und kostengünstig aufzubewahren.

Zu warten, bis Festplatten größere Speicherkapazitäten ermöglichen, oder auf sinkende Preise von NAS- oder SAN-Netzwerkspeichern zu hoffen, ist keine nachhaltige Lösung. Langfristig sinnvoll sind dagegen intelligente und kombinierbare Speicherlösungen.

Speicherlösung auf mehreren Ebenen

Für einen kombinierten Speicher bietet sich ein Multi-Tiering-Storage-Modell an, wie es sich seit Jahren bereits bewährt hat. Im ersten Level – dem eigentlichen Tier 0 – kommt eine hochperformante Speicherlösung zum Einsatz. An dieser Stelle ist das Datenaufkommen eher gering und besteht in Regel aus Datenbanken oder entsprechenden Anwendungen. Dafür ist Tempo gefragt. Flash-

  • StrongLink Beschreibung
  • StrongLink Datenblatt
  • sind in diesem Bereich „State of the Art“. Im Tier 1 werden hochverfügbare NAS- oder SAN-Systeme genutzt. Dort liegt die Masse der Dateien und dort ist auch in vielen Fällen auch die meiste Kapazität vorhanden, die in einem Tier 3 Speicher wesentlich sinnvoller eingeplant wäre. Vor dem Tier 3 Speicher liegt noch der Tier 2 und damit das Backup. Auch ein hohes Backupaufkommen gehört in die Aufgabenstellung von „BigData“. Wer in der Lage ist, die nicht genutzten Dateien von Tier 1 auf einen anderen Speicher-Level zu bekommen, kann damit das Backup-Volumen reduzieren.

    3. Etage: „Big Data“

    Die erwähnten nicht genutzten Dateien sollten im Tier 3 liegen. Da es sich um den größten Anteil der Daten handelt, ist hier eine günstige und zuverlässige Speicherlösung gefragt.

    Das günstigste Medium ist bis heute immer noch das Band. Es ist vor allem in der Lage, große Datenmengen aufzunehmen. So kann ein LTO 5 Band 1.5 TB, ein LTO 6 Band bis zu 2.5 TB an Daten speichern. Für den zukünftigen Standard LTO 8 wird eine Kapazität von ca. 10 TB auf einem Band erwartet. Der Preis für das einzelne Band verändert sich dagegen kaum. Gerade im Tier 3 Speicher soll der administrative Aufwand gering gehalten werden. Am effektivsten ist daher ein System, das ohne großen Aufwand im Netzwerk bereit steht. Praktisch ist es, wenn das System sich als NAS – Network-Attached-Storage über Shares präsentiert. So können die Dateien leicht in das System migriert werden und weder Anwender noch Applikationen werden in der Nutzung eingeschränkt – im Normalfall merkt man nicht, dass es sich um ein Bandlaufwerk handelt. Das System führt das Band-Handling im Hintergrund durch. Wer mehr Kapazität braucht, legt einfach neue Bänder in die Library: In kürzester Zeit hat das System mehrere Terrabyte mehr Kapazität.

    Alle Dateien am richtigen Ort

    Nun geht es darum, die nicht genutzten Dateien zu migrieren: aus dem performanten Tier 1 Speicher in das Tier 3 Speichersystem, eine Kombination aus Platte und Band als NAS im Netzwerk. Hierzu kommt es auf den hauseigenen Workflow an. Wünscht man (1.) für die Anwender die volle Transparenz und den Zugriff auf die Dateien weiterhin über den Tier 1 Share? Arbeitet man (2.) Projekt basierend und will die Dateien projektbezogen in einem Langzeitspeicher ablegen? Oder besteht der Workflow aus (3.) einer Kombination aus beidem?

    Grundsätzlich gibt es für jeden dieser drei Anwendungsfälle eine geeignete Applikation, um die Dateien zu bewegen. Diese bieten individuelle Regelwerke für verschiedene Grade der Transparenz. Für transparente Migration verbleiben Platzhalter im Tier 1; für Projektarchive werden Daten in Containern gebündelt und über eine XML-Quittung dokumentiert. Beispiele sind das System HNAS des Herstellers HDS, Applikationen der DataGlobal oder PoINT oder die Software der Firma NTP für Isilon Systeme. Im Fall einer projektorientierten Ablage muss definiert werden, welche Dateien zu dem auszulagernden Projekt gehören. Eine Möglichkeit bietet die Firma DocuProtection mit der gleichnamigen Software an.

    Ordnung muss sein!

    Im Tier 3 sollte das bevorzugte System verschiedene Shares darstellen können, um jeden Anwendungsfall optimiert abzubilden. Bei der Nutzung mehrerer Shares sollte das System in der Lage sein, Bänder hinter einem Share zu gruppieren. Dadurch wird Daten-Mischmasch vermieden.

    Ein Beispiel für ein solches System ist die StrongBox der Firma Crossroads. Mit ihr werden die oben genannten Anforderungen erfüllt. Zusätzlich werden die eingesetzten Bänder ständig überwacht und überprüft, um die Lesbarkeit auch in Jahren noch sicherzustellen. Die StrongBox beschreibt die Bänder im standardisierten LTFS-Format. Damit ist gewährleistet, dass die Bänder jederzeit auch ohne das ursprüngliche System lesbar sind.

    Komplex und dabei günstig

    So komplex eine Multi-Tier-Lösung mit entsprechender Verwaltungssoftware einsetzbar ist, bleiben die Kosten begrenzt. Die Investition amortisiert sich relativ schnell. Es geht um eine nachhaltige Lösung: Jedes GB/TB, das nicht genutzt wird, verschwendet auf teurem schnellen Speicher das doppelte an Platz. Hinzu kommt das Backup. Tagtäglich werden aufwendig Dateien gesichert, die keiner nutzt. Ein gut durchdachtes Tiered-Storage-Modell spart dagegen Strom und schont das Klima. Der schnelle Speicher ist besser verfügbar und muss im Regelfall nicht mehr erweitert werden.

    Die Zukunft der Datensicherung kann nicht im permanenten Neuerwerb von Speichersystemen liegen. Diese Herausforderung kann nur durch die intelligente Umsetzung innovativer Konzepte gemeistert werden.

    Kategorien: Fachartikel