Wissenswertes zum
Forschungsdatenmanagement
Concat Forschungsdatenmanagement 2

Paradigmenwechsel: Renaissance der Tape-Archive

Was Sie in diesem Artikel erfahren:

Das Wachstum an unstrukturierten Daten ist ungebremst hoch: Jede Universität, jede Forschungseinrichtung und jedes Unternehmen produziert täglich solche Daten. Der größte Teil entsteht durch Forschung, Entwicklung und Datensammlung bzw. -analyse im Rahmen von KI- und Big-Data-Prozessen.

Unstrukturierte Daten müssen aus Sicherheitsgründen oftmals mindestens doppelt vorgehalten und lange fehlerfrei aufbewahrt werden. Das Mittel der Wahl für diese Aufbewahrung sind Scale-out-NAS-Systeme (z. B. vom Marktführer Dell Isilon, PowerScale) mit einem schnellen All-Flash/NVMe-Bereich zum produktiven Arbeiten und einem hochkapazitiven Archivbereich für die Langzeitaufbewahrung. Diese Systeme konnten mit den Daten mitwachsen, ohne dabei im gleichen Maße die Kosten steigen zu lassen – vor allem aus zwei Gründen:

1. Der Administrationsaufwand steigt im Verhältnis zur Kapazität nur minimal.

2. Noch wichtiger: Die Plattenkapazität stieg stetig, während die absoluten Kosten der Systeme weitgehend konstant blieben. Der Preis pro TB sank also effektiv oder anders ausgedrückt, man bekam für das gleiche Geld mehr Kapazität.

Speicherkosten für Archivdaten steigen spürbar

Punkt 1 gilt natürlich weiterhin. Aber Punkt 2 bereitet Sorgen. Seit gut zwei Jahren sinken die Preise nicht mehr oder nur noch in sehr geringem Umfang. Das sorgt dafür, dass die Kosten für das Speichern der Archivdaten – die Daten, die eigentlich nur aufbewahrt werden müssen – spürbar steigen.

Warum ist das so?

Am Ende ist es die weltweit explodierende Nachfrage bei nicht im gleichen Umfang steigenden Produktionskapazitäten. Hinzu kommen Unsicherheiten auf globalen Transportwegen (Suez-Kanal, Taiwan-Straße), die die Transportkosten mittelfristig verteuern.

Eine deutliche Preissenkung pro TB erleben wir nur noch bei Flash- und NVMe-Speichern. Hier kommen wir jedoch von einem so hohen Preisniveau, dass es noch Jahre dauern wird, bis All-Flash-Systeme als Archivspeicher kosteneffizient eingesetzt werden können – wenn es überhaupt jemals eintritt.

Kunden stehen vor einem Dilemma

Einige unserer Kunden können die Preisentwicklung abfedern und gemeinsam mit uns in harten Verhandlungen die Auswirkungen in Grenzen halten. Aber wie lange noch? Manche Institutionen stehen schon heute vor dem Dilemma, ihre Kapazitäten nicht mehr in ausreichendem Maße ausweiten zu können. Denn: Zusätzlich müssen auch Ausfallsysteme und Sicherungsinfrastrukturen betrieben werden – die preislich der gleichen Entwicklung unterliegen.

Was also tun?

Die aus unserer Sicht wahrscheinlichste und technisch sinnvollste Lösung ist, die monolithischen Scale-out-NAS-Systeme weiterzubetreiben, den Archivpart aber teilweise auszulösen. Wir werden in den nächsten Jahren eine Renaissance der Tape-Archive sehen, da diese ganz offensichtliche Vorteile bieten:

1. Energieeffizient: Sie sind die mit Abstand energieeffizienteste Form, Daten zu speichern. Das senkt die Betriebskosten enorm und leistet einen Beitrag zum Umwelt- und Klimaschutz.

2. Attraktiv im Preis: Ab einer Gesamtdatenmenge von mehr als ca. fünf Petabyte sind Tape-Libraries auch in der Erstanschaffung attraktiv.

3: Einfach handhabbar: Tapes sind transportabel und können heutzutage problemlos in NAS- oder S3-Speicherstrukturen eingebunden werden.

4: Niedrige Wartungskosten: Tape-Libraries lassen sich i. d. R. problemlos bei einem Third-Party-Maintenancer unter Wartung nehmen. Die Wartungskosten für einen Betriebszeitraum von z. B. zehn Jahren sind also nicht nur kalkulierbar, sondern auch niedrig.

Wann sind (Neu-)Investitionen in Tape-Archive sinnvoll?

Für große Datenmengen wird Tape ein immer mehr beachtetes Medium. Die Energie- und Betriebskosten sind unschlagbar niedrig, die Kapazitäten pro Höheneinheit im Rechenzentrum sehr hoch. Unsere Kunden stellen daher verstärkt die Frage, ob sich die Neuinvestition in eine Tape-Library für sie lohnt. Es gibt keine klare Antwort auf diese Frage, sondern nur ein „das kommt darauf an“.

Worauf?

Die Datenmenge: Fünf PB sollten es minimal sein, damit sich die Investitionen in zusätzliche Tape-Hardware rechnen. Tape-Libraries mögen auf den ersten Blick extrem preiswert und damit auch deutlich günstiger als Disk-Systeme erscheinen. ABER: Beachten Sie bitte, dass Sie hinsichtlich der Stellplätze im Durchschnitt maximal von einer 30-Prozent-Ausnutzung der Tape-Kapazitäten ausgehen sollten.

Darüber hinaus brauchen Sie mindestens sechs, besser acht Laufwerke, um nicht nur mit ausreichender Geschwindigkeit lesen und schreiben zu können, sondern auch genügend Ressourcen für Tape-Reorganisationen (sog. Co-Location) und die im späteren Betrieb unvermeidlichen Migrationen auf neuere Laufwerk- und Band-Generationen zu haben.

Vorsicht vor billigen Einstiegsangeboten

Eine Library sollte immer ausreichend Laufwerke für die interne Datenverwaltung bereitstellen, um eine übermäßige Datenfragmentierung zu verhindern – und damit gute Lese- bzw. Restore-Geschwindigkeiten zu bieten. Wenn Sie die Library für unterschiedliche Zwecke nutzen (z. B. Datensicherung, Datenarchiv), ist auch eine Partitionierbarkeit wichtig. Lassen Sie sich bitte nicht von billigen Einstiegsangeboten blenden, sondern ein belastbares Sizing erstellen, das dann auch lange hält.

Die Medienbruch-Strategie: Nicht ohne Grund empfiehlt das BSI, einen Medienbruch in der Datenhaltung zu berücksichtigen, um optimaler gegen Ransomware-Attacken, im Speziellen gegen Verschlüsselung geschützt zu sein. Dies kann über Objektspeicher, Public-Cloud-Anbieter oder Tape erfolgen. Welche Strategie ein Kunde bevorzugt, hängt von sehr individuellen Entscheidungen beim Anwender ab.

Vorhandene Hardware: Wenn Sie bereits mit Tape-Libraries in der Datensicherung arbeiten, kann es (je nach Modell, Laufwerkstyp und Alter) sinnvoll sein, diese für die Datenarchivierung zu erweitern. Achten Sie dann jedoch immer darauf, dass die sechs bis acht Laufwerke für die Archivlösung ebenso zusätzlich in der Library unterzubringen sind, wie die nötigen Stellplätze. Außerdem ist es zwingend erforderlich, dass die Library partitionierbar ist, was häufig nur bei (entsprechend teuren) Enterprise-Libraries möglich ist.

Welche Tape-Hardware ist zu empfehlen?

Mit Ausnahme von Huawei haben nahezu alle Hardwarehersteller kleinere Tape-Libraries als OEM-Produkt im Sortiment. Diese reichen jedoch für ein langfristig zu betreibendes Archiv eher nicht aus. Die Anzahl der Stellplätze und der maximal zu verbauenden Laufwerke ist meist zu limitiert.

Also müssen wir gemeinsam auf den Markt der Enterprise-Libraries schauen. Hier finden sich vor allem drei Anbieter: IBM, Spectra Logic und Quantum. Letzterer bietet oftmals die günstigste Lösung. Vor allem Spectra Logic überzeugt unserer Meinung nach mit technisch innovativen Produkten und einer weiterhin eigenständigen Forschung und Entwicklung.

Natürlich stehen unsere kaufmännischen und technischen Experten mit Rat, Tat und Total-Cost-of-Ownership Kalkulationen gern zur Verfügung, um die Entscheidung für oder gegen eine bestimmte Lösungsstrategie beratend zu begleiten.

Welche Archivsoftware ist zu empfehlen?

Längst nicht alle Softwareprodukte zur Datenarchivierung können mit Tape-Libraries umgehen. Eine Archivierung auf Festplattensysteme ergibt jedoch wenig Sinn, da nicht nur die Kosten der Anschaffung eine Rolle spielen, sondern vor allem die Betriebs- (Strom, Klima) und Wartungskosten auf lange Sicht deutlich höher sind und die gebotenen Performancevorteile oft nicht benötigt werden.

Wenig überraschend landet man häufig bei den Anbietern von Enterprise-Tape-Libraries, die allesamt entsprechende Softwareprodukte zur Verfügung stellen. Sie finden hauptsächlich Lösungen von IBM (Spectrum 2 Scale), Quantum (StorNext) und Spectra Logic (Black Pearl). Alle drei Lösungen haben den Nachteil, dass sie nicht besonders modern sind und nur mit der Hardware desselben Herstellers einwandfrei unterstützt werden. Mit Versity gibt es jedoch einen Softwareanbieter, der den vollen Funktionsumfang bietet und gleichzeitig herstellerunabhängig bzgl. der Hardware ist.

Sie haben hier also die freie Auswahl, welchen Tape-Anbieter Sie bevorzugen und können die Hardware exakt so aufbauen, dass Sie Ihren Anforderungen hinsichtlich Performancestufen genügen.

Wie so etwas aussehen kann, erläutern wir gern in einem persönlichen oder virtuellen Gespräch.

Weiterführende Informationen

Blog-Artikel: Forschungsdatenmanagement: Struktur und Sicherheit im täglichen Datenwahnsinn

Modernes Forschungsdatenmanagement: Forschungsdatenmanagement von Experten ✔️ Concat AG

weitere Artikel , die Sie interessieren könnten
Mit mehr als 30 Jahren Erfahrung und unserem starken Team bringen wir immer Höchstleistungen.
Wie kann man diesen Datenwahnsinn in den Griff bekommen?
Mit mehr Ressourcen, mehr Zeit, mehr Budget. Klingt logisch, ist aber oft nicht umsetzbar.
Die Concat AG und ihre Partner bieten hier smarte Lösungen.
4,7
Sterne bei
Google
1,5
Wochen bis
zur Installation
98%
aller Kunden
geben uns Note 1
#1
unter den Datensystemen
in der Forschung
Unsere Welt ist der Datenwahnsinn. Wir sind Ihr Ansprechpartner für Forschungsdatenmanagement. Seit über 30 Jahren realisieren wir komplexe, vernetzte Projekte als Basis für Ihre Geschäftsanwendungen. Gleichzeitig sind wir flexibel genug, um auf die individuellen Anforderungen jedes einzelnen Kunden einzugehen.

© 2023 Concat AG – IT Solutions | All Rights Reserved