Daten zur richtigen Zeit am richtigen Ort

1. Juni, 2021
08:18

Facebook X LinkedIn Reddit WhatsApp Pocket

Die Flut an strukturierten und unstrukturierten Daten nimmt immer weiter zu, und so die Notwendigkeit bei fast gleichbleibenden Budgets immer mehr Speicher bereit zu stellen. Vor allem unstrukturierte Daten wachsen überproportional und wecken Begehrlichkeiten: primär nach günstigem Speicher, am besten in rauen Mengen.

So hat sich Objektspeicher schnell neben Block- und File-basiertem Storage etabliert. Doch nicht jede Speicherform eignet sich für jede Anforderung und isolierte Lösungen enden schnell in Sackgassen.

Um Daten adäquat zu speichern, stehen für alle drei Ansätze HDD und SSD in unterschiedlichsten Ausprägungen zur Verfügung. Unabhängig davon, ob sie lokal, verteilt oder in der Cloud genutzt werden, haben Block-, Datei- und Objektspeicher Vor- und Nachteile. Wo also liegen die Unterschiede?

Blockspeicher: Suche nach Verfügbarkeit und Performance

Blockspeicher kann als Basiselement aller drei Speicherformen gesehen werden. In Reinform wird er primär für strukturierte Daten verwendet, da für sie der Fokus auf vielen kleinen Datenänderungen mit höchstmöglicher Performance bei niedriger Latenz und permanenter Verfügbarkeit liegt. Auf Blockspeicher greift man im Regelfall über SAS, SATA, FC, iSCSI oder NVMe zu.

Typische Anwendungsgebiete liegen bei sich permanent ändernden Daten und Anwendungen mit zufälligen Lese-Schreib-Vorgängen, also etwa Datenbanken oder geschäftskritischen Applikationen wie ERP-Systeme. Typische Installationsgrößen liegen heute zwischen 10 und 200 Terabyte. Ausnahmen, vor allem nach oben, bestätigen die Regel.

File-basierter Speicher: Verwaltbarkeit im Fokus

Beim Dateispeicher dagegen liegt der Schwerpunk auf Kollaboration, für den geteilten Zugriff auf häufig von Nutzern veränderte Daten. Der Zugriff erfolgt üblicherweise mittels eines hierarchischen Dateisystems über NFS- und SMB-Protokolle, wie sie von Network Attached Storage (NAS) lokal oder auch in der Cloud genutzt werden. Der Schwerpunkt liegt hier auf der einfacheren Verwaltbarkeit der Daten in Dateiform, neben Performance und Verfügbarkeit. Erreicht wird das über die Dateisysteme, mit denen der nicht direkt ansprechbare darunterliegende Blockspeicher verwaltet wird. Installationen reichen typischerweise von etwa 20 Terabyte bis in den unteren Petabyte-Bereich. Auch hier gibt es regelmäßig Ausnahmen in beide Richtungen.

Objektspeicher: Für verteilten Zugriff

Etwas anders verhält es sich bei großen, unstrukturierten Datenmengen wie etwa Streaming-Videodaten, Bilddatenbanken und Datensätzen für die Analyse für Maschinenlernen (ML) und künstliche Intelligenz (KI). Bei Objektspeichern erfolgt der Datenzugriff ohne Dateisystem direkt auf einzelne Dateien mittels S3- oder http-Protokollen.

Objektspeicher kümmert sich um die Bereitstellung und Archivierung von Daten, die sich selten oder nicht ändern und ermöglicht deren verteilte Nutzung. Bei der Veränderung von Inhalten, sollten es auch nur ein Byte sein, wird in der Regel das bestehende Objekt komplett ersetzt. Das wirkt sich nicht gerade positiv auf die relative Schreibperformance aus, ermöglicht aber das einfache Verwalten und auch Bereitstellen großer Datenmengen für eine verteilte Nutzung.

Installationen finden sich in Bereichen ab 100 Tera- bis zu hunderten Petabyte. Aus Kostensicht ist Objektspeicher die preisgünstigste (Preis pro TB) der drei Speicherformen. Zudem lässt er sich relativ einfach als aktives Archiv an Dateispeicher anschließen.

Die üblichen Formen Daten zu speichern. Bild: DataCore Software

On-premises, Cloud oder die Qual der Wahl?

Nun bietet der Markt diverse Lösungen, um unterschiedliche Anforderungen abzubilden. Nicht zuletzt muss der Speicher in Bezug auf Verfügbarkeit, Performance und Kapazität skaliert werden können, und zwar zu akzeptablen Kosten. Anhänger der Cloud loben die gute Skalierbarkeit, und die derzeit beliebte Umschichtung von Investitions- auf Betriebskosten. Offen bleiben jedoch die dauerhaften Kosten sowie die Umsetzbarkeit sehr individueller Datensicherheits- und Compliance-Anforderungen.

Klassische Alternativen sind dedizierte (On-premises-) Speichersysteme, die häufig als „Enterprise Speichersysteme“ vermarktet werden. Sie bieten lokale Datensicherheit und -hoheit. Bei der Implementierung muss aber ein erheblicher Aufwand betrieben werden, etwa bei der Datenmigration zwischen verschiedenen Herstellern. Sie resultieren schnell in Silo- Architekturen mit diversen Plattformabhängigkeiten und einer Nutzungsdauer mit drei bis fünf Jahren. Und dann?

Alternative SDS

Als Alternative zu den erwähnten Ansätzen bieten sich Software-Defined Storage (SDS)-Lösungen. Die entscheidende Frage: Wieviel muss man denn von welchem Speicher wo genau haben? Mit den passenden Software-Defined Storage-Lösungen können Unternehmen ihre Ressourcen frei wählen, auch vorhandene Ressourcen nutzen und dies jederzeit ändern. Egal ob Block-, File- oder Objektspeicher – lokal, verteilt oder in der Cloud, kann die Zuordnung der Daten zur Speicherphysik individuell an die jeweiligen geschäftlichen Anforderungen angepasst werden. Einen entsprechenden Ansatz verfolgt DataCore mit SDS-Plattformen für jede der drei Speicherdisziplinen. Das sind SANsymphony für Blockspeicher, vFilO für Dateispeicher und neuerdings Swarm für Objektspeicheranforderungen. Die drei Spezialisten gewährleisten bereits heute für jede Anforderung die optimale Lösung.

Swarm: Mehr als „Nur“ Objektspeicher

DataCore Swarm ist eine On-Premises- Objektspeicherlösung, die die Verwaltung, die Speicherung und den Schutz der Daten vereinfacht und dabei S3-/ http-Zugriff für jede Anwendung, jedes Gerät und jeden Endnutzer bietet. Swarm verwandelt Datenarchive in eine flexible, sofort abrufbare Content-Bibliothek, die dezentrale Arbeitsabläufe, bedarfsabhängigen Zugriff und massive Skalierbarkeit ermöglicht. Zudem kann Swarm direkt mittels NFS und SMB als aktives Archiv genutzt werden. Dies wird durch SwarmFS (NFS) und DataCore FileFly (SMB) erreicht.

Einige Eigenschaften von DataCore Swarm:

Einfaches Management, automatisierte Aufgaben
Ein Admin kann in Teilzeit mehr als 50 PB und tausende Mandanten verwalten
90 Sekunden um zusätzliche Kapazität oder Performance hinzuzufügen
Kein darunterliegendes Betriebssystem oder Datenbank zu verwalten
95 Prozent der Speicherkapazität ist ausschließlich für Daten
Die Hardware (CPU, RAM, HDD, SSD…) kann beliebig gemischt werden
Erasure Coding und Replikas auf derselben HW – patentierte Technologie
Self-Service für Endbenutzer über das Inhaltsportal
Speichern, suchen und teilen von Dateien mit jedem Gerät
Teilbereiche von Dateien (Video Clipping) direkt aus Swarm herauslesen
Metadaten hinzufügen, bearbeiten, indizieren und zur Suche verwenden

Neues Objekt der Begierde

Swarm eignet sich für diverse Einsatzgebiete wie Medien und Unterhaltung, High-Performance Computing, Archive im Gesundheitswesen, öffentliche Einrichtungen, sekundäre Speicherplattform in Unternehmen, Hybrid Cloud und so weiter. Die SDS-Plattform beseitigt Komplexitäten und vereinfacht das Infrastruktur- und Mandantenmanagement mit Object-Storage, dem neuen Objekt der Begierde am Speicherhimmel.

Daten zur richtigen Zeit am richtigen Ort

Blockspeicher: Suche nach Verfügbarkeit und Performance

File-basierter Speicher: Verwaltbarkeit im Fokus

On-premises, Cloud oder die Qual der Wahl?

Alternative SDS

Swarm: Mehr als „Nur“ Objektspeicher

Neues Objekt der Begierde

Alfons

Michels

Weitere Artikel

Events

Jobs

Meistgelesene Artikel

Trade Republic erneut down: Tausende Störungsmeldungen

Trade Republic down: Investment-App kämpft mit Störungen

Cyberangriff auf Arbeitsamt: Hacker wollten ans Arbeitslosengeld

X down – schon wieder! Tausende Nutzer melden Störungen

Wegen US-Zöllen: Baerbock fordert 10 Cent pro iPhone-Update

IT Verlag

Wichtige Links

Kontakt