Suche
Was ist Objektspeicher?

Objektspeicher im Fokus: Vorteile und die Unterschiede zu Block- und Dateispeicher

Carsten Graf

© Shutterstock / Bedrin

Die Menge zu speichernder Daten wächst überall exponentiell an. Soweit nichts Neues. Würde man sich die Mühe machen und sich die Daten einmal genauer ansehen, würde man schnell schlussfolgern: Es sind hauptsächlich unstrukturierte Daten, die den Datenberg so immens wachsen lassen.

Die generelle Datenflut ist schon problematisch genug. Unstrukturierte Daten verschärfen die Situation um ein Vielfaches, da sich bestehende NAS- oder SAN-Infrastrukturen für die Verwaltung solch einer Menge an unstrukturierten Daten nicht besonders gut eignen. Backup und Wiederherstellung dauern länger, Migrationen auf neue Systeme sind aufwändig und die zeitintensive Provisionierung von Speicher für Nutzer muss häufiger durchgeführt werden. Wie kann man da Abhilfe schaffen? Mit Objektspeicher! Objektspeicher bietet im Kampf gegen die Datenflut gegenüber bisherigen Technologien viele Vorteile. Vor allem punktet diese Technologie in Zeiten explodierender Datenmengen in Sachen Skalierung. Unmissverständlich eine Hauptforderung an bestehende Speichertechnologien.

Bisherige Standards der Speicherung: Block- und Filespeicher

Datei- und Blockspeicher sind Verfahren zum Speichern von Daten auf NAS- und SAN-Speichersystemen. Ein NAS stellt seinen Speicher als Netzwerk-Dateisystem zur Verfügung. Wenn Geräte an ein NAS-System angeschlossen sind, wird ein mountfähiges Dateisystem angezeigt und Benutzer können mit korrekten Zugriffsrechten auf ihre Dateien zugreifen. Aus diesem Grund muss ein NAS-System Benutzerrechte, Dateisperren und andere Sicherheitsmaßnahmen verwalten, damit mehrere Benutzer auf Dateien zugreifen können. Der Zugriff auf den NAS erfolgt über die Protokolle NFS und SMB/CIFS. Wie bei jeder Server- oder Speicherlösung ist ein Dateisystem für die Positionierung der Dateien im NAS verantwortlich. Das funktioniert sehr gut bei Hunderttausenden oder sogar Millionen an Dateien, aber nicht mehr bei Milliarden.

Die Blockspeicherung funktioniert ähnlich. Doch im Gegensatz zur Dateispeicherung, bei der die Daten auf Dateiebene verwaltet werden, werden hierbei die Daten in Datenblöcken gespeichert. Mehrere Blöcke – etwa in einem SAN-System – bilden eine Datei. Ein Block besteht aus einer Adresse und die SAN-Anwendung erhält den Block, wenn sie eine SCSI-Anfrage an diese Adresse stellt. Die Speicheranwendung entscheidet dann, wo die Datenblöcke innerhalb des Systems auf welcher Festplatte oder welchem Speichermedium liegen. Wie die Blöcke schließlich kombiniert werden und wie man darauf zugreift, entscheidet die Speicheranwendung. Blöcke in einem SAN haben keine Metadaten, die sich auf das Speichersystem oder die Anwendung beziehen. Mit anderen Worten: Blöcke sind Datensegmente ohne Beschreibung, Zuordnung und ohne Eigentümer der Speicherlösung. Alles wird von der SAN-Software gesteuert und kontrolliert. Aus diesem Grund wird SAN- und Blockspeicher oft für leistungshungrige Anwendungen wie Datenbanken oder für Transaktionen verwendet, da auf die Daten zugegriffen, geändert und gespeichert werden kann.

Beide Methoden zur Datenspeicherung haben sich über Jahre hinweg bewährt. Warum braucht es also ein weiteres Konzept?

Blockchain Whitepaper 2018

Free: Blockchain Technology Whitepaper

If building a blockchain from scratch is beyond your current scope, the blockchain technology whitepaper is worth a look. Experts from the field share their know-how, tips and tricks, development advice, and strategy for becoming a blockchain master.

80 Prozent unstrukturierte Daten müssen verwaltet werden

Lösungen für Datei- und Blockspeicherung müssen die Funktionalität der Benutzerzugriffsrechte implementieren, damit sie Änderungen an den Daten vornehmen können. Der größte Teil der heutzutage zu speichernden Daten sind unstrukturierte Daten, also Inhalte oder Materialien, die nie wieder geändert werden. Der Anteil unstrukturierter Daten liegt weltweit bei etwa 80 Prozent, bei einzelnen Organisationen je nach Anwendungsportfolio entsprechend weniger. Bei einer solch hohen Menge an Daten und dem immer größer werdenden Anteil unstrukturierter Daten wiegen die Nachteile, der für diese Daten schlecht geeigneten Technologien Block- und Filespeicher immer schwerer. Hier kommt die Objektspeicherung ins Spiel.

Objekte in der Objektspeicherung sind „gebündelte Daten“ (auch bekannt als Datei) mit entsprechenden Metadaten. Dieses Objekt erhält eine eindeutige ID (Identifier), die aus dem Dateiinhalt und den Metadaten berechnet wird. Anwendungen identifizieren das Objekt über diese ID. Die vielen Objekte innerhalb eines Objektspeichersystems werden auf den angegebenen Speicherplatten gespeichert. In seiner reinen Form kann die Objektspeicherung „nur“ eine Version einer Datei (eines Objekts) speichern. Wenn ein Benutzer eine Änderung vornimmt, wird eine andere Version der gleichen Datei als neues Objekt gespeichert. Aus diesem Grund ist ein Objektspeicher eine perfekte Lösung für eine Backup- oder Archivlösung. Oder zum Beispiel Speicher, der große Mengen an Videos oder Filmen enthält, die nur angesehen, aber nicht verändert werden, wie z.B. Online-Filmstreaming-Seiten oder Videos auf YouTube.

Ohne Dateisystem, keine Hierarchien

Der Hauptunterschied zu den anderen Konzepten besteht darin, dass die Objekte über die Anwendung selbst verwaltet werden, die die Objektspeicherung unterstützt. Das bedeutet, dass hier kein Dateisystem benötigt wird. Objekte sind im Gegensatz zu Dateien nicht hierarchisch verwaltet. Jedes Objekt befindet sich auf der gleichen Ebene in einem Speicherpool. Eine Anwendung, die Objektspeicherung verwendet, sendet eine Speicheranfrage an die Lösung, wo das Objekt gespeichert werden soll. Das Objekt erhält dann eine Adresse innerhalb des riesigen Speicherplatzes und wird dort von der Anwendung selbst gespeichert.

Aufgrund der viel einfacheren Verwaltung von Daten – ohne ein Dateisystem – können Objekt-Speicherlösungen viel einfacher skaliert werden als Dateispeicher oder Blockspeicher-basierte Systeme. Man fügt einfach einige Festplatten in die Lösung ein und es ist keine große Verwaltung mehr erforderlich, um mehr Speicherplatz zu haben. Die ist in Zeiten exponentiellen Datenwachstums der größte Vorteil von Objektspeicher. Damit ist Objektspeicher eine perfekte Lösung für große Datenmengen und daher setzten heute schon viele Unternehmen, vom Mittelstand bis zu großen Cloud-Service-Providern wie Amazon und Google auf Objektspeicher.

S3 als Industriestandard für Objektspeicherung

Als Industriestandard für Objektspeicher hat sich de facto S3 entwickelt. So gut wie jede Applikation basiert heutzutage auf diesem Standard. Das von der Storage Industry Networking Association (SNIA) entwickelte und definierte CDMI hat kaum Verbreitung gefunden. OpenStacks Swift gewinnt hingegen bei Herstellern an Popularität, um Kompatibilität ihrer Produkte mit OpenStack Nova herzustellen.

Es gibt viele Gründe, warum kontinuierlich mehr und mehr Daten gespeichert werden müssen, hauptsächlich unstrukturierte Daten. Die Datenmenge hat längst die Zettabyte-Grenze überschritten und es stellt sich generell die Frage, wie Daten zukünftig überhaupt effizient gespeichert, verwaltet und genutzt werden können. Objektspeicher gibt Antworten auf viele der heutigen Fragen.

Verwandte Themen:

Geschrieben von
Carsten Graf

Carsten Graf ist Sales Director DACH bei Cloudian Inc.

Kommentare

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
400
  Subscribe  
Benachrichtige mich zu: