sakkmesterke - stock.adobe.com

So sichern Sie unstrukturierte Daten effizient

Die meisten aktuellen Daten sind unstrukturiert, und Storage-Profis haben oft Probleme damit. Eine effiziente Sicherung dieser Daten möglich, wenn man weiß, worauf man achten muss.

Die Speicherung unstrukturierter Daten ist eine der größten Herausforderungen für den Speicher beziehungsweise für Storage-Administratoren. Einige technologische Fortschritte haben eben den Nachteil, dass sie enorme Datenmengen erzeugen, die verwaltet, gespeichert und analysiert werden müssen.

Der Umgang mit unstrukturierten Daten ist jedoch keineswegs unmöglich, und die Zahl der Anbieter steigt stetig, um die Bedürfnisse von Unternehmen zu erfüllen, die mit vielen dieser Daten arbeiten. Die Speichertechnologie entwickelt sich ebenfalls weiter, und mit den richtigen Speichersystemen und -praktiken ist ein effizientes Arbeiten mit unstrukturierten Daten möglich.

Im Folgenden beantworten wir fünf häufig gestellte Fragen zur Speicherung unstrukturierter Daten. Diese fünf Punkte sollen helfen, das Beste aus unstrukturierten Daten herauszuholen und sie effizient zu sichern.

Was sind unstrukturierte Daten?

Wie der Name schon sagt, entsprechen unstrukturierte Daten nicht einer traditionellen Struktur, wie beispielsweise Daten aus Finanzsystemen und Geschäftsanwendungen. Während sich strukturierte Daten für starre Formate wie Datenbanken eignen, sind unstrukturierte Daten in vielen Formen zu finden. Beispiele für unstrukturierte Daten sind Bilder, Textdateien, Sensordaten und E-Mails.

Die unstrukturierte Natur dieser Dateien hat ihre Vorteile, wie zum Beispiel die Möglichkeit, dass Analyseteams mit Daten arbeiten können, ohne diese vorher zu standardisieren, was zu einer umfassenderen Analyse führen kann. Fortschritte im Bereich des maschinellen Lernens und der künstlichen Intelligenz erleichtern die Kennzeichnung und Kategorisierung unstrukturierter Daten, so dass Informationen leichter zugänglich und weniger beängstigend sind.

Was sind die größten Probleme bei der Speicherung unstrukturierter Daten?

„Abschreckend“ ist ein Wort, das verwendet werden könnte, um die Mengen an unstrukturierten Daten zu beschreiben. Unstrukturierte Daten machen den größten Teil der heute produzierten Daten aus, und es gibt eine Menge davon. Die drei größten Hindernisse für unstrukturierte Datenspeicherung sind Volumen, Vielfalt und Wert.

Anstatt ein starres Format zu verwenden, nutzen Objektspeicher-Systeme Metadaten, um die Daten zu beschreiben und sie nach Attributen wie Name, Erstellungsdatum und Ort zu sortieren.

Da unstrukturierte Daten aus Dateien wie Audio-, Video-, Bild- und sogar Social-Media-Daten bestehen, ist es leicht zu verstehen, warum die schiere Menge eine Herausforderung ist. Glücklicherweise gibt es eine Reihe von Anbietern im Bereich der Speicherung unstrukturierter Daten, darunter Dell EMC, Pure Storage, Scality, Igneous Systems und Red Hat.

In Anbetracht der Vielzahl von Datentypen kann die Vielfalt zu großen Sicherheitsproblemen führen, wenn sie nicht korrekt gehandhabt wird. Bei so vielen gespeicherten Daten können die Datentypen – einschließlich personenbezogener Daten, Kreditkartennummern und Sozialversicherungsnummern – nicht berücksichtigt werden.

Ebenso kann der Wert der Daten verloren gehen, wenn man mit so vielen davon arbeitet. Es gibt einen Wert in unstrukturierten Daten, aber die Nutzung dieser Informationen kann schwierig sein. Anbieter wie Cohesity und NetApp bieten Produkte an, die Ihnen helfen können, die Daten effizient zu sortieren und darauf zu achten, was sie enthalten.

Welches Storage-System eignet sich am besten unstrukturierter Daten?

Sowohl NAS als auch Objektspeicher haben ihre Vorteile, wenn es um unstrukturierte Datensicherung geht. NAS ist ein traditionelles und zuverlässiges Speichersystem, und sein hierarchisches und organisiertes Format sorgt dafür, dass Dateien kategorisiert und leicht durchsucht werden können. NAS-Systeme sind schnell, benutzerfreundlich und werden von vielen Herstellern angeboten. Allerdings fehlt dem NAS die Skalierbarkeit, zumindest im Vergleich zum Object Storage.

Anstatt ein starres Format zu verwenden, nutzen Objektspeichersysteme Metadaten, um die Daten zu beschreiben und sie nach Attributen wie Name, Erstellungsdatum und Ort zu sortieren. Die Objektspeicherung ist hochskalierbar, was die Kapazitätssteigerung erleichtert. Allerdings ist es wahrscheinlicher, dass die Performance in einem Objektspeichersystem fehlt. Während die Objektspeicherung einen Vorteil zu haben scheint, gibt es Vor- und Nachteile für beide Speichersysteme.

Unstrukturierte Daten können in verschiedenen Formaten auftreten.
Abbildung 1: Unstrukturierte Daten können in verschiedenen Formaten auftreten.

Was ist mit Flash-Speicher?

Wenn Sie Ihrem Speichersystem eine Performance-Optimierung geben möchten, lohnt es sich vielleicht, in Flash zu investieren, um unstrukturierten Daten zu verwalten.

Die Flash-Kosten sinken weiter, so dass die schnelle Alternative zu Festplatten eine sinnvolle Option für mehr Workloads ist. Da Object Storage oft nicht genug Performance bietet, kann die Verwendung von Hybrid- oder All-Flash-Systemen die Sache erheblich beschleunigen.

Neben einer besseren Leistung verbrauchen Flash-basierte SSDs weniger Energie und benötigen weniger Platz. Während die Preise jedoch sinken, ist Flash-Speicher immer noch eine teure Option. Bevor Sie Flash zu Ihrer unstrukturierten Datenspeicherstrategie hinzufügen, sollten Sie Ihr Unternehmen bewerten und sicherstellen, dass es sich um eine sinnvolle Investition handelt.

Kann Storage Tiering helfen?

Storage-Tiering ist nichts Neues, aber die Notwendigkeit eines angemessenen Tierings hat mit dem Anstieg unstrukturierter Daten an Bedeutung gewonnen. Mit automatisiertem Storage-Tiering können Sie unstrukturierten Daten Kategorien zuweisen, indem Sie sie so organisieren, dass häufig abgerufenen Daten leicht verfügbar sind, während weniger wichtige (aber dennoch notwendige) Daten etwas nach hinten verschoben werden. Bei einer so großen Vielfalt an Datentypen unter dem unstrukturierten Dach kann eine solche Priorisierung die Performance verbessern und die Speicherkosten senken.

Erfahren Sie mehr über Storage Management

ComputerWeekly.de
Close