michelangelus - Fotolia

Storage für unstrukturierte Daten: Drei Herausforderungen

Volumen, Vielfalt und Wert machen die Sicherung unstrukturierter Daten schwierig. So unterstützen einige Anbieter Unternehmen, Kontrolle über wachsenden Datenspeicher zu erhalten.

Unstrukturierte Daten sind alles, was nicht in die übersichtlich angeordneten Zeilen und Spalten einer Datenbank passt. Es kann ein Dateiserver sein, der zu einem Ablageplatz für alle Word-Dokumente, Excel-Tabellen und PowerPoint-Präsentationen geworden ist, die ein Unternehmen verwendet. Es kann auch Fotos, Videos, E-Mail-Nachrichten und andere Formate umfassen.

Seit Jahren kämpfen IT-Profis darum, Wege zu finden, mit unstrukturierten Daten umzugehen. Die drei wichtigsten Herausforderungen bei der Speicherung unstrukturierter Daten, denen sie am meisten ausgesetzt sind, sind die folgenden:

  1. Das schiere Volumen an unstrukturierten Daten und das weiterhin ungebremste Wachstum.
  2. Ständig tauchen neue Arten von unstrukturierten Daten auf. Beispielsweise müssen die Protokolldateien der IoT-Geräte irgendwo abgesichert werden.
  3. Ohne eine Möglichkeit, unstrukturierte Daten besser zu verwalten und zu analysieren, verbraucht es Speicherkapazität, ohne einen Mehrwert zu schaffen. Im Allgemeinen machen es Speichersysteme nicht einfach, unstrukturierte Daten nach der Speicherung zu finden.

In den letzten Jahren haben IT-Anbieter versucht, Unternehmen dabei zu unterstützen, unstrukturierte Daten besser zu verstehen und sie nutzbar und wertvoller zu machen. Wir sehen jetzt die Ergebnisse einiger dieser Bemühungen. Nachfolgend finden Sie Ansätze, mit denen einige Anbieter die Herausforderungen bei der Datenspeicherung solcher Datensätze angehen.

Diese Arten der unstrukturierten Daten gibt es.
Abbildung 1: Diese Arten der unstrukturierten Daten gibt es.

Der Kampf mit dem Wachstum

Wie bereits erwähnt, ist das schiere Datenvolumen etwas, mit dem Unternehmen seit Jahrzehnten zu kämpfen haben. Dieses Problem wird sich nicht so schnell lösen, zumal Unternehmen vermehrt Daten für Analysen, künstliche Intelligenz und maschinelles Lernen benötigen und auch sammeln wollen. Die Herausforderung besteht darin, einen Weg zu finden, wie man kontinuierlich skalieren kann, um den unstillbaren Appetit auf mehr Daten zu befriedigen.

Unternehmen wie Pure Storage haben eigens für dieses spezifische Problem spezielle Geräte entwickelt. Pures FlashBlade bietet ein skalierbares System, das speziell entwickelt wurde, um unstrukturierte Datenspeicherung zu unterstützen und einige Herausforderungen bei der Datenspeicherung zu bewältigen. Dank der Unterstützung gängiger Protokolle, einschließlich NFS, S3 und SMB, kann FlashBlade problemlos in die meisten Umgebungen integriert werden.

Umgang mit der Vielfalt

Zu wissen, was in unstrukturierten Daten steckt, kann ebenfalls ein großes Sicherheitsrisiko darstellen. Dateien werden gesichert, die Kreditkarten- und Sozialversicherungsnummern und andere Persönlich Identifizierbare Informationen (PII) enthalten. Oftmals gibt es kein übergreifendes Management, das darüber wacht, was gespeichert wird. Mindestens alles, was PII enthält, sollte verschlüsselt werden, aber selbst das passiert nicht immer.

Die Herausforderung bei unstrukturierten Daten besteht darin, dass es so viel davon gibt, und sie verschiedenen Personen auf unterschiedliche Weise divergierende Werte bieten.

Einige Anbieter haben Schritte unternommen, um das PII-Problem zu lösen. Cohesity bietet beispielsweise eine sekundäre Speicherplattform, die alle unstrukturierten Daten aufnimmt, indexiert und Probleme identifiziert. Durch die Mustererkennung findet und löscht Cohesity Dateien mit sensiblen PII, was eine engere Einhaltung von Best Practices und in vielen Fällen Compliance-Anforderungen ermöglicht. Die Indexierungs-Engine von Cohesity hilft Unternehmen auch, einen Wert in ihren Daten zu finden.

Die Scale-Out-Architektur und die Indizierungs-Engine von Cohesity adressieren das Volumen, die Vielfalt und den Wert unstrukturierter Datenspeicher. Es bietet auch einen klaren Ansatz für die Plattformfrage, da es zu einer sekundären Plattform an sich wird.

Werte erkennen und nutzen

Um Einblick in unstrukturierte Daten zu erhalten, ist eine Kombination von Tools und Teams erforderlich. Eine Person, die es alleine macht, wird wahrscheinlich nicht in der Lage sein, alle Datenprobleme eines Unternehmens zu lösen. Der Datenwert kann durch Mining oder die Platzierung unstrukturierter Daten in Workflows abgeleitet werden, die Geschäftsprozesse und -ergebnisse verbessern.

Die Hauptfragen zu unstrukturierten Daten
Abbildung 2: Die Hauptfragen zu unstrukturierten Daten.

NetApp begegnet dieser Herausforderung mit dem Einsatz von StorageGrid, einem massiv skalierbaren Objektdatenspeicher in der hybriden Cloud, der organisationsübergreifende automatisierte Workflows ermöglicht. So können Sie beispielsweise einen Workflow für Mediendateien erstellen, der einige auf einen kostengünstigeren Speicher, andere auf einen leistungsfähigeren Speicher oder einen Ort für die Aktion eines bestimmten Teams verschiebt.

Das Gesamtbild

Die Herausforderung bei unstrukturierten Daten besteht darin, dass es so viel davon gibt, und sie verschiedenen Personen auf unterschiedliche Weise divergierende Werte bieten. Die oben genannten Produkte sind nur drei von Hunderten von Anbietern, die an den kritischen Herausforderungen der unstrukturierten Datenspeicherung arbeiten.

Nächste Schritte

Die Speicheranforderungen unstrukturierter Daten

Warum die Analyse unstrukturierter Daten immer wichtiger wird

Die Verbreitung unstrukturierter Daten erfordert eine neue Art des Storage

Erfahren Sie mehr über Storage Management

ComputerWeekly.de
Close