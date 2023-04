Unternehmen generieren Metadaten so schnell, dass dies zu einer der größten Herausforderungen für Big Data geworden ist. Es ist jedoch nicht immer klar, wie und wo all diese Informationen am besten gespeichert werden sollen.

Vieles hängt davon ab, wie Unternehmen die Metadaten verwalten und nutzen und ob sie diese von den Primärdaten trennen. Viele Firmen legen ihre Metadaten in einem zentralen Repository ab, um die Abläufe zu verbessern und die Informationen besser nutzen zu können. Daher steht die Frage der Metadatenspeicherung im Mittelpunkt des Interesses.

Die Nutzung von Objektspeichern nimmt zu. Berücksichtigen Sie die Tatsache, dass Metadaten für Objektspeicher in hohem Maße anpassbar sind, was die Gesamtdatenmenge erhöhen kann. Legen Sie fest, ob die Metadaten als Binär - oder Textdaten gespeichert werden sollen, wie lange sie aufbewahrt werden sollen, ob sie archiviert werden sollen und wie viel Speicherplatz für Analysen benötigt wird.

Die Leistungsanforderungen steigen weiter, wenn Unternehmen von einem passiven zu einem aktiven Metadatenmodell übergehen. Passive Metadaten sind relativ statisch. Aktive Metadaten sind intelligenzgesteuert und arbeiten in Echtzeit, so dass sie ständig Informationen aus dem gesamten Netzwerk sammeln.

Involvieren Sie alle relevanten Teams für die Definition von Metadatenzielen und der Umsetzung von Standards. Auf diese Weise kann das Team eine wichtige Perspektive in die Diskussion einbringen und mit der Arbeit an der Basis beginnen.

Weitere Überlegungen und Beispiele für die Sicherung von Metadaten

Ein Unternehmen kann Metadaten zusammen mit den Quelldaten oder an einem separaten Ort speichern. Wenn die Metadaten zusammen mit den Daten gespeichert werden, sind sie oft in dieselbe Datei wie die Primärdaten eingebettet, wobei die Überlegungen zur Metadatenspeicherung im Wesentlichen denen für die Primärdaten entsprechen. In diesem Fall sind die Überlegungen zur Speicherung der Metadaten ähnlich wie bei den Primärdaten. In einigen Fällen werden die Metadaten in externen Dateien gespeichert, die zu den Hauptdaten gehören.

Halten Sie die Metadaten in der Nähe der eigentlichen Daten, um einen einfachen Umgang mit den Metadaten und der damit verbundenen Speicherung zu ermöglichen. Die Metadaten bleiben bei den Primärdaten, wenn diese verschoben werden, und können leicht gelesen und aktualisiert werden. Wenn jedoch die Metadaten aus der Datendatei entfernt werden oder die externe Metadatendatei entfernt wird, gehen die Vorteile beider Ansätze verloren. Keiner der beiden Ansätze ermöglicht eine zentrale Verwaltung im gesamten Netzwerk, was mit dem wachsenden Datenvolumen und der zunehmenden Bedeutung von Metadaten ein immer größeres Problem darstellt. Die wachsenden Datenmengen erschweren auch die Suche nach bestimmten Daten, wenn die Metadaten zusammen mit den Daten gespeichert werden.

Aufgrund dieser Einschränkungen speichern viele Unternehmen ihre Metadaten heute in einem zentralen Repository, das von den Quelldaten getrennt ist. Ein zentrales Metadaten-Repository oder ein zentraler Metadatenkatalog ist in der Regel Teil einer umfassenderen Strategie für das Metadatenmanagement, bei der die Metadaten aus den Quelldaten extrahiert und im Repository gespeichert werden. Ein zentrales Repository erleichtert die Suche nach bestimmten Datentypen im gesamten Unternehmen, unabhängig von der Größe des Datenvolumens oder dem Speicherort der Daten. Dieser Ansatz rationalisiert auch die Verwaltung, was zu effizienteren Abläufen und konsistenteren Metadaten im gesamten Unternehmen führt.

Trennen Sie die Metadaten von den Daten, um einen Speicher einzurichten, der am besten für metadatenspezifische Workloads geeignet ist. Ein zentralisiertes Repository kann erweiterte Analysen erleichtern, um mehr Wert aus den Metadaten zu ziehen. Die Metadaten sind von den Daten getrennt, so dass der Speicher metadatenspezifische Arbeitslasten aufnehmen kann. In einigen Fällen kann ein Unternehmen einen hybriden Ansatz für die Metadatenverwaltung wählen, indem es ein zentrales Repository einrichtet, die Metadaten aber in einigen Dateien eingebettet lässt.

Ein zentralisierter Ansatz bringt andere Herausforderungen mit sich. Wenn die Metadaten nicht mehr mit den Daten übereinstimmen, können die Metadaten weniger nützlich sein. Das Verwaltungssystem muss in der Lage sein, die Metadaten kontinuierlich mit den Quelldaten abzugleichen, um eine kontinuierliche Genauigkeit zu gewährleisten - ein Prozess, der sich auf die Speicherressourcen auswirken kann. Ein Metadatenverwaltungssystem ist möglicherweise nicht in der Lage, die Metadaten in bestimmten Dateien zu verstehen. In diesem Fall muss das System die Metadaten in einem binären großen Objektspeicher speichern, damit ein Drittanbieter-Tool darauf zugreifen kann. Selbst wenn diese Faktoren kein Problem darstellen, muss das Speicherteam sicherstellen, dass es über den richtigen Speicher verfügt, um die für ein Metadaten-Repository typischen leseintensiven Workloads zu unterstützen.