Definition

Tiered Storage (Abgestuftes Storage)

Tiered Storage ist eine Methode zur Zuweisung unterschiedlicher Datenkategorien an verschiedene Arten von Speichermedien, um die Gesamtspeicherkosten zu senken und die Leistung und Verfügbarkeit von unternehmenskritischen Anwendungen zu verbessern. Eine Tiered-Storage-Architektur kategorisiert Daten hierarchisch nach ihrem geschäftlichen Wert, wobei die Daten danach geordnet werden, wie oft Benutzer und Anwendungen auf sie zugreifen. Die Daten werden dann bestimmten Speicherebenen (Storage Tiers) zugewiesen, die durch ihre Leistung, Verfügbarkeit und Medienkosten definiert sind.

Im Allgemeinen werden die wichtigsten Daten von den schnellsten Speichermedien bereitgestellt, die in der Regel auch die teuersten sind. In einer Basiskonfiguration könnten unternehmenskritische Daten einer hochleistungsfähigen Ebene (Tier) zugewiesen werden, die aus Flash-Solid-State-Laufwerken (SSDs) oder Intel Optane-Speichermodulen besteht, während weniger kritische Daten auf eine zweite Speicherebene geschrieben werden, die nur aus Festplattenlaufwerken(HDDs) besteht. Eine dritte Schicht kann dann für die Archivierung von Daten verwendet werden, die auf unbestimmte Zeit aufbewahrt werden müssen, wobei die Daten auf Bandlaufwerken oder Cloud-Speicherplattformen gespeichert werden.

Tiering ist ein Glied in einer Kette von Aktivitäten, die vom Information Lifecycle Management (ILM) gesteuert werden.

Die Geschichte von Tiered Storage

IBM leistete Pionierarbeit mit der Multi-Tier-Speicherarchitektur für seine Mainframe-Computer. Als die Tiered-Storage-Architektur entwickelt wurde, wurden die primären Produktionsdaten manuell auf unterschiedlichen Konfigurationen von Serial-Attached-SCSI- (SAS) und Serial-Advanced-Technology-Attachment- (SATA) Festplatten gespeichert. Die Daten wurden mit Techniken wie Short Stroking und Striping über einen RAID-Controller in Blöcke auf den Festplatten geschrieben.

So entstanden Speicherebenen mit unterschiedlichen Kapazitäten, Kosten und Leistungsmerkmalen, die es ermöglichten, unterschiedliche Speicheranforderungen innerhalb eines einzigen Mainframes zu erfüllen. Um weitere Flexibilität zu bieten, wurde eine zusätzliche Schicht von Bandbibliotheken hinter den anderen Medien eingerichtet, um warme Daten zu unterstützen oder ein tiefes Archiv (Deep Archive) für kalte Daten bereitzustellen.

Das Aufkommen des hierarchischen Speichermanagements (HSM) trug dazu bei, den manuellen Prozess des Storage Tiering zu reduzieren. Mit HSM wurde eine softwarebasierte Automatisierung eingeführt, die die Daten dynamisch zwischen verschiedenen Speichersystemen, Laufwerkstypen oder RAID-Gruppen in Echtzeit hin- und herschiebt, und zwar auf eine Weise, die für den Benutzer weitgehend transparent ist.

Was ist Multi-Tiered Storage?

Bei einem Tiering-Ansatz für die Datenverwaltung werden verschiedene Arten von Speichermedien verwendet, um mehrere Schichten für die Unterbringung unterschiedlicher Datentypen zu schaffen. Der genaue Ansatz, den Unternehmen beim Tiering verfolgen, hängt von ihren spezifischen Speicher-, Daten- und Anwendungsanforderungen ab. Heutige IT-Teams können zwischen zwei und fünf Tiers unterstützen, manchmal sogar mehr.

Die Anzahl der Tiers hängt in hohem Maße davon ab, wie ein Unternehmen seine Daten klassifiziert. Geschäftsdaten werden beispielsweise häufig in eine von vier Kategorien eingeteilt: unternehmenskritische Daten, heiße Daten, warme Daten und kalte Daten. Auf der Grundlage dieser Kategorien könnte ein Unternehmen vier Speicherebenen implementieren - Tier 0, Tier 1, Tier 2, Tier 3 - wobei Tier 0 unternehmenskritische Arbeitslasten unterstützt und Tier 3 kalte Daten speichert.

Unternehmen sind nicht an diese Struktur gebunden - sie können mehr oder weniger Tiers einsetzen - aber dieser Ansatz stellt die grundlegenden Prinzipien einer mehrschichtigen Speicherarchitektur dar.

Abbildung 1: Die Anzahl der Storage Tiers in einem Unternehmen hängt davon ab, wie die Daten kategorisiert werden.
Abbildung 1: Die Anzahl der Storage Tiers in einem Unternehmen hängt davon ab, wie die Daten kategorisiert werden.

Unternehmen können auf verschiedene Weise von dieser Struktur abweichen. So können sie beispielsweise Tier 1 oder Tier 2 in zwei Tiers aufteilen, um die Speicherressourcen besser zu nutzen. Unabhängig von der Konfiguration speichert der höchste Tier – in diesem Modell –  Tier 0 - immer die Daten für die anspruchsvollsten Workloads, und der niedrigste Tier - ob Tier 3, Tier 4, Tier 5 oder etwas anderes - speichert die am wenigsten kritischen und aktiven Daten.

Was ist Tier-0-Speicher?

Die oberste Ebene der Speicherhierarchie begann traditionell mit Tier-1-Speicher, aber mit dem Aufkommen von Solid-State- und Flash-Speicher entstand das Konzept des Tier-0-Speichers. Tier 0 bietet eine höhere Leistung als Tier-1-Speicher, und viele der Daten, die früher als Tier-1-Speicher galten, werden jetzt auf Tier 0 gespeichert.

Tier-0-Speicher ist die schnellste und teuerste Ebene in der Hierarchie und eignet sich für unternehmenskritische Anwendungen mit geringer Toleranz für Ausfallzeiten oder Latenzzeiten. Zu den Daten, die in einem „Zero Tier“ gespeichert werden, gehören häufig skalierbare Transaktionsdatenbanken für Analysen, Finanzdaten, Gesundheitswesen und Sicherheit.

Abbildung 2: Storage Class Memory ist ein Beispiel für ein Speichermedium des Tier 0.
Abbildung 2: Storage Class Memory ist ein Beispiel für ein Speichermedium des Tier 0.

Die Speichergeräte, die Tier 0 bilden, können Flash-SSDs oder Storage Class Memory (SCM)-Geräte wie Optane-SSDs oder Speichermodule umfassen. Die SSDs verwenden in der Regel Peripheral Component Interconnect Express (PCIe) oder Non-Volatile Memory Express (NVMe)-Technologien, um die Leistung zu maximieren. In einigen Fällen kann ein Unternehmen aufgrund seiner Leistung und Zuverlässigkeit Single-Level-Cell-Flash (SLC) verwenden. Tier 0-Speicher können auch Random Access Memory (RAM) nutzen, um die Leistung zu optimieren.

Obwohl Tier-0-Speicher der teuerste Speichertyp ist, müssen die greifbaren Vorteile einer verbesserten Leistung, wie zum Beispiel eine schnellere Markteinführung oder höhere Umsätze, gegen die Kosten der Tier-0-Speichergeräte abgewogen werden.

Was ist Tier-1-Speicher?

Tier-1-Daten unterstützen Anwendungen, die für das Tagesgeschäft eines Unternehmens unerlässlich sind. Anwendungen, die auf diese Daten angewiesen sind, können in der Regel höhere Latenzzeiten und geringere IOPS als Tier 0-Anwendungen verkraften. Auch die Speicherkosten spielen eine größere Rolle als bei Tier-0-Speicher, obwohl bei Tier-1-Speicher in der Regel immer noch hochwertige Medien verwendet werden, wie beispielsweise RAID mit doppelter Parität, um sicherzustellen, dass der Speicher die erforderliche Latenz und den erforderlichen Durchsatz liefert, auch wenn er nicht so schnell wie Tier-0-Speicher ist.

Tier-1-Speicher kann SSDs, Festplatten oder eine Kombination aus beiden in einer hybriden Laufwerkskonfiguration sein. Hybride Speichersysteme speichern heiße Daten in Flash zwischen für einen schnellen Abruf und schreiben die restlichen Daten auf die Festplatten. Die für Tier-1-Speicher verwendeten Festplatten sind in der Regel die schnellsten und teuersten, vor allem, wenn sie der einzige Speichertyp sind, der auf dieser Ebene verwendet wird.

In einigen Fällen wird bei festplattenbasierter Speicherung ein Teil des Arbeitsspeichers des Servers als virtuelles Laufwerk genutzt, insbesondere wenn die Festplatten nicht Teil eines Hybridsystems sind. Dies bedeutet jedoch auch, dass weniger Speicher für Rechenressourcen zur Verfügung steht. Außerdem benötigt RAM eine konstante Stromversorgung, um seine Daten vorzuhalten. SSDs und Festplatten sind nichtflüchtige Speichergeräte, so dass sie von der Stromversorgung getrennt werden können und ihre Daten trotzdem gespeichert bleiben.

Selbst wenn Unternehmen die meisten ihrer Tier-1-Anwendungen auf Festplatten ausführen, können sie bestimmte Arbeitslasten auf All-Flash-Speichern oder auf Hybrid-Flash-Speichern ausführen. In einigen Fällen nutzen IT-Teams ungenutzte Rechenkapazitäten, um Transaktionsdatenbanken in schnellen In-Memory-Speichern auszuführen. Zu diesen Geräten gehören nichtflüchtige Dual-Inline-Speichermodule (NVDIMMs), die in einen Standard-Serversteckplatz eingeschoben werden können.

Abbildung 3: NVDIMMs sind ein Beispiel für schnellen In-Memory-Speicher, der sich als Medium für Tier 1 eignet.
Abbildung 3: NVDIMMs sind ein Beispiel für schnellen In-Memory-Speicher, der sich als Medium für Tier 1 eignet.

Was ist Tier-2-Speicher?

Tier-2-Speicher sichert warme Daten, zu denen alte E-Mails, geheime Dateien, historische Finanzdaten oder eine Vielzahl anderer Arten von Informationen gehören können. Diese Ebene kann auch Berichte und Analysen unterstützen. Tier-2-Speicher erfordert in der Regel eine größere Kapazität für längere Zeiträume, so dass sich der Schwerpunkt von der Leistung auf die Kosteneffizienz verlagert.

Tier-2-Speicher dient oft als Sekundärspeicher eines Unternehmens, auf dem Tier-0- und Tier-1-Backups als Teil einer BC/DR-Strategie (Business Continuity and Disaster Recovery) gespeichert werden. Ein Tier-2-Speicher ermöglicht die schnelle Wiederherstellung wichtiger Dateien, wenn die Daten auf dem Primärspeicher nicht mehr verfügbar sind.

Zu den Sicherungsdaten auf dem Tier-2-Speicher können ERP-Systeme (Enterprise Resource Planning), Unternehmens-E-Mails, Back-Office-Anwendungen oder andere Anwendungsdaten gehören, die eine hohe Zuverlässigkeit und Sicherheit erfordern, aber keine Latenzzeiten von unter einer Millisekunde benötigen.

Tier-2-Daten werden auf kostengünstigeren Medien wie Festplatten, Backup-Appliances, Bandspeichern oder Cloud Storage gespeichert. Die Festplatten basieren in der Regel auf SATA und nicht auf teureren RAID-Arrays oder SAS-Geräten. Die Wiederherstellungsanforderungen bestimmen häufig die Art der für Tier-2-Speicher verwendeten Medien.

Was ist Tier-3-Speicher?

Tier-3-Speicher ist eine Archivierungsebene, die hinter der Backup-Ebene liegt. Auf die Daten in dieser Schicht wird nur selten oder gar nicht zugegriffen oder sie werden nicht aktualisiert. Zu den Speichermedien dieser Ebene können langsam drehende Festplatten, beschreibbare Compact Discs, Bandlaufwerke oder Archiv-Cloud-Speicherdienste gehören - je nachdem, was im Vergleich zu den anderen Ebenen den günstigsten Speicherplatz bietet. Tier 3 speichert fixe Kopien von Inhalten, die als strategisch wertvoll erachtet werden, wie gering auch immer, oder von Inhalten, die zur Einhaltung geltender Vorschriften aufbewahrt werden müssen.

In vielen Unternehmen werden Backups für einen bestimmten Zeitraum auf Tier 2 gespeichert, bevor die Daten zur langfristigen Aufbewahrung in eine Bandbibliothek der Stufe 3 verschoben werden. Die Daten können auf unbestimmte Zeit aufbewahrt werden oder zu einem bestimmten Datum ablaufen. In einigen Fällen werden die Archivdaten nur einmal auf die Festplatte geschrieben und nie gelöscht oder aktualisiert.

Unternehmen in regulierten Branchen nutzen Archive, um alternde oder inaktive Daten von teurerem Speicher zu migrieren. Tier-3-Speicher unterstützt die Einhaltung von Vorschriften, historische Analysen oder andere geschäftliche Anforderungen, die in regelmäßigen Abständen auftreten können, aber keinen hochmodernen Speicher erfordern.

Unternehmen setzen zunehmend auf Objektspeicher für ihre Tier-3-Daten und implementieren diese Ebene oft als Teil einer hybriden Cloud-Strategie, die sowohl lokale Systeme als auch Cloud-Dienste nutzt. Die Public Cloud kann Tier-3-Daten als Teil dieser hybriden Strategie speichern.

Einige Speicherexperten prognostizieren eine Zukunft mit weniger Speicherebenen, möglicherweise nur zwei, wobei die Primärdaten auf einer Flash-Ebene gespeichert und die Archiv- und Sicherungsdaten in der Cloud abgelegt werden.

Was ist automatisiertes Storage-Tiering?

Storage Tiering war ursprünglich ein manueller Prozess, aber die Automatisierung hat sowohl bei der Platzierung der Daten als auch bei der Analyse ihrer Platzierung eine größere Rolle übernommen. Seit ihrer Einführung hat sich die Tiering-Automatisierung kontinuierlich verbessert und weiterentwickelt. Immer mehr Speicherprodukte bieten nun Tiering-Funktionen, die entweder in das Speichersystem integriert sind oder als Software oder Services von Drittanbietern angeboten werden.

Mit dem Aufkommen hybrider Speicher-Arrays, die Flash-SSDs und Festplatten mischen, wurde die Tiering-Automatisierung immer wichtiger. Durch die Automatisierung wird sichergestellt, dass nur die wichtigsten Daten auf teuren Medien verbleiben und der Rest entsprechend verteilt wird.

Die Anbieter von Speicher-Arrays haben das automatisierte Storage Tiering inzwischen in den Software-Management-Stack integriert. Automatisierte Richtlinien verschieben Daten auf der Grundlage der vom Unternehmen definierten Richtlinien auf das geeignete Tier, in der Regel in Echtzeit.

Eine Reihe von Software-Drittanbietern bietet ebenfalls Verwaltungssoftware an, die Tiered Storage enthält. Zu diesen Produkten gehören softwaredefinierte Cloud-Storage-Gateways, Copy Data Management und File-Sync-and-Share-Suiten für Unternehmen.

Was ist optimiertes Tiering?

Speicherexperten haben erklärt, dass eine gut entwickelte Datenklassifizierungstaxonomie der Dreh- und Angelpunkt einer optimierten Tiered-Storage-Architektur ist. In einer Taxonomie werden alle Daten klassifiziert und die Kosten gegen die Anforderungen an die Speicherleistung abgewogen.

Speicherarchitekten sollten die Verfügbarkeits-, Leistungs- und Serviceattribute jeder Schicht klar definieren. Ziel ist es, einer Anwendung die Möglichkeit zu geben, den Speicher zu wählen, der ihren Geschäftsaufgaben entspricht.

Wenn ein Unternehmen auf eine kontinuierliche Betriebszeit für seine Transaktionsverarbeitungsanwendungen angewiesen ist, können die erzielten Einnahmen die Kosten für Hochleistungsspeicher mehr als decken. Storage Tiering kann die Anwendungsleistung verbessern, indem primärer Speicher frei wird und sekundäre Daten auf eine kostengünstigere Ebene verschoben werden.

Es ist allgemein anerkannt, dass nur 10 bis 20 Prozent der Daten zu einem bestimmten Zeitpunkt als „heiß“ gelten. Das bedeutet, dass der schnellste und teuerste Speicher ausschließlich für diese häufig abgerufenen Daten verwendet werden sollte, während die restlichen 80 bis 90 Prozent auf einer günstigeren Speicherebene gespeichert werden.

Tiering vs. Caching

Die Begriffe „Tiering“ und „Caching“ werden oft synonym verwendet - insbesondere bei Flash-Medien -, aber es handelt sich um unterschiedliche Prozesse.

Beim Caching wird eine temporäre Kopie der Daten auf einem Hochleistungsmedium, zum Beispiel einem dynamischen RAM (DRAM) oder einem Solid-State-Speicher, abgelegt, um die Leistung zu verbessern. Der Cache befindet sich zwischen der Anwendung und dem Backend-Speicher.

Die gleichen Daten befinden sich auch auf einer niedrigeren Speicherebene, in der Regel auf einer Festplatte. Die Host-Software oder der Speicher-Controller kopiert die Daten in den Cache, aber die Originalkopie der Daten verbleibt an ihrem ursprünglichen Speicherort.

Abbildung 6: Dieses Diagramm erläutert die Unterschiede im Datenfluss bei Storage Tiering und SSD-Caching.
Abbildung 6: Dieses Diagramm erläutert die Unterschiede im Datenfluss bei Storage Tiering und SSD-Caching.

Tiered-Daten befinden sich zu jeder Zeit auf einem Medientyp, wechseln aber zwischen den Medien, wenn sich die Datenzugriffsmuster ändern. Tiered Storage kopiert keine Daten. Die Daten werden auf ein anderes Speichermedium verschoben, wobei der Speicherort ausgewählt wird, der ein optimales Gleichgewicht zwischen Verfügbarkeit, Leistung und Kosten des Speichermediums bietet. Auf diese Weise kann die Speicherhardware besser ausgelastet werden, während gleichzeitig die Leistung für unternehmenskritische Anwendungen maximiert wird.

Diese Definition wurde zuletzt im August 2022 aktualisiert

Erfahren Sie mehr über Storage Management

ComputerWeekly.de
Close