Definition

Tiered Storage (Abgestuftes Storage)

Mitarbeiter: Garry Kranz, Dave Raffo

Tiered Storage oder abgestufter, mehrschichtiger Speicher ist eine Möglichkeit, verschiedene Kategorien von Daten verschiedenen Arten von Speichermedien zuzuordnen, mit dem Ziel, die Gesamtkosten des Speichers zu reduzieren. Eine Tiered-Storage-Architektur platziert Daten in einer Hierarchie entsprechend ihrem Geschäftswert. Die Tiers (Ebenen oder Schichten) werden durch Leistung und Kosten der Medien bestimmt, und die Daten werden danach eingestuft, wie oft Benutzer auf sie zugreifen. Im Allgemeinen werden die wichtigsten Daten von den schnellsten Speichermedienbereitgestellt, die in der Regel auch die teuersten sind.

Fortsetzung des Inhalts unten

In einer Basiskonfiguration wird die Leistung mit einer schnellen Flash-Speicherebene erreicht, während andere Daten in den Sekundärspeicher auf Platte, Band oder in die Cloud geschrieben werden. Daten, die auf unbestimmte Zeit aufbewahrt werden müssen, werden in einer Archivschicht aufbewahrt.

Tiering ist ein Glied in einer Kette von Aktivitäten, die durch das Information Lifecycle Management (ILM) geregelt wird.

Geschichte

IBM leistete Pionierarbeit bei der Entwicklung einer mehrstufigen Speicherarchitektur für den Einsatz auf seinen Großrechnern. Bei der Konzeption von Tiered Storage wurden die primären Produktionsdaten auf verschiedene Konfigurationen von SAS- und SATA-Festplatten gelegt. Die Daten wurden mit Techniken wie Short Stroking und Striping in ein RAID-Array in Blöcke auf Platten geschrieben.

Dies führte zu Speicherebenen mit unterschiedlichen Kapazitäts-, Kosten- und Leistungsmerkmalen. Eine zusätzliche Ebene von Bandbibliotheken befand sich hinter der Platte, um ein tiefes Archiv (Deep Archive) für kalte oder warme Daten bereitzustellen.


Das Video von Brent Ozar Unlimited erklärt den
Storage-Tiering-Prozess.

Der Aufstieg des hierarchischen Speichermanagements (HSM) trug dazu bei, den manuellen Prozess des Speicher-Tierings zu reduzieren. Durch Softwareautomatisierung werden die Daten dynamisch zwischen verschiedenen Speichersystemen, Laufwerkstypen oder RAID-Gruppen in Echtzeit hin- und hergeschoben, und zwar auf eine Weise, die für den Benutzer weitgehend transparent ist.

Tier 0 und der Erfolg von Flash

Der Erfolg von SSDs und Flash-Speichern hat zu dem geführt, was viele als Tier-0-Speicher bezeichnen. Tier 0 ist schneller als herkömmliche Tier-1-Speicher, und ein Großteil der Daten, die früher als Tier 1 angesehen wurden, werden heute auf Tier 0 gespeichert. Tier-0-Speicher ist die schnellste und teuerste Schicht in der Hierarchie und eignet sich für Anwendungen mit geringer Toleranz für Ausfall- oder Latenzzeiten. Zu den Daten, die in einem Tier 0 abgelegt werden, gehören oft Scale-up-Transaktionsdatenbanken für Analytik, Finanzen, Gesundheitswesen und Sicherheit.

Als die Festplatte dominierte, platzierten Speicheradministratoren Tier-0-Daten auf schnelleren, teureren Festplattenlaufwerken (HDDs) und verwendeten für weniger wichtige Daten langsamere, weniger teure Festplatten. Die Platten-Topologie wird nach wie vor verwendet, obwohl SSDs die Platte als Hauptmedium für Tier-0-Daten verdrängt hat.

Abbildung 1: Daten werden je nach ihrem Geschäftswert und ihren Zugriffszahlen auf unterschiedliche Speichermedien abgelegt.
Abbildung 1: Daten werden je nach ihrem Geschäftswert und ihren Zugriffszahlen auf unterschiedliche Speichermedien abgelegt.

Die Verwendung der Festplatte als Tier-0-Ziel erforderte einen Teil des Server-RAMs, um als virtuelles Plattenlaufwerk zu fungieren. Dies bedeutete, dass weniger Memory für Berechnungen zur Verfügung stand. RAM erfordert außerdem eine konstante Stromversorgung, um Daten zu speichern. SSDs, die auf nichtflüchtigem Speicher (NVM) basieren, eliminieren dieses Problem.

Mit dem Aufkommen hybrider Speicher-Arrays, die Flash und HDDs mischen, entstand der Bedarf an automatisierter Speicher-Tiering-Software, um sicherzustellen, dass nur die wichtigsten Daten auf teuren SSDs innerhalb eines Arrays verbleiben. Das Storage Tiering begann als manueller Prozess, aber die Automatisierung hat bei der Analyse der Datenplatzierung eine größere Rolle gespielt.

Bei All-Flash-Arrays haben primäre Speichersysteme oft nur eine Ebene. Es kann jedoch verschiedene Flash-Ebenen geben, zum Beispiel RAM, PCIe-Flash (Peripheral Component Interconnect Express) mit niedriger Latenz und SSDs.

Im Vergleich zur herkömmlichen rotierenden Festplatte erweitert der Flash-Speicher die durch Software bereitgestellten Datenverwaltungsfunktionen. Dazu gehören Datenreduzierungstechniken wie Inline-Komprimierung und Deduplizierung. Hybride Speichersysteme speichern heiße Daten zum schnellen Abruf im Flash-Speicher und schreiben die verbleibenden Daten anschließend auf eine Ebene mit Backend-Festplatten.

Im Idealfall befinden sich alle Daten auf der schnellstmöglichen Ebene, aber das ist in den meisten Fällen nicht praktikabel. Das Verschieben von Daten auf einem herkömmlichen Plattenarray verbraucht Input/Output (I/O)-Anforderungen für Host-Anforderungen. Dies führt zu Engpässen, da das System wartet, bis die Daten zwischen den Ebenen verschoben werden. Bei Flash wird nur ein kleiner Teil der Kapazität als Cache reserviert, um Hochleistungs-Workloads zu beschleunigen.

Die greifbaren Vorteile einer verbesserten Leistung, zum Beispiel eine schnellere Markteinführung oder höhere Verkaufszahlen, müssen gegen die Speicherkosten abgewogen werden.

Tier-1-Speicher

Zu den Tier-1-Daten gehören unternehmenskritische Anwendungen, kürzlich abgerufene Daten oder streng geheime Dateien. Diese Daten können auf teuren, hochwertigen Medien, beispielsweise Double-Parity-RAID, gespeichert werden. In zunehmendem Maße werden Flash- und In-Memory-Speicher als Optionen zur Leistungssteigerung bei ausgewählten Arbeitslasten eingesetzt.

Tier-1-Speicher ist für Daten reserviert, die auf schnelle Lese- und Schreibvorgänge angewiesen sind, zum Beispiel alle Anwendungen, die mit Einnahmen oder Geschäftsvorgängen verbunden sind. Ein Beispiel ist eine transaktionale Online-Datenbank, die Hochgeschwindigkeitsanwendungen in Echtzeit bedient. Schneller Speicher liefert die erforderliche geringe Latenz oder den erforderlichen Durchsatz.

Auch wenn einige Tier-1-Anwendungen auf der rotierenden Festplatte verbleiben, werden Unternehmen ausgewählte Workloads auf All-Flash-Speicher oder auf Hybrid-Flash ausführen. In einigen Fällen nutzen IT-Shops die ungenutzte Rechenkapazität, um transaktionale Datenbanken im schnellen In-Memory-Speicher auszuführen. Zu diesen Geräten gehören Non-Volatile Dual In-line Memory Modules (NVDIMMs), die in einen Standard-Serversteckplatz geschoben werden.

Tier-2- und Tier-3-Speicher

Selbst wenn die primären Operationen abgeschlossen sind, werden Tier-1-Daten in der Regel gleichzeitig auf eine sekundäre Ebene von plattenbasierten Backup-Appliances oder auf Magnetband geschrieben. Rechenzentren setzen eine Sicherungsschicht ein, um Business Continuity und Disaster Recovery (BC/DR) durch schnelle Wiederherstellungen von wichtigen Dateien und Speicherhardware zu unterstützen.

Viele Organisationen richten Backups für einen bestimmten Zeitraum direkt auf Platte aus, wonach die Daten dann zur langfristigen Aufbewahrung in eine Bandbibliothek verschoben werden.


Howard Butler, Senior Director of Systems Engineering
und Field Support bei Condusiv Technologies, gibt Tipps,
wie Anwender ihr Tiered Storage SAN optimieren.

Die Daten auf dem Tier-2-Speicher enthalten in der Regel historische Finanzinformationen, kalte Daten und klassifizierte Dateien. Diese Daten werden auf kostengünstigeren Medien in einem herkömmlichen Storage Area Network (SAN) aufbewahrt.

Tier-2-Backups können auch Enterprise Resource Planning (ERP)-Systeme, Unternehmens-E-Mail und Back-Office-Anwendungen umfassen. Im Allgemeinen schützt Tier-2-Speicher Anwendungsdaten, die eine hohe Zuverlässigkeit und Sicherheit erfordern, aber keine Latenz im Submillisekundenbereich benötigen.

In einem dreistufigen Speichersystem befindet sich eine Archivschicht hinter der Backup-Schicht. Die Daten im Archiv können ereignisgesteuerte, selten verwendete oder nicht klassifizierte Dateien auf langsam drehenden Festplatten, beschreibbaren CDs oder Bändern enthalten. Ein Archiv bewahrt feste Kopien aller Inhalte auf, denen ein strategischer Wert beigemessen wird, wie gering dieser auch sein mag. Der Inhalt innerhalb eines Archivs kann unbegrenzt aufbewahrt werden oder an einem bestimmten Datum auslaufen und gelöscht werden.

Unternehmen in regulierten Branchen nutzen Archive, um alternde oder inaktive Daten von teurerem Speicherplatz zu migrieren. Der Archivspeicher unterstützt die Compliance, historische Analysen oder andere Geschäftsanforderungen, die periodisch auftreten können. Neben der physischen lokalen Speicherung stellt die Entwicklung der Hybrid Cloud eine weitere Speicherebene dar. Dienstanbieter bieten hier eine skalierbare Ebene an Objektspeicher zur Verwaltung unstrukturierter Daten. DevOps-Teams verwenden häufig objektbasierte Clouds für die Zusammenarbeit zu Testzwecken, bevor sie neue Anwendungen auf Produktionsebene einführen.

Die Public Cloud kann höhere Ebenen für Daten mit seltenem Zugriff ersetzen. Viele Speicherexperten prognostizieren die Verwendung von weniger Speicherebenen, möglicherweise sogar nur zwei, wobei Primärdaten auf einer Flash-Ebene abgelegt und archivierte und Backup-Daten in der Cloud platziert werden.

Array-basiertes Tiering

Anbieter von Speicher-Arrays haben automatisiertes Tiering in den Softwaremanagement-Stack integriert. Automatisierte Richtlinien verschieben Daten auf der Grundlage einer vom Unternehmen definierten Richtlinie in der Regel in Echtzeit in den entsprechenden Tier. Der Anstoß zum Verschieben von Daten erfolgt in vordefinierten Metadatenattributen.

Eine Reihe von Softwareanbietern offeriert auch Verwaltungssoftware, die Tiered Storage umfasst. Zu diesen Produkten gehören softwaredefinierte Cloud-Gateways, Copy Data Management und unternehmensweite Datei-Sync-and-Share-Suites.

Optimiertes Tiering

Speicherexperten sagen, dass eine gut entwickelte Datentaxonomie der Dreh- und Angelpunkt einer optimierten Tiered-Storage-Architektur ist. Eine Taxonomie klassifiziert alle Daten und wägt die Art der erforderlichen Speicherleistung gegen die Kosten eines solchen Plans ab. Verfügbarkeits-, Leistungs- und Service-Attribute jeder Schicht sollten klar definiert werden. Ziel ist es, einer Anwendung die Wahl des Speichers zu ermöglichen, der zu den von ihr ausgeführten Geschäftsaufgaben passt.

Wenn ein Unternehmen für seine Anwendungen zur Transaktionsverarbeitung auf kontinuierliche Betriebszeit (Uptime) angewiesen ist, werden die erzielten Einnahmen wahrscheinlich die Kosten für Hochleistungsspeicher mehr als decken. Dadurch wird nicht nur die Anwendungsleistung verbessert, sondern es wird auch Primärspeicher durch die Automatisierung von Backups auf eine Ebene mit kostengünstigeren Festplattenkapazitäten frei.

Es ist allgemein anerkannt, dass nur 10 Prozent bis 20 Prozent der Daten zu einem bestimmten Zeitpunkt als „heiß“ eingestuft werden. Das bedeutet, dass der schnellste und teuerste Speicher ausschließlich für diese häufig abgerufenen Daten verwendet werden sollte, während die restlichen 80 bis 90 Prozent auf einer kostengünstigeren Speicherebene gespeichert werden sollten.

Tiering vs. Caching

Speicherschicht- und Cache-Technologien werden oft austauschbar verwendet - insbesondere beim Umgang mit Flash-Medien - aber es handelt sich um unterschiedliche Prozesse. Tiered Data (abgestufte Daten) befinden sich zu jeder Zeit auf einem Medientyp, bewegen sich aber zwischen den Medien, wenn sich die Datenzugriffsmuster ändern.

Beim Caching wird vorübergehend eine Kopie der Daten auf einem Hochleistungsmedium wie Dynamic RAM (DRAM) oder Solid-State-Speicher abgelegt, um die Leistung zu verbessern. Die zwischengespeicherten Daten befinden sich jedoch auch auf einer niedrigeren Speicherebene, in der Regel auf einer Festplatte.

Die Host-Software oder der Speicher-Controller legt eine Kopie der Daten in den SSD-Cache, der zwischen der Anwendung und dem Backend-Speicher liegt. Die Originalkopie der Daten verbleibt an ihrem ursprünglichen Speicherort.

Abbildung 2: Die Unterschiede zwischen SSD-Caching und Storage Tiering auf einen Blick.
Abbildung 2: Die Unterschiede zwischen SSD-Caching und Storage Tiering auf einen Blick.

Umgekehrt verschiebt Tiered Storage die Daten auf ein anderes Speichermedium, wobei der Speicherort so gewählt wird, dass Verfügbarkeit, Leistung und Kosten des Speichermediums ausgewogen sind.

Diese Definition wurde zuletzt im September 2020 aktualisiert

Erfahren Sie mehr über Storage Management

File Extensions and File Formats

Powered by:

ComputerWeekly.de

Close