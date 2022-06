Die meisten Unternehmen haben mehrere Arten von Daten zu speichern. Datengröße, Zugriffsgeschwindigkeit und Anwendungspriorität bestimmen, welche Art von Speicher für die verschiedenen Daten benötigt wird. Daher verwenden viele Unternehmen im Rechenzentrum mehrere verschiedene Speichertypen und nicht nur einen einheitlichen Speichertyp.

Zwei wichtige Formen des Storage im Rechenzentrum sind das Storage Area Network (SAN) und Network-Attached Storage (NAS). Ein SAN verwendet eine Netzwerk-Fabric und Switches, um Server mit dem Speicher zu verbinden. SANs eignen sich gut für Block-I/Os und strukturierte Daten, wie relationale Datenbanken.

SANs erfordern entweder Fibre-Channel-Netzwerke oder Ethernet, zum Beispiel iSCSI. NAS hingegen greift über ein Protokoll auf Dateien zu und ist optimal für Remote File Serving geeignet. NAS arbeitet wie ein Server mit eigenem Dateiserver und bietet eine zentralisierte Datenverwaltung. Es ist am besten für unstrukturierte Daten geeignet.

Ein hybrides Storage-Array erfordert in der Regel eine Tiering -Software. Diese Software hilft bei der Einteilung der Daten in verschiedene Tiers (Ebenen) im Speichersystem auf der Grundlage von Faktoren wie Zugriffsaktivität, Durchsatzanforderungen und Redundanz und hilft somit bei der Festlegung, wo bestimmte Daten innerhalb des Systems gespeichert werden.

Wenn Sie verschiedene virtuelle Festplatten in Betracht ziehen, insbesondere VMware , wählen Sie zwischen Raw-, Thin- und Thick-Disks. Eine Raw Disk verbindet eine logische Speichereinheit direkt mit einer VM innerhalb eines SAN. Eine Raw-Disk speichert die Festplattendaten einer VM in einer kleinen Festplattendeskriptor-Datei im Arbeitsverzeichnis dieser VM und verbessert die I/O-Anwendungsleistung. Eine Thick-Disk kann dagegen die Leistung und Sicherheit erhöhen, indem sie Thick Provisioning zur Vorabzuweisung von physischem Speicher verwendet. Eine Thin Disk schließlich optimiert die Festplatteneffizienz, indem sie nur so viel Speicherplatz verbraucht, wie sie für ihre Funktion benötigt.

Data Lake vs. Data Warehouse und Cloud vs. On-Premises

Ein Data Lake ist ein großes Repository, in dem Rohdaten in ihrem nativen Format gespeichert werden. Im Gegensatz zu einem traditionellen Data Warehouse, das Daten in hierarchischen Ebenen speichert, speichert ein Data Lake Daten als Dateien oder Objekte in einer flachen Architektur.

Sowohl Data Lakes als auch Data Warehouses benötigen viel Speicherplatz, insbesondere in großen Unternehmen. Viele Speicherhersteller bieten spezialisierte Produkte für jede Speicherarchitektur an. So eignen sich beispielsweise die Elastic Data Platform von Dell EMC und Hitachi Vantara für groß angelegte, lokale Data-Lake-Implementierungen. Anbieter wie IBM, NetApp und HPE haben Angebote, die für beide Architekturen geeignet sind. Cloud-Anbieter wie AWS, Microsoft Azure und Google Cloud Platform offerieren Storage als Service für beide Architekturen an.