Die Fast Track Data Warehouse Referenzarchitektur für SQL Server 2012

Die Fast-Track-Data-Warehouse-Referenzarchitektur von Microsoft hilft Ihnen beim Aufbau eines effizienten und leistungsstarken Data Warehouse.

SQL Server 2012 Fast Track Data Warehouse (FTDW) definiert eine Referenzarchitektur für den Aufbau von leistungsfähigen SQL-Server-Data-Warehouses auf zertifizierter Hardware von Microsoft-Partnern wie HP, Dell, IBM oder Cisco. FTDW bietet eine umfassende Schritt-für-Schritt-Anleitung zur Umsetzung eines ausbalancierten Konfigurations-Modells für ein SMP-basiertes (symmetrisches Multi-Processing) SQL-Server-Datenbank-System.

Im Mittelpunkt des Programms steht die Veröffentlichung des Fast Track Data Warehouse-Referenzhandbuchs für SQL Server 2012. Das Referenzhandbuch umreißt die Komponenten-Architektur und die Methodik für den Aufbau einer entsprechenden Data-Warehouse-Plattform zur SQL Server-Datenverarbeitung mit Hardware-Komponenten-Durchsatz. Die FTDW-Methodik definiert die minimale System-Architektur, die erforderlich ist, um verschiedene Data-Warehouse-Workloads zu implementieren und zu pflegen.

Die einzelnen Komponenten einer FTDW-Plattform.

Balanced Data Warehousing

Eine FTDW Data-Warehouse-Plattform besteht aus einer Reihe von Hardware- und Software- Komponenten. Die Hardware muss mindestens Server, Storage und die verbindenden Netzwerkkomponenten umfassen. Die Software dagegen muss das Betriebssystem sowie das Datenbank-Managementsystem (DBMS) enthalten, in diesem Fall also Windows Server und SQL Server. Zusätzlich ist noch Software für die Kommunikation zwischen den Komponenten nötig.

Das Referenzhandbuch bietet eine grundlegende Methodik für die Bereitstellung eines FTDW mit einer ausgewogenen Hardware- und Software-Konfiguration, mit dem sich Data-Warehouse-Workloads bearbeiten lassen. Jede Komponente ist optimiert, um in Verbindung mit den anderen Komponenten zu arbeiten, und so den größtmöglichen Durchsatz zu erreichen. Das Ziel ist es dabei, ein effizientes Gleichgewicht zwischen Hardware-Ressourcen und SQL-Server-Processing zu erreichen.

Die Hardware-Konfiguration wird definiert von spezifischen Workloads, Grundeinstellungen zu Validierung sowie Best Practices. Dazu bietet FTDW spezifische Benchmarks auf Basis paralleler Workloads zusammen mit detaillierten und validierten Hardware-Spezifikationen, die einen Fokus auf eine Komponentenarchitektur legen, mit der sich Datenbank-Kapazitäten und Hardware-Ressourcen ausbalancieren lassen. Das Referenzhandbuch bietet so einen praktischen Rahmen für das Erreichen eines wirksamen Gleichgewichts zwischen den wichtigsten Komponenten der Data Warehouse-Plattform.

Die Data-Warehouse-Arbeitsbelastung

Die Datenbankauslastung kann von einer Anwendung zur nächsten deutlich variieren. Beispielsweise erfordert eine Datenbank, die Online-Transaktionsverarbeitung (OLTP) unterstützt, in der Regel kleine Leseoperationen und Datenänderungen. Eine derartige Datenbank ist normalerweise zum Großteil indiziert, um wenige Zeilen ohne Latenz aufrufen zu können. Solche Workloads können aber erhebliche Plattenkopfbewegungen erfordern und erzeugen zufällige I/O- Scan-Muster.

Auf der anderen Seite führen Data-Warehouse-Operationen oft zu sehr Scan-intensiven Vorgängen. In diesem Fall kann das System von sequentiellen Platten-Scans und ihrer potenziell höheren Leistung profitieren. Die FTDW-Architektur berücksichtigt die spezifischen Bedürfnisse von Data-Warehouse-Workloads und betont eine ausgewogene Komponentenarchitektur, die für gleichbleibende hohe I/O- Scan-Raten sorgen soll, anstatt sich auf Operationen pro Sekunde zu konzentrieren, wie es bei der Bewertung von OLTP-Datenbanken typisch ist.

Da FTDW Datenbankdateien und Konfigurationen mit effizienten Festplattenscans verbindet, anders als bei Suchoperationen, wird die Anzahl der Festplatten zur Bearbeitung eines bestimmten Workloads verringert. FTDW priorisiert Festplattenleistung über andere Überlegungen bei der Optimierung von Hardware-und Software-Komponenten. Gleichzeitig betont FTDW die Verwendung von geclusterten Indizes und Bereichspartitionierung zur Unterstützung effizienter Scan-basierter Disk-I /O bei gleichzeitiger Minimierung der Verwendung von nicht-gruppierten Indizes.

Konfiguration eines Data Warehouse

Die FTDW-Richtlinien bieten Informationen über die Hardware- und Software-Konfigurationen, die erforderlich sind, um eine ausgewogene Komponentenarchitektur zu erreichen. Die Hardware-Seite dieser Gleichung basiert auf dedizierten Storage-Konfigurationen, wie ein Switched Storage-Area Network (SAN) oder Direct Serial-Attached SCSI. Dedizierter Speicher und ihre Prozessoren helfen dabei, den Disk-I/O-Durchsatz zu maximieren. Eine weitere Überlegung betrifft den genutzten Server-Speicher, was auf Benchmark-Ergebnissen basieren sollte. Das Ziel ist es hierbei, den maximalen Durchsatz gegen CPU-Auslastung auszugleichen.

Die Anwendungskonfigurationen, die in FTDW skizziert ist, vor allem das SQL Server-Setup, müssen ebenfalls berücksichtigt werden. Die Leitlinien klären zum Beispiel die Frage, welche Startoptionen beim Start von SQL Server gesetzt sein müssen. Die Speichermenge, die auf dem SQL Server zum Einrichten der Ressourcenkontrolle zugeordnet ist, muss ebenfalls ausreichen. Die Richtlinien enthalten auch detaillierte Angaben über die Konfiguration der drei Speicher-und Dateisystemschichten, aus denen sich eine typische Datenbank aufbaut: Das physische Festplatten-Array, das Betriebssystem-Laufwerk und die Zuordnung der eigentlichen Datenbankdateien.

Data Warehouse Best Practices

Die FTDW-Dokumentation enthält eine Reihe von Best Practices für die Optimierung eines Systems, das Data-Warehouse-Workloads verarbeiten muss. Insbesondere die Planung der Datenarchitektur, die Verwaltung von Daten-Fragmentierung und das Laden von Daten müssen auch beachtet werden.

Best Practices zur Daten-Architektur zum Beispiel decken gruppierte Tabellenstrukturen, Tabellenpartitionen, Seitenkomprimierung und Indizes ab. Die Richtlinien legen besonderes Augenmerk auf Columnstore Indexes und auf Fragen bezüglich der Speicherverwaltung und der Unterscheidung zwischen normierten Datenmodellen und Dimensionen.

Darüber hinaus bietet die FTDW Dokumentation eine Reihe von Best Practices in Bezug auf die Dateisystem-Fragmentierung speziell bei Page Allocations und Extent Management. Doch die Dokumentation geht auch auf Index-Fragmentierung und Dateigruppen-Setup ein. Im Hinblick auf das Laden von Daten decken die Best Practices inkrementelle Lasten und Datenmigration für Heap- und Clustertabellen ab.

Das FTDW-Programm

Das Programm bietet umfangreiche FTDW-Leitlinien für den Aufbau eines Data Warehouses. Zusätzlich zu dem, was wir hier besprochen haben, enthält die Dokumentation Details über die Gestaltung und Qualifizierung der FTDW-Referenzarchitektur, mit einem Schwerpunkt auf Hardware-und Datenbankvalidierungsprozesse. Außerdem sind Anlagen über die FTDW-Systemdimensionierung und Tools sowie Details über Arbeitsbelastung für das Testen und Validieren einer benutzerdefinierten FTDW-Plattform enthalten.

Wenn Sie planen, in absehbarer Zeit ein SQL-Server-2012-Datawarehouse aufzubauen, ist es sinnvoll, sich mit FTDW auseinanderzusetzen. Auch wenn Sie die Richtlinien nicht alle beachten, werden Sie trotzdem feststellen, dass es sich um eine nützliche Ressource handelt, die Ihnen aufzeigt, wie eine effektive Data-Warehouse-Plattform geplant wird.

Folgen Sie SearchEnterpriseSoftware.de auch auf Facebook, Twitter und Google+!

Artikel wurde zuletzt im Mai 2014 aktualisiert

Erfahren Sie mehr über Datenverwaltung

- GOOGLE-ANZEIGEN

ComputerWeekly.de

Close