So adressieren Sie technische Veränderungen im Rechenzentrum
Die Entwicklung von Rechenzentren schreitet rasch voran. Einige Änderungen, wie die Erhöhung der Temperaturen, sind für einen nachhaltigeren Betrieb von Rechenzentren notwendig.
Die Fortschritte beim Betrieb moderner Rechenzentren führen zu neuen Möglichkeiten und Herausforderungen für die Verwaltung. Die jüngsten Änderungen an den Standards und dem Design moderner Rechenzentren maximieren sowohl die betriebliche als auch die energetische Effizienz.
Das moderne Rechenzentrum ist weitaus anspruchsvoller als seine Vorgänger. Mit der richtigen Wartung und Verwaltung können die heutigen Rechenzentren neue Hardwaregenerationen über Jahre hinweg unterstützen und den Energieverbrauch erheblich senken. Die meisten Änderungen betreffen den Luftstrom und die steigenden Temperaturen im Rechenzentrum. Es ist wichtig zu wissen, wie diese neuen Möglichkeiten zu handhaben sind, um die damit verbundenen Chancen voll auszuschöpfen.
Lufteinschluss
Die meisten modernen Rechenzentren verwenden Lufteinschlüsse, um die Isolierung von heißen und kalten Gängen zu maximieren. Das bedeutet, dass massive Platten oder Kunststoffstreifen und Türen am Ende der Reihen installiert werden, um entweder den heißen oder kalten Gang abzusperren.
Die Abschirmung sollte eng zwischen den Oberseiten der Schränke und der Decke anliegen. Die Türen sollten selbstschließend sein und gut abdichten, um die Lufttemperatur und -zirkulation zu regulieren. Die Schränke sollten über Bodendichtungen verfügen, damit keine Luft unter den Rädern oder Stellfüßen entweicht. Wenn Administratoren neue Schränke installieren, müssen sie die Einhausung anpassen, um die Dichtigkeit zu gewährleisten.
Die Eindämmung erfordert, dass die IT-Abteilung alle ungenutzten Schranköffnungen mit Abdeckplatten ausfüllt. Für kleine Räume sind 1U- und 2U-Blindplatten (HE, Höheneinheit) erhältlich, aber der Kauf größerer Mengen kann kostspielig sein. Blindplatten können größere Räume kostengünstiger ausfüllen als einzelne Platten. Blindplatten haben eine Höhe von 27 U, sind aber in 1-U-Schritten geritzt, so dass sie auf die entsprechende Größe zugeschnitten werden können.
Blindplatten sind in modernen Rechenzentren nützlich, in denen es Raum für zukünftiges Wachstum in freien Schränken gibt. Durch die Verwendung von Abdeckplatten oder -blechen kann die kalte und heiße Luft ordnungsgemäß durch die Serverschränke strömen. Wären diese Platten nicht vorhanden, würde die heiße Luft stärker durch das Rechenzentrum zirkulieren und dazu führen, dass sich die Klimaanlage häufiger einschaltet.
Abbildung 1: Das Nutzen von Abdeckplatten ist von Vorteil für das Luftstrommanagement.
Überwachung der Temperatur
Zu den Veränderungen im Rechenzentrum gehören höhere Betriebstemperaturen, wobei heutige Strom- und Kühlsysteme in der Lage sind, die Kapazität an die tatsächliche IT-Last anzupassen, da ausführlichere Betriebsdaten vorliegen.
Der Betrieb eines hochmodernen Rechenzentrums innerhalb der ASHRAE-Wärmehülle erfordert eine gute Temperaturüberwachung, da es unmöglich ist, eine völlig gleichmäßige Luftverteilung im Raum zu erreichen. Klimaanlagen verfügen über die üblichen Auslass- und Rücklufttemperatursensoren, aber diese reichen für das Wärmemanagement nicht aus.
Die meisten modernden Schaltschrank-Steckdosenleiten sind mit zusätzlichen Temperatur- und Feuchtigkeitsfühlern ausgestattet, die über die gleichen Netzwerkverbindungen wie die Stromversorgung überwacht werden. Diese Sensoren sollten sich vor und hinter der IT-Hardware und an zwei oder drei verschiedenen Stellen entlang der Schränke befinden. So wird sichergestellt, dass sie eine klare Darstellung der Daten über die thermischen Bedingungen im gesamten Raum liefern. Die Ergebnisse der Sensoren werden auf einem an das System angeschlossenen Monitor angezeigt.
Die an den Schränken angebrachten Thermoleisten zeigen nur die Temperatur des Metalls an, nicht die der Umgebungsluft. Es gibt jedoch Paneele, die eine Luftströmung um die Temperaturstreifen herum ermöglichen, wodurch die Umgebungsluft überwacht wird. Infrarot-Punktmessgeräte überwachen auch die Oberflächentemperatur der Geräte, können aber nicht die Lufttemperatur messen.
Luftgleichgewicht
Klimaanlagen für Rechenzentren werden normalerweise auf 24 Grad Celsius eingestellt, damit die am weitesten entfernten Schränken die maximale Servereintrittstemperatur von 27 Grad Celsius nicht überschreiten. Das bedeutet, dass heiße Gänge bis zu 35 Grad Celsius erreichen können, was jetzt nicht mehr als gefährlich für die Geräte angesehen wird.
Eine eng gekoppelte Kühlung, wie zum Beispiel in der Reihe, ist selbstregulierend, wenn die Temperatursensoren richtig angebracht sind. Die Unterflurkühlung erfordert das Hinzufügen oder Entfernen von Luftstrompaneelen oder die Einstellung der Luftklappen der Paneele, wenn sich die Belastung von Schrank zu Schrank ändert. Bei der Überkopfkühlung müssen möglicherweise die Klappen der Luftauslässe eingestellt werden. Es ist eine Verschwendung von Energie und Ressourcen, wenn eine unzureichende Lufttemperatur zu unnötigen Temperaturschwankungen führt.
Überwachung der Stromversorgung
Die heutigen Schaltschrank-Steckdosenleisten – intelligente Stromverteilereinheiten (iPDUs) – können die Last an jeder Steckdose sowie an jeder Phase der gesamten Leiste überwachen. Die Aufrechterhaltung des Phasengleichgewichts ist besonders wichtig, um sowohl die USV-Kapazität als auch die Energieeffizienz zu maximieren.
Es ist eine Verschwendung von Energie und Ressourcen, wenn unzureichende Ergebnisse der Lufttemperatur zu unnötigen Schwankungen der Temperatur führen.
Der Phasenausgleich in europäischen 240-Volt-Systemen bedeutet, dass Lasten von einer Steckdose zur anderen verschoben werden. Amerikanische 208-Volt-Systeme sind schwieriger. Das Verschieben einer Last von einer Steckdose zu einer anderen ändert eine Phasenlast, nicht aber die andere. Visuelle Phasenanzeigen auf den iPDUs geben sofortige Rückmeldung darüber, wie eine Last bei einer Änderung der Schaltung beeinflusst wurde.
Die Stromüberwachung ist auch entscheidend für die Aufrechterhaltung der Stromredundanz. In einem 2N-System sollte die Last auf jeder USV unter 50 Prozent gehalten werden, damit die andere USV die gesamte Last übernehmen kann, wenn eine ausfällt. Ein N+1-Design erfordert jedoch Kenntnisse über die modulare Struktur der USV. Bei einer 100-kW-USV, die aus 20-kW-Modulen besteht, bedeutet N+1 sechs 20-kW-Module, und die Gesamtlast muss unter 100 kW gehalten werden. Dadurch wird sichergestellt, dass das zusätzliche 20-kW-Modul die verbleibenden fünf nicht überlastet. Ebenso muss eine 500-kW-N+1-USV mit 50-kW-Modulen unter 500 kW gehalten werden, um den Redundanzschutz zu gewährleisten.
Feuerschutz
Rechenzentren benötigen ein Ansaugraucherkennungssystem als Ergänzung zu einer normgerechten Branderkennung und -unterdrückung. Diese Systeme nehmen ständig Luftproben im gesamten Gebäude und können auf eine hohe Empfindlichkeit eingestellt werden. Das ermöglicht ein persönliches Eingreifen, die Identifizierung der Rauchquelle und die Löschung mit Handfeuerlöschern viel früher als bei herkömmlichen Brandmeldern.
Frühzeitige Warnmeldungen müssen sowohl dem IT-Betrieb als auch dem Sicherheitsdienst angezeigt werden, um das Risiko der Auslösung eines vollständigen Feueralarms zu verringern. Dadurch wird vermieden, dass die Feuerwehr auftaucht und den Notausschalter betätigt.
DCIM
Der beste Weg, all diese Systeme zu überwachen und die Masse der verfügbaren Daten in verwertbare Informationen umzuwandeln, ist ein Softwarepaket für Data Center Infrastructure Management (DCIM). Die oben genannten Systeme verfügen über Hunderte von Überwachungspunkten, die mehr Daten produzieren, als der menschliche Verstand realistischerweise erfassen und verarbeiten kann.
Ein DCIM-System kann bei richtiger Auswahl, Installation und Wartung Daten in leicht verständliche Informationen umwandeln. In großen Betrieben kann es den IT-Bestand von der Bestellung über die Installation bis hin zur Stilllegung verwalten. Ein DCIM kann auch überwachen, ob Softwareversionen auf dem neuesten Stand sind. Es kann sogar potenzielle Strom- und Kühlungsausfälle vorhersagen, bevor sie auftreten.