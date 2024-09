Mit einem eigenen KI-Server kann man die Vorteile von KI erschließen, ohne Daten zu versenden und für das Training fremder Sprachmodelle (Large Language Model, LLMs) zur Verfügung zu stellen. Dadurch lassen sich personenbezogene Informationen, sensible Daten und Dateien mit KI verarbeiten, die einen erhöhten Datenschutz voraussetzen.

Steht entsprechende Hardware zur Verfügung, lassen sich mit Open-Source-LLMs nahezu alle Möglichkeiten nutzen, die auch mit öffentlichen KI-Anwendungen zur Verfügung stehen. Die komplette Verarbeitung erfolgt dabei On-Premises. Die Software steht darüber hinaus kostenlos zur Verfügung. Da es sich um Open Source handelt, kann zudem geprüft werden, ob es Schwachstellen oder Backdoors im Code gibt.

Hard- und Software für eigenen KI-Server

Für die Open-Source-Software entstehen keine Lizenzkosten für den KI-Server. Allerdings sollte die Hardware leistungsstark sein, da die Nutzer ansonsten das System nicht optimal nutzen können und auf öffentliche KI-Dienste ausweichen. Das ist aus Datenschutzgründen nicht ideal, da in vielen Fällen die Daten zum Training der zugrunde liegenden LLM verwendet werden.

Auf Hardwareseite sollte man auf leistungsstarke Server mit genügend Arbeitsspeicher, schnellen Datenträgern und entsprechender Leistung im Netzwerk setzen. CPU und GPU sollten ebenfalls performant und aktuell sein, wobei die KI-Berechnungen durch den Grafikprozessor erfolgt. Dieser stellt daher den größten Kostenfaktor dar.

Zu den bekanntesten und leistungsstärksten GPUs von Nvidia gehören die Modelle der Nvidia A100 und H100 Serien, die in der Ampere-/Hopper-Architektur gebaut sind. Diese GPUs bieten gute Leistung für KI-Training und Inferenz, insbesondere bei großen Sprachmodellen und anderen datenintensiven Aufgaben. Die Nvidia A100, die mit 80 GB HBM2e-Speicher ausgestattet ist, bietet eine Spitzenleistung von bis zu 312 TeraFLOPS bei gemischter Präzision (FP16/FP32). Diese GPU ist in verschiedenen Konfigurationen erhältlich, unter anderem als PCIe-Karte und als Teil von Nvidia DGX-Systemen. Die Preise für eine Nvidia A100 beginnen im Einzelverkauf bei etwa 10.000 bis 12.000 Euro, können aber in spezialisierteren Systemen deutlich höher ausfallen.

Die neuere Nvidia H100, die auf der Hopper-Architektur basiert, bietet im Vergleich zur A100 nochmals signifikante Verbesserungen in der Leistung, insbesondere bei der Arbeit mit Transformer-Modellen und im Bereich des beschleunigten Deep Learnings. Mit über 700 TeraFLOPS Leistung bei gemischter Präzision und einem verbesserten Speicherinterface ist sie das aktuelle Flaggschiff im Nvidia-Portfolio. Die H100 ist in der Regel nur in sehr spezifischen, hochintegrierten Systemen wie dem Nvidia DGX H100 verfügbar, und die Preise können je nach Konfiguration und Systemumgebung bis zu 30.000 Euro oder mehr betragen.

Neben den Highend-GPUs bietet Nvidia auch kostengünstigere Optionen, die sich besonders für kleinere Projekte oder den Einstieg in KI-Anwendungen eignen. Hierzu zählen vor allem die GPUs der Nvidia RTX Serie, wie die RTX 4090 und RTX 4080, die ursprünglich für Gaming und professionelle Visualisierungen entwickelt wurden, sich aber aufgrund ihrer hohen Rechenleistung und CUDA-Kompatibilität auch für KI-Entwicklungen eignen.

Nvidia RTX 4090 bietet mit 24 GB GDDR6X-Speicher und bis zu 82,6 TeraFLOPS FP32-Leistung eine passende Plattform für KI-Workloads, insbesondere für inferenzbasierte Anwendungen oder das Training kleinerer Modelle. Der Preis für die RTX 4090 liegt aktuell bei etwa 1.800 bis 2.000 Euro, je nach Anbieter und Verfügbarkeit. Eine etwas günstigere Option stellt die Nvidia RTX 4080 dar, die mit 16 GB GDDR6X-Speicher und einer FP32-Leistung von bis zu 49 TeraFLOPS ebenfalls für viele KI-Anwendungen ausreichend ist. Diese GPU kostet derzeit rund 1.300 bis 1.500 Euro.

Für noch preisbewusstere Anwender gibt es die Nvidia RTX 3060 und RTX 3070/3090, die ebenfalls für KI-Entwicklungen genutzt werden können, jedoch mit deutlichen Einschränkungen hinsichtlich der Rechenleistung und des Speichers. Diese GPUs bewegen sich preislich zwischen 400 und 700 Euro.