DIgilife - stock.adobe.com

BSI: Leitfaden zur Datenqualität in KI-Systemen vorgestellt

Der Einsatz von KI ist in Sachen Sicherheit und Daten ein sensibles Thema. Das BSI hat einen methodischen Leitfaden zur Datenqualität in KI-Systemen als Hilfestellung vorgestellt.

Das Bundesamt für Sicherheit in der Informationstechnik (BSI)  einen Katalog zur Qualitätssicherung von Trainingsdaten in KI-Systemen veröffentlicht. So würden in der KI-Verordnung (EU AI Act) die Qualitätsanforderungen an KI-Trainingsdaten definiert. Dazu gehören etwa Faktoren wie Fehlerfreiheit, Vollständigkeit und Relevanz.

Das Ziel der Dokumentenreihe Qualitycriteria for AI Trainingsdata in AI Lifecycle (QUAIDAL) sei es diese Anforderungen der KI-Verordnung in konkrete Maßnahmen, Methoden und Bausteine zu überführen. Dies soll Organisationen dabei unterstützen, die regulatorischen Vorschriften einhalten zu können. Gleichzeitig soll sich die technische Nachvollziehbarkeit im Entwicklungsprozess von KI-Systemen erhöhen.

„Wir müssen sicherstellen, dass Anwendungen mit Künstlicher Intelligenz hohen Qualitätsanforderungen entsprechen. Nur so können wir vertrauenswürdige KI herstellen und nutzen. Das BSI bietet mit diesem Katalog eine ganz konkrete Hilfestellung, die an der Basis ansetzt.“, so BSI-Präsidentin Claudia Plattner.

Die KI-Verordnung definiert für Anbieter von Hochrisiko-KI-Systemen detaillierte Anforderungen hinsichtlich Dokumentation, Datenmanagement und kontinuierlicher Qualitätssicherung. So würden sich die QUAIDAL-Dokumente insbesondere an diese Zielgruppe richten. Die Dokumentenreihe soll Unternehmen helfen, regulatorische Anforderungen umzusetzen und vertrauenswürdige KI-Anwendungen zu entwickeln.

KI-Verantwortliche und Entwickler sollen in den Dokumenten die passenden Maßnahmen zur Sicherstellung der Datenqualität finden und deren Umsetzung systematisch nachweisen können. Das Konzept der Dokumente sei modular und ließe sich künftig einfach erweitern, um neuen Entwicklungen Rechnung zu tragen.

Ein Entwurf des Leitfadens sowie zwei maschinenlesbare GitHub Repositories stünden ab sofort zu Verfügung. Das BSI betont, dass die Community eingeladen sei, aktiv mizuwirken und Vorschläge einzubringen.

Erfahren Sie mehr über Künstliche Intelligenz (KI) und Machine Learning (ML)