Definition

Datenintegrität

Was ist Datenintegrität?

Datenintegrität ist die Gewährleistung, dass digitale Informationen unverfälscht sind und nur von autorisierten Personen abgerufen oder geändert werden können.

Datenintegrität beschreibt Daten, die während ihres gesamten Lebenszyklus auf folgende Weise vollständig, genau, konsistent und sicher aufbewahrt werden:

Vollständig. Daten werden in ihrer vollständigen Form aufbewahrt, und es werden keine Datenelemente gefiltert, gekürzt oder verloren. Wenn beispielsweise 100 Tests durchgeführt werden, spiegeln vollständige Daten die Ergebnisse aller 100 Tests wider. Tests, die fehlgeschlagen sind oder zu unerwünschten Ergebnissen geführt haben, werden nicht aus Datenanfragen ausgelassen.

Genau: Daten werden in keiner Weise verändert oder aggregiert, die die Datenanalyse beeinträchtigen könnte. Beispielsweise werden Testergebnisse nicht auf- oder abgerundet, und alle Testkriterien oder -bedingungen sind gut dokumentiert und verständlich. Wiederholte Tests sollten zu denselben Ergebnissen führen.

Konsistent: Daten bleiben unverändert, unabhängig davon, wie oder wie oft auf sie zugegriffen wird und wie lange sie gespeichert sind. Beispielsweise sind Daten, auf die in einem Jahr zugegriffen wird, dieselben Daten, die heute generiert oder abgerufen werden.

Sicher: Daten werden auf sichere Weise verwaltet und können nur von autorisierten Anwendungen oder Personen abgerufen und verwendet werden. Darüber hinaus können sichere Daten nicht ohne Weiteres von böswilligen Akteuren ausgenutzt werden. Die Datensicherheit umfasst Aspekte wie Authentifizierung, Autorisierung, Verschlüsselung, Sicherung oder andere Maßnahmen zur Data Protection sowie die Protokollierung von Zugriffen.

Abbildung 1: Datenintegrität umfasst sowohl die physische als auch die logische Integrität.
Abbildung 1: Datenintegrität umfasst sowohl die physische als auch die logische Integrität.

Die Datenintegrität ist ein weit gefasster Begriff, der sich auf die Erfassung, Speicherung, den Zugriff und die Verwendung von Daten auswirkt. Der Begriff der Integrität ist ein zentraler Bestandteil vieler regulatorischer Compliance-Rahmenwerke, beispielsweise der Datenschutz-Grundverordnung (DSGVO).

Datenintegrität ist kein einzelnes Produkt, keine Plattform und kein Tool. Stattdessen handelt es sich um eine umfassende Umgebung, die durch eine Reihe von geltenden Standards, Regeln, Prozessen und Verfahren geschaffen wird, die in der gesamten Infrastruktur eines Unternehmens implementiert und von seinen Mitarbeitern, Partnern und Benutzern eingehalten werden.

Datenkorruption tritt auf, wenn während der Speicherung, dem Zugriff oder der Verarbeitung unerwünschte oder unerwartete Änderungen an Daten vorgenommen werden – all dies stellt einen Verlust oder eine Beeinträchtigung der Datenintegrität dar. Datenkorruption kann durch Hardwarefehler, menschliches Versagen, böswillige Handlungen oder Versagen der Datensicherheit verursacht werden.

Warum ist Datenintegrität wichtig?

Während traditionelle Unternehmen sich oft auf die Herstellung und den Vertrieb physischer Produkte konzentrierten, sind Unternehmen heute in der Regel durch die Bereitstellung digitaler Produkte und Dienstleistungen erfolgreich. Dieser Wandel erfordert enorme Datenmengen, die zum neuen Rohstoff der digitalen Wirtschaft geworden sind. Dies zeigt sich in drei wesentlichen Bereichen:

Geschäftsanalytik (Business Analytics). Ein traditioneller Grundsatz der frühen Computertechnik lautete: Garbage in, garbage out (Müll rein, Müll raus). Dies gilt sicherlich auch für die moderne Geschäftsanalytik für Unternehmensentscheidungen und Produktentwicklung. Daher ist die Datenintegrität für Analyseergebnisse von entscheidender Bedeutung, da fehlende oder ungenaue Daten zu schlechten Geschäftsentscheidungen oder Produktfehlern führen können.

Kundeninteraktionen. Unternehmen sammeln und verwenden enorme Mengen an Kundendaten, darunter auch sensible oder personenbezogene Daten (PII). Die Datenintegrität stellt sicher, dass Kunden korrekt behandelt werden, beispielsweise durch korrekte Kontogutschriften und Berichterstattung. Die Datensicherheit muss diese sensiblen Daten vor Verlust und Diebstahl schützen.

Compliance: Unternehmen sind in der Regel verpflichtet, Daten für einen bestimmten Zeitraum aufzubewahren, um sicherzustellen, dass die Geschäftsprozesse in Übereinstimmung mit den geltenden Branchenstandards und gesetzlichen Vorschriften erfolgen. Die Datenintegrität ist für eine vollständige, genaue und konsistente Berichterstattung für alle Compliance-Zwecke von entscheidender Bedeutung. Andernfalls kann das Unternehmen gegen Vorschriften verstoßen und mit Geldstrafen und anderen rechtlichen Maßnahmen belegt werden.

Folglich erfüllt die Datenintegrität dieselbe wesentliche Funktion wie jede physische Qualitätskontrolle in einem traditionellen Unternehmen, indem sie sicherstellt, dass das Ausgangsmaterial korrekt, sicher und für den vorgesehenen Zweck geeignet ist.

Arten der Datenintegrität

Die Datenintegrität umfasst sowohl physische als auch logische Aspekte:

Physische Integrität. Dazu gehören Probleme im Zusammenhang mit der Speicherung und dem Abruf von Daten – in erster Linie Storage-Geräte, Memory-Komponenten und die dazugehörige Hardware. Wenn beispielsweise eine Festplatte oder eine Memory-Einheit beschädigt ist, sind die darauf gespeicherten Daten zwangsläufig betroffen. Es gibt viele Gefahren, die die Datenintegrität physischer Speicherhardware beeinträchtigen oder sogar beschädigen können:

  • Hardwarefehler und -ausfälle
  • Konstruktionsfehler und -mängel
  • natürliche Abnutzung wie Korrosion
  • Stromausfälle und -unterbrechungen
  • Naturkatastrophen
  • Strahlung und extreme Umweltbedingungen wie Temperatur und Druck

Unternehmen können die physische Integrität ihrer Daten verbessern, indem sie eine Hardware-Infrastruktur implementieren, die redundante Speichersubsysteme wie RAID mit batteriegepuffertem Schreib-Cache umfasst, fortschrittliche fehlerkorrigierende Speichergeräte verwenden, geclusterte und verteilte Dateisysteme implementieren und Fehlererkennungsalgorithmen einsetzen, um Datenänderungen während der Übertragung zu erkennen. Unternehmen setzen häufig eine Vielzahl von Hardwaregeräten und -techniken ein, um die physische Integrität von Daten zu verbessern.

Logische Integrität. Selbst wenn die Hardwaregeräte und die Infrastruktur einwandfrei funktionieren, gibt es mehrere Faktoren, die die Richtigkeit oder Sinnhaftigkeit von Daten im jeweiligen Kontext beeinflussen. Sind die Daten sinnvoll oder haben sie sich unerwartet verändert? Die logische Integrität kann durch schlechtes Softwaredesign und Softwarefehler sowie durch menschliches Versagen und Fehlverhalten beeinträchtigt werden. Es gibt vier Haupttypen der logischen Integrität:

  1. Entitätsintegrität. Diese stellt sicher, dass kein Datenelement wiederholt vorkommt und dass keine kritischen Dateneinträge leer oder null sind. Dies ist eine gängige Überlegung zur logischen Integrität in relationalen Datenbanksystemen.
  2. Referenzielle Integrität. Diese Regeln definieren, wie Daten in einer Datenbank gespeichert und verwendet werden und dass nur autorisierte Änderungen, Ergänzungen oder Löschungen vorgenommen werden können. Diese Regeln verhindern doppelte Daten, gewährleisten die Datengenauigkeit oder eliminieren unzutreffende Daten.
  3. Domänenintegrität. Sie spiegelt das Format, den Typ, die Menge und den Wertebereich oder Umfang akzeptabler Datenwerte innerhalb einer Datenbank wider. Wenn Daten beispielsweise numerisch sein sollen, kann ein alphanumerisches Datenelement abgelehnt werden.
  4. Benutzerdefinierte Integrität. Hierbei handelt es sich um zusätzliche Regeln und Einschränkungen, die entsprechend den spezifischen Anforderungen der Organisation implementiert werden und nicht durch die ersten drei Integritätsarten abgedeckt sind.

Physische und logische Integrität werden separat definiert, können jedoch häufig miteinander in Zusammenhang stehen. Beispielsweise kann ein Null-Datenstrom die logische Integrität oder die Entitätsintegrität verletzen, aber die Ursache für die Null-Daten kann auf einen ausgefallenen Sensor im Internet der Dinge (IoT) zurückzuführen sein.

Was sind Risiken für die Datenintegrität?

Die Datenintegrität kann aus verschiedenen Gründen verloren gehen:

  • Menschliche Fehler. Daten können versehentlich gelöscht, falsch eingegeben oder geändert werden – beispielsweise eine falsche Kundenadresse – oder unvollständig bleiben.
  • Übertragungsfehler. Daten können bei der Übertragung zwischen zwei Systemen beschädigt werden oder verloren gehen – oder sogar gestohlen werden –, beispielsweise durch einen Netzwerkausfall oder einen falschen Speicherort, oder zwischen zwei physischen Standorten, beispielsweise beim Transport eines mit Daten gefüllten Speichergeräts an einen anderen Standort.
  • Böswillige Handlungen. Malware, Hacking und andere Cyberbedrohungen können wertvolle Daten stehlen, verändern oder zerstören. Dies kann zu einem Verlust sowohl der Datenintegrität als auch der Datensicherheit führen.
  • Unsachgemäße Infrastrukturkonfigurationen. Unzureichende Netzwerk- und Infrastruktursicherheit kann Schwachstellen offenlegen, die Angreifer ausnutzen können, um Daten zu stehlen, zu verändern oder zu zerstören. In allen Situationen, in denen es um Datenintegrität und Datensicherheit geht, sind ordnungsgemäße, gut dokumentierte und streng durchgesetzte Konfigurationsstandards unerlässlich.

Die Folgen eines Verlusts der Datenintegrität können je nach Umfang des Verlusts und der Art der betroffenen Daten von einer kleinen Unannehmlichkeit bis hin zu einer schweren geschäftlichen Katastrophe reichen. Führungskräfte aus Wirtschaft und Technologie investieren viel Zeit und Ressourcen, um Datenintegritätsverluste zu verstehen und zu verhindern.

So stellen Sie die Einhaltung der Datenintegrität sicher

Datenintegrität ist kein einfaches Konzept und kann nicht mit einem einzigen Software-Tool oder einer einzigen Vorschrift gewährleistet werden. Vielmehr handelt es sich um ein weites Feld, das Menschen, Prozesse, Regeln und verschiedene Tools umfasst, um ein Framework und Unterstützung bereitzustellen. Es gibt zwar keine universelle Lösung für Datenintegrität, aber zahlreiche Strategien, die zum Aufbau einer Umgebung beitragen können, die Datenintegrität unterstützt. Zu den gängigen Strategien gehören:

  • Mitarbeiterschulungen. Unternehmen erstellen in der Regel Richtlinien und Verfahren für die Erfassung, den Zugriff und den Schutz geschäftsbezogener Daten. Regelmäßige Schulungen helfen neuen Mitarbeitern, ihre Rollen und Verantwortlichkeiten im Bereich Datenintegrität zu verstehen und dieses Wissen auf dem neuesten Stand zu halten, wenn sich im Laufe der Zeit Änderungen ergeben.
  • Schaffen Sie eine Kultur der Integrität. Datenintegrität ist umso bedeutender, je mehr Führungskräfte und Manager sie als Unternehmensziel betrachten. Zusammenarbeit und die Akzeptanz von Integritätskonzepten auf allen Ebenen können zu besseren Datenintegritätsmaßnahmen führen.
  • Validieren Sie die Daten. Nehmen Sie sich Zeit, um die Daten zu überprüfen oder zu validieren. Dies kann besonders wichtig sein, wenn Daten aus Drittquellen stammen. Wenn ein Unternehmen beispielsweise Analysen von mehreren verschiedenen Datensätzen durchführt, lohnt es sich zu überprüfen, ob alle Datensätze konsistente – oder zumindest sinnvolle – Daten enthalten. Ein Datensatz mit stark abweichenden Daten kann verdächtig sein.
  • Verarbeiten Sie Daten sinnvoll. Überprüfen Sie Datensätze auf doppelte Einträge und entfernen Sie diese. Stellen Sie sicher, dass die Vorverarbeitung der Daten – wie zum Beispiel die Normalisierung oder Aggregation – keine Auswirkungen auf die Basisdaten hat.
  • Schützen Sie Daten. Regelmäßige Backups können dazu beitragen, die Datenintegrität zu gewährleisten, indem Daten an einen zweiten Speicherort kopiert werden. So ist sichergestellt, dass die Daten auch bei Hardware-, Infrastruktur- oder Sicherheitsverletzungen immer verfügbar sind.
  • Implementieren Sie starke Sicherheitsmaßnahmen. Stellen Sie sicher, dass der Datenzugriff durch starke Authentifizierungs- und Autorisierungskontrollen geschützt ist. Protokollieren Sie alle Datenzugriffe und bewahren Sie die Protokolle zur Überprüfung der Aktivitäten auf. Die Verschlüsselung ruhender (Data at Rest) und übertragener Daten (Data in Flight) kann zum Schutz vor unbefugtem Zugriff oder Diebstahl beitragen.

Datenintegrität vs. Datensicherheit vs. Datenqualität

Die Begriffe Integrität, Sicherheit und Qualität werden manchmal fälschlicherweise synonym verwendet. Obwohl die drei Begriffe eng miteinander verbunden sind, besitzen sie einzigartige Eigenschaften, die sie von ihren Begleitbegriffen unterscheiden.

Datenqualität bezieht sich auf die Zuverlässigkeit von Daten. Daten von guter Qualität müssen genau, vollständig, eindeutig und ohne Duplikate sein und rechtzeitig verfügbar sein, um nützlich zu sein.

Datensicherheit umfasst die Infrastruktur, Tools und Regeln, mit denen sichergestellt wird, dass nur autorisierte Anwendungen und Benutzer auf Daten zugreifen können, dass die Daten in einer geschäftskonformen Weise verwendet werden und dass die Daten vor Verlust, Diebstahl oder Missbrauch geschützt sind.

Datenintegrität ist ein weiter gefasster Begriff, der Aspekte der Datenqualität und -sicherheit umfasst und die ordnungsgemäße Aufbewahrung, angemessene Vernichtung und die Einhaltung der relevanten Branchen- und behördlichen Vorschriften gewährleistet.

Erfahren Sie mehr über Datensicherheit