Definition

Daten

In der Informatik und im Computerbereich sind Daten Informationen, die in eine Form übersetzt wurden, die für das Kopieren oder Verarbeiten effizient ist. In heutigen Computern und Übertragungsmedien sind Daten Informationen, die in eine binäre digitale Form umgewandelt wurden. Der Begriff Rohdaten bezeichnet Daten in ihrem einfachsten digitalen Format.

Das Konzept der Daten im Zusammenhang mit der Datenverarbeitung hat seine Wurzeln in der Arbeit von Claude Shannon, einem amerikanischen Mathematiker, der als Vater der Informationstheorie bekannt ist. Er führte binäre digitale Konzepte ein, die auf der Anwendung der Booleschen Logik mit zwei Werten auf elektronische Schaltungen basierten.

Binäre Ziffernformate liegen CPUs, Halbleiterspeichern und Festplattenlaufwerken sowie vielen der heute in der Informatik üblichen Peripheriegeräte zugrunde. Frühe Computereingaben für Steuerung und Daten erfolgten in Form von Lochkarten, gefolgt von Magnetband und Festplatten.

Schon früh zeigte sich die Bedeutung von Daten im geschäftlichen Kontext durch die Popularität der Begriffe Datenverarbeitung und elektronische Datenverarbeitung, die eine Zeit lang die gesamte Bandbreite der heute als Informationstechnologie bekannten Technik abdeckten.  Im Laufe der Geschichte der Datenverarbeitung in Unternehmen kam es zu einer Spezialisierung, und mit dem Wachstum der Datenverarbeitung in Unternehmen entstanden eigene Datenberufe.

Wie Daten gespeichert werden

Computer stellen Daten, einschließlich Video, Bilder, Töne und Text, als binäre Werte mit Mustern aus nur zwei Zahlen dar: 1 und 0. Ein Bit ist die kleinste Einheit von Daten und stellt nur einen einzigen Wert dar. Ein Byte ist acht Binärziffern lang. Speicherung und Speicher werden unter anderem in Megabyte und Gigabyte gemessen.

Die Maßeinheiten der Daten wachsen mit der Menge der gesammelten und gespeicherten Daten weiter. Der relativ neue Begriff Brontobyte zum Beispiel ist eine Datenspeicherung, die 10 hoch 27 Bytes entspricht.

Daten können in Dateiformaten gespeichert werden, wie in Großrechnersystemen mit ISAM und VSAM. Andere Dateiformate für die Datenspeicherung, -konvertierung und -verarbeitung enthalten durch Komma getrennte Werte. Diese Formate fanden Verwendung bei einer Vielzahl von Maschinentypen, als stärker strukturierte, datenorientierte Ansätze in der betrieblichen Datenverarbeitung Fuß fassten.

Eine größere Spezialisierung erfolgte mit DatenbankenDatenbankmanagementsystemen (DBMS) und relationale Datenbanktechnologien zur Organisation von Informationen.

Arten von Daten

Das Wachstum des Internets und die wachsenende Zahl von Smartphones in den letzten zehn Jahren führte zu einem sprunghaften Anstieg digitaler Daten. Die Daten umfassen heute Text-, Audio- und Videoinformationen sowie Aufzeichnungen von Log- und Web-Aktivitäten. Ein Großteil davon sind unstrukturierte Daten.

Der Begriff Big Data wird verwendet, um Daten im Petabyte-Bereich oder größer zu beschreiben. Big Data kann dabei mit den 3Vs dargestellt werden – Volume, Variety und Velocity (Volumen, Vielfalt und Geschwindigkeit). Mit der Ausbreitung des webbasierten E-Commerce haben sich große datengesteuerte Geschäftsmodelle entwickelt, die Daten als einen Wert an sich behandeln. Solche Trends haben auch zu einer größeren Besorgnis über die gesellschaftliche Nutzung von Daten und den Datenschutz geführt.

Daten haben eine Bedeutung, die über ihre Verwendung in auf Datenverarbeitung ausgerichteten Computeranwendungen hinausgeht. So wird zum Beispiel bei der Verbindung elektronischer Komponenten und der Netzwerkkommunikation der Begriff Daten oft von Control Information, Control Bits und ähnlichen Begriffen unterschieden, um den Hauptinhalt einer Übertragungseinheit zu identifizieren.

Darüber hinaus wird der Begriff Daten in der Wissenschaft verwendet, um einen gesammelten Bestand an Fakten zu beschreiben. Dies ist auch in Bereichen wie Finanzen, Marketing, Demographie und Gesundheit der Fall.

Datenmanagement und -nutzung

Mit der Verbreitung von Daten in Unternehmen und der Wissenschaft wurde zusätzliches Augenmerk auf die Sicherung der Datenqualität gelegt, indem Duplikate reduziert und die Verwendung der genauesten und aktuellsten Datensätze garantiert wird.

Zu den vielen Schritten, die mit modernem Datenmanagement verbunden sind, gehören Datenbereinigung sowie Extraktions-, Transformations- und Ladeprozesse (ETL) zur Integration von Daten. Die zu verarbeitenden Daten werden inzwischen durch Metadaten ergänzt, die Administratoren und Benutzern helfen, Datenbankinhalte und andere Daten zu verstehen.

Analyseverfahren, die strukturierte und unstrukturierte Daten kombinieren, sind nützlich geworden, da Organisationen versuchen, aus solchen Informationen Kapital zu schlagen. Systeme für diese Analysen streben zunehmend nach Echtzeit-Performance, so dass sie so aufgebaut sind, dass sie eingehende Daten verarbeiten können, die mit hohen Leseraten verarbeitet werden können.

Im Laufe der Zeit wurde die Idee der Datenbank für Operationen und Transaktionen auf die Datenbank für Berichte und prädiktive Datenanalysen (Predictive Analytics) ausgeweitet. Ein Beispiel ist das Data Warehouse, das für die Verarbeitung von Fragen zu Operationen für Geschäftsanalysten und Führungskräfte optimiert ist. Die zunehmende Betonung des Auffindens von Mustern und der Vorhersage von Geschäftsergebnissen hat zur Entwicklung von Data-Mining-Techniken geführt.

Datenmanagementprozess
Abbildung 1: Wie der Datenmanagementprozess funktioniert.

Datenspezialisten

Der Beruf des Datenbank-Administrators (DBA) ist ein Ableger der IT. Diese Datenbankexperten arbeiten an der Gestaltung, Abstimmung und Wartung der Datenbank.

Der Beruf des Datenmanagers hat sich fest etabliert, als das relationale Datenbankmanagementsystem (RDBMS) ab den 1980er Jahren in Unternehmen breite Anwendung fand. Der Aufstieg der relationalen Datenbank wurde zum Teil durch die Structured Query Language (SQL) ermöglicht. Später entstanden NoSQL-Datenbanken als Alternative zu den etablierten RDBMS.

Heute beschäftigen Unternehmen Datenmanagementexperten oder weisen Mitarbeitern die Rolle der Datenverwaltung zu, was die Durchführung von Datenverwendungs- und Sicherheitsrichtlinien umfasst, wie sie in Data-Governance-Richtlinien beschrieben sind.

Der Titel Data Scientist beschreibt Spezialisten, die sich auf Data Mining und Analyse konzentrieren. Der Vorteil der anschaulichen Darstellung der Data Science (Datenwissenschaft) hat sogar den Data Artist (Datenkünstler) hervorgebracht. Dies sind Personen, die Daten auf kreative Weise grafisch darstellen und visualisieren.

Diese Definition wurde zuletzt im September 2020 aktualisiert

Erfahren Sie mehr über Business-Software

ComputerWeekly.de
Close