Datenverwaltung-Definitionen
- 
			G	
			Golden RecordAls Golden Record bezeichnet man eine Definition aller Datensätze in einem organisatorischen Ökosystem, der seinen Beteiligten als Referenz dienen soll. 
- 
			Google Cloud DataprocGoogle Cloud Dataproc ist ein Service für die Verarbeitung großer Datensätze. Er ist Teil der Public Cloud von Google und richtet sich an Data Scientists und Datenanalysten. 
- 
			Government to Government (G2G, Regierung-zu-Regierung)Government to Government beschreibt die gemeinsame Nutzung elektronischer Daten und Systeme zwischen Regierungsbehörden und anderen öffentlichen Organisationen. 
- 
			GraphQLGraphQL ist eine Open-Source-Datenabfragesprache. Sie wurde 2012 von Facebook entwickelt, um die Endpunkte von REST zu vereinfachen. 2015 wurde GraphQL veröffentlicht. 
- 
			H	
			Hadoop Data LakeEin Hadoop Data Lake ist eine Daten-Management-Plattform, die eine oder mehrere Hadoop-Cluster umfasst und für nicht-relationale Daten genutzt wird. 
- 
			Hadoop Distributed File System (HDFS)Das Hadoop Distributed File System ist das Basisdateisystem, das in Hadoop zum Einsatz kommt. Es ist Open Source und verwaltet Big-Data-Anwendungen innerhalb des File Systems. 
- 
			Hadoop-ClusterEin Hadoop-Cluster ist ein Computer-Cluster, der für die Speicherung und Analyse von großen Mengen unstrukturierter Daten entwickelt wurde. 
- 
			Halbstrukturierte Daten (Semistrukturierte Daten)Semistrukturierte Daten sind Informationen, die keiner allgemeinen Struktur unterliegen, sondern einen Teil der Strukturinformation, zum Beispiel als Metadaten, mit sich tragen. 
- 
			Hierarchisches Storage-Management (HSM)Hierarchisches Storage-Management nutzt Daten- beziehungsweise Storage Tiering, um Daten entsprechend ihrem Wert und ihrer Zugriffshäufigkeit dem passenden Speicher zuzuweisen. 
- 
			I	
			IBM (International Business Machines)IBM ist ein großes international agierendes Unternehmen, dass bereits Anfang des 20. Jahrhunderts gegründet wurde und sich sehr früh auf IT-Lösungen spezialisierte. 
- 
			Inline-DeduplizierungInline-Deduplizierung ist eine Methode zur Datenreduzierung, bei der redundante Daten nicht auf dem Zielspeicher abgelegt werden. Der Prozess erfolgt während des Datentransfers. 
- 
			IT-Servicemanagement (ITSM)IT-Servicemanagement optimiert IT-Dienste von Planung bis Support, senkt damit ihre Kosten, steigert die Qualität und schafft einen Mehrwert durch klare Prozesse und Standards. 
- 
			J	
			JavaScript Object Notation (JSON)JavaScript Object Notation, kurz JSON, ist ein textbasiertes, menschenlesbares Datenformat, das zum Austausch von Daten zwischen Webclients und Webservern genutzt wird. 
- 
			K	
			Komprimierung (Kompression)Komprimierung, oder auch Kompression, ist eine Methode die Größe von Daten und Dateien zu verringern und somit Speicherkapazitäten, Wiederherstellungszeiten und Kosten zu sparen. 
- 
			KonfigurationsmanagementKonfigurationsmanagement ist ein Governance- und Entwicklungsprozess zur Sicherstellung der Konsistenz zwischen physischen und logischen Assets in einer Betriebsumgebung. 
- 
			Kundendatenplattform (Customer Data Platform)Eine Kundendatenplattform stellt eine einheitliche Plattform für Kundeninformationen bereit, welche von anderen Systemen erfasst, angezeigt oder abgerufen werden können. 
- 
			Künstliches neuronales Netz (KNN)In der IT ist ein künstliches neuronales Netz (Artificial Neural Network) ein System aus Hard- und Software, das der Funktionsweise von Neuronen im Gehirn nachgebildet ist. 
- 
			L	
			Lemmatization (Lemmatisierung)Lemmatisierung fasst verschiedene gebeugte Versionen desselben Wortes zusammen und kommt beim Natural Language Processing, Natural Language Understanding und Chatbots zum Einsatz. 
- 
			Linear Tape File System (LTFS)Linear Tape File System ist ein Dateisystem für LTO-Bänder, mit denen Daten auf einem Tape so abgelegt und organisiert werden wie auf einer Festplatte, was die Zugriffe beschleunigt. 
- 
			LustreLustre ist ein Open-Source-Filesystem, das vor allem in Clustern beziehungsweise High-Performance-Computing-Umgebungen eingesetzt wird. Das Dateisystem basiert auf Linux. 
- 
			M	
			MapReduceMapReduce ist eine Komponente des Software-Frameworks Apache Hadoop, mit dem sich große Datenmengen auf Clustern mit Standardhardware verarbeiten lassen. 
- 
			MaschinendatenMaschinendaten sind digitale Informationen, die durch Computer, Mobilgeräte, eingebettete Systeme und andere vernetzte Geräte generiert werden. 
- 
			MetadatenMetadaten sind strukturierte Daten, die Informationen über andere Daten liefern, wie Autor, Erstellungsdatum und Dateigröße, und erleichtern das Auffinden und Verwalten dieser Daten. 
- 
			Multi-Tenancy (Mandantenfähigkeit)Wenn eine einzelne Softwareinstanz mehrere Kunden bedient, nennt sich diese Architektur Multi-Tenancy. Die Kunden oder Tenants können Teile der Anwendung anpassen. 
- 
			N	
			Normalisierung (Datenbanknormalisierung)Normalisierung ist der Prozess der Organisation von Daten in Datenbanktabellen, so dass die Ergebnisse bei der Verwendung der Datenbank immer eindeutig sind. 
- 
			O	
			Online Transaction Processing (OLTP)OLTP bezeichnet Systeme zur schnellen und zuverlässigen Abwicklung von Transaktionen in Echtzeit. Typische Einsatzfelder sind Banking, E-Commerce und Kassensysteme. 
- 
			Operational Data Store (ODS)Ein Operational Data Store ist eine Datenbank, die der Integration von Daten aus einer oder mehreren Datenquellen und als Zwischenbereich für ein Data Warehouse dient. 
- 
			P	
			PERT-DiagrammEin PERT-Diagramm ist ein Tool, das zur Planung, Organisation und Koordinierung von Aufgaben innerhalb des Projektmanagements eingesetzt wird. 
- 
			Projektmanagement (PM)Projektmanagement (PM) setzt auf etablierte Grundsätze, Verfahren und Richtlinien, um ein Projekt von der Konzeption bis zum Abschluss erfolgreich zu verwalten. 
- 
			R	
			Raw Data (Rohdaten, Quelldaten)Raw Data oder Rohdaten sind Daten, die nicht verarbeitet wurden und so auch nicht viele Informationen bieten. Erst eine Verarbeitung macht diese Daten zu nützlichen Informationen. 
- 
			Remote Access (Fernzugriff)Remote Access ermöglicht den Fernzugriff auf Computer oder Netzwerke über das Internet, um Daten, Anwendungen oder Dienste von überall zu nutzen. 
- 
			ReplikationBei der Replikation wird eine Kopie – also eine Replik – von daten oder Datensätzen angefertigt und an einem zweiten Speicherstandort für den Fall des Datenverlustes vorgehalten. 
- 
			Resilient File System (ReFS)Das Resilient File System (ReFS) ist ein Dateisystem für Windows-Betriebssysteme, das einige Einschränkungen des New Technology File System (NTFS) überwinden soll. 
- 
			ROT (Redundant, Outdated/Obsolet, Trivial Information)ROT-Informationen sind Daten, die keinerlei Wert für Unternehmen haben und trotzdem gespeichert sind, obwohl sie gelöscht werden können. Das verursacht mehrere Probleme. 
- 
			Rücksendenummer (RMA-Nummer)Eine Rücksendenummer oder RMA-Nummer (Return Merchandise Authorization) stellt sicher, dass Käufer ein defektes Produkt an den Händler zurücksenden und dabei nachverfolgen können. 
- 
			S	
			SAP Data HubMit SAP Data Hub können Unternehmen eine Datenpipeline aus verschiedenen Quellen aufbauen, die dann in neuen datengesteuerten Anwendungen genutzt werden können. 
- 
			SAP NetWeaver Business IntelligenceSAP Business Information Warehouse oder SAP NetWeaver Business Intelligence (SAP BI), ist ein BI-Paket, das für SAP-ERP-Anwendungen optimiert wurde. 
- 
			Schriftgutverwaltung (Records Management)Schriftgutverwaltung (Records Management) umfasst die sichere Überwachung und Verwaltung von digitalen oder Papierakten, unabhängig vom Format. 
- 
			Single Source of Truth (SSOT)Eine einzige verlässliche Datenquelle (Single Source of Truth, SSOT) hilft dabei, die negativen Auswirkungen von Datensilos zu verringern. Dazu nutzt sie Data Federation Software. 
- 
			Slice and DiceMit slice and dice wird in der IT das Zerlegen eines Informationsbestands in kleinere Teile verstanden. Es bedeutet aber auch, sie aus verschiedenen Blickwinkeln zu betrachten. 
- 
			StemmingStemming ist eine Methode, mit der unterschiedliche Versionen eines Wortes auf seinen Stamm reduziert wird. Dafür werden aufgefundene Suffixe und Präfixe entfernt. 
- 
			SternschemaDas Sternschema ist ein logisches Datenbankschema für Data-Warehouse-Anwendungen. Es besteht aus einer Faktentabelle und mehreren Dimensionstabellen. 
- 
			Strukturierte DatenStrukturierte Daten sind Daten, die in einem formatierten Repository, zum Beispiel einer Datenbank, organisiert sind, so dass sie sich leicht verarbeiten und analysieren lassen. 
- 
			Suchmaschinenoptimierung (Search Engine Optimization, SEO)Suchmaschinenoptimierung (Search Engine Optimization, SEO) beschäftigt sich mit der Optimierung einer Website, um ihre Sichtbarkeit für spezifische Suchanfragen zu erhöhen. 
- 
			Synthetische DatenSynthetische Daten sind Informationen, die künstlich erstellt und nicht durch reale Ereignisse generiert wurden. Sie dienen zum Beispiel als Ersatz für reale Testdatensätze. 
- 
			System of Record (SOR)Ein System of Record (SOR) ist ein System zur Speicherung und Wiederauffindung von Informationen. Erfahren Sie mehr über die verschiedenen Arten von SORs und ihre Vorteile. 
- 
			U	
			Unstrukturierte DatenUnstrukturierte Daten sind Informationen in verschiedenen Formen, die nicht herkömmlichen Datenmodellen entsprechen und nicht in relationalen Datenbanken gespeichert werden können. 
- 
			V	
			Die sechs Vs von Big DataDie wichtigsten Eigenschaften von Big Data werden üblicherweise mit den sechs Vs beschrieben: Velocity, Volume, Value, Variety, Veracity und Variability. 
- 
			W	
			Walled GardenWalled Gardens sichern Kontrolle und Nutzerbindung – doch sie erschweren Integration, bremsen Innovation und stärken Monopole. Wir erklären, die Grundlagen des Konzepts. 
- 
			Web-Based Enterprise Management (WBEM)Web-Based Enterprise Management stellt Industriestandards dar, mit denen Anwender IT-Prozesse im Internet verwalten können. Damit lassen sich unter anderem CIM-Daten austauschen. 
- 
			Wissensdatenbank (Knowledge Base)Eine Wissensdatenbank ist ein zentraler Speicherort, der meist Referenzdaten enthält, die Mitarbeiter oder Kunden zur Fehlerbehebung und zum Lernen nutzen können. 
- 
			WorkloadDer Begriff Workload beschreibt die Arbeit, die ein Server zum Beantworten einer Anfrage leistet. Es gibt verschiedene spezialisierte Workloads für verschiedene Aufgaben. 
- 
			Z	
			ZFSZFS ist ein lokales File-System, das zahlreiche Speicherfunktionen und einen logischen Volume-Manager bietet. Große Vorteile sind hohe Skalierbarkeit und Datenintegrität. 
 
			