fledermausstudio - stock.adobe.c

SAP Datasphere: Datenmanagement und -analyse in SAP-Systemen

Mit SAP Datasphere können Unternehmen Daten aus verschiedenen Quellen integrieren, verwalten und analysieren. Die Cloud-Plattform ist speziell in SAP-Umgebungen praktisch.

Effektives Datenmanagement ist ein entscheidender Faktor für den Erfolg von Unternehmen. Daten sind die Basis moderner Geschäftsstrategien und ermöglichen fundierte Entscheidungen, effiziente Prozesse und innovative Geschäftsmodelle.

SAP Datasphere spielt dabei in SAP-Umgebungen eine zentrale Rolle. Dahinter verbirgt sich eine Cloud-Datenmanagementplattform, mit der sich Daten aus verschiedenen Quellen integrieren, verwalten und analysieren lassen. Als Datenquellen kommen Cloud- oder lokale Umgebungen, SAP- und Nicht-SAP-Systeme in Frage. Datasphere stellt eine einheitliche Umgebung für Datenintegration, Governance und Analyse zur Verfügung. 

Im Vergleich zu anderen SAP-Lösungen, wie zum Beispiel SAP BW/4HANA, konzentriert sich SAP Datasphere auf ein umfassendes  Datenmanagement. Während SAP BW/4HANA hauptsächlich für Data Warehousing genutzt wird, bietet SAP Datasphere erweiterte Funktionen für Datenintegration, Governance und Analyse. Die Lösung hat eine modulare und skalierbare Architektur, die eine Integration von Daten aus verschiedenen Quellen erlaubt.

Hauptkomponenten von SAP Datasphere

SAP Datasphere umfasst mehrere technische Hauptkomponenten, die eng zusammenarbeiten, um eine robuste Datenmanagementumgebung zu bieten. Benutzer können verschiedene Datenquellen einbinden, Datenflüsse überwachen und Zugriffskontrollen einrichten. Die Cloud-Anwendung hält zudem Modellierungswerkzeuge, einen Data Marketplace und Funktionen zur Datenherkunftsanalyse bereit. 

Zu den Kernfunktionen gehören Datenmodellierung, Datenintegration und die Verwaltung von virtuellen Arbeitsumgebungen, sogenannten Spaces, mit denen sich Datenobjekte isolieren und Ressourcen zuweisen lassen.

Diese Isolation erlaubt es, spezifische Speicherquoten festzulegen, Ressourcen zu kontrollieren und Workload-Klasseneinstellungen pro Space zu definieren. Jedes Space kann eigene Quellsystemverbindungen und eine gemeinsame Zeitdimension verwalten, was besonders nützlich ist, wenn verschiedene Geschäftseinheiten unterschiedliche Datenquellen verwenden.

So können beispielsweise Finanzen und Beschaffung ihre jeweiligen Datenquellen getrennt verwalten. Spaces bieten auch die Möglichkeit, den Benutzerzugriff zu steuern, indem sie bestimmten Benutzern oder Benutzergruppen Zugriff auf spezifische Spaces gewähren. Dies erleichtert die Verwaltung von Benutzerrechten. Zudem lassen sich Daten zwischen verschiedenen Spaces teilen. Durch die Konfiguration von Spaces können Unternehmen sicherstellen, dass die Nutzung der Ressourcen optimal auf ihre Bedürfnisse abgestimmt ist, was die Effizienz und Performance der gesamten Datenumgebung optimiert.

Datenintegration in SAP Datasphere

Datasphere erlaubt die Integration von Daten aus verschiedenen internen sowie externen Quellen und unterstützt ETL-Prozesse (Extraktion, Transformation, Laden). Mit einem integrierten Datenkatalog lassen sich die Daten verwalten und katalogisieren, damit sie Anwender schneller finden. In SAP Datasphere spielen zudem Datenverbindungen eine zentrale Rolle. Diese werden über einen eigenen Wissensgraphen visualisiert. Die Lösung unterstützt eine Vielzahl von Verbindungstypen, einschließlich direkter Verbindungen zu SAP-Anwendungen, Datenbanken wie Oracle und Microsoft SQL Server, generischen OData-Quellen sowie Hyperscaler- und Cloud-Anwendungen.

Eine bemerkenswerte Funktion ist der virtuelle Datenzugriff, bei dem Remote-Tabellen verwendet werden, die auf Tabellen in externen Systemen verweisen. Dies gestattet den Zugriff auf Daten, ohne sie in SAP Datasphere zu replizieren. Mit Remote-Tabellen lassen sich Daten in Echtzeit nutzen, indem Abfragen direkt an die Quellsysteme weitergeleitet werden, wodurch Speicherressourcen geschont werden. Gleichzeitig können Filter angewendet werden, um den Datentransfer zu optimieren.

Für Nutzer, die dennoch Daten replizieren möchten, stehen verschiedene Modi zur Verfügung, darunter vollständige Replikation, Echtzeit-Snapshot-Replikation und reiner Remote-Zugriff. Diese Optionen erlauben es Anwendern, den Datenzugriff je nach Anforderung und Performance-Bedarf anzupassen, ohne dass Änderungen an den bestehenden Datenmodellen erforderlich sind. Verbindungen können einfach über das Menü für das Space-Management oder direkt über den Verbindungsbereich konfiguriert und verwaltet werden, wobei auch die Validierung der Verbindungen unterstützt wird.

Ein zentraler Datenkatalog erleichtert das Metadatenmanagement und die Datenklassifizierung. SAP Datasphere bietet Katalogfunktionen, die das Erforschen, Organisieren und Kuratieren von Metadaten und Daten erleichtern, um Datenqualitäts- und Governance-Programme zu unterstützen.

Der Katalog ist über die Navigation verfügbar und enthält eine Hauptseite, Tag-Hierarchien und Überwachungsfunktionen, die für Power-User zugänglich sind. Nutzer können umfassende Suchfunktionen verwenden, um Daten zu finden und zu filtern. Der Katalog zeigt Metadaten an, die Änderungen und den Ursprung der Daten dokumentieren. Lineage-Funktionen unterstützen dabei, den Ursprung und die Auswirkungen von Datenänderungen zu verstehen. Glossarbegriffe, Tags und KPIs verbessern das Verständnis und die Auffindbarkeit von Daten. Tags und KPIs können vordefiniert und während der Anreicherung von Administratoren zugewiesen werden. Diese Funktionen unterstützen, den Kontext der Daten zu verstehen und deren Eignung zu bewerten. Schließlich ermöglicht der Katalog den direkten Zugriff auf Datenressourcen in SAP Analytics Cloud und im SAP Datasphere-Tenant.

Data Governance stellt in Datasphere sicher, dass Daten konsistent, genau und vertrauenswürdig sind. Es umfasst Richtlinien, Prozesse und Technologien zur Einhaltung von Datenqualitätsstandards und gesetzlichen Vorschriften. Zusätzlich koordiniert und automatisiert Data Orchestration Datenprozesse, um eine effiziente und fehlerfreie Datenverarbeitung zu gewährleisten. Die Funktion umfasst Workflow-Management und Prozessautomatisierung.

SAP Datasphere
Abbildung 1: Mit SAP Datasphere lassen sich Daten aus verschiedenen Quellen integrieren und für die Analyse verarbeiten.

Datenanalyse und KI-Integration

SAP Datasphere bietet Werkzeuge und Schnittstellen zur Durchführung fortschrittlicher Datenanalysen und zur Integration von künstlicher Intelligenz (KI) und Machine-Learning-Modellen (ML). Die Lösung stellt verschiedene Tools und Methoden zur Datenintegration bereit, einschließlich ETL-Prozesse, API-Integration und Echtzeit-Datenstromverarbeitung.

SAP Datasphere stellt dazu auch Funktionen zur Einhaltung von gesetzlichen und branchenspezifischen Vorschriften zur Verfügung, einschließlich Datenschutzgesetzen wie der EU-DSGVO. Audit-Funktionen erlauben die Nachverfolgbarkeit und Prüfung von Datenzugriffen und -änderungen. Umfassende Audit- und Sicherheitsfunktionen schützen die Datenintegrität und -vertraulichkeit. Dazu gehören Zugriffskontrollen, Verschlüsselung und regelmäßige Sicherheitsüberprüfungen.

SAP erweitert Datasphere regelmäßig

Im Juli 2024 hat SAP Datasphere mehrere neue Funktionen eingeführt. Eine der wichtigsten Neuerungen ist die Integration mit dem SAP Cloud Transport Management Service (TMS) auf der BTP-Plattform, die es zulässt, Content-Pakete über verschiedene Landschaften hinweg zu transportieren. Eine weitere Erweiterung ist die SCIM-API, die eine programmgesteuerte Verwaltung von Benutzern über einen SCIM 2.0-konformen Endpunkt gestattet. Dies erleichtert die Synchronisierung des Datasphere-Systems mit bevorzugten Identity-Management-Lösungen.

Darüber hinaus wurden elastische Compute-Knoten eingeführt, so dass sich bei Bedarf zusätzliche Rechen- und Verarbeitungskapazitäten zuweisen lassen, um Spitzenlasten zu bewältigen. Diese können im Systemmonitor überwacht und entsprechend geplant werden. Zusätzlich wurden verschiedene weitere Funktionen hinzugefügt, zum Beispiel das Werkzeug View as User, um die Auswirkungen von Datenzugriffskontrollen zu überprüfen, sowie Verbesserungen im Analytic Model. Benutzer können nun Datenvorschauen als Excel- beziehungsweise CSV-Dateien exportieren, Änderungen rückgängig machen oder wiederholen und die Ausrichtung des Diagrammlayouts ändern. Auch die Umbenennung von vielen Attributen gleichzeitig ist nun möglich.

Ebenfalls neu ist die Column-Level-Lineage, die eine detaillierte Analyse der Datenherkunft zulässt, indem sie die Quellen einzelner Spalten und deren Auswirkungen zeigt. Im Bereich der Datenintegration wurden mehrere Verbesserungen eingeführt, wie die Option, Ansichten und Objekte aus Open-SQL-Schemata in Transformationsflüsse einzubeziehen und Prozeduren aus Open-SQL-Schemata als Voraussetzung in Aufgabenketten zu verwenden. Administratoren müssen dafür entsprechende Ausführungsrechte erteilen. Neu ist auch die Optimierung der Replikationsflüsse, die das Hinzufügen von Objekten im aktiven Status erlaubt, ohne den Lauf zu stoppen. Zudem kann eine Thread-Anzahl von mehr als eins für Delta-Loads spezifiziert werden, was parallele Verarbeitung ermöglicht.

Erfahren Sie mehr über Data Governance

ComputerWeekly.de
Close