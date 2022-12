Mit Tools für das Datenqualitätsmanagement lassen sich viele der Prozesse automatisieren, die erforderlich sind, um sicherzustellen, dass die Daten in den Bereichen Analyse, Datenwissenschaft und maschinelles Lernen für den jeweiligen Zweck geeignet sind. Unternehmen müssen das Tool finden, das am besten geeignet ist, um bestehende Datenpipelines zu bewerten, Qualitätsengpässe zu identifizieren und verschiedene Abhilfeschritte zu automatisieren.

Zu den Prozessen, die mit der Sicherstellung der Datenqualität verbunden sind, gehören Data Profiling, die Verfolgung der Datenherkunft und Datenbereinigung. Insgesamt kann es sinnvoll sein, ein Tool oder eine Reihe von Tools zu identifizieren, das/die mit den bestehenden Datenpipeline-Workflows des Unternehmens übereinstimmt/übereinstimmen. Kurzfristig ist es manchmal hilfreich, spezifische Lücken oder Herausforderungen im Datenqualitätsprozess zu identifizieren.

„Es ist am besten, sich zunächst darauf zu konzentrieren, welche Tools und Systeme ersetzt werden müssen“, sagt Jeff Brown, Teamleiter für BI-Projekte bei Syntax, einem Anbieter von Managed Services.

Zunächst wird gemeinsam mit den Teams ermittelt, was sich am stärksten auf die Verbesserung der datengesteuerten Kultur auswirken wird.

„Zu den wichtigsten Überlegungen gehören die Gesamtkosten, die Auditierbarkeit, die einfache Einrichtung von Richtlinien und Standards, der Schulungsaufwand für die Nutzung des Tools, die Skalierbarkeit des Tools, um mit den zunehmenden und sich weiterentwickelnden Datenquellen Schritt zu halten, und die Benutzerfreundlichkeit“, sagt Terri Sage, CTO von 1010data, einem Anbieter von analytischer Intelligenz für den Finanz-, Einzelhandels- und Verbrauchermarkt.

Parsing-Funktionen helfen dabei, Daten in ihre Bestandteile zu zerlegen. Dies unterstützt dabei, die Ursache von Datenqualitätsproblemen zu ermitteln und nachgelagerte Datensätze zu kennzeichnen, wenn in einer Datenpipeline Probleme auftreten.

Ataccama wurde 2007 gegründet, um die von Adastra, einer Datenanalyse- und KI-Plattform, selbst entwickelten Datenaufbereitungstools zu vermarkten. Ataccama hat sich darauf spezialisiert, Rohdaten in wiederverwendbare Datenprodukte umzuwandeln, die verschiedene KI-, Analyse- und Betriebsaufgaben in einem Unternehmen unterstützen. Ein wichtiger Aspekt dabei ist die Sicherstellung der Datenqualität für große Datenpipelines durch selbststeuernde Funktionen für automatische Datenklassifizierung, automatische Datenqualität und Dokumentation der Zugriffsrichtlinien.

Precisely Trillium Quality

Precisely ist der moderne Name für einen Anbieter von Datentransformations-Tools, den es seit den späten 1960er Jahren gibt. Das Unternehmen wurde als Whitlow Computer Systems gegründet und konzentrierte sich auf Datentransformation. In den 1980er Jahren wurde es in Syncsort umbenannt und 2020 in Precisely. Jeder neue Markenname steht für eine Verlagerung der aktuellen Anforderungen der Branche und neue Technologien.

Kürzlich wurde Infogix mit seinen Datenqualitäts-, Governance- und Metadatenfunktionen übernommen. Zu den aktuellen Datenqualitätsangeboten gehören Precisely Trillium Quality, Precisely Spectrum Quality und Precisely Data360. Eine große Stärke ist ein umfangreicher Satz von Geokodierungs- und Geodatenstandardisierungs- sowie Anreicherungsfunktionen. Es ist erwähnenswert, dass die Tools zusammen mit ihren Anbietern separat erworben wurden. Daher müssen Unternehmen möglicherweise zusätzliche Integrationskosten für Workflows einplanen, die diese verschiedenen Tools umfassen.