Attributanalyse: Attributnamen richtig setzen

Der Namen eines Attributs sollte zu den darin gespeicherten Daten passen, da sprechende Namen den Inhalt besser verständlich machen als kryptische Bezeichnungen.

Der Namen eines Attributs sollte zu den darin gespeicherten Daten passen, da sprechende Namen (z. B. MITARBEITER_ID) den Inhalt besser verständlich machen lassen als kryptische Bezeichnungen (z. B. MID).

In der Attributnamenanalyse prüft der Datenanalyst deshalb die Namen aller Attribute auf Verständlichkeit und Aussagekraft. Die Verständlichkeit bei der Nutzung wird erhöht, wenn man den Attributen einen solchen Namen gibt, der auch außerhalb des Kontextes seiner Tabelle aussagekräftig ist. So sollte man beispielsweise dem Attribut mit der Mitarbeiternummer in der Tabelle MITARBEITER den Namen MITARBEITER_ID statt ID geben. Wenn die Attributwerte in einem Prozess weiterverarbeitet werden, fehlt ansonsten der Kontextbezug zu der ursprünglichen Tabelle. Kommen dann bei der Integration weitere IDs hinzu, ist auf den ersten Blick nicht mehr zu erkennen, welche ID welche eindeutige Nummer darstellt.

Enthält ein Attributname einen Hinweis auf den Datentyp (z. B. EINKOMMEN_NR) oder die Funktion (z. B. KUNDE_ID), so sollte dieser auch richtig sein. Beispielsweise können mit ID bezeichnete, aber nicht eindeutige Attribute genauso zu einem falschen Verständnis führen wie solche mit NR und nichtnumerischem Inhalt. Ein Beispiel hierfür ist in der Abbildung das Attribut BERUFSGRUPPEN_NR, dessen Werte nur zu 72,5 Prozent numerisch sind.

Zusätzlich wird analysiert, ob die Namen eindeutig sind oder Synonyme/Homonyme existieren. Der Business-Analyst kann entweder die Attribute und deren Werte betrachten oder den Hinweisen einer Domänen-Analyse nachgehen: Findet er unterschiedlich benannte Attribute mit der gleichen Domäne, so deutet das auf Synonyme hin; entdeckt er hingegen unterschiedliche Domänen in gleichnamigen Attributen, so ist das ein Hinweis auf Homonyme. Synonyme kann er berichtigen, indem er einen eindeutigen Namen festlegt und durchgängig verwendet. Bei Homonymen hingegen muss er die Namen der betroffenen Attribute so ändern, dass sie eindeutig sind.

In der Praxis kommt es öfters vor, dass nicht mehr genutzte Attribute für neue Inhalte zweckentfremdet werden, ohne den Namen ebenfalls anzupassen. Die möglichen Gründe sind: Man hat es schlichtweg vergessen oder man hat, um den Aufwand zu reduzieren, die Abfragen auf dieses Attribut und die dieses Attribut verwendenden Prozesse nicht aktualisieren wollen. Ein Indiz hierfür ist, dass die Werte eines Attributs nicht mit den anhand des Attributnamens erwarteten Werten übereinstimmen. Ein Beispiel: In einem Attribut STATUS werden mit Hilfe der Muster- oder Domänen-Analyse Telefonnummern gefunden. Meist ist es aber sehr schwierig, diese zweckentfremdeten Attribute zu finden, da in der Regel diese Attribute gemischt alte und neue Werte enthalten. So sind in dem Beispiel mit dem Attribut STATUS passende Statusinformationen und unpassende Telefonnummern enthalten.

Über den Autor:

Detlef Apel ist Senior-Berater im Center of Competence Business Intelligence bei Capgemini. Sein Spezialgebiet ist das Informationsqualitätsmanagement in allen Facetten, in dem er seit vielen Jahren große Unternehmen verschiedener Branchen erfolgreich bei Konzeption, IT-Architektur, Optimierung, Realisierung und Einführung berät und unterstützt. Als Redner auf verschiedenen Konferenzen sowie als Autor diverser Fachartikel und des Fachbuchs „Datenqualität erfolgreich steuern – Praxislösungen für Business-Intelligence-Projekte“ stellt er sein Wissen und seine langjährigen Projekterfahrungen der DWH-/BI-Gemeinschaft zur Verfügung.

Folgen Sie SearchEnterpriseSoftware.de auch auf Twitter, Google+ und Facebook!

Artikel wurde zuletzt im Juli 2009 aktualisiert

Erfahren Sie mehr über Big Data

- GOOGLE-ANZEIGEN

ComputerWeekly.de

Close