Fotolia

Graphdatenbanken: Behörden entdecken den Wert von Datenbeziehungen

Im Zeitalter von Internet und Big Data nutzen auch Behörden verstärkt neue Technologien, um Daten auszuwerten – ein Beispiel sind Graphdatenbanken.

Große und schnell wachsende Datenmengen, komplexe Strukturen und heterogene Quellen – im Zeitalter von Internet und Big Data stehen nicht nur Unternehmen vor neuen Herausforderungen beim Daten-Management. Auch staatliche Behörden setzen verstärkt neue Technologien ein, um Informationen schneller, effizienter und zuverlässiger auswerten zu können. Ein Beispiel sind Graphdatenbanken, mit denen sich Beziehungen zwischen Daten analysieren und so Muster und Zusammenhänge besser erkennen lassen.

Informations- und Kommunikationstechnologien im öffentlichen Dienst haben eine ganze Reihe an Anforderungen zu erfüllen, die weit über das reine Daten-Management hinausgehen. Begrenzte finanzielle Mittel erlauben nur wenig Spielraum für technologische Neuinvestitionen. Gleichzeitig sind Systeme gefragt, die hohen Datenschutzstandards entsprechen und im großen Maßstab genutzt werden können – sowohl auf föderaler, nationaler als auch internationaler Ebene.

Ähnlich wie die Business Intelligence (BI) bei Unternehmen ist auch in der öffentlichen Verwaltung und in Behörden eine systematische Analyse der Daten notwendig. So müssen unterschiedliche Informationssilos über mehrere Verwaltungsebenen miteinander verknüpft werden, um einen ganzheitlichen und umfassenden Blick auf den Kunden – oder in diesem Fall – auf Personen und Bürger werfen zu können, die die Dienstleistung einer Behörde in Anspruch nehmen oder nationale Grenzen überschreiten.

Relationale Datenbanken überfordert

Herkömmliche relationale Datenbank-Management-Systeme (RDBMS) stoßen hier an ihre Grenzen. Beziehungen zwischen den Daten, die beispielsweise für Personennetzwerke grundlegend sind, lassen sich damit nur äußerst ressourcenintensiv und kompliziert abspeichern und abfragen. Das heißt nicht, dass solche SQL-Datenbanken von vornherein überflüssig werden. Für bestimmte Anwendungsfälle sind relationale Datenbanken weiterhin die erste Wahl und können mit vielen Vorteilen punkten. Für das Management extrem großer, heterogener Daten sind sie jedoch weniger geeignet.

Das gleiche gilt auch bei Big Data Engines wie Hadoop. Sie verfügen über eine enorme Leistungsfähigkeit und können im Vergleich zu RDBMS auch größere Datenmengen problemlos managen. Genau wie relationale Datenbanken können sie jedoch bei einem wichtigen Aspekt nicht punkten – nämlich dann, wenn es um Beziehungen geht.

Beziehungen sind entscheidend, wenn es darum geht, die reale Welt wirklichkeitsnah in Datenbanken abzubilden. Sie zeigen wie Personen miteinander in Verbindung stehen und welchen Gruppen sie zuzuordnen sind – angefangen bei der Staatsangehörigkeit über Familienstand bis zur Steuerklasse. Verantwortliche im öffentlichen Dienst sind auf diese Informationen angewiesen, wenn sie gesetzlich vorgeschriebenen Anforderungen entsprechen und die Dienstleistungen des Staates gegenüber seinen Bürgern erfüllen wollen.

Ein Fall für Graphdatenbanken

Graphtechnologie eröffnet hier völlig neue Möglichkeiten. Sie eignet sich besonders gut, stark vernetzte und unstrukturierte Informationen anschaulich darzustellen. Denn sie misst den gespeicherten Daten die gleiche Bedeutung bei wie der Beziehung zwischen diesen Daten. Damit sind die Daten nicht mehr bloß Metadaten, sondern stehen im Zentrum des Modells.

Zudem erleiden Graphdatenbanken bei extrem vielen, miteinander verknüpften Datensätzen keine Performance-Verluste. Die Beziehungen zwischen Elementen müssen für eine Abfrage nicht aufwendig berechnet werden, sondern sind durch die vorliegenden Strukturen einfach verfolgbar. Die Abfragegeschwindigkeit hängt nicht von der Gesamtmenge der Daten in der Datenbank und der Anzahl von Verknüpfungsoperationen ab, sondern nur von der Anzahl der konkreten Beziehungen, die für die gewünschte Abfrage relevant sind. Abfragen, die in anderen Datenbanktechnologien noch Minuten oder gar Stunden dauerten, liefern jetzt in Millisekunden – das heißt in Echtzeit – das Ergebnis.

Ein weiterer entscheidender Vorteil, der Graphtechnologie besonders für die öffentliche Hand interessant macht, ist die hohe Skalierbarkeit. Unterschiedliche Backend-Datenquellen können zusammengeführt werden, so dass ein einheitliches, semantisches Datenmodell entsteht. Das Hinzufügen neuer Datensätze ist problemlos möglich.

In Behörden lassen sich so zum Beispiel Datensätze unterschiedlicher Referate und interner Stellen verknüpfen, um Muster und damit Trends und Entwicklungen frühzeitig zu erkennen. Dazu zählen beispielsweise demographische Daten, aktuelle Gesetzesvorgaben oder -änderungen sowie Angaben über Sozialdienstleistungen. Langwierige bürokratische Verfahren und Prozesse verlaufen so effizienter und können abgekürzt werden.

Sichere Grenzen

Welche Vorteile Graphdatenbanken sowohl gegenüber RDBMS als auch Big-Data- und Hadoop-Technologien besitzt, zeigt ein konkretes Beispiel eines G8-Staats. Die dortige Einwanderungsbehörde nutzt Graphtechnologie, um Beziehungen zwischen Personen besser abfragen und visualisieren zu können. Dabei ging es zunächst um Einzelfälle, in denen die zuständigen Beamten relevante und sicherheitskritische Informationen identifizierten und an die verantwortlichen Behörden der Grenzkontrolle weiterleiteten.

Mehr zum Thema Graphendatenbanken:

Graphdatenbank Titan in der AWS-Cloud verwenden.

Graphdatenbanken zeigen ihren Nutzen jenseits von Facebook, Twitter und Co.

Panama Papers mit Graphdatenbank und Visualisierungssoftware enthüllt.

Der schnelle und direkte Zugriff auf entsprechende Daten ist hier entscheidend – sowohl bei Sicherheitsfragen und der Überprüfung von Einreisenden als auch bei der Bekämpfung von illegalem Handel und Schleusern. Da die Beziehungen zwischen Personen und Daten in Echtzeit abgefragt werden können, lassen sich Netzwerke von Gruppen und beispielsweise Schmugglerbanden bereits an der Grenze stoppen.

Die von der Graphdatenbank genutzte Fuzzylogik ist in diesem Zusammenhang besonders hilfreich. Sie erkennt beispielsweise mit hoher Zuverlässigkeit unterschiedliche Schreibweisen eines Namens und kann diese eindeutig einer Person zuordnen. Eine solche genaue Analyse von leicht abweichenden Daten können klassische Datenbanken nur schwer leisten.

Fundierte Richtlinien

Graphtechnologie eröffnet aber noch weitere Vorteile. Denn durch den Fokus auf die Datenbeziehungen erhalten Regierungsbehörden einen vollständig neuen Blick auf ihre Daten und können nützliche Erkenntnisse aus ihnen ziehen. Die neu gewonnenen Informationen fließen in interne Berichte ein und können so innerhalb des staatlichen Verwaltungsapparats geteilt und stellenübergreifend genutzt werden.

„Ein entscheidender Vorteil, der Graphtechnologie besonders für die öffentliche Hand interessant macht, ist die hohe Skalierbarkeit.“

Emil Eifrem, Neo Technology

Auf dieser Grundlage lassen sich Richtlinien und Vorgehensweisen entsprechend anpassen, Bearbeitungsprozesse über mehrere Ebenen hinweg vereinheitlichen und neue Initiativen und Maßnahmen einleiten. Auch eine Weiterentwicklung des Daten-Management-Systems ist vorstellbar, zum Beispiel um Beamten ein informelles, hoch dynamische Lern-Management-System zur Verfügung zu stellen, mit dem sich Nutzer über ihre Erfahrungen austauschen können. Dieses kann auf unterschiedlichen nationalen Ebenen in verschiedenen Behörden genutzt werden.

Vorbild Wirtschaft

Unternehmen setzen bereits seit geraumer Zeit graphbasierte Lösungen ein. Die Anwendungsgebiete reichen von Stammdaten-Management, Identity und Access Management bis zu Telekommunikationsnetzwerke, sozialen Netzwerken und Empfehlungssystemen. Banken und Versicherungen nutzen Graphdatenbanken beispielsweise bei der Aufdeckung von Betrugsversuchen, um verdächtige Transaktionen aufzuspüren. Dabei werden Betrüger identifiziert, die sich nach metrischen Kriterien völlig „normal“ verhalten und bei der Analyse mit herkömmlichen Systemen durchs Suchraster fallen.

Ähnlich vielseitige Einsatzgebiete für Graphtechnologie sind auch für das E-Government denkbar – sei es beim Management von großen, komplexen Datenmengen in der Verwaltung, der Vergabe von Zugangsberechtigungen bei sensiblen und sicherheitskritischen Daten oder der Strafverfolgung (zum Beispiel Steuerbetrug). Die Notwendigkeit, komplexe Datenbeziehungen schnell und sicher auszuwerten, steigt. Graphtechnologie präsentiert hier vielversprechende Lösungen für den öffentlichen Dienst, um Verfahren zu straffen und bürokratische Hürden schneller überwinden zu können.

Über den Autor:
Emil Eifrem ist CEO von Neo Technology und Mitentwickler von Neo4j, der weltweit führenden Graphdatenbank. Die erste Idee zum Property Graph Modell kam ihm auf einem Flug nach Mumbai im Jahr 2000. Heute widmet er sich der Weiterentwicklung der Technologie und informiert weltweit über die Vorteile und Einsatzmöglichkeiten von Graphdatenbanken, zum Beispiel als Co-Autor des bei O’Reilly erschienenen Buchs „Graph Databases“.

Folgen Sie SearchEnterpriseSoftware.de auch auf Twitter, Google+, Xing und Facebook!

Fortsetzung des Inhalts unten

Erfahren Sie mehr über Datenbanken

- GOOGLE-ANZEIGEN

ComputerWeekly.de

Close