Die Funktionen der Pentaho Data-Integration-Plattform im Überblick

Die Pentaho Data-Integration-Plattform ermöglicht es Unternehmen, Daten aus jeder beliebigen Quelle zu integrieren, vermischen und konvertieren.

Pentaho Data Integration bietet ETL-Funktionen (Extract, Transform, Load), die notwendig sind, um eine Vielzahl von Datenquellen zu integrieren, einschließlich relationaler Datenbanken, Enterprise-Anwendungen und Big-Data-Dateien.

Die ETL-Architektur der Plattform unterstützt die Erstellung und Pflege von Zieldatenbanken wie Data Warehouses, Data Marts und Data Lakes. Das Produkt stellt den Datenintegrationsbestandteil der Pentaho-Business-Analytics-Plattform dar, die ebenfalls Datenaufbereitungs- und Governance-Funktionen enthält. Pentaho Data Integration kann allein oder in Kombination mit diesen Tools eingesetzt werden.

Die neueste Version, Pentaho Data Integration 6.1, bietet folgende Features:

  • Das Tool enthält einen grafischen ETL-Designer, der es Datenintegrations-Teams erlaubt, Integrationsprozesse, Workflows, Benachrichtigungen und Warnmeldungen zu entwerfen, zu testen und zu implementieren.
  • Die aktuelle Version ermöglicht die Verbindung mit einer Vielzahl von relationalen Datenbanken, Big Data Stores, Dateien und Enterprise-Anwendungen sowie Datenquellen und -zielen für die Datenintegration.
  • Sie bietet eine umfangreiche Bibliothek mit voreingestellten Komponenten für die Umwandlung von Daten, die komplexe Prozessabläufe unterstützt.
  • Pentaho Data Integration 6.1 integriert Repository-basierte Entwicklungs-Tools, die Designs, Tests, die Implementierung und den Betrieb von Integrationsprozessen verwalten und Metadaten unterstützt.
  • Benutzer können Daten während der Datenaufbereitung visualisieren und Metadatenmodelle in den Analyse-Tools veröffentlichen.

Die aktuelle Version bietet Anwendern außerdem die Möglichkeit, Datentransformationen in Datenservices zu konvertieren. Das erlaubt es, die Abfrageergebnisse von diesen Services als virtuelle Datentabellen zu analysieren. Der zusätzliche Support für Datenherkunftsanalysen versetzt Anwender in die Lage, den gesamten Datenfluss der Transformationen innerhalb von Pentaho Data Integration zu analysieren. Pentaho Data Integration 6.1 bietet außerdem verbesserte Big-Data-Funktionen dergestalt, dass die Anwendung Cloudera Distribution for Hadoop unterstützt und eine Verbindung zu den Hadoop-Clustern durch die Verwendung von Spoon ermöglicht.

Ein neues SNMP-Plug-in (Simple Network Management Protocol) erlaubt es Unternehmen, Drittanbieter-Tools zu integrieren, um Datenintegrationsereignisse zu überwachen. Die Version enthält ein SAP HANA Bulk-Loader-Plug-in, so dass Nutzer große Datenmengen in ihre SAP-HANA-Datenbank laden können.

Für wen ist Pentaho Data Integration gedacht?

Mittelständische wie auch große Unternehmen verwenden die Anwendung als umfassende und kohärente Datenintegrations- und Business-Analytics-Plattform. Neben dem Direktvertrieb unterhält Pentaho ein OEM-Netzwerk, das es diesen Anbietern erlaubt, ihre eigenen Produkte mit den Datenintegrations- und Analytics-Funktionen von Pentaho zu erweitern.

Zusätzlich zur kommerziellen Version bietet Pentaho eine Open-Source-Version von Data Integration unter dem Namen Kettle an. Viele Unternehmen beginnen zunächst mit dem Open-Source-Tool, um die Integrationsfähigkeiten zu entdecken oder es für begrenzte Integrations-Workloads einzusetzen.

Welche Lizenzen und Preismodelle bietet Pentaho für Data Integration?

Die kommerzielle Version von Pentaho Data Integration ist in drei Editionen verfügbar: Basic, Professional und Enterprise. Alle Versionen laufen auf Windows-, Linux- und Mac-OSX-Systemen. Diese werden über ein Jahresabonnement angeboten, das Support-Services einschließt. Für Preisinformationen sollten Interessenten Pentaho direkt kontaktieren.

Eine 30-tägige Testversion mit allen Funktionen ist als Teil des Pentaho-Business-Analytics-Pakets oder als eigenständige Anwendung erhältlich.

Die Open-Source-Version Kettle ist zusammen mit anderen Produkten für Analytics verfügbar, darunter Report Designer, Aggregation Designer, Schema Workbench und Metadata Editor. Kettle bietet nur einen Teil der Datenintegrationsfunktionen an, während Pentaho Data Integration erweiterte Transformationen, Repository-basiertes Management und Team-basierte Entwicklungsfunktionen zur Verfügung stellt.

Folgen Sie SearchEnterpriseSoftware.de auch auf Twitter, Google+, Xing und Facebook!

Erfahren Sie mehr über Datenanalyse

ComputerWeekly.de
Close