Rassco - Fotolia

Big-Data-Analyse mit der KNIME Analytics Platform und zugehörigen Erweiterungen

KNIME bietet Datenanalyse-, Reporting- und Integrations-Tools sowie kommerzielle Anwendungen, mit denen sich effizientere Workflows erstellen lassen.

Die KNIME Analytics Platform ist eine Open Source Datenanalyse-, Reporting- und Integrationsplattform des Schweizer Unternehmens KNIME. Über die Verwendung einer grafischen Oberfläche ermöglicht KNIME Benutzern, Datenflüsse zu erstellen, ausgewählte Analyseschritte auszuführen und Ergebnisse, Modelle und interaktive Ansichten zu prüfen.

Die KNIME Analytics Platform ist in Java geschrieben und wurde mit Eclipse gebaut. Die Plattform erweitert die Plug-ins und Konnektoren von Eclipse. Diese unterstützen die Integration von Methoden für Text Mining, Image Mining und Zeitreihenanalysen.

KNIME integriert außerdem verschiedene andere Open-Source-Projekte, darunter Machine-Learning-Algorithmen von Weka, R und JFreeChart. Es unterstützt Wrapper, um anderen Code aufzurufen, und kann über Knoten Java, Python, Perl und andere Codefragmente ausführen.

Die KNIME Analytics Platform nutzt die Eclipse Plug-in-Funktionalität. Infolgedessen existieren mehr als 1.000 Module, die Konnektoren für alle gängigen Dateiformate und Datenbanken unterstützen, sowie eine breite Palette von Datentypen, statistischen Funktionen und fortschrittliche Vorhersage- und Machine-Learning-Algorithmen.

Neben der Open-Source-Version der KNIME Analytics Platform stellt der Anbieter auch kommerzielle Produkte bereit. Als Cloud Analytics Platform ist die KNIME Analytics Platform innerhalb einer Microsoft-Azure-Umgebung verfügbar.

Zu den KNIME Personal Productivity Extensions gehören:

  • KNIME Personal Productivity: Die Erweiterung bietet Anwendern die Möglichkeit, KNIME Workflows effizient zu erstellen und zu pflegen, so dass Code-Snippets und Meta-Knoten in einem Workflow einfach verwaltet, wiederverwendet und gemeinsam genutzt werden können.
  • KNIME Partner Productivity: Die Erweiterung stellt Beratungsorganisationen die Möglichkeit zur Verfügung, verschachtelte Meta-Knoten zu verschlüsseln und zu entschlüsseln, um sie mit Kunden zu teilen, während das geistige Eigentum geschützt bleibt.

Die KNIME Performance Extensions umfassen:

  • KNIME Big Data Extensions: Diese bieten Konnektoren und Erweiterungen für die Integration von Apache Hadoop und Spark.
  • KNIME Cluster Executor: Das Tool ermöglicht die Verbindung der KNIME Analytics Platform mit Hochleitungs-Cluster und die Ausführung eines verteilten Workflows über Cluster hinweg.

Zu den KNIME Collaboration Extensions zählen:

  • KNIME Server Lite: Die Erweiterung stellt Collaboration-Funktionen zur Verfügung, zum Beispiel grundlegende Benutzerauthentifizierung und Benutzerrechte, die Remote-Ausführung und Planung von Berichten, geteilte Datenbereiche, Workflow-Repositories, Meta-Knoten und die Priorisierung von Updates.
  • KNIME Server: Das Produkt erweitert die Funktionen der Server-Lite-Erweiterung. Dies beinhaltet fortschrittlichere Benutzerauthentifizierung und Benutzerrechte, Unterstützung von Webdiensten, Workflow-Versionierung und kommerzieller Support.

KNIME TeamSpace verbessert die Zusammenarbeit in Teams, indem es Mittel zur Speicherung von Datenströmen und Analyse-Workflows zentral zur Verfügung stellt, so dass man es mit Teammitgliedern teilen und zusammen daran arbeiten kann.

KNIME WebPortal ist eine verfügbare Erweiterung von Server Lite, mit dem Benutzer Zugriff auf Workflows über den Webbrowser erhalten. KNIME Cloud Server ist ein Paket von erweiterten KNIME-Server-Funktionen, die für die Bereitstellung in einer Cloud-Umgebung gedacht sind.

Mehr zum Thema Big Data Analytics:

Big Data und Digitalisierung: Warum Algorithmen so entscheidend sind.

Fünf Wege zur Vermeidung üblicher Fallstricke in Big-Data-Analytics-Projekten.

Wie KI, IoT und Big Data zu neuen Erkenntnissen per Data Mining führen.

Big Data Analytics: Strategie geht vor Technologie.

Wie lassen sich allgemeine Big-Data-Probleme in AWS vermeiden?

Version 3.3 der KNIME Analytics Platform verfügt über mehrere Erweiterungen, einschließlich kurvenförmiger Verbindungslinien im Workflow-Editor, verbesserte Excel-Integration zur Unterstützung von großen Dateien, die Verwendung der Eclipse Neon 4.6 Integration von Apache Tika für verbessertes Text Mining, neue Cloud-Connector-Knoten für Amazon Simple Storage Service (AWS S3) und Azure Blob Store sowie Verbesserungen für Deep-Learning-Knoten.

Ausführbare Versionen der KNIME Analytics Platform stehen für Microsoft Windows und Linux (sowohl 32- als auch 64-Bit) sowie macOS zur Verfügung.

Lizenzierung und Preis von KNIME

Die KNIME Analytics Platform ist als Open Source verfügbar und wird unter der GNU General Public License Version 3 verwaltet. Erweiterungen und Knoten werden unter Abschnitt 7 der Lizenzbedingungen abgedeckt.

Die kommerziellen Erweiterungen sind bei KNIME.org sowie Partnern erhältlich. Der KNIME Support wird in der Regel durch Online-Foren und die KNIME-Community gewährleistet. Zusätzlichen Support erhält man bei KNIME mit dem Kauf der kommerziellen Erweiterung des KNIME Servers. KNIME bietet außerdem zusätzliche Verträge für den Support.

Folgen Sie SearchEnterpriseSoftware.de auch auf Twitter, Google+, Xing und Facebook!

Erfahren Sie mehr über Big Data

ComputerWeekly.de
Close