Fotolia

Microsoft R Open und R Server für Analytics verwenden

Das Microsoft R-Produktportfolio umfasst mehrere Analytics-Tools. Zum Portfolio gehören Microsoft R Open, Microsoft R Client und Microsoft R Server.

Microsoft R ist eine erweiterte Implementierung von R, einer Open-Source-Entwicklungssprache für statistische Analysen, die von Data Scientists, Statistikern und Akademikern verwendet wird. Die R-Produktfamilie umfasst Microsoft R Open, Microsoft R Client und Microsoft R Server.

Microsoft R Open, früher bekannt als Revolution R Open, ist eine verbesserte Version von R, die eine leistungsfähige R-Sprache-Engine enthält. Die Anwendung wird mit dem reproduzierbaren R-Toolkit geliefert, das sicherstellt, dass die Ergebnisse von R-Codeausführungen wiederholbar sind und andere Anwender, die denselben Code ausführen, genau dieselben Ergebnisse erzielen. Microsoft R Open lässt sich kostenlos herunterladen, verwenden und teilen.

Microsoft R Open arbeitet in Host-Ausführungsumgebungen, die verschiedene Hadoop-Frameworks enthalten können, darunter von Cloudera, Hortonworks und MapR. Microsoft R Open kann auch in Enterprise-Data-Warehouse-Umgebungen, zum Beispiel von Teradata oder IBM, sowie mit Grid- Computing-Systemen, zum Beispiel von Microsoft und IBM, eingesetzt werden.

Microsoft R Client und R Server basieren auf Microsoft R Open. Sie führen die proprietäre ScaleR-Technologie von Microsoft, eine Bibliothek von Big-Data-Analytics-Algorithmen, ein, die parallele Berechnungen und Datenanalysen unterstützen.

Microsoft R Client ist ein kostenloses, leistungsstarkes Analyse-Tool, mit dem Anwender Daten parallel über die ScaleR-Technologie analysieren können. Microsoft R Client hat einige Einschränkungen, da es die Daten im Arbeitsspeicher des lokalen Clients verarbeitet und nur zwei Threads verarbeiten kann, wenn man mehrere ScaleR-Funktionen verwendet.

Microsoft R Server stellt eine erweiterte Version von R zur Verfügung, die Leistung und Skalierbarkeit auf Enterprise-Niveau bietet. Das Tool kann R-Skripte und Comprehensive R Archive Network (CRAN) Pakete über eine geclusterte parallele Verarbeitung ausführen. Microsoft R Server beseitigt die Einschränkungen von Microsoft R Client, indem es die Skalierbarkeit von Festplatten ausnutzt, die größer ist als beim Arbeitsspeicher des Servers.

ScaleR-Algorithmen, die mit Microsoft R Server verfügbar sind, reduzieren die Speicherbeschränkungen, da sie als optimierte parallele externe Speicheralgorithmen implementiert sind, die den verfügbaren RAM und Storage gemeinsam verwalten, was zu einer erhöhten Skalierbarkeit führt. Mit den Werkzeugen von ScaleR benötigen Entwickler keine speziellen Entwicklungsmethoden oder Sprachen für die parallele Verarbeitung.

Microsoft R Client und R Server unterstützen Datenaufbereitung, deskriptive Statistikfunktionen, Datenvisualisierung, statistische Testfunktionen, Klassifikations- und Machine-Learning-Fähigkeiten sowie parallele statistische Modellierungsalgorithmen. Darüber hinaus bietet ScaleR mit R Server Optionen für offene Datenbank-Konnektivitätstreiber und Konnektoren, die die Integration mit mehreren Datenbanksystemen sowie dem Hadoop Distributed File System (HDFS) ermöglichen.

Microsoft bietet außerdem SQL Server R Services an, eine R-Umgebung, die parallel zu SQL Server ausgeführt wird und Benutzern einen Mechanismus für die Integration von R-Server-Daten mit SQL Server und anderen Business-Intelligence-Tools von Microsoft zur Verfügung stellt.

Die jüngste Version von R Open kann als Open Source unter der GNU General Public License Version 2 verwendet werden. Microsoft R Open läuft unter Windows, macOS 10.9 und höher sowie mehreren Linux-Versionen und bietet Community Support. Die aktuelle Version von Microsoft R Client kann für die Verwendung unter Windows heruntergeladen werden.

Microsoft R Server ist als kommerzielles Produkt verfügbar und kann auf Windows und Linux sowie mit Hadoop, Teradata und SQL Server eingesetzt werden. Microsoft R Server lässt sich über mehrere Kanäle herunterladen, unter anderem mit einem Abonnement des Microsoft Developer Network, über Volume Licensing Service Center oder über Visual Studio Dev Essentials.

Entwickler und Data Scientists können die kostenlose Developer Edition installieren, die dieselben Funktionen wie die Enterprise-Version bietet, jedoch für Entwicklerzwecke gedacht ist. Für Preise und Support-Optionen sollten sich Interessenten mit Microsoft in Kontakt setzen.

Folgen Sie SearchEnterpriseSoftware.de auch auf Twitter, Google+, Xing und Facebook!

Nächste Schritte

Die Analytics-Tools der Teradata Aster Analytics Suite.

Wie SAS Enterprise Miner Data Mining einfacher macht.

SAP Predictive Analytics: Das Business von morgen analysieren.

Erfahren Sie mehr über Datenanalyse

ComputerWeekly.de
Close