Suche

Big Data Analytics mit Hadoop und R

Redaktion JAXenter

Die kalifornische Softwareschmiede Revolution Analytics hat die statistischen Funktionen der von ihr entwickelten Programmiersprache R besser auf das populäre Big-Data-Framework Hadoop abgestimmt. Außerdem soll sich die neue Version Revolution R Enterprise 7 (RR7), die seit Montag verfügbar ist, mit Teradata-Datenbanken nutzen lassen.

Ferner enthält RR7 eine Bibliothek an R-Algorithmen, die sich wie bei Hadoop parallel auf mehreren Nodes ausführen lassen. Daten könnten nun auf dem Node abgefragt werden, auf dem sie liegen, statt verschoben zu werden, so der Hersteller, was die Auswertung beschleunige. Wie bei einem Data Warehouse lassen sich darüber hinaus nun ganze Datensätze, nicht nur Auszüge oder Summaries, analysieren.

Des Weiteren lässt sich RR7 mit den Cloudera-Hadoop-Distributionen CDH3 und CDH4 sowie mit der Hortonworks Data Platform 1.3 integrieren. Damit wurde die R-Bibliothek um die gängigsten Werkzeuge zur Datenabfrage und –analyse erweitert, was Anwendern die statistische Auswertung großer Datenmengen wesentlich erleichtern und R weiteren Auftrieb im Bereich Big Data Analytics geben dürfte.

Vereinfacht wurde die Erstellung von Entscheidungswäldern (Decision Forests). Hierfür steht nun ein Werkzeug zur Verfügung, mit dem sich Entscheidungsbäume visualisieren lassen.

R ist eine quelloffene Programmiersprache für statistisches Rechnen und die grafische Aufbereitung von Daten, die sich im Business-Intelligence-Umfeld zunehmender Beliebtheit erfreut. Revolution Analytics selbst schätzt die Nutzerzahl auf 2 Millionen weltweit. Es handelt sich um ein GNU-Projekt, das sich an die Sprache und Entwicklungsumgebung S aus dem Hause Bell Laboratories (jetzt: Lucent Technologies) anlehnt. R stellt eine Reihe von statistischen und grafischen Methoden zur Datenverarbeitung bereit und zeichnet sich durch einfache Erweiterbarkeit (mit Packages) aus.

Die R-Entwicklungsumgebung bietet vielfältige Werkzeuge zur Berechnung, Datenverwaltung, -speicherung, –analyse und –visualisierung.

Geschrieben von
Kommentare

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
400
  Subscribe  
Benachrichtige mich zu: