Big Data Analytics mit Hadoop und R

Diana Kupfer

Die kalifornische Softwareschmiede Revolution Analytics hat die statistischen Funktionen der von ihr entwickelten Programmiersprache R besser auf das populäre Big-Data-Framework Hadoop abgestimmt. Außerdem soll sich die neue Version Revolution R Enterprise 7 (RR7), die seit Montag verfügbar ist, mit Teradata-Datenbanken nutzen lassen.

Ferner enthält RR7 eine Bibliothek an R-Algorithmen, die sich wie bei Hadoop parallel auf mehreren Nodes ausführen lassen. Daten könnten nun auf dem Node abgefragt werden, auf dem sie liegen, statt verschoben zu werden, so der Hersteller, was die Auswertung beschleunige. Wie bei einem Data Warehouse lassen sich darüber hinaus nun ganze Datensätze, nicht nur Auszüge oder Summaries, analysieren.

Des Weiteren lässt sich RR7 mit den Cloudera-Hadoop-Distributionen CDH3 und CDH4 sowie mit der Hortonworks Data Platform 1.3 integrieren. Damit wurde die R-Bibliothek um die gängigsten Werkzeuge zur Datenabfrage und –analyse erweitert, was Anwendern die statistische Auswertung großer Datenmengen wesentlich erleichtern und R weiteren Auftrieb im Bereich Big Data Analytics geben dürfte.

Vereinfacht wurde die Erstellung von Entscheidungswäldern (Decision Forests). Hierfür steht nun ein Werkzeug zur Verfügung, mit dem sich Entscheidungsbäume visualisieren lassen.

R ist eine quelloffene Programmiersprache für statistisches Rechnen und die grafische Aufbereitung von Daten, die sich im Business-Intelligence-Umfeld zunehmender Beliebtheit erfreut. Revolution Analytics selbst schätzt die Nutzerzahl auf 2 Millionen weltweit. Es handelt sich um ein GNU-Projekt, das sich an die Sprache und Entwicklungsumgebung S aus dem Hause Bell Laboratories (jetzt: Lucent Technologies) anlehnt. R stellt eine Reihe von statistischen und grafischen Methoden zur Datenverarbeitung bereit und zeichnet sich durch einfache Erweiterbarkeit (mit Packages) aus.

Die R-Entwicklungsumgebung bietet vielfältige Werkzeuge zur Berechnung, Datenverwaltung, -speicherung, –analyse und –visualisierung.

Geschrieben von
Diana Kupfer
Diana Kupfer
Diana Kupfer war Redakteurin bei S&S Media für die Zeitschriften Java Magazin, Eclipse Magazin und das Portal JAXenter. 
Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.