Spring for Hadoop 2.0 kommt näher

Claudia Fröhling

Das Projekt Spring for Apache Hadoop 2.0 ist als Meilenstein 5 erschienen, die Release-Candidate-Phase rückt damit immer näher. Der Fokus des zweiten Major Release liegt auf der Unterstützung der YARN-Funktionalität (MapReduce 2.0). Die Default-Distribution wird Apache Hadoop 2.2 sein.

Die Unterstützung der YARN-Features wird über ein neues spring-yarn-Unterprojekt gewährleistet. YARN-Support ist außerdem über Spring Boot verfügbar. Mehr Informationen finden sich im Blogpost.

Spring for Hadoop bietet eine nahtlose Integration des Hadoop-Frameworks und einiger weiterer Systeme aus dem Hadoop-Ökosystem in die Srping-Welt. Ein ausführlicher Artikel von Ramon Wartala über das Projekt findet sich im Java Magazin 12.2012.

Die so genannte YARN Engine ist das Highlight von Hadoop 2 (erschienen Oktober 2013). Sie gilt als Weiterentwicklung des MapReduce-Ansatzes und wird daher auch oft als MapReduce 2.0 bezeichnet. Im Grunde geht es bei YARN (übrigens die Abkürzung für „yet another resource negotiator“) darum, die ursprüngliche MapReduce-Komponente aus Hadoop als optionales Plug-in herauszulösen und so alternative Ausführungsalgorithmen zu ermöglichen. Das bei MapReduce verwendete Batch-Modell kann so durch interaktivere Ansätze (etwa Apache Storm oder auch Services wie Apache HBase) ersetzt werden.

Geschrieben von
Claudia Fröhling
Claudia Fröhling
Claudia Fröhling hat in verschiedenen Redaktionen als TV- und Onlineredakteurin gearbeitet, bevor sie 2008 zur Software & Support Media GmbH kam und sich bis 2014 um alle Projekte des Verlages im Ressort Java kümmerte. Claudia hat einen Abschluss in Politikwissenschaften und Multimedia Producing. Ihr Google+ Profil findest du hier.
Kommentare

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
400
  Subscribe  
Benachrichtige mich zu: