JAX Countdown

BigDataCon 2012: Auf den Spuren von Hadoop, MapReduce & NoSQL

Hartmut Schlosser

Ob in Finance, Telco, Logistik, Medizintechnik oder Energie – in fast allen Branchen werden heute rasant steigende Mengen an Daten erfasst. Diese für Analyse und Prognose im geschäftlichen Umfeld zu nutzen, stellt eine enorme Herausforderung an die klassischen Datenspeicher dar. Im Zeichen von Big Data entstehen aktuell neue Technologien und Methoden für Speicherung, Processing, Suche, Echtzeitverarbeitung, globale Bereitstellung und Visualisierung.

Um dieser Entwicklung Rechnung zu tragen, findet in diesem Jahr zum ersten Mal die BigDataCon als Erweiterung der JAX 2012 statt. Die Spezialkonferenz erlaubt in zahlreichen Vorträgen, technischen Tutorials, praxisnahen Fallbeispielen und einem Ganztagesworkshop einen konzentrierten Blick auf die Big-Data-Technologien und Methoden. BigDataCon-Sprecher Bernd Fondermann gibt im JAX-Countdown einen Vorgeschmack auf die Konferenz und beschreibt die aktuellen Entwicklungen um eine der zentralen Big-Data-Technologien: Apache Hadoop.

Bernd Fondermann auf der BigDataCon

Bernd Fondermann können Sie auf der JAX / BigDataCon live erleben:

Apache Hadoop: Past, Present, Future

17.04.2012 | 10:00 – 11:15


Aus dem exotischen Open-Source-Projekt ist ein Ökosystem an Projekten, Produkten und Distributionen geworden. Dabei die Übersicht zu behalten, fällt schwer. Der Vortrag gibt einen Überblick über aktuelle Entwicklungen rund um Hadoop und Big Data. Verschiedene Tools und Libraries werden kurz vorgestellt und bewertet. Ein Ausblick auf neue Features und Trends rund um den Big-Data-Platzhirsch wird gegeben.

Blaue oder rote Pille: SQL oder MapReduce?

17.04.2012 | 15:15 – 16:15


Big Data und NoSQL sorgen derzeit für frischen Wind. Das MapReduce Pattern spielt dabei eine große Rolle. Dieser Vortrag will Entscheidungshilfen liefern und MapReduce in ein praxisnahes Licht rücken. Anhand konkreter Beispiele und Demos wird gezeigt, welche Vor- und Nachteile die verteilte, parallele MapReduce-Datenverarbeitung hat und welche neuen Perspektiven sie gegenüber SQL bietet.

Infos: www.bigdatacon.de

JAXenter: Hadoop ist es gelungen, sich von einem recht esoterischen Projekt aus der Entwicklerschublade von Yahoo! zu einer der derzeit wichtigsten Technologien des Java-Ökosystems zu entwickeln. Wie war das möglich?

Bernd Fondermann: Während das vergangene Jahrzehnt sehr im Fokus der weltweiten Vernetzung und dem Aufbau der zugehörigen Geschäftsmodelle stand, stehen heute wieder – und immer mehr – die Daten an sich im Vordergrund. Dabei stellt sich heraus, dass relationale Datenbanken neben ihren unbestrittenen Vorteilen auch Nachteile haben. Und in diese Lücke ist Hadoop – neben anderen Technologien – gestoßen. Meiner Meinung nach hat Hadoop gegenüber anderen NoSQL-Lösungen den großen Vorteil, ein breites Spektrum an Anwendungsfällen abzudecken und gleichzeitig in fast unbegrenzte Größenordnungen zu skalieren. (Passend dazu der JAX-Vortrag: Blaue oder rote Pille).

Das hat Firmen wie Yahoo!, Facebook, Twitter und viele andere dazu bewogen, in die Technologie zu investieren. Als Nebeneffekt ist ein nahezu unüberschaubares Ökosystem rund um Hadoop entstanden, aus dem sich jeder frei bedienen kann.

JAXenter: In der Tat gibt es rund um Hadoop mittlerweile eine Vielzahl von Erweiterungen und Technologien. Welche sind aus deiner Sicht die Interessantesten?

Bernd Fondermann: Ganz vorne steht für mich Apache HBase, die Datenbank für Hadoop. Sie rundet Hadoop einfach für den klassischen OTP-Fall ab. Aber auch die Brückentechnologien wie Hive, Pig, Flume, Sqoop etc., die dem Anwender einen einfachen Zugang zu Hadoop bieten, stehen im Mittelpunkt des Interesses. Schließlich denke ich, dass Basis-Technologien wie Apache Zookeeper, welches Einzug in Neo4j, Solr, HBase und nun auch den Hadoop-Kern hält, in Zukunft überall dort genutzt werden, wo irgendeine Form des Verteilten Rechnens zum Einsatz kommt. Schließlich sei Apache Mahout nicht vergessen, welches Algorithmen bereitstellt, mit denen sich aus Big Data ganz neue Erkenntnisse destillieren lassen.

JAXenter: Und welche Neuerungen dürfen wir bei Hadoop erwarten?

Bernd Fondermann: Dieses Jahr wird es die grundlegensten Änderungen in der Hadoop-Architektur seit dem Start des Projektes geben. Sowohl auf Seiten des verteilten Dateisystems HDFS, aber vor allem beim Application-Framework. MapReduce wird weiterhin im Vordergrund stehen, aber aus den Hadoop-Fundamenten herausgelöst werden. Dies wird durch eine weitreichende Modularisierung der Kern-Dienste erreicht. Ziele ist es, eine noch bessere Skalierung für noch größere Hadoop-Cluster sowie Raum für andere Arten von Applikationen zu schaffen. Bei HDFS wird Hochverfügbarkeit, Fail-Over und Förderation im Vordergrund stehen. Wer auf die JAX kommt, kann sich dazu die Session „Past, Present, Future“ anschauen.

JAXenter: Vielen Dank für dieses Gespräch!

BigDataCon 2012

Keynote:

  • Harnessing the Transformative Power of Big Data – Chris Blessington (EMC)

Workshops:

  • A Programmatic Introduction to the Neo4j Graph Database – Ian Robinson (Neo Technology)
  • Der No Frills Big Data Workshop – Dominik Wagenknecht (Accenture)

Sessions:

  • Apache Hadoop: Past, Present, Future – Bernd Fondermann (brainlounge)
  • Einführung in HBase – Lars George (Cloudera)
  • The (R)Evolution of Data Stores – Dominik Wagenknecht (Accenture)
  • NoSQL for Enterprise Applications – Hit or Miss? – Dirk Bartels (Versant)
  • HBase für Fortgeschrittene – Lars George (Cloudera)
  • New Opportunities for Connected Data – Ian Robinson (Neo Technology)
  • Abrunden ist uncool – Big Data for the Masses – Martin Lange & Thomas Friebel (Talend)
  • Blaue oder rote Pille: SQL oder MapReduce? – Bernd Fondermann (brainlounge)
  • Mobile Eye for the Big Data Guy – Darach Ennis (Push Technology Ltd)
  • Showcase of Data Visualisation Techniques for thriving in the Age of Big Data – Andy Kirk (visualisingdata.com)
  • Hadoop im Unternehmenseinsatz bei 1&1 – Stefan Igel (inovex GmbH), Dirk Schmid (1&1 Internet AG)
  • As simple as possible: how Skype managed its Big Data Challenge – Oleh Babyak (Skype)
  • The Big Data Developer – Pavlo Baron (codecentric AG)
  • Radical NoSQL Scalability with Cassandra – Tim Berglund (August Technology Group, LLC)
  • Big Data ist anders: ein Reisebericht – Patrick Peschlow & Uwe Friedrichsen (codecentric AG)

Alle Infos unter: http://bigdatacon.de/2012/sessions/

Geschrieben von
Hartmut Schlosser
Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.