Big Data

AsterixDB stellt flexible NoSQL-Datenbank in Aussicht

Mit dem Daten-Management-System AsterixDB will ein internationales Entwicklerteam eine Lücke im Big-Data-Bereich schließen. Mit der neuen Open-Source-Datenbank sollen künftig auch semi-strukturierte Daten in großem Umfang gespeichert, strukturiert und analysiert werden können.

NewSQL mit VoltDB

„Relationale Datenbanken sind groß, alt, schwer und langsam wie ein Elefant. Richtig gut können die eigentlich gar nichts“, sagt Michael Stonebreaker. Er will den Elefanten mit der Datenbank VoltDB zeigen, dass auch mit ACID und SQL gute Skalierbarkeit und hohe Performance möglich sind.

Apache Spark 1.3 mit DataFrame API

Wie Databricks, das Unternehmen hinter Apache Spark, bekannt gegeben hat, ist das Datenanalyse-Tool ab sofort in Version 1.3 erhältlich. Das vierte Release der 1.x-Reihe setzt sich nach Angaben der Entwickler aus insgesamt mehr als 1000 Einzelpatches zusammen. Highlight des Updates ist jedoch zweifellos das neue DataFrame API sowie die Tatsache, dass die Spark-SQL-Komponente sich nun nicht länger im Alpha-Stadium befindet.

GeoWave: Neues Eclipse-LocationTech-Projekt basiert auf Apache Accumulo

Zwei Jahre ist es her, dass sich unter der Schirmherrschaft der Eclipse Foundation die LocationTech Working Group gründete, eine Initiative für ortsabhängige Software. Seither hat sich eine Reihe von Projekten bei der Working Group eingefunden (wir berichteten), die unterschiedliche Technologiebausteine liefern – viele davon Java-basiert. Jetzt wurde ein neuer Projektvorschlag mit dem Titel „GeoWave“ eingereicht. Worum geht es bei dem Vorhaben?

MongoDB 3.0 – Was ist neu?

Mit dem neuen Major-Release 3.0 von MongoDB werden vor allem nicht-funktionale Anforderungen wie Performance und Storage adressiert. Die wesentlichen Neuerungen, die mit dieser Version auf Sie zukommen, möchte ich Ihnen im Folgenden vorstellen.

Neues Eclipse-Projekt SFCurve: Schnellere Abfragen dank FASS-Kurven

Das Projekt SFCurve, das sich zur Zeit in der Incubator-Phase der Eclipse Foundation befindet, hat seinen Ursprung in den LocationTech-Projekten GeoTrellis and GeoMesa. Beide Projekte hatten bereits Scala-Code für eine leichtere Erstellung und Bearbeitung von Z-Kurven-Indizes, die auf den räumlichen oder raumzeitlichen Eigenschaften von Daten basieren, entwickelt. Da sowohl GeoTrellis als auch GeoMesa ähnlichen Code produzierten, der dieselben Probleme lösen sollte, wurden die Anstrengungen nun in SFCurve gebündelt.

Apache HBase 1.0: „Der Beginn einer neuen Ära“

Nach knapp siebenjähriger Entwicklungszeit steht Apache HBase, die verteilte und skalierbare Open-Source-Implementierung von Googles proprietärem Datenbanksystem BigTable für Apache Hadoop und HDFS, in der Version 1.0 bereit – „der Beginn einer neuen Ära“ für das Projekt, wie es Enis Söztutar, der Release Manager von HBase, beschrieb.

HBase: NoSQL-Lösung mit großer Zukunft

Mit seinen Wurzeln in der Bigtable-Technologie hat sich HBase über die Jahre zur Grundlage vieler Google-Produkte und -Dienste entwickelt. Welche Ideen, Architektur und welches Datenmodell stecken hinter HBase? Wir nehmen die NoSQL-Lösung unter die Lupe.

Datenvisualisierung: Mehr als Balken und Torten

Daten in eine visuell ansprechende und zugleich aussagekräftige Form zu bringen, gehört wohl in fast jedem Unternehmensbereich zu den täglichen Herausforderungen. Kein Wunder, dass die Datenvisualisierung neben der Analyse einen immer größeren Stellenwert einnimmt. Dabei gibt es jedoch einige Fallstricke.

Spring für Big Data: Spring XD 1.1 veröffentlicht

Etwas mehr als ein halbes Jahr ist seit der Veröffentlichung der ersten Hauptversion des Big Data-Tools Spring XD vergangen. Nun erfolgte nach mehreren Meilensteinen die allgemeine Verfügbarkeit von Version 1.1 sowie der Release des Maintenance-Updates 1.0.4.