Das Ziel von Apache Mahout ist es, dass Entwickler schnell skalierbare Machine-Learning-Algorithmen erstellen können, die auf den aktuellen High-Performance Parallel-Computing Engines laufen. Mahout verbindet eine interaktive Umgebung mit einer Library, die lineare Algebra unterstützt und bereits viele moderne Machine-Learning-Algorithmen enthält. Dafür bietet Mahout eine breite Palette an vorkonfigurierten Algorithmen wie Matrixfaktorisierung oder Principal Component Analysis (PCA) in Scala für Apache Spark, H20 und Apache Flink.

Apache Mahout 0.13.0 macht es Entwicklern nun einfacher Matrizen auf Grafikkarten zu berechnen. Zusätzlich erlaubt die Version 0.13.0 Shared Nothing Computing auf GPUs, Multi-Core-CPUs oder in der JVM. In Mahout Samsara, einer integrierten Umgebung für Experimente mit Vektoren mit einer R-ähnlichen Syntax, gibt es nun eine JavaCPP Bridge zu nativen oder GPU-Operationen in ViennaCL. Auch verteilte GPU-Matrix-Matrix- und Matrix-Vector-Multiplikationen auf Spark sind jetzt möglich.

Kommende Releases von Mahout werden native iterative Gleichungen unterstützen, eine robustere Algorithmus-Library enthalten und smartere Tests sowie die Optimierung von Multiplikationen ermöglichen. Die kompletten Release Notes von Apache Mahout 0.13.0 findet man hier. Pat Ferrel, Mitglied im Apache Mahout Project Management Committee, hat hier eine Einführung in das Machine Learning Tool gegeben.