Steckbrief: Machine Learning Tools

ADAMS: Machine Learning für einen besseren Workflow

Peter Reutemann

© Shutterstock / Daboost (modifiziert)

Im Rahmen unseres Themen-Dossiers zum Maschinellen Lernen stellen wir interessante Projekte und Beispiele für Machine Learning vor. Heute: Machine Learning mit ADAMS.

Das Advanced Data Mining And Machine Learning System, kurz ADAMS, war mehr oder weniger ein Nebenprodukt aus einem Forschungsprojekt, das Maschinelles Lernen auf GC-MS (Gas-Chromatography Mass-Spectrometry)-Daten angewandt hat. Für die vielen Vorverarbeitungsschritte war es notwendig, ein Workflow-System einzusetzen. Ursprünglich war die Entwicklung nur intern und auf Kepler basiert. Da es allerdings zu umständlich war, neue Komponenten und Operatoren in Kepler einzubinden, haben wir unsere eigene Workflow Engine implementiert. Über die Jahre ist daraus dann ADAMS geworden, welches seit ein paar Jahren auch der Öffentlichkeit zugänglich ist.

Wie ist ADAMS aufgebaut?

ADAMS is in Java geschrieben und bietet auch Scripting mittels Jython und Groovy. Wir benutzen ADAMS als Plattform für unsere kommerziellen Projekte, bei denen wir uns in die Geschäftsprozesse einklinken und Daten verarbeiten und Vorhersagen machen. Die Kommunikation kann z. B. über Webservices (SOAP) geschehen. Beispiele für kommerzielle Projekte sind Vorhersagen für Boden- und Pflanzenproben auf Basis von spektralen Daten wie NIR/XRF/MIR, Bildverarbeitung zur Insektenidentifizierung in Gewächshäusern. Diese Beispiele sind auch in den folgenden Publikationen beschrieben:

Reutemann and G. Holmes (2015). Big Data with ADAMS. Proceedings of the 4th International Workshop on Big Data, Streams and Heterogenous Source Mining: Algorithms, Systems, Programming Models and Applications. Editors: Wei Fan, Albert Bifet, Quiang Yang, Philip S. Yu. Vol. 41:5-8.

Reutemann PM, Holmes G 2014. Scientific workflow management with ADAMS: building and data mining a database of crop protection and related data. In: Beresford RM, Froud KJ, Kean JM, Worner SP ed. The plant protection data tool box. New Zealand Plant Protection Society.

Ein kleines Beispiel

Workflows werden normalerweise über den Flow Editor erstellt (= graphisches Programmieren). Quellcode muss nur geschrieben werden um neue Operatoren hinzuzufügen. Hier finden Sie ein Beispiel wie ein neuer Operator erstellt werden kann.

Wie soll es weiter gehen mit ADAMS?

Distributed Computing und Cloud Computing sind momentan in Vorbereitung, um besser bei großen Datenmengen und vielen Vorhersagemodellen zu skalieren. Rudimentäre Unterstützung für Deep Learning ist vorhanden (mittels deeplearning4j), wird aber in der Zukunft noch ausgebaut.

 Steckbrief

Name Advanced Data Mining And Machine Learning System (ADAMS)
Art Workflow Engine
Sprachen Java, auch Jython und Groovy
Lizenz GNU General Public License
Home https://adams.cms.waikato.ac.nz/
Kontakt ADAMS Team

 

Faszination Machine Learning – das Interview

JAXenter: Was ist an Machine Learning so faszinierend?

Zerstörungsfreie Methoden wie NIR/MIR erlauben es, die Anzahl der Labortests für Proben zu reduzieren, was die Umwelt entlastet.

JAXenter: Glaubst du, dass Maschinen eines Tages die Welt übernehmen werden? Sind diese Ängste gut begründet?

Nicht wirklich.

JAXenter: Welche Top 3 Blogs/Filme/Bücher kommen dir in den Sinn, wenn jemand mehr über Machine Learning erfahren möchte?

Ich empfehle Data Mining von Witten et al., Machine Learning von Tom Mitchell und Artificial Intelligence von Russel und Norvig.

JAXenter: Beende die folgenden Sätze:

Machine Learning wird in 50 Jahren…

…nicht mehr aus dem Leben wegzudenken sein, auch wenn wir gar nicht mehr wahrnehmen werden, dass all die kleinen Helferlein maschinelles Lernen benutzen.

Wenn Maschinen intelligenter als Menschen werden…

… dann könnte endlich mal ein intelligenter Diskurs stattfinden, wie die endlich Ressourcen auf der Erde gehandhabt werden.

Im Vergleich mit Menschen wird einer Maschinen nie…

… warm ums Herz werden, wenn das Lied im (futuristischen Äquivalent vom) Radio spielt, bei welchem der erste Kuss ausgetauscht wurde.

Ohne das Maschinelle Lernen würde die Menschheit niemals in der Lage sein …

… die Herausforderungen des 21. Jahrhunderts zu bewältigen.

 

Verwandte Themen:

Geschrieben von
Peter Reutemann
Peter Reutemann
Peter Reutemann ist Lead Developer des Projektes ADAMS, Advanced Data Mining And Machine Learning System.
Kommentare

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
400
  Subscribe  
Benachrichtige mich zu: