Den Maschinen Daten lehren

Datalore: Eine Webanwendung für Machine Learning

Marcel Richters
Datalore

© Shutterstock.com / LightSpectrum

Noch müssen Menschen in den meisten Fällen den Maschinen Daten und deren Interpretation beibringen. Mit der Webanwendung Datalore wollen die Entwickler von JetBrains diesen Schritt zumindest ein wenig vereinfachen. Die Anwendung ist seit Februar in der offenen Beta verfügbar und soll das Erstellen von Berechnungen einfach und kollaborativ machen. Dabei wird unter anderem auf intelligente Vorschläge und inkrementelle Kalkulation gesetzt.

Datalore ist seit Februar als offene Betaversion verfügbar. Mit der Webanwendung lassen sich Daten analysieren und visualisieren. Entwickler JetBrain zielt mit dem Tool darauf ab, die eigene Produktpalette im Bereich Machine Learning zu erweitern und setzt dabei bewusst auf Python. Eine klare Vision ist es, die JetBrains eigenen Angaben zufolge anhand dieser Produkte verfolgt, nämlich: „to make development as enjoyable and productive as possible for everyone.“ Bewerkstelligen wollen die tschechischen Entwickler das mit einigen Features, die die Verarbeitung von Daten in Datalore besonders einfach machen sollen. Zudem sind neben einem intelligenten Code-Editor auch Tools für die inkrementelle Berechnung und für Machine Learning an Bord.

Code-Editor mit Hellsicht

Ein Feature, auf das die Programmierer besonders stolz sind, ist der Code-Editor. Dieser macht das Coden nicht nur durch Vorhersagen einfacher, sondern erstellt die Vorhersagen abhängig vom jeweiligen Kontext. Das bedeutet, die Vorschläge des Editors orientieren sich in Echtzeit an dem, was zuletzt als Code geschrieben wurde. Daraus generiert der Editor Datensätze für Uploads, Graphendesign und andere Funktionen.

Berechnungen sind kein Kartenhaus

Bei der Berechnung von Machine-Learning-Modellen braucht es manchmal viel Feintuning. Mit Datalore will man dieser Tatsache entgegenkommen, indem das Programm Abhängigkeiten zwischen verschiedenen Berechnungen folgen soll. Das bedeutet, wenn die Daten einer Berechnung abgeändert werden, versucht Datalore die Neuberechnungen in abhängigen Kalkulationen zu minimieren. Auf diesem Weg sollen Änderungen schneller sichtbar werden und die Ausgabe immer die aktuellste Version einer Visualisierung anzeigen.

Datalore

Das UI von Datalore mit Beispieldaten / Quelle: JetBrains

Ab in die Bibliothek

Für die Datenanlyse in Python dürfen Basics wie NumPy, Pandas und Sklearn nicht fehlen, dazu bietet Datalore zwei eigene Bibliotheken an. Zum einen datalore.plot, die sich an ggplot orientiert, sowie datalore.geo_maps. Mit Letzterer soll interaktives Kartenmaterial in Analysen implementiert werden. Die Karten basieren dabei auf OpenMaps. Außerdem sind eingebaute Datensets wie Iris, MNIST oder Titanic in Datalore enthalten, die mit einem Dateimanager um eigene .csv-Dateien ergänzt werden können. Änderungen in den jeweiligen Datensätzen werden automatisch gespeichert, dank Versionskontrollsystem sollen Änderungen ohne Probleme rückgängig gemacht werden können.

Interaktiv miteinander und dem Rechenzentrum

Da Datalore eine reine Webanwendung ist, können Workbooks und Code-Editoren zeitgleich von mehreren Teammitgliedern genutzt werden. Zusätzlich ist der Austausch über ein Kommentarsystem möglich. Sowohl diese als auch alle anderen Funktionen der Anwendung laufen auf Berechnungsressourcen, die von der jeweils genutzten Datenmenge abhängen. Am unteren Rand des Browserfensters lässt sich laufend die Ressourcennutzung ablesen, dabei werden sowohl die CPU-Last, als auch freier Speicher werden angezeigt.

Für größere Anwendungen wie Deep-Learning-Algorithmen bietet JetBrains auch größere Rechenkraftpakete an. Diese können über ein Forum angefragt werden. Unter datalore.io steht die Basisanwendung zur Verfügung. Nach der Anmeldung stehen bereits ein Hello-World-Workbook und einige Beispiele bereit, obwohl sich Datalore noch in der Betaphase befindet. Wann mit einer stabilen Version zu rechnen ist, hat JetBrains noch nicht bekannt gegeben.

Python Summit 2018
Oz Tiram

Advanced Flow Control in Python

mit Oz Tiram (derico – web development & consulting))

Geschrieben von
Marcel Richters
Marcel Richters
Marcel hat Soziologie an der Goethe-Universität in Frankfurt am Main studiert und danach als E-Commerce-Manager gearbeitet. Seit Februar 2018 unterstützt er das Team von JAXenter als Redakteur. Daneben arbeitet er als freier Journalist in der Mainmetropole.
Kommentare

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
400
  Subscribe  
Benachrichtige mich zu: