Albert Blarer im JAX-Countdown

"Data Science ist eine fachübergreifende Angelegenheit"

Redaktion JAXenter
© S&S Media

Vom 12. bis 14. Mai findet parallel zur JAX die Big Data Con in Mainz statt. Im dreitägigen Programm dreht sich alles um aktuelle Big-Data-Themen wie Hadoop und MapReduce, NoSQL, Data Visualization, Cloud, Analytics oder System-Architektur. Auch Data Science, eine relativ neue Wissenschaftsdisziplin, wird dort ein Thema sein – in der Session von Albert Blarer. Wir wollten jetzt schon von ihm wissen, weshalb es sich lohnt, aus Daten eine Wissenschaft zu machen.

JAXenter: Können Sie sich noch erinnern, in welcher Situation Sie das Wort „Data Science“ zum ersten Mal hörten?
Albert Blarer: Im Herbst 2012 erschien in der Zeitschrift Harvard Business Review ein Artikel mit dem provokanten Titel „Data Scientist – The Sexiest Job of the 21st Century“. Auf den ersten Blick befremdete mich die Job-Bezeichnung Data Scientist, denn Wissenschaftler beschäftigen sich eigentlich immer mit Daten. Weshalb also aus Daten eine Wissenschaft machen?

Albert Blarer arbeitet als Principal Consultant für das IT-Dienstleistungsunternehmen Trivadis. Er hat ursprünglich Biologie studiert und anschließend mit einer biomathematischen Arbeit promoviert. Seit 2000 hat er sich der IT verschrieben. Aktuell arbeitet Albert Blarer in einem breit angelegten Big-Data-Projekt und beschäftigt sich mit der Analytik von schwach strukturierten Daten. Bild: A. Blarer

JAXenter: Warum lohnt sich das – aus Daten eine Wissenschaft zu machen?
Blarer: Eine tiefgründige Frage mit vielschichtigen Antworten. Die aktuelle Datenflut, die gemeinhin als „Big Data“ bezeichnet wird, erlaubt es uns, Daten aus völlig unterschiedlichen Kontexten gegenüberzustellen. Wenn beispielsweise Bewegungsdaten aus der Mobil-Telefonie mit epidemiologischen Erhebungen zu einer Infektionskrankheit verknüpft werden, erhalte ich neue, wertvolle Informationen, die eine effiziente Bekämpfung der Infektions-Ausbreitung ermöglichen. So geschehen in Kenia im Kontext der Malaria-Bekämpfung. Im Verbinden von Datensätzen aus unterschiedlichsten Fachbereichen liegt meiner Meinung nach eines der lohnendsten Ziele von Data Science.

Im Verbinden von Datensätzen aus unterschiedlichsten Fachbereichen liegt meiner Meinung nach eines der lohnendsten Ziele von Data Science.

JAXenter: Sie selbst sind promovierter Biologe. Welche individuellen Voraussetzungen und fachlichen Kenntnisse sollte man allgemein mitbringen, wenn man Data Science betreiben möchte?
Blarer: An erster Stelle möchte ich hier die Neugierde nennen. Sie ist der Hauptmotor, um bedeutsame Fragen zu stellen. Ferner halte ich eine interdisziplinäre Denkweise für wichtig, denn Data Science ist eine äußerst fachübergreifende Angelegenheit. Mein Hintergrund, die Biologie, hat mir immer sehr gut geholfen, Aufgabenstellungen interdisziplinär, manchmal auch unkonventionell, anzugehen. Schließlich braucht es für eine erfolgreiche Umsetzung der Lösungsidee auch Kenntnisse in Statistik, Mathematik und vielen Teilgebieten der Informatik.
 
JAXenter: Worauf sollten Unternehmen achten, die Data Science gewinnbringend einsetzen möchten?
Blarer: Unternehmen sind gut beraten, wenn sie beim Aufbau einer Data-Science-Lösung an ein Team von Mitarbeitern denken. Data Science beinhaltet meiner Ansicht nach zu viele unterschiedliche Facetten, als dass diese von einer einzigen Person fundiert abgedeckt werden können. Allzu oft erliegt man beispielsweise als Laie der Versuchung, eine Korrelation fälschlicherweise als kausale Beziehungen zu interpretieren. Ein Statistiker wird diesen Fehler mit Sicherheit erkennen. Er wird aber nur in Ausnahmefällen in der Lage sein, die Korrelations-Rechnung auf einem Hadoop-Cluster zu implementieren. Aufgabenteilung und Team-Arbeit halte ich für gewinnbringende Faktoren.
 
JAXenter: Warum ist dieser Wissenschaftszweig gerade für das Java-Umfeld interessant?
Blarer: Wenn man sich aus einem technischen Blickwinkel die System-Bausteine betrachtet, die Data Science ermöglichen, führt kein Weg an Java vorbei. Ich denke hier an Big-Data-Systeme, die eine Lambda-Architektur implementieren. Bausteine wie das Hadoop-Framework, die Messaging-Plattform Kafka, viele NoSQL-Datenbanken, wie etwa Cassandra, oder auch Storm zur Echtzeit-Verarbeitung von Datenströmen, sind in Java implementiert und besitzen Java-APIs. Natürlich bleibt Data Science nicht auf Java beschränkt. Es kommen auch viele Skript-Sprachen wie Python oder R zum Einsatz. Das Java-Umfeld stellt jedoch eine grundlegende Technologie dar.

An Java führt kein Weg vorbei.

JAXenter: Welche Erwartungen haben Sie an die BigDataCon bzw. JAX?
Blarer: Ich erwarte viele Begegnungen mit neugierigen Menschen und spannende Diskussionen. Dabei wünsche ich mir diesen „interdisziplinären Spirit” zu spüren, welcher Entwickler, Architekten, Wissenschaftler und Fachexperten so wunderbar zusammenschmieden kann und das Wesen von Data Science besonders gut wiedergibt. Solche Begegnungen bedeuten mir viel, weil sie äußerst lehrreich sind.

Geschrieben von
Kommentare

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
400
  Subscribe  
Benachrichtige mich zu: