Big Data

Advanced JPA: Persistenztricks für Fortgeschrittene

Aus diversen Projekterfahrungen haben sich beim Einsatz des Java Persistence API für die Entwicklung von Applikationen einige Best Practices herauskristallisiert, die sich als äußerst nützlich erwiesen haben. Die Erweiterung des DAO-Patterns, ein weiterführendes Konzept zum Schreiben von Testfällen und die Möglichkeit, mit Entitätsobjekten eine Vererbung abzubilden, sind Punkte, die an dieser Stelle diskutiert werden.

Apache Flink: Modernes Stream Processing für Big Data und Machine Learning

Für das Stream Processing gab es bereits vor Apache Flink Frameworks wie Apache Spark und Apache Kafka. Während diese beiden Frameworks allerdings erst im Nachhinein auf die Datenstrom-Verarbeitung optimiert wurden, wurde Apache Flink für diesen Anwendungszweck von Grund auf designt. Fabian Hueske, Co-Founder und Software Engineer bei data Artisans, spricht im Interview über die Unterschiede zwischen den Frameworks und die Zukunft des Stream Processings.

Big Data & Künstliche Intelligenz – ein Erfolgsfaktor für passgenaues Business

Wer im Business-Alltag auf eigenes Datenmanagement und Künstliche Intelligenz setzt, ist der Gewinner von morgen, weil er heute schon den Überblick behält. „Künstliche Intelligenz“ ist digitales Zukunftsthema und Boomfaktor in Wissenschaft, Wirtschaft und Medien und hat längst in Unternehmen und Institutionen Einzug gehalten. Doch wenn Konsumenten und Organisationen zunehmend digital agieren, müssen auch die Ansätze zur Kundenakquise, zum Personalmanagement und zum Businessmanagement digitale Kommunikation und Interaktion schneller und umfassender operationalisieren und analysieren.

„Optimiert man blind auf eine einzige Metrik hin, kann das gewaltigen Schaden anrichten“

Wie stellen wir fest, was wichtig genug ist, um gemessen zu werden? Wie bekommen wir einen gesamtheitlichen Überblick über die Gesundheit des Unternehmens? Wie stellen wir sicher, dass Metriken uns mehr helfen, als dass sie uns schaden? Im Interview von der mit Julia Wester, Mitgründerin und Principal Consultant bei Lagom Solutions, von der DevOpsCon 2018 sprachen wir über all diese Fragen und mehr.

Data- und Event-driven Microservices mit Apache Kafka

Der Trend, in Sachen Softwarearchitektur auf Microservices zu setzen, hat nichts an Aktualität verloren. Doch um diese Architekturen möglichst effizient zu gestalten, muss auch der Datenaustausch zwischen den Microservices untereinander richtig funktionieren. In seiner Session von der W-JAX 2017 stellt Mike Wiesner, Senior Manager für MHP – A Porsche Company, den Shared-Kernel-Ansatz vor. Dabei kommt auch Apache Kafka zum Einsatz.

Kubernetes & Apache Spark: Das perfekte Duo für Data Science & Machine Learning

Irgendwann mussten sich die Bereiche Kubernetes bzw. Container und Machine Learning ja treffen. In seinem Artikel erklärt Terry Shea, Chief Revenue Officer bei Kublr, wie man beim Maschinellen Lernen und im Internet of Things von Kubernetes profitieren kann. Schlüsselelement ist dabei die neueste Version von Apache Spark (2.3), die den nativen Support für die Orchestrierungsplattform bereitstellt.

Machine Learning mit Apache Spark: „Ein maschinelles Lernmodell ist nur so gut wie sein Input!“

Zu Beginn des Jahres wurde Apache Spark 2.3 veröffentlicht und bildet einen bedeutenden Meilenstein für das Structured Streaming. Es gab allerdings noch viele weitere, interessante Features, die ebenso wichtig sind. Wir sprachen daher mit Reynold Xin, dem Mitgründer und Chief Architect von Databricks, über die Databricks Runtime und andere Verbesserungen in Apacke Spark 2.3.

Data Science in der Industrie: Nicht reden, sondern loslegen!

Glaubt man vielen Zukunftsszenarien, so ist die Arbeitswelt von morgen vorgezeichnet: Der Mensch wird im Rahmen der technischen Datenevolution zunehmend entmündigt. Doch ist die datengestützte Technologie nur negativ zu bewerten? Anlässlich der Internet of Things Conference in München sprachen wir zu diesem spannenden Thema mit dem Speaker und Data Science-Spezialisten Dr. Tobias Brombach.

Ein paar Studien, etwas Testing und Hadoop 3 – unser Wochenrückblick

In der letzten Woche flatterten der JAXenter-Redaktion gleich mehrere Studien ins Haus. Der State of JavaScript 2017 ist da und Joblift hat herausgefunden, dass App-Entwickler nach wie vor heiß begehrt sind. Daneben haben wir auch einen Blick auf ein von Entwicklern ziemlich ungeliebtes Thema geworfen: Testing. Schließlich trudelte nach fünf Jahren dann auch noch Hadoop 3 ein.

Hadoop 3.0: Weit jenseits der Batch-Verarbeitung

Fünf Jahre hat Hadoop von der Version 2.0 auf die 3.0 gebraucht. Andrew Wang, Release Manager von Apache Hadoop 3, spricht vom größten Release aller Zeiten des Open-Source-Projekts. Dementsprechend lang ist die Liste der Änderungen und neuen Features. Wie immer geht es um mehr Effizienz, Skalierbarkeit und Zuverlässigkeit.