Suche
Datenanalyse

Cloudera Enterprise 5.5 sucht nach unnötigen Workloads

Melanie Feldmann

© Shutterstock / VIGE.CO

Die auf Apache Hadoop basierende Datenmanagement- und Analyse-Plattform Cloudera Enterprise ist in der Version 5.5 verfügbar. Die wichtigste Neuerung ist die Beta-Version des Cloudera Navigator Optimizers. Mit ihm lassen sich Leistung und Effizienz von Workloads steigern.

In jedem Unternehmen können über mehrere Systeme hinweg jederzeit unzählige Workloads ablaufen. Viele solcher Workloads weisen ähnliche Schwachstellen auf: Etwa Störungen in ETL-Pipelines, lange Wartezeiten für Business-Intelligence-Berichte, erhöhter Systemdruck aufgrund von Adhoc-Abfragen und unnötig komplexe Abfragen. Im Ergebnis gehen dadurch Zeit und Geld verloren.

Der Cloudera Navigator Optimizer analysiert vorhandene Workloads und macht deutlich, welche Prozesse am wichtigsten sind, auf welche Daten am meisten zugegriffen wird und wie diese Daten genutzt werden. Die gewonnenen Informationen werden dann automatisch in Optimierungsempfehlungen umgewandelt. Über ein Dashboard erhält der  Anwender Handlungsempfehlungen, worauf sich Entwicklungsaufwendungen konzentrieren sollten, um die größte Wirkung zu erzielen. Dabei geht es vor allem darum, Doppeleinträgen zu identifizieren, Komplexität aufzudecken und kompatible Ökosystem-Tools wie Impala und Apache Hive einzusetzen. Der Cloudera Navigator Optimizer wird vom Big Data Integration Service (BDIS) des Unternehmens Xplain.io angetrieben, das im Februar 2015 von Cloudera übernommen wurde. Einen kleinen Einblick in das Tool gibt dieser Blogbeitrag.

Das kann das Release sonst noch

Darüber hinaus umfasst die Analyse-Plattform eine Reihe weiterer Funktionen, um die Analyse auf Hadoop-Basis zu stärken. Die Query Engine Impala, die Cloudera plant an die Apache Foundation zu übergeben, unterstützt nun geschachtelte Datenarten einschließlich JSON, um Datenerkundung und Business Intelligence auszudehnen. Sicherheit auf Spaltenebene ermöglicht eine fein abgestufte Zugangskontrolle für alle Nutzer. Die Plattform umfasst als weitere Schutzfunktion nun auch die Verwaltung von Berechtigungen, einschließlich der Passwort-Herausgabe. Außerdem erzwingt der Cloudera Navigator nun automatisch vollständige Daten-Lifecycle-Workflows, einschließlich der Aufbewahrung und Archivierung, damit immer die richtigen Daten bereitstehen. Das neue Cloudera Navigator SDK liefert zudem Herkunfts- und Metadaten-Funktionen zu Partner-Tools, um eine erweiterte Sichtbarkeit zu erreichen, ganz gleich, welche Tools zur Integration, Einschleusung oder Analyse von Daten zum Einsatz kommen. Hier geht es zu den vollständigen Release Notes.

Aufmacherbild: A hipster Caucasian man has a lot of work von Shutterstock / Urheberrecht: VIGE.CO

Verwandte Themen:

Geschrieben von
Melanie Feldmann
Melanie Feldmann
Melanie Feldmann ist seit 2015 Redakteurin beim Java Magazin und JAXenter. Sie hat Technikjournalismus an der Hochschule Bonn-Rhein-Sieg studiert. Ihre Themenschwerpunkte sind IoT und Industrie 4.0.
Kommentare

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
400
  Subscribe  
Benachrichtige mich zu: