Big Data bewältigen und sinnvoll nutzen

Gold aus dem Datenberg schürfen

Christian Kirschniak

Die Technologie zum Zähmen des Big-Data-Phänomens steht bereits. Doch geht es nicht allein um die schiere Bewältigung der neuen Datenexplosion, sondern um deren Kapitalisierung. Hier gibt es je nach Business Case Raum für viele neue Möglichkeiten. Neben Kriterien, die die Klassifikation von Big Data ermöglichen sollen, beschäftigt sich dieser Artikel mit den Fragen, die sich Unternehmen im Umgang mit ihren Datenmassen stellen sollten, um sie gewinnbringend für die Entscheidungsoptimierung nutzen zu können.

Es sind Zahlen, die das Vorstellungsvermögen übersteigen: Der tägliche Datenausstoß liegt heute bei 2,5 Trillionen Bytes. Allein 90 Prozent der heute existierenden Daten sind erst in den letzten zwei Jahren erzeugt worden. Hauptursache ist die umfassende „Computerisierung“ der Gesellschaft und Warenwelt: Sensoren erfassen Wetterinformationen, Social-Web-Nutzer posten Statusupdates, Digitalfotos und Videos in Onlineportalen, Onlinekunden geben Transaktionsdaten ins Netz, Handys senden Positionssignale und vieles mehr. Der Name, den die Branche dafür gefunden hat, versucht die Überwältigung durch das Phänomen in schlichte Worte zu fassen: Big Data. Vor allem das oft zitierte „Internet der Dinge“ hat sich als ein wahrer Katalysator für die Big-Data-Erscheinung entpuppt. Der Jogger zählt seine gelaufenen Kilometer per Smartphone und übermittelt seine Route an die Community, intelligente Stromzähler senden im Fünfzehnminutentakt aktuelle Verbrauchszahlen zur Stromnutzung jedes einzelnen Haushalts, Geschäftsleute fotografieren Flippcharts mit dem Smartphone und senden die Bilder an Kollegen – den Beispielen sind keine Grenzen gesetzt.

Drei Vs bestimmen Big Data

Da das Phänomen so weit verbreitet ist, droht aber auch eine missbräuchliche Verwendung des Begriffs. Die Experton Group zum Beispiel versteht den Begriff nicht als neuen Hype, sondern als neue Dimension, die traditionelle Datenanalysemethoden erweitert. Zur Abgrenzung beschreiben die Experten, was Big Data eben gerade nicht ist:

  • Keine einzelne Technologie
  • Kein Hardware- oder Softwareprodukt
  • Keine IT-Strategie oder -Architektur
  • Kein Marketing-Buzzword
  • Kein kurzfristiger Trend

Vielmehr sei Big Data eine Erweiterung von schon bestehenden Datenanalysemethoden, -prozessen und -verfahren. Aber nicht jede große Datenansammlung ist zwangsläufig auch ein Fall von Big Data. Großbanken etwa prozessieren schon sehr lange allnächtlich enorme Mengen an Transaktionsdaten, ohne dass man dort das Phänomen als Big Data bezeichnen würde. Um Klarheit über den Begriff zu erlangen, lässt sich das Big-Data-Phänomen nach spezifischen Kriterien fassen, zum Beispiel durch die Formel „V3“. Demzufolge spricht man dann von Big Data, wenn die folgenden Kriterien zutreffen:

  1. Variety (Vielfalt): Big Data geht über strukturierte Daten hinaus und umfasst unstrukturierte Daten aller Art: Text, Audio, Video, Klickstreams, Protokolldateien usw. Heute sind mehr als 80 Prozent der Daten unstrukturiert.
  2. Velocity (Geschwindigkeit): Big-Data-Daten sind oft zeitkritisch und müssen daher sofort verarbeitet werden, wenn sie in das Unternehmen einfließen, damit ihr geschäftlicher Wert optimal genutzt wird. Der Trend geht hier zum Echtzeit-Computing.
  3. Volume (Masse): Für Big Data gibt es nur eine Größenordnung: groß. Unternehmen versinken geradezu in einer Datenflut, die vielfach Tera- oder sogar Petabytegröße erreicht.

Die Nachtschichten der Datenbanksysteme in Großbanken zählen daher nicht unbedingt zum Big-Data-Phänomen, da bei ihnen „nur“ das Volume-V zutrifft, nicht aber zwangsläufig die beiden anderen Merkmale.

Geschrieben von
Christian Kirschniak
Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.