Es gibt viel zu tun

Daten – das Öl des 21. Jahrhunderts: Unternehmerische Chancen von Open Data

Klaus-Dieter Schulze

©iStock / nd3000

Neben sozialen Netzwerken spielen in der Diskussion rund um explosionsartig wachsende Datenmengen auch Aspekte wie Industrie 4.0 oder das Internet of Things für Daten und ihre Interpretation eine wichtige Rolle. Bei einigen der nach Börsenwert wertvollsten Unternehmen der Welt wie Facebook oder Google sind Daten und Business Analytics sogar zentraler Teil des Geschäftsmodells. Zu den Unternehmensdaten gesellt sich jetzt eine neue Spezies: Open Data.

Die Metapher von „Daten als Öl des 21. Jahrhunderts“ versucht, Bedeutung und Wert von Daten zu versinnbildlichen. Dabei spielt Öl nicht nur als Energiequelle, sondern auch als Vorprodukt eine entscheidende Rolle und ist aus vielen Branchen gar nicht wegzudenken. Genau diese Bedeutung wird Daten heute gegeben: Wer Daten am besten in Informationen verwandelt, sein Geschäft damit steuert oder seine Produkte digital aufwertet, wird im Wettbewerb die Nase vorn haben.

Blockchain Whitepaper 2018

Free: Blockchain Technology Whitepaper

If building a blockchain from scratch is beyond your current scope, the blockchain technology whitepaper is worth a look. Experts from the field share their know-how, tips and tricks, development advice, and strategy for becoming a blockchain master.

Soviel Einhelligkeit, wie über die Bedeutung von Big Data herrscht, so wenig wird zwischen den einzelnen Datenquellen differenziert. Wenig Beachtung haben bisher Open Data gefunden. Obwohl im Fahrwasser der Open-Governance-Diskussion gerade diese, noch dazu kostenlose, Datenquelle mehr und mehr an Bedeutung gewinnt. Aber was ist Open Data? Und welche Herausforderungen und Chancen sind mit Open Data verbunden? Das Open Data Handbook der Open Knowledge Foundation, einer internationalen Non-Profit-Organisation zur Verbreitung von Wissen, definiert Open Data so: „Offene Daten sind Daten, die von jedermann frei benutzt, weiterverwendet und geteilt werden können. Die einzige Einschränkung betrifft die Verpflichtung zur Nennung des Urhebers.“ Diese Definition wird noch durch folgende Punkte ergänzt:

  • Verfügbarkeit und freier Zugang: Offene Daten müssen als Ganzes verfügbar sein und das zu geringen Vervielfältigungskosten, idealerweise als Download. Die Daten müssen weiterhin in einem zweckmäßigen und editierbaren Format vorliegen.
  • Wiederverwendung und Weitergabe: Offene Daten müssen so bereitgestellt werden, dass sie wiederverwendet, weitergegebenen oder um Daten anderer Quellen ergänzt werden können.
  • Universelle Nutzung: Jeder soll offene Daten nutzen, verarbeiten und weiterverteilen können. Es darf keine Benachteiligung von einzelnen Personen, Gruppen oder Anwendungszwecken geben. Einschränkungen in der kommerziellen Nutzung etwa oder Beschränkung auf bestimmte Nutzungszwecke, z. B. nur für Bildungseinrichtungen, sind nicht erlaubt.

Open Data konkret: GovData und die Vatikanische Bibliothek

Auch wenn die Definition klar abgrenzt, helfen zwei Praxisbeispiele zu unterscheiden. Ein Beispiel, das die oben genannten Kriterien maßgeblich erfüllt, ist das Portal GovData: Die Plattform wurde 2014 vom Bundesministerium des Inneren als das „zentrale Open-Data-Portal für Bund, Länder und Kommunen“ ins Leben gerufen. GovData bietet frei zugängliche Daten aus rund vierzehn unterschiedlichen Kategorien wie Wirtschaft, Gesundheit oder Bildung. Die einzelnen Daten sind alle in Form von in Open Data üblichen Formaten wie .xls oder .csv veröffentlicht. Verwendung und Weiterverarbeitung sind damit einfach.

Abb. 1: Das Beispiel GovData zeigt, wie Open Data funktionieren kann

Abb. 1: Das Beispiel GovData zeigt, wie Open Data funktionieren kann

Ein Negativbeispiel ist die Vatikanische Bibliothek: Sie beherbergt Literatur aus mehr als 2 500 Jahren und ist komplett digitalisiert worden. Bücher lassen sich online finden, und man kann die kompletten Bestände der Bibliothek betrachten. Doch die entscheidenden Kriterien für Open Data sind nur teilweise erfüllt. Verfügbarkeit und freier Zugang sind zwar durch die Digitalisierung deutlich verbessert, aber die entscheidende Einschränkung ist die mangelnde Möglichkeit, Daten weiterzuverarbeiten. Mit extrem viel Aufwand würden sich die gescannten Bücher und Dokumente eventuell aufbereiten lassen. Aber eine einfache Weiterverarbeitung oder Analyse der Daten ist nicht möglich. Auch wenn die freie Verfügbarkeit häufig in den Vordergrund gestellt wird, die beiden Beispiele verdeutlichen: Die Nutzbarkeit von Daten spielt die entscheidende Rolle.

Offene Datenquellen sind überall

Legt man die obige Definition zugrunde, findet man viele interessanten Bezugsquellen von Open Data. Mit Blick auf den Inhalt der Daten gibt es Schwerpunkte, wie geografische Daten oder Wetter- und Klimadaten. Daten aus öffentlichen Statistiken finden sich besonders häufig, woran sich klar das Engagement der öffentlichen Hand für Open Data ablesen lässt. Neben diesen Schwerpunkten können allerdings auch zu fast jedem anderen Themenbereich Daten gefunden werden. Ein gutes Beispiel für die Vielfältigkeit der Daten und die Komplementarität verschiedener Datenquellen ist die Linking Open Data Cloud http://lod-cloud.net/. Hier werden Daten geclustert und visualisiert. Das vereinfacht die Navigation in den großen und teilweise sehr heterogenen Daten. Es gibt auch Beispiele dafür, wie sich ganze Open-Data-Plattformen im Laufe der Jahre erfolgreich etablieren konnten. Die Wichtigsten:

Deutschland ist Schlusslicht

Gefördert werden Open-Data-Initiativen insbesondere von öffentlichen Institutionen. So beschreiben die G8-Staaten in ihrer Open-Data-Charta aus dem Jahr 2008 die Bedeutung von Open Data für die gesellschaftliche Entwicklung. 2013 wurde auf dem G8-Gipfel auch der „G8 Open Data Charter And Technical Annex“ formuliert. Hier wurde beschlossen, dass jeder Bürger ein Recht auf die Daten von öffentlichen Institutionen hat. Diese sollen einfach, für alle nutzbar und frei zugänglich sein sowie hinsichtlich der Qualität der Daten geprüft werden. Parallel zu dieser Entscheidung beantworteten die G8-Staaten jeweils Fragen zu Open Data und schätzen den Istzustand ein. Das Center for Data Information hat die Befragungen ausgewertet: Deutschland belegt lediglich den vorletzten Platz. Die große Spanne zwischen Anspruch und Wirklichkeit soll mit dem 2014 veröffentlichten „Nationalen Aktionsplan der Bundesregierung zur Umsetzung der Open Data Charter der G8“ bis 2020 geschlossen werden.

Herausforderungen bei der Verwendung von Open Data

Zunächst gilt es festzuhalten: Open Data unterscheiden sich meist erheblich von unternehmensinternen Daten, wie sie etwa in CRM- oder ERP-Systemen für die Analyse verwendet werden. Open Data enthalten in der Regel nämlich keine personalisierten Daten. In öffentlichen Statistiken gibt es zwar soziodemografische Daten. Diese gruppieren die Bevölkerung aber nur in Kohorten. Die Herstellung einer direkten Beziehung zu unternehmensinternen Kundendaten ist damit nur bedingt möglich.

Eine weitere Einschränkung sind zeitliche Verfügbarkeit und Aktualität der Daten. Eine tägliche Aufbereitung von Kunden- oder Accounting-Daten ist in vielen Unternehmen heute schon üblich. Bei Daten, die unter die Open-Data-Definition fallen, ist eine vergleichbare Aktualität in der Regel nicht gegeben. Viele öffentliche Statistiken werden nur monatlich oder unregelmäßig neu aufbereitet. Zudem ist oft nicht festgelegt, wann und wie häufig Updates bereitstehen. Wenn man Open Data als Ergänzung für unternehmensinternen Analysen verwendet, sollte man sich dieser Einschränkungen bewusst sein.

Rechtliche Fragen

Bei der Verwendung von Daten ist auch stets zu prüfen, welche rechtlichen Rahmenbedingungen eingehalten werden müssen. Im Falle von Open Data sind Datenschutzrichtlinien und Eigentumsrechte an Daten zu prüfen. Ziel des Bundesdatenschutzgesetzes (BDSG) ist es, den einzelnen davor zu schützen, dass er durch den Umgang mit personenbezogenen Daten in seinen Persönlichkeitsrechten beeinträchtigt wird (BDSG §1 Absatz 1). Damit ist das Thema für Open Data nur eingeschränkt relevant, da als Open Data fast ausschließlich nicht personenbezogene Daten zur Verfügung gestellt werden. Falls es doch einmal personalisierte Open-Data-Quellen gibt, sollten Nutzer eine genaue Prüfung durch die Datenschutzbeauftragten durchführen lassen.

Die Frage der Eigentumsrechte Dritter an den Daten ist in der Definition von Open Data zwar berücksichtigt. Demnach soll sichergestellt sein, dass die Daten frei von Rechten Dritter sind und damit vom Nutzer ohne Bedenken verarbeitet werden können. Wirft man aber einen Blick auf die Rechtslage zu verschiedenen Daten, ist eine nähere Prüfung auf jeden Fall ratsam. Die Notwendigkeit der Prüfung lässt sich besonders am Beispiel von Geoinformationen illustrieren. Zur Erstellung werden üblicherweise besonders viele Quellen verwendet: Karten und Pläne werden nach dem deutschen Urheberrechtsgesetz gemäß § 2 Abs. 1 Nr. 7 („Darstellungen wissenschaftlicher oder technischer Art, wie Zeichnungen, Pläne, Karten, Skizzen, Tabellen und plastische Darstellungen“) und Abs. 2 geschützt, sofern sie „persönliche geistige Schöpfungen“ darstellen oder im Falle einer Karte als „analoger Datenbank“ (§ 4 und § 87a UrhG, s. u.) ihre „Beschaffung, Überprüfung oder Darstellung eine nach Art oder Umfang wesentliche Investition erfordert“. Es lässt sich schnell erkennen, dass die Prüfung der im Gesetz formulierten Bedingungen nicht einfach ist. Formulierungen wie „persönliche, geistige Schöpfungen“ oder „wesentliche Investitionen“ lassen einen Interpretationsspielraum.

Um rechtlichen Unklarheiten vorzubeugen, werden immer häufiger Data-Governance-Richtlinien eingeführt. Eine Data-Governance-Richtlinie beschreibt, wie Unternehmen erreichen, dass ihre Daten sicher, einheitlich, korrekt gespeichert und leicht zugänglich sind. Die Richtlinie legt fest, wer unter welchen Umständen für die Informationen verantwortlich ist und mit welchen Verfahren die Daten verwaltet werden sollen. Gerade bei einer zunehmenden Anzahl an Datenquellen dienen solche Richtlinien nicht nur dazu, die rechtlichen Rahmenbedingungen einzuhalten. Sie sind darüber hinaus auch zwingend notwendig, um den Überblick über die zunehmend komplexer werdenden Datenbestände zu behalten.

Wirtschaftliche Chancen von Open Data

Betrachtet man die Chancen und Möglichkeiten von Open Data, überwiegt das große Potenzial die Risiken deutlich. Europaweit betrachte, sehen die Prognosen vielversprechend aus. Das European Data Portal hat den Marktwert von Open Data Ende 2016 auf 55,3 Milliarden Euro innerhalb der 28 EU-Staaten geschätzt. Bis 2020 soll sich dieser nochmals um 36,9 Prozent steigern, womit Open Data in der EU bei einem Marktwert von 75,4 Milliarden Euro liegt. Hinzu kommt der wachsende Arbeitsmarkt, denn momentan schafft der Open-Data-Sektor 25 000 Jobs jährlich, was sich bis 2020 mit einer Steigerung von 32 Prozent auf 200 000 Jobs in Europa erweitern soll.

Neuer Arbeitsplatz: Data Broker

Ein Beispiel für das Entstehen neuer Geschäftsmodellen auf der Basis von Open Data und damit auch dem Entstehen neuer Arbeitsplätzen sind so genannte Data Broker. Diese verfügen in der Regel über branchen- oder prozessspezifisches Know-how, das sie für die Aufbereitung von Daten verwenden. Data Broker sammeln in einem ersten Schritt Daten, die für bestimmte Branchen interessant sind. Als Input können dabei Open-Data-Quellen genauso wie kommerzielle Datenangebote dienen. Im zweiten Schritt nutzen Data Broker ihr Know-how für die sinnvolle Kombination und Integration verschiedener Datenquellen. Das Know-how für die Aufbereitung der Daten ist die Kernleistung des Data Brokers, das fertige Produkt sind angereicherte Daten, die er verkauft.

Das Sammeln und Aufbereiten von Daten dient als neues Geschäftsmodell im Open-Data-Business und wird in Zukunft große Bedeutung gewinnen. Denn die Menge der Daten, die mittlerweile zur Verfügung stehen, sind ohne Kenntnisse nur schwer zu nutzen. Vor allem müssen offene Daten meist kombiniert und aufbereitet werden, was mit hohem Ressourcenaufwand verbunden ist. Data Broker nehmen Unternehmen diese Arbeit ab.

Fazit

Mit Open Data entwickelt sich ein neuer Markt, und es gibt schon viele Beispiele von Mehrwert: Von der Möglichkeit, das Stauaufkommen europaweit um 629 Millionen Stunden zu reduzieren, bis hin zur Restauranthygiene sind den Möglichkeiten wenig Grenzen gesetzt.

Geschrieben von
Klaus-Dieter Schulze
Klaus-Dieter Schulze
Klaus-Dieter Schulze ist Vorstandsmitglied des TDWI Germany e.V. Er hat seit über zwanzig Jahren verantwortliche Positionen im Business-Intelligence-Umfeld bei verschiedenen Beratungshäusern innegehabt. Seit Anfang 2015 ist er Vice President Big Data & Analytics bei NTT DATA. Er beschäftigt sich auf Basis seines betriebswirtschaftlichen Studiums bereits seit 1994 intensiv mit den Themen Business Intelligence und Data Warehouse. Er hat verschiedene Fachartikel und Buchbeiträge zur Entwicklung des BI-Markts veröffentlicht, ist Co-Autor der Europäischen Business Intelligence-Maturity-Audit-(biMA®-)Studie und referiert regelmäßig bei Fachveranstaltungen.
Kommentare

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
400
  Subscribe  
Benachrichtige mich zu: