Neuzugänge zur Eclipse LocationTech Working Group: SpatialHadoop und GeoGit

Diana Kupfer

Es ist die Ära der Working Groups bei Eclipse: M2M, Automotive & Co. haben sich in den letzten ein, zwei Jahren als besonders dynamische Technologiezweige und innovative Ideenschmieden erwiesen. Anfang Februar wurde mit LocationTech eine ganz neue Arbeitsgruppe für ortsabhängige Technologien ins Leben gerufen (wir führten dazu u. a. ein Interview mit Eddie Pickle vom beteiligten Unternehmen Boundless, früher: OpenGeo). Deren Mission ist es, Technologiestandards zur Erfassung und Verarbeitung von Geodaten zu entwickeln, die sich mit bestehender Unternehmens-IT und bewährten Big-Data- und BI-Lösungen zusammenführen lassen.

Geodaten à la Hadoop

In diesem Monat wurden bereits zwei LocationTech-Projektvorschläge eingereicht. Zum einen SpatialHadoop, eine auf Geodaten zugeschnittene Hadoop-Lösung. Genauer handelt es sich um ein MapReduce-Framework, das um MapReduce-Komponenten sowie um Ortsdatentypen wie Point, Rectangle oder Polygon erweitert wurde. Darüber hinaus lassen sich die Daten durch Ortsindizes im Dateisystem HDFS (Hadoop Distributed File System) leichter strukturieren. Enthalten sind laut Projektskizze außerdem ein Dutzend räumliche Operationen (darunter Range Query, Spatial Join, Convex Hull, Polygon Union), die allesamt als MapReduce-Programme implementiert sind. Nutzer und Entwickler verwenden ein und dasselbe API, über das sich das Framework um weitere räumliche Operationen erweitern lässt.

Da der Entwickler und designierte Projektleiter Ahmed Eldawy SpatialHadoop zuvor als Forschungsprojekt an der University of Minnesota entwickelte, steht bereits ein kompletter Prototyp unter Apache-2-Lizenz auf GitHub zur Verfügung. Das Framework kann einfach als Erweiterung eines existierenden Hadoop-Clusters installiert und genutzt werden. Eine Neukonfiguration von Hadoop ist dazu nicht notwendig.

Geodaten à la Git

Das andere LocationTech-Projekt, das sich seit Kurzem in der Proposal-Phase befindet, ist GeoGit, ein verteiltes Versionskontrollsystem nach dem Vorbild von Git, das seit 2010 von Boundless speziell für Geodaten entwickelt wird. Neben der von Git bekannten Datenverwaltung über Repositories können Rohdaten von gängigen Formaten wie Shapefiles, Microsofts SQL Server und SpatialLite importiert werden. Auch das Importieren von OpenStreetMap-(OSM-)-Daten samt History ist möglich. Um spezielle Datensets zu erstellen, können Mappings auf importierte OSM-Daten angewandt und per GeoGit an OSM gepusht werden. GeoGit steht wahlweise als Kommandozeilenanwendung oder als Java-Bibliothek zur Verfügung. Ein Plug-in für die GIS-(Geo-Informationssystem-)-Software Quantim GIS aus dem Hause Boundless ist ebenfalls in Vorbereitung. Übliche Commands für das Kommandozeilentool werden im Projektvorschlag vorgestellt:

add: Add features to the staging area

apply: Apply a patch to the current working tree

branch: List, create, or delete branches

cat: Provide content of an element in the repository

checkout: Checkout a branch or paths to the working tree

cherry-pick: Apply the changes introduced by existing commits

clean: Deletes untracked features from working tree

clone: Clone a repository into a new directory

commit: Record staged changes to the repository

config: Get and set repository or global options

conflicts: Shows existing conflicts

diff: Show changes between commits, commit and working tree, etc

 

Geschrieben von
Diana Kupfer
Diana Kupfer
Diana Kupfer war Redakteurin bei S&S Media für die Zeitschriften Java Magazin, Eclipse Magazin und das Portal JAXenter. 
Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.