Maschinelles Lernern

Die Cloud Vision API von Google bringt Applikationen bei Bilder zu erkennen

Mascha Schnellbacher

© Shutterstock/grufnar

Google hat einen weiteren Schritt in Richtung künstliche Intelligenz gemacht: Das Cloud Vision API steht ab sofort in der Beta-Version zur Verfügung. Bereits seit Dezember ist die Bilderkennungsfunktion als Limited Preview im Einsatz und ermöglicht das Entwickeln von Applikationen, die den Inhalt von Bildern erkennen und verstehen können.

Googles Cloud Vision API überträgt das Konzept des maschinellen Lernens auf Bilder. Das API soll zwischen tausenden von Kategorien unterscheiden und zielsicher die Emotionen hinter einem Gesichtsausdruck identifizieren können. Mit dem Beta-Release des Google Cloud Vision API kann nun jeder Bilder an das API übermitteln, das dann den Inhalt des Bilds wiedergibt und versteht. Dabei ist das Cloud Vision API nicht nur in der Lage, Alltagsgegenstände zu erkennen, sondern kann auch Text innerhalb des Bilds lesen oder Produktlogos identifizieren.

Features der Beta des Cloud Vision API

Das Beta-Release des Cloud Vision API ermöglicht den Zugriff auf das API, das auf eine Vielzahl von im Google Cloud Storage gespeicherten Bildern zurückgreifen kann. Zudem können Bilder als Teil des API-Requests eingebunden werden. Das Cloud Vision API unterstützt verschiedene Szenarien: So können beispielsweise Einblicke in Bilder gewonnen werden, da das API Objekte in Bildern erkennen und zuordnen kann – von Blumen bis hin zu bekannten Sehenswürdigkeiten. Neu ist die Fähigkeit, die vorherrschende Farbe in einem Bild zu erkennen.

Quelle: bit.ly/1Q4V9IR

Quelle: bit.ly/1Q4V9IR

Außerdem ist das Cloud Vision API in der Lage, anstößigen Inhalt aufzuspüren und zu melden. Auch Gefühle sind für das API kein Fremdwort: Es kann Emotionen wie Freude, Trauer und Ärger in Gesichtern erkennen. Zudem erlaubt die Optical Character Recognition (OCR) das Finden von Text in Bildern sowie eine automatische Spracherkennung.

Quelle: bit.ly/1Q4V9IR

Quelle: bit.ly/1Q4V9IR

Google hat zeitgleich mit der Veröffentlichung der Beta ein Preismodell angekündigt: Entwickler können monatlich bis zu 1.000 Bilder kostenlos durch das Cloud Vision API jagen, danach wird  für jede weitere Einheit von 1.000 Bildern ein Betrag zwischen 2,50 Dollar und fünf Dollar fällig – je nach Aufwand. Bei einer großen Anzahl von Bildern gewährt Google auch Rabatt: Ab fünf Millionen Bildern bewegen sich die Preise zwischen 0,60 und zwei Dollar. Während der Betaphase gibt es eine Obergrenze von 20 Millionen Bildern pro Monat.

Seit der Veröffentlichung der Limited Preview im Dezember haben laut Google tausende von Firmen das Cloud Vision API genutzt, darunter die Fotobearbeitungs- und Brandingapp PhotoFy und das soziale Netzwerk Yik Yak. Das Cloud Vision API steht auf der Projektwebsite zum Testen zur Verfügung; dort finden sich auch die Dokumentation und Tutorials.

Aufmacherbild: out of focus business building and fingers creating a square making the vision clear von Shutterstock / Urheberrecht: grufnar

Verwandte Themen:

Geschrieben von
Mascha Schnellbacher
Mascha Schnellbacher
Mascha Schnellbacher studierte Buchwissenschaft und Deutsche Philologie an der Johannes Gutenberg-Universität Mainz. Seit Juni 2015 arbeitet sie als Redakteurin in der Redaktion des Entwickler Magazins bei Software & Support Media. Zuvor war sie als Lektorin in einem Verlag sowie als freie Editorin tätig.
Kommentare

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
400
  Subscribe  
Benachrichtige mich zu: