Interview mit Guy Fighel

„AIOps spielt bei der Optimierung der Sicherheit von IT-Infrastrukturen eine entscheidende Rolle“

Dominik Mohilo

© Shutterstock / Willyam Bradberry

Zuerst einmal die gute Nachricht: Machine Learning wird weder Operator noch Entwickler ersetzen, auch nicht bei erfolgreicher Umsetzung einer AIOps-Strategie. Guy Fighel, General Manager of AI und Vice President of Product Engineering bei New Relic, erklärt im JAXenter-Interview, was genau AIOps eigentlich ist und wie Unternehmen und DevOps-Teams von maschinellem Lernen und künstlicher Intelligenz profitieren können. Er gibt zudem Auskunft über die Rolle von Entwicklern in diesem Prozess und beantwortet die Frage nach der Sicherheit bzw. den Risiken.

JAXenter: Hallo Guy und danke, dass du dir die Zeit für dieses Interview genommen hast. Auf der Future of AI-Konferenz hast du über KI, AIOps und die Rolle künstlicher Intelligenz im Rahmen der Noise Reduction oder Rauschunterdrückung, gesprochen. Zunächst einmal, was genau ist in diesem Zusammenhang „Rauschunterdrückung“?

Guy Fighel: Durch die immer größer werdende Auswahl an IT-Monitoring-Tools steigt auch das Volumen täglicher Alerts, die ein SRE- oder DevOps-Team heutzutage bewältigen muss. Das reicht bis in die Zehntausende. Dabei sind SRE- und DevOps-Teams immer auf schnelle Reaktionen fokussiert. Wer etwas schnell identifiziert und Probleme schnell lösen kann, spart Tausende von Dollar ein oder Tausende von Klicks.

Die Flut an täglichen falsch-positiven Meldungen, sogenannten Symptom Alerts, die IT-Ops und DevOps-Teams erreichen, wird auch als IT-Lärm bezeichnet. Durch ihn wird die Identifizierung von Ursachen nahezu unmöglich. Um dieser unüberschaulichen Situation gerecht zu werden, setzen einige Unternehmen auf Filter, durch die nur hoch priorisierte Alerts (P0- oder P1-Probleme) die zuständigen Teams erreichen. Dadurch wird jedoch die operative Sichtbarkeit des Unternehmens teilweise uneinsehbar, da Alerts mit niedriger Priorität oft Vorläufer von Alerts mit hoher Priorität sind. Zudem führt es zu der sogenannten Alert Fatigue, einer Alarm-Ermüdung, die eine große Gefahr darstellt. Aus all diesen Gründen ist es wichtiger denn je, das Rauschen für IT-Operation-Teams zu reduzieren und Teams dabei zu unterstützen, Alerts zu priorisieren und Signale innerhalb des Rauschens zu identifizieren.

JAXenter: Der Begriff DevOps ist mittlerweile, 11 Jahre nach seiner ersten Erwähnung, weithin bekannt, ebenso Derivate wie DevSecOps, BizDevOps und so weiter. Was genau ist nun AIOps?

Guy Fighel: DevOps soll grundsätzlich die Arbeitsweise von Teams optimieren, damit Software schneller, in häufigerer Frequenz und zuverlässiger geliefert werden kann. Sie führen zu einer schnelleren Reaktion auf auftretende Probleme, die sich auf die Kundenerfahrung oder Service-Level-Objectives (SLOs) auswirken könnten.

Bei AIOps geht es darum, den IT-Bereitschaftsdienst mit Hilfe von KI und ML zu befähigen, Probleme sehr früh zu erkennen, die Ursachen schneller zu diagnostizieren und zu verstehen und die Automatisierung zu deren Behebung voranzutreiben.

In den letzten Jahren entstand eine neue Technologiekategorie, die künstliche Intelligenz (KI) und Machine Learning (ML) in die Hände von Bereitschaftsteams legt, damit diese mehr Vorfälle verhindern und schneller darauf reagieren können. Der Begriff AIOps (Artificial Intelligence for IT Operations) wurde ursprünglich von Gartner geprägt, um diesen Bereich zu beschreiben. Bei AIOps geht es darum, den IT-Bereitschaftsdienst mit Hilfe von KI und ML zu befähigen, Probleme sehr früh zu erkennen, die Ursachen schneller zu diagnostizieren und zu verstehen und die Automatisierung zu deren Behebung voranzutreiben.

Bei New Relic glauben wir, dass AIOps-Fähigkeiten essentiell für die Observability sind. Durch das Angebot einer vernetzten Echtzeitansicht aller Telemetriedaten auf einem Fleck, kann man dank Observability Probleme schneller lokalisieren. Es ist nicht nur nachvollziehbar wann ein Problem auftritt, sondern auch warum. Zudem wird ein Kontext angezeigt, wodurch die Daten schnell analysiert und proaktiv auf sie eingegangen werden kann.

Mit AIOps können Mitarbeiter des IT-Bereitschaftsdienstes Anomalien proaktiver erkennen, zuordnen und Alerts und Vorfälle korrelieren, um das Rauschen zu reduzieren. Außerdem können Vorfälle schneller diagnostiziert werden indem sie mit Informationen und Kontext angereichert werden. So kann auf sie auch schneller reagiert werden.

Auf dem Blog von New Relic habe ich bereits vier Anwendungsfälle von AIOps detailliert dargestellt.

JAXenter: Wie unterstützt AIOps bei der oben genannten Rauschreduzierung?

Guy Fighel: Um dieses Rauschen im IT-Betrieb zu bewältigen hat New Relic kürzlich New Relic AI eingeführt. Es ist eine umfassende Lösung, die automatisch Anomalien erkennt und aus den Vorfall-, Alert- und Event-Daten sowie dem Feedback des Teams lernt. So kann es Alerts, die für das Team nicht relevant sind, ausschließen und damit zusammenhängende Vorfälle korrelieren – mit minimaler Konfiguration, Schulung oder Einarbeitung.

JAXenter: Welche Rolle spielt künstliche Intelligenz im Bereich des Monitorings und der Observability?

Guy Fighel: Betriebliche Produktionssysteme werden immer komplexer, deshalb sind Softwareteams auf schnellere und einfachere Wege zur Problemlösung angewiesen. Sie benötigen Hilfestellungen und Automatisierungslösungen, die ihre bestehenden Vorfall-Management-Teams und Arbeitsabläufe ergänzen, damit sie Probleme schneller erkennen und beheben können. Bei New Relic vertreten wir die Ansicht, dass Observability ein Teil des Lebenszyklus der Softwareentwicklung sein sollte und ebenso wie DevOps Teil der Kultur.

Generell können Teams durch Observability neue Durchbrüche in Sachen Sichtbarkeit und Service-Level erreichen.

New Relic nutzt seinen Zugang zu rohen Monitoring-Daten, um ML-Modelle mit Informationen zu füttern und einen Workflow zur Antwort auf Ereignisse zu kreieren, der intelligent und kontextreich ist. Durch New Relic AI steigt der Wert, den Kunden aus dem Monitoring ziehen, indem neben der Telemetrie eine intelligente Einspeisung von Ereignisinformationen bereitgestellt wird. Zudem wird KI und ML eingesetzt, um die Daten zu analysieren und zu verwerten, damit man Probleme schneller erkennen, beheben und darauf reagieren kann. Generell können Teams durch Observability neue Durchbrüche in Sachen Sichtbarkeit und Service-Level erreichen. Durch die Kombination von Observability mit AIOps-Strategien, optimieren Teams die Betriebszeit und Leistung, verringern die Arbeitsbelastung und beschleunigen das Innovationstempo.

JAXenter: Wie implementieren und beziehen Teams AIOps ein? Gibt es bewährte Praktiken?

Guy Fighel: Mit AIOps können IT-Unternehmen sich zu viel effektiveren Partnern für Unternehmen entwickeln. Eine IT-Operations-Plattform mit eingebauten AIOps-Funktionen kann IT-Betriebe dabei unterstützen, potenzielle Risiken mit den Services oder der Technologie, die sie Unternehmen zur Verfügung stellen, proaktiv zu erkennen und zu korrigieren, bevor sie sich zu ernsten Problemen entwickeln.

IT-Betriebe sollten IT-Workflows und die Infrastruktur auf eine KI-getriebene Strategie vorbereiten. Eine weitere Voraussetzung für künstliche Intelligenz im IT-Betrieb ist eine vereinheitlichte Datenerfassung und -verwaltung. Mit einem einfachen Zugang zu Daten kann ein Team die Zusammenhänge zwischen Anwendungsperformance und der IT-Infrastruktur, die sie antreibt, besser identifizieren. Letztlich sollte man bei der Implementierung von AIOps für Teams darauf achten, die Erwartungen der Mitarbeiter aufzunehmen und zu erklären, dass künstliche Intelligenz dazu gedacht ist, Arbeitsplätze zu erweitern, nicht zu vernichten. Wir haben die Erfahrung gemacht, dass die AIOps-Technologie die menschliche Arbeit nicht ersetzt, sondern ausweitet, indem sie die alltägliche Arbeitsbelastung verringert und es den Mitarbeitern ermöglicht, sich auf höherwertige Aufgaben zu konzentrieren.

Ich bin der Überzeugung, dass AIOps bei der Optimierung der Sicherheit von IT-Infrastrukturen eine entscheidende Rolle spielt.

JAXenter: Welche Sicherheitsrisiken sehen Sie in diesem Zusammenhang?

Guy Fighel: Ich bin der Überzeugung, dass AIOps bei der Optimierung der Sicherheit von IT-Infrastrukturen eine entscheidende Rolle spielt. Durch die Anwendung von Algorithmen des maschinellen Lernens, werden potentielle Risikoereignisse erkannt, bevor sie auftreten und so wiederum erfolgreich vermieden.

Indem KI auf das Sicherheitsmanagement angewendet wird, können IT-Teams eine Vielzahl von Sicherheitslücken und -verstöße erkennen. Mit der Nutzung von hochentwickelten Algorithmen des maschinellen Lernens können potenziell unbefugte und böswillige Aktivitäten innerhalb der Infrastruktur identifiziert werden.

JAXenter: AIOps hört sich an, als wären keine Entwickler involviert. Ist das so?

Guy Fighel: Nicht mal im Ansatz! Entwickler, die coden, sind essentiell, um die Verfügbarkeit und Zuverlässigkeit von Services zu gewährleisten – das ist nur eines der Ergebnisse einer DevOps-Transformation. AIOps wird die Funktionen von Ingenieurteams erweitern, indem sie sich um die Aufgaben kümmern, die regelmäßig aufkommen und äußerst zeitraubend sind. Die Aufgabenbereiche der Mitarbeiter werden sich dagegen von der Behandlung von geschäftsunterbrechenden Ereignissen auf die Prognose von Wartungsarbeiten und die Handhabung von Analyse- und anderen Daten verlagern.

JAXenter: Wie wird Künstliche Intelligenz die Welt der Softwareentwicklung in den kommenden Jahren verändern?

Guy Fighel: Die meisten Unternehmen stehen diversen Herausforderungen auf dem Weg der digitalen Transformation gegenüber. Unternehmen, die sich an einem digital-zentrierten Ansatz orientieren, sparen mit KI Zeit und Arbeitsleistung ein, da sich die Mitarbeiter stattdessen auf Innovationen konzentrieren können. Letztendlich werden wir durch künstliche Intelligenz eine nahtlose Kundenerfahrung mit Predictive Analytics liefern können und gleichzeitig die Arbeitsbelastung und Ineffizienz reduzieren.

Guy Fighel ist General Manager of AI und Vice President of Product Engineering bei New Relic. In dieser Position leitet er die AIOps-Produkt- und Entwicklungsabteilung von New Relic. Er ist verantwortlich für die allgemeine Strategie des Unternehmens in den Bereichen künstliche Intelligenz und maschinelles Lernen. Zuvor war er Mitbegründer und Chief Technology Officer bei SignifAI, einem Event-Intelligence-Unternehmen, das im Februar 2019 von New Relic übernommen wurde.

Guy Fighel verfügt über 20 Jahre Erfahrung in der Innovation, Konzeption und Entwicklungsleitung von hochskalierbaren Softwarelösungen. Darüber hinaus hat er 25 innovative Patente vorzuweisen. Bevor er bei SignifAI einstieg, hatte er technische Führungspositionen inne, beispielsweise bei Vonage, Tango Me und im Büro des Premierministers von Israel. Er erhielt 2014 einen Bachelor of Business Administration (B.B.A.) mit einer Spezifikation im Bereich Software- und Informationstechnologie vom Interdisciplinary Center. 2012 absolvierte er das Stanford Business School Leadership Program.

Geschrieben von
Dominik Mohilo
Dominik Mohilo
Dominik Mohilo studierte Germanistik und Soziologie an der Goethe-Universität in Frankfurt. Seit 2015 ist er Redakteur bei S&S-Media.
Kommentare

Hinterlasse einen Kommentar

avatar
4000
  Subscribe  
Benachrichtige mich zu: