Die Innovationen, die BASF Agricultural Solutions für die Landwirtschaft entwickelt, sind nicht zuletzt auch das Ergebnis verschiedenster digitaler Lösungen. Als Head of IT Solutions Delivery Europe des Unternehmensbereichs zeichnet Leif Geiger für ihre verlässliche Auslieferung ebenso verantwortlich wie für ihren stabilen Betrieb. Um den Health-Status des zugrunde liegenden Anwendungs-Stacks klar im Blick behalten und Business-KPIs für diverse Stakeholder präzise erfassen zu können, brauchte es ein Interface, in dem sämtliche hierfür relevanten Daten zusammenlaufen. In diesem Artikel verrät Geiger, wie er und sein Team dies gestützt auf die Technologie von New Relic umsetzen konnten.

Unsere Stakeholder haben hunderte Anwendungen im Einsatz, die unser Team von Digital Agriculture Solutions bei BASF allesamt verantwortet – inklusive einer Roadmap, in deren Rahmen es laufend neue Features zu entwickeln und auszurollen gilt. In der Vergangenheit waren wir allerdings allzu oft weniger damit als mit der Analyse und Behebung von Software-Problemen beschäftigt.

So untersuchten wir Konzepte, mit denen wir Health und Performance jeder einzelnen Anwendung sowohl durchgängig als auch zentral einsehen würden können. Schon bald kristallisierte sich dabei heraus: Effizient würde sich das Monitoring sämtlicher Anwendungen und der ihnen zugehörigen Umgebungen nur durch Automatisierung gestalten lassen. Hierin bestand dann auch eines der zentralen Ziele der Initiative. 

Echtzeit-Korrelation von Business-KPIs und Cloud-Umgebungen

Als es dann an die Umsetzung unserer Vorhaben ging, wurde schnell klar: Wir brauchten zunächst einmal die passende Technologie. Denn unsere ursprüngliche Monitoring-Lösung war zwar durchaus leistungsfähig gewesen, was die Erfassung technischer KPIs anging. Auch ließen sich die Daten mit ihr einfach via Drag & Drop zusammentragen, allerdings kaum – und das war für uns enorm wichtig gewesen – in Custom-Dashboards zusammenführen. Zudem galt es, Business-KPIs korreliert im Zusammenhang mit unseren Cloud-Umgebungen auswerten zu können, also etwa die Server-Health im Kontext der Anzahl aktiver Nutzer:innen zu einem bestimmten Zeitpunkt.

So kamen wir auf New Relic und seine Observability-Plattform. Mit ihr erhielten wir Echtzeit-Visibility für sämtliche Telemetriedaten zentral an einem Ort, zudem Informationen aus verschiedensten Cloud-Umgebungen auf einen Blick. Hinzu kam maximale Flexibilität bei Custom-Apps: Wir konnten so nicht nur spezifisch auf Anforderungen zugeschnittene Anwendungen entwickeln, sondern auch weitere Monitoring-Tools in unsere Umgebung integrieren. 

All dies waren zentrale Aspekte unserer Vision – und diese umzusetzen hatten bereits seit über einem Jahr vergeblich versucht. Den entscheidenden Unterschied machte dabei nicht zuletzt auch der herausragende Support von New Relic.

Aus der Observability-Initiative von BASF entstanden ist das GAME Board, eine gemeinsame Entwicklung der Teams von BASF und New Relic. Die Lösung liefert eine Direktsicht auf den Health-Status sämtlicher Anwendungen, zeigt dabei auch auf einen Blick Ausfälle auf. Über Probleme, die sich auf die Anwendungen auswirken, erhalten die Engineering-Teams von BASF zudem umgehend Nachricht via Alert. So können sie direkt einschreiten, noch bevor die Endbenutzer-UX beeinträchtigt wird.

Custom-Anwendung aus der Feder von BASF und New Relic

So setzten wir uns mit dem Team von New Relic zusammen, um gestützt auf ihre Technologie unsere ganz eigene Custom-Anwendung für BASF zu entwickeln. Getauft haben wir sie GAME Board – Global Application Monitoring Experience. Und diesem Namen macht sie alle Ehre: Auf sämtliche unserer Anwendungen hat sie ihre Augen und Ohren gerichtet – zentral an einem Ort, sowohl für On-Prem- als auch Cloud-Implementierungen.

Damit haben wir nun eine Direktsicht auf den Health-Status jeder beliebigen Anwendung, erkennen sofort, wo etwas im Argen liegt oder bereits ausgefallen ist. Zudem werden wir bei Problemen mit Auswirkungen auf unsere Anwendungen umgehend via Alert darüber benachrichtigt. So können wir gezielt Maßnahmen priorisieren und einschreiten, noch bevor sich etwas davon in der Endbenutzer-UX bemerkbar macht. 

Clouds, Kosten, Metrics. Zentralisiert.  

New Relic überzeugte außerdem durch seine tiefgehende Integration mit von uns auf breiter Basis genutzten Cloud-Services wie Microsoft Azure und Amazon Web Services (AWS). So erhalten wir etwa für AWS mehr als 50 wichtige Metrics direkt out of the box, erfassen dadurch zentral den Health-Status der zugehörigen Anwendungen. All dies unabhängig davon, in welcher Umgebung sie ausgeführt werden. 

Die Zahl der Metrics, die New Relic automatisch erfasst, ist schon für sich genommen höchst beeindruckend. Noch besser dabei: Sie umfassen auch all jene, die wir zur Ermittlung der Cloud-Kosten und somit für wichtige geschäftliche Entscheidungen benötigen. Denn bei so groß angelegten Umgebungen wie unserer sind naturgemäß verschiedenste Cloud-Abonnements zu verwalten. Diese allesamt manuell auszuwerten, die Kosten ins Verhältnis zum erwarteten Output zu stellen, dies nach Anzahl der Nutzer:innen oder auch aus monetärer Perspektive, das ist enorm mühsam und zeitraubend. Mit New Relic konnten wir all diese Kalkulationen zentralisiert in einem Custom-Dashboard zusammenführen. So haben wir nun tatsächlich sämtliche Abonnements einschließlich der zugehörigen Kostendetails direkt im Blick. 

Optimale CX durch proaktive Problemerkennung und -behebung

New Relic ist jedoch nicht nur für das Health-Monitoring unserer Anwendungen im Rahmen unseres GAME Board zentral. Die Technologie hilft uns auch dabei, Performance-Probleme und andere Fehler auszumachen und zu beheben, bevor sie Einfluss auf interne oder externe Benutzer:innen nehmen. Möglich wird dies mit dem enorm funktionsstarken Synthetic Monitoring. Damit simulieren wir User Traffic vor dem Deployment neuer Software oder Updates und ermitteln so Problemstellen frühzeitig und korrigieren diese. Zudem greift das Feature auch bei Software in der Produktion: Auf Performance-Schwächen, die sich in der UX niederschlagen könnten, macht es uns schnell und effizient aufmerksam, sodass wir sie dann ebenso rasch beheben.  

KPI-Tracking für Business-Stakeholder

Außerdem ausschlaggebend dafür, dass unsere Wahl auf New Relic fiel: Die Technologie gibt uns über die Health und Performance unserer Anwendungen und Infrastruktur hinaus auch Aufschluss über businessrelevante KPIs. Denn von Anfang an war es ein zentrales Kriterium unserer Monitoring-Initiative gewesen, klar nachvollziehen zu können, wie, wann und von wem unsere Software genutzt wird.   

Dank KPI-Monitoring und -Tracking haben wir zu jedem beliebigen Zeitpunkt Klarheit etwa über die Nutzerzahlen unserer Software. Genau das, was unsere Business-Stakeholder und Produktverantwortlichen benötigen, um Prioritäten für neue Features auf unserer Digital-Roadmap datenfundiert zu bestimmen.

Ausblick in die Zukunft

Unserer Initiative rund um Observability und Monitoring steht zwar noch relativ am Anfang. Das GAME Board ist aber schon jetzt ein großer Erfolg – der zudem mit jeder weiteren Anwendung wächst, die wir in seinem zentralisierten Dashboard ergänzen. Denn so erweitert sich auch die anwendungsübergreifende Visibility für unsere Teams. Ein solches Maß an Transparenz ist für uns ein absolutes Novum.   

Im nächsten Schritt wollen wir die Instrumentierung unserer Umgebungen und Anwendungen gestützt auf Terraform-Scripts automatisieren. Geplant ist, die Erfassung und Visualisierung von Telemetriedaten in New Relic mit nicht mehr als ein paar Klicks möglich zu machen. Das Ziel: Anhand von vorgefertigtem Code und Templates sollen Produktverantwortliche das Monitoring ihrer Anwendungen in New Relic maximal einfach selbst umsetzen können – ganz gleich, ob in Azure oder AWS.