Chez plentymarkets, nous avons une solide stratégie du « client d'abord ». Le secteur du commerce électronique est rapide et très compétitif. Les consommateurs s'attendent à obtenir ce qu'ils veulent en quelques secondes ou ils vont voir ailleurs. En conséquence, les performances des sites web (disponibilité, fonctionnalité et rapidité de chargement des pages) sont désormais un must lors des pics saisonniers comme le Black Friday et les fêtes de fin d'année. Le monitoring en temps réel de nos services est essentiel si nous voulons que nos clients aient la meilleure expérience possible en matière de performance. Auparavant, nous dépendions de plus de dix solutions de monitoring distinctes et autogérées. La gestion de ces outils prenait énormément de temps et ne nous laissait pas la place d'améliorer l'expérience des clients. En outre, seuls quelques ingénieurs logiciels savaient vraiment comment utiliser chaque outil, ce qui créait un goulot d’étranglement lorsqu'il fallait résoudre des problèmes. 

En tant que Directeur de l'ingénierie de secteur pour la plateforme cloud, je suis responsable des décisions architecturales au niveau de l'infrastructure pour améliorer l'expérience utilisateur. Mais ma vraie passion est d'optimiser les conditions de travail, de rendre les tâches plus efficaces, et d'améliorer la satisfaction des employés dans toute l'organisation. C'est la raison pour laquelle j'ai voulu faire passer notre monitoring à la vitesse supérieure avec l'observabilité.

Depuis que nous avons mis en place New Relic chez plentymarkets, nous avons tiré trois leçons importantes :

1. Des alertes de qualité pour un sommeil de qualité

Nous offrons une large gamme de fonctionnalités pour de nombreux cas d'utilisation différents, ce qui rend notre stack technologique relativement complexe. Pour obtenir la visibilité sur nos systèmes au cours des années, nous avons mis en place plusieurs solutions de monitoring qui sont vite devenues écrasantes. Nous recevions chaque jour des centaines d'e-mails ou de messages de mises à jour pour nos outils, ce qui noyait nos équipes sous des vagues d'informations et de données. Les efforts que nous devions faire pour faire le suivi des messages et les trier par ordre de priorité étaient non seulement considérables, mais 98 % des notifications étaient de fausses alarmes.

Au lieu d'une solution tributaire de quelques experts, il nous en fallait une qui soit utilisable par nos différentes équipes pour identifier et résoudre les problèmes. L'optimisation des coûts était également très importante pour nous. Pour nous, New Relic était la meilleure solution pour répondre à nos besoins en matière de tarification et d'assistance. New Relic nous a également permis d'accorder l'accès aux informations à toutes les personnes qui en avaient besoin, avec une connexion à authentification unique

Ensuite, nous avons commencé à définir des normes pour les alertes afin que le plus grand nombre d'employés possible puisse prendre des décisions éclairées et résoudre les problèmes. Nous avons également établi des directives sur la prise de décision. Nous avons priorisé l'autonomie en ce qui concerne la mise à jour des alertes. En effet, les notifications sont seulement efficaces si vous définissez celles qui comptent vraiment et si chaque personne reçoit seulement les notifications dont elle a besoin. En personnalisant les alertes pour chaque membre de l'équipe, nous avons pu réduire drastiquement la fatigue due aux alertes et donner aux ingénieurs les informations dont ils avaient besoin pour réussir. Avec l'élargissement de l'accès aux données, nous avons mis en place ce qu'il fallait pour assurer la réussite de tous.

Lukas Wöhrl, Directeur de l'ingénierie de secteur pour la plateforme cloud pour plentymarkets, explique pourquoi il a choisi New Relic plutôt qu'une solution open source autogérée.

2. Le monitoring des performances des applications

Nous avons remplacé notre solution APM autogérée avec le monitoring d'applications (APM) de New Relic. Auparavant, nous nous concentrions sur le monitoring de l'infrastructure sous-jacente, mais grâce à New Relic, nous avons pu améliorer davantage le monitoring des performances tout en ayant un œil sur l'infrastructure. Nous avons également augmenté le volume de données soumises au monitoring ainsi que la vitesse du monitoring. Sur le plan des performances, les retombées ont été énormes : l'expansion de la quantité de données ingérées et monitorées se traduit par une capacité à détecter toute anomalie avant qu'elle n'atteigne nos clients. 

New Relic est en passe d'être la seule solution de monitoring chez plentymarkets. Tout le monde dispose de la même visibilité et la collaboration est encouragée pour identifier et résoudre les problèmes.

3. Un dépannage en temps réel pour les problèmes des clients

Avant que nous consolidions nos outils dans New Relic, chaque problème client exigeait plusieurs étapes dans le processus de monitoring. Nous voulions simplifier ce processus en réduisant le temps de réponse pour améliorer encore plus les performances du système. Ainsi, nous collectons désormais toutes les données, y compris les transactions, les performances du système et l'impact sur le client, par le biais d'un dashboard personnalisé amplifié par des variables de modèles. Nous avons un accès immédiat dès qu'un problème apparaît. Cette approche a exigé que plusieurs personnes abandonnent leur droit de propriété de certaines parties du stack. Et désormais, ces données ne sont plus l'apanage de quelques ingénieurs. Ainsi, nous pouvons améliorer le temps moyen de résolution et l'expérience globale des clients.