En 2023, nous avions publié un article sur une étude précédente de Solarwinds qui indiquait un constat quasi identique. D’après cet éditeur de logiciel de gestion d'observabilité, le coût moyen des incidents était, aux États-Unis, de 13,7 millions de dollars pour une moyenne de neuf pannes par mois. Un chiffre à corroborer toutefois par d’autres études. Au rang des principales causes, figuraient la dette technique, les solutions logicielles inadaptées et le cloud mal géré.
Le rapport 2025 de Solarwinds sur les tendances dans ce domaine intitulé « De fragile à agile : l’état de la résilience opérationnelle » repose sur une enquête auprès de plus de 200 professionnels de l'informatique en Europe (Royaume-Uni, Allemagne et France). Un bon point, la confiance des équipes dans la résilience opérationnelle est en hausse, mais les problèmes quotidiens continuent cependant de mobiliser du temps, donc de l’argent.
Plus de la moitié (55 %) des responsables informatiques européens estiment que le SI de leur entreprise est résilient. Ils ne sont cependant qu’un sur trois (34 %) à penser que cette résilience est très forte. Parmi les DSI européens interrogés, quelque 44 % consacreraient encore un quart de leur semaine de travail à la résolution de problèmes critiques et d'interruptions de service.
Point saillant, près de la moitié des participants désignent la lourdeur des processus, plutôt que la technologie elle-même, comme le principal obstacle à une résilience renforcée. Près de la moitié des répondants (47 %) imputent la responsabilité aux processus en période de perturbation. Il est à noter que quatre répondants sur dix disent manquer de personnel pour assurer la résilience opérationnelle. Cela laisse supposer que des recrutements amélioreraient sans doute la situation.
« Ce rapport confirme ce que nous entendons de nos clients en France », déclare Sameh El Tawil, Sales Director France chez SolarWinds, qui poursuit « Les équipes consacrent un budget et des efforts réels à la résilience, mais beaucoup n’arrivent pas à sortir d’un mode de fonctionnement réactif. La technologie seule ne peut résoudre les problèmes ».
Les piliers de la résilience opérationnelle
Néanmoins, les équipes IT en Europe adoptent une approche préventive et investissent massivement dans la résilience opérationnelle. Selon l’étude, 30 % de leur budget informatique est consacré à la prévention des perturbations. Plus des deux tiers (69 %) déclarent également mettre à niveau activement leurs outils, formations et manuels afin d'améliorer leurs processus internes de reprise et de réponse aux perturbations.Les solutions passent, en partie seulement, par l’usage d’outils qui opèrent une surveillance proactive de l’infrastructure IT basée sur trois types de données de télémétrie : les métriques, les logs (historique évènements) et autres traces. Selon l’étude de Solarwinds en 2023, les outils d'observation et surveillance améliorent l’expérience de leurs clients (96 %), accélèrent les initiatives d’innovation (71 %), réduisent le délai de résolution des problèmes (71 %) leur détection (60 %) et augmentent leur efficacité opérationnelle (55 %).
Les outils et technologies ne sont pas des baguettes magiques. Les responsables et équipes IT doivent s’interroger sur leurs méthodes de travail et les solutions utilisées, mais cela doit s’accompagner par des effectifs en nombre suffisant pour être plus résilientes et efficaces.