La panne majeure, en octobre dernier, de l’une des plus importantes entreprises de la tech, aura entraîné l'interruption de ses services pendant plus de six heures, affectant des millions d'utilisateurs à travers le monde. Et cette interruption très médiatisée qui a impacté le grand public comme les professionnels ne sera malheureusement pas la dernière du genre. Alors que la pression sur les responsables informatiques n’a jamais été aussi forte, ils reconnaissent le besoin de meilleurs outils de surveillance pour faire face à la complexité croissante de leur pile technologique.

Répondre à des utilisateurs exigeants

Les utilisateurs sont devenus plus intransigeants que jamais quant aux services numériques qu'ils utilisent et ne sauraient se satisfaire de rien d’autre qu'une qualité optimale en toute circonstance. Ils ont une politique de tolérance zéro pour les mauvaises expériences et rejettent automatiquement la faute sur l'application et la marque associée, quelle que soit la cause du problème. De fait, les répercussions de ce type d’incident (financières ou en termes d’image) peuvent être catastrophiques.

Si les équipes informatiques se disent préoccupées par la possibilité d'une panne majeure et par les perturbations qui en résulteraient, ils sont également nombreux à ressentir une pression de la part de leur direction pour se prémunir des problèmes critiques de performance ou d’une panne. Ils se doivent d’assurer un fonctionnement optimal et d’offrir une expérience applicative totale à leurs utilisateurs.

La pandémie aura forcé les entreprises, tous secteurs confondus, à accélérer leurs initiatives de transformation numérique. Aujourd’hui, elles font face à une pile technologique complexe, entraînant des retards dans l'identification de la cause des problèmes qu’elles peuvent rencontrer. Et les besoins d'innovation ne montrant aucun signe de faiblesse, la situation ne devrait qu’empirer.

Assurer la résolution des incidents grâce à l’observabilité full-stack

Si les équipes informatiques disposent déjà d'outils de surveillance, dont beaucoup offrent des méthodes très sophistiquées pour identifier et corriger les anomalies, elles s'interrogent à raison sur l'efficacité de ces outils. Pour pallier ces manques, l’observabilité full-stack permet d’avoir une vue d’ensemble de toute la pile technologique et ainsi relier les différentes données entre elles. De l'application, à l’infrastructure qui la supporte, au réseau, au stockage… afin d'identifier rapidement les causes et localisations des incidents.

Il est urgent pour les responsables informatique de faire le choix de l'observabilité full-stack, mais surtout de la relier aux impacts métiers. Identifier la priorité des actions techniques en fonction de l’impact métier et client, permet un meilleur alignement des équipes et une optimisation des résultats avec les ressources disponibles.

Bien sûr, il est pratiquement impossible d'éliminer tous les problèmes potentiels. Ce qui est désormais largement compris, cependant, est que les responsables informatiques doivent disposer d'outils et de solutions leur permettant de s'assurer qu'en cas de problème, les équipes peuvent rapidement déterminer la cause du problème, son importance et y remédier, avant que l'utilisateur final ne soit affecté.

Par Erwan Paccard, Director product Marketing chez AppDynamics