Les processus invisibles consomment de l'énergie et des ressources, non seulement pour les personnes, mais aussi pour les systèmes complexes. Des indicateurs clés de performance (KPI) comme le délai de livraison ou l'efficacité de l'allocation des ressources sont nécessaires, mais sont-ils toujours mesurés correctement ? Et reflètent-ils la réalité dans son ensemble ? 

L'ingénierie de plateforme promet d'accélérer la mise sur le marché, d'améliorer l'expérience des développeurs et aide à décloisonner les équipes et à optimiser les ressources, mais les entreprises peinent encore à exploiter pleinement son potentiel. Un bon point de départ consiste à comprendre les KPI qui sous-tendent l'ingénierie de plateforme et leur signification pour les parties prenantes.

Les 8 KPI en ingénierie de plateforme

On observe une maturation de l'ingénierie de plateforme au sein des organisations : 43 % d'entre elles disposent d'une équipe dédiée depuis 3 à 5 ans, et 35 % depuis 6 à 10 ans, voire plus[1]. Ces organisations peuvent mettre en place des KPI selon 3 grands axes pour comprendre comment mesurer un véritable succès et éviter de créer un arriéré de problèmes invisibles (et de tickets de support) : la productivité, la stabilité et l’efficacité.

Productivité

Mesurer la productivité au nombre de lignes de code écrites est non seulement dépassé, mais aussi profondément trompeur. Les KPI doivent viser à rationaliser et simplifier les processus de livraison de logiciels, afin de créer un environnement optimal pour que vos développeurs puissent se concentrer sur leur travail.

  • Délai de mise en œuvre : Le délai de livraison correspond au temps nécessaire pour passer d'une user story à la livraison de la fonctionnalité demandée. Cela inclut les discussions, la gestion du backlog et la transition du développement à la mise en production. Si les délais de livraison sont trop longs cela indique un blocage dans les processus.
  • Fréquence de déploiement : Des déploiements fréquents démontrent que l’équipe met en œuvre les changements rapidement et de manière fiable. À l'inverse, des déploiements moins fréquents peuvent révéler des difficultés d'adoption des pratiques d'intégration continue ou de livraison continue (CI/CD) par l’équipe, ou une compréhension insuffisante de l'infrastructure.
  • Bonheur des développeurs : Des développeurs heureux travaillent mieux. Il est donc important de mesurer les statistiques DevX (expérience développeur).

Stabilité

Face à une complexité croissante, voire à une sur-ingénierie, la stabilité est essentielle. Les ingénieurs produit doivent pouvoir apporter des modifications en toute confiance et éviter les dysfonctionnements, car l'expérience client finale est primordiale.

  • Taux d'échec des modifications (CFR) : C’est le pourcentage des déploiements qui échouent ou causent une panne. Un CFR supérieur à 15% indique un cycle de déploiement à risque, nécessitant une amélioration des processus.
  • Temps moyen de récupération (MTTR) : Le temps moyen de rétablissement (MTTR) mesure la rapidité avec laquelle un service est rétabli après une panne ou un incident de production. La capacité à réagir rapidement est essentielle pour la stabilité et la confiance des utilisateurs. Il ne s’agit pas d’empêcher les pannes, mais de mieux les gérer lorsqu’elles surviennent.

Efficacité

L'utilisation des ressources doit être optimisée, tant sur le plan de l'efficience, de la rentabilité que de la durabilité. Une approche stratégique tient compte de l'influence du FinOps (gestion financière du cloud) et du GreenOps (informatique durable).

  • Allocation des ressources : L'ingénierie de plateforme permet de répartir les ressources (calcul, stockage, réseau) de manière optimale et de suivre précisément leur utilisation. Cela permet de vérifier si les ingénieurs se concentrent sur les objectifs les plus importants de l'entreprise.
  • Observabilité des coûts : Grâce à une analyse précise des dépenses cloud, il est possible d’aller au-delà des factures mensuelles et de comprendre les facteurs de coûts, d'identifier les inefficacités et de prendre des décisions basées sur les données.
  • Suivi du carbone : La durabilité est un enjeu tant pour l’environnement que pour la rentabilité. Permettre aux utilisateurs finaux et aux équipes de la plateforme de visualiser le coût et l'impact carbone de leurs architectures avant leur déploiement, ou d'obtenir une vue d'ensemble des dépenses et des impacts du cloud, sera un facteur déterminant de réussite et permettra de respecter les réglementations.

Il est essentiel d’impliquer les développeurs dans la définition des KPI, de former les équipes et de leur donner davantage de contrôle sur leurs processus de développement. Ainsi, les collaborateurs comprendront, utiliseront et percevront la valeur ajoutée des nouveaux frameworks et des bonnes pratiques issus de l'ingénierie de plateforme. Une plateforme est censée fédérer les équipes et profiter à toute l'entreprise, ce qui nécessite la coopération de tous.

Le suivi des progrès doit aussi faire partie intégrante des KPI. Quels que soient les KPI choisis, il est essentiel de définir des attentes réalistes dès le début du déploiement de la plateforme ; elles évolueront au fur et à mesure. Mais la première étape consiste à se concentrer sur la simplification de l'analyse des données et de la prise de décision pour les équipes plateforme et produit.

Par Benjamin Brial, fondateur et CEO de Cycloid

publicité