Le manque de personnel qualifié impacte le quotidien des professionnels IT. L’objectif principal des équipes IT est ainsi d’assurer la disponibilité et la fiabilité des services. Or, trop souvent, elles passent leur temps à éteindre des incendies et à répondre à des urgences, plutôt qu’à aider leurs organisations à innover.
C’est pourquoi, l’utilisation de l’Intelligence Artificielle pour les Opérations informatiques (AIOps), en particulier avec l’IA générative (GenAI), se démocratise pour aider les équipes IT à prendre de l’avance. L’AIOps vise à alléger les tâches routinières et à favoriser l’innovation et compte trois capacités clés qui permettent aux équipes IT de passer d’une posture réactive à proactive, récupérant ainsi du temps pour innover.
Réduire la complexité et traiter le problème à la racine
Les équipes IT modernes sont chargées de surveiller des environnements complexes et hybrides, s’appuyant souvent sur une vaste gamme d’outils. Parmi eux, certaines plateformes se distinguent par leur expérience utilisateur intuitive, intégrant des applications, des approches heuristiques et des workflows dans un cadre cohérent visant à améliorer l’efficacité opérationnelle.Ces systèmes sont conçus pour être accessibles même aux équipes opérationnelles de premier niveau moins qualifiées, fournissant des insights basés sur l’IA et le machine learning (ML) qui transforment les données brutes en insights et recommandations exploitables.
Il y a une véritable valeur à consolider les sources de données et les outils afin de permettre à une IA causale sophistiquée de trouver la raison profonde des problèmes complexes. L’IA générative va encore plus loin ; d’une part, elle traduit ces causes en résumés compréhensibles par les humains, elle offre, par ailleurs, des solutions et des prédictions proactives tout en utilisant la gestion des opérations et des services ainsi que le DevOps pour économiser du temps aux équipes IT.
Détecter les anomalies, changer l’impact et prévenir proactivement les problèmes
Les outils de surveillance traditionnels présentent souvent un inconvénient majeur : beaucoup de systèmes ne préviennent les équipes des problèmes qu'après leur apparition, ce qui entraîne des dépannages d'urgence, des ralentissements et des arrêts potentiels.Les approches réactives ne sont pas suffisantes dans l’environnement actuel où les services sont critiques pour la mission. À mesure que les systèmes deviennent plus complexes, anticiper et résoudre les problèmes avant qu’ils n’apparaissent devient crucial et reste l’objectif de chaque DSI. La proactivité garantit la continuité des activités, ce qui devrait inclure la gestion des risques de changement d’impact (à la fois l’étendue et la gravité).
Le scénario idéal consiste à être informé des problèmes avant qu’ils n’affectent les opérations plutôt que d’atténuer leur impact après coup. Cela implique d’utiliser une IA prédictive capable d’identifier les problèmes de capacité et de ressources, ainsi que les perturbations potentielles des services ou les déclins, et de mettre en œuvre des mesures automatisées pour les résoudre.
Accélérer la réponse et la remédiation automatisées
La vitesse à laquelle les systèmes évoluent dépasse souvent la surveillance et la gestion humaines. Cela a nécessité un passage vers des outils avancés de niveau entreprise alimentés par le machine learning. Ces outils sont conçus pour traiter et analyser de vastes quantités de données système provenant d’environnements IT complexes, transformer ces données en insights exploitables et conduire des réponses automatisées.Cela permet aux professionnels IT d’automatiser des actions basées sur une compréhension complète des opérations de leurs systèmes et de leur impact sur les objectifs commerciaux. En utilisant l’analyse de données et les actions automatisées, les organisations peuvent mieux optimiser les ressources IT précieuses, leur permettant de prioriser les tâches, la création de valeur et les activités d’innovation pour augmenter l’impact potentiel sur les affaires.
Établir une fondation au milieu des défis
Compte tenu de l’étendue et de la diversité des infrastructures IT modernes, des réseaux et des applications, ainsi que l’hétérogénéité des données produites par les systèmes, les modèles de ML et d’IA sont souvent considérés comme des nécessités dans la boîte à outils des équipes IT.Dans ces environnements où les équipes des opérations IT se concentrent sur des indicateurs clés de performance (KPIs) comme la prédiction des pannes, l’analyse des causes profondes ou encore le temps moyen de réparation, le cerveau humain peut avoir du mal à suivre le volume et la complexité des données assez rapidement pour avoir un impact significatif sur ces métriques.
Ainsi, lorsque les organisations s’appuient sur des processus manuels et intensifs en personnel pour atteindre les métriques, la mise à l’échelle et la standardisation de leurs efforts, de manière rentable, peuvent se révéler difficiles.
Cependant, la mise en œuvre des technologies AIOps constitue un défi pour de nombreuses organisations sous divers aspects : la qualité des données, la complexité et la mise à l’échelle, les silos ou encore la confiance dans l’automatisation.
En ce qui concerne la qualité des données, les équipes IT doivent surveiller en permanence les millions de sources de données ingérées pour s'assurer qu'elles ne contiennent ni erreurs ni biais, car des données incorrectes peuvent avoir des conséquences graves, telles que des usages abusifs ou des résultats erronés. La complexité et l'échelle posent quant à elles un défi supplémentaire, face au développement des opérations IT des entreprises et à l’augmentation des données et outils.
Cela nécessite la réconciliation et la modélisation des services des actifs qui couvrent à la fois le cloud et le mainframe, ainsi que les applications et les réseaux. De plus, les organisations IT sont souvent cloisonnées, ce qui peut entraver l'intégration sous une même entité. Enfin, l'automatisation peut rendre l’obtention du bon contexte difficile pour isoler les causes profondes et recommander des actions basées sur des occurrences historiques ce qui complexifie la confiance dans cette technologie.
Ainsi, le succès de la mise en œuvre de l'AIOps, repose essentiellement sur l’utilisation d’une plateforme ouverte interopérable avec les outils existants, qui offre une IA/ML avancée prête à l'emploi (y compris l'IA causale, prédictive et générative) et qui accélère l'automatisation. Il est important de réfléchir aux cas d'utilisation pertinents pour l'entreprise et de commencer par de petites étapes pour prouver la valeur de ces solutions.
En adoptant cette approche, l’AIOps peut favoriser la prise de décision rapide en entreprise. Une stratégie AIOps solide nécessite également un changement culturel. Les organisations performantes standardisent les processus pour simplifier l’automatisation, améliorent la gouvernance pour soutenir les nouveaux rôles et traitent efficacement la gestion du changement organisationnel.
En pratique, cela signifie s’assurer que les objectifs internes sont alignés, que les équipes sont prêtes à embrasser l’échec et à en tirer des leçons, et que la collaboration interfonctionnelle a lieu. Une communication ouverte et cohérente est par conséquent essentielle. Ce changement culturel peut garantir l’utilisation efficace des ressources des employés en vue de travailler vers un objectif commun de l’entreprise.
Dans l’ensemble, une approche stratégique de l’AIOps peut favoriser une rationalisation des opérations pour les équipes IT. Elle établit une base solide pour favoriser l’automatisation des opérations IT, aidant les entreprises à innover plus rapidement.
Par Ali Siddiqui, Chief Product Officer chez BMC Software