L'intégration de l'intelligence artificielle et l'exploitation des modèles de langage (LLM) ne sont pas de simples projets technologiques ; ils constituent une démarche structurante et stratégique qui touche à tous les aspects de l'organisation. Mais c’est la qualité des données qui freine les projets.

Le déploiement d’applications à base d’intelligence artificielle et l’utilisation des modèles de langage à grande échelle (LLM) dans le cadre professionnel est une démarche complexe, qui nécessite la mise en place d’une chaîne de traitement numérique ainsi que des compétences humaines spécialisées. Elle requiert une approche méthodique et structurée.

Pour cela, une connectivité de haute qualité sans latence est essentielle afin d’assurer une expérience utilisateur optimale et des réponses rapides. Le stockage doit également être performant pour conserver les modèles d’IA, les données d’entraînement et les résultats d’inférence, tandis que des capacités de calcul haute performance sont nécessaires pour gérer les importantes charges de travail liées à l’inférence.

Au-delà des infrastructures, le déploiement efficace d’applications d’IA requiert une pile technologique applicative adéquate, incluant le choix pertinent d’un ou de plusieurs LLM, d’un pipeline de données et d’outils de traitement des données. Il est également indispensable de disposer de spécialistes ayant des compétences en ingénierie logicielle, en science des données et en IA pour le développement, le déploiement et la maintenance des applications. En somme, cette approche structurée va au-delà de la simple installation de technologies. Elle implique une réflexion et une planification approfondies touchant à l’organisation de l’entreprise, à ses processus et à sa culture.  

Tous les adoptants de l’IA générative ont rencontré des adversités…

L’étude annuelle « CDO Insights 2024 : Charting a Course to AI Readiness » réalisée par Informatica, met en exergue l’importance cruciale du déploiement d’applications à base d’intelligence artificielle et de l’utilisation des modèles de langage de grande taille (LLM) au sein des entreprises. L’enquête, qui a recueilli les témoignages de 600 responsables de données (CDO) à travers les États-Unis, l’Europe et l’Asie-Pacifique, souligne que l’adoption de l’IA générative est déjà bien engagée, avec des taux de mise en œuvre variés selon les régions.

Par exemple, 25 % des CDO français ont déjà implémenté l’IA générative, tandis que leurs homologues britanniques (52 %) et allemands (58 %) montrent une attitude plus volontariste. Cependant, un défi majeur persiste, souligne l’étude : la qualité des données. En France, tous les adoptants de l’IA générative ont rencontré des obstacles à sa mise en œuvre, 43 % citant spécifiquement la qualité des données comme le principal frein, suivi par des préoccupations liées à la confidentialité et à la protection des données, ainsi qu’à la gouvernance de l’IA.

Malgré ces défis, l’intérêt pour l’IA générative reste élevé, 73 % des responsables des données français envisageant son utilisation pour stimuler la productivité par l’automatisation et l’augmentation, et 71 % cherchant à améliorer le retour sur investissement grâce à un accès plus rapide aux données. La préparation des données est ainsi devenue un axe majeur de préoccupation, reflétant un changement dans la prise en compte des indicateurs de succès pour les stratégies de données. Celle-ci privilégie désormais l’amélioration de la préparation des données pour l’IA et l’analytique.  

… à cause de la fragmentation et de la complexité des données…

Cependant, la fragmentation et la complexité des données forment l’obstacle principal, avec une augmentation attendue du nombre de sources de données à gérer. D’après l’étude, 39 % des responsables des données français ont du mal à équilibrer plus de
1 000 sources de données, ce qui représente une baisse par rapport à l’année dernière (55 %), mais 78 % s’attendent à ce que ce chiffre augmente au cours de l’année à venir. De plus, 45 % des responsables des données français déclarent qu’ils auront besoin d’au moins cinq outils de gestion des données pour soutenir leurs priorités et gérer leur patrimoine de données, soit une augmentation par rapport à 2023 (50 %).

Parmi les difficultés relatives aux données, 39 % des responsables des données français ont indiqué que le nombre croissant de consommateurs de données (39 %) et l’impossibilité de faire évoluer les données quand et où cela est nécessaire (39 %) sont les principaux obstacles techniques à la réalisation de leur stratégie en matière de données. L’année dernière, le principal obstacle était l’absence d’une vision et d’une compréhension complètes de leur patrimoine de données (le quatrième obstacle le plus
important en 2024).  

… et des résistances internes

Conscients du problème, 45 % des responsables des données français ont déclaré que l’amélioration de la préparation des données pour l’IA et l’analytique est l’indicateur le plus courant pour mesurer l’efficacité de la stratégie de données. C’est un revirement par rapport au constat de 2023 qui désignait l’amélioration de la façon dont les données sont utilisées dans la prise de décision de l’entreprise (47 %) comme l’indicateur principal.

Pour compliquer encore plus cette démarche, l’étude révèle que la résistance interne au sein des organisations, le manque de soutien des dirigeants, et un alignement insuffisant entre les unités opérationnelles sont identifiés comme des obstacles majeurs à la réalisation des stratégies de données.

En somme, les CDO français ont souligné l’importance de fournir des données fiables et cohérentes adaptées à l’IA générative et d’améliorer la culture axée sur les données et la maîtrise des données comme leurs principales priorités stratégiques pour 2024. Cela marque un changement par rapport aux années précédentes, mettant en lumière l’évolution continue des besoins et des priorités en matière de gestion des données à l’ère de l’IA générative.

À la lumière de cette étude, il est crucial d’établir une stratégie claire pour l’IA et de la déployer de manière ordonnée, ce qui permet de bénéficier de plusieurs avantages. Parmi ceux-ci, une meilleure gouvernance des données assure la sécurité, la confidentialité et l’éthique. Une collaboration accrue entre les équipes améliore la communication et la coordination entre tous les acteurs impliqués. L’évolutivité des infrastructures et des applications peut être ajustée en fonction de l’évolution des besoins de l’entreprise, et une adoption plus large par les utilisateurs finaux est facilitée, intégrant ainsi de manière optimale les applications d’IA dans les flux de travail existants.