De nombreuses entreprises rencontrent des difficultés pour exploiter efficacement leur patrimoine informationnel. Ces obstacles, exacerbés par l’émergence de technologies comme l’IA, proviennent de facteurs historiques liés à la gestion des données, à l'absence de gouvernance rigoureuse et
à l'isolement des systèmes.


Les entreprises sont confrontées à des défis majeurs dans leur quête pour exploiter pleinement leurs données à des fins d’analyse et d’inférence. La préconisation la plus répétée par les spécialistes et les ingénieurs de la donnée est de se préoccuper d’abord des problèmes de qualité, d’intégration et de gouvernance des données. Ce sont là les prérequis incontournables avant que les organisations puissent bénéficier des innovations technologiques. En suivant les recommandations du rapport, elles peuvent améliorer leurs fondations de données, renforcer leur compétitivité et tirer un maximum
de valeur de leurs projets d'IA.

Dans un rapport intitulé « Data Strategies for AI Leaders », Snowflake examine les obstacles majeurs rencontrés par les entreprises dans leur gestion et exploitation des données, particulièrement dans le cadre de l’adoption de l’Intelligence Artificielle générative. En dépit des promesses technologiques de l’IA, les fondations de données, c’est-à-dire l’ensemble des infrastructures, processus et pratiques qui permettent à une organisation de gérer efficacement ses données, se révèlent souvent inadéquates. Une situation qui compromet leur capacité à pleinement exploiter des innovations. L’étude, réalisée en partenariat avec de MIT Technology Review, synthétise les causes de ces difficultés, leurs impacts, ainsi que les recommandations des experts pour surmonter ces obstacles et permettre une exploitation optimale des données.

L’étude met en avant plusieurs défis persistants auxquels les entreprises font face dans l’exploitation de leurs données :

Qualité et accessibilité des données : une grande partie des entreprises n’a pas encore atteint une maturité suffisante pour gérer et exploiter efficacement leurs données. Seulement 22 % des répondants considèrent leurs fondations de données comme « très prêtes » à supporter les applications d’IA générative, alors que la majorité se juge
« quelque peu prête ». Les problèmes de qualité des données, notamment leur intégration, leur gouvernance et leur actualisation, sont fréquemment évoqués, et cette inadéquation limite la fiabilité des modèles d’IA.

Intégration des données : près de la moitié des entreprises (48 %) signalent des difficultés liées à l'intégration des données en raison des silos de données, rendant complexe l’unification de diverses sources d'information pour des applications
d'IA à grande échelle.

Sécurité et gouvernance : les préoccupations autour de la sécurité et de la gouvernance des données sont aussi omniprésentes, avec 59 % des entreprises identifiant cela comme un défi majeur. Assurer la protection des données sensibles tout en permettant leur accès pour des applications d’IA est une tâche complexe.

Problèmes de coût et de ressources : les coûts liés à l'infrastructure et à la mise à niveau des capacités de traitement des données sont également cités par 49 % des répondants comme un obstacle majeur à l'adoption de l’IA.

Des problèmes anciens amplifiés par l’IA

Les difficultés rencontrées par les entreprises dans l'exploitation de leurs données découlent de plusieurs facteurs interconnectés. Tout d'abord, les défis liés à la qualité et à l'intégration des données ne sont pas récents. Comme l'explique Chakraborty, responsable de l'IA chez Accenture, « ces problèmes existent depuis de nombreuses années, et l'introduction de l'IA générative n'a fait qu'amplifier ces difficultés ».

Ensuite, de nombreuses entreprises peinent à mettre en place une gouvernance efficace, ce qui compromet la traçabilité et la sécurisation des données tout au long de leur cycle de vie. Enfin, l'absence d'une stratégie unifiée est un facteur, avec beaucoup d'organisations qui continuent de fonctionner avec des systèmes cloisonnés, compliquant l'accès à des données fiables et exploitables à une échelle globale.

Les données utilisées par l’IA doivent être de qualité

Pour surmonter ces obstacles, les rédacteurs du rapport émettent plusieurs recommandations. Il est tout d'abord essentiel d'améliorer la qualité des données en investissant dans des processus robustes de gestion, incluant la normalisation, la gouvernance et une surveillance continue. Cela garantit que les données utilisées par les modèles d'IA soient de haute qualité. Par ailleurs, il est fortement conseillé de créer une infrastructure de données unifiée à travers toute l'organisation, afin de faciliter l'intégration et l'accès aux informations, réduisant ainsi les risques liés à la gouvernance.

Une autre recommandation consiste à adopter des modèles d'IA spécifiques à l'entreprise, entraînés sur des données internes provenant de divers domaines comme la finance, les ressources humaines ou la logistique, pour que l'IA devienne un véritable levier de différenciation compétitive. Enfin, pour sécuriser l'adoption de l'IA générative, il est crucial de mettre en place des garde-fous qui limitent les risques de dérives des modèles, notamment en contrôlant les hallucinations, c'est-à-dire les erreurs produites par l'IA.