Selon l’étude Global AI Adoption Index 2021, 20 % des entreprises françaises cherchent à développer l’intelligence artificielle, et plus de 35 % se disent intéressées par la possibilité de l’exploiter à l’avenir. L’intelligence artificielle (IA) et le machine learning ou apprentissage machine (ML) sont de véritables leviers d'amélioration de l'efficacité, d'automatisation et sont sources d'informations précieuses pour les entreprises. Comme la technologie ML repose sur des volumes de données fiables pour « apprendre », elle est hautement dépendante et liée à l'intégrité des données.
Le machine learning (ML)est un sous-ensemble de la catégorie plus large de l'IA, qui permet aux machines d'apprendre en consommant de grands volumes de données, pour apprendre leurs modèles et finalement arriver à des prédictions précises, sans nécessiter d'instructions de programmation explicites. Il doit être « formé »pour comprendre le domaine spécifique sur lequel il doit faire des prédictions. En d'autres termes, les modèles ML doivent se référer au passé pour comprendre ce qui est susceptible de se produire à l'avenir.
De plus, les algorithmes ML requièrent un ensemble de données suffisamment important pour pouvoir en tirer des prédictions statistiquement valides. Bien que la majorité des organisations trouvent un volume adéquat de données, la plupart sont confrontées à un problème d’intégrité des données. Ce dernier se traduit par un manque de richesse contextuelle fournie par la géo-intelligence et l'enrichissement des données ; cela s’explique le plus souvent par le fait que les informations cloisonnées sont déconnectées des autres sources de données au sein de l'entreprise et peu qualitatives.
Par conséquent, toute entreprise confrontée à ce cas de figure, et souhaitant se lancer dans des initiatives d'IA/ML, doit commencer par aborder les quatre piliers de l'intégrité des données : l'intégration, la gouvernance avec la qualité, l'enrichissement et la géo-intelligence, afin de garantir des informations précises, cohérentes et complètes.
L'intégrité des données, clé de voûte d’une analyse éclairée
Comme mentionné précédemment, pour comprendre l’importance de l’intégrité des données, il convient de souligner que les modèles de machine learning sont formés à partir d’ensembles de données. Si ces dernières manquent d'intégrité, ils ne parviendront pas à atteindre les résultats escomptés et peuvent même conduire à des prédictions inexactes ou erronées. Le machine learning produit donc éminemment à partir des informations en sa possession, et ne peut pas parvenir à un résultat de qualité avec des données de qualité médiocre. Le deuxième problème du contexte de l’intelligence artificielle et du machine learning est celui de l'échelle. Se préoccuper de l'exactitude et de l'exhaustivité d'un seul enregistrement client dont les données sont de mauvaise qualité mènerait alors à une analyse d’une portée relativement limitée.
Or, si l’analyse porte sur un large éventail de clients, la mauvaise qualité des données prend alors plus d’importance. L'IA et le ML permettent aux entreprises d'exploiter véritablement les données à l'échelle et de prendre des décisions opérationnelles et stratégiques. Il s'agit d'un point crucial, pour les entreprises qui envisagent l’implémentation de ces technologies, ou pour celles ayant déjà entamé le processus.
Une opportunité considérable pour les entreprises
Si l’intégrité des données constitue un défi pour les entreprises, elle représente surtout une opportunité, un idéal à atteindre. Les organisations en viennent à se battre contre la mauvaise qualité des données, le cloisonnement des informations et le manque de richesse contextuelle, de façon à exploiter l'IA et le ML et ainsi obtenir un avantage concurrentiel sur le long terme.
Certaines entreprises dépendent presque de l’intégrité des données. C’est le cas notamment des compagnies d'assurance, qui utilisent le machine learning pour assurer une meilleure prise de décisions en matière de tarification, pour comprendre les risques et pour repérer les cas potentiels de fraude et d'abus. Elles utilisent également l’intelligence artificielle avec la technologie de localisation intelligente pour contacter de manière proactive les clients avant tout événement météorologique majeur – avis de tempête, fortes chutes de neige – afin de les avertir des dangers. Elles peuvent alors prépositionner les experts en sinistres pour répondre rapidement aux assurés susceptibles d'avoir besoin d'une assistance urgente à la suite d’une catastrophe naturelle.
Les commerçants utilisent quant à eux le machine learning pour mieux analyser les modèles d'achat et mieux comprendre le comportement de leurs clients. L'IA et le ML aident entre autres les entreprises à améliorer la sélection des sites, en associant les données internes à un large éventail de variables géographiques qui peuvent être utilisées pour calculer les zones de chalandise et de livraison, analyser les schémas de circulation et comprendre les populations avec leurs préférences de style de vie, leurs niveaux de revenus et leurs habitudes d'achat. L’objectif est d’obtenir une vue unifiée de leurs clients, tout en dédupliquant les informations dans leurs systèmes CRM et ERP et en enrichissant les informations sur les consommateurs pour mieux comprendre les clients qu'ils servent.
La vision holistique de l'intégrité des données comprend l'exactitude, la cohérence et le contexte. Lorsque les données sont exactes et cohérentes et qu'elles intègrent le contexte géospatial et les données de tiers, les entreprises sont mieux placées pour voir tous les enjeux d’une situation. Selon Statista, 64 zettaoctets (Zo) de données ont été générés dans le monde en 2020. D’ici 2025, ce chiffre devrait croître de près de 40 % et dépasser les 180 Zo.
Face au nombre croissant de données, les entreprises sont confrontées à des défis plus importants que jamais. Dans ce contexte, l'IA et le machine learning sont des technologies très prometteuses pour permettre aux entreprises de gagner en précision et en efficacité. L’intégrité des données se positionne durablement comme un pilier de l’analyse des entreprises, et une source de renseignements précieuse afin d’assurer une activité pérenne pour toutes les structures. Les dirigeants pourront ainsi prendre des décisions stratégiques plus éclairées et rester compétitifs et productifs sur leur marché.
Par Steve van den Berg, Vice-Président SEMEA chez Precisely