Alors que le gouvernement planche sur une application mobile de traçage numérique pour prévenir d’éventuels foyers de l’épidémie en cours sur le territoire, la donnée est plus que jamais au cœur des enjeux sanitaires et d’innovation des entreprises. Véritable chantre de la donnée, capable d’en assurer l’exploitation, la valorisation, voire même, parfois, la monétisation, le data scientist est l’un des pivots de la transformation numérique des organisations. Selon un rapport mené par LinkedIn sur les métiers les plus recherchés en 2020 en France, le data scientist s’inscrit, d’ailleurs, à la dixième place du palmarès.
Pour les entreprises, la data science est un moyen clé de comprendre ses clients, d'élaborer des produits phares, d'améliorer l'efficacité opérationnelle ou encore de rationaliser la gestion d'une chaîne logistique. Cependant, beaucoup d’organisations ont aujourd’hui recours à un système de machine learning automatisé qui rend les technologies auparavant réservées aux data scientists, accessibles à des nouveaux profils de métiers tels que le chief data officer ou le citizen data scientist. En supprimant la lourde tâche d'extraction de la valeur des données, l’analyse augmentée et le machine learning transforment les tâches manuelles telles que le nettoyage des données, la génération d'information et la modélisation en processus automatisés.
Cette automatisation des processus remet en question la fonction même du data scientist. En effet, selon Gartner, 40% des tâches de la data science seront automatisées à l’horizon 2030. Le data scientist risque bien d’être dépossédé des missions inhérentes à son métier. Mais grâce à l’intelligence artificielle et au machine learning, il pourrait également tirer meilleur parti des données en se libérant de tâches chronophages – comme la création de modèles prédictifs, de workflows de préparation et de traitement des données – et se consacrer à des missions innovantes à plus forte valeur ajoutée.
L’IA automatisée et la data science, un duo gagnant-gagnant
En effet, les nouvelles technologies qui s’appuient sur l’intelligence artificielle et le machine learning facilitent la préparation et l’exploration des données. Par exemple, l’analyse augmentée se charge de transformer les données en informations directement exploitables et d’automatiser les tâches manuelles telles que le nettoyage des données et la modélisation. La transformation de la fonction du data scientist par l’intelligence artificielle et le machine learning ne remet donc pas en cause sa légitimité. Elle vient, au contraire, renforcer son expertise pour exploiter et valoriser des données.
Lorsque le data scientist crée un modèle prédictif, le développement des nombreux workflows de préparation de données requis peut nécessiter un travail de longue haleine. En revanche, la génération automatique de ces workflows fait gagner du temps, génère des modèles plus précis et encourage le respect des meilleures pratiques tout au long du processus pour une meilleure productivité des organisations.
Vers une meilleure productivité pour l’entreprise
En effet, la préparation de données automatisée et l’apprentissage statistique offrent des gains de productivité considérables pour les analystes métiers et les data scientists. En automatisant différentes phases du workflow allant des chefs de projets à la production, des modèles peuvent être créés, ajustés et déployés en environnements de production cloud natifs. De leurs côtés, les modèles de machine learning sont de plus en plus simples à déployer et à connecter à des flux de données afin de permettre des prises de décisions en temps réel. Qu’il s’agisse d’aider les services financiers à détecter des fraudes avec précision ou de superviser la production d’un gisement pétrolier, les analystes, data scientists et développeurs utilisent des workflows automatisés pour générer des informations pertinentes et créer ainsi rapidement des modèles plus intelligents.
La data science est le support de prédictions la plus précise en environnement de production. Tout comme les chaînes de fabrication automatisées ont accompagné la naissance de l’ère industrielle moderne, l’automatisation de la data science est au cœur de l’âge industriel numérique : elle libère les experts des tâches fastidieuses et leur permet d’appliquer rapidement des technologies analytiques à différents domaines.
Ainsi, l’automatisation du machine learning est une solution qui génère un gain de temps non négligeable pour optimiser la résolution d’un problème, sans pour autant venir se substituer à la connaissance et à l’intuition d’un data scientist. Au regard de l’évolution de l’intelligence artificielle et des solutions de machine learning automatisé, il y a fort à parier que cette branche de la data science évoluera rapidement au service de la productivité des entreprises tout en conservant au data scientist son statut de figure tutélaire.
Par Michael O’Connell, Chief Analytics Officer chez TIBCO Software