A peine dévoilé que déjà le machine learning s’annonce comme un vecteur de progrès considérable, au travers de 5 domaines aptes à le rendre plus facile, plus rapide et moins coûteux.

Branche de l'Intelligence Artificielle (IA) qui se nourrit de données pour découvrir automatiquement des modèles et des anomalies, faire des prédictions et prendre des décisions, le machine learning s’impose.

Pour autant, malgré sa puissance et sa polyvalence, si près de 9 entreprises sur 10 affirment avoir déjà adopté l’IA, elles sont moins de 1 sur 10 à investir dans le machine learning (source : SAP Leonardo). Il s’avère qu’un certain nombre de facteurs limitent son adoption : le manque de praticiens qualifiés ; le manque de maturité sur les outils et les cadres de travail, qui par ailleurs sont en constante évolution. La difficulté, longue et coûteuse, de l'obtention des grands ensembles de données que nécessitent certaines techniques de développement de modèles.

Sans oublier l’effet boîte noire : une fois le premier algorithme écrit, le système s’enrichit sans que l’humain ne sache vraiment ce qui se passe, et sans rien savoir de la précision et des marges d’erreur à appliquer sur les résultats. Et que dire des réglementations qui obligent les entreprises à fournir des explications pour leurs décisions ou à prouver que ces dernières ne sont pas discriminatoires.

Les 5 vecteurs clés du machine learning

Voici 5 vecteurs clés de progrès pour faire tomber les barrières qui se dressent autour du machine learning.

1Automatisation de la science des données

Le développement de solutions de machine learning nécessite des compétences entrant dans la discipline des sciences des données, un domaine souvent mal compris, pratiqué par des spécialistes en forte demande mais à court d'offre. La science des données est un mélange d'art, de science et de travail numérique. Or, jusqu'à 80 % du travail sur lequel les scientifiques de la donnée passent leur temps peut être entièrement ou partiellement automatisé. En particulier la préparation des données, l’analyse préliminaire destinée à la compréhension des caractéristiques générales des données, l’identification des caractéristiques des données susceptibles d'être les plus significatives dans l'analyse, et sélection des algorithmes à exécuter et à tester. De quoi rendre les spécialistes des données non seulement plus productifs, mais également plus efficaces.

2Réduire le besoin de données de formation

La formation d'un modèle de machine learning peut nécessiter jusqu'à des millions d'éléments de données. Cela peut constituer un obstacle majeur : l'acquisition et l'étiquetage des données peuvent prendre beaucoup de temps et être coûteux. Les questions de confidentialité peuvent également rendre difficile l'obtention de données avec lesquelles travailler. Mais des techniques prometteuses pour réduire la quantité de données d'entraînement requises pour le machine learning apparaissent. Comme l'utilisation de données synthétiques, générées de manière algorithmique pour imiter les caractéristiques des données réelles. Et cela peut fonctionner étonnamment bien. Une autre technique est l'apprentissage par transfert, avec  un modèle automatique pré-formé sur un ensemble de données en tant que raccourci pour apprendre un nouvel ensemble de données dans un domaine similaire tel que la traduction ou la reconnaissance d'image.

3Accélérer la formation

En raison des grands volumes de données et des algorithmes complexes impliqués, le processus de formation d'un modèle de machine learning peut prendre beaucoup de temps : des heures, des jours, voire des semaines. Ce n'est qu'à son issue que le modèle peut être testé et affiné. Mais de nouveaux processeurs spécialisés, tels que des unités de traitement graphique (GPU), des gate arrays (réseaux de portes) programmables et des circuits intégrés spécifiques aux applications peuvent réduire le temps nécessaire à accélérer les calculs et accélérer le transfert des données dans la puce. Ces processeurs dédiés aident à accélérer la formation et l'exécution du machine learning, ce qui réduit à son tour les coûts associés.

4Expliquer les résultats

Les modèles de machine learning souffrent souvent d'une faiblesse critique : beaucoup sont des boîtes noires, ce qui signifie qu'il est impossible d'expliquer avec confiance comment ils ont pris leurs décisions ! Cela peut les rendre impropres ou désagréables pour de nombreuses applications. Dans certains cas, les règlements exigent de telles explications. Mais des techniques émergent qui aident à faire briller la lumière à l'intérieur de la boîte noire de certains modèles de machine learning, les rendant plus interprétables et précis.

5Déployer localement

L'adoption du machine learning augmentera avec la capacité de déployer la technologie là où elle peut améliorer l'efficacité et les résultats. Les progrès dans les logiciels et le matériel rendent plus viable l'utilisation de la technologie sur les équipements mobiles et les capteurs intelligents. Du côté des logiciels, des fournisseurs de technologies créent des modèles de machine learning compacts qui nécessitent relativement peu de mémoire, mais qui peuvent déjà gérer des tâches telles que la reconnaissance d'image et la traduction sur des appareils mobiles, aboutissant à des modèles 10 à 100 fois plus petits. L'émergence des appareils mobiles en tant que plate-forme d'apprentissage augmente le nombre d'applications potentielles de la technologie et incite les entreprises à développer des applications dans des domaines tels que les maisons intelligentes, les véhicules autonomes, la technologie portable et l'Internet industriel.

Source : Deloitte

Image d’entête 917075688 @ iStock PhonlamaiPhoto