Certains dirons que nous sommes à la marge de l’Intelligence Artificielle, mais il y a tellement de projets IA qui demeurent sans suite que nous vous invitons de commencer par réfléchir sur une première approche du machine learning : l’apprentissage supervisé.

Au sein de l’IA, le machine learning occupe une place centrale car il repose sur l’exploitation de données de plus en plus volumineuses, ce qui d’ailleurs se prête à l’usage des algorithmes d’apprentissage automatique ‘traditionnels’.Plus récents et plus sophistiqués sont venus les algorithmes de deep learning.

Le ‘surpervised learning’

L’apprentissage supervisé est la première approche pour former des réseaux de machine et deep learning, la plus simple également, ce qui le rend particulièrement intéressant pour s’initier aux pratiques du machine learning et de l’IA.

Le principe du supervised learning est de créer des réseaux d’apprentissage à l’aide d’exemples où nous connaissons déjà la bonne réponse. Voici 4 étapes pour décliner un scénario de machine learning :

1Création et catégorisation d'un ensemble de données

Le processus démarre par l’examen des données, l’identification des contenus, et leur étiquetage. La création de 2 piles va permettre de créer un premier réseau d’apprentissage, la seconde pile est destinée à contrôler la précision du modèle. L’objectif est d’obtenir jun e réponse simple, du type ‘0’ si la donnée ne répond pas à la requête et ‘1’ si elle y répond.

La tâche de catégorisation va permettre d’étendre la réponse au questionnement afin de générer un ensemble de valeurs qui vont au-delà du ‘0’ et ‘1’. Par exemple une notation de 0 à 100 permet de générer une probabilité, vers le 0 le visiteur n’achètera pas, vers 100 il ira probablement vers l’achat, c’est ce qu’on appelle les tâches de régressions.

2Formation

Pour continuer le processus, le modèle effectue une prédiction pour chaque donnée en suivant des règles (fonction d'activation) permettant de décider d'allumer un nœud particulier dans le workload. Chaque prédiction ou noeud est positionné sur un modèle gauche/droite ou en couches, le noeud le plus à droite ou noeud de sortie s’allume ou non, vrai ou faux, information qui est transmise au réseau.

Les fonctions de coût, d’objectif, d'utilité ou de mise en forme quantifient l’éloignement de la réponse réelle par rapport à la prédiction du modèle. Les résultats sont utilisés pour modifier la force des connexions et des biais entre les nœuds dans un processus appelé rétropropagation. Une multitude de modèles mathématiques utilisent cette compétence afin de déterminer si le modèle est correct ou non.

3Vérification

Les deux étapes précédentes sont répétées avec des ajustements des hyperparamètres, des éléments du modèles comme le nombre de noeuds, le nombre de couches, la fonction mathématique, afin de décider si le noeud s’allume ou non. Le modèle est testé sur la seconde pile afin de vérifier sa précision.

4Utilisation

Une fois qu’un modèle précis est validé, il est déployé dans l’application et exposé en tant qu’appel d’API, afin de faire une inférence et de donner un résultat.

Le machine learning vaut-il son coût ?

La création d’un jeu de données étiquetées peut se révéler complexe et donc coûteuse. Avant de créer les piles et de former un modèle, il est fortement recommandé de s’assurer que la valeur de la prédiction justifie son coût…

Or, nous l’avons vu, le process du machine learning est itératif pour forger sa précision. Si les attentes sont simples et les données clairement identifiées, le modèle est rapide à définir et les résultats seront précis et pertinents. Mais dans la plupart des cas il s’agit de partir sur des (très) gros volumes de données afin de pouvoir affiner les résultats et la précision à partir d’une masse statistique. Il demeure donc toujours une zone d’ombre...

Sachant que plus un modèle est précis, plus sa valeur est élevée… comme son coût ! Il s’agit donc pour l’organisation de dépasser le phénomène de mode lié à l’IA et de définir précisément ses attentes afin de définir si le jeu l’IA et le machine learning en vaut la chandelle, et le prix !

Source : Andreessen Horowitz’s AI Playbook

Image d’entête 962219860 @ iStock Photo PlargueDoctor