Le machine learning prend toute sa puissance en se plaçant à la confluence de l'informatique, les statistiques et les mathématiques.
Le machine learning, ou apprentissage automatique, appliqué à la donné consiste à construire un modèle de corrélations – mise en relation d’évènements - reposant sur des algorithmes dans le but de réaliser de l’analyse prédictive. Si cette démarche n’est pas nouvelle, la technologie a vu ses premiers développements il y a une quarantaine d’années, elle prend une autre dimension avec l’arrivée du Big Data.
La donnée au coeur de l'apprentissage
En effet, en reposant sur un volume important de donnés, les deux phases du machine learning que sont l’entrainement, l’apprentissage sur un petit volume de données qui aboutit à la création d’un modèle mathématique, et la vérification, qui teste le modèle sur un grand nombre de données, trouvent à s’exprimer pleinement.
Le Web a un effet important : nous recueillons de plus en plus de données. Les géants du Web ont d’ailleurs été les premiers à accueillir et à développer des technologies de machine learnig, car plus les volumes augmentent et moins les technologies d’analyse classiques se révélaient efficaces. Certaines technologies Big Data, comme MapReduce, sont des tentatives de réponse à ces problématiques.
Le machine learning se fait omniprésent dans le Big Data et perce dans des domaines où jusqu’à présent les analytiques restaient réservées aux plus riches. Entre les premiers algorithmes de rétropropagation qui ont alimenté les premiers réseaux neuronaux au début des années 70, et aujourd’hui, ce qui a changé c’est la puissance du CPU, des processeurs.
A la croisée du machine learning
Cet aspect purement ‘hardware’ ne suffit pas cependant à faire du machine learning un succès. Celui-ci est à rechercher au centre de la confluence de l'informatique, des statistiques et des mathématiques. Disposer de capacités de calcul à un prix abordable aide à sa démocratisation mais pas à son usage.
C’est seulement de la réunion des bonnes compétences mathématiques et statistiques avec la bonne technologie que naitra le meilleur du machine learning et du Big Data au service de l’analyse et de la prise de décision.
Image d’entête 81918687 @ iStock jabkitticha