Par Gaël Le Dily, Manager en charge des offres Pilotage et Transformation ainsi que de la direction technique, Groupe Estia
Tout l'art du data scientist consiste à analyser, interpréter, corréler des données brutes en forts volumes. On le sait, il ne suffit pas d’être « statisticien » : on évolue au carrefour de des statistiques et des maths bien sûr, de l’informatique mais aussi des métiers. La complexité s’accroit au fil des masses et des enjeux, et il faut trouver de nouvelles sources de créativité. Afin d'inspirer et d'accélérer une innovation continue, pourquoi ne pas jouer la concurrence interne entre équipes, sous forme de data competitions ?
Au-delà de ses apports opérationnels et applicatifs, la data science, et c’est une de ses originalités, a la capacité de faire émerger de nouveaux questionnements dans les entreprises, et ainsi de booster l'innovation. Acteur avancé de la transformation, elle cherche aujourd’hui à inoculer dans ses propres méthodes et son management, de nouveaux modes de travail à même d’accélérer cette innovation, appuyés sur le management 3.0.
Ludiques, inspirantes, très en phase avec l’ADN intellectuel « digital native » de ces millenials que sont souvent les ingénieurs et chercheurs en R&D du domaine, les data competitions peuvent être source, en plus de leur dynamique managériale, de solutions applicatives, techniques ou métiers, réellement novatrices.
Faire sauter plus facilement des verrous techniques
Héritier des hackhatons, des compétitions Kaggle et autres battles, ce genre de challenge informatique atypique prend la forme de « contests» entre tandems de data scientists. Il va plus loin que ses « ancêtres » : il améliore les pratiques et cas d’usage, et fait profiter les entreprises utilisatrices du big data, de l’expertise de leurs environnements. C’est donc un moyen original de favoriser l’innovation technologique, service ou métier.
La data competition se base sur des situations concrètes rencontrées. L’objectif est de faire sauter des verrous - techniques notamment, en testant des solutions qui ne sont pas encore sur le marché ou des problématiques fournies par les entreprises - et de transformer des sujets de compétition en offres.
De multiples cas d’innovation déjà recensés
Ce type de battle a déjà pu donner naissance à des projets tangibles. Ainsi, c’est via une data competition qu’une plateforme de collecte de données open source a permis de réaliser une étude comportementale des utilisateurs du Velib à Paris. Des travaux qui ont catégorisé les arrondissements (résidentiel, en activité…) à travers une application de datavizualisation et de classification des stations par des méthodes statistiques. Ce type d’application pourrait être utilisée pour l’exploration d’autres données open data. Le sujet pourrait être poussé plus loin en intégrant d’autres sources de données telles que la météo, les données liées aux transports parisiens, etc. afin de réaliser une étude sur les rapports des Parisiens aux modes de transports.
Autre exemple : une application web a été créée pour automatiser le traitement de données Twitter afin d’en extraire les informations pertinentes (analyse de sentiments, de mots liés, classement des verbatims…). L’adaptation de cette application peut désormais permettre de réaliser un suivi Twitter pour une marque, un produit ou une personne.
C’est encore une de ces battles qui a vu la sortie d’un projet de formation au machine learning : à travers des outils de data science comme R ou Python, une formation atypique, qui s’écarte des standards du marché est aujourd’hui délivrée dans certaines entreprises. La formation se déroule en plusieurs itérations intégrant l’évaluation des candidats, la mise à niveau, la formation et la mise à disposition d’éléments de formation continue ou d’exercices permettant aux candidats de continuer à s’auto-former après avoir acquis les bases.
Ces data competitions sont donc sources d’innovations. Elles sont aussi un véritable investissement original pour rester à la pointe des technologies data et proposer de nouveaux produits. En quelque sorte, un bras « armé » ludique de la R&D...