Dans un monde d’incertitude et de crise, le partage de données entre les entreprises apparaît comme une solution qui permet d’accélérer l’innovation, via l’apprentissage automatique et l’IA. Jadis réticentes, les entreprises s’ouvrent progressivement à cette mutualisation de la donnée.

En juin 2019, dix grandes entreprises pharmaceutiques ont formé un consortium dans le but de partager les données de recherche sur les médicaments, que chacun peut utiliser pour former ses algorithmes d’IA. Selon notre confrère spécialisé European Pharmaceutical Review, le projet était doté d’un budget estimé à 18,4 millions d’euros provenant de l’Initiative en matière de médicaments innovants (IMI). Il s’agit d’un partenariat entre l’Union européenne et l’industrie pharmaceutique européenne, représentée par la Fédération européenne d’associations et d’industries pharmaceutiques (EFPIA).

Le système de partage repose sur une combinaison de Blockchain pour la publication des données et sur un algorithme d’IA pour l’analyse. Owkin, une startup basée à Paris et soutenue par Google Ventures, a développé l’intelligence artificielle, alors que la traçabilité des données repose sur un système sécurisé de blockchain. L’algorithme est programmé pour analyser les données que les entreprises saisissent sans révéler de secrets commerciaux à leurs rivaux. L’objectif est de simplifier et accélérer la découverte et le développement de molécules, afin que des médicaments et des traitements nouveaux et moins coûteux soient mis sur le marché.

Le partage de donnée et la théorie de l’holisme ontologique

Ce projet est à lui seul une illustration que le partage de données ne peut être que bénéfique à ceux qui veulent bien mettre leurs données au service de tous. Une collaboration en matière de recherche où l’IA est un facilitateur, et signifie bien souvent que les bénéficiaires en retireront plus que ce qu’ils y ont mis. C’est en ce sens que la théorie de l’holisme ontologique, qui stipule que « le tout est plus que la somme de ses parties », semble s’appliquer à merveille dans le cas de l’Apprentissage automatique et plus généralement de l’IA.

Nous avons emprunté cette expression à Jennifer Belissent, Principal Analyst chez Forrester, qui, dans un article de blog raille ceux qui ne veulent pas partager, les comparant aux mouettes dans le dessin animé Nemo où chacune criait « à moi » à n’en plus finir.

Partant du constat que les données d’une entreprise ne leur « permettent pas d’aller plus loin » que leur seule expérience ; elle cite le CDO de la Flagstar Bank : « Avec nos propres données, nous ne pouvons regarder qu’en interne. Nous avons besoin de voir les références du secteur, les tendances régionales et les vagues sur lesquelles nous pouvons naviguer ». Flagstar Bank utilise des données externes pour obtenir une vue plus complète de ses clients afin de réduire le taux de désabonnement et de prévoir plus précisément les risques pour améliorer ses pratiques de prêt.

Les entreprises prennent conscience de l’importance de partager

Fort heureusement, les mentalités évoluent. Une enquête de Forrester, « Forrester Analytics Business Technographics 2020 », révèle que 70 % des entreprises accordent la priorité à l’élargissement de leur capacité à obtenir des données externes. Dix-sept autres pour cent déclarent qu’elles prévoient de le faire au cours des 12 prochains mois. C’est une augmentation significative par rapport à il y a quelques années seulement.

Comme à l’accoutumée, ce sont les grandes entreprises qui ont amorcé le mouvement, ainsi que les gouvernements avec les initiatives open data. Certes, les grandes structures ont les moyens de sécuriser leurs données confidentielles et disposent des compétences en interne pour assurer le suivi du partage et sa sécurité. Mais les entreprises de taille moyenne peuvent compter sur des fournisseurs de services, ou des places de marché de la donnée pour mettre en partage les leurs et bénéficier de celles des autres.