Une nouvelle stratégie émerge dans la donnée, celle de la découverte des Dark Data, les données muettes, cachées, inexplorées ou inaccessibles, qui pourtant offrent un fort potentiel pour le business via leur analyse Dark Analytics.

DSI, data scientist, chef d’entreprise, vous êtes toujours plus nombreux à vous affairer sur les Dark Analytics – l’analyse des données muettes, non structurées, cachés, inexploitées ! L’objectif est d’investiguer ces données cachées, comme celles qui n’ont pas été digérées par le SI, afin d’en extraire et d’exploiter des informations sur le business et les clients de l’entreprise.

Rappelons que le Deep Web, le web invisible qui se cache derrière les données indexées par les moteurs de recherche, est 500 fois plus important que ces dernières, et estimé à 44 milliards de téraoctets en 2020. Et qu’à cette date, entre 21 et 50 milliards d’objets connectés viendront s’ajouter pour l’alimenter.

Les données du Dark Analytics

Bien au-delà, plus profondément et avec des volumes autrement plus importants que les BIG Data, derrière les Dark Analytics se cachent trois typologies de données :

  • Les données auxquelles l’entreprise peut déjà accéder, mais qui ne sont pas vraiment exploitées, telles que les données en ligne sur les habitudes d'achat dans le retail.
  • Les données auxquelles il est possible d’accéder, mais pour lesquelles l’entreprise ne possèdent pas actuellement les capacités et les techniques pour les évaluer pleinement, telles que les informations générées par les capteurs des objets connectés.
  • Les données non indexées qui sont organisées par des universitaires, des consortiums, des organismes gouvernementaux, des collectivités et d'autres domaines dans le ‘deep web’, et qui nécessitent généralement des capacités d’accès et d’analyse proposées par des tiers.

Les potentialités des Dark Analytics

Pour tirer le meilleur parti des Dark Analytics, l’entreprise doit aller plus loin que les data stores et les data lakes, ses outils habituels pour stocker les données. Plus loin ne signifie pas de cumuler plus de données, même si les volumes sont autrement plus importants, mais plutôt d’apprendre à explorer les données présentes et d’apprendre à tirer parti des connaissances en apportant la capacité de répondre à des questions pertinentes et adaptées. Une démarche plus complexe encore que celle des Big Data !

Pour cela, le DSI doit prendre en considération les nouvelles technologies d’analyse de la donnée, comme par exemple les outils d’exploitation des données scientifiques, ou le deep learning. Il doit également examiner son infrastructure, et sur ce point sensible faire évoluer sa stratégie, via des services cloud par exemple, ou encore les nouvelles plateformes de données et les écosystèmes émergents.

Un élément important à considérer porte sur les coûts associés tant à la collecte qu’au stockage, à la maintenance et à la diffusion de la donnée. Ainsi qu’aux partenariats qu’il est nécessaire de mettre en place pour accéder à certaines données qui ne sont pas encore accessibles.

Le bon côté des choses, c’est que les Dark Analytics ouvrent d’énormes opportunités en matière d’exploitation de données, dont des données stratégiques et sensibles, d’intégration d’informations dans de nouveaux produits ou services, et plus généralement de monétisation de l’information.

Image d’entête 511382390 @ iStock hanohiki