Avec la donnée devenue un actif stratégique de l’entreprise, surtout depuis l’arrivée du Big Data, des analytiques, de l’Intelligence Artificiel et du Machine Learning, les professionnels de la données sont devenus des employés importants. Et pourtant, une étude étonnante révèle qu’ils consacrent trop de temps à des activités qui n’apportent pas de valeur, et donc trop peu à l’analyse !
Les analytiques portées sur les données sont sources de valeurs, d’idées, et accompagnent la prise de décision. Mais il se révèle que les professionnels de la donnée y consacrent trop peu de temps. Au lieu de cela, ils se perdent dans le nettoyage et la préparation des données, dans la modélisation et le dépannage, des tâches qu’ils exécutent mais qu’ils considèrent comme les activités les moins ‘agréables’.
Mais à quoi consacrent-ils leur temps ?
117 % - Nettoyage et préparation des données
Le nettoyage des données est probablement l’activité à laquelle les professionnels de la donnée consacrent le plus de temps, et en corolaire celle qu’ils considèrent comme la moins agréable.
214 % - Analyse
L’analyse est le but de la gestion de donnée, le point central qui permet aux organisations d’accéder à de nouvelles informations sur les clients, la concurrence, le marché. Mais les professionnels de la donnée y consacrent finalement peu de temps !
312 % - Gestion
Les professionnels de l’informatique, en particulier ici les professionnels de la donnée, consacrent une part importante de leur temps à la gestion, or une majorité d’entre eux n’aspirent pas à des rôles de gestionnaires.
412 % - Modélisation des données
La modélisation des données est un domaine particulier, non qu’elle soit désagréable aux professionnels de la donnée, mais plutôt qu’ils espèrent que cette tâche pourra être confiée à des logiciels afin d’être automatisée. C’est donc bien volontiers qu’ils l’abandonneront à l’automatisation.
510 % - Produit
La majorité des professionnels de la donnée reconnaissent la valeur du travail sur le produit, qui est une approche pratique. Mais plus que la modélisation, c’est cette tâche qui devrait en priorité être confiée à l’automatisation.
610 % - Dépannage
Le dépannage est une tâche régulière pour les professionnels de la donnée, mais elle est considérée comme l’une des moins agréables à accomplir. Elle est considérée comme la moins agréable par 35 % des ingénieurs de la donnée, tandis que 16 % des data scientists la placent à la seconde place.
78 % - Intégration des données
Là encore, voici une tâche à laquelle les professionnels de la donnée consacrent peu de temps, mais qui pourrait bénéficier de l’automatisation.
85 % - ETL
L’ETL (Extract, Transform, Load), tout comme l’intégration qui précède et les pipelines à suivre, ne figure pas parmi les tâche favorites des professionnels de la donnée, et pourrait bénéficier de l’automatisation.
95 % - Construction des pipelines de données
Avec l’explosion des volumes de données compilées par les organisations, le temps consacré à la préparation des données – intégration, ETL, et construction des pipelines de données – ne cesse également d’augmenter. Globalement ces activités absorbent environ 18 heures par mois, en augmentation régulière.