La plupart des professionnels de la donnée sont confrontés à une mauvaise qualité des données, malgré le temps et les ressources investis pour y remédier.
On a coutume de dire que la data est le carburant des entreprises. Mais il semble que ce carburant n’est pas aussi limpide qu’espéré. C’est le constat que fait la société Monte Carlo, spécialisée dans la fiabilité des données qui a interrogé plus de 300 professionnels des données.
Les résultats de l'étude montrent que les équipes se débattent toujours avec la qualité des données et perdent un temps précieux, de l'argent et des ressources pour résoudre les problèmes qui se présentent. Or, une mauvaise exploitation des données impacte la compétitivité des entreprises.
Les personnes interrogées ont déclaré qu'en moyenne, 40 % de leur temps est consacré à l'évaluation ou au contrôle de la qualité des données. En outre, plus de la moitié d’entre elles a indiqué que la construction ou la réparation des pipelines leur prenait le plus de temps dans la journée.
Dans le détail, on apprend que :
- 75 % mettent quatre heures ou plus pour détecter un incident de qualité des données.
- Près de la moitié ont déclaré qu'il fallait en moyenne neuf heures pour résoudre le problème une fois identifié.
- 58 % ont déclaré que le nombre total d'incidents a augmenté quelque peu ou fortement au cours de l'année écoulée, souvent en raison de pipelines plus complexes, d'équipes de données plus importantes, de plus grands volumes de données et d'autres facteurs.
La mauvaise qualité des données affecte également les résultats financiers, 47 % des personnes interrogées estimant que les mauvaises données affectent 25 % ou plus des revenus de leur entreprise. D’ailleurs, une étude a montré que l’IA ne donnait pas des résultats pertinents faute d’un volume important de données de qualité.
Mais tout n’est pas négatif pour… le commanditaire de cette étude. Environ 90 % des personnes interrogées ont déclaré qu'elles investissaient déjà ou prévoyaient d'investir dans des solutions de qualité des données, comme l'observabilité des données, dans les six mois.