Data Fabric Big Data Le coût des mauvaises données : la ‘règle des dix’

Le coût des mauvaises données : la ‘règle des dix’

Par

06/08/2018

Sur le seul territoire américain, IBM a estimé qu’en 2016 le coût global annuel des données de mauvaise qualité a été de 3.100 milliards de dollars ! Ce calcul a mis en application la ‘règle des dix’.

Nous avons, dans notre précédent article « Seulement 3 % des données sont jugées acceptables » (lire ici), évoqué la méthode FAM (Friday Afternoon Measurement) qui a permis aux chercheurs de la University College Cork de prendre la mesure de l’effroyable volume des mauvaises données dans les organisations.

Ces données erronées qui s’accumulent ont un coût exorbitant pour les entreprises comme pour l’économie. Pour les Etats-Unis et en 2016, IBM a estimé ce coût à 3,1 billons de dollars (3,1 milliers de milliards $). Et ses répercussions sont multiples :

Les travailleurs du savoir gaspillent 50 % de leur temps consacré au traitement des données à la recherche de ces données, à la recherche et la correction d'erreurs, et à la recherche de sources de confirmation pour les données auxquelles ils ne font pas confiance.

Les scientifiques perdent 60 % de leur temps au nettoyage et à l'organisation des données (source : CrowdFlower).

Les pertes en cascade...

Le bilan n’a rien de glorieux :

Les vendeurs perdent du temps à gérer des données de prospects erronées ;
Les prestataires de services perdent du temps à corriger les commandes erronées des clients reçues des ventes ;
Les spécialistes des données consacrent énormément (trop) de temps au nettoyage des données ;
La DSI consacre énormément d'efforts à mettre en place des systèmes qui « ne parlent pas » ;
Les cadres couvrent (dans le sens de couvrir les risques) leurs projets parce qu'ils ne font pas confiance aux chiffres de la finance.

Et pourtant, selon IBM, si l’entreprise travaille activement à réduire les coûts évoqués ci-dessus, ceux-ci peuvent être réduit des deux tiers, voire de 90 % et plus

La règle des dix

Avec la méthode FAM (Friday Afternoon Measurement), nous savons comment évaluer le volume des données erronées. La ‘règle des dix’ permet d’estimer, donc de prévoir leur coût, avec une certaine précision. Cette règle spécifie qu’« il en coûte dix fois plus pour compléter une unité de travail lorsque les données sont imparfaites, de quelque façon que ce soit, que quand elles sont parfaites ».

Les chercheurs de la University College Cork donnent l’exemple suivant :

Supposons que vous avez 100 choses à faire et que chacune coûte 1 € lorsque les données sont parfaites.

Si toutes les données sont parfaites, le coût total est de :

100 x 1 € = 100 €

Si 89 données sont parfaites et 11 sont défectueuses, le coût total est de :

89 x 1 € + 11 x 10 € = 199 €

Notons que pour la plupart des organisations, les coûts opérationnels sont bien plus importants. Et la ‘règle des dix’ ne tient pas compte des coûts non monétaires, tels que les clients perdus, les mauvaises décisions ou les dommages à la réputation de votre entreprise.

Résultat, le coût des mauvaises données a de quoi effrayer tous les gestionnaires. Ajoutons à cela que la majorité des données sont erronées. La conclusion vous appartient...

Sources :

Travaux de l’University College Cork, Irlande, relayés par la Harvard Business Review
« Extracting business value from the 4 V's of big data » d’IBM

Image d’entête 861865194 @ iStock ilyakalinin

Le coût des mauvaises données : la ‘règle des dix’

Les pertes en cascade...

La règle des dix

LAISSER UN COMMENTAIRE Annuler ma réponse

Derniers articles de fond

Infostealers, un cas d’école : 19 % des mots de passe volés...

Robotique industrielle : l’automobile décroche, la Chine s’impose, la médecine décolle

Pour la première fois, l’impact d’un datacenter, de la fondation au...

Derniers livres blancs

Voir ce que les attaquants voient : reprenez la main sur...

Réussir ma migration de messagerie vers exchange on line

Pourquoi et comment migrer sharepoint maintenant

Dernières actualités

Plarium neutralise 20 millions de requêtes malveillantes par mois sans bloquer...

Vertiv étend son offre de refroidissement aux petites salles informatiques et...

Box intègre un agent IA pour exploiter les documents d’entreprise sans...

IFS abandonne la facturation par utilisateur et bascule sur les actifs...

Derniers Articles de fond

Infostealers, un cas d’école : 19 % des mots de passe volés...

Robotique industrielle : l’automobile décroche, la Chine s’impose, la médecine décolle

Pour la première fois, l’impact d’un datacenter, de la fondation au...

Dernières Actualités

Plarium neutralise 20 millions de requêtes malveillantes par mois sans bloquer...

Vertiv étend son offre de refroidissement aux petites salles informatiques et...

Box intègre un agent IA pour exploiter les documents d’entreprise sans...

Dernières Expériences

Organisation d’un exercice de crise cyber | RSSI – Ville de...

Sensibilisation des jeunes sur la cybercriminalité | Général de division –...

Migration de l’infrastructure traditionnelle vers AWS | DevOps – Algofi |...